「生成AI」なんて聞くと魔法やSFの世界のようですが、要は「何でも吸収する超・優秀な新人」を、村の総出でどうやって仕事ができるように育て上げているかというお話。ちょっと調べてみました。
【ステップ1:事前学習】:村の巨大図書館に引きこもらせる
まずは「言葉のつながり」や「世界のルール」を覚えさせるフェーズ。世界中の本、ネットの掲示板、プログラムのコードなど、村にあるあらゆる「文字」を片っ端から読み込ませます。
「吾輩は」と来たら「猫である」が続く確率が高い、というパターンの塊を作っていく作業です。ただ、この時点での新人は、知識は膨大でもただブツブツと独り言を言っているだけの「物知りマシーン」に過ぎません。
【ステップ2:ファインチューニング】:特定の「専門職」としての特訓
知識があるだけでは仕事になりません。そこで「このコードを直して」「この文章を要約して」といった、村の住人からの具体的な依頼にどう応えるか、「問答集」を使って教え込みます。
汎用的な知識を持った新人に、マニュアルを渡して実務研修をするようなイメージ。ここでようやく、私たちの指示に従ってくれる「便利なツール」へと進化します。
【ステップ3:アライメント】:村のルールと道徳を叩き込む(しつけ)
超パワーを持った新人が暴走しないようにするための、ある意味一番泥臭くて大事なフェーズです。
人間がAIの回答をいくつも見て「こっちの答え方の方が親切でいいね!」「差別的なことや危険な作り方は教えちゃダメだよ!」と地道に採点(フィードバック)して育てます。この「しつけ」があるからこそ、私たちは安全にAIをアシスタントとして使えるわけです。
【まとめ】:魔法ではなく、泥臭い教育の結晶
AIを一人前に育てるには、村全体の数兆ページものデータと、都市一つ分の電力、そして数百億〜数千億円という莫大な教育コストがかかります(だからアメリカの巨大な地主企業しか作れないわけです)。
たまに知ったかぶりをして堂々と嘘をつく(ハルシネーション)という新人の「空想癖」には注意が必要ですが、こうやって泥臭く育てられている背景を知ると、AIがただの無機質な機械ではなく、可愛い「相棒」に見えてきますね。