LLMの中の「計算式」を、数式ニガテでもわかるように解説してみた！

Posted at 2025-04-23

この記事でわかること

ひとことで言うと：「次に来る言葉を当てるAI」です。

例：

「私は今日、」→「ラーメンを食べた。」

この「ラーメンを食べた」みたいな続きを、たくさんの知識から“予想”してる。

→ 人間の「文字」や「単語」は、AIにとっては意味不明。

「犬」→ [0.2, -1.3, 0.8, ...]

これがEmbedding（埋め込み）。言葉の“意味”を数字で表す。

単語の意味 + 位置のベクトル = 入力ベクトル完成！

「周りの言葉との関係を調べて、“どれが大事か”を考える機能」

イメージ：

「犬」→「遊んだ」＝ 0.9（強い関係）
「私は」→「遊んだ」＝ 0.2（弱い関係）

これで「文の流れ」に合った意味の理解ができるようになる！

各単語のベクトルを小さな脳みそ（MLP）に通して、意味を強化

例文：私は今日ーーーーーでラーメンを食べた。
候補：「学校」「病院」「ラーメン屋」
結果：「ラーメン屋」 ＝ 一番ありえそう → 出力！

1. 言葉 → 数字のベクトルに変換（Embedding）
2. 周りの単語とどれくらい関係あるかを計算（Attention）
3. 各単語の意味を強化（FFN）
4. それを繰り返す（深層）
5. 最後に「次の単語はこれ！」と予測（Softmax）

✨「大量の文章を読んで、次に来る言葉を超高精度で当てるAI」

そのために、言葉を「数字」にして、「どれが大事か」を見て、「予測」してる！

「LLM = 百万冊の本を読んだ人」
「次に出る言葉を、今までの経験で“だいたいこれでしょ”って当ててるだけ」