AI #3. LLMの正体を知る！作り方・パラメータ・オープンソースの基本を完全解説

Posted at 2026-06-07

LLMの正体を知る！作り方・パラメータ・オープンソースの基本を完全解説

生成AIをビジネスや開発で活用する際、「そもそもLLMの中身はどうなっているのか？」「なぜこれほど種類があるのか？」といった疑問を持つことはありませんか？

本記事では、YouTube動画「生成AIインフラ入門 Episode 02：LLMはどうやって作られるのか」の内容をベースに、LLMの基礎知識を初心者の方にもわかりやすく解説します。

動画で詳しく学びたい方はこちらをチェックしてください。

LLMが賢くなるプロセスは、料理に例えると非常に理解しやすくなります。大きく分けて3つのフェーズがあります。

インターネット上の膨大なテキストデータを読み込ませ、言語の基礎パターンを学習させます。

事前学習したモデルに対し、質問と回答のペアデータを与えて「対話」ができるように訓練します。

人間が回答の良し悪しを評価し、そのフィードバックをもとにモデルを改善します。

よく「パラメータ数70B（700億）」といった数字を耳にしますが、これはモデルの**「知識の容量」や「脳細胞のつながりの数」**に相当します。

最近では、質の高いデータで学習させることで、小型でも非常に賢いモデルが登場しており、「大きいほど必ず優れている」とは限らないのが現在のトレンドです。

2024年以降、数百種類ものモデルが登場しています。これらは主に以下の4つの軸で差別化されています。

代表的なモデルには、以下のような強みがあります。

GPTなどの商用APIと異なり、LlamaなどのオープンソースLLMは「モデルの重み」が公開されており、自社サーバーで動かせるのが最大の特徴です。

機密データを扱う場合や、特定の業務に特化させたい場合は、オープンソースLLMの活用が有力な選択肢となります。

LLMを選ぶ際は、以下の3軸で考えるのが基本です。

動画本編では、これらの内容を図解を交えてさらに深掘りしています。インフラエンジニアだけでなく、生成AIの全体像を把握したいビジネス職の方も、ぜひチェックしてみてください！

LLMはどうやって作られるのか ― パラメータ・種類・オープンソース