国産にこだわる理由は、性能じゃなかった——「源内」7モデル選定が語る、政府システムの設計要件

Posted at 2026-03-12

2026年3月6日、デジタル庁は政府の生成AIプラットフォーム**「源内（げんない）」で利用する国産LLM（大規模言語モデル）を7モデル選定**し、全府省庁の職員約18万人を対象に試験展開する方針を発表しました（ITmedia AI＋、CNET Japan）。「国産AIを政府が採用」と報じられがちですが、設計・運用の観点で押さえておきたいのは、選定の理由が「愛国」や「性能」ではなく、政府システムとしての設計要件に近いという点です。この記事では、源内とは何かからはじめに整理し、なぜ国産LLMが選ばれたのかを、段落ごとのつながりを意識しながらわかりやすくまとめます。

まず押さえたい「源内」とは何か——Gen AIと平賀源内に由来する名前

源内は、デジタル庁が2025年5月から開発・展開を進めている政府職員向けの生成AI利用環境です。名前の由来は、Generative AIを略した「Gen AI（ゲンナイ）」と、江戸時代の発明家・平賀源内の精神を合わせたものとされています（デジタル庁 note「ガバメントAI、プロジェクト『源内』の構想紹介」）。

すでにデジタル庁内では、Amazon Nova Lite、Claude、OpenAI など複数のLLMを搭載した基盤として利用が始まっており、チャット対話・文章要約・法制度調査支援・国会答弁検索など、行政実務向けのアプリが20種類以上提供されています。デジタル庁職員の約80％が利用し、延べ6万5千回以上利用されたという実績も公表されています（デジタル庁ニュース「ガバメントAIとは？」）。今回の発表は、この源内に「国産LLM」を追加で組み込み、府省庁全体に広げるという、次の段階に進んだという位置づけです。

では、どのような国産LLMが選ばれ、いつからどう使われるのか。選定の中身とスケジュールを見ていきましょう。

7モデルが選ばれた——選定の中身と、これからのスケジュール

デジタル庁は、政府標準仕様書に沿ってGenerative AIを「Gen AI」と表記するなど共通ルールを定めたうえで、源内でのAI活用を推進しています。2025年12月に国産AIモデルの公募を開始し、応募15件のなかから7モデルを選定しました（イノベートピア）。選定理由としてデジタル庁が挙げているのは、日本語の語彙・表現への適合、日本の文化・価値観の尊重、信頼できるAIの国内開発支援の3点です。つまり「日本語ができるモデルを選んだ」というだけでなく、行政の業務とガバナンスを前提にした調達設計として読むと、腹落ちしやすいと思います。

選定にあたっては、国内開発であること、行政実務での実用性、安全性・セキュリティの確保、そして2026年度中の無償提供が可能であることなどが基準とされています。いわば、本番に近い行政業務で使うための条件が明確に課された公募だった、と理解するとよいでしょう。

では、実際に選ばれたのはどのモデルか。一覧で押さえておきます。

選定された7モデル

今回、源内で利用する候補として選ばれた国産LLMは次の7つです（発表順・表記は報道に準拠）。

NTTデータ「tsuzumi 2」
KDDI・ELYZA「Llama-3.1-ELYZA-JP-70B」
オラクル「Sarashina2 mini」
日本電気「cotomi v3」
三菱「Takane 32B」
Preferred Networks「PLaMo 2.0 Prime」
日立「CC Gov-LLM」

1社に絞らず7モデルを並行で選定している点は、後で触れる「ベンダーロックインを弱める」「比較可能性を残す」という設計意図ともつながってきます。

続いて、いつからどう展開されるかを、スケジュールで整理します。

スケジュールと試験展開

利用スケジュールは、報道やデジタル庁周辺の情報をまとめると、おおむね次のとおりです。

2026年3月〜：選定した事業者との契約・技術調整
2026年5月頃：源内を他府省庁に展開し、利用対象を広げる
2026年8月頃：源内のなかで国産LLMの試用を開始
2026年5月〜2027年3月：約18万人の職員を対象に試験利用を実施
2027年1月頃：評価・検証結果の一部を公表
2027年度以降：優れたモデルに絞り込み、有償調達を検討（CNET Japanでは「さらに絞り込みへ」と報じられています）

まとめると、まず大規模に試してから、実用性と行政実務への適合性を見極め、そのうえで本格調達に進む流れです。開発・調達の現場になじみのある言葉で言えば、PoC（概念実証）〜トライアルを経ての本番調達という、政府調達でよくあるパターンに沿った設計になっています。

ここまでで「何が選ばれ、いつ動くか」は押さえられました。次に、「なぜ国産なのか」を設計の言葉で読み解きます。

愛国ではない。では何か——設計要件として読むと見えること

政府が国産LLMを選ぶ理由を愛国とだけ受け止めると、「性能は海外の方が上では？」と感じる方も多いでしょう。しかしデジタル庁の説明を、システム設計や調達の観点で読み替えると、別の絵が見えてきます。

国産にこだわる本質は、政府システムとして満たすべき要件——「どの言語・どのデータで動かすか」「誰が責任を持ち、どう監査するか」「供給が止まらないか」——に合わせて調達している、という解釈です。つまり、LLMを「便利なチャットツール」ではなく、国家の業務基盤として組み込むソフトウェアとして扱い始めた結果、評価の軸が「どれが一番賢いか」だけでなく、言語適合性、監査のしやすさ、契約と統制、供給の安定性、主権、業務への載せやすさまで広がっている、ということです。

その「設計要件」の中身を、もう少し具体的に整理すると、おおむね次の7点に分けられます。

国産が選ばれた、7つの理由——言語・統制・主権まで

1. 「役所の言葉」に強い——業務要件としての日本語

一般的なLLMは日常会話やニュース記事には強くても、役所で使うような文章——法令、通知、通達、国会答弁、公文書の定型表現——には弱いことがあります。政府の資料でも「日本語の語彙・表現への適合」が強調されていますが、意味しているのは「日本語がうまい」だけではありません。曖昧さを避けた書き方、敬語・公用文のルール、制度の文脈、役所ならではの言い回しを安定して扱えるか、という業務としての要件です。

翻訳・要約、パブリックコメントの分類、相談対応の下書きなど、行政の実務ではこの差がそのまま使える・使えないの差になります。国産モデルは、国内の行政文書や法務文書で学習・評価されていることが多く、「役所の言葉」に合わせたチューニングや検証がしやすい、という利点があります。

言語への適合と並んで、政府が重く見るのがデータをどこでどう扱うかです。

2. データと統制を握れる——ガバナンスを組みやすい

政府調達では、「どれだけ性能が良いか」　よりも、「データはどこで処理されるか」「誰が運用し、どこまで追跡・監査できるか」　のほうが重視されます。海外のAPI（クラウド上のAIサービス）に頼むと、データが国外に送られる可能性、学習に流用される条件、障害時の責任の所在、監査で証跡を残せるか、などが複雑になりがちです。

国産だからといって自動的に安全なわけではありません。それでも、契約、法務、監査、セキュリティのレビューを、国内の事業者を中心に組みやすいという現実的なメリットがあります。行政のように「なぜそうなったか」を説明する責任が重い現場では、「統制しやすい」 という点はとても大きいです。デジタル庁も、行政への信頼を保ちながら、安全・安心に生成AIを使うことを前提にしています。選定基準には、政府の機密情報（機密性2）を扱えるだけのセキュリティや、学習データの法令遵守が含まれているとの報道もあります（イノベートピアなど）。

データの統制を握る一方で、「一社に依存しない」 ことにも、政府は意図的に配慮しています。

3. 一社に依存しない——ロックインを弱める設計

政府の基盤AIが、海外の一社や少数の巨大ベンダーに強く依存すると、あとから価格が上がる、利用規約が変わる、サービスが止まる、機能が制限される、モデルが入れ替わって挙動が変わるといったリスクに振り回されやすくなります。IT基盤でいう、DBやクラウドを一社に絞り込んでしまうのと同じ構図です。

今回、デジタル庁が1社ではなく7モデルを並べて選定しているのは、「とりあえず試す」だけではなく、比較できる状態を残し、特定のベンダーに固定されないようにする設計だと読むとわかりやすいです。複数のモデルを並べて評価・調達することで、将来の交渉力と選択肢を確保する意図があります。

選択肢を残すことと並んで、政府には需要側として国内の市場を育てるという役割もあります。

4. 需要側として市場を育てる——政府調達のもう一つの役割

今回の発表では、国内の企業や研究機関が開発・提供するAIモデルを政府が積極的に使うことで、信頼できるAIの国内開発を支えることが重要だと明言されています。政策的には、政府が大口の需要側になることで、市場を育てるという発想です。

よいプロダクトが育つには、研究開発費だけでなく、本番に近い規模で使ってもらう環境、実際の利用フィードバック、今後も調達が見込めることが欠かせません。約18万人が使う実証は、国内ベンダーにとって、精度や運用の改善、セキュリティの成熟、SLA（サービスレベル）の設計を進める大きな実戦の場になります。国産選定には、「国産を応援する」という面とあわせて、持続的に使える供給基盤を国内に作るという産業政策の側面もあります。背景には、人口減少や担い手不足のなかで、行政でもAI活用を進めざるを得ない、という事情も報じられています（EnterpriseZineなど）。

国内に基盤を育てる話は、安全保障やデジタル主権の観点とも重なります。

5. 止まらない・変われない——主権と安全保障

政府の業務では、普段の効率化だけでなく、緊急時や、外交・規制の環境が変わったときも想定する必要があります。海外に依存しすぎた基盤は、地政学的なリスク、輸出規制、制裁、サービス提供方針の変更などの影響を受けやすくなります。ここでいう国産重視は、「性能で勝つ」という話ではなく、国の重要業務を支えるAI基盤を、どこまで自国内で維持・コントロールできるかという話です。

クラウド、半導体、通信、暗号と同様に、LLMも社会の基盤を支える技術として扱われ始めています。デジタル庁の資料でも、政府が先頭に立ってAIを活用し、日本全体のAI利活用を促す姿勢が示されています。設計の観点では、「いつ止まるか・変わるかわからない外部APIに、重要業務を預けきらない」 という原則として理解するとよいでしょう。

主権や供給の安定を考えると、日々の障害対応や改善のサイクルを業務に合わせやすいかも、重要な要件になります。

6. 障害時や要望に合わせやすい——業務に載せやすい

海外の汎用モデルは多機能で強力ですが、「この帳票の形式に合わせてほしい」「この役所独特の文体で出力してほしい」 といった細かい要望は、契約上も運用上も実現しづらいことがあります。国内ベンダーが常に早いとは限りませんが、日本語での要件のすり合わせ、行政の現場との打ち合わせ、個別のチューニング、障害時の連絡体制は、少なくとも組み立てやすいです。

つまり、国産を重視しているのは「ベンチマークで1位を取るため」ではなく、実際の業務システムとしてきちんと回るかを重視した判断でもあります。今回の選定でも、実用性や行政実務への適合性を見極めると明記されています。本番運用を考えると、「止まったときに誰にどう連絡するか」がはっきりしているかは、設計の大事な要件の一つです。

障害時の連携の先には、説明責任という要件があります。

7. 説明責任——ブラックボックスを小さくする

政府でAIを使う場合、「なぜその答えになったのか」「どのモデルを使ったのか」「いつバージョンが変わったのか」「問題が起きたらどこで止めるのか」 を説明できることが求められます。国産LLMでも中身が完全に透明になるわけではありません。それでも、開発元・運用元・契約先・問い合わせ窓口・改善のルートが国内にあり、距離が近いだけでも、組織として「説明できる」度合いは高まります。

民間でも、金融・医療・公共に近い分野では同じ考え方が広がっています。金融庁のAIディスカッションペーパーでも、説明責任やガバナンスが重視され、「説明できません」では済まないという前提が示されています。同じような論点は、Qiita記事一覧の金融庁AI指針を扱った記事などでも整理されています。

ここまで7つの理由を並べると、国産が常に正解のようにも聞こえます。ただし、一つだけ押さえておきたいことがあります。

国産＝最高性能、ではない——選ぶのは「タスクと責任条件」

「国産＝いつでも技術的に最高」 ではありません。

今回の選定は、「いちばん性能が高いモデルを1つ選ぶ」話ではなく、性能に加えて、統制・監査・契約・継続供給・行政実務への適合を総合的に見て、調達を設計しているという理解が正しいです。たとえば、コーディング支援や高度な推論では、海外の最先端モデルが有利な場面もあります。反対に、行政文書の処理や、国内でデータや運用をきちんと統制したい場面では、国産が有利になりやすい。つまり、「どれが一番賢いか」ではなく、「どの業務を、どの責任条件で任せるか」 によって選ぶ、という考え方です。7モデルを並べて試すのも、どのタスクにどのモデルが向いているかを見極めるためだと考えるとよいでしょう。

では、ここまでを一言でまとめるとどうなるか。

まとめ——「チャットツール」ではなく「基盤ソフト」として見る

デジタル庁の国産LLM選定と源内の試験展開が示しているのは、国産にこだわる理由が「愛国」ではなく、政府システムとして満たすべき設計要件に近いということです。一言で言い換えると、こうなります。

国産にこだわる理由は、LLMを「チャットツール」ではなく「国家の業務基盤として組み込むソフトウェア」として扱い始めたから。 その結果、評価の軸が 「精度」だけでなく、言語への適合、監査のしやすさ、契約と統制、供給の安定性、主権、業務への載せやすさ まで広がった、という理解です。

この「タスクと責任条件で選ぶ」という考え方は、民間にもそのまま当てはまります。行政に近い業務や、説明責任が重い業務、データの扱いに厳しい業務では、「どこで処理するか」「誰が責任を持つか」「どう監査するか」 といった同じような観点で、モデルやベンダーを選ぶ場面が増えていくでしょう。一方で、汎用のコーディング支援や社内の下書き作成などでは、海外のAPIを選ぶ判断もありえます。大切なのは、「国産かどうか」で決めるのではなく、「そのタスクと責任の条件に、どのモデル・どの調達の形が合うか」 を、設計の観点で考えることです。

作成日：2026年3月9日

You get articles that match your needs
You can efficiently read back useful information
You can use dark theme

What you can do with signing up