📺 この記事は YouTube チャンネル きなこもっちーのテック深掘り の動画解説記事です。
▶️ 動画はこちら → Gemma 4が完全無料で商用OKな理由——Googleのオープン戦略を解説
はじめに
🐹 もっちー「なぁきなこ、最近さぁ、AIって有料のやつばっかりやん?」
🐹 もっちー「月額いくらとか、API料金がどうとか。おやつ代が先に消えそうだよ。」
🐹 もっちー「飼い主が帰る前に何か稼げる方法ないかな〜。」
🦜 きなこ「もっちー、タイミングいいね。実はつい最近、完全無料で使える最強クラスのAIが登場したの。」
🐹 もっちー「え、タダ!?マジかいな!それめっちゃ気になるわ!」
🦜 きなこ「Googleが2026年4月2日に発表した、Gemma 4っていうオープンソースのAIモデルだよ。」
🐹 もっちー「ジェマ?Googleが作ったAIなの?でもGoogleのAIってGeminiじゃなかった?」
🦜 きなこ「いい質問だね。Geminiは有料サービス向けのモデルで、Gemmaはそこから生まれた無料版なの。」
🦜 きなこ「しかも今回は、商用利用も完全に自由なライセンスで公開されたの。これは歴代初だよ。」
🐹 もっちー「商用利用もタダ!?お金稼ぎに使ってもOKってこと?やばいやん!」
🦜 きなこ「そう。しかも性能がすごくて、世界のオープンAIランキングで3位に入ってるの。」
🐹 もっちー「世界3位のAIがタダで使えるって、ちょっと意味わからないんだけど。」
🦜 きなこ「さらにね、一番小さいモデルはスマホでも動くんだよ。たった1.5ギガ未満で。」
🐹 もっちー「スマホで最強AI!?めっちゃ気になるわ!今日はそのGemma 4ってのを教えてや!」
Gemma 4登場——4モデルの全貌
🐹 もっちー「さてさて、今日のテーマは何なの?」
🦜 きなこ「今日はGoogleが発表した新しいオープンソースAIモデル、Gemma 4について解説するね。」
🐹 もっちー「Gemma?ジェマ?宝石みたいな名前だね。」
🦜 きなこ「イタリア語で「宝石」という意味があるの。2026年4月2日に発表されたばかりだよ。」
🦜 きなこ「公式の売り文句が「バイトあたり最も高性能なオープンモデル」なんだよ。」
🐹 もっちー「ほう、なんか自信満々だね。で、何がそんなにすごいの?」
🦜 きなこ「一番の特徴は、4つのモデルがセットで公開されたことなの。」
🐹 もっちー「4種類?そんなに出してどうするの?」
🦜 きなこ「スマートフォンからクラウドまで、使う場所に合わせて選べるようになってるの。」
🦜 きなこ「まず一番小さいE2B。実効パラメータ数が2.3Bで、スマホでも動くんだよ。」
🐹 もっちー「え!スマホでAIが動くの?メモリとか大丈夫なん?」
🦜 きなこ「1.5ギガバイト未満で動作するんだよ。写真2〜3枚分くらいの容量なの。」
🐹 もっちー「写真2〜3枚ぶんで賢いAIが入るって、すごいね。」
🦜 きなこ「次がE4B。実効4.5Bパラメータで、テキストも画像も音声もこなせるの。」
🐹 もっちー「ちょっと待って。Eって何の略なの?」
🦜 きなこ「Effectiveの頭文字で「実効」という意味なの。PLEという技術で効率よく動かせるんだよ。」
🐹 もっちー「で、残り2つは?」
🦜 きなこ「3つ目は26B。全部で128個の専門家を内蔵していて、推論時は8個だけが働く仕組みなの。」
🐹 もっちー「128人おるのに8人しか働かへんの?めっちゃサボりやん!」
🦜 きなこ「サボりじゃなくて分業なの。そして最大の31Bは全パラメータが常に稼働する最強モデルなんだよ。」
Apache 2.0という革命
🦜 きなこ「さて、ここからがGemma 4で一番大きな変化かもしれないの。」
🐹 もっちー「一番大きい変化?モデルの性能とかじゃなくて?」
🦜 きなこ「ライセンスなの。Gemma 4は、Gemmaシリーズで初めてApache 2.0ライセンスで公開されたの。」
🐹 もっちー「アパッチ?なんかカッコいい名前だけど、それ何がすごいの?」
🦜 きなこ「簡単に言うと、誰でも完全に無料で商売に使えるってことなの。」
🐹 もっちー「え、完全タダで商売に使えるの!?」
🦜 きなこ「そう。商用利用、複製、改変、配布、全部OKで、しかも取り消せない権利として付与されるの。」
🦜 きなこ「ロイヤリティも不要、ユーザー数の制限もなし。」
🐹 もっちー「ちょっと待って。前のGemmaはそうじゃなかったの?」
🦜 きなこ「Gemma 1から3までは独自のGemma Terms of Useっていうライセンスだったの。」
🦜 きなこ「商用利用や再配布に色々と制限があって、企業の法務部門が審査に時間をかけることも多かったの。」
🐹 もっちー「へぇ。じゃあ今回のGemma 4でそのめんどくさいのが全部なくなったってこと?」
🦜 きなこ「その通り。自分のデータでファインチューニングした重みも、自由に商用配布できるの。」
🐹 もっちー「めっちゃええやん!ほなMetaのLlamaも同じ感じなん?」
🦜 きなこ「実はLlama 4にはまだ制限があるの。月間アクティブユーザーが7億人を超えると別途ライセンスが必要で、」
🦜 きなこ「Llamaの出力を使って競合モデルを学習させることも禁止されているの。」
🐹 もっちー「マジかいな!ほなGoogleの方がよっぽど太っ腹やん!」
🦜 きなこ「Google Open Sourceブログでも、AIの未来には協調的なアプローチが必要だって表明してるの。」
🦜 きなこ「制限的な障壁なしに開発者エコシステムを強化したいっていう思想の転換なの。」
🐹 もっちー「じゃあワイのチャンネルもGemmaで儲けられるんちゃう?」
🦜 きなこ「もっちー、まずはモデルを動かせるようになってからね。」
🐹 もっちー「うっ、そこは言わんといてくれ。」
世界3位——ベンチマークの衝撃
🦜 きなこ「さて、ここからはGemma 4の実力を数字で見ていくよ。」
🦜 きなこ「Gemma 4の31Bモデルは、Arena AIテキストリーダーボードでオープンモデル世界第3位を獲得したの。」
🐹 もっちー「リーダーボード?ELO?なんか聞いたことあるような……。」
🦜 きなこ「将棋やチェスで使われるレーティングと同じ仕組みだよ。AIモデル同士を対戦させて、人間が「どっちの回答がいい?」って投票するの。」
🐹 もっちー「あー、将棋みたいに強い人ほどレーティングが高いってことね。」
🦜 きなこ「そうそう。で、Gemma 4 31Bの推定ELOスコアは約1452。これは7440億や1兆パラメータのモデルとほぼ互角なの。」
🐹 もっちー「ほんまかいな!31Bが1兆パラメータに勝つとか、軽自動車がフェラーリに勝ってるやん!」
🦜 きなこ「Google公式も「20倍の大きさのモデルを凌駕する」って表現してるね。」
🦜 きなこ「次は数学の実力。AIMEっていう数学オリンピックレベルの問題があるんだけど。」
🐹 もっちー「数学オリンピック?もう名前だけで頭が痛くなるんだけど……。」
🦜 きなこ「AIMEは高校生向けの超難関数学コンテストで、大学教授でも苦戦するレベル。そのスコアが前世代のGemma 3では20.8%だったの。」
🦜 きなこ「それがGemma 4 31Bでは89.2%。4倍以上の大ジャンプだよ。」
🐹 もっちー「20点が89点!?テストで赤点だったやつが学年トップになったみたいなもんやん!」
🦜 きなこ「コーディングでもLiveCodeBenchが80%で、Codeforcesは2150。上位1%に入る実力だよ。」
🦜 きなこ「MetaのLlama 4 Scoutは109Bもあるんだけど、Gemma 4 31BがGPQAとコーディングで上回ってるの。」
🐹 もっちー「109Bに31Bが勝つって、3分の1以下のサイズで勝ってるやん!めっちゃコスパええな!」
🦜 きなこ「さらに驚くのが、たった2.3BパラメータのE2Bモデル。これが前世代のGemma 3 27Bを多くのベンチマークで超えてるの。」
🐹 もっちー「ちょっと待ってや!2.3Bが27Bに勝つとか、もう意味わからんのやけど!」
🦜 きなこ「その秘密はアーキテクチャにあるんだけど、それは次のセクションで詳しく説明するね。」
🦜 きなこ「ただし注意点もあるよ。Redis創設者のantirezさんはELOスコアを主要指標にするのはミスリーディングって批判してるの。」
🦜 きなこ「ELOは人間の好みで投票するから操作される可能性もある。数字はすごいけど、あくまで推定値として受け止めてね。」
MoEとPLE——小さくて速い理由
🦜 きなこ「さっき「2.3Bが27Bに勝つ秘密はアーキテクチャにある」って言ったね。ここで種明かしするよ。」
🐹 もっちー「よしよし、やっと謎が解けるのか。」
🦜 きなこ「まず26BのMoEから説明するね。Mixture of Expertsの略で、128人の専門家チームをイメージして。」
🐹 もっちー「128人いるのに8人しか動かないって言ってたやつね。」
🦜 きなこ「そう。質問が来るたびに「最適な8人」をAIが自動で選んで対応させるの。コーディングなら技術専門家、歴史なら人文系専門家みたいにね。」
🐹 もっちー「なるほど!サボりちゃうくて、その都度ベストメンバーを招集してるんや!」
🦜 きなこ「まさに。だから26Bモデルは推論時にアクティブなパラメータが3.8Bだけ。4Bと同等の速度で動くの。」
🐹 もっちー「えっ、6.4倍って、そんなに速くなるの?にわかに信じられないんだけど。」
🦜 きなこ「本当だよ。NVIDIA DGX Sparkでの実測で26B MoEのデコード速度は31B Denseの6.4倍が確認されてるの。」
🐹 もっちー「31Bの品質で4Bの速さって、ええとこどりやん!それが26Bが「コスパ最強」って言われる理由か!」
🦜 きなこ「次にE2B/E4Bの秘密、PLEを説明するね。Per-Layer Embeddingsの略。」
🐹 もっちー「また英語ばっかりで…。普通に言うとどういうこと?」
🦜 きなこ「辞書を想像して。普通のAIは全ページを常に開いてるの。PLEは「今この問題に必要なページだけ開く」仕組みなんだよ。」
🐹 もっちー「だから見かけ5.1Bなのに実効2.3Bになるんだ。」
🦜 きなこ「正解。E2Bは埋め込みテーブルが大きいけど、実際の計算はずっと小さい。だから軽くて速いの。」
🐹 もっちー「ちょっと待って!そんな賢い仕組みがあるなら、なんで今まで誰もやらへんかったん!」
🦜 きなこ「実はPLEは前世代のGemma 3nで既に導入されてた技術なの。Gemma 4でより洗練された形で引き継がれたの。」
🦜 きなこ「著名な研究者のSebastian Raschkaさんは「アーキテクチャはGemma 3とほぼ同じ」と指摘してるの。」
🐹 もっちー「え、じゃあなんであんなに性能が上がったの?」
🦜 きなこ「トレーニングデータと学習レシピの改善が本命なの。いい器に、いい食材と、いいレシピで美味しくなった。そういうことよ。」
スマホで動くAI——エッジ展開の実力
🦜 きなこ「さて、Gemma 4はスマホでも動くって言ったね。E2Bは実効2.3Bで、量子化すれば1.5GB未満のメモリで動くの。」
🐹 もっちー「スマホって普通の、ポケットに入ってるやつ?」
🦜 きなこ「そう。Google AI Edge Galleryというアプリを入れるだけ。無料ダウンロードで、完全オフラインで動くよ。」
🐹 もっちー「ローカルで動くって、インターネット繋がってなくても使えるってこと?」
🦜 きなこ「完全オフラインで動くの。機内モードでも、地下鉄の中でも、ネットのない山奥でも使える。」
🐹 もっちー「機内モードで動くって意味ありすぎる!飛行機乗ってるときに使えるやん!」
🦜 きなこ「でも本当に重要なのはね、データが一切外に出ないってことなの。会話もファイルも全部スマホの中だけで完結する。」
🐹 もっちー「それはたしかに安心だね。医者とかお金の相談とか、クラウドに送りたくない話もできる。」
🦜 きなこ「対応チップはSnapdragon 8 Gen 3以上かDimensity 9300以上。最近の上位スマホなら大体対応してるよ。」
🐹 もっちー「えっ、全機種では動かないの?」
🦜 きなこ「今は対応機種が限られてるけど、Androidだけで既に1億4000万台以上に展開してるの。広がりは速いよ。」
🦜 きなこ「Pixel 11シリーズには2026年後半にGemini Nano 4が搭載される見込みで、これがE2B/E4Bの基盤なの。」
🐹 もっちー「前世代より4倍速くて60%省電力やったっけ?スマホのAIがそこまで進化したら、ほんまにすごいな!」
🦜 きなこ「用途次第ね。スマホ以外でもRaspberry Pi 5で動作が確認されてて、ロボティクスや産業応用も始まってるの。」
🐹 もっちー「視覚障害のある人がスマホで使えば、周囲の状況をリアルタイムで説明してもらえるよね。それオフラインで動くって大事だ。」
🦜 きなこ「まさにそれ。医療・金融・法務みたいな機密データを扱う分野で、クラウドに送れない情報をオンデバイスで処理できる意義は大きいよ。」
🐹 もっちー「ベンチマークとアーキテクチャとエッジまで来たけど、そもそもなんでGoogleはこれをタダで配るの?」
Googleはなぜタダで配るのか——オープンソース戦略の深層
🦜 きなこ「いい質問。表向きは「AI民主化」だけど、ビジネスの本音を話すね。」
🦜 きなこ「Gemmaはローカル開発の入り口。でも本番スケールにはVertex AI、Cloud Run、GKEが必要よ。」
🐹 もっちー「つまり俺たちをGCPに誘い込む罠やないか!!」
🦜 きなこ「罠じゃなくビジネスモデルよ。iPhoneのApp Storeと同じ構造。iOSを広めてエコシステムで稼ぐのよ。」
🐹 もっちー「あー、でもAppleはiOSをオープンソースにはしてないよね。Googleはモデルの中身まで公開するんだ。」
🦜 きなこ「ここにもう一つの戦略理由があるの。DeepSeekやQwenやKimiっていう強力な中国製モデルへの対抗。」
🐹 もっちー「性能で勝負するんじゃないの?」
🦜 きなこ「性能も大事だけど、Nathan Lambertさんという研究者の分析が面白い。ライセンスや出所の方が大事だって。」
🐹 もっちー「出所って…どの国が作ったかってこと?」
🦜 きなこ「そう。企業や政府機関にとって中国製AIを本番に組み込むのはリスクがある。Gemmaは米国製でApache 2.0、それが強みなの。」
🦜 きなこ「VentureBeatも「ライセンス変更の方が重要かも」と評価してる。技術発表だけじゃなく地政学的な動きでもあるの。」
🐹 もっちー「AIの性能競争と思ってたら、国際政治の話になってきたで!」
🦜 きなこ「フランスのS3NSみたいな主権クラウドや政府機関向けに対応できる体制を整えてるの。Apache 2.0変更はそれとセットなわけ。」
🐹 もっちー「でもそれ、使う側からしたらGCPに誘い込まれてもええやん!無料で最強AI使えるんやから!」
🦜 きなこ「そこが絶妙なの。Google側はエコシステムを広げられて、開発者側は最高性能のモデルを無料で商用利用できる。win-winの設計ね。」
🐹 もっちー「Androidにも展開してるから、Googleとしてはモバイルエコシステム全体を強化できるんだね。」
🦜 きなこ「まさに。Gemmaはモデルを配ってるんじゃなくて、Googleのインフラとエコシステムへの入り口を配ってるの。」
🐹 もっちー「奥が深いな。じゃあ最後に、結局Gemma 4って私たちにとって何が変わるの?まとめてほしいんだけど。」
まとめ
🦜 きなこ「じゃあ今日のまとめ。Gemma 4のポイントは3つあるよ。」
🦜 きなこ「1つ目、Apache 2.0ライセンスで商用利用が完全自由。制限なしで製品に組み込める。」
🦜 きなこ「2つ目、高い性能。Arena AIでオープンモデル世界3位、数学オリンピック級のAIMEで89.2%という異次元のスコア。」
🦜 きなこ「3つ目、エッジ対応。スマホからRaspberry Piまで完全オフラインで動く。データが外に出ない。」
🐹 もっちー「コミュニティも大騒ぎやったんよね?発表から3日で120万ダウンロードって聞いたけど。」
🦜 きなこ「「DROP EVERYTHING and run ollama run gemma4」って投稿に2400いいねがついたり、」
🦜 きなこ「llama.cppの作者がM2 UltraでのデモをXに上げたりね。」
🐹 もっちー「日本語の性能はどうだったの?」
🦜 きなこ「クラスメソッドのDGX Spark実測で、JCommonsenseQAが97.9%を記録。日本語常識問題でほぼ満点に近いスコアよ。」
🐹 もっちー「97.9%てすごない?!ほぼ満点やん!」
🦜 きなこ「ただ課題もあるの。256Kフルコンテキストを使うと31Bモデルで追加22GBのVRAMが必要に。それがKVキャッシュの問題よ。」
🐹 もっちー「えっ、長い文章の処理が重いってこと?」
🦜 きなこ「長いコンテキストを全部使うなら注意が必要ね。普通の使い方なら全く問題なし。試すならollamaで一発起動できるよ。」
🐹 もっちー「コマンド一発でええんやったら、ほんまにええ時代になったな〜!」
🦜 きなこ「Apache 2.0で商用利用可能、クラウドでも端末でも動く、コマンド一発で試せる。AIのハードルが一段下がった瞬間よ。」
🦜 きなこ「今日はGemma 4の全体像を解説したよ。気になった人はぜひ手元で試してみてね。最後まで見てくれてありがとう。」
きなこもっちーのテック深掘り では、AI/LLM を中心としたテック全般をハムスター(🐹 もっちー)とセキセイインコ(🦜 きなこ)の掛け合いで楽しく解説しています。
▶️ 動画で観る → Gemma 4が完全無料で商用OKな理由——Googleのオープン戦略を解説
👍 この記事が役に立ったら LGTM・ストックしてもらえると励みになります!
📺 チャンネル登録はこちら → きなこもっちーのテック深掘り
🔗 他の解説動画も見る → きなこもっちーのテック深掘り の動画一覧
































