📺 この記事は YouTube チャンネル きなこもっちーのテック深掘り の動画解説記事です。
▶️ 動画はこちら → DeepSeek R2の正体はSEOブログ!噂の幻・Huawei失敗・V4の実力を徹底解説
🐹🦜 この記事に登場する2匹
- 🐹 もっちー(ハムスター)… AI はまだ勉強中。「それどういうこと?」と素朴に質問する生徒役
- 🦜 きなこ(セキセイインコ)… AI で調べものをこなす解説役。やさしく深掘りして教える先生役
この記事は2匹の掛け合いを書き起こした形式です。発言の先頭にいる絵文字+名前が話者です。
はじめに
🐹 もっちー「ねえきなこ!DeepSeek R2が32Bで安くて強いって本当?RTX 4090で動いてAIME 92.7%達成って噂で、AIコミュニティがすごく盛り上がってたんだけど!」
🦜 きなこ「うん、すごく話題になってるよね。でも実は……そのR2、公式リリースが存在しないんだよ。」
🐹 もっちー「え……?あんなにXもニュースも盛り上がってたのに、リリースされてないってどういうこと?具体的な仕様まで書かれてたのに……」
🦜 きなこ「2026年4月時点で、DeepSeekのHuggingFaceリポジトリにR2という名前のモデルは存在しないんだよ。V4-ProとV4-Flashは実在するけど、R2は見当たらないの。」
🐹 もっちー「じゃあ「32B Dense、RTX 4090で動く、AIME 92.7%」って仕様はどこから出てきたの?そんな具体的な数字まで出てたのに……」
🦜 きなこ「そこが今日の核心なんだよ。噂の出所を追いかけていったら、衝撃的なことが分かったの。」
🦜 きなこ「この動画ではR2噂の正体・Huawei Ascendでの訓練失敗の真相・実際にリリースされたV4の実力まで、DeepSeek R2論争の全貌を解説していくね。」
🐹 もっちー「R2って一体誰が、どこで作り出した話なの?それを知りたい!」
🦜 きなこ「噂の起点になったのはdecodethefuture.orgというSEOブログだったんだよ。公式の裏付けは一切なかったけど、そこに書かれた仕様がXで拡散して、世界規模のトレンドになったの。」
🐹 もっちー「一個のSEOブログが世界中のAIコミュニティを動かしたってこと?それって怖くない……?ちゃんとしたリポジトリや公式を確認すれば良かったのに。」
🦜 きなこ「そう、一次ソースの確認って大事なんだよ。これは情報リテラシーの話でもあるよね。じゃあ実際に何が起きたのか、詳しく見ていくよ。」
噂の解剖:32B Dense仕様はどこから来たのか
🦜 きなこ「「DeepSeek R2は32B Dense、AIME 92.7%、MIT並みの性能、RTX 4090で動く」という、R2の仕様を報じた出所を調べると?」
🦜 きなこ「decodethefuture.orgというSEOブログの記事に行き着くんだよ。で、そのサイトはどこから情報を取ってるかというと…」
🐹 もっちー「decodethefuture.org……聞いたことない。それって信頼できる情報サイトなの?」
🦜 きなこ「それがね、DeepSeek公式でもarXivでもReuters・TechCrunchでもない。検索エンジンに最適化されたSEOブログなんだよ。」
🦜 きなこ「DeepSeek公式の何億ものトークン訓練データには「R2の仕様」なんて一文字も出てこないんだよ。」
🐹 もっちー「え、それってインターネットの噂がひとり歩きしてたってこと?!ソースどこなんよ!あんな具体的な数字まであったのに!」
🦜 きなこ「さらに面白いことがあってね。複数のサイトがそれぞれ「R2の仕様」を報じてるんだけど、その内容が互いに矛盾してるの。」
🐹 もっちー「矛盾?どんな矛盾があるの?」
🦜 きなこ「一方のサイトは「32B Denseモデル」と主張して、別のサイトは「sparse MoEアーキテクチャ」と言うの。DenseとMoEは根本的に違う構造だから、同じモデルを指してるわけがないんだよね。」
🐹 もっちー「それって……みんな同じソースを引用してたわけじゃなくて、それぞれが独自にR2の仕様を作り上げてたってこと?」
🦜 きなこ「そういうこと。「R2が来る!」という期待感が先にあって、仕様は後から想像と推測で埋められていった感じなんだよね。予測市場でも「R2リリース」の可能性はゼロに近い判定だったんだよ。」
🐹 もっちー「恐ろしいな……でもなんでそんな噂が世界中に広がったの?」
🦜 きなこ「DeepSeekがV3やR1で実際にすごい成果を出してたから、「次のR2はもっとすごいはず」という期待が増幅されたんだよ。信頼性のある実績があると、噂も信じやすくなるんだよね。」
🐹 もっちー「じゃあDeepSeekは実際に何をリリースしてたの?R2がないなら、本当の新モデルは何なの?」
現実のDeepSeek:V4と真のラインナップ
🦜 きなこ「DeepSeekが2026年4月に発表したのはDeepSeek-V4。パラメーター総数1.6兆、アクティブ490億のMixture of Expertsモデルなの。」
🐹 もっちー「1.6兆パラメーターって天文学的な数字だけど、本当にそんなモデルが実際に動いてAPIで使えるの?動かすためにどれくらいのコンピューターが必要なの?」
🦜 きなこ「動くし、強い。LiveCodeBenchで93.5、Codeforcesレーティング3206を記録してるの。コーディング系ベンチマークではトップクラスの数値なんだよ。」
🐹 もっちー「でもさ、ちょっと前から「R1-Distill-32BってR2のことなんじゃないか」って話があったんだけど、実際はどういう関係なの?名前に32Bってあるから混同されてたの?」
🦜 きなこ「それがR2神話の混同源なんだよ。R1-Distill-Qwen-32Bは2025年1月に公開された実在モデルで、名前に「32B」があるから「これがR2?」って誤解を招いたんだよね。」
🐹 もっちー「なるほど!R1を圧縮した蒸留モデルが32Bで、それがR2の「32B Dense」という具体的な噂のベースになったってこと?でも蒸留モデルと新しいアーキテクチャって根本的に違うよね?」
🦜 きなこ「そういうこと。実在する「R1-Distill-Qwen-32B」に「R2」というラベルを貼って、存在しない仕様が増幅されていったんだよね。」
🐹 もっちー「ちょっと待って、じゃあなんでR2はこんなに遅れてるの?V4がリリースされてるのに。」
🦜 きなこ「そこには深刻な理由があるんだよ。単なる技術的な課題じゃなくて、地政学的なリスクが技術開発のロードマップに直接影響した話なの。次で詳しく見ていくよ。」
🐹 もっちー「地政学が技術開発に影響って……なんかスケールが大きすぎてついていけないんだけど、それって具体的にどういうこと?」
🦜 きなこ「ちなみに「蒸留」って何?って思ったよね。大きなモデルの知識を小さなモデルに移し替える技術のことなんだよ。」
🦜 きなこ「R1の賢さをQwen-32Bに凝縮したのがR1-Distillと呼ばれるモデルなんだよ。大は小を兼ねる逆バージョンだね!」
R2遅延の真相:Huawei Ascend失敗と地政学
🦜 きなこ「DeepSeekはR2を、Huawei Ascend 910Bで訓練しようとしたの。でも頻発するクラッシュと不安定な動作で、訓練が完走できなかったんだよ。」
🐹 もっちー「え、Huaweiのチップ使おうとして失敗したの?それって相当大変だったんじゃ……」
🦜 きなこ「原因は2つあってね。一つ目がCANN——HuaweiのAIソフトウェアスタックの未成熟さ。NVIDIAのCUDAに相当するものなんだけど、大規模訓練での安定性が不足してたの。」
🐹 もっちー「CANNってGPUプログラミングの仕組みのことだよね。CUDAと比べてどのくらい差があるの?」
🦜 きなこ「エコシステムの成熟度が全然違うんだよ。CUDAはNVIDIAが15年以上かけて磨いた技術で、深層学習フレームワークとの互換性も高い。CANNはまだその途上なの。」
🦜 きなこ「二つ目の原因がチップ間の相互接続速度。大規模MoEモデルの訓練では、何千ものチップが高速に通信する必要があるんだけど、Ascendはそこでボトルネックが出たんだよ。」
🐹 もっちー「なるほど……それでR2の訓練が詰まってしまったわけか。」
🦜 きなこ「そこに追い打ちをかけたのが、2025年4月のH20 GPU輸出禁止なんだよ。アメリカがNVIDIAに対して、中国向けH20の出荷を禁止したの。」
🐹 もっちー「ダブルパンチやん!Huaweiで失敗、NVIDIAも使えない……そら遅れるわ!」
🦜 きなこ「DeepSeekが取った対策が「NVIDIA訓練・Huawei推論」のデュアルトラック戦略なんだよ。」
🦜 きなこ「訓練はNVIDIA、推論(実際の応答生成)はHuaweiという役割分担で輸出規制を回避してるんだよ。」
🐹 もっちー「訓練と推論で使うチップを分けるってこと?それは賢いな。」
🦜 きなこ「こうして2025年5月の予定だったR2リリースが、2026年現在も遅れ続けてるんだよね。でもね、本当のコスパ革命はR2じゃなくて、もっと意外なところにあったんだよ。」
コスパ革命の実態:V4-Flashは「70%安」じゃない
🦜 きなこ「「DeepSeekはWestern APIより70%安い」って聞いたことある?実際の数字はもっとドラマチックだったんだよ。」
🐹 もっちー「70%安って聞いたら十分すごいと思うけど、もっとドラマチックってどういうこと?1ドルが30セントになるってことなのに、それより安いってどういうスケールの話なの?」
🦜 きなこ「V4-Flashの料金は入力100万トークンあたり0.14ドル、出力0.28ドルなの。Claude Sonnet 4.6と比べると97%安い、Opus 4.7と比べると98%安いんだよ。」
🐹 もっちー「70%安って聞いてたのに、実際は97%安?!それって4倍どころかめちゃくちゃ違うやん!計算おかしない?!」
🦜 きなこ「計算は合ってるよ。70%安ということは3分の1の価格。97%安は30分の1以上の価格なの。全然違う世界だよね。」
🦜 きなこ「ここで少し技術的な話をするとね、MoEアーキテクチャがこのコスパを支えてるんだよ。1.6兆パラメーター全部を使うんじゃなくて、トークンごとに最適な専門家490億分だけを選んで使うの。」
🐹 もっちー「つまりフル出勤じゃなくて、プロジェクトごとに最適な専門家チームだけを呼んで、不要な人は待機させてるようなシステムってこと?それがコスト削減の秘密なんだ!」
🦜 きなこ「そのたとえが正確だよ。1.6兆中490億——約3%のパラメーターだけをアクティブにする効率化が、あの価格設定を可能にしてるんだよね。」
🐹 もっちー「R2の噂を追いかけてる間に、現実のV4の方がよっぽどすごい技術を実現してたんだね。」
🐹 もっちー「で、そんなにすごい技術をDeepSeekがオープンソースにしてる理由って何なの?企業戦略として変じゃない?」
🦜 きなこ「実はそこに地政学的な計算があるんだよ。技術力を世界に公開することで影響力を広げる——AIをソフトパワーとして使う戦略なの。」
🐹 もっちー「ソフトパワーとしてのAI……つまりDeepSeekを世界中の開発者が使えば使うほど、技術エコシステムの中心に中国の技術が入り込んでくるってことか。戦略的に考えてるんだね。」
オープンソース戦略の地政学:ソフトパワーとしてのAI
🦜 きなこ「DeepSeekのCEO梁文鋒は「オープンソースは文化的実践でありソフトパワーだ」と発言してるの。単なる技術提供じゃなくて、戦略的な意味があるんだよね。」
🐹 もっちー「あれ、DeepSeekって使っていいの?政府とかは使えないって聞いたけど……実際どこが禁止してるの?日本はどうなの?」
🦜 きなこ「アメリカでは、連邦政府と17州以上が、政府デバイスからDeepSeekを排除してるの。GDPR違反の懸念で、EUでも規制の動きがあるよ。イタリアとアイルランドでも、調査が始まってるんだよね。」
🐹 もっちー「17州以上ってめっちゃ多いやん!それって全米規模でほぼ使えないってことになるんちゃうの?!EUでも規制って、世界中から締め出されてるんちゃうの?!」
🦜 きなこ「政府デバイス限定の話なんだよ。民間や個人レベルでは各国でまだ使えてるの。日本はMETI(経済産業省)が注意喚起レベルで、法的規制まではいってないんだよね。」
🐹 もっちー「じゃあ日本の個人開発者はV4-FlashのAPIをふつうに使えるってこと?それはかなりありがたいな。コスト97%削減って、小さいプロジェクトでも余裕でやれる規模じゃん。」
🦜 きなこ「収益面で言うと、V4-Flashの97%コスト削減は日本の個人開発者にとってもかなり大きいんだよ。」
🦜 きなこ「月100万トークン使ってたら、ClaudeからDeepSeek V4-Flashに切り替えるだけで月のAI費用が激減するんだよ!」
🐹 もっちー「技術とガバナンスのトレードオフってことだよね。安くて強いけど、データ主権の問題がある。機密データを扱わないプロジェクトなら全然ありな選択肢じゃないかな。」
🦜 きなこ「APIとして使う分には技術的なメリットを享受しながら、機密性の高いデータを送らないという使い方が一般的だよ。技術選択とデータ管理を分けて考えることが大事なの。」
🐹 もっちー「そういえば、HuggingFaceでも中国発のモデルが増えてきてるって聞いたんだけど……DeepSeekだけじゃないってこと?QwenとかGLMとかも見るようになったよね。」
🦜 きなこ「HuggingFaceのダウンロード数でも、中国発のオープンソースモデルが米国モデルを上回る傾向が出てきてるんだよ。Qwen・GLM・DeepSeekが揃って上位に入ってきてる感じだよね。」
🦜 きなこ「R2の噂が世界を駆け巡っていた裏で、実際のオープンソースAIエコシステムは着々と成長していたんだよ。噂より現実の方が、ずっと面白い展開をしてたんだよね。」
まとめ
🐹 もっちー「結局R2って何だったんですかって聞かれたら、「一次ソースのない噂が存在しないモデルを作り上げた」って言えばいいってこと?情報リテラシーの教科書みたいな事例だよね。」
🦜 きなこ「そういうこと。R2の噂は「ない袖は振れない」だったけど、現実のDeepSeekはV4の1.6兆MoE・97%以上のコスパ・Huawei戦略失敗と輸出規制というドラマをリアルに展開してたんだよね。」
🦜 きなこ「技術的に整理するとね、MoEアーキテクチャの本質は「全員が毎回働かなくていい」という効率化なんだよ。1.6兆パラメーターのうち3%しか動かさないことで、高性能と低コストを両立させてるの。」
🐹 もっちー「R2の幻を追いかけてた時間があったら、実際にV4-FlashのAPIを触ってればよかった!MoEで97%安くて高性能なんて、現実の方がよっぽどすごいじゃん!」
🐹 もっちー「MoEって、まるで会社のプロジェクトチームみたいな感じだよね。全員が毎回出勤しなくて、その案件に合わせた専門家だけが動く!」
🦜 きなこ「R2が遅れてる原因はHuawei AscendのCANN未成熟とインターコネクト問題が大きいんだよ。」
🦜 きなこ「さらにNVIDIA H20の輸出禁止というダブルパンチで、DeepSeekは訓練インフラの制約に縛られてるんだよ。」
🐹 もっちー「技術力の問題じゃなくて地政学的な環境のせいでR2が遅れてるんだね。DeepSeekは本気でやろうとしてるけど、外部要因に縛られてる感じか。」
🦜 きなこ「もしHuawei Ascendが成熟してNVIDIA不要になったら、DeepSeekは本当にゲームチェンジャーになれるかもね。」
🦜 きなこ「V4-Flashは今すぐAPIで試せるよ。入力100万トークンで0.14ドルだから、1ドルあれば相当な量を試せるんだよ。個人開発者にとって革命的な価格設定なの。」
🐹 もっちー「1ドルで700万トークン!そんな量、普通の個人開発者が使い切れるの?むしろ気にせずガンガン使える時代になってきたんだね。それは確かに革命的だ。」
🦜 きなこ「ということで質問なんだけど、みんなはDeepSeekのR2噂を信じてた?実際にDeepSeekのAPIを使ったことある?コメントで教えてね。」
🦜 きなこ「個人開発者の視点から見ると、V4-FlashのAPIコスト削減は実際にどのくらいインパクトがあったか、具体的な数字と体験を聞かせてもらえると嬉しいな。」
🐹 もっちー「R2を待ってる間にV4は使えるんだから、ぼくも早速試してみるよ!次の動画でどんな結果だったか報告するね!」
🦜 きなこ「次の動画では引き続きAIの最新トレンドを深掘りしていくよ。お楽しみに!」
きなこもっちーのテック深掘り では、AI/LLM を中心としたテック全般をハムスター(🐹 もっちー)とセキセイインコ(🦜 きなこ)の掛け合いで楽しく解説しています。
▶️ 動画で観る → DeepSeek R2の正体はSEOブログ!噂の幻・Huawei失敗・V4の実力を徹底解説
👍 この記事が役に立ったら LGTM・ストックしてもらえると励みになります!
📺 チャンネル登録はこちら → きなこもっちーのテック深掘り
🔗 他の解説動画も見る → きなこもっちーのテック深掘り の動画一覧















