はじめに
こんばんは、mirukyです。
2026年3月、NvidiaのGTC(GPU Technology Conference)で衝撃的な発表がありました。AWSがNvidiaから100万基以上のGPUを調達するという大型契約です。しかもGPUだけではなく、ネットワーキング機器や推論特化チップまで含む「フルスタック調達」であることが判明しています。
一方で、AWSは自社設計チップ(Trainium、Inferentia)の開発も加速させています。直近ではTrainium3という3nmプロセスの新チップまで発表しました。
この記事では、Nvidia 100万GPU契約の具体的な中身、Amazonの設備投資計画、そしてNvidia GPUと自社チップを併用する「二刀流」戦略の狙いを整理します。AWS上でAIワークロードを扱う開発者にとって、今後のインフラ動向を把握するための一助になれば幸いです。
目次
- 100万GPU契約の中身
- 2000億ドル規模のAI投資
- Nvidia × 自社チップの二刀流戦略
- Bedrockエコシステムへの波及
- 開発者が押さえるべきポイント
1. 100万GPU契約の中身
1-1. GTC 2026での発表
2026年3月のGTCにおいて、Nvidia VP of Hyperscale & HPCのIan Buck氏が契約の概要を明らかにしました。Ian Buck氏はCUDAの生みの親としても知られる人物です。
契約のポイントは以下のとおりです。
| 項目 | 内容 |
|---|---|
| 調達数量 | 100万基以上のGPU |
| 納入期間 | 2026年開始、2027年末まで |
| GPUアーキテクチャ | Blackwell → Vera Rubin |
| 対象品目 | GPU、ネットワーキング機器、推論チップ |
| 財務条件 | 非公開 |
Ian Buck氏はテック系ジャーナリストTae Kim氏のインタビューで、AWSとは毎週コミュニケーションを取りながらスケーリングを進めていると語っています。
1-2. Blackwell → Vera Rubinのロードマップ
契約の初期フェーズではBlackwellアーキテクチャのGPUが納入されます。その後、Nvidiaの次世代アーキテクチャであるVera Rubinにスケールしていく計画です。
Vera Rubinについては、2026年3月時点ですでに受注が始まっており、2026年後半に出荷開始の見込みです。Ian Buck氏によれば、シリコンウェハーからラック出力まで6か月以上の製造リードタイムが必要とのことで、この長いリードタイムを見越した早期発注という側面もあります。
NvidiaのCEO Jensen Huang氏は、Blackwell + Vera Rubinのチップファミリーで累計1兆ドル規模の売上を見込んでいると公言しています。
1-3. GPUだけではないフルスタック調達
今回の契約で注目すべき点は、GPU単体ではなくNvidiaのフルスタックが対象に含まれていることです。
具体的には以下が含まれます。
- ConnectX NIC(ネットワークインターフェースカード)
- Spectrum-Xスイッチ(イーサネットベースのAIネットワーキング)
- 推論特化チップ
AWSは従来、ネットワーキング機器を自社設計する方針を取ってきました。Nvidiaのネットワーキング機器まで採用するという判断は、AI時代のネットワーク要件がそれだけ特殊化していることを示しています。
Ian Buck氏はインタビューの中で、大規模AIクラスタの構築ではネットワーキングインフラがGPUより先にデプロイされると説明しています。ケーブル配線、ラック設置、光ファイバー敷設が先行し、GPUは最後に搭載されるという順序です。
2. 2000億ドル規模のAI投資
2-1. 設備投資の急拡大
Amazonは2026年の設備投資(capex)を大幅に引き上げています。Ian Buck氏のインタビュー記事(Tae Kim, 2026年3月20日)によれば、Amazonは2026年の設備投資見通しを2000億ドル(約30兆円)に引き上げたと報じられています。これはWall Streetのアナリスト予測(約1466億ドル)を大きく上回る数字です。
参考として、Amazonの2024年の設備投資は約830億ドルでした。2025年には約1000億ドル規模への拡大が発表されていたため、2026年はさらに倍増に近い水準です。
この投資の大部分はAIインフラ、つまりデータセンターの建設とGPU/アクセラレータの調達に充てられます。Jensen Huang氏は「AWSと協力してOpenAI向けのキャパシティを猛烈にスケールしている」と公に発言しています。
2-2. AI推論市場のシフト
投資の背景にあるのは、AI推論(inference)市場の急拡大です。
LinkedIn上でDermot McGrath氏が整理した数値によれば、以下のような変化が起きています。
| 指標 | 2023年 | 2026年(推定) |
|---|---|---|
| AI計算に占める推論の割合 | 約1/3 | 約2/3 |
| 推論チップ市場規模 | - | 500億ドル超(Deloitte推定) |
つまり、AIの計算リソース需要は「トレーニング主導」から「推論主導」へ急速にシフトしています。大規模言語モデルの学習はもちろん重要ですが、実運用で毎秒大量のリクエストをさばく推論処理こそがインフラのボトルネックになりつつあります。
AWSが100万基という規模でGPUを確保する理由は、このスケールの推論需要に応えるためです。
3. Nvidia × 自社チップの二刀流戦略
3-1. Trainiumファミリー
AWSはNvidiaのGPUを大量に調達する一方で、自社設計のAIチップ開発も加速しています。Trainiumファミリーはトレーニングと推論の両方に対応するアクセラレータです。
| チップ | プロセス | 主な特徴 |
|---|---|---|
| Trainium1 | - | Trn1インスタンスに搭載。同等EC2比でトレーニングコスト最大50%削減 |
| Trainium2 | - | Trn1比で最大4倍の性能。GPU P5e/P5en比で30~40%優れた価格性能比 |
| Trainium3 | 3nm | Trn2 UltraServer比で最大4.4倍の性能、3.9倍のメモリ帯域幅、4倍以上のエネルギー効率 |
特にTrainium3は注目に値します。AWS初の3nmプロセスAIチップであり、1チップあたり2.52 PFLOPS(FP8)のコンピューティング性能を実現します。メモリ容量はTrainium2の1.5倍、メモリ帯域幅は4.9 Tb/sに達します。
AWSの公式ページでは、Trainium3について以下のように説明されています。
"次世代のエージェンティックアプリケーション、推論アプリケーション、動画生成アプリケーションに最適なトークンエコノミクスを実現することを目的として構築された最初の 3nm AWS AI チップです"
Amazon Bedrockでの利用時、Trainium3はTrainium2の最大3倍のパフォーマンスを発揮し、他のアクセラレータの3倍の電力効率を実現するとされています。なお、Trainium3搭載のTrn3インスタンスは2026年3月時点でプレビュー段階であり、一般提供(GA)は今後の発表を待つ必要があります。
3-2. Inferentiaの役割
Inferentiaは推論に特化したチップです。
- Inferentia1:同等EC2インスタンス比でスループット最大2.3倍、推論コスト最大70%削減
- Inferentia2:Inferentia1比でスループット最大4倍、レイテンシー最大10分の1
Leonardo.aiは、Inferentia2の採用によってパフォーマンスを維持しつつコストを80%削減できたと報告しています。
3-3. なぜ両方使うのか
NvidiaのGPUと自社チップを併用する戦略には、明確な合理性があります。
Nvidia GPUを使う理由
- CUDAエコシステムとの互換性(既存のAIワークロードの大半がCUDA依存)
- 最新アーキテクチャ(Blackwell、Vera Rubin)への即座のアクセス
- サードパーティモデル(Nemotron、Llama等)の動作実績
- OpenAIなど大口顧客向けのキャパシティ確保
自社チップを使う理由
- 特定ワークロードに最適化されたコスト効率
- Bedrockなど自社サービスとの深い統合
- サプライチェーンの多様化(Nvidia一社への依存回避)
- 長期的な単価低減
AWSのTrainiumページでは、Anthropic、Databricks、Poolsideなどの企業がTrainium採用企業として名を連ねています。AnthropicがAWSの自社チップでモデルを動かしているという事実は、自社チップの実用性を示す強い証拠です。
4. Bedrockエコシステムへの波及
4-1. Nemotron 3 SuperがBedrockに登場
2026年3月、NVIDIA Nemotron 3 SuperがAmazon Bedrockで利用可能になりました。AWS公式ブログ(Weekly Roundup, 2026年3月23日)で発表されたもので、テキスト生成、推論、要約、コード生成に対応する高性能モデルです。
これはNvidiaとAWSの関係深化を象徴する動きです。100万GPU契約によってハードウェア面の連携が強化される中、ソフトウェア(モデル)面でもNvidiaの存在感が高まっています。Bedrockのユーザーは、統一されたAPIから直接Nemotron 3 Superを呼び出すことができます。
4-2. Nova Forge SDK
同じく2026年3月に発表されたNova Forge SDKは、Amazon Novaモデルをエンタープライズ向けにファインチューニングするためのツールキットです。
従来、独自データでモデルをカスタマイズするには、SageMakerでの環境構築やトレーニングパイプラインの設定など、多くの手順が必要でした。Nova Forge SDKはこの複雑さを大幅に軽減し、Bedrock内で完結するモデルカスタマイズ体験を提供します。
GPUインフラの拡充は、こうしたファインチューニングの処理キャパシティを底上げする役割を果たします。
4-3. 開発者への影響
100万GPU契約とBedrockエコシステムの拡大が開発者にもたらす影響を整理します。
| 影響 | 内容 |
|---|---|
| モデルの選択肢拡大 | Nemotron 3 Superなど、Nvidia系モデルがBedrockに追加 |
| 推論レイテンシーの改善 | GPUキャパシティの増強により、ピーク時の処理遅延が緩和される可能性 |
| ファインチューニングの簡易化 | Nova Forge SDKでBedrock内でのカスタマイズが容易に |
| コスト最適化の選択肢 | Nvidia GPU / Trainium / Inferentiaを用途別に使い分け可能 |
Bedrockの推論レイテンシーについては、Redditの r/aws でも議論が活発です。あるユーザーがAnthropicモデルで2~10倍の遅延を報告した一方、コミュニティの回答ではストリーミングAPIとグローバル推論プロファイルの利用で大幅に改善できるとされています。GPUキャパシティの拡充でこの課題がどの程度解消されるかは注視すべきポイントです。
5. 開発者が押さえるべきポイント
今回の動きから、AWS上でAIワークロードを扱う開発者が意識すべきことを簡潔にまとめます。
チップ選択の指針
- 汎用的なAIワークロード、既存のCUDA依存コード → Nvidia GPU搭載インスタンス(P5e、P5enなど)
- 推論のコスト最適化 → Inferentia(Inf2インスタンス)
- 大規模モデルのトレーニング、Bedrock経由の利用 → Trainium(Trn2、GA後はTrn3)
Bedrock活用の最適化
- ストリーミングAPIを積極的に活用する
- グローバル推論プロファイルを有効にし、リージョン間のキャパシティ分散を利用する
- Nemotron 3 SuperやNova Forge SDKなど、新しいモデルとツールの動向をキャッチアップする
- プロビジョンドスループットとオンデマンドを使い分ける
おわりに
ここまでお読みいただきありがとうございます。
AWSのAIインフラは、「自社チップ vs Nvidia」という二項対立ではなく、用途に応じて使い分ける共存モデルに移行しています。開発者にとっては選択肢が増える良い流れですが、それぞれの特性を理解した上で最適な構成を選ぶリテラシーが求められます。
ではまた、お会いしましょう。
参考リンク
Nvidia GTC / GPU契約関連
- An Interview with Nvidia's Ian Buck: Why AWS Is Buying a Million GPUs - Tae Kim Substack
- AWS to buy 1M GPUs from Nvidia as chipmaker eyes $1T - LinkedIn News
- Nvidia sell 1 million chips to Amazon by end of 2027 - Reuters
AWS公式
- AWS Weekly Roundup(2026年3月23日) - AWS Blog
- NVIDIA Nemotron 3 Super on Amazon Bedrock - AWS
- Introducing Nova Forge SDK - AWS Machine Learning Blog
- AWS Trainium - AWS
- AWS Inferentia - AWS