5
3

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?

RTX 5090でAIマシンを組むとき、CPUはそこまで重要じゃない理由。でも「どこまで手を抜けるか」は知っておきたい。

Posted at

「RTX 5090買ったぞ!」と意気込んで、次に悩むのがCPU選び。

でもね、ここで正直に言っておくと、AIワークロードにおいてCPUは「主役」じゃない。むしろ「裏方」に近い。じゃあ適当でいいのか?というと、それもまた違う。

今回は「なぜCPUが脇役なのか」「でもどれくらいの性能があると安心なのか」「AMD vs Intelはどう選ぶべきか」を、RTX 5090という怪物GPUに合わせて整理していく。


なぜAIワークロードでCPUは「そこまで」重要じゃないのか

理由1:計算の主役は完全にGPU

機械学習、特にディープラーニングの本質は「大量の行列演算を並列処理すること」だ。

ここでCPUとGPUの違いを思い出してほしい。

CPU GPU
コア数 4〜24個程度 数千〜数万個
処理方式 順次処理が得意 並列処理が得意
メモリ帯域 〜50GB/s 〜1,800GB/s(RTX 5090)

CPUは「複雑な判断を順番にこなす司令塔」、GPUは「単純な計算を大量に同時にさばく工場」。AIのトレーニングは後者の仕事だ。

IBMの解説によると、GPUを使ったディープラーニングのトレーニングは、同等コストのCPUより10倍以上速いとされている。NVIDIAのブログでも「2003年からGPU性能は約7,000倍向上し、コストパフォーマンスは5,600倍良くなった」と報告されている。

つまり、AIにとってGPUは「エンジン」であり、CPUは「ハンドル」みたいなもの。エンジンが1,000馬力あっても、ハンドルが1,000馬力である必要はない。

理由2:推論時はさらにCPU依存度が下がる

モデルを「学習させる」フェーズと「動かす(推論)」フェーズでは、CPUの重要度が違う。

学習時はデータの前処理やシャッフルでCPUもそこそこ働く。でも推論時は「GPUが99%の仕事をしている」と言っても過言じゃない。Stable Diffusionを動かすくらいなら、Core i5-12400FとRTX 3060 Tiの組み合わせでも「遅いけど動く」レベルには到達する。


とはいえ、CPUにも「ちゃんとした仕事」がある

「じゃあCPUは適当でいいじゃん」と思うかもしれないけど、ちょっと待ってほしい。

CPUの仕事その1:データの前処理

GPUが計算を始める前に、データは誰かが用意しなきゃいけない。

画像のリサイズ、テキストのトークナイズ、データのシャッフル、オーグメンテーション(水増し処理)。これらは全部CPUの仕事だ。

ある開発者の実体験談が印象的だった。「4枚のGPU構成で組んだのに、CPUをケチったら訓練が何度も止まる。GPUにデータが間に合わなくて餓死状態。結局Threadripperに換えたら解決した」と。

弱いCPUは「料理が遅いキッチン」みたいなもの。お客さん(GPU)は腹ペコなのに、料理が出てこない。

CPUの仕事その2:PCIeレーンでGPUにデータを流す

GPUとCPUを繋ぐ「道路」がPCIeレーンだ。

RTX 5090はPCIe 5.0 x16に対応していて、帯域幅は片方向で約64GB/s。この道路が渋滞すると、いくらGPUが速くても意味がない。

普通の消費者向けCPU(Ryzen 9000シリーズやIntel Core Ultra)はだいたい20〜28レーン程度。シングルGPUなら問題ないけど、マルチGPU構成を考えるなら、Threadripper(128レーン)やXeon Wシリーズ(112レーン)が必要になってくる。

CPUの仕事その3:システム全体のオーケストレーション

Pythonスクリプト、Dockerコンテナ、モニタリングツール、OS自体のオーバーヘッド。これら全部がCPUリソースを食う。

「GPUが30%でCPUが100%」という状態は、明らかにCPUがボトルネックになっているサイン。逆に「GPU使用率が100%でCPUが余裕」なら、それが理想的な状態。


どれくらいの性能のCPUがあればいいのか

シングルGPU構成の場合

結論から言うと、ミドルレンジで十分

  • AMD: Ryzen 5 7600X / Ryzen 7 9700X
  • Intel: Core i5-13600K / Core i7-14700K

実際のベンチマークでも、Puget SystemsのRTX 5090 AIレビューではRyzen 9 9950Xを使用しているが、「CPUがボトルネックになるのは、小さいバッチサイズで短い推論をするときくらい」と報告されている。

つまり、普通に使う分にはミドルレンジでGPUの性能を引き出せる。「最高のCPUを買わないと5090が無駄になる!」という心配は、ほぼ杞憂だ。

マルチGPU構成の場合

2枚以上のGPUを積むなら話は変わる。

  • AMD: Threadripper PRO 7000シリーズ / EPYC 9005シリーズ
  • Intel: Xeon W-3500シリーズ / Xeon Scalable

これらは128レーン以上のPCIeと8チャンネルメモリをサポートしていて、3〜4枚のGPUを余裕で支えられる。

ただし、お値段も「余裕で」跳ね上がる。Threadripper PRO 7995WXなんて100万円コース。ここまで来ると、本当にマルチGPUが必要かどうか、クラウドとの比較も含めて冷静に考えた方がいい。

「迷ったらこれ」リスト

用途 おすすめCPU 価格帯
AIの勉強・個人開発 Ryzen 5 7600X 約3万円
本格的な学習・推論 Ryzen 9 9950X 約10万円
ゲーミング+AI Ryzen 7 9800X3D 約7万円
マルチGPU本気構成 Threadripper PRO 30〜100万円

AMD vs Intel、AIマシンではどっちがいい?

AMDの強み

コア数・スレッド数が多い

同価格帯で比較すると、AMDの方がコア数が多い傾向にある。AI向けのデータ前処理やマルチスレッド処理で有利。

PCIeレーンが豊富

AM5プラットフォームはPCIe 5.0を28レーンサポート。マルチGPU構成に強い。ThreadripperやEPYCに至っては128レーン以上。

3D V-Cacheの恩恵(ゲーミング兼用時)

Ryzen 7 9800X3DやRyzen 9 9950X3Dは、巨大なL3キャッシュ(96〜128MB)を搭載。AIには直接関係ないけど、ゲームも楽しみたいなら最強の選択肢。

電力効率が良い

Zen 5アーキテクチャは電力あたりの性能が高い。24時間回し続けるAIワークロードでは電気代も馬鹿にならない。

Intelの強み

ソフトウェア互換性が高い

歴史的にIntel向けに最適化されたソフトウェアが多い。oneAPIやMKL-DNNなど、Intel独自の最適化ライブラリも充実。

AMX(Advanced Matrix Extensions)

Xeon Scalable(Sapphire Rapids以降)にはAMXという行列演算アクセラレータが搭載されている。CPUだけでAI推論を行う場面では有利。

シングルスレッド性能

Core Ultra 9 285Kなどはシングルスレッド性能が高い。ただし、AIワークロードではマルチスレッド性能の方が重要なことが多い。

企業向けサポート

Xeonは信頼性やサポート体制が手厚い。ミッションクリティカルな業務用途では安心感がある。

結論:AI用途ならAMD優勢

正直なところ、2025年時点でAI/MLワークステーションを組むなら、AMDの方がコスパが良い

NotebookCheckの「Best AI Workstation Processors 2025」でも「Why AMD Ryzen Beats Intel for Local AI Computing for now!」というタイトルで、AMDの優位性が解説されている。

ただし、Intelが悪いわけじゃない。既存のIntelプラットフォームがあるなら無理に乗り換える必要はないし、企業用途でXeonの実績を重視するケースもある。


RTX 5090と相性が良いCPUベスト5

1位:AMD Ryzen 7 9800X3D(ゲーミング兼用なら最強)

  • 8コア16スレッド、ブースト5.2GHz
  • 96MB L3 3D V-Cache
  • TDP 120W
  • 価格:約7万円

「AIもやりたい、でもゲームもガチでやりたい」ならこれ一択。ゲーミング性能は現行最強で、AIの推論やライトな学習も問題なくこなせる。Club386のテストでは、RTX 5090との組み合わせで1080pから4Kまで安定したフレームレートを記録。

ただし、8コアなので重い並列処理には限界あり。本格的なモデル訓練には物足りないかも。

2位:AMD Ryzen 9 9950X(生産性重視ならこれ)

  • 16コア32スレッド、ブースト5.7GHz
  • 64MB L3キャッシュ
  • TDP 170W
  • 価格:約10万円

コア数が9800X3Dの倍。レンダリング、3Dモデリング、AIの学習など「重たいマルチスレッド処理」が多いならこっち。

GeekaWhatのレビューでは「RTX 5090と組み合わせて4K/8Kゲーミングからプロダクティビティまでボトルネックなし」と評価されている。

3位:AMD Ryzen 9 9950X3D(全部入り、お金があるなら)

  • 16コア32スレッド
  • 128MB L3 3D V-Cache
  • 価格:約11万円(2025年3月発売)

9950Xの生産性と9800X3Dのゲーミング性能を両立したモンスター。「予算があるなら迷わずこれ」という声も多い。

4位:Intel Core Ultra 9 285K(Intel派なら)

  • 8 Pコア + 16 Eコア(24コア24スレッド)
  • ブースト5.7GHz
  • TDP 125W
  • 価格:約9万円

Intelの最新Arrow Lakeアーキテクチャ。マルチスレッド性能は高いが、ゲーミングでは9800X3Dに負ける。「仕事用PCにRTX 5090を積みたい」というビジネスユースなら選択肢に入る。

5位:Intel Core i7-14700K(コスパ重視のIntel)

  • 8 Pコア + 12 Eコア(20コア28スレッド)
  • ブースト5.6GHz
  • TDP 125W
  • 価格:約6万円

14世代Coreの中ではバランスが良い。13世代からの進化は少ないけど、安定性は高い。「Intelがいいけど高すぎるのは困る」という人に。


マルチGPU構成を考えるなら

RTX 5090を2枚以上積む猛者には、以下のCPUを推奨する。

AMD Threadripper PRO 7000WXシリーズ

  • 最大96コア192スレッド(7995WX)
  • 128 PCIe 5.0レーン
  • 8チャンネルDDR5(最大2TB)
  • 価格:30〜100万円

Puget Systemsが「ML/AI向けに推奨するCPUプラットフォーム」として挙げているのがこれ。3〜4枚のGPUを余裕で支えられる。

Intel Xeon W-3500シリーズ

  • 最大60コア120スレッド
  • 112 PCIe 5.0レーン
  • 8チャンネルDDR5 ECC
  • 価格:40〜80万円

エンタープライズ向けの信頼性が売り。AMX(行列演算アクセラレータ)搭載で、CPU推論も高速。


まとめ:結局どうすればいい?

AIマシンでCPUが「そこまで」重要じゃない理由

  1. 計算の99%はGPUが担当
  2. メモリ帯域もGPUの方が圧倒的に速い
  3. 推論時はほぼGPU任せ

でもCPUには「ちゃんとした仕事」がある

  1. データ前処理(GPUに餌を与える係)
  2. PCIeレーンでGPUにデータを流す道路
  3. システム全体のオーケストレーション

どれくらいの性能があればいい?

  • シングルGPU:ミドルレンジ(Ryzen 5/7、Core i5/i7)で十分
  • マルチGPU:ハイエンド(Threadripper、Xeon W)が必要

AMD vs Intel

  • AI用途ならAMDがコスパ良好
  • Intelはソフトウェア互換性と企業サポートで強み
  • ゲームもやるなら3D V-Cache搭載AMDが最強

RTX 5090との相性ベスト

  1. Ryzen 7 9800X3D(ゲーミング兼用)
  2. Ryzen 9 9950X(生産性重視)
  3. Ryzen 9 9950X3D(全部入り)
  4. Core Ultra 9 285K(Intel派)
  5. Core i7-14700K(コスパIntel)

参考情報

主要な一次情報

NVIDIA公式ブログ - Why GPUs Are Great for AI
https://blogs.nvidia.com/blog/why-gpus-are-great-for-ai/

"GPU performance has increased roughly 7,000 times since 2003 and price per performance is 5,600 times greater"
(GPUの性能は2003年から約7,000倍向上し、コストパフォーマンスは5,600倍良くなった)

IBM - CPU vs. GPU for Machine Learning
https://www.ibm.com/think/topics/cpu-vs-gpu-machine-learning

"Training deep neural networks on GPUs can be over 10 times faster than on CPUs with equivalent costs."
(GPUを使ったディープニューラルネットワークの訓練は、同等コストのCPUより10倍以上速くなりうる)

Puget Systems - NVIDIA GeForce RTX 5090 & 5080 AI Review
https://www.pugetsystems.com/labs/articles/nvidia-geforce-rtx-5090-amp-5080-ai-review/

"The most likely explanation for this is a CPU bottleneck somewhere in the generation pipeline, which most prominently affects these shorter runs at smaller batch sizes."
(これはおそらく生成パイプラインのどこかでCPUボトルネックが発生しているためで、特に小さいバッチサイズでの短い実行に影響する)

SabrePC - Best Processors for Machine Learning
https://www.sabrepc.com/blog/Deep-Learning-and-AI/best-processors-for-machine-learning

"The CPU manages critical tasks like data preprocessing, memory transfer, and task coordination, feeding data to the GPU and keeping the entire pipeline running smoothly."
(CPUはデータ前処理、メモリ転送、タスク調整といった重要なタスクを管理し、GPUにデータを供給してパイプライン全体をスムーズに動かす)


RTX 5090という怪物を飼うなら、CPUは「最低限まともなエサをあげられる飼育員」であればいい。でも「エサを渡す手が遅い」とせっかくの怪物が本気を出せない。そのバランスを理解した上で、自分の用途に合ったCPUを選んでほしい。

5
3
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
5
3

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?