ユーザー質問1: Radeonシリーズはどの型番から使えるのでしょうか。LLM研究開発用GPU購入の参考情報にしたいのです。
(GPT回答)
2026年4月時点の実用目線では、LLM研究開発用に買うなら Radeon RX 7900系以上が無難です。
「とにかく動く」だけなら下の型番もありますが、PyTorch / ROCm / vLLM / FlashAttention まで考えると線引きが変わります。
目安
| 用途 | 最低ライン | 購入候補として現実的 |
|---|---|---|
| Ollama / llama.cpp でローカル推論 | RX 5500 XT / 5700 / 6800 / 7600 なども対象 | 既に持っているなら可 |
| PyTorch + ROCm で研究開発 | RX 7700 / 7700 XT / 7800 XT / 7900系 / 9000系 | RX 7900 GRE以上推奨 |
| vLLM サービング | RX 7900系、RX 9000系 | RX 7900 XTX、RX 9070 XT、AI PRO R9700 |
| VRAM重視のLLM開発 | 16GB以上 | RX 7900 XTX 24GB、Radeon AI PRO R9700 32GB、Radeon PRO W7900 48GB |
型番で言うと
-
買ってよいライン:
RX 7900 GRE / XT / XTX、RX 9070 / 9070 XT、RX 9060 XT、RX 7800 XT -
研究開発ならできれば避けたい:
RX 7600 / 7600 XT以下
Ollamaでは名前が出ますが、ROCm/PyTorch/vLLMの開発用途では対応範囲が狭くなります。 -
本気でLLM用:
Radeon AI PRO R9700 32GB、Radeon PRO W7900 48GB
価格が許せばVRAMが効きます。
AMDの最新ROCm for Radeon資料では、Linuxで RX 9070 / 9070 XT / 9070 GRE / 9060 / 9060 XT / 7900 XTX / 7900 XT / 7900 GRE / 7800 XT / 7700 / 7700 XT などがサポート対象です。さらに PyTorch、TensorFlow、ONNX、Triton、vLLM、llama.cpp、FlashAttention-2 もRadeon on Linuxの対応項目に入っています。
参考: ROCm on Radeon compatibility
一方で vLLM はもう少し狭く、AMD GPUでは Radeon RX 7900 series と Radeon RX 9000 series を明記しています。vLLMを使う予定があるなら、RX 7900系以上を基準にした方がよいです。
参考: vLLM GPU requirements
私なら購入候補はこの順です。
-
Radeon RX 7900 XTX 24GB
価格とVRAMのバランスがよく、LLMローカル研究用として一番現実的。 -
Radeon AI PRO R9700 32GB
32GB VRAMが魅力。AMD公式もローカルAI開発向けをうたっています。 -
Radeon PRO W7900 48GB
VRAM最優先なら強いですが、価格は研究室・業務向け。 -
Radeon RX 9070 XT 16GB / RX 7800 XT 16GB
軽めの推論・小規模LoRAなら候補。ただし大きめLLMでは16GBがすぐ壁になります。
なので短く言うと、**「RadeonならRX 7900 XTXから」**を推奨します。予算重視ならRX 7800 XT、VRAM重視ならAI PRO R9700かPRO W7900です。
ユーザー質問2: NvidiaGeforceシリーズに比べると、AMDRadeonでは結局コスパがわるいでしょうか
(GPT回答)
結論は「目的次第。ただし研究開発の総コスパでは、まだGeForceが有利になりやすい」です。
Radeonはハード単体で見ると、特に RX 7900 XTX 24GB や Radeon AI PRO R9700 32GB はVRAM単価が魅力です。ローカル推論、Ollama、llama.cpp、ROCm対応済みPyTorch、vLLMをLinuxで使う、という範囲なら十分候補になります。AMD公式もROCm 7.2系でRadeon 9000系と一部7000系、PyTorch、vLLM、llama.cpp、FlashAttention-2対応を掲げています。
ただ、LLM「研究開発」では、GPU価格だけでなく 詰まったときの時間コスト が大きいです。ここでNVIDIAが強いです。CUDA前提の論文実装、bitsandbytes、FlashAttention、vLLM、TensorRT-LLM、Transformers周辺の情報量、Dockerイメージ、issue解決例が圧倒的に多いので、「動かすまでの摩擦」が小さいです。
ざっくり判断すると:
| 選び方 | おすすめ |
|---|---|
| いろいろなLLM実装・論文コードを触る | GeForce RTX |
| LoRA/QLoRA、bitsandbytes、CUDA前提ツールを多用 | GeForce RTX |
| Linux + ROCmに慣れている | Radeonもあり |
| 推論中心、VRAM単価重視 | RX 7900 XTX / R9700 はかなりあり |
| Windows中心で研究開発 | GeForce RTX が無難 |
| 仕事・納期・再現性重視 | GeForce RTX が無難 |
個人的な推奨はこうです。
-
一枚だけ買ってLLM研究開発を広くやる
→ GeForce RTXを選ぶ方が後悔しにくいです。RTX 4090 24GB、RTX 5090 32GB、予算次第でRTX 4070 Ti SUPER/4080系/5080系。ただし16GBはすぐ壁になります。 -
VRAM単価を重視してローカル推論・自前実験中心
→ Radeon RX 7900 XTX 24GB はかなり魅力があります。ROCmで戦う覚悟があるならコスパは悪くありません。 -
32GB以上が欲しいがNVIDIA 5090が高すぎる
→ Radeon AI PRO R9700 32GB は面白い候補です。ただしCUDA資産との互換性ではNVIDIAに劣ります。
なので、「Radeonは結局コスパが悪いか?」への答えは、ハード単体では悪くない。むしろVRAM単価は良いことがある。でも研究開発全体の時間コストまで入れると、NVIDIA GeForceの方がまだコスパが良い場面が多い、です。
参考: ROCm Radeon compatibility, vLLM GPU requirements, TensorRT-LLM support matrix