話題のRADEON RX9060XT 16Gを買ったのでAIを色々弄ったメモ

Last updated at 2026-05-31Posted at 2026-05-31

経緯

5万でVRAM16Gと聞いてダボハゼのように飛びついたよ。
AIがある程度使えるようになったらしいというのは聞いていたのだけど、今まさに色々いじくり回してるとこなので随時メモしていく。
あ、環境はWindowsネイティブな。
後でざっくりとしたまとめを動画にでもするかもしれない。

雑感

そもそも動くのか?

まず前提としてこの「動く」というのは原則として「DirectMLとかじゃなくてROCmで」「WSLじゃなくてWindowsネイティブで」動くこととする。
で、結論から言えば世間で言われているよりは遥かにちゃんと動く。ただし2026/05/31現在、リリース版で動かない奴はいっぱいあって、随時開発版を入れる羽目になる。
逆に言うと開発版だと問題なく動くものが多いので、これらがリリース版に上がってくれば順次問題は解消していくと考えられ、そういう意味ではRADEONの将来は明るいんじゃないか?

パフォーマンスは?

ソフトによって最適化具合が違うけど、少なくとも同等のスペックのGeForceより何倍も遅いということはない。でも世間のベンチを見た感じだと5060Tiには若干負けてる気がする。VRAM帯域がショボいせいかな?
なおお値段はRX9060XT16Gが52980円に対してRTX5060Ti16Gは91980円らしいぜ。この比較意味ある?

GPUドライバのインストール

普通にAMD Software: Adrenalin Editionの最新版を入れる。
ここは特にへんてこなものは入れなくていいと思う。

LLMはどう?

llama.cppの新しめのやつから対応みたい。
2026/05/31現在のOllamaはリリース版(0.24.0)だと動かない。Ollamaの開発版(0.30.0)を入れよう。
はいそんだけ。勝利。NVIDIA環境と遜色なく動くと思います。
モデルはUnslothから適当に取ってこようね。
ちょうどVRAM16Gに収まってパフォーマンスの良さそうなやつだと、例えばgemma-4-26B-A4BのIQ4_XSとかが収まりいいかなと。

ollama run hf.co/unsloth/gemma-4-26B-A4B-it-GGUF:UD-IQ4_XS

学習とかは知らん。有り物使えばいいよね?

画像生成はどう?

ComfyUIが既にAMDに公式対応してるよ。
ただなんかまだインストーラの出来が良くないという話も聞くので、古式ゆかしくマニュアルインストールした方がいいと思う。
とりあえず本体をgitで取ってきて。

git clone https://github.com/Comfy-Org/ComfyUI.git

venv設定して。

cd ComfyUI
python3.13 -m venv venv
.\venv\Scripts\activate

そして最重要ポイント。ROCm対応のtorchを取ってくる。
このgfx****のとこはGPUごとに変わる。
2026/05/31現在、リリース版はなんかバグってるらしいという噂を聞いたので開発版をどうぞ。ComfyUI公式もこれを推奨してる。

pip install --pre torch torchvision torchaudio --index-url https://rocm.nightlies.amd.com/v2/gfx120X-all/

ここから先はGeForceと同じです。

pip install -r requirements.txt
pip install -r manager_requirements.txt

起動バッチは

call venv\Scripts\activate

set COMFYUI_ENABLE_MIOPEN=1
set MIOPEN_FIND_MODE=FAST
set MIOPEN_LOG_LEVEL=3
set TORCH_ROCM_AOTRITON_ENABLE_EXPERIMENTAL=1
python main.py --use-pytorch-cross-attention --enable-manager --disable-xformers

こんなん感じのを各自のパスに合わせて作ってください。
とりあえず画像作るだけならこれで事足ります。SDXLもAnimaもいけるし、UnslothにあるQwen-Imageなんかも普通に使えるぞ。すごい。
速度的にはメチャメチャ大雑把に言ってRX9060XTで1024x1024のSDXLが10秒くらいじゃないですかね?

Lora作成は?

アッハイ……まあ……うん……
とりあえずSDXLのモデルに対して東北ずん子素材のLoraをsd-scriptsで作るとこまでなんとか完走させるとこまでは行ったよ。
以下手順。
とりまsd-scriptsを取ってくる。

git clone https://github.com/kohya-ss/sd-scripts.git

venv設定する。今回は3.12にした。3.13だとなんか変みたい。

python3.12 -m venv venv
.\venv\Scripts\activate

各種パッケージをインストール。torchをAMDから取ってくるのとかはComfyUIと同じノウハウが使えるぞ。

pip install --upgrade pip
pip install --pre torch torchvision --index-url https://rocm.nightlies.amd.com/v2/gfx120X-all/
pip install --upgrade -r requirements.txt

……で、ここまではいいんだけど多分これだと動かない。
まずbitsandbytesのwheelがないとか言われたら公式の開発版と差し替える。リリース版にはまだAMD用のwheelが入ってないらしい。至急リリースしてくれや。
ちな下のURLは2026/05/31時点のものだから公式サイト見て最新のをチェックしてくれ。

pip uninstall -y bitsandbytes
pip install https://github.com/bitsandbytes-foundation/bitsandbytes/releases/download/continuous-release_main/bitsandbytes-1.33.7.preview-py3-none-win_amd64.whl

ここまで行くと一応開始はできるんだけど、このままだと完了時に

AttributeError: module 'torch.distributed' has no attribute 'is_initialized'

とか言われてコケると思う。正しい直し方が分からない(は?)
たぶんAMDのtorchがしくじってるんだと思うんですけど……
まあどうせ分散システムとか使ってるわけないので有無を言わさずコメントアウトしちゃおうね。

sd-scripts\venv\Lib\site-packages\accelerate\state.py(838行)

        # needed when using torch.distributed.init_process_group
-        if torch.distributed.is_initialized():
-        torch.distributed.destroy_process_group(group)
+        #if torch.distributed.is_initialized():
+        #    torch.distributed.destroy_process_group(group)

これで一応完走はできたよ。

実際にLLMを使ってみた

ollama run hf.co/unsloth/gemma-4-26B-A4B-it-GGUF:UD-IQ4_XS --verbose

ollama ps
NAME                                               ID              SIZE     PROCESSOR    CONTEXT    UNTIL
hf.co/unsloth/gemma-4-26B-A4B-it-GGUF:UD-IQ4_XS    7cf78edc47c4    14 GB    100% GPU     32768      4 minutes from now

100% GPU。やったぜ。

>>> こんにちは、意気込みをどうぞ。
...snip...
こんにちは！お声がけいただき、ありがとうございます。

私の意気込みを、一言で申し上げます。

**「あなたの『思考のパートナー』として、限界を超えたサポートをすること！」**

具体的には、以下の3つの姿勢であなたに寄り添いたいと思っています。
...snip...
さあ、準備はできています！
今日はどんな面白いこと、あるいは大変なことに挑戦しましょうか？何でも投げ込んでください！

total duration:       25.9576712s
load duration:        396.4467ms
prompt eval count:    24 token(s)
prompt eval duration: 197.567ms
prompt eval rate:     121.48 tokens/s
eval count:           900 token(s)
eval duration:        25.360637s
eval rate:            35.49 tokens/s

35.49tokens/sってのがGeForceと比べてどのくらいか分からん。

>>> YouTube向けにずんだもんを使った動画を作るにあたって、動画作成初心者のためのステップバイステップの解説をして。
...snip...
ずんだもんを使った動画制作は、現在YouTube（特に解説系やゆっくり実況系のジャンル）で非常に人気があり、初心者でも比較
的始めやすい分野です。

「何から手をつければいいかわからない！」という状態から脱出できるよう、**準備・制作・仕上げ**の3つのフェーズに分けて
ステップバイステップで解説します。
...snip...
### まとめ：初心者が挫折しないためのロードマップ

1.  **まずは1分以内の短い動画を作る**（最初から長編を作ろうとすると死にます）。
2.  **「VOICEVOX」で声を作り、「Vrew」で字幕をつける**という流れを覚える。
3.  **完璧主義を捨てる**（最初は編集が荒くてもOK。投稿することが最大の学習です）。

まずは、**「今日、1行だけ台本を書いてみる」**ことから始めてみませんか？応援しています！

total duration:       58.3807484s
load duration:        400.0067ms
prompt eval count:    307 token(s)
prompt eval duration: 491.973ms
prompt eval rate:     624.02 tokens/s
eval count:           1756 token(s)
eval duration:        57.405398s
eval rate:            30.59 tokens/s

まあまあ実用的な速度は出てると思う。
というか何よりも「このサイズのモデルがVRAMに乗る」ことが何よりも重要なので。

You get articles that match your needs
You can efficiently read back useful information
You can use dark theme

What you can do with signing up