AMD GPU での Stable Diffusion の改善

Last updated at 2025-06-01Posted at 2023-06-21

AMD GPU で Stable Diffusion のパフォーマンスが改善されたという情報と、関連する AMD の動向を紹介します。

導入方法を説明しますが、対象となる GPU を所持していないため動作確認できていません。

【追記 2025/06/02】Windows 版の ROCm が自分でビルドして試せるようになりました。

情報源

リリースノートによれば Adrenalin Edition 23.5.2 は、従来の 23.5.1 に比べて RX 7900 XTX での Stable Diffusion 1.5 のパフォーマンスが 2 倍近く向上したとのことです。

Performance optimizations for Microsoft Olive DirectML pipeline for Stable Diffusion 1.5 on AMD Radeon RX 7900 series graphics

Boost your performance by an average of 2x in Microsoft Olive Optimized DirectML Stable Diffusion 1.5 using AMD Software: Adrenalin Edition™ 23.5.2 on the AMD Radeon^™️ RX 7900 XTX graphics card, versus the previous software driver version 23.5.1. ^RS-579

日本語の記事です。

AMD Radeon RX 7000シリーズビデオカードはAIワークロードに最適化されたAIアクセラレーターを搭載。最新ドライバーを適用したAMD Radeon RX 7900 XTXビデオカードでは、Stable Diffusion 1.5（DirectMLとMicrosoft Olive最適化バージョン）にて従来ドライバー（23.5.1）と比べて平均2倍のパフォーマンスを達成できるという。

この記事からリンクされている AMD のブログに説明があります。

Microsoft has optimized DirectML to accelerate transformer and diffusion models, used in Stable Diffusion, so that they run even better across the Windows hardware ecosystem. AMD is enabling the next wave of hardware accelerated AI programs using DirectML as seen in the pre-release of Olive. Step by step instructions are available on the main site, which makes it easy to install: Olive/examples/directml/stable_diffusion at main · microsoft/Olive · GitHub.

DeepL による翻訳

マイクロソフトは DirectML を最適化し、Stable Diffusion で使用されているトランスフォーマーと拡散モデルを高速化することで、Windows ハードウェア・エコシステム全体でより優れた動作を実現しました。 AMD は、Olive のプレリリースに見られるように、DirectML を使用してハードウェアアクセラレーションによる AI プログラムの次の波を可能にします。メインサイトにはステップ・バイ・ステップのインストラクションが用意されており、簡単にインストールできます: Olive/examples/directml/stable_diffusion at main · microsoft/Olive · GitHub.

Olive

Stable Diffusion のモデルを Olive によって ONNX に最適化して変換します。画像生成には diffusers の OnnxStableDiffusionPipeline から onnxruntime-directml を使用します。

Stable Diffusion web UI には対応していません。利用には diffusers の知識が必要となります。diffusers については入門記事を参照してください。

Olive は AMD GPU 専用ではなく、NVIDIA GPU への対応も行われています。記事から Olive や ONNX に言及した部分を引用します。

また，PyTorchモデルの最適化，およびディープラーニングモデルの相互変換を行うオープンなフレームワーク「Open Neural Network Exchange」（ONNX）の変換を行うツール「microsoft/Olive」を，MicrosoftがGitHubで公開している。今後は，MicrosoftとNVIDIAが協力してOliveを使用した最適化を進めていくそうだ。
これにより，AIアプリケーションの開発者は，GeForce RTX GPUを搭載したワークステーションやノートPC上でモデルをカスタマイズしたり最適化したりしたうえで，それを「Microsoft Azure」のクラウドにプッシュするといったことが，より自在に行えるようになると，NVIDIAは説明している。
ちなみに，OliveはGPUへの最適化機能もあるので，NVIDIAとの共同開発によりNVIDIA製GPUでの性能の向上も期待できるかもしれない。

インストール

Windows 10 に Python 3.10 と Git for Windows をインストールします。

venv で環境を分離します。

Windows コマンドプロンプト

python -m venv olive-env
olive-env\Scripts\activate.bat

Alternatively として示される動作確認されたバージョンをインストールします。

pip install olive-ai[directml]==0.2.1
git clone https://github.com/microsoft/olive --branch v0.2.1
cd olive/examples/directml/stable_diffusion
pip install -r requirements.txt

ここまでは Python を使ったことがあれば特に問題ない作業です。

変換

説明に従ってまずモデルを変換します。

python stable_diffusion.py --optimize

残念ながら対象となる RX 7900 は所持していません。Ryzen 5 APU の内蔵 GPU（ドライバー 23.5.2 対応）で試しましたが、途中でタイムアウトが発生して止まりました。（何度やっても同様）

動作対象外の環境なので止むを得ません。

APU

APU はメインメモリから VRAM を割り当てるため、大量の VRAM を必要とする生成 AI に有利ではないかとして試した記事です。速度的には CPU オンリーよりは高速ですが、ハイエンド GPU には及ばないようです。

You get articles that match your needs
You can efficiently read back useful information
You can use dark theme

What you can do with signing up

AMD GPU での Stable Diffusion の改善

情報源

Olive

インストール

変換

関連情報

続報

Microsoft

ROCm

Ryzen AI

APU