概要
AMD Ryzen AI MAX+ 395のミニPCを買ったので、ROCmの7.2を入れてみました。OSはUbuntu24.0.4.4です
グラフィックドライバーのインストール
Windowsと異なり、ROCmをインストールするときに同時に入れることが可能です。
ROCmインストール
ステップ 1:システムを最新化
sudo apt update && sudo apt upgrade -y
ステップ 2:ROCm 7.2 インストーラの取得
AMDリポジトリから amdgpu-install スクリプトをダウンロードしてインストールします:
https://rocm.docs.amd.com/projects/radeon-ryzen/en/latest/docs/install/installryz/native_linux/install-ryzen.html
cd /tmp
wget https://repo.radeon.com/amdgpu-install/7.2/ubuntu/noble/amdgpu-install_7.2.70200-1_all.deb
sudo apt install ./amdgpu-install_7.2.70200-1_all.deb
sudo apt update
ステップ 3:ROCm 本体のインストール
Ryzen APU では --no-dkms フラグを付けてインボックスカーネルドライバをそのまま使います。デスクトップ環境(GUI)がある場合は graphics も追加します:
https://rocm.docs.amd.com/projects/radeon-ryzen/en/latest/docs/install/installryz/native_linux/install-ryzen.html
sudo amdgpu-install -y --usecase=graphics,rocm --no-dkms
ステップ 4:ユーザーをグループに追加
sudo usermod -a -G render,video $LOGNAME
そして再起動です。
動作確認
# GPUが検出されているか
rocminfo
# Agent 2 として gfx1151 が表示されればOK
#*******
#Agent 2
#*******
# Name: gfx1151
# Uuid: GPU-XX
# Marketing Name: AMD Radeon Graphics
# GPU情報の確認
rocm-smi
GPU メモリ(TTM)の設定(AI用途の場合)
まずはじめにTTMとBIOSの役割の違いは以下です。
- BIOSの専用VRAM設定(UMA Frame Buffer Size)
- GPUがディスプレイ出力・フレームバッファのために確保する固定メモリ量
- OSから見て「最初からGPUに予約済み」の領域
- ここを小さくすることで、OSが使えるメモリを増やせる
- TTM(Translation Table Maps)の上限設定
- ROCmがGPUコンピュートワークロード(AI推論など)のためにシステムRAMから動的に借りられる上限
- BIOSの固定確保とは別枠で、OS管理下のメモリをGPUが使う仕組み
- amd-ttm --set 31はこの動的借用の上限を31GBに設定する
私の構成の場合、Windows11とのデュアルブートかつトータルメモリが96GBなので、BIOSでは48GBをキープ、TTMで31GBを借りられるようにします。システムメモリが16+1GBぐらいないと不安ですよね。
物理RAM 96GB
├── BIOSが固定確保(UMA Frame Buffer) → 48GB (AMDの推奨は0.5GB)
└── OS管理領域 → 48GB
├── Linuxカーネル・プロセス用 → 最低16+1GB
└── TTMプール(ROCmが動的に借用)→ 最大31GBなど
設定が以下です
sudo apt install pipx
pipx ensurepath
# 必要であれば、ターミナルを再起動後
pipx install amd-debug-tools
# 現在の設定確認
amd-ttm
# 例:48+31GBに拡張(96GB RAM搭載の場合)
amd-ttm --set 31
# rebootを要求されるのでreboot
LocalScoreにトライ
せっかくインストールしたので、LocalScoreのベンチマークを試してみます。
https://www.localscore.ai/
事前準備
ROCmが正しく動いているか確認します。
rocminfo | head -30
hipcc --version
ダウンロード
手順に従います。ここでは、Medium-14Bを選んでみました。
https://www.localscore.ai/download
curl -OL https://localscore.ai/download/localscore-medium
chmod +x localscore-medium
./localscore-medium
あんまり早くなくて、正直がっかり
いま、気がつきましたが、localscoreのバイナリはCUDAで書かれててROCmではないかも?そうするとコード移植しないといけないかも
