背景
Radeon VII を powerlimit 運用し, 電力効率よくマイニングやレンダリングや機械学習したい
環境
- Ubuntu 18.04
- amdgpu-pro 20.30
- ROCm も使えると思うが, 現時点では 3.5.0, 3.5.1 問題でカオスになっているため推奨しない
powerlimit
amdgpu の場合は rocm-smi の git を clone してくれば動きます.
--setpoweroverdrive 120
と, nvidia-smi のようにワット指定のオプションがありますが, 2020 年 8 月時点では experimental feature です. 使っているとたまにリミットが外れたりします(VEGA の場合は暴走するときもある).
--setsclk 2 などと, クロックのレベルの方を設定しましょう.
メモリ
Radeon VII のメモリは hynix or samsung です.
--showmemvendor
でメモリベンダの情報が出ます.
定格 or 弱め powerlimit では samsung のほうが性能いい感じです.
測定
ethash miner(Phoenix Miner)で試します.
sudo rocm-smi --setsclk 2 --setfan 50%
setfan の指定 + 10 が実際のファンスピードになるようです(%
つけないと 255 レベル? でのファン速度と解釈されてしまうので注意).
fan 60% で open air で, 夏の猛暑日室温 35 度で GPU 温度 60 ~ 68C でした.
fan 60% はそんなにうるさくないです(扇風機やクーラーのほうがうるさい)
今回は GPU のファンだけでしたが, 外部ファンで GPU に送風してあげるとより温度減ると思われます.
Eth 62 Mh/s 出ました(2020/08/13 時点 0.3 mBTC/day(~350 円/day)ほど).
rocm-smi で見るかぎりでは, 85W(HDMI ポート指している場合は 105W)と, かなりいい感じです.
1 枚 100W ですと, 4 枚指し Radeon VII でレンダリングや機械学習運用も 1000W PC 電源で足りてよいですね.
寿命は?
寿命はどれくらい?グラフィックボードの耐用年数
http://blog.livedoor.jp/i80286/archives/50430445.html
マイニング上がりの中古グラボを狙う
https://minkara.carview.co.jp/userid/186746/blog/42892590/
世界初の7nmプロセス採用ゲーミンググラフィックス、AMD「Radeon VII」検証
https://www.gdm.or.jp/review/2019/0207/292897/3
Radeon VII はタンタルコンデンサを使っているようですので, コンデンサの寿命は半永久と考えてよさそうです.
故障の要員としては GPU メモリの故障などが考えられますが(ちなみに Radeon VII は SRAM(L1 キャッシュ?) は ECC 化されているっぽい), powerlimit で GPU 温度 70 度以下運用でしたら, 24 時間運用しても 4~5 年(法定耐用年数)は問題なく使えそうです.
また, タンタルコンデンサは故障すると発火の危険性があるようですので注意ですね
(GPU の場合は, タンタルコンデンサ故障の場合は基盤がうまく対処してくれるのかしらん?)
問題点
10 万円以下(発売時)でメモリ 16GB あって倍精度 3 TFlops あって, 100W で GPU 温度 70 度以下で, タンタルコンデンサ使っていて耐久性たかそうでとてもよい Radeon VII ですが, 残念ながらすぐに discon になりました.
今後の Big Navi に期待でしょうか.