最近ROCm2.5がリリースされました。
変更点について
rocm-smi
rocm-smiでVRAM使用量の項目などが増えました
https://github.com/RadeonOpenCompute/ROC-smi
========================ROCm System Management Interface========================
================================================================================
GPU Temp AvgPwr SCLK MCLK Fan Perf PwrCap VRAM% GPU%
0 41.0c 18.0W 809Mhz 351Mhz 22.75% auto 250.0W 0% 0%
================================================================================
==============================End of ROCm SMI Log ==============================
他にもドライババージョンも見れるようになった
rocm-smi --showdriverversion
========================ROCm System Management Interface========================
Driver version: 19.10.9.418
==============================End of ROCm SMI Log ==============================
バージョンチェック
$ apt show rocm-libs -a
Package: rocm-libs
Version: 2.5.27
Priority: optional
Section: devel
Maintainer: Advanced Micro Devices Inc.
Installed-Size: 13.3 kB
Depends: rocfft, rocrand, hipblas, rocblas
Homepage: https://github.com/RadeonOpenCompute/ROCm
Download-Size: 768 B
APT-Manual-Installed: yes
APT-Sources: http://repo.radeon.com/rocm/apt/debian xenial/main amd64 Packages
Description: Radeon Open Compute (ROCm) Runtime software stack
ベンチマーク
https://qiita.com/T_keigo_wwk/items/355866c49cf867946b48
ベンチマークは以上の方法で取得、Tensorflow-rocm 1.13.3で測定。
まとめると特に2.4に対して速度上の優位性は特に認められませんでした。
今回のアップデートはあくまでも機能面での改善がメインでパフォーマンスチューニングなどはなかったようです。