LoginSignup
1
0

More than 3 years have passed since last update.

ROCm2.5がリリースされたので検証及びベンチマーク

Posted at

最近ROCm2.5がリリースされました。

変更点について

rocm-smi

rocm-smiでVRAM使用量の項目などが増えました
https://github.com/RadeonOpenCompute/ROC-smi

========================ROCm System Management Interface========================
================================================================================
GPU  Temp   AvgPwr  SCLK    MCLK    Fan     Perf  PwrCap  VRAM%  GPU%  
0    41.0c  18.0W   809Mhz  351Mhz  22.75%  auto  250.0W    0%   0%    
================================================================================
==============================End of ROCm SMI Log ==============================

他にもドライババージョンも見れるようになった

 rocm-smi --showdriverversion


========================ROCm System Management Interface========================
Driver version: 19.10.9.418
==============================End of ROCm SMI Log ==============================

バージョンチェック

$ apt show rocm-libs -a
Package: rocm-libs
Version: 2.5.27
Priority: optional
Section: devel
Maintainer: Advanced Micro Devices Inc.
Installed-Size: 13.3 kB
Depends: rocfft, rocrand, hipblas, rocblas
Homepage: https://github.com/RadeonOpenCompute/ROCm
Download-Size: 768 B
APT-Manual-Installed: yes
APT-Sources: http://repo.radeon.com/rocm/apt/debian xenial/main amd64 Packages
Description: Radeon Open Compute (ROCm) Runtime software stack

ベンチマーク

(TF1.13.3)ROCm2.3+(TF1.13.3)ROCm2.4(RadeonⅦ)+(ROCm2.4+TF2.0 RadeonⅦ)+RadeonⅦ (ROCm2.5).png
図1 ROCm2.3から2.5までのベンチマーク

https://qiita.com/T_keigo_wwk/items/355866c49cf867946b48
ベンチマークは以上の方法で取得、Tensorflow-rocm 1.13.3で測定。

まとめると特に2.4に対して速度上の優位性は特に認められませんでした。
今回のアップデートはあくまでも機能面での改善がメインでパフォーマンスチューニングなどはなかったようです。

1
0
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
1
0