はじめに
9月末に時間があったので、ディープラーニング用に自作PCのパーツを秋葉原に買いに行ったのですね。
CPUやメモリ、グラボについて授業で勉強することはなかったのですが、オライリーの
コンピュータシステムの理論と実装 ―モダンなコンピュータの作り方
はざっくり読んだという状況です。
これから3回ほどに分けて購入した各パーツについての記事を書いていきたいと思います。
CPU購入時に考えたこと
買ったCPUは第9世代のIntel icore 5-9400です。
6コア/6スレッド、クロックがベース2.9GHz、ターボ時4.1GHz、キャッシュ容量が9MB(Intel SmartCache)、TDPが65W、対応メモリがDDR4-2666(2チャンネル、最大128GB)
今回は、CPUは最低限のスペックでよかったので、コア、スレッドとクロック数だけ考慮して購入しました。かつては単一のコアで動くCPUが主流でしたが、小型化が進み、第8世代からは、iCore5のスペックから6コア6スレッドのヘキサコアになりました。
クロック周波数はとは、1秒あたりの信号数です。
2.9GHzだと1秒間に29億回の動作を行います。
DLの学習ではGPUが重要だと思われがちですが、前処理ではCPUが使われることが多いです。
例えば、Pythonの有名なライブラリscikit-learnはGPUによる計算処理のサポートがないので処理速度はCPUに依存します。
GPU購入時に考えたこと
購入したGPU
GeForce RTX 2070 GAMING Z 8G
GPUを購入時に考えたことはGPUの個数とGPUクロック、ブーストクロック、メモリ量です。
マザーボードによっては、複数のGPUを積んで、SLI接続を行い、複数のGPUを並列に動かすことができます。
ただ、ショップの店員さんにも言われたのですが、よっぽどのハイスペックなGPUが必要ではない限り、性能が低いGPUを2つ積むよりも、性能が良いGPUを一つ積んだ方が良いらしいです。
今回は予算が10万付近だったので、個数は1つにしました。
というわけで、1070と迷いましたが、新しいモデルの2070を購入しました。
余談-Why GPU?
そもそも、なぜDL用のPCではGPUの性能が求められるのでしょうか?
CPUでの演算処理では何がダメなのでしょうか?
そもそもGPUはGraphics Processing Unitの略で3Dグラフィックスなどの画像描写を行う際に必要となる計算処理を行う半導体チップ(プロセッサ)のことです。
画像データは行列(多次元配列)ですよね。
超簡略化した図
PCゲームをやる時には、リアルタイムでユーザが起こしたアクションや、ゲーム内のイベントについてCPUから送られる画像を描画する必要があるわけですが、行列の計算を高速で行う必要があるのでGPUではコア数が数千個(CPUは多くても数十個)ほどあり、並列で行列の計算が行えるようになっています。
CPUはif分などの複雑な処理を処理することには向いていていますが、コア数が少ないので高速に並列処理を行うことには向いていません。
一方GPUはfor文などの反復処理を高速で行うことができます。
2次元データを高速で3D画像に描画することは単純でスピードが求められるのでGPUの方が適しているっていうわけです。
CPUでの処理に限界を感じてGPUを作ったので当たり前と言えば当たり前なのですが。
さて、DLについて理解している人はもうピンと来ていると思いますが、DLの学習時の演算は重みの行列に別の行列をかけて足し合わせる「行列の積和演算」ですよね。
この処理は三次元のグラフィックスのポリゴンを移動させたり回転させたりするときの行列演算とそのまんま同じなのです。
DLでの演算がGPUの演算とほとんど同じなので、元々は3Dグラフィックスの描画に使っていたけど、DLでも使ってしまえ!というのがアイデアなのですね。
GPUの演算資源を画像処理以外の目的で応用する技術のことをGPGPU(General-purpose computing on graphics processing units)と言います。
最後に
余談が長すぎて、ほとんどになってしまいました。笑
次回はマザーボードとメモリについて解説できたらなと思います。
まだまだ絶賛参加受付中なので、気になった方は参加して欲しいです!!
千葉大学 Advent Calender
それでは!
参考