#2020年代のゲームハードウェア技術トレンド
##講演者
後藤 弘茂 さん
##講演内容
ゲームハードウェアの半導体技術のトレンドに関してのお話がされた。
##プロセス技術の微細化
プロセス技術は28nmから16nmへと微細化が進んでいる。
チップを小さくすることで低コスト化と省電力化を行うことが出来る。
これの代表例としてPS4 SlimとXboOne Sがあげられる。
プロセス技術の微細化は自体は現在も継続中であり、
今年は10nm、来年には7nmに達するという見方がある。
2020年代には5nmに到達する可能性もある。
##Intelとファウンドリとのズレが発生
ファウンドリとは、TSMC,GLOBALFOUNDRIES,Sumsungが3大ファウンドリと呼ばれている。
ファウンドリの10nmはIntel製の14nmから10nmの間のものとなっている。
同じ14nmでもスペックが大きく異なっているので注意が必要である。
##プロセス微細化の問題
プロセスの微細化を進めていくとチップに搭載できるトランジスタの数が倍増していく。
このトランジスタの消費電力を半減していかないと、消費電力の観点から同時にオンできない
ダークシリコンと呼ばれるものが発生してしまう。
これを解決するため現在は性能よりも省電力化に力を入れている。
##3Dトランジスタ技術の限界
2020年代に達成する見込みである5nmあたりから、
現在の3Dトランジスタ技術であるFinFETが限界になるかもしれない。
その代替案としてGAA(ゲートオールアラウンド)型トランジスタが提案されている。
##GAA型トランジスタとは?
トランジスタ内のChannelをゲートで完全に囲ってしまうことで、性能と省電力化があがるというもの
##現在のプロセス技術
ムーアの法則(半導体の集積率は18か月で2倍になるという法則)
近年、ムーアの法則自体が限界との話もあがって来ているが、
現在も微細化自体は継続中である。
微細化が進むことで搭載できる回路数が増え、チップの機能を大幅にあげることは可能である。
ただし、チップ自体の製造コストが上がってきているため、簡単にチップ自体を作ること自体が難しくなってきている。
また、動作周波数の向上幅自体が狭くなってきているため、演算ユニットを増やすことで実現
##x86スモールコアの終焉?
現在のゲームハードウェア(PS4やXboxOne、NintendoSwitch)はx86のスモールコアを搭載している。
だが、AMD社においてはPS4やXboxOneに搭載されている
Jaguar系のCPUコア製品をやめてZENコア1本に絞り込んでいる。
プロセス技術の微細化によりパフォーマンスCPUコアのサイズがより小さくなってきた。
スマートフォンやタブレットなどはより小さなCPUコアを必要とするため、ARMの独壇場となっている。
CPU自体の微細化により次世代ゲームハードではパフォーマンスCPUに回帰するのではないかという予想
##パフォーマンスCPUコアとは?
- PC並のシングルスレッド性能
- 高い浮動小数点演算の性能
##ARMCPUの次の土台
モバイルゲーム機はARMCPU、将来のIoTゲームにも。
ARMはCPUコアとCPUアーキテクチャを一新し、
大型のCPUコアと小型のCPUコアを組み合わせbig.LITTLEがより効率的になる。
##今後のCPU
CPUコア自体はラディカルなアーキテクチャの変更は厳しいという
現在はCPUの規模と命令制御の複雑度で差異を出している。
また、各社は様々なアプローチでCPU開発を行っている。
- 分岐予測にニューラルネットワークを使用する(AMDのZENコア)
- 動的なコード最適(NVIDIAのDenver)
- CPUのオープンソース化(RISC-V)
- 可変ベクトル命令(ARM)
- Cell.B.E..型のメニィコア(中国Sanway TaihuLight)
##GPUアーキテクチャの今後
GPUはグラフィックスと汎用並列演算の共用プロセッサとして進化している。
グラフィックス機能としてはVRのラスタライズの対応が潮流となっている。
モバイルGPUもコンピューティング機能の強化へ向かっている
現在はディープラーニングへの対応が焦点となっている。
ただ、GPUにグラフィックス以外の機能を詰め込むことで、肝心のグラフィックス機能とのトレードオフとなってしまう。
NVIDIAのVoltaGV100というGPUにはテンサーコアというものが搭載されている
##テンサーコアとは?
テンサーコアではFP16(16ビットの浮動小数点)用の乗算ユニット64個と加算ユニット16個が搭載されており、
これがVolta GV100に2個も搭載されている。
GPU全体にFP16のパフォーマンスは120TFLOPSになるという。
##ディープラーニングの台頭
昨今、ディープラーニングが注目され、これに対応するためのワークロードが存在している。
ただ、ここで問題となっているのが、ディープラーニング自体の処理を既存のコアやGPUでやらせるのかという問題が出てきている。
学習するだけならGPUやFPGAを使用したほうがいい。
##ディープラーニングに特化したコア
ディープラーニングの学習に当たる処理のことをインファレンスプロセッシングという
これは、画像認識や音声認識、自然言語認識などを行う処理のこと。
これに対するアプローチとして様々なものがある。
CPU自体に専用の命令を追加したり、省電力GPUや従来型DSPに機能を追加したり、
ディープラーニングに特化したコアを作成するなどのされている。
実際のチップが搭載されているコア自体はまだ数は少ない状況だが、膨大な数の論文が発表されており、
インファレンス用のコアの研究フェイズから製品化までは迅速に行われるという予測とのこと。
現在はDLPU(ディープラーニングプロセッシングユニット)が
CPU,GPUに続く3番目のコアとなる可能性が出てきている。
実際、スマートフォン向けのチップはこの方向性で動いているとのこと。
DLPUにおいて現在話題となっている機能がニューラルネットワークの剪定(プルーニング)機能である。
プルーニング機能とは、形成したニューラルネットワークから無駄なウェイトデータを削除し、
シンプルにすることを指す。
DLPUの例としてNVIDIAの新Tegra「Xavier」に特化したアクセレレータが搭載されている。
プルーニングに対応しており、必要メモリ量と消費電力量を大幅に下げている。
また、一番興味深いこととしてこの技術自体がオープンソースとして公開するとのこと(9月予定という記載あり)
##メモリの今後
DRAMは徐々に次世代へと世代交代をしていく。
GDDR6、LPDDR5、DDR5などに変化していき、
メモリ帯域を2倍にしてくという流れになっている。
HBMに関してはコスト削減の方向に動いている。
###HBMとは
メモリ帯域は広く、最近のものだと1TB/sを低い消費電力で実現できている。
ただ、これの問題としてコストが非常に高いため、ハイエンドなGPUにしか使われていない。
これを今後コスト削減していこうという流れができている。
なぜ、コストが高いかというとDRAMに微細な穴をあけるTSV技術、DRAMの下にロジックチップを入れる技術
HBMとプロセッサを結合するシリコンインタポーザがコストが高いためである。
このシリコンインタポーザを使わないで良い方法のHBMが検討されている。
###3D NAND
NANDのメモリセルを垂直に構築していき、64層、96層と多層化が可能となっている。
従来の平面型NANDよりも面積あたりのメモリ容量が大幅に増加できる。
また、メモリセルの間隔を広げることにより、多値化が可能となっている。
これにより、1チップで1Tビットが見えてきている。
Intelとマイクロンが共同開発している3DXpointという不揮発性のメモリ技術が
どこまで浸透していくか。
メモリセルを垂直に構築していくものには2種類存在している。
垂直型メモリとクロスポイント型メモリの2種類である。
###垂直型メモリ
3D NANDなどを指す
これは、重ねられるメモリセル数が大きく、容易に容量を増やすことができる。
ただし、メモリアクセスの粒度が大きいという問題がある。
###クロスポイント型メモリ
これは、3DXpointを指す。
これは、メモリアクセスの粒度を小さく保てるが、重ねられるメモリセルの幅が小さいため
大容量化の限界が低いという問題もある。
###CPU内部のメモリを不揮発性に
CPU内のメモリを不揮発性にするという流れが出てきている。
この技術で対応できるものとして、スリープ時などに別の領域にデータを逃していたのを
行う必要がなくなり、スリープのONとOFFが速くできるという。
###コードをデータのところへ
昔はデータ量が少なかったため、ストレージからCPUへのデータ移動の電力が少なかったが、
昨今は、データ量が増えたため従来どおりだと消費電力が大きくなってしまう。
そこで、データ移動を行わず、コードをデータのあるところに持っていったほうがいいのではないかという考え。
##IoTの時代
###IoTとは
The Internet of Thingsの略称
###IoTとディープラーニング
インファレンス機能がIoT側の端末に搭載されていっている。
用途としてセキュリティカメラやドローン技術など。
###IoTとディープラーニング
IoT側の端末では低電力のIoT向け超低電圧プロセスを用意している。
超低電圧プロセスでは同期型だと低速でしか動作しないが、
非同期型プロセッサで超低電圧プロセスを活用するという考えも出てきている。
##まとめ
ハードウェアに関する興味深いお話を聞くことが出来ました。
自身はスマホ向けの開発に携わっていますが、スマホやタブレット向けのコアも
コンシューマとはまた違った進化をしているということを知りとても参考になりました。
また、コアの世界でもディープラーニングが浸透しているところが一番興味をいだきました。