More than 5 years have passed since last update.

@h_tomiin

株式会社 gumi

[CEDEC2017]2020年代のゲームハードウェア技術トレンド

CEDEC2017

Last updated at 2017-09-06Posted at 2017-09-06

2020年代のゲームハードウェア技術トレンド

講演者

後藤弘茂　さん

講演内容

ゲームハードウェアの半導体技術のトレンドに関してのお話がされた。

プロセス技術の微細化

プロセス技術は28nmから16nmへと微細化が進んでいる。
チップを小さくすることで低コスト化と省電力化を行うことが出来る。
これの代表例としてPS4 SlimとXboOne Sがあげられる。

プロセス技術の微細化は自体は現在も継続中であり、
今年は10nm、来年には7nmに達するという見方がある。
2020年代には5nmに到達する可能性もある。

Intelとファウンドリとのズレが発生

ファウンドリとは、TSMC,GLOBALFOUNDRIES,Sumsungが３大ファウンドリと呼ばれている。
ファウンドリの10nmはIntel製の14nmから10nmの間のものとなっている。
同じ14nmでもスペックが大きく異なっているので注意が必要である。

プロセス微細化の問題

プロセスの微細化を進めていくとチップに搭載できるトランジスタの数が倍増していく。
このトランジスタの消費電力を半減していかないと、消費電力の観点から同時にオンできない
ダークシリコンと呼ばれるものが発生してしまう。
これを解決するため現在は性能よりも省電力化に力を入れている。

3Dトランジスタ技術の限界

２０２０年代に達成する見込みである5nmあたりから、
現在の3Dトランジスタ技術であるFinFETが限界になるかもしれない。
その代替案としてGAA（ゲートオールアラウンド）型トランジスタが提案されている。

GAA型トランジスタとは？

トランジスタ内のChannelをゲートで完全に囲ってしまうことで、性能と省電力化があがるというもの

現在のプロセス技術

ムーアの法則（半導体の集積率は18か月で2倍になるという法則）
近年、ムーアの法則自体が限界との話もあがって来ているが、
現在も微細化自体は継続中である。
微細化が進むことで搭載できる回路数が増え、チップの機能を大幅にあげることは可能である。
ただし、チップ自体の製造コストが上がってきているため、簡単にチップ自体を作ること自体が難しくなってきている。
また、動作周波数の向上幅自体が狭くなってきているため、演算ユニットを増やすことで実現

x86スモールコアの終焉？

現在のゲームハードウェア（PS4やXboxOne、NintendoSwitch）はx86のスモールコアを搭載している。
だが、AMD社においてはPS４やXboxOneに搭載されている
Jaguar系のCPUコア製品をやめてZENコア１本に絞り込んでいる。

プロセス技術の微細化によりパフォーマンスCPUコアのサイズがより小さくなってきた。
スマートフォンやタブレットなどはより小さなCPUコアを必要とするため、ARMの独壇場となっている。
CPU自体の微細化により次世代ゲームハードではパフォーマンスCPUに回帰するのではないかという予想

パフォーマンスCPUコアとは？

PC並のシングルスレッド性能
高い浮動小数点演算の性能

ARMCPUの次の土台

モバイルゲーム機はARMCPU、将来のIoTゲームにも。
ARMはCPUコアとCPUアーキテクチャを一新し、
大型のCPUコアと小型のCPUコアを組み合わせbig.LITTLEがより効率的になる。

今後のCPU

CPUコア自体はラディカルなアーキテクチャの変更は厳しいという
現在はCPUの規模と命令制御の複雑度で差異を出している。
また、各社は様々なアプローチでCPU開発を行っている。

分岐予測にニューラルネットワークを使用する（AMDのZENコア）
動的なコード最適（NVIDIAのDenver）
CPUのオープンソース化（RISC-V）
可変ベクトル命令（ARM）
Cell.B.E..型のメニィコア（中国Sanway TaihuLight)

GPUアーキテクチャの今後

GPUはグラフィックスと汎用並列演算の共用プロセッサとして進化している。
グラフィックス機能としてはVRのラスタライズの対応が潮流となっている。
モバイルGPUもコンピューティング機能の強化へ向かっている
現在はディープラーニングへの対応が焦点となっている。
ただ、GPUにグラフィックス以外の機能を詰め込むことで、肝心のグラフィックス機能とのトレードオフとなってしまう。

NVIDIAのVoltaGV100というGPUにはテンサーコアというものが搭載されている

テンサーコアとは？

テンサーコアではFP16（１６ビットの浮動小数点）用の乗算ユニット６４個と加算ユニット１６個が搭載されており、
これがVolta　GV100に２個も搭載されている。
GPU全体にFP１６のパフォーマンスは120TFLOPSになるという。

ディープラーニングの台頭

昨今、ディープラーニングが注目され、これに対応するためのワークロードが存在している。
ただ、ここで問題となっているのが、ディープラーニング自体の処理を既存のコアやGPUでやらせるのかという問題が出てきている。
学習するだけならGPUやFPGAを使用したほうがいい。

ディープラーニングに特化したコア

ディープラーニングの学習に当たる処理のことをインファレンスプロセッシングという
これは、画像認識や音声認識、自然言語認識などを行う処理のこと。
これに対するアプローチとして様々なものがある。
CPU自体に専用の命令を追加したり、省電力GPUや従来型DSPに機能を追加したり、
ディープラーニングに特化したコアを作成するなどのされている。

実際のチップが搭載されているコア自体はまだ数は少ない状況だが、膨大な数の論文が発表されており、
インファレンス用のコアの研究フェイズから製品化までは迅速に行われるという予測とのこと。

現在はDLPU（ディープラーニングプロセッシングユニット）が
CPU,GPUに続く３番目のコアとなる可能性が出てきている。
実際、スマートフォン向けのチップはこの方向性で動いているとのこと。

DLPUにおいて現在話題となっている機能がニューラルネットワークの剪定（プルーニング）機能である。
プルーニング機能とは、形成したニューラルネットワークから無駄なウェイトデータを削除し、
シンプルにすることを指す。

DLPUの例としてNVIDIAの新Tegra「Xavier」に特化したアクセレレータが搭載されている。
プルーニングに対応しており、必要メモリ量と消費電力量を大幅に下げている。
また、一番興味深いこととしてこの技術自体がオープンソースとして公開するとのこと（９月予定という記載あり）

メモリの今後

DRAMは徐々に次世代へと世代交代をしていく。
GDDR6、LPDDR5、DDR5などに変化していき、
メモリ帯域を２倍にしてくという流れになっている。
HBMに関してはコスト削減の方向に動いている。

HBMとは

メモリ帯域は広く、最近のものだと１TB/sを低い消費電力で実現できている。
ただ、これの問題としてコストが非常に高いため、ハイエンドなGPUにしか使われていない。
これを今後コスト削減していこうという流れができている。

なぜ、コストが高いかというとDRAMに微細な穴をあけるTSV技術、DRAMの下にロジックチップを入れる技術
HBMとプロセッサを結合するシリコンインタポーザがコストが高いためである。
このシリコンインタポーザを使わないで良い方法のHBMが検討されている。

3D　NAND

NANDのメモリセルを垂直に構築していき、６４層、９６層と多層化が可能となっている。
従来の平面型NANDよりも面積あたりのメモリ容量が大幅に増加できる。
また、メモリセルの間隔を広げることにより、多値化が可能となっている。
これにより、１チップで１Tビットが見えてきている。
Intelとマイクロンが共同開発している3DXpointという不揮発性のメモリ技術が
どこまで浸透していくか。

メモリセルを垂直に構築していくものには２種類存在している。
垂直型メモリとクロスポイント型メモリの２種類である。

垂直型メモリ

3D　NANDなどを指す
これは、重ねられるメモリセル数が大きく、容易に容量を増やすことができる。
ただし、メモリアクセスの粒度が大きいという問題がある。

クロスポイント型メモリ

これは、3DXpointを指す。
これは、メモリアクセスの粒度を小さく保てるが、重ねられるメモリセルの幅が小さいため
大容量化の限界が低いという問題もある。

CPU内部のメモリを不揮発性に

CPU内のメモリを不揮発性にするという流れが出てきている。
この技術で対応できるものとして、スリープ時などに別の領域にデータを逃していたのを
行う必要がなくなり、スリープのONとOFFが速くできるという。

コードをデータのところへ

昔はデータ量が少なかったため、ストレージからCPUへのデータ移動の電力が少なかったが、
昨今は、データ量が増えたため従来どおりだと消費電力が大きくなってしまう。
そこで、データ移動を行わず、コードをデータのあるところに持っていったほうがいいのではないかという考え。

IoTの時代

IoTとは

The　Internet　of　Thingsの略称

IoTとディープラーニング

インファレンス機能がIoT側の端末に搭載されていっている。
用途としてセキュリティカメラやドローン技術など。

IoTとディープラーニング

IoT側の端末では低電力のIoT向け超低電圧プロセスを用意している。
超低電圧プロセスでは同期型だと低速でしか動作しないが、
非同期型プロセッサで超低電圧プロセスを活用するという考えも出てきている。

まとめ

ハードウェアに関する興味深いお話を聞くことが出来ました。
自身はスマホ向けの開発に携わっていますが、スマホやタブレット向けのコアも
コンシューマとはまた違った進化をしているということを知りとても参考になりました。
また、コアの世界でもディープラーニングが浸透しているところが一番興味をいだきました。

You get articles that match your needs
You can efficiently read back useful information
You can use dark theme

What you can do with signing up

[CEDEC2017]2020年代のゲームハードウェア技術トレンド

2020年代のゲームハードウェア技術トレンド

講演者

講演内容

プロセス技術の微細化

Intelとファウンドリとのズレが発生

プロセス微細化の問題

3Dトランジスタ技術の限界

GAA型トランジスタとは？

現在のプロセス技術

x86スモールコアの終焉？

パフォーマンスCPUコアとは？

ARMCPUの次の土台

今後のCPU

GPUアーキテクチャの今後

テンサーコアとは？

ディープラーニングの台頭

ディープラーニングに特化したコア

メモリの今後

HBMとは

3D NAND

垂直型メモリ

クロスポイント型メモリ

CPU内部のメモリを不揮発性に

コードをデータのところへ

IoTの時代

IoTとは

IoTとディープラーニング

IoTとディープラーニング

まとめ

3D　NAND