さて、これから僕はIBMのPower9アーキテクチャのCPUのドキュメントを読んでいきます。
Power9アーキテクチャについて研究していきたい理由ってのが、ぜひBounty Sourceで出てきたお題を解決してお金をゲットしたいなと思ったというのがあります。
ドキュメントを読んでてもわからんところが多いので、ぜひ強い人に教えてもらいながらドキュメントを読み通していきたいです。
ドキュメントは以下からフリーでダウンロードできます。
では初めていきます。
The Power9 processor is a superscalar symmetric multiprocessor designed for use in servers and large cluster systems.
Power9プロセッサはスーパースカラーシンメトリックマルチプロセッサで、サーバや大規模なクラスターシステムに使われます
superscalarって出てきましたね。スーパースカラーとは、Wikipediaによると、
複数の命令を同時にフェッチし、複数の同種のあるいは異種の実行ユニットを並列に動作させ、プログラムの持つ命令レベルの並列性を利用して性能の向上を図るアーキテクチャである。
のようです。並列性を利用するんですね。
1998年以降に開発された汎用プロセッサは基本的に全てスーパースカラーである。
と書いてあるので、スーパースカラーということで、Power9 CPUが特別なプロセッサということはないようです。
Power9 CPU自体は、サーバーやクラスターシステム(分散システムのことかな)に使われるようです。
クライアントには使われないんですね。
シンメトリックマルチプロセッシングとあるんですけど、Wikipediaで調べたら、対称型マルチプロセッシングのようです。コアが対称に割り付けられているようです。
It uses CMOS 14 nm technology with 17 metal layers.
CMOS 14nmの技術、17のメタルの層で構成されているようです。多層になってるんですね.
The POWER9 processor supports direct-attach memory.
direct-attach memoryって何?ということで調べてみます。Direct-attached storageでヒットしたんだけど、まあメモリが直接接続されているようです。
It supports a maximum symmetric multiprocessing (SMP) size of two sockets and is targeted for scale-out workloads.
対称型マルチプロセッシングが最大2ソケット使えるようです。スケールアウトした仕事量に標的を絞っているようです。
The POWER9 processor offers superior cost and performance.
まあコストとパフォーマンスが良いよと書いてあります。
Technical Computing: The POWER9 processor provides superior floating-point performance and high-memory bandwidth to address this market segment. It also supports off-chip floating-point acceleration.
Power9 プロセッサは優れた浮動小数点演算のパフォーマンスを提供できる。高いメモリー帯域をこのマーケットセグメントで提供できる。
メモリー帯域って初めてみたんだけど、憶測なんだけど、メモリーにアクセスできる速さのことかなとは思います。
off-chip floating-point accelerationって何と思ったけど、off-chip memoryってのは、外部メモリーのようですね。外部メモリとは何を指してるのかわからないけど、外部メモリにおける浮動小数点演算を加速できるようです。
次は、クラウド開発環境にも使えるよみたいなことが。
Big Data Analytics: The POWER9 processor with CAPI attach, large caches, and on chip accelerators provides a robust platform for analytics and big-data applications.
CAPIとは、Coherent Accelerator Processor Interfaceのようです。CPUと任意のソフトウェア、ミドルウェア、ユーザーアプリケーションを結合して、お互いのメモリを自由に行き来できるようにする技術みたいです。プロセッサ用のバスの1種のようです。(指摘ありがとうございます)
on-chip acceleratorという要素もあるようですね。ググってもわからないのでスルーで。
この後、キャッシュやメモリーが頑健なので、業務向けにも使えるみたいなことが書いてあります。
From a logical perspective, the POWER9 processor consists of six main components:
論理的な視点では、Power9 プロセッサは、6のメインコンポーネントから成り立っているようです。
POWER9 processing core including the L1 cache
Power9 のプロセッサのコアがL1のキャッシュも含んでいるようです。L1キャッシュとは一番上位に位置するキャッシュのようですね。それより下位にL2キャッシュがあるようです。キャッシュも階層構造になってるんですね。
では今日はこんなもので。