More than 1 year has passed since last update.


「ハードウェア開発、CPUアーキテクチャ Advent Calendar 2016」の3日目(12月3日)です。


「マルチコア、GPGPU、FPGA」

2013年1月8日のブログに、

これからは「マルチコア、GPGPU、FPGA」が半導体の最先端アプリケーションになると思い、

ブログの内容を変更しました。

それから約4年、まさに、「マルチコア、GPGPU、FPGA」になり、いろいろなところで盛り上がっています。

マルチコアに関しては、Intelのx86(Xeon/Xeon Phi)とSoftbankに買収されたARM。

GPGPUに関しては、NVIDIAのGPGPUとCUDA。

FPGAに関しては、Intelに買収されたAlteraとXilinx。

基本的には各領域ではトップであるが、2つ以上の領域でトップになることは無かったです。

しかしながら、IntelがAlteraを買収したことにより、IntelはFPGAを手に入れました。

そして、そのFPGAをIntelのマルチコアであるXeonと接続した「Xeon + FPGA」として発表し、

マルチコアだけでは実現できないものをFPGAアクセラレータとして実現する環境を整え始めています。

「Xeon + FPGA」に関しては、Slideshareに「Xeon+FPGA への妄想」 どうやって実装するのか?

をアップしていますので、参考にしてください。

Intelは「マルチコア、GPGPU、FPGA」の3つの内、2つ(マルチコアとFPGA)は手に入れましたが、

3つすべてが揃っているのはまだ無かった。と、思っていました。


IBM POWER8 登場

IBMがPOWER8にNVLinkとCAPIを取り込みました。

その製品化したものがIBM Power System S822LC for High Performance Computing

先日、とあるセミナーでこのIBM Power System S822LC for High Performance Computingを直に見て、

もしかして、これ、最強のシステムじゃん。と思いました。

何故なら、このシステムには、「マルチコア、GPGPU、FPGA」が揃っているからです。

その3つについて説明していきます

最初は、「マルチコア

POWER8を2機搭載し、

各POWER8は10コア/12コアのマルチコアであり、8スレッドなので最大48論理コアです。

次は、「GPGPU

GPGPUは、NVIDIA Tesla P100を各POWER8に2機NVLinkで接続し、

システムでは4機のP100が搭載されています。

NVIDIAのDeep Learning専用機のDGX-1の8機には勝てませんが、

DGX-1はXeonとの接続はあくまでもPCIeであるため、

システムメモリへのアクセスを考えるとPOWER8の方が圧倒的に優位です。

最後に、「FPGA

FPGAは、標準では搭載されていません。

CAPI対応PCIe FPGAボードを指すことでの対応になります。

従来のPCIe FPGAボードでは、システムメモリ上のデータをPCIe FPGAボードに移動する必要がありました。

これに対して、CAPI対応PCIe FPGAボードでは、

システムメモリ上のデータへPCIe FPGAボードから直接アクセスが出来るようになり、

データの移動の必要性は少なくなりました。

また、FPGAボード用のソフトウェアの開発も非常に楽になりました。

IBMのCAPIについては、

SlideshareにFPGAアクセラレータの作り方 (IBM POWER+CAPI編)をアップしています。


終わりに

IBMは自前ですべてを開発するのではなく、

強いところと上手く組んで、総合力にて、「マルチコア、GPGPU、FPGA」を手に入れました。

そんな、素敵な「IBM Power System S822LC for High Performance Computing」を使ってみたいのですが、

お値段が超高いです。

どこかに落ちていないでしょうか?


クリスマスプレゼントかお年玉として、

お願いできないでしょうか。。。ね。(笑 #

余談)

総合力については、

2013年4月11日のブログ「個人の総合力、と、組織での個人の総合力を束ねる力」に書きました、

企業だけでなく、個人も総合力で勝負するのがいいと思っています。