###「ハードウェア開発、CPUアーキテクチャ Advent Calendar 2016」の3日目(12月3日)です。
##「マルチコア、GPGPU、FPGA」##
2013年1月8日のブログに、
これからは「マルチコア、GPGPU、FPGA」が半導体の最先端アプリケーションになると思い、
ブログの内容を変更しました。
それから約4年、まさに、「マルチコア、GPGPU、FPGA」になり、いろいろなところで盛り上がっています。
マルチコアに関しては、Intelのx86(Xeon/Xeon Phi)とSoftbankに買収されたARM。
GPGPUに関しては、NVIDIAのGPGPUとCUDA。
FPGAに関しては、Intelに買収されたAlteraとXilinx。
基本的には各領域ではトップであるが、2つ以上の領域でトップになることは無かったです。
しかしながら、IntelがAlteraを買収したことにより、IntelはFPGAを手に入れました。
そして、そのFPGAをIntelのマルチコアであるXeonと接続した「Xeon + FPGA」として発表し、
マルチコアだけでは実現できないものをFPGAアクセラレータとして実現する環境を整え始めています。
「Xeon + FPGA」に関しては、Slideshareに「Xeon+FPGA への妄想」 どうやって実装するのか?
をアップしていますので、参考にしてください。
Intelは「マルチコア、GPGPU、FPGA」の3つの内、2つ(マルチコアとFPGA)は手に入れましたが、
3つすべてが揃っているのはまだ無かった。と、思っていました。
IBM POWER8 登場
IBMがPOWER8にNVLinkとCAPIを取り込みました。
その製品化したものがIBM Power System S822LC for High Performance Computing。
先日、とあるセミナーでこのIBM Power System S822LC for High Performance Computingを直に見て、
もしかして、これ、最強のシステムじゃん。と思いました。
何故なら、このシステムには、「マルチコア、GPGPU、FPGA」が揃っているからです。
その3つについて説明していきます
最初は、「マルチコア」
POWER8を2機搭載し、
各POWER8は10コア/12コアのマルチコアであり、8スレッドなので最大48論理コアです。
次は、「GPGPU」
GPGPUは、NVIDIA Tesla P100を各POWER8に2機NVLinkで接続し、
システムでは4機のP100が搭載されています。
NVIDIAのDeep Learning専用機のDGX-1の8機には勝てませんが、
DGX-1はXeonとの接続はあくまでもPCIeであるため、
システムメモリへのアクセスを考えるとPOWER8の方が圧倒的に優位です。
最後に、「FPGA」
FPGAは、標準では搭載されていません。
CAPI対応PCIe FPGAボードを指すことでの対応になります。
従来のPCIe FPGAボードでは、システムメモリ上のデータをPCIe FPGAボードに移動する必要がありました。
これに対して、CAPI対応PCIe FPGAボードでは、
システムメモリ上のデータへPCIe FPGAボードから直接アクセスが出来るようになり、
データの移動の必要性は少なくなりました。
また、FPGAボード用のソフトウェアの開発も非常に楽になりました。
IBMのCAPIについては、
SlideshareにFPGAアクセラレータの作り方 (IBM POWER+CAPI編)をアップしています。
終わりに
IBMは自前ですべてを開発するのではなく、
強いところと上手く組んで、総合力にて、「マルチコア、GPGPU、FPGA」を手に入れました。
そんな、素敵な「IBM Power System S822LC for High Performance Computing」を使ってみたいのですが、
お値段が超高いです。
どこかに落ちていないでしょうか?
クリスマスプレゼントかお年玉として、
お願いできないでしょうか。。。ね。(笑 #
余談)
総合力については、
2013年4月11日のブログ「個人の総合力、と、組織での個人の総合力を束ねる力」に書きました、
企業だけでなく、個人も総合力で勝負するのがいいと思っています。