LoginSignup
12
12

More than 5 years have passed since last update.

お手元のマシンとスパコンを比較する方法-スパコン用ベンチマークソフトを動かしてみる

Last updated at Posted at 2015-11-13

スパコンと自分のマシンを比べてみる

最近、スパコン周りの話題が人気だ。
またもスパコンにメス 「見合った成果説明できず」
京速コンピューターが、予算にあった成果があるかという突っ込みが入ったそうだ。
そのニュースをぼーっと見ながら、疑問に思った。自分の手元にあるマシンに比べてどの位、京速コンピュータは速いのだろう?

ということで、スーパーコンピューターでよく使われるベンチマークソフト LINPACKを手元で動かしてみて、どの位違うものなのか比べてみることにする。

実際のスパコンは、メモリーやストレージ性能も段違いなので、あまり真に受けないように。

 ベンチマークソフトを入手

スーパーコンピュータの準位比較としてはTOP500というランクが有名だ。そこではLINPACKベンチマークというベンチマークが使われているようだ。LINPACKについてはこちら

書いてあることはよくわからないが、世の中よくしたもので、ベンチマークソフトを配っている企業がある。INTELにLINPACKベンチマークソフトがあった。

こちらのサイトから、アプリをダウンロードすれば、実行バイナリーを入手できるようだ。本来であればソースコードからコンパイルするらしいが、めんどくさいので、バイナリーを利用する(Linux,windows,osx版がある)。

macで試したので、osx版をダウンロードして、解凍した。

解凍後 m_mklb_p_11.3.1.002/benchmarks_11.3.1/mac/mkl/benchmarks/linpackと深いフォルダーに、runme64とかrunme32というプログラムがある。linpack_cd64がプログラムの本体で、runme64がそれを簡単に呼び出すスクリプトになっている。

ベンチマーク実行

$./runme64

を実行すれば、ベンチマークが始まり、終了後実行結果が表示される(5分くらいかかる)。
実行する環境は、macbookpro mid 2012 Core-i5 2.5GHz-2core メモリー8GBだ。

実行結果

This is a SAMPLE run script for SMP LINPACK. Change it to reflect
the correct number of CPUs/threads, problem input files, etc..
2015年 11月13日 金曜日 20時21分05秒 JST
Intel(R) Optimized LINPACK Benchmark data

Current date/time: Fri Nov 13 20:21:05 2015

CPU frequency:    3.091 GHz
Number of CPUs: 1
Number of cores: 2
Number of threads: 4

(中略)

Performance Summary (GFlops)

Size   LDA    Align.  Average  Maximal
15000  15000  4       33.6330  33.6330
14000  14008  4       36.3750  37.2843
13000  13000  4       36.3239  37.4845
12000  12008  4       32.0855  33.6463
11000  11000  4       35.4210  35.5010
10000  10008  4       37.1876  37.4411
8000   8008   4       35.5023  37.2433
6000   6008   4       35.5924  36.1413
1000   1000   4       17.0286  17.2889

Residual checks PASSED

End of tests

-n Done:
2015年 11月13日 金曜日 20時30分36秒 JST

途中省略した。全文はこちら

Performance Summaryを項目を見ると大体33GFlopsから37GFlops位出ているようだ。

スパコンと比べてみると。

実際に、京速コンピューターと較べてみる。

手元のmac book proが約37GFlops,こちらによると、京のLINPACKの実効性能(Rmax)は、10510TFlopsだそうだ。

10,510TFlopsは10,510,000GFlopsなので、10,510,000/37より約284,054倍になり、約28万倍くらいの性能のようだ。

ちなみに、こちらを調べたら、1999年の400位くらいと、手元のmacbookproは同じ位のようだ。15年ほどすると、手元のマシンも、スパコン並になるのだな。

追記

AWSのEC2でCPUが速いマシンと比較してみた。

12
12
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
12
12