前に、お手元のマシンとスパコンを比較する方法と言うなんともアホっぽい記事を書いた。更に思った。Amazon EC2の最もCPUが高いマシンと、比べてみたらどうだろうか?
実際のスパコンは、メモリーやストレージ性能も段違いなので、あまり真に受けないように。
AWS c4.8xlarge でLINPACK ベンチマークを動かす。
という訳で、AWSで最もCPUが早そうなマシンを使って、スパコンと性能の比較をしてみる。
今回使用したマシンはこちら
c4.8xlarge
モデル | vCPU | メモリ |
---|---|---|
c4.8xlarge | 36core | 60GB |
ベンチマークソフトの入手は、前回の実験を参考。
LINPACKベンチ実行
$ ./runme_xeon64
と実行すれば、ベンチマークが走る
実行結果
ubuntu@ip-*-*-*-*:~/l_mklb_p_11.3.1.002/benchmarks_11.3.1/linux/mkl/benchmarks/linpack$ ./runme_xeon64
This is a SAMPLE run script for SMP LINPACK. Change it to reflect
the correct number of CPUs/threads, problem input files, etc..
./runme_xeon64: 37: [: -gt: unexpected operator
Fri Nov 13 11:26:24 UTC 2015
Intel(R) Optimized LINPACK Benchmark data
Current date/time: Fri Nov 13 11:26:24 2015
CPU frequency: 3.126 GHz
Number of CPUs: 2
Number of cores: 18
Number of threads: 36
Parameters are set to:
Number of tests: 15
中略
Performance Summary (GFlops)
Size LDA Align. Average Maximal
1000 1000 4 111.9889 130.8526
2000 2000 4 238.4829 241.5401
5000 5008 4 339.5006 343.8180
10000 10000 4 504.4043 507.6466
15000 15000 4 561.8308 568.8488
18000 18008 4 605.1949 607.6225
20000 20016 4 612.9355 612.9947
22000 22008 4 616.1507 618.2845
25000 25000 4 625.9232 626.5519
26000 26000 4 629.0290 629.1309
27000 27000 4 629.0215 629.0215
30000 30000 1 630.3005 630.3005
35000 35000 1 631.0244 631.0244
40000 40000 1 642.6358 642.6358
45000 45000 1 634.4839 634.4839
Residual checks PASSED
End of tests
Done: Fri Nov 13 11:38:43 UTC 2015
長いので省略した。全部の結果はこちらのgistにある .
結果を見ると、630GFlops位になりそうだ。
ちなみに、その時にCPUの使用率はこんなもん。
効率的に各CPUを使えているみたいだ。
#スパコンと比べると
先の記事を参考にすると、京コンピュータの実効性能は、10510TFlopsだそうだ。
10,510TFlopsは10,510,000GFlopsなので、10,510,000/630より約16682倍になり、約16000倍くらいの性能のようだ。
こちらによると、1996年の11月のTOP1よりは性能が良いようだ。Rmaxを見れば良いらしい。
システム名 | rMax(GFlops) |
---|---|
Center for Computational Sciences, University of Tsukuba Japan | 368.2 |
aws c4.8xlarge | 630 |
次のランキングでは、Sandia National Laboratories United Statesが突如、1,068.0GFlopsを叩きだした。
ちなみに、先の程の記事で、MacBookPro(core-i5-2.5GB)の性能を計測しており、その性能は37GFlops位なので、630/37は17倍位になり、aws c4.8xlargeは17倍くらい高性能だと考えられ、まあそんなもんかなと言う気がする(小数演算の性能しか比べていないので本当の性能比較はもっと複雑です・・)。