はじめに
少し古いことを許せばネットで探すとサーバー用パーツを入手できる。なのでPC自作感覚でサーバー、ワークステーションを組むことができる。せっかく組みあがったら何よりベンチマークするわけだが計算用CPUで組むので一般的なレンダリング系ベンチに加えて倍精度計算系のベンチも試す。すると単精度性能と倍精度性能に違いが現れ結果XeonというCPUは難しいなぁ、と感じたので感想メモ書き。
使用したXeon CPU
使用したXeon環境は下記。
E5-2620 v3(6C、12T、ベースクロック2.4 GHz、ブーストクロック3.2 GHz)2基
E5-2699 v(22C、44T、ベースクロック2.2 GHz、ブーストクロック3.6 GHz)2基
Silver 4116(12C、24T、ベースクロック2.1 GHz、ブーストクロック3.0 GHz)1、2基
Gold 6152(22C、44T、ベースクロック2.1 GHz、ブーストクロック3.7 GHz)2基
Cinebench2024
Cinebench2024のCPUマルチにおいて、これらの中で最もパフォーマンスが良かったのはE5-2699 V4で1807 cb、2位はGold 6152の1745 cb。これらはCore i9-13900Kよりも高スコアである。デュアルCPU環境でともに44 C、88 T。Gold 6152の方が世代が新しいのでこの結果は意外だった。
下位に移るとSilver 4116 x 2(24 C、48 T)の953 cb > Silver 4116 x 1(12 C、24 T)の542 cb > E5-2620 v3 x 2(12 C、24 T)の503 cbとなり、こちらの順位は世代の新しいほうが高スコアになり、その通りかなと納得した。
これらはレンダリング演算なので単精度計算スコアである。
Quantum Espresso (AUSURF112)
倍精度計算ベンチにはこちらと同じく密度汎関数計算プログラムQuantum Espresso ver. 7.0を用いた。Wall Timeは計算に要した時間なので短いほど演算パフォーマンスが高いことになる。
結果は2 x Gold 6152(44 C、88 T) > 2 x E5-2699 v4(44 C、88 T)> 2 x E5-2620 v3(12 C、24 T) > 2 x Silver 4116(24 C、48 T)だった。
Cinebench2024の結果と比較するとSilver 4116のパフォーマンスが悪く、倍精度計算能力が低いとわかる。Silver 4116 x 2のCinenench2024スコア(953 cb)とE5-2620 v3のスコア(503 cb)を比較するとSilver 4116 x 2はE5-2620 v3の約1.9倍高性能だ。これは単精度の場合であり、倍精度演算ではコア数やクロック数のみで計算能力を単純に予測できないとわかった。
Xeon Silverとは
こちらのサイトを参照するとXeon Silverシリーズは「中程度のタスク向けに最適化」されたCPUとある。おそらく倍精度計算能力を削り価格を下げたシリーズだろう。とはいえ倍精度計算で古い世代かつコア数半分のE5-2620 v3に惨敗した結果には自分の目を疑った。逆により高スペックXeonなら性能が上がるか?を試したいが使用したマザボの仕様によりGold 6152が上限のため今のところこれ以上確認できない。Silver 4116、Gold 6152などの初代Scalable XeonはAliexpressから比較的安価に入手できるのでマザボ交換を考えるか?とも思い始めている。あいにく予算がないので無理なのだが。
最近のXeonは難しい
Scalable Xeonは非常にたくさんのモデルがある。今回用いた第一世代の一覧はこちら。何が違うのか?もわかりにくい。目的に合わせて最適なモデルを選択できるメリットがあるだろうが詳しくない人にとっては何を選べばよいか迷うだろう。使うプログラム、想定される負荷などをよく精査して詳しい人に相談というのが現実的な対応だろう。これに予算の制約が入ると選択が難しくなるばかりだ。
ジャンカー感覚なら遊ぶ選択肢が多いのでとっかえひっかえ比べる、という遊び方もありうると思うが、実際にやってみようとするとCPU交換が面倒というかプラ製のCPUキャリアを割ってしまいそうな感じがする。頻繁なCPU交換が想定されていない設計なのだ。いろいろ難しい感じでした。