
PhoronixによるGH100(Graceチップを1つ搭載)のレビューによると、NVIDIAのGraceサーバーCPUは非常に競争力が高いようです。NVIDIAの72コアArm CPUは、全体的なパフォーマンスではAMDやIntelのフラッグシップ機に遅れをとりましたが、上位のEpyc 9754やXeon Platinum 8592+よりも多くのベンチマークで勝利しました。Armアーキテクチャへの最適化が進めば、Graceは非常に強力なデータセンタープロセッサとなる可能性があります。
GH100には、Hopper GPUと72コアのGrace CPU、480GBのLPDDR5X RAMが搭載されています。NvidiaはGraceチップ単体を販売していないため、GH100(およびGH200)は、Grace CPU単体の性能を検証できる唯一のデバイスです。PhoronixはGPTshop.ai経由でGH100にアクセスしましたが、リモート接続のみでした。電力統計はリモートコンピューターに公開されず、また、壁からの電力消費量も確認できなかったため、レビューでは電力値は記載されていません。
ベンチマークは、最も一般的なサーバーOSであるLinuxで実施されました。このレビューでは、デュアルソケット構成を含む様々なCPUとの比較が含まれています。下の表は、GraceとAMDのフラッグシップであるBergamoベースのEpyc 9754、およびIntelの最上位Emerald Rapids Xeon Platinum 8592+を比較した結果です。
スワイプして水平にスクロールします
行0 - セル0 | グレースホッパー GH200 | エピック 9754 | Xeon プラチナ 8592+ |
高性能共役勾配 | 41.69 | 25.89 | 35.42 |
代数マルチグリッドベンチマーク 1.2 | 1,997,929,111 | 2,291,049,667 | 1,839,912,667 |
ルレシュ 2.0.3 | 23,185.18 | 22,356.75 | 39,468.91 |
Xmrig 6.18.1 | 17,253 | 29,356.1 | 40,381.2 |
ジョン・ザ・リッパー 2023.03.14 | 68,817 | 204,828 | 178,108 |
エース DGEMM 1.0 | 17.94 | 43.68 | 29.14 |
GraphicsMagick 1.3.38 シャープ | 1,363 | 924 | 749 |
GraphicsMagick 1.3.38 強化 | 1,761 | 1,451 | 1,192 |
Graph500 3.0 中央値 | 1,239,790,000 | 1,147,090,000 | 1,238,670,000 |
グラフ500 3.0 マックス | 1,315,650,000 | 1,184,510,000 | 1,304,200,000 |
ストレス-NG 0.16.04 マトリックス | 512,759.08 | 552,067.04 | 301,894.53 |
ストレス-NG 0.16.04 マトリックス 3D | 17,483.02 | 8,009.21 | 13,854.38 |
これらのテストはすべて、GFLOPS、1秒あたりの計算回数、ポイント数など、さまざまな値で測定されました。Graceの損失の大部分は、これらのベンチマークのばらつきに収まっているため、一見するとCPUの性能はそれほど高くないように見えるかもしれません。それでも、High Performance Conjugate GradientやGraphicsMagickなど、Graceが大きくリードするワークロードもあります。
スワイプして水平にスクロールします
行0 - セル0 | グレースホッパー GH200 | エピック 9754 | Xeon プラチナ 8592+ |
ロディニア 3.1 (低いほど良い) | 30.31 | 25.15 | 39.89 |
NWChem 7.0.2 (低いほど良い) | 1,403.5 | 1,700.8 | 1,850.8 |
Xompact3d Incompact3d (低いほど良い) | 254.49 | 493.5 | 323.53 |
Xompact3d Incompact3d (低いほど良い) | 9.81 | 9.03 | 10.18 |
Godot コンピレーション 4.0 (低いほど良い) | 139.1 | 118.25 | 111.96 |
プライムシーブ 8.0 (低いほど良い) | 35.49 | 21.76 | 49.06 |
Helsing 1.0-beta (低いほど良い) | 67.61 | 48.95 | 84.95 |
DuckDB 0.9.1 IMDB (低いほど良い) | 92.08 | 147.6 | 96.87 |
DuckDB 0.9.1 TPC-H Parquet (低いほど良い) | 148.76 | 177.13 | 134.73 |
RawTherapee(低いほど良い) | 46.72 | 66.13 | 45.53 |
Timed Gem 5 コンパイル 23.0.1 (低いほど良い) | 180.62 | 208.58 | 174.18 |
全体的な平均パフォーマンス | 2,175.03 | 2,459.11 | 2,242.9 |
Graceは、完了時間で評価されるこの2回目のテストでさらに勢いを増しました。このスコアは低いほど良いとされています。最終的に、Graceチップ単体はEmerald Rapidsに対して15勝、BergamoとGenoa(表には含まれていませんが、結果は非常に似ています)に対してはそれぞれ13勝を挙げました。デュアルソケットシステムでは、NvidiaのサーバーCPUがAMDやIntelのCPUに勝ったケースもありました。Graceは、同じくArmを搭載したAmpereの老朽化したAltra Max M128-30と比較しても非常に高速でした。
しかし、Grace の損失の多くはかなり大きかったため、平均すると Emerald Rapids 搭載の Xeon Platinum 8592+ より 3% 遅く、Bergamo ベースの Epyc 9754 や Genoa ベースの Epyc 9654 より約 13% 遅くなっています。Phoronix によると、「AArch64 [Arm] にあまり最適化されていないワークロードがまだいくつかある」ため、Grace が負けたとき、多くの場合、大幅な差で負けることになります。
GraceがサーバーCPUとしてどれほど優れているかを、パフォーマンスだけで評価するのは困難です。効率性も重要な指標だからです。しかしながら、2つのGrace CPUを組み合わせたGraceスーパーチップのTDPは500ワットであることが分かっており、1つのGraceが消費する電力は350ワット以下であると考えられます。このスーパーチップの初期ベンチマークは、非常に高い効率性を示しており、これはシングルチップ構成でも同様の結果になると思われます。
Tom's Hardware の最高のニュースと詳細なレビューをあなたの受信箱に直接お届けします。
マシュー・コナッツァーは、Tom's Hardware USのフリーランスライターです。CPU、GPU、SSD、そしてコンピューター全般に関する記事を執筆しています。