AMDは、Instinct MI200やZen 4のロードマップなど、他の興味深い情報とともに、3D V-Cacheを搭載した同社の最新のEPYC Milan-Xプロセッサを公式に発表しました。チップメーカーはキャッシュスタックチップの仕様を公表していませんが、Microsoftは、3D V-Cacheがもたらすパフォーマンスの向上を示すMilan-Xベンチマークを公開しました。
Microsoftは、EPYC 7V73Xプロセッサを2基搭載した新しいAzure HBv3シリーズVMの基盤としてMilan-Xを採用します。各プロセッサは最大64個のZen 3コアを搭載し、サーバーあたり合計128コアとなります。ただし、各サーバーから8コアがAzureハイパーバイザーやその他のオーケストレーションルーチンへの供給用に予約されています。そのため、Microsoftは顧客に、コア数が異なる最大5つの構成(120コア、96コア、64コア、32コア、16コア)を提供しています。EPYC 7V73Xのピーククロック速度は最大3.5GHzです。
Azure HBv3のその他のハードウェアは変更されていません。メモリは448GBで、帯域幅は350GBps(STREAM TRIADで測定)のままです。さらに、2基の900GB NVMe SSDが高速ストレージを提供し、読み取り速度は最大6.9GBps、書き込み速度は最大2.9GBpsです。また、Mellanox ConnectX-6 NICが200Gbpsのイーサネット接続を提供します。
Microsoft Azure HBv3 仕様
スワイプして水平にスクロールします
VMサイズ | 120個のCPUコア | 96個のCPUコア | 64個のCPUコア | 32個のCPUコア | 16個のCPUコア |
---|---|---|---|---|---|
VM名 | 標準_HB120rs_v3 | 標準_HB120- 96rs_v3 | 標準_HB120- 64rs_v3 | 標準_HB120- 32rs_v3 | 標準_HB120- 16rs_v3 |
インフィニバンド | 200 Gb/s HDR | 200 Gb/s HDR | 200 Gb/s HDR | 200 Gb/s HDR | 200 Gb/s HDR |
ピークCPU周波数 | 3.5GHz | 3.5GHz | 3.5GHz | 3.5GHz | 3.5GHz |
VMあたりのRAM | 448GB | 448GB | 448GB | 448GB | 448GB |
コアあたりのRAM | 3.75GB | 4.67GB | 7GB | 14GB | 28GB |
VMあたりのメモリ帯域幅 | 350 GB/秒 | 350 GB/秒 | 350 GB/秒 | 350 GB/秒 | 350 GB/秒 |
コアあたりのメモリ帯域幅 | 2.91 GB/秒 | 3.65 GB/秒 | 5.46 GB/秒 | 10.9 GB/秒 | 21.9 GB/秒 |
VMあたりのL3キャッシュ | 1.5 GB | 1.5 GB | 1.5 GB | 1.5 GB | 1.5 GB |
コアあたりのL3キャッシュ | 12.8MB | 16MB | 24MB | 48MB | 96MB |
VM あたりの SSD パフォーマンス | 2 * 960GB NVMe - 6.9 GB/秒 (読み取り) / 2.9 GB/秒 (書き込み)、200K IOPS (読み取り) / 190K IOPS (書き込み) | 2 * 960GB NVMe - 6.9 GB/秒 (読み取り) / 2.9 GB/秒 (書き込み)、200K IOPS (読み取り) / 190K IOPS (書き込み) | 2 * 960GB NVMe - 6.9 GB/秒 (読み取り) / 2.9 GB/秒 (書き込み)、200K IOPS (読み取り) / 190K IOPS (書き込み) | 2 * 960GB NVMe - 6.9 GB/秒 (読み取り) / 2.9 GB/秒 (書き込み)、200K IOPS (読み取り) / 190K IOPS (書き込み) | 2 * 960GB NVMe - 6.9 GB/秒 (読み取り) / 2.9 GB/秒 (書き込み)、200K IOPS (読み取り) / 190K IOPS (書き込み) |
Microsoftは、大容量キャッシュがメモリ帯域幅とレイテンシの有効性を高めることを明らかに指摘しています。数値流体力学(CFD)、陽解法有限要素解析(FEA)、気象シミュレーション、EDA RTLシミュレーションといったワークロードは、Milan-Xの豊富なL3キャッシュの恩恵を受けるでしょう。一方、ピークFLOPS、クロック速度、あるいはメモリ容量に依存するワークロードは、大容量L3キャッシュの影響を受けません。これには、分子動力学、EDAフルチップ設計、EDA寄生抽出、そして陰解法有限要素解析などが含まれます。
画像
1
の
2

結果によると、Milan-X(EPYC 7V73X)は、現行世代のMilan(EPYC 7V13)と比較して、メモリレイテンシが42%~50%低下していることが明らかになりました。Milan-Xは、メモリコントローラがプロセッサに統合されて以来、メモリレイテンシの相対的なパフォーマンスにおいて最も飛躍的な向上を示したプロセッサの一つです。ただし、Microsoftの結果は、Milan-XがDRAMアクセスのレイテンシを改善したことを示唆するものではないことを明記しておく必要があります。
Microsoftによると、大容量キャッシュはキャッシュヒット率の向上とL3とDRAMのレイテンシの組み合わせを実現し、実環境における実効的な結果を向上させるとのことです。AMDのL3キャッシュのスタック方法により、L3レイテンシの分布幅は拡大しています。しかしながら、MicrosoftはMilan-XのL3メモリレイテンシはMilanと同程度になるはずだと考えています。最悪のシナリオでは、Milan-XのL3レイテンシはMilanよりもわずかに遅くなる可能性があります。
Tom's Hardware の最高のニュースと詳細なレビューをあなたの受信箱に直接お届けします。
Milan-Xのメモリも同様の傾向を示しています。Milan-XはSTREAM TRIADベンチマークで約358GB/秒のスループットを達成しました。これは、MilanチップとDDR4-3200メモリをチャネルあたり1枚のDIMMで組み合わせた従来のデュアルソケットサーバーと同等の結果です。
画像
1
の
8

MicrosoftはEPYC 7V73Xを徹底的にテストし、Milan-Xチップを同社のAzure HBv3 VM(EPYC Milan、EPYC Rome、Xeon Platinum(Skylake)プロセッサ搭載)と比較しました。言うまでもなく、Milan-Xのパフォーマンスは驚異的です。
64 VM構成では、Milan-XはAnsys Fluent 2021 R1のf1_racecar_140モデルでMilanよりも最大77%高いパフォーマンスを実現し、Skylakeよりも最大257%高速でした。combustor_830mモデルでは、128 VM構成でMilan-XはMilanとSkylakeよりもそれぞれ16%と131%高いパフォーマンスを示しました。
OpenFOAM Motorbikeベンチマークでは、8VM構成において、Milan-XはMilanより最大60%、Skylakeより最大305%高速でした。この傾向は明確で、Milan-Xは前世代機と比較して2桁のパフォーマンス向上、Skylakeと比較して3桁のパフォーマンス向上を誇っています。
AMDの3D V-Cacheの実装により、Milan-Xのスケーリング効率は驚異的でした。Ansys Fluent 2021 R1ベンチマークとf1_racecar_140モデルを基準として、Milan-Xは64台のVMと1台のVMを比較した場合、最大200%のスケーリング効率を示しました。つまり、Milan-Xを搭載した64台のHBv3 VMは、1台のHBv3インスタンスにかかる時間の半分でジョブを完了できるということです。つまり、お客様はVMコストを50%削減し、ソリューション時間を127倍高速化できるというメリットを享受できるのです。
マイクロソフトは、お客様にリニアなパフォーマンス向上を提供することに常に誇りを持っています。HPCにおけるゴールドスタンダードとみなされるリニア効率とは、1台のVM(または問題解決に必要な最小数のVM)と比較して、パフォーマンスがコストに比例してリニアに向上することを意味します。Milan-Xを利用することで、マイクロソフトのお客様はソリューション時間を大幅に短縮し、VMコストを削減できます。
Zhiye Liuは、Tom's Hardwareのニュース編集者、メモリレビュアー、そしてSSDテスターです。ハードウェア全般を愛していますが、特にCPU、GPU、そしてRAMには強いこだわりを持っています。