43
AMDのEPYC Milan-Xが正式発表:3D Vキャッシュにより最大768MBのL3キャッシュ、64コアを実現(更新)

AMDのCEO、リサ・スー氏は、本日開催されたAccelerated Data Centerイベントにおいて、3Dスタック型L3キャッシュ「3D V-Cache」を搭載した同社のEPYC Milan-Xプロセッサに関する最初の詳細情報を公開しました。AMDによると、既存のZen 3搭載EPYC Milanモデルに追加される新しいキャッシュスタッキング技術により、新しいMilan-Xチップはチップあたり最大768MBのL3キャッシュを搭載可能になるとのことです。これは、まもなく1.5GBという驚異的なL3キャッシュを搭載したデュアルソケットサーバーが登場することを意味します。AMDはまた、この技術の恩恵を受けるワークロードの例をいくつか公開し、60%のパフォーマンス向上を示す印象的なベンチマーク結果も発表しました。

これらのチップは2022年第1四半期に市場に投入される予定ですが、現在Azureのプレビューインスタンスとして利用可能です。Microsoftも独自のパフォーマンス予測を発表していますが、それについても以下の記事で取り上げます。 

簡単におさらいすると、AMDはCES 2021で3D V-Cacheテクノロジーを発表し、追加のL3キャッシュを搭載した第3世代Ryzenプロトタイプを披露しました。3D V-Cacheは、Ryzenコンピューティングチップレットの上に垂直に積み重ねられた追加の64MBの7nm SRAMキャッシュを融合する新しいハイブリッドボンディング技術を使用して、RyzenチップあたりのL3キャッシュの量を3倍にします。AMDは、これにより一部のゲームで最大15%のパフォーマンス向上がもたらされると主張しており、これらのチップが来年初めに市場に登場すると、ゲーム向けの最高のCPUのタイトルを争うことになるでしょう。それ以来、今年初めのHot Chipsプレゼンテーションでパッケージング技術に関する詳細な情報など、これらのチップについてさらに多くの詳細が明らかになっています。 

AMD EPYC Milan-X 仕様

画像

1

4

AMD ミランX
(画像提供:Tom's Hardware)

AMDは、長らく噂されていたMilan-Xデータセンタープロセッサにも同じ技術を採用していますが、新チップの詳細な仕様はまだ公表されていません。しかし、AMDはブリーフィングとエンドノートを通じて、少なくとも16コア、32コア、64コアのバリエーションが用意されることを確認しており、これは以前リークされた製品スタックのリストと一致しています。実際、B2B小売業者で販売されているのを確認したこともあります。噂されている仕様は以下のとおりです。

スワイプして水平にスクロールします

AMDの「Milan-X」リフレッシュに関する未確認のリーク仕様
プロセッサコア/スレッドベースクロックブーストクロックTDPL3 キャッシュ (L3 + 3D V キャッシュ)
エピック 7773X64/1282.2GHz3.5GHz280ワット768MB
エピック 7573X32/642.8GHz3.6GHz280ワット768MB
エピック 7473X24/482.8GHz3.7GHz240ワット768MB
エピック 7373X16/323.05GHz3.8GHz240ワット768MB

コンシューマー向けバリアントと同様に、AMD は各 CCD (コンピューティング チップレット) にすでに存在する L3​​ キャッシュの上に、単一の 6x6mm レイヤーの L3 キャッシュを直接積み重ねます。

改造前の各CCDには32MBのL3キャッシュが搭載されていました。垂直にスタックされたL3キャッシュスライスを追加すると、さらに64MBのキャッシュが追加され、CCDあたり合計96MBになります。Milan-Xチップは、8つのCCDを搭載した最大64コアモデルまで拡張可能で、チップあたりのL3キャッシュは合計768MBになります。AMDは、このチップがより高いL3スタックをサポートすることを確認しており、HardwareLuxxは、既存のAMD EPYC Milanサーバーでチップあたり最大4つのキャッシュスタックを可能にするサーバーBIOS設定を発見しました。

スタック型L3キャッシュは、全体のレイテンシに約10%のオーバーヘッドを追加します。これは、標準的なオンダイ技術で単純に容量を追加した場合の標準的なレイテンシへの影響と同程度です。これは、追加のL3キャッシュスライスがやや「ダム」であることも一因です。すべての制御回路は既存のCCD上に配置されているため、レイテンシのオーバーヘッドが軽減されます。さらに、キャッシュ容量の増加によりL3キャッシュヒット率が向上し、メインメモリへのトリップ回数が減少するため、メインメモリの帯域幅への負荷が軽減され、レイテンシが低減されます。その結果、アプリケーションのパフォーマンスが複数の側面から向上します。

AMDは通常のZen 3コアを使用していますが、3D V-Cacheの制御回路は、初期設計段階で将来を見据えた設計上の選択として追加されました。AMDは既存のEPYC Milanチップをビルディングブロックとして使用しているため、これらのチップはEPYCサーバーのSP3ソケットにそのまま搭載できます(BIOSアップデートが必要です)。これにより、認定期間が短縮され、市場投入までの期間が短縮されます。

AMDは、3D V-Cacheを実現するはんだ付け不要のハイブリッドボンディング技術の多くの利点を改めて強調しました。例えば、2Dチップレットと比較して200倍の相互接続密度、マイクロバンプ3Dパッケージングと比較して15倍の密度と3倍のエネルギー効率向上などです。AMDによると、ハイブリッドボンディングは他の3Dアプローチと比較して、熱、トランジスタ密度、相互接続ピッチも改善し、最も柔軟なアクティブ・オン・アクティブ・シリコンスタッキング技術となっています。

Tom's Hardware の最高のニュースと詳細なレビューをあなたの受信箱に直接お届けします。

さらにAMDは、増加したキャッシュ容量を活用するためにソフトウェアの変更は不要であると述べていますが、複数のパートナーと協力して認定ソフトウェアパッケージを作成中です。これらのパッケージでは、さらなるパフォーマンスの最適化も実現される可能性があります。

画像

1

5

AMD ミランX
(画像提供:Tom's Hardware)

AMDによると、Milan-Xは、主に様々な製品開発ソフトウェアで構成される特定の「対象ワークロード」において、最大50%のパフォーマンス向上を実現するという。これには、数値流体力学(CFD)、有限要素解析(FEA)、構造解析、そしてチップ設計を含む電子設計自動化(EDA)が含まれる。

AMDは、3つのワークロードにおける既存のAMD EPYC Milanモデルのパフォーマンスを宣伝し、そのうち3つのワークロードで2つのEPYC 75F3が2つのIntel Xeon 8362に勝ったことを示したが、これらのベンチマークにはMilan-Xは含まれていない。

AMDは、Milan-XをIntelのチップと直接比較することは避け、代わりにSynopsys VCSを用いたチップ設計(EDA)RTL検証ワークロードにおいて、16コアのMilan-Xが標準の16コアEPYCチップと比較して66%の性能向上を示したことを示しました。テストの注釈は記事の末尾に掲載しています。

AMDは、Milan-Xがより幅広いワークロードにもメリットをもたらすと述べています。これは上記のアルバムでご覧いただけます。また、Altair、Cadence、Synopsysなど、既に認定ソフトウェアパッケージの開発に取り組んでいる複数のISVもリストアップしています。これらの認定ソリューションは、発売時に利用可能になる予定です。

AMDはまだ公式の仕様や価格を発表していませんが、情報が入り次第更新します。チップは2022年第2四半期に発売される予定です。 

更新: Milan-X CPU を搭載した Azure HBv3 VM

MicrosoftはMilan-X HBv3 VMに関するドキュメントを公開しており、VMとベンチマークの詳細な分析についてはこちらの別記事でまとめています。以下は、パフォーマンス予測、VMサイズの詳細、技術概要をまとめたショートバージョンです。 

  • CFDワークロードのパフォーマンスが最大80%向上
  • EDA RTLシミュレーションワークロードのパフォーマンスが最大60%向上
  • 明示的有限要素解析ワークロードのパフォーマンスが最大 50% 向上
  • 最大120個のAMD EPYC 7V73X CPUコア(3D Vキャッシュ搭載EPYC、「Milan-X」)
  • コアあたり最大 96 MB の L3 キャッシュ (標準の Milan CPU の 3 倍、Rome CPU の 6 倍)
  • 350 GB/秒のDRAM帯域幅(STREAM TRIAD)、最大1.8倍の増幅(実効帯域幅約630 GB/秒)
  • 448 GBのRAM
  • 200 Gbps HDR InfiniBand (SRIOV)、アダプティブルーティングを備えた Mellanox ConnectX-6 NIC
  • 2 x 900 GB NVMe SSD (SSD あたり 3.5 GB/秒 (読み取り)、1.5 GB/秒 (書き込み)、大規模ブロック IO)

画像

1

3

アズール
(画像提供:Microsoft)

AMD

(画像提供:Microsoft)

さらに多くの EPYC Milan-X ベンチマークについては、Microsoft の Azure の投稿をご覧ください。 

  • 詳細: ゲームに最適なCPU
  • 詳細:  CPUベンチマーク階層
  • 詳細: AMD vs Intel
  • 詳細: すべてのCPUコンテンツ

画像

1

3

AMD MIlan-X
(画像提供:トムズハードウェア)

ポール・アルコーンはTom's Hardware USの編集長です。CPU、ストレージ、エンタープライズハードウェアに関するニュースやレビューも執筆しています。