
クラウドデータセンターのパフォーマンスに対する要求はますます高まっており、CPU開発者は、ムーアの法則の減速によって生じるコスト制約に立ち向かいながら、ソケットあたりのパフォーマンスを最大限に高めるために、設計の見直しを迫られています。AMDのEPYC「Begamo」は、業界初のx86クラウドネイティブCPUで、特別に設計されたZen 4cマイクロアーキテクチャをベースとしています。このマイクロアーキテクチャは、Zen 4マイクロアーキテクチャと基本的に同じ機能セットを維持しながら、コアサイズ要件を半分に削減しています。SemiAnalysisの報道によると。
AMDのEPYC「Bergamo」プロセッサは128コアを搭載し、96コアのEPYC「Genoa」CPUと同じソケットSP5に搭載されています。また、同様の12チャネルDDR5-4800メモリサブシステムを搭載し、同じI/Oダイ(コードネームFloyd)を使用しているため、128本のPCIe Gen5レーンとSP5製品のその他の特徴も備えています。クラウドネイティブのシステムオンチップ(SoC)であるBergamoは、Ampere、Amazon、Google、Microsoftなどの新興ArmベースのデータセンターグレードSoCへの対応という側面もあり、コアあたりのパフォーマンスを最大化することを目指したものではなく、効率性、消費電力、ダイサイズ、総所有コスト(TCO)の低減など、複数の要素を考慮して設計されています。
スワイプして水平にスクロールします
行0 - セル0 | EPYC 9654 | EPYC 9754 | EPYC 9734 |
デザイン | ジェノヴァ | ベルガモ | ベルガモ |
マイクロアーキテクチャ | 禅4/ペルセポネ | 禅 4c/ディオニュソス | 禅 4c/ディオニュソス |
コア/スレッド | 96/192 | 128/256 | 112/224 |
L1i キャッシュ | 32KB | 32KB | 32KB |
L1dキャッシュ | 32KB | 32KB | 32KB |
L2キャッシュ | 1MB | 1MB | 1MB |
合計L2キャッシュ | 96MB | 128MB | 112MB |
CCX あたりの L3 キャッシュ | 32MB | 16MB | 16MB |
合計L3キャッシュ | 384MB | 256MB | 256MB |
CCD | デュランゴ | ヴィンディヤ | ヴィンディヤ |
CCDカウント | 12 | 8 | 8 |
CCDあたりのCCX | 1 | 2 | 2 |
CCDあたりのコア数 | 8 | 16 | 14 |
I/Oダイ | フロイド | フロイド | フロイド |
メモリチャネル | 12 | 12 | 12 |
定格メモリ速度 | DDR5-4800 | DDR5-4800 | DDR5-4800 |
メモリ帯域幅 | 460.8 GB/秒 | 460.8 GB/秒 | 460.8 GB/秒 |
PCIe 5.0 レーン | 128 | 128 | 128 |
TDP/最大TDP | 360W/400W | 360W/400W | 360W/400W |
ソケット | SP5 | SP5 | SP5 |
スケーラビリティ | 2P | 2P | 2P |
マイクロアーキテクチャレベルでは、Zen 4cはZen 4と同じ設計を維持しており、機能やクロックあたりの命令数性能も同一ですが、構成と実装は大幅に異なるとSemiAnalysisは主張しています。Zen 4cの「Dionysus」コアは、Zen 4の「Persephone」コアと比較して約35.4%小型化されています。これを実現するために、AMDはいくつかの設計上の工夫を凝らしました。アナリストたちは次のように考えています。
- ブーストクロックのターゲット周波数を3.70GHzから3.10GHzに引き下げました。これによりタイミングクロージャが簡素化され、緩和されたタイミング制約を満たすためのバッファセルの追加の必要性が減少しました。今日の設計は配線密度と配線混雑によって制約を受けることが多いため、周波数を下げることで信号経路をより密集させ、スタンダードセルの密度を高めることができます。
- これにより、ダイの物理パーティションの数が削減され、ロジックがより密集したため、デバッグや修正の導入が難しくなりましたが、ダイのサイズは縮小されました。
- Zen 4cでは、SRAM面積を削減するため、Zen 4の8TデュアルポートSRAM回路に対し、より高密度の6TデュアルポートSRAMセルを採用しました。その結果、Zen 4とZen 4cのコアのL1キャッシュとL2キャッシュのサイズはほぼ同等ですが、Zen 4cのキャッシュの使用面積は小さくなっています。しかし、これらのキャッシュの速度はZen 4のキャッシュほど速くありません。
- 最後に、シリコンをさらに節約するために、3D V-Cache のシリコン貫通ビア (TSV) アレイを削除しました。
AMDがダイ面積削減に用いた手法はこれだけではありません。SemiAnalysisによると、AMDのBergamoは、8個のVindhyaコアコンプレックスダイ(CCD)をベースにしており、16個のZen 4cコアを搭載しています(CCDあたり8個のZen 4コアから増加)。これはコアの小型化によるものですが、クロック速度のポテンシャルにも影響を与えています。各CCDには、2個の8コアコアコンプレックス(CCX)と32MBのL3キャッシュ(CCXあたり16MB)も搭載されています。一方、Zen 4 CCXは1個あたり32MBのL2キャッシュを搭載しており、Zen 4c CCXと比較してサイズが大幅に増加しています。
全体的に見て、AMDのZen 4cとBergamoは、128個のZen 4クラスのコアをGenoaと同じ360W~400Wの消費電力枠に収める必要があったため、設計の方向性を大きく転換したと言えるでしょう。周波数目標の引き下げ、より高密度なSRAMセルの使用、そしてCCXあたりのL3を半分に削減することで、AMDはコア数を増やすことができましたが、それがコアあたりのパフォーマンスにどのような影響を与えたかはまだ解明されていません。
SemiAnalysis によると、AMD は今月後半に 128 コアの EPYC 9754 と、そのわずかに削減された兄弟製品である 112 コアの EPYC 9734 という 2 つの Bergamo プロセッサをリリースする準備をしているとのこと。エクサスケール データセンターの運営者は、展開に関して特定の要件を持っている傾向があることを考えると、AMD が最終的にカスタムおよびセミカスタムの Bergamo 製品をいくつ生産するのかは気になるところですが、今のところ、すでに来週には 2 つのモデルが発表される予定です。
「来週、高密度で、クラウドネイティブコンピューティングのためのエネルギー効率においてワット当たりの性能が非常に優れているクラウドネイティブに最適化されたデバイスであるBergamoについてお話します」と、AMDのサーバー事業責任者であるダン・マクナマラ氏は、バンク・オブ・アメリカ2023グローバルテクノロジーカンファレンスで述べた(SeekingAlpha経由)。
Tom's Hardware の最高のニュースと詳細なレビューをあなたの受信箱に直接お届けします。
アントン・シロフはTom's Hardwareの寄稿ライターです。過去数十年にわたり、CPUやGPUからスーパーコンピュータ、最新のプロセス技術や最新の製造ツールからハイテク業界のトレンドまで、あらゆる分野をカバーしてきました。