昨日、テクノロジーレビューサイト「Chips and Cheese」がAMDの新しい3D V-Cacheテクノロジーのレビューを公開し、前世代のZenプロセッサとの比較によるパフォーマンスを披露しました。Chips and Cheeseは、この用途にAMDのEPYCサーバープロセッサを選択し、3D V-Cache対応のEPYC 7V73 (Milan-X) と標準のZen 3 EPYC 7763 (Milan) を選定しました。
3D V-CacheはAMDが開発した新技術で、L3キャッシュを垂直方向に積み重ねることで、非常に小さなスペースでキャッシュサイズを大幅に拡大できます。AMDはこの新技術により、CPUコアにより多くの情報を一貫して供給できるようになり、既に目覚ましいパフォーマンス向上を実証しています。
Zen 1とZen 2のEPYCチップ(7551と7452など)を加えると、AMDの3D V-Cacheチップの真価がさらに明確になりました。Chips and Cheeseは、L3キャッシュをZen 1からZen 2にカウントするように設定することで、約5サイクルのレイテンシが追加されると指摘しました。さらに、Zen 3ではL3キャッシュのデュアル16MBチャンクをZen 2から統合することで、さらに7~8サイクルのレイテンシが追加されました。
一方、AMD の Zen 3 から Zen 3 3D V-Cache への移行と、L3 キャッシュのサイズの 3 倍化によるレイテンシのコストはわずか 3 ~ 4 サイクルで、これはこれまで見てきた中で最も無視できるペナルティです。
Chips and Cheeseのグラフによると、すべてのZen世代でL1キャッシュとL2キャッシュのレイテンシはほぼ同じでした。しかし、L3キャッシュに関しては、世代間でL3キャッシュの使用量が増えるにつれてレイテンシは減少し、特に3D V-Cacheを搭載したZen 3ではその傾向が顕著でした。
Tom's Hardware の最高のニュースと詳細なレビューをあなたの受信箱に直接お届けします。
帯域幅
帯域幅の結果では、Chips and Cheese は、AMD の 7V73X 3D V-Cache がシングルスレッド キャッシュ帯域幅テストでサイクルあたり約 25% のバイト増加しか得られなかったことを発見しました。
しかし、Chips and Cheese は、CPU が L3 キャッシュを利用する大きなワークロードに達するとクロック速度が低下する可能性があると考えており、それが実際に違いを説明しています。
7V73Xでは、もう一つ奇妙な現象が発生しました。シングルCCDキャッシュ帯域幅テストで、3D V-Cacheチップの帯域幅が標準の7763と比較してわずかに不足し、約12.5%の不足が見られました。Chips and Cheeseは、これは両方のチップに64個のコアが搭載されているため、消費電力を抑えるためではないかと推測しました。3D V-Cacheは確かにより多くのスペースを占有し、わずかに多くの電力を必要とするため、CPUの冷却がやや複雑になるため、これは理にかなっています。
興味深いことに、同じ現象はAMDのZen 2マイクロアーキテクチャをベースにしたEPYC 7452チップでも発生しました。EPYC 7763 Zen 3 CPUは、シングルCCD帯域幅テストとシングルスレッド帯域幅テストの両方で同等のパフォーマンスを発揮した唯一のチップでした。
Zen 1について疑問に思われる方もいるかもしれませんが、キャッシュ帯域幅はZen 2やZen 3の同等製品に全く及ばず、テスト対象となったEPYC 7551は、テストの大部分において半分以下の帯域幅しか得られませんでした。追いつくのに近づいたのは、テストの中盤と終盤になってからでした。
結論
では、これらのデータは実際のパフォーマンスにおいてどのような意味を持つのでしょうか?Chips and Cheeseは、Gem5、libx264 4Kトランスコーディング、7-Zipなど、複数のベンチマークを実行しました。3D V-Cacheがパフォーマンスに顕著な変化をもたらしたのはGem5のみでした。その他のベンチマークでは、3D V-Cacheチップのパフォーマンス向上がわずか5%程度と、ほとんど目立たない結果となりました。
Chips and Cheeseの予備的な結果によると、3D V-Cacheの影響はAMDが既に予測していたほど大きくないことが示唆されています。しかし、判断を下すにはより詳細なテストが必要になります。また、これはAMDのEYPCサーバープロセッサ上の3D V-Cacheに関するものであり、コンシューマー向けプロセッサにおける3D V-Cacheの挙動は異なる可能性があることも忘れてはなりません。
まず、7V73Xは64コアという驚異的なチップであるため、熱と電力出力に敏感で、必要に応じてCPUコアを急速にスロットリングします。これはキャッシュを追加することで調整され、CPUの電力と放熱要件が増加します。
もう 1 つはサーバーのワークロードです。サーバーのワークロードは、その性質上、従来はレイテンシよりも計算負荷が大きくなる傾向があります。3D V-Cache は、コアがボトルネックになっていない場合、および処理にかなりの時間を要するスレッドが実行されていない場合にのみ役立ちます。
コンシューマー市場では、コア数が大幅に少ないチップが主流となっています。これにより消費電力が低減し、コアはクロック周波数のわずかな変動で最大限のパフォーマンスを発揮できます。優れた冷却システムと、PC DIY市場でCPUが要求するよりもはるかに余裕のある強力な電力供給ソリューションを備えたマザーボードがあれば、これは問題になりません。
コンシューマー向けアプリは一般的に計算負荷がはるかに低いため、キャッシュレイテンシがより重要な役割を果たします。これはビデオゲームにおいて特に顕著で、CPUが100%まで負荷されることは稀ですが、レイテンシが低いということは、プリレンダリングされたフレームがGPUに速く到達し、入力遅延が減少し、フレームレートが向上することを意味します。
Aaron Klotz 氏は Tom's Hardware の寄稿ライターであり、CPU やグラフィック カードなどのコンピューター ハードウェアに関するニュースを扱っています。