83
AMD RDNA 3とRadeon RX 7000シリーズGPU:わかっていることすべて
AMD RDNA 3
(画像提供:AMD)

AMDのRadeon RX 7000シリーズとRDNA 3アーキテクチャは、RX 7900 XTXとRX 7900 XTを皮切りに、2022年後半に発売されました。その後1年半の間に、数多くのカードがこのシリーズに加わり、最高峰のグラフィックカードに搭載されています。GPUベンチマークのランキングでは、これらのGPUが他の世代や競合製品と比較してどのようにランク付けされているかを確認できます。今後のRDNA 4 GPUにも期待が高まります。

でも、先走りすぎないようにしましょう。AMDのRDNA 3カードは7つのモデルから構成されています。最速のRX 7900 XTXから、低スペックのRX 7600まで、そしてその間のあらゆるモデルをテスト・レビューしました。それでは、詳細を見ていきましょう。

AMD RDNA 3 / Navi 3xの概要

  • 最大 96 CU / 12,288 シェーダー
  • RDNA 2よりもワットあたりのパフォーマンスが50%向上
  • CUあたりのALU数を2倍にする
  • GPUチップレットアーキテクチャ
  • 最大96MBの無限キャッシュ

AMD RX 7000シリーズの仕様

現在、世界中で発売され入手可能なすべての AMD RDNA 3 GPU の基本仕様は次のとおりです。

スワイプして水平にスクロールします

グラフィックカードRX 7900 XTXRX 7900 XTRX 7900 GRERX 7800 XTRX 7700 XTRX 7600 XTRX7600
建築ナビ31ナビ31ナビ31ナビ32ナビ32ナビ33ナビ33
プロセス技術TSMC N5 + N6TSMC N5 + N6TSMC N5 + N6TSMC N5 + N6TSMC N5 + N6TSMC N6TSMC N6
トランジスタ(10億個)45.6 + 6x 2.0545.6 + 5x 2.0545.6 + 4x 2.0528.1 + 4x 2.0528.1 + 3x 2.0513.313.3
ダイサイズ(mm^2)300 + 225300 + 225300 + 225200 + 150200 + 113204204
コンピューティングユニット96848060543232
GPU コア (シェーダー)6144537651203840345620482048
Tensor / AIコア1921681601201086464
レイトレーシングコア96848060543232
ブーストクロック(MHz)2500240022452430254427552655
VRAM速度(Gbps)20201819.5181818
VRAM(GB)2420161612168
VRAMバス幅384320256256192128128
L2 / 無限キャッシュ96806464483232
レンダリング出力単位19219216096966464
テクスチャマッピングユニット384336320240216128128
TFLOPS FP32(ブースト)61.451.646.037.335.222.621.7
テラフロップス FP16122.8103.29274.670.445.243.4
帯域幅(GBps)960800576624432288288
TDP(ワット)355315260263245190165
発売日2022年12月2022年12月2023年7月2023年9月2023年9月2024年1月2023年5月
発売価格999ドル899ドル549ドル499ドル449ドル329ドル269ドル
オンライン価格900ドル700ドル540ドル480ドル400ドル330ドル260ドル

前世代のRDNA 2およびRX 6000シリーズGPUでは、4種類のGPUデザインが12種類の異なるグラフィックカードモデルに分散していました。しかも、統合型グラフィックソリューションは含まれていません。AMD RDNA 3では、3種類のメインGPUと7種類のグラフィックカードモデル(および統合型)に絞り込まれ、その数は若干減少しました。

3つのGPU設計は、性能の高い順にNavi 31、Navi 32、Navi 33と呼ばれています。最大のダイには3つの異なるモデルがありますが、他の2つには2つのモデルしかありません。しかし、AMDがそこに到達するまでの過程には、いくつかの大きな違いがあります。

AMD RDNA 3は、少なくとも上位2つの構成において、初めてGPUチップレットを採用しました。Navi 31と32はそれぞれ大型のGCD(グラフィックス・コンピュート・ダイ)を搭載し、3~6個のMCD(メモリ・キャッシュ・ダイ)チップレットを搭載しています。最小のダイであるNavi 33は、従来のモノリシック・ダイを採用しています。

各MCDは64ビットのメモリインターフェースと16MBのL3キャッシュを備えています。MCDはAMDのInfinity Fabricを介してメインGCDに接続され、AMDはこれをInfinity Fanout Bridgeと呼んでいます。このブリッジは他の外部インターフェースよりもビットあたりの消費電力が低くなっていますが、モノリシック設計と比較すると確かに消費電力は高くなります。つまり、AMDは前世代のプロセスノードでMCDを製造することでコストを削減し、GCDのサイズを縮小することに成功しました。

将来の設計ではGPUダイを複数のチップレットに分割することでメリットが得られる可能性がありますが、この第一世代のGPUチップレットにおいては、これは基本的にコスト削減策です。一方、Navi 33ダイは、RDNA 2で使用されたN7ノードの改良版であるN6を依然として使用しています。これは、N6が小さすぎるため、GCD 1個とMCD 2個に分割する手間がかからないためです。

クロック速度はRDNA 2から大きく変わっていませんが、AMDは今回、シェーダー用とフロントエンド用にそれぞれ異なるクロックドメインを採用しています。AMDが公表しているクロック速度は今回のバージョンではやや控えめな設定となっており、ほとんどのゲームでより高いクロック速度が期待できます。ただし、ブーストクロックに達しないゲームもあり、その場合はリストに挙げています。AMDはさらに控えめな「ゲームクロック」も提供していますが、実際にはそれほど意味のあるものではありません。

今世代ではCUとシェーダコアが大幅にアップグレードされましたが、不思議なことにAMDは、潜在的なALUプロセッサのそれぞれを直接シェーダと呼んでいません。代わりに、実効レートの半分に相当するベース値を記載しています。例えば、RX 7900 XTXの6,144個のGPUシェーダは、時として12,288個のシェーダのように動作することがあります。これが、RDNA 2の2倍以上にあたる、はるかに高い演算性能を実現している理由です。

最上位モデルは61.4テラフロップスの演算性能を備え、FP16ワークロードではその2倍の性能を発揮します。ミドルレンジの7800 XTでさえ37.3テラフロップスの演算性能を備えており、これはRX 6800 XTのほぼ2倍に相当します。しかし、実際のゲームパフォーマンスは理論上の演算性能に比例するわけではありません。例えば、RX 7800 XTはRX 6900 XTとほぼ同等のパフォーマンスを発揮します。

7900 XTXのメモリ帯域幅は、RX 6950 XTと比較して50%以上増加しました。これは、50%広いインターフェースへの移行と、GDDR6メモリを20Gbps(6950は18Gbps)で動作させたことによるものです。実効メモリ帯域幅も、第2世代のInfinity Cacheによって向上しています。Infinity Cacheは、ほとんどのモデルでRDNA 2と比較してサイズが縮小されています。しかし、これはスループットの向上とキャッシュ階層のその他の調整によってほぼ相殺されています。

AMD Radeon 7000のパフォーマンス

AMD サム・ナフジガー

(画像提供:AMD)

過去2世代のAMDハードウェアと同様に、AMDはRDNA 3でワット当たり性能を少なくとも50%向上させることを目標としていました。これはかなり具体的な目標に思えるかもしれませんが、実際にはまだ調整の余地が十分にあります。例えば、RDNA 2はRDNAよりもワット当たり性能が50%向上しました。それがどのように実現したか、具体的な例をいくつか挙げてみましょう。

当社のGPUベンチマーク階層によると、RX 6900 XTは1080pウルトラで130fps、1440pウルトラで106fps、4Kウルトラで63fpsを実現しながら308Wの消費電力を消費します。下位モデルのRX 6700 XTは215Wを消費し、平均96fps、71fps、39fpsのフレームレートを実現しています。一方、RX 5700 XTは、同じ解像度で74fps、53fps、29fpsを実現しながら214Wを消費します。

計算してみると、6900 XTはワットあたりのパフォーマンスが22%~50%向上するのに対し、6700 XTは29%~34%しか向上しません。他のRDNAおよびRDNA 2 GPUを基準値として加えると、ワットあたりのパフォーマンス向上の可能性はさらに広がります。

AMDはアーキテクチャの改善についても言及しました。レイトレーシングハードウェアは改善されましたが、期待していたほどではありませんでした。アーキテクチャ上の最大の変更点は、実行リソースが2倍になったデュアルCUへの移行です。AMDはまた、FP16およびINT8演算のスループットを向上させるAIアクセラレータも追加しました。これらはシェーダー実行コアとリソースを共有しながら、データフローを最適化します。

画像

1

4

AMD RDNA 3 について私たちが知っていることすべて
(画像提供:Tom's Hardware)

RDNA 3 GPUがすべて発売された今、パフォーマンスとワットあたりのパフォーマンスの両方において、それぞれの性能を比較した独自の評価を提供できます。上のグラフは、19ゲームのテストスイートの全体的な結果を示しています。下には、個々のテスト結果の表があります。6000シリーズGPUの約半分は、テスト結果が(まだ)更新されていないため「欠落」していますが、7000シリーズについては十分なデータを提供しています。

上位2つのGPU、7900 XTXと7900 XTは、AMDの前世代のどのGPUよりも優れたパフォーマンスを発揮します。これは主に、前世代のどのGPUよりも多くのCU、VRAM、そしてメモリ帯域幅を備えていることによるものです。7900 XTXは96個のCU、24GBのメモリ、960GB/秒の帯域幅を備えています。7900 XTは84個のCU、20GBのメモリ、800GB/秒の帯域幅を備えています。これを、80個のCU、16GBのメモリ、576GB/秒の帯域幅を備えた6950 XTと比較すると、上位モデルのパフォーマンスが向上した理由は一目瞭然です。

その水準を下回ると、状況はそれほど魅力的ではなくなります。7900 GREは6950 XTと互角に渡り合いますが、7800 XTと6800 XTは非常に僅差で推移します。これは、RDNA 3の大きな懸念を示しています。メモリコントローラーとキャッシュを分離してGPUチップレットを作成することは、実際にはパフォーマンスの向上を目的としたものではありません。

CU数が同程度であれば、世代間で比較すると比較的似たパフォーマンスが得られます。RX 7800 XTは60基、6800 XTは72基のCUを搭載しているため、旧世代GPUの方がCU数が20%多くなっています。しかし、新型GPUはクロックも高くなっています。仕様では8%高いですが、テスト結果では5%程度です。全体として、7800 XTは約5%高速化しており、アーキテクチャの改善による全体的なパフォーマンスの向上はわずか10%程度にとどまっていると考えられます。

画像

1

11

AMD RDNA 3 について私たちが知っていることすべて
(画像提供:Tom's Hardware)

こちらでは、当社の完全なテストスイートから得られたワットあたりのパフォーマンス指標をご覧いただけます。AMDはワットあたりのパフォーマンスが最大50%向上すると主張しており、適切なGPUを選択すればその目標を達成できます…ただし、そのためには結果を厳選する必要があります。

例えば、7800 XTと6800 XTを比較すると、ワットあたりの性能は全体でわずか19~25%向上しています。7900 XTと6900 XTを比較した場合、向上幅は7%(1080pミディアム)から25%(4Kウルトラ)です。50%以上の向上を求めるなら、RX 6600とRX 7700 XTを4Kウルトラで比較するなど、具体的な比較を行う必要があります。ただし、RX 6600は4Kゲーミングカードとして設計されたわけではないため、この比較は妥当性に欠けます。

RDNA 3アーキテクチャがRDNA 2から後退したわけではありません。多くの人が期待していたような大きな前進には至らなかったのです。RDNA 2は、少なくともラスタライズゲームにおいては、Nvidiaの競合製品であるRTX 30シリーズよりもワットあたりのパフォーマンスが優れていましたが、プロセスノードの優位性も持ち合わせていました。Nvidiaは今回、RTX 40シリーズでプロセスノードと効率性においてAMDを凌駕し、ワットあたりのパフォーマンスが概ね30~60%向上しました。

AMD RDNA 3 アーキテクチャ: GPU チップレット

AMD サム・ナフジガー

AMDのEPYC CPUは、中央のI/Oチップレットを囲むように最大8個のCPUチップレットを搭載しています。(画像提供: AMD)

RDNA 3における最大のアーキテクチャアップデートの一つは、既に述べたようにGPUチップレットへの移行です。複数のチップレットへの移行には十分な理由がありますが、全体的なメリットは実装方法に大きく依存します。この第一世代のコンシューマー向けGPUチップレットにおいて、AMDは主にコスト削減に重点を置いているようです。

従来のGPU設計はモノリシックで、GPUの動作に必要なすべての機能が単一のシリコンチップから構成されていました。そのため、GPUには多くの冗長性が組み込まれており、チップは「ハーベスト」構成で販売されています。Navi 21は、最大80個のコンピュートユニット(CU)を搭載した6950 XT、6900 XT、6800 XT、そして6800で採用され、CUは最大60個まで搭載されていました。

興味深いことに、Navi 21ダイにも8つの32ビットメモリインターフェースが搭載されていますが、AMDはメモリチャネル数が少ないNavi 21の派生版をリリースしていません。Navi 22、Navi 23、Navi 24にもほぼ同様の傾向が見られます。メモリとキャッシュサイズは、オール・オア・ナッシング方式だったようです。メモリコントローラの歩留まりが非常に高かったのかもしれません。利用可能なメモリチャネルをすべて使用しなかった唯一のGPUは、RX 6700(非XT)のNavi 22で、フル192ビットインターフェースではなく160ビットインターフェースを採用していました。

Navi 31と32では、AMDはすべてのメモリインターフェースとInfinity Cacheブロックをメインダイから独立したダイに移設します。各MCDには、64ビットGDDR6インターフェースと16MBのInfinity Cacheチャンクが搭載されています。MCDには、メインMCDの上に別の16MBダイを配置する3Dチップスタッキングオプションがあるという噂がありましたが、もしその噂が真実であれば、AMDはそのような構成を実装したことはありませんでした。MCDはAMDのInfinity Fabricを介してGCDに接続されます。Infinity Fabricは、Ryzen CPUで使用されていた以前のバージョンからいくつかのアップデートが加えられています。

Infinity CacheとGDDR6メモリインターフェースを分離することには、明確な利点があります。トランジスタ密度はロジック回路で最も大きくスケールしますが、キャッシュではそれほど大きくありません。一方、アナログインターフェース(メモリコントローラ用など)は最もスケールしません。GCDとMCDの両方に搭載されているオンパッケージのInfinity Fabricリンクは依然としてダイスペースを必要としますが、故障したメモリコントローラやキャッシュブロックはもはや問題にはなりません。それらは単に破棄されるだけです。

一方、MCDはTSMCの既存のN6プロセスで製造されます。これは新しいN5ノードよりもコストが低く、ダイサイズもそれほど問題になりません。MCDはわずか38mm²なので、300mmのN6ウェハには約1,600個のMCDを配置できるスペースがあります。冗長性を持たせるよりも、不良チップをすべて廃棄する方がはるかに簡単です。

Navi 31とNavi 32のGCDは、前世代に比べてかなり小型化されており、より高価なN5ノードでは、これは非常に有利です。AMDは、大型のNavi 31 GCDでは1ウェーハあたり約180個、小型のNavi 32では約300個のGCDを依然として取得できます。また、演算ユニットやMCDの数が少ないチップを再利用して、下位層向け製品を開発することも可能です。そのため、Navi 31 GCDベースのカードが3種類、Navi 32 GCDベースのカードが2種類あります。

AMDがモノリシック設計に固執していたら、Navi 31は550mm角に近いウェハ面積で、1ウェハあたり100チップ程度になっていた可能性が高い。N5ウェハはN6の2倍以上になる可能性が高いため、コスト面ではNavi 31の方が有利になるのは明らかだ。また、少なくとも上位製品においては、AMDはキャッシュサイズに関してより柔軟な対応が可能になる。スタックキャッシュはMCDのみに搭載されているため、GCDは冷却装置に熱を放散できる。これは、3D VキャッシュがCPUで苦労していた点だ。

Tom's Hardware の最高のニュースと詳細なレビューをあなたの受信箱に直接お届けします。

AMD RDNA 3 アーキテクチャ: コア強化

AMD サム・ナフジガー

(画像提供:AMD)

AMD は、RDNA 3 のコア アーキテクチャに他の多くの変更を加える予定です。AMD は、再設計されたコンピューティング ユニットと最適化されたシェーダ アーキテクチャを備えると述べていますが、後者については詳細はあまり提供されていません。

演算ユニットは刷新され、NVIDIAがAmpereで行ったのと同様のアプローチで、RDNA 3 CUのFP32実行ユニット数が2倍になりました。これにより理論上の演算性能は大幅に向上し、AMDはRDNA 2 CUを80基、最大5,120基のGPUシェーダーを搭載していたのに対し、RDNA 3 CUを最大96基、それぞれが前世代機の2倍の性能を持つ6,144基のGPUシェーダーを搭載するようになりました。実用上のメリットが理論上の演算性能に直接比例するわけではないとしても、パフォーマンスは向上するはずです。

AMDのレイアクセラレータは、NVIDIAやIntelが提供するGPU処理クラスターあたりの性能に依然として遅れをとっています。テクスチャユニットをBVHトラバーサルハードウェアと共有することは、レイトレーシングハードウェアの第一世代では問題なかったかもしれませんが、第二世代ではさらに改善が必要でした。そして、それは実現しました…ただし、大きな差ではありません。

全体的に、RDNA 3 で行われた最適化と改善によりパフォーマンスは向上しましたが、AMD はレイ トレーシングと AI ハードウェアを後回しにして、純粋な GPU シェーダ コンピューティングを優先し続けています。

AMD RDNA 3 アーキテクチャ: AI アクセラレータ

AMDのサム・ナフジガー氏へのインタビューで、AMDのコンシューマー向けGPUにTensorコアまたは同等のコアが搭載されるかどうか尋ねました。簡単にまとめると、TensorコアはGPUシェーダーよりもはるかに限定された命令セットを持ち、生のスループットに最適化されたコンピューティングコアです。NvidiaのRTXカードには、DLSSなどの機械学習アプリケーション向けにTensorコアが搭載されています。Intelもこれに追随し、ArcアーキテクチャのXMXコア(Xe Matrix eXtensions)をXeSSなどのディープラーニングソフトウェアに使用しています。

AMDは自社のGPUにこのようなハードウェアを搭載することに抵抗はなく、Instinct MI250XとMI300データセンターGPUにはTensorコアが搭載されています。Tensorコアの恩恵を真に受けられるアプリケーションのほとんどは現在これらのGPUで実行されていますが、コンシューマー向けハードウェアでの活用の可能性はあるものの、AMDは今のところAIハードウェアの追加をほとんど見送っているようです。

AMDがRDNA 3で提供したのは、WMMA(Wave Matrix Multiply Accumulate)命令を搭載したAIアクセラレータと呼ばれるものです。これは既存のFP16実行リソースを再利用しているようで、理論上のスループットは変わりませんが、FP16演算を大量に実行する際の効率が向上します。これはStable Diffusionテストで確認されています。

AMD Radeon 7000 の電力要件

AMD サム・ナフジガー

(画像提供:AMD)

ムーアの法則は、トランジスタサイズを縮小することでトランジスタ密度を最適化することに主眼を置いてきました。現在も進歩は続いていますが、トランジスタ数が2年ごとに倍増するという時代はとうに過ぎ去っています。それに伴い、電力効率の改善も劇的に鈍化しています。

かつては、より小型のトランジスタを低電圧で高クロックで動作させ、消費電力を抑えることができました。しかし今では、同じ性能で30%の消費電力削減、あるいは同じ消費電力で15%の性能向上といった漠然とした説明しかされません。計算してみれば、この2つは等しくないことが分かります。

どの企業もこの副作用から逃れることはできませんが、次世代GPUの消費電力増加はあらゆる兆候から明らかです。例えば、PCIe 5.0電源インターフェースと、これをサポートする今後の電源ユニットは、16ピンコネクタ1つで最大600Wを供給できるため、業界全体がより高電力なGPUへと移行していく兆しとなっています。NvidiaのRTX 4090は、ベースモデルの消費電力を450Wにまで引き上げ、工場出荷時にオーバークロックされた一部のカードでは、16ピンコネクタを2つ搭載するほどでした。AMDは16ピンコネクタを完全に廃止することを選択しましたが、これは私たちにとっては大きな決断でした。

AMDのRDNA 3は、TBP(Total Board Power)をRDNA 2よりもわずかに高くしましたが、これは最高レベルのみでした。RX 7900 XTXのTBPは355Wで、6950 XTは335W、6900 XTは300Wでした。7900 XTでは315Wに低下していますが、下位モデルではTBPが前世代機よりも低いか同等であることが一般的です。興味深いことに、RX 7600でさえTBPは165Wなので、低消費電力パーツや低予算パーツは存在しません。

AMDのサム・ナフジガー氏がこの点について私たちと話してくれました。「これを推進しているのは、まさに物理学の基礎です」とナフジガー氏は説明しました。「ゲームとコンピューティング性能に対する需要は、どちらかといえば加速している一方で、基盤となるプロセス技術、そしてその改善率は劇的に鈍化しています。そのため、電力レベルは上昇し続けるでしょう。現在、私たちはこの曲線を相殺するために、大幅な効率改善に向けた数年にわたるロードマップを作成していますが、この傾向は確かに存在します。」

AMDはRDNA 3で、RDNA 2と同等の効率性を維持しながら、わずかに高いクロックを実現しました。AMDは長年にわたり、CPUとGPUの設計チームを「相互に作用させる」戦略を議論しており、両社の最高の技術を新しいCPUとGPUの設計に取り入れています。新しいRDNA 3 GPUコアは「本質的に電力効率が高い」とされていますが、ビジネス上の判断はまだ行われていません。

「パフォーマンスこそが重要です」とナフィツィガー氏は述べた。「しかし、たとえ当社の設計がより電力効率に優れていたとしても、競合他社が同じことをしている限り、電力レベルを上げないということではありません。ただ、競合他社は当社よりもはるかに高い電力レベルを上げなければならないというだけです。」

AMD Radeon 7000 の発売日

RDNA 3およびRX 7000シリーズGPUの最初のモデルは、7900 XTXおよびXTモデルとして2022年12月に登場しました。RX 7600は、Navi 33を搭載した2番目のRDNA 3ダイで、2023年5月に発売されました。ミドルレンジのRDNA 3カードは、RX 7800 XTとRX 7700 XTが発売された2023年9月まで登場しませんでした。また、2023年7月には中国で7900 GREが発売され、最終的には2024年2月に米国に登場しました。さらに、2024年1月には、ベースとなる非XTカードのVRAMを2倍にしたRX 7600 XTも登場しました。

AMDが既存のRDNA 2の在庫処分を待つ間、RDNA 3 GPUの一部のリリースが大幅に遅れた可能性があります。最初のカードが発売されてから2年近く経った今でも、RX 6000シリーズのGPUは市場に出回っており、価格的にも十分な選択肢となっています。例えば、RX 6700 XTと6750 XTは、新しいRX 7600/7600 XTよりも概ね優れた性能を発揮しています。

AMD Radeon 7000の価格

AMDのRX 7000シリーズグラフィックカードの価格は?初期モデルはNVIDIAに追随し、これまで以上に高価格設定となったようです。RX 7900 XTXは999ドル、下位モデルのRX 7900 XTは899ドルで発売されました。後者はそれほどお買い得とは言えず、その後200ドル値下がりして699ドルになりました。

一方、廉価版のRX 7600は、既存のRX 6650 XTとほぼ同等の性能で、実質的に同じ価格帯に押し上げられました。前述の通り、RX 7800 XTと7700 XTはNavi 31モデルの発売から9ヶ月遅れて登場しました。これは、既存のNavi 21 GPUが市場から姿を消すのを待つためだったと考えられます。価格は旧型GPUの実売価格とほぼ同じで、それぞれ499ドルと449ドルでしたが、AMDは発売から6ヶ月後にRX 7700 XTを399ドルに値下げしました。

価格設定の一部は、前世代のGPUベースの仮想通貨マイニングの影響を受けているようです。イーサリアムのマイニングは終了したため、現在GPUは仮想通貨にはあまり使われていません(利益は底をついています)。しかし、前世代のGPUが公式希望小売価格の2倍で販売されることが多かったことを考えると、AMDとNvidiaは新しい価格設定に過度にこだわっていたように思われます。また、転売屋が価格や入手性にほとんど影響を与えなかったため、少なくとも少しは明るい兆しがあります。

ジャレッド・ウォルトンは、Tom's Hardwareのシニアエディターで、GPU全般を専門としています。2004年からテクノロジージャーナリストとして活躍し、AnandTech、Maximum PC、PC Gamerなどで執筆活動を行っています。初代S3 Virgeの「3Dデセラレータ」から最新のGPUまで、ジャレッドは最新のグラフィックストレンドを常に把握しており、ゲームパフォーマンスに関する質問は彼にお任せください。