40
AMD Radeon RX 480 8GB レビュー

ポラリス10号のご紹介

6ヶ月前、AMDは次世代GPUの機能を発表し始めました。まず、HDMI 2.0bとDisplayPort 1.3 HBR3、FreeSync over HDMI、HDR対応パイプラインをサポートするように刷新されたディスプレイコントローラーが発表されました。その後数週間で、他の情報も少しずつ明らかになり、メインストリームのデスクトップ市場でシェアを奪還し、薄型軽量のフォームファクターでコンソールクラスのパフォーマンスを提供するモバイルソリューションを提供するために意図的に設計された、2つの異なるGPUが発売されることが示唆されました。

後者の設計には、128ビットのメモリバスと4Kビデオのエンコード/デコードアクセラレーションに対応したAMDのコンピュートユニット16基が搭載されています。これはまだ発売されていません。現在販売されているRadeon RX 480は、より大型のPolaris 10設計をベースにしています。しかし、Nvidiaの153億トランジスタGP100プロセッサのような大型さではありません。むしろ、このGPUは今日のハイエンドVRヘッドセットを駆動できる程度の複雑さを備えており、少なくともAMDのRadeon R9 290やNvidiaのGeForce GTX 970と同等の性能を備えています。

ミッドレンジの性能だけでは、特にGP104がハイエンドの常識を覆してから1ヶ月も経っていない今、誰もが驚くようなことはないだろう。しかし、Radeon RX 480を同程度の高速なマザーボードよりも大幅に低価格に設定し、消費電力を150Wに抑えることで、AMDはVRをより多くのゲーマーに普及させようとしている(600ドルや800ドルのHMDを販売しているメーカーもこの動きに追随してくれればの話だが)。

Radeon RX 480には2つのバージョンが登場すると予想されています。7Gbpsで動作する4GBオンボードGDDR5を搭載した200ドルモデルと、8Gbpsで動作する8GB GDDR5を搭載した240ドルモデルです。もちろん、手元にあるのは8GBモデルです。

ポラリス10の内部

Polaris 10は、230mm²のダイに57億個のトランジスタを搭載しています。Hawaiiの438mm²のダイに62億個のトランジスタを搭載しているのと比較してみてください。ベンチマークページをご覧いただければお分かりいただけるように、RX 480は通常、R9 290と390の間に位置し、トランジスタ数は少なく、消費電力は約55%です。その多くは、GlobalFoundriesの14nm FinFETプロセスによるもので、AMDは、このプロセスが28nmノードのプレーナートランジスタよりも基本的な性能と消費電力の面で優れていると評価しています。FinFETは、どの電力レベルにおいても、より高いクロック周波数を実現します。選択された周波数において、14nmデバイスは消費電力を抑えます。Polarisでは、AMDは両方のメリットを活かすことでクロック周波数の向上と消費電力の削減を実現しています。そのため、150W の上限で、Hawaii などのリソースが豊富な GPU よりも優れたパフォーマンスを発揮できます (ただし、当社の測定では、RX 480 の TDP が少し高いことが示されています)。

新しいコードネームにもかかわらず、Polaris 10はAMDのGraphics Core Nextアーキテクチャの第4世代実装に基づいています。この点を踏まえると、GCNに既に馴染みのあるほとんどの愛好家はPolarisの設計の構成要素を理解できるでしょう。そのため、設計のステップを追うのは非常に簡単です。

仕様

AMD Radeon RX 480

AMD Radeon R9 390

AMD Radeon R9 290


詳細: 最高のPCビルド

Tom's Hardware の最高のニュースと詳細なレビューをあなたの受信箱に直接お届けします。


詳細: PCの組み立て方


詳細: すべてのPCビルドコンテンツ

グラフィックスキューをシェーダーエンジンにディスパッチする役割は、依然として単一のグラフィックス・コマンド・プロセッサ(GCP)が担っています。同様に、コンピューティングキューの処理を担う非同期コンピューティングエンジン(ACC)も同様です。AMDによると、コマンド処理ロジックは8つではなく4つのACEで構成され、優先順位付けされたキュー、時間的/空間的リソース管理、CPUカーネルモードドライバーのスケジューリングタスクのオフロードのために2つのハードウェア・スケジューラ・ユニットが搭載されています。これらは厳密には独立した新しいブロックではなく、既存のパイプラインで実行できるオプションのモードです。AMDのグラフィックス担当シニアテクノロジーマネージャーであるDave Nalasco氏が、その目的について説明しています。

HWS (ハードウェア・ワークグループ/ウェーブフロント・スケジューラ)は、基本的にディスパッチ・コントローラなしで構成されたACEパイプラインです。その役割は、利用可能なハードウェア・キュー・スロット上でユーザー/ドライバー・キューのスケジューリングを処理することでCPUの負荷を軽減することです。マイクロコード・プログラマブル・プロセッサであり、様々なスケジューリング・ポリシーを実装できます。Polarisでは、クイック・レスポンス・キューとCU予約機能をHWSで実装し、これらの変更をドライバー更新によって第3世代GCN製品に移植することができました

クイックレスポンスキューを使用すると、開発者は他のプロセスを完全にプリエンプトすることなく、非同期で実行される特定のタスクを優先できます。この機能に関するDaveのブログ記事を見逃した場合は、こちらでご覧いただけます。要するに、AMDが強調したいのは柔軟性です。そのアーキテクチャは、VRのようなアプリケーションにおいて非常に重要な、使用率の向上とレイテンシの最小化を複数のアプローチで実現します。

我々がよく知るコンピュートユニットは、IEEE 754-2008準拠のシェーダー64個で構成され、4つのベクターユニット、1つのスカラーユニット、そして16個のテクスチャフェッチロード/ストアユニットに分割されています。各CUは、4つのテクスチャユニット、16KBのL1キャッシュ、64KBのローカルデータシェア、そしてベクターユニットとスカラーユニット用のレジスタ空間もホストしています。AMDによると、CUの効率性を向上させるため、ネイティブFP16(およびInt16)サポートの追加、キャッシュアクセスの調整、命令プリフェッチの改善など、いくつかの調整が行われたとのことです。これらの変更により、第2世代GCNアーキテクチャをベースにしたRadeon R9 290のHawaii GPUと比較して、CUあたり最大15%のパフォーマンス向上が見込まれています。

9つのCUがシェーダエンジンを構成しており、Polaris 10は4つのSEを搭載しています。これは、アーキテクチャの最大値とされる数と一致しています。計算すると(64個のシェーダ × 9個のCU × 4個のSE)、2304個のストリームプロセッサと144個のテクスチャユニットとなります。

各シェーダーエンジンはジオメトリエンジンに関連付けられており、AMDによると、スキャン変換前にピクセルにラスタライズできないプリミティブを破棄するプリミティブ破棄アクセラレータを追加することで、スループットが向上しています。これはグラフィックスパイプラインのラスタライズ前段階の自動機能であり、Polarisでは全く新しい機能です。インスタンス化されたジオメトリ用のインデックスキャッシュも存在しますが、そのサイズやインスタンス化使用時の影響の大きさは不明です。

Hawaiiと同様に、Polaris 10はクロックサイクルあたり最大4つのプリミティブを処理できます。しかし、Hawaii/Grenadaベースの最速GPUは最大1050MHz(R9 390Xの場合)で動作するのに対し、AMDはRadeon RX 480をベースクロックレート1120MHz、ブーストレート1266MHzまで引き上げ、オンダイリソースの損失の一部を高周波数化することで補っています。Radeon R9 290Xは単精度浮動小数点演算性能が5.6TFLOPSでしたが、RX 480はブーストレート仕様で最大5.8TFLOPSに達します。

1266MHzという数字はどれほど現実的なのでしょうか?ハワイでは、高温になった際にAMDのクロック周波数仕様を維持するのに大きな問題を抱えていました。そこで、Polarisでも同じ問題が発生しないことを確認したかったのです。Metro : Last Light Reduxの内蔵ベンチマークを10回ループさせ、GPU-Zで周波数を記録したところ、以下のグラフが得られました。

この折れ線グラフの最低点と最高点の間はちょうど148MHzです。下限は1118MHz、上限は1265MHzです。AMDはベースとブーストの定格をほぼ正確に設定していると言えるでしょう。ただし、その間の周波数は常に調整されています。少なくとも平均1208MHzは、下限よりも上限に近いと言えるでしょう。

Hawaii SEとFiji SEにはそれぞれ4つのレンダリングバックエンドがあり、クロックあたり16ピクセル(GPU全体では64ピクセル)のレンダリングが可能です。Polaris 10ではその数字が半分になります。SEごとに2つのレンダリングバックエンドがあり、それぞれ4つのROPがあり、クロックあたり合計32ピクセルです。これは、AMDがRX 480で打ち負かす必要のあるHawaiiベースのRadeon R9 290と比較すると大幅な削減です。さらに悪いことに、Polaris 10は256ビットのメモリバスを採用しており、Hawaiiの合計512ビットパスよりもはるかに狭いです。Radeon RX 480の4GBバージョンには7Gb/s GDDR5が含まれており、224GB/sの帯域幅が可能になります。一方、今日テストしている8GBモデルは8Gb/sのメモリを使用し、スループットを256GB/sに向上させます。それでも、R9 290の320GB/sよりはるかに低いです。

この不足分は、バスを介した情報転送量を削減するデルタカラー圧縮の改良によって補われています。AMDは現在、NVIDIAのPascalアーキテクチャに類似した2/4/8:1ロスレス比をサポートしています。Polaris 10は、Fijiで初めて搭載された2MBの大容量L2キャッシュの恩恵も受けています。これによりGDDR5への接続回数が減り、GPUの広いバス幅と高いデータレートへの依存度がさらに低減されます。

それでも、GPUのバックエンドをスリム化することで、解像度とアンチエイリアシングの使用率が高まるにつれて、パフォーマンスに何らかの影響が出ることは間違いありません。負荷が増大した際にPolarisとHawaiiを比較してみたかったので、 Grand Theft Auto Vを1920x1080の控えめな解像度、非常に高いディテール設定で起動し、その後アンチエイリアシングを強化していきました。

確かに、MSAAをオフから2倍、そして4倍へと切り替えていくと、Radeon RX 480の平均フレームレートはR9 390よりもはるかに速く低下していることがわかります。AAを無効にした状態では、480は97.3fps、390は90.4fpsを達成しています。しかし、最終的にAMDのRadeon RX 480は57.5fpsまで低下し、390は平均62.9fpsにまで低下しています。


詳細: 最高のグラフィックカード


詳細: デスクトップ GPU パフォーマンス階層表

クリス・アンジェリーニは、Tom's Hardware USの名誉編集者です。ハードウェアレビューの編集を担当し、注目度の高いCPUやGPUの発表を取り上げています。