ネタバレ注意:NVIDIAは、GeForce GTX 1080 TiとTitan Xpにより、超ハイエンドグラフィックス市場のトップの座を維持する見込みです。しかしAMDは、待望のVega 10アーキテクチャが現在の差を大きく縮め、多くのマニアが購入できる価格帯で競争できる体制を整えると主張しています。
話はさらに面白くなる。AMDは、自社製品群に含まれるPolarisベースのグラフィックカードが暗号通貨マイナーに買い占められ、ゲーマーにはほとんど手に入らない状況に気づき、「Radeon Packs」というコンセプトを考案した。このパックは、PCビルダーが新しいグラフィックカードと同時に特定のコンポーネントを購入すると割引が受けられるというもの。
パックは3種類用意されています。Radeon Aqua Pack(700ドル)、Radeon Black Pack(600ドル)、そしてRadeon Red Pack(500ドル)です。もちろん、500ドル出せば標準のRadeon RX Vega 64も購入できます。しかし、過去の経験から未来を予測するなら、これらのパックはすぐに売り切れてしまうでしょう(おそらくAMDが提示している価格では売れないでしょう)。
2種類の空冷カードのうち1枚に600ドルを費やすと、無料ゲーム2本(米国では『Wolfenstein II』と『 Prey』)に加え、SamsungのFreeSync対応CF791を200ドル割引で、Ryzen 7とマザーボードの組み合わせを100ドル割引で購入できるオプションが付きます。割引を受けるか受けないかはあなた次第です。どちらにしても100ドルの追加料金がかかります。
AMDのAqua Packは700ドルに値上がりし、水冷カードに加え、各種割引やゲームバンドルが付属します。一方、500ドルのRed PackにはRadeon RX Vega 56が搭載されます。
Radeonパックは、後で使えるクーポンではありません。お好みのカードに追加料金を支払うことで、ゲーミング向けコンポーネントをお得に購入できるというメリットがあります。これは、可変リフレッシュレートモニター、Ryzen 7搭載プラットフォーム、無料ゲームに興味のない暗号通貨マイナーの購買意欲を削ぐためのものです。しかし、マイナーがミッドレンジのRadeon RXカードにどれだけの追加料金を払う意思があるかを考えると、Vegaのハッシュレートがいつか「投資」に値すると判断されたとしても、100ドルや200ドルのプレミアムが、マイナーコミュニティがRadeonパックへの追加投資を躊躇させるとは考えられません。
Tom's Hardware の最高のニュースと詳細なレビューをあなたの受信箱に直接お届けします。
AMDは当初、Radeon Packの提供を8月までと発表していました。しかし、その後、担当者は提供期間を延長することを明らかにしました。アドインボードのパートナー各社は、第3四半期末または第4四半期初めにかけて、AMDのリファレンスデザインを独自の解釈で採用すると予想されます。
Radeon RX Vega 64の仕様:誰もが満足できるもの
Radeon Vega Frontier Editionはすでに発売されているため、AMDの非公開説明会に先立ち、ゲーミング向けモデルがどのようなものになるかはある程度予想できました。Radeon R9 Fury XのFijiプロセッサと同様に、Radeon RX Vega 64は4つのシェーダーエンジンを搭載し、それぞれに独自のジオメトリプロセッサとラスタライザーが搭載されています。
Fijiと同様に、シェーダーエンジンごとに16個のコンピュートユニット(CU)があり、各CUには64個のストリームプロセッサと4個のテクスチャユニットが搭載されています。これらを合計すると、4096個のストリームプロセッサと256個のテクスチャユニットになります。
ただし、クロックレートは大幅に向上しています。Fijiの最高クロックレートは1050MHzでしたが、GlobalFoundriesの14nm FinFET LPPプロセスと高周波数向けの最適化により、Radeon RX Vega 64のVega 10 GPUはベースクロックレート1247MHz、ブーストレート1546MHzで動作可能です。AMDのFP32のピーククロック仕様である12.66TFLOPSは、当然ながらこの最高周波数に基づいています。ただし、計算では通常、保証されたベースクロックを使用しています。それでも10.2TFLOPSは、Radeon R9 Fury Xと比べて約20%の向上となります。
スワイプして水平にスクロールします
ヘッダーセル - 列 0 | Radeon RX Vega 64 液冷 | Radeon RX Vega 64 | Radeon RX Vega 56 |
---|---|---|---|
次世代CU | 64 | 64 | 56 |
ストリームプロセッサ | 4096 | 4096 | 3584 |
テクスチャユニット | 256 | 256 | 224 |
ROP | 64 | 64 | 64 |
ベースクロックレート | 1406MHz | 1247MHz | 1156MHz |
ブーストクロックレート | 1677MHz | 1546MHz | 1471MHz |
メモリ | 8GB HBM2 | 8GB HBM2 | 8GB HBM2 |
メモリ帯域幅 | 484 GB/秒 | 484 GB/秒 | 410 GB/秒 |
ピーク FP32 パフォーマンス。 | 13.7 TFLOPS | 12.66 TFLOPS | 10.5 TFLOPS |
ピーク FP16 パフォーマンス。 | 27.5 TFLOPS | 25.3 TFLOPS | 21テラフロップス |
ピーク FP64 パフォーマンス。 | 856 MFLOPS | 791 MFLOPS | 656 MFLOPS |
ボード電源 | 345W | 295W | 210W |
価格 | 700ドル | 500ドル | 400ドル |
水冷モデルでは、ベースクロックは1406MHz、ブーストクロックは最大1677MHzまで向上します。これはベースクロックが約13%、ブースト周波数が約8%向上し、AMDが規定するピークFP32レートは13.7TFLOPSに達します。ただし、閉ループ水冷クーラーには200ドル以上の追加料金がかかります。ボードの消費電力は、Radeon RX Vega 64の295WからLiquid Cooled Editionの345Wへと上昇し、17%という不釣り合いな増加となっています。どちらの数値も、VegaのターゲットにはなっていないNvidiaのGeForce GTX 1080 Tiの250Wを上回っています。
Vega 10の各シェーダーエンジンは、クロックサイクルあたり16ピクセルのレンダリングが可能な4つのレンダリングバックエンドを備え、64個のROPを生成します。これらのレンダリングバックエンドは、既にご存知の通り、L2のクライアントとなります。L2のサイズは現在4MBですが、Fijiには2MBのL2容量が搭載されています(これはHawaiiの1MB L2の倍です)。理想的には、これはGPUがHBM2にアクセスする頻度を減らし、Vega 10の外部帯域幅への依存を減らすことを意味します。Vega 10のクロックレートはFijiよりも最大約60%高くなりますが、メモリ帯域幅は実際には28GB/s低下するため、キャッシュ容量を増やすことでボトルネックの回避に役立ちます。
ちなみに、AMDのマイク・マンター氏によると、Vega 10に搭載されているSRAMの総容量は45MB以上だそうです。すごいですね。125億個のトランジスタを486平方ミリメートルのチップに搭載しているのも納得です。これは、さらに大きなダイに搭載されているNVIDIAのGP102よりも多くのトランジスタを搭載していることになります。
HBM2の採用により、AMDはインターポーザー上のメモリスタック数をFijiと比較して半分に削減し、合計4096ビットバスを2048ビットに削減しました。Radeon R9 Fury Xが4GBという上限を背負っていたのに対し、RX Vega 64は4段スタックで8GBという余裕のメモリ容量を提供します(AMDのFrontier Editionカードは16GBを誇ります)。1.89 Gb/sという驚異的なデータレートにより、484 GB/sという帯域幅が実現され、これはGeForce GTX 1080 Tiが11 Gb/s GDDR5Xで実現する帯域幅に匹敵します。
新しさを見極める
Fijiとの類似点が多数あるにもかかわらず、AMDはVega 10は動作周波数、消費電力、機能強化において向上していると主張しています。トランジスタ数が40%増加し、ピークブーストクロックが約50%向上していることが、この主張を裏付けているように思われます。繰り返しになりますが、Vegaのアーキテクチャについては過去のテックデーのまとめ記事で多く取り上げています。高帯域幅キャッシュコントローラー、次世代コンピューティングユニット、プログラマブルジオメトリパイプライン、次世代ピクセルエンジンの詳細については、「AMDがVegaアーキテクチャを予告:200以上の新機能、2017年前半にリリース」をご覧ください。しかし、同社のアーキテクトはいくつかの新情報も公開しました。
例えば、前回の記事では、HBCCのハードウェア支援型メモリ管理機能について触れました。この機能により、Vegaは複数のプログラム可能な手法を用いて、きめ細かなページ移動が可能になります。コントローラはデータの読み込み要求を受け取り、DMA転送によってデータを取得します。その間、GPUは別のスレッドに切り替え、ストールすることなく処理を継続します。コントローラは要求に応じてデータを取得するだけでなく、予測的にデータを読み出すこともできます。HBM内の情報は、インクルーシブキャッシュのようにシステムメモリに複製することも、HBCCが1つのコピーだけを保持してメモリ容量を節約することもできます。
画像
1
の
2

AMDは、Vegaのメモリ階層を、最小かつ最高速のレジスタからシステムDRAMまで、HBCCがアドレス指定できる範囲まで図解することで、これらの概念を詳しく説明しました。デフォルトでは、このアーキテクチャは排他キャッシュモードに設定されており、HBCCセグメントはカードのHBM2を超えて拡張されます。しかし、大容量のストレージを備えたシステムでは、オンパッケージメモリをDRAMまたはNVRAMを包括的にバックアップするキャッシュとして使用できます。この実用的な重要性は、排他モデルを使用して27GBを超えるリソースにリアルタイムでアクセスするデモで示されました。これは、競合ハードウェアでは実行できないとされるワークロードです。
AMDは2017年初頭にVegaの次世代コンピューティングユニットに関するアップデートを実施し、Rapid Packed Mathのサポートを正式に発表しました。これは、以前のPlayStation 4 Proの詳細な分析ではVegaが新しいデータ型に対応することが示唆されていたにもかかわらずです。私たちの報道から:
「…NCUあたり64個のシェーダと、1サイクルあたり最大2回の浮動小数点演算で、1クロックあたり最大128回の32ビット演算が可能になります。パックドFP16演算を使用すると、この数値は1クロックあたり256回の16ビット演算になります。AMDは、1クロックあたり最大512回の8ビット演算が可能だとさえ主張しています。倍精度となると話は別ですが、AMDはターゲット市場に基づいてFP64のレートを設定していることを認めることに抵抗がないようです。」
Fijiと同様に、Vega 10のFP64レートは単精度仕様の1/16であることが確認されました。これもゲームに特化したアーキテクチャであり、HPC分野では全く採用されません。
しかし、VegaのNCUはIEEE準拠のFP16および整数演算を2倍の速度で処理できるだけでなく、16ビット(または16ビットと32ビットの混合)オペランドを32ビットレジスタにネイティブに累算する混合精度演算もサポートしています。もちろん、この機能を活用するには開発者のサポートが必要なので、発売時には明確なメリットとして現れることはないでしょう。
同様に、AMDとNVIDIAはどちらも、自社の設計が将来を見据えた機能を備えていると語るのが好きです。たとえ、それらを活用するアプリがまだ存在しないとしてもです。しかし、開発者にとっては、現在のAPIを超えるハードウェアへのアクセスは実験を容易にします。Vega 10は、DirectX 12のサポートにおいてPolarisやNVIDIAのPascalを上回っています。
7か月前のアーキテクチャに関するプレビュー記事で触れたように、Vega 10は従来のジオメトリパイプラインを、頂点シェーディングとプリミティブシェーディングのステップを組み合わせた新しいプリミティブシェーダーステージで補完します。プリミティブシェーダーの機能は、DirectXの頂点シェーダー、ハルシェーダー、ドメインシェーダー、ジオメトリシェーダーステージの機能の多くを含みますが、より高いパフォーマンスと柔軟性が期待できます。AMDの最新アップデートでは、プリミティブシェーダーを使用したジオメトリパイプラインのピーク時のプリミティブ破棄率を示すピークパフォーマンスデータが追加されました。確かに、これはゲーマーがメリットを実感するまでに開発者が精力的に取り組まなければならない機能なので、その潜在能力はすぐには明らかにならないでしょう。
Vega 10の改良されたディスプレイエンジンも同様です。しかし、2台の4K/120Hzディスプレイ、または3台のHDR対応4K/60Hzモニターをサポートできるようになることを心待ちにしています。AMDのRadeon RX Vegaモデル3機種すべてに、3つのDisplayPort 1.4対応出力とHDMI 2.0コネクタが搭載され、すべてHDCP 2.2とFreeSyncをサポートしています。
AMDはVega 10の仮想化とセキュリティ機能についても詳しく説明し、ハードウェア検証済みのブートとファームウェアを実現するAMDセキュアプロセッサの統合も発表しました。Trusted Memory Zoneのサポートにより、理論上はUltra HD Blu-rayディスクなどの保護されたコンテンツの再生が可能になるはずですが、対応ソフトウェアも必要です。現在、CyberlinkのPowerDVD 17は、HD Graphics 630またはIris Plus Graphics 640を搭載したKaby Lakeベースのプロセッサでのみ動作します。
興味深い補足情報として、1月に発表したピクセルエンジンのDraw Stream Binning Rasterizerは、Radeon Vega Frontier Editionカードでは現在無効になっているようです。しかし、AMDによると、間もなく発売されるRadeon Vega RXではこの機能が有効になるとのこと。この機能の有効化に奇跡的な変化は期待できません。AMDはDSBR有効時のパフォーマンスを確かに予測しています。しかし、おそらく最良のシナリオを示したスライドでは、帯域幅が最大30%節約できることが示されています。
待ち時間は続く
技術的な詳細はさておき、Vega 10は高密度で物理的に大きく、トランジスタ数とダイサイズでNvidiaのGP102を上回っていることが分かっています。RX Vega 64の公式ボード電力仕様が295Wから345Wであることからも、熱くなることは間違いありません。また、AMD自身のガイダンスでは、このカードは1年以上前のGeForce GTX 1080と競合するとされています。間違いなく、AMDが競合他社との差を縮めているのを見て興奮していますし、AMDの熱狂的なファンがRadeon RX Vegaがついに実現した(まあ、ほぼですが)のを喜んでいることも分かっています。しかし、グラフィックのアップグレードに少なくとも500ドル費やすべき場所を推奨する段階になったら、これらのカードがどこかで勝つことを期待したいところです。相対的な価値が、今ラウンドで同社にとって最大の希望となる可能性があります。待ち遠しいのはもうすぐです。8月14日はもうすぐです。
クリス・アンジェリーニは、Tom's Hardware USの名誉編集者です。ハードウェアレビューの編集を担当し、注目度の高いCPUやGPUの発表を取り上げています。