GP102に会う
編集者注: 記事を更新し、7 ページと 8 ページに電力、熱、ノイズの測定値を含めました。また、それらの測定値を反映するように結論を編集しました (10 ページを参照)。
ベンチマークが1つも公開される前に、NVIDIAは数ヶ月で3つ目のPascalベースGPUをリリースしたことで賞賛を浴びる一方で、フラッグシップモデルの価格を値上げしたことで批判を浴びました。この値上げは、IntelがCore i7-6950Xを前代未聞の1700ドル超で発売した際に痛手となりました。しかし、重要なのは、最高の製品を購入する人々は、忍び寄る贅沢税の影響を受けないということです。そして、実際にPCで収益を上げている人々は、収入を加速させるハードウェアに喜んでプレミアム価格を支払っています。
これらすべてのおかげで、Titan Xを使う時間が少し楽になったように思います。後から価値を気にする必要はありません。GeForce GTX 1080より70%高い価格で、CUDAコアが40%増加し、メモリ帯域幅が50%向上します。カードを受け取る前から、パフォーマンスが価格に比例しないことは分かっていました。それでも、ベンチマークを実行するのが待ちきれませんでした。Titan Xは4Kでのフレームレートを、1080では最高画質のゲームには不十分だと決めつけるような、いわゆる「アームチェアクォーターバック」を納得させるほど向上させるのでしょうか?それを知る方法は一つしかありません。
GP102: GP104に似ているが、もっと大きい
NvidiaはGeForce GTX 1080で、GP104(ハイエンドPascal)プロセッサを発表しました。このGPUは、GeForce GTX 980で最後に搭載されたGM204(ハイエンドMaxwell)の後継機です。しかし、Pascalアーキテクチャは16nm FinFET製造と高速GDDR5Xメモリの採用に合わせてタイミングが調整されたため、結果としてGTX 1080は、GM200(超ハイエンドMaxwell)を搭載したGTX 980 TiとTitan Xよりも平均フレームレートが30%以上も向上しました。153億個のトランジスタを搭載したGP100(超ハイエンドPascal)はコンピューティング指向で、デスクトップ向けではないことは周知の事実だったため、次のステップアップは容易に忘れ去られました。
今、初めて、Nvidia の最高級プロセッサと GP104 に囲まれた、一種の「中間 GPU」が登場しました。これは GP102 と呼ばれ、アーキテクチャ的には GP104 に似ていますが、サイズが大きいだけです。4 つのグラフィック処理クラスターが 6 つになります。つまり、20 のストリーミング マルチプロセッサが 30 になります。また、SM あたり 128 の FP32 CUDA コアを備えた GP102 は、最大 3840 のプログラム可能な構成要素を扱います。ただし、GP102 は非常に複雑です (120 億個のトランジスタで構成されています)。歩留まりを向上させる手段として、Nvidia は Titan X のプロセッサの SM のうち 2 つを無効にし、ボードの CUDA コア数を 3584 に減らしました。また、各 SM は 8 つのテクスチャ ユニットもホストするため、2 つをオフにすると 224 のテクスチャ ユニットが有効になります。
Titan Xの仕様では、ベースクロックは1417MHz、GPU Boost時の典型的な周波数は1531MHz程度とされています。これにより、このカードのFP32レートは10.1TFLOPS以上となり、GeForce GTX 1080よりも約23%高い数値となります。
Tom's Hardware の最高のニュースと詳細なレビューをあなたの受信箱に直接お届けします。
GP104は、特に4K解像度において、さらに広いメモリインターフェースがあれば恩恵を受けたであろうことは間違いありません。しかし、GP102のシェーディング/テクスチャリング能力の向上は、間違いなく何らかのバランス調整を必要とします。そのため、プロセッサのバックエンドは12個の32ビットメモリコントローラに拡張され、各コントローラは(GP104と同様に)8個のROPと256KBのL2メモリにバインドされ、合計96個のROPと3MBの共有キャッシュを備えています。これにより384ビットのメモリパスが確保され、NVIDIAはGTX 1080と同じ10Gb/s GDDR5Xメモリを12GB搭載しています。
このカードの理論上のメモリ帯域幅は 480 GB/秒 (1080 の 320 GB/秒と比較して 50% 増加) ですが、Pascal アーキテクチャのデルタ カラー圧縮の改善を考慮すると、実効スループットはさらに高くなるはずです。
AMDが1年以上前にHBMの多くのメリットを示していたにもかかわらず、なぜGDDR5由来の技術を使い続けているのでしょうか?GP102の設計段階では、NvidiaはHBM2の供給がどうなるか確信が持てず、安全策としてGDDR5Xベースのサブシステムを採用したとしか考えられません。GP100は、同社のラインナップの中でHBM2を搭載する唯一のGPUです。
スワイプして水平にスクロールします
グラフィックプロセッサ | タイタンX(GP102) | GeForce GTX 1080 (GP104) | タイタンX(GM100) |
---|---|---|---|
SMS | 28 | 20 | 24 |
CUDAコア | 3584 | 2560 | 3072 |
ベースクロック | 1417 MHz | 1607MHz | 1000MHz |
GPUブーストクロック | 1531MHz | 1733 MHz | 1075MHz |
GFLOP(ベースクロック) | 10,157 | 8228 | 6144 |
テクスチャユニット | 224 | 160 | 192 |
テクセル充填率 | 342.9 GT/秒 | 277.3 GT/秒 | 192 GT/秒 |
メモリデータレート | 10 Gbps | 10 Gbps | 7 Gb/秒 |
メモリ帯域幅 | 480 GB/秒 | 320 GB/秒 | 336.5 GB/秒 |
ROP | 96 | 64 | 96 |
L2キャッシュ | 3MB | 2MB | 3MB |
TDP | 250W | 180W | 250W |
トランジスタ | 120億 | 72億 | 80億 |
ダイサイズ | 471 mm² | 314 mm² | 601 mm² |
プロセスノード | 16nm | 16nm | 28nm |
Nvidiaがどうやら土壇場でTitan XをGeForceファミリーから距離を置くことを選んだのは興味深い。geforce.comのTitan Xランディングページでは、これを「究極のグラフィックカード」と呼んでいる。「究極のゲーミンググラフィックカード」ではなく、「究極。以上」だ。もちろん、大型化されたGP104を扱っている以上、Titan Xはゲーミングにも適しているはずだ。
しかし、スタンフォード大学主催のAIミートアップでTitan Xを発表するという同社の決定は、今回同社がディープラーニングに注力していることを示しています。そのため、GP104(ひいてはGP102)のFP16とFP64の速度は悲惨なほど遅いものの、両プロセッサともINT8を4:1でサポートしており、Titan Xのベース周波数では40.6 TOPSを実現しています。
詳細: 最高のグラフィックカード
詳細: デスクトップ GPU パフォーマンス階層表
詳細: すべてのグラフィックコンテンツ
クリス・アンジェリーニは、Tom's Hardware USの名誉編集者です。ハードウェアレビューの編集を担当し、注目度の高いCPUやGPUの発表を取り上げています。