GM204のご紹介: 新しいMaxwellがやって来ました
NVIDIAは約7ヶ月前、ミッドレンジのGeForce GTX 750および750 Tiに、コードネーム「Maxwell」と呼ばれる最新のグラフィックアーキテクチャを搭載しました。これらのカードはフラッグシップゲーミングマシンほどの高性能ではありませんが、PCグラフィックス分野にかつてないほどの電力効率をもたらします。Maxwellを搭載したGeForce GTX 750 Tiは、ワットあたりのパフォーマンスに優れ、65Wの熱容量上限を持つグラフィックカードと同等のフレームレートを実現します。
NVIDIAは、Tegraファミリーで採用したのと同じ技術革新をGeForceにも適用することで、厳しい電力予算の中でGPUの各パーツの性能を最大限に引き出しました。しかし、マニアが求めるのは効率性だけではありません。何よりも重要なのは、圧倒的なスピードです。そして私たちは、GeForce GTX 750 Tiが登場して以来、パフォーマンス重視のMaxwell実装を待ち望んできました。さて、NVIDIAが本日発表するのは何でしょう?GeForce GTX 980と970です。ゲームをするなら、まさに待ち望んでいたMaxwellと言えるでしょう。
これらのカードに搭載されているGM204 GPUは、大まかに見ると、GeForce GTX 750 TiのGM107を適切にスケールアップしたような構成です。GM107と同様に、ストリーミングマルチプロセッサ(SMM)ごとに4つのパーティションブロックを活用します。各SMMは、128個のCUDAコア、32個のロード/ストアユニット、8個のテクスチャユニット、そして1個のPolyMorphエンジンをホストします。2MBのL2キャッシュはGPU全体で共有されます。しかし、明らかな違いはSMMの数です。GM107は5個ですが、GeForce GTX 980のGM204はなんと16個も搭載しています。つまり、合計2048個のCUDAコア、512個のロード/ストアユニット、128個のテクスチャユニット、そして16個のPolyMorphエンジンということになります。当然ながら、2 番目に速い GeForce GTX 970 ではこれらのリソースの一部が無効になっており、合計で 13 個の SMM、1664 個の CUDA コア、416 個のロード/ストア ユニット、104 個のテクスチャ ユニット、および 13 個の PolyMorph エンジンとなっています。
GM204はGM107と比べて多くの点で優れていますが、多くの点で優れています。例えば、GeForce GTX 980の各SMMは、演算タスク用の共有アドレス空間を96KBに拡張しており、750 Tiの64KBから増加しています。新しいGPUのL1/テクスチャキャッシュサイズは、CUDAコア処理ブロックのペアあたり24KB(SMMあたり48KB)となり、GM107の2倍になっています。
GM107とは異なり、GM204 GPUは1つではなく4つのグラフィックス・プロセッサ・クラスター(GPC)を搭載しています。つまり、ラスターエンジンの数が4倍になります。もちろん、ハイエンドグラフィックスカードは、これだけのデータスループットを処理するために、より強力なバックエンドを必要とします。GeForce GTX 980は、1クロックあたり16回のフルカラーROP処理(合計64回)を処理できる4つのレンダリング・バックエンドを搭載しています。4つの64ビット・メモリ・コントローラーは、合計256ビットのバスを構成します。ちなみに、GeForce GTX 970の13個のSMMが4つのGPCに均等に分割されていないことにお気づきかもしれません。Nvidiaによると、970にはGPCごとにSMMの事前定義されたレシピはなく、各GPUは異なる構成になる可能性があるとのことです。
GeForce GTX 980はベースクロック1126MHz、GPUブースト周波数1216MHzで動作します。一方、GeForce GTX 970はベースクロック1050MHz、GPUブースト周波数1178MHz(標準)です。両モデルとも4GBのGDDR5 RAMを搭載し、1750MHz(7GT/s)に設定されているため、理論上の帯域幅は224GB/sとなります。
[追記]:このレビューを公開してから、GeForce GTX 970にはNvidiaが当初公表していたよりも多くの制限があることが明らかになりました。GTX 980は2MBのL2キャッシュを搭載しているのに対し、970は1.75MBに制限されています。GTX 980は64個のROPを備えていますが、970は部分的に無効化されたクラスターのため、56個に制限されています。さらに、970のメモリは3.5GBと500MBのチャンクに分割されており、それぞれ196GB/秒と28GB/秒の帯域幅となっています。これらのチャンクはストライピングできないため、3.5GBチャンクの最大使用可能メモリ帯域幅は、当初報告されていた224GB/秒ではなく、196GB/秒となっています。詳細については、更新記事「Nvidia GeForce GTX 970の真の仕様」をご覧ください。[/追記]
Tom's Hardware の最高のニュースと詳細なレビューをあなたの受信箱に直接お届けします。
エヌビディア GeForce GTX 980
エヌビディア GeForce GTX 970
Nvidia GeForce GTX 780 Ti
GM204を、NvidiaのGeForce GTX 780 Tiに搭載されているKeplerベースのGK110と比較するのが最も理にかなっているでしょう。もっとも、Maxwellベースの最も強力なGPUとして歴史に名を残すことはまずないでしょうが。780 Tiは、2,880個のCUDAコア、240個のテクスチャユニット、48個のROP、そして336GB/秒のメモリ帯域幅を持つ384ビット集約メモリバスを備えています。これらの特性はすべて(ROP/クロックを除く)、GeForce GTX 980の仕様を凌駕しています。しかし、Maxwellはより少ないリソースでより多くの処理を実行できる、より効率的なアーキテクチャであることに留意してください。簡単に復習するには、GeForce GTX 750 Tiレビュー:Maxwellが省電力でパフォーマンスを向上 をご覧ください。
重要なのは、GeForce GTX 980が780 Tiと同等の性能、ひょっとすると780 Tiを上回る性能を発揮すると期待していることです。GeForce GTX 980のラスター処理能力は特に優れており、フルカラーROP(1クロックあたり64)とフィルレート(72ギガピクセル/秒)を実現しています。一方、GeForce GTX 780 TiはROP(1クロックあたり48)とフィルレート(44ギガピクセル/秒)を実現しています。この性能は、高解像度(4Kなど)やアンチエイリアシングにおいて、GM204に優位性をもたらすはずです。
話を進める前に、Maxwellの効率性へのこだわりについて触れておきましょう。GeForce GTX 980の熱設計電力制限は165Wです。これは誤植ではなく、GeForce GTX 780 Tiより約100ワットも低い数値です。グラフィックスカードの世界で200Wを下回る性能を誇るリーダーが登場するのは久しぶりです。GM204の398mm 2ダイサイズは、同じ28nm製造ノードで製造されているにもかかわらず、GK110の80%以下です。この第2世代Maxwell GPUには52億個のトランジスタが搭載されているのに対し、Keplerは71億個です。GeForce GTX 970はTDPが145Wと、さらに省電力化が進んでいます。これらの新しいGeForceカードが前世代機と同等の性能を発揮できれば、Nvidiaは特別なことを成し遂げたと言えるでしょう。
Maxwell のより効率的なグラフィック アーキテクチャにもかかわらず、GeForce GTX 980 は、GeForce GTX 780 Ti と比較してピーク時のメモリ帯域幅が 33% 低下しています。Nvidia は、改良されたメモリ圧縮方式を実装することでこの不足を解消しています。GM204 は、ハードウェアにさらに多くのオプションを提供する、改良された第 3 世代のデルタ カラー圧縮モードを備えています。64 ピクセルの 8x8 ブロックを使用して、2x4 ブロックで圧縮分析を実行し、8:1、4:1、2:1 ステップで可能な限り最高の圧縮を実現します。2:1 圧縮が実行できない場合、そのブロックは圧縮されません。圧縮に成功したブロックは、メモリが読み取られるたびにさらに多くの帯域幅を節約します。Nvidia は、これにより GeForce GTX 680 Kepler クラスのカードと比較して、有効メモリ帯域幅が 224 GB/秒から約 300 GB/秒に増加すると主張しています。これが、GeForce GTX 980 が強力な GeForce GTX 780 Ti と競争力を保つのに十分であるかどうかを見てみましょう。
GM204のテッセレーション性能の向上についても触れておくべきでしょう。同社のPolyMorphエンジン2.0設計は、KeplerやMaxwellベースのGM107にも採用されていました。しかし、GM204では第三世代PolyMorphエンジンにアップグレードされ、状況は一変しました。NVIDIAの担当者は、アーキテクチャの改良により、エンジンごとに高テッセレーション係数で最大50%のパフォーマンス向上を実現したと主張しています。
NVIDIAの新しいGPUには、独自のディスプレイオプションも搭載されています。GeForce GTX 970と980は、HDMI 2.0規格に対応した世界初のグラフィックスカードであり、HDMI 1.2の30Hz制限に代わり、60Hzでのフル4K表示を実現します。リファレンスカードのデザインには、2つのDisplayPort 1.2出力とデュアルリンクDVIコネクタも搭載されています。また、GPUは将来的に5K解像度をサポートするディスプレイエンジンを搭載し、4台の4Kディスプレイを同時に駆動できます。
NVIDIAは最新GPUにH.265 (HEVC) エンコーディングのサポートを追加し、将来を見据えた優れたアップグレードを提供しています。既存のH.264サポートについては、GeForce GTX 750で既に利用可能なMaxwellの固定機能ビデオエンコーダが、前世代のKeplerハードウェアと比較して2.5倍のスループットに向上していることにご留意ください。NVIDIAのShadowPlayソフトウェアは、GM204で60fpsの4Kビデオをサポートしており、将来的には他のMaxwellベースのカードでもこの機能が利用可能になる可能性があります。
Nvidia は、GeForce GTX 980 が GM204 プロセッサの無修正版を使用しているかどうかについては明らかにしていませんが、将来の製品ではこの GPU がさらに多くの (またはより少ない) CUDA コアを搭載して再登場する可能性があります。
現在のページ: GM204のご紹介: 新しいMaxwellが街にやってきました
次のページの 新機能
ドン・ウォリグロスキーは、Tom's Hardwareの元シニアハードウェアエディターです。CPU、GPU、システム構築、新興技術など、PCハードウェアに関する幅広いトピックをカバーしています。