GeForce GTX 590:熱をもたらす
静音性を追求するのは皮肉に聞こえるかもしれない。NvidiaのFermiアーキテクチャをベースにしたGPUは、発熱と消費電力が非常に大きいことで悪名高い。同社が1枚のPCBに2基搭載して、AMDのデュアルCaymanベースのカードに勝てないと考えるのは、ほとんど滑稽と言えるだろう。しかし、Nvidiaはそれを実現したと主張している。
しかし、そこに到達するのは容易なことではなかったと認めています。妥協も重ねてきました。例えば、NVIDIAはAMDを批判したのと同じミッドマウントファン設計を採用しています。発熱を抑えるため、GPUのクロック周波数を下げました。それでも、このカードはこれまでテストしたどのグラフィック製品よりも多くの電力を消費します。
でも、静かだ。信じられないくらい静かだ。ATIのRage Fury Maxx以来、私がテストした中で最も静かなデュアルGPUボードだ(昔ながらの静かさだ)。その点ではミッションは達成されたと言えるだろう。しかし、疑問が残る。Nvidiaは、AMDに「高性能なカードは必ずしも大きな音を出す必要はない」と示すためだけに、このファームを手放さざるを得なかったのだろうか?
ボンネットの下:デュアルGF110、両方ともカットされていない
Nvidia との話し合いで、同社は GF110 プロセッサを 2 つ使用したいと考えており、それらをハックする意図はないことを明確にしていました。GeForce GTX 580 と GF110: Nvidia が意図した方法 を読んだことがあるならすでにご存知かもしれませんが、カットされていない GF110 は、それぞれ 4 つのストリーミング マルチプロセッサを備えた 4 つのグラフィックス処理クラスターを使用します。各 SM には 32 個の CUDA コアがあり、GPU あたり合計 512 個のコアがあります。各 SM には 4 つのテクスチャリング ユニットもあり、チップ全体では 64 個になります。もちろん、SM ごとに 1 つの Polymorph エンジンもありますが、過去に見たように、Nvidia のジオメトリの並列化へのアプローチは必ずしもうまく拡張できるわけではありません。
GPUのバックエンドには6つのROPパーティションがあり、それぞれが32ビット整数ピクセルを8つ同時に出力できるため、1クロックあたり最大48ピクセルを出力できます。合計384ビットのメモリバスは6つの64ビットインターフェースに分割可能で、6つのストップすべてに256MBのGDDR5メモリが搭載されています。つまり、GPUあたり1.5GBのメモリが搭載され、GeForce GTX 590の3GBというメモリ容量に相当します。
Tom's Hardware の最高のニュースと詳細なレビューをあなたの受信箱に直接お届けします。
Nvidia は、独自の NF200 ブリッジを使用して GTX 590 の GF110 プロセッサを結合します。NF200 ブリッジは、1 つの 16 レーン PCI Express 2.0 インターフェイスを受け取り、それを 2 つの 16 レーン パス (各 GPU に 1 つずつ) に多重化します。
スワイプして水平にスクロールします
ヘッダーセル - 列 0 | GeForce GTX 590 | GeForce GTX 580 | Radeon HD 6990 | Radeon HD 6970 | Radeon HD 6950 |
---|---|---|---|---|---|
製造工程 | 40nm TSMC | 40nm TSMC | 40nm TSMC | 40nm TSMC | 40nm TSMC |
ダイサイズ | 2 x 520 mm² | 520 mm² | 2 x 389 mm² | 389 mm² | 389 mm² |
トランジスタ | 2 x 30億 | 30億 | 2 x 26億4000万 | 26億4000万 | 26億4000万 |
エンジンクロック | 607MHz | 772 MHz | 830MHz | 880MHz | 800MHz |
ストリームプロセッサ / CUDAコア | 1024 | 512 | 3072 | 1536 | 1408 |
コンピューティングパフォーマンス | 2.49 TFLOPS | 1.58 TFLOPS | 5.1 TFLOPS | 2.7 TFLOPS | 2.25 TFLOPS |
テクスチャユニット | 128 | 64 | 192 | 96 | 88 |
テクスチャフィルレート | 77.7 Gtex/秒 | 49.4 Gtex/秒 | 159.4 Gtex/秒 | 84.5 Gtex/秒 | 70.4 Gtex/秒 |
ROP | 96 | 48 | 64 | 32 | 32 |
ピクセルフィルレート | 58.3 Gpix/秒 | 37.1 Gpix/秒 | 53.1 Gpix/秒 | 28.2 Gpix/秒 | 25.6 Gpix/秒 |
フレームバッファ | 2 x 1.5 GB GDDR5 | 1.5 GB GDDR5 | 2 x 2 GB GDDR5 | 2 GB GDDR5 | 2 GB GDDR5 |
メモリクロック | 853MHz | 1002 MHz | 1250MHz | 1375MHz | 1250MHz |
メモリ帯域幅 | 2 x 163.9 GB/秒(384ビット) | 192 GB/秒(384ビット) | 2 x 160 GB/秒(256ビット) | 176 GB/秒(256ビット) | 160 GB/秒(256ビット) |
最大ボード電力 | 365ワット | 244ワット | 375ワット | 250ワット | 200ワット |
不評だったGF100ベースのGeForce GTX 480からGF110に何が変わったのでしょうか?私のGeForce GTX 580レビューより:
GPU自体はほぼ変わりません。これはGF100からGF104のような変更ではありません。GF100では、シェーダーマルチプロセッサが再設計され、主流の価格帯でパフォーマンスが向上しました(つまり、テクスチャ処理能力が向上しました)。ここでの重点は依然として計算能力です。実際には、機能面での変更は2つだけです。フルスピードのFP16フィルタリングとZカリング効率の向上です。
GF110はFP16テクスチャフィルタリングを1クロックサイクル(GF104と同等)で実行できますが、GF100では2クロックサイクル必要でした。テクスチャリングが制限されるアプリケーションでは、この高速化がパフォーマンス向上につながる可能性があります。カリングの改善により、GF110はオーバードローの多いタイトルで優位性を発揮し、利用可能なメモリ帯域幅を最大限に活用できます。NVIDIAは、これらの機能強化によりクロックあたり最大14%(程度)の効果が得られると主張しています。
それ以外では、TSMCの40nmノードで製造され、それぞれ約30億個のトランジスタで構成される2つのシリコンについて話していることになります。GF110は520平方ミリメートルで、389平方ミリメートルで26億4000万個のトランジスタで構成されるAMDのCaymanプロセッサよりも大幅に大きいです。
さて、GeForce GTX 590 でこれらすべてのリソース (2 倍) を利用できるのはすばらしいことです。ただし、GeForce GTX 580 は 772 MHz のグラフィック クロックと 1002 MHz のメモリ クロックを採用しているのに対し、GTX 590 の GPU はそれぞれ 607 MHz と 853 MHz に遅くなります。
その結果、このカードのパフォーマンスは、NVIDIAの最速シングルGPUフラッグシップ2機種に期待されるレベルには程遠いものとなっています。しかし、これはこれで良いのかもしれません。AMDはRadeon HD 6970をGeForce GTX 570のライバルとして発売し、580は独自の地位を築いていました。つまり、AMDのRadeon HD 6990は同社の最速シングルGPUカードの2倍近いパフォーマンスを実現しているものの、AMDが既に確立し、NVIDIAもそれに追いつく予定の700ドルという価格帯で競争力を持つために、GeForce GTX 590が同等の性能を発揮する必要はないのです。
AMDが「世界最速のグラフィックカード」を実現するために何をしなければならなかったかは既に知られています。では、Nvidiaはどのように対抗するのでしょうか?
クリス・アンジェリーニは、Tom's Hardware USの名誉編集者です。ハードウェアレビューの編集を担当し、注目度の高いCPUやGPUの発表を取り上げています。