Nvidia GeForce GTX 590 3GBレビュー：1024基のCUDAコアで反撃

19ページ中1ページ目:

GeForce GTX 590：熱をもたらす

静音性を追求するのは皮肉に聞こえるかもしれない。NvidiaのFermiアーキテクチャをベースにしたGPUは、発熱と消費電力が非常に大きいことで悪名高い。同社が1枚のPCBに2基搭載して、AMDのデュアルCaymanベースのカードに勝てないと考えるのは、ほとんど滑稽と言えるだろう。しかし、Nvidiaはそれを実現したと主張している。

しかし、そこに到達するのは容易なことではなかったと認めています。妥協も重ねてきました。例えば、NVIDIAはAMDを批判したのと同じミッドマウントファン設計を採用しています。発熱を抑えるため、GPUのクロック周波数を下げました。それでも、このカードはこれまでテストしたどのグラフィック製品よりも多くの電力を消費します。

でも、静かだ。信じられないくらい静かだ。ATIのRage Fury Maxx以来、私がテストした中で最も静かなデュアルGPUボードだ（昔ながらの静かさだ）。その点ではミッションは達成されたと言えるだろう。しかし、疑問が残る。Nvidiaは、AMDに「高性能なカードは必ずしも大きな音を出す必要はない」と示すためだけに、このファームを手放さざるを得なかったのだろうか？

ボンネットの下：デュアルGF110、両方ともカットされていない

Nvidia との話し合いで、同社は GF110 プロセッサを 2 つ使用したいと考えており、それらをハックする意図はないことを明確にしていました。GeForce GTX 580 と GF110: Nvidia が意図した方法を読んだことがあるならすでにご存知かもしれませんが、カットされていない GF110 は、それぞれ 4 つのストリーミングマルチプロセッサを備えた 4 つのグラフィックス処理クラスターを使用します。各 SM には 32 個の CUDA コアがあり、GPU あたり合計 512 個のコアがあります。各 SM には 4 つのテクスチャリングユニットもあり、チップ全体では 64 個になります。もちろん、SM ごとに 1 つの Polymorph エンジンもありますが、過去に見たように、Nvidia のジオメトリの並列化へのアプローチは必ずしもうまく拡張できるわけではありません。

GPUのバックエンドには6つのROPパーティションがあり、それぞれが32ビット整数ピクセルを8つ同時に出力できるため、1クロックあたり最大48ピクセルを出力できます。合計384ビットのメモリバスは6つの64ビットインターフェースに分割可能で、6つのストップすべてに256MBのGDDR5メモリが搭載されています。つまり、GPUあたり1.5GBのメモリが搭載され、GeForce GTX 590の3GBというメモリ容量に相当します。

Tom's Hardware の最高のニュースと詳細なレビューをあなたの受信箱に直接お届けします。

Nvidia は、独自の NF200 ブリッジを使用して GTX 590 の GF110 プロセッサを結合します。NF200 ブリッジは、1 つの 16 レーン PCI Express 2.0 インターフェイスを受け取り、それを 2 つの 16 レーンパス (各 GPU に 1 つずつ) に多重化します。

スワイプして水平にスクロールします

ヘッダーセル - 列 0	GeForce GTX 590	GeForce GTX 580	Radeon HD 6990	Radeon HD 6970	Radeon HD 6950
製造工程	40nm TSMC	40nm TSMC	40nm TSMC	40nm TSMC	40nm TSMC
ダイサイズ	2 x 520 mm²	520 mm²	2 x 389 mm²	389 mm²	389 mm²
トランジスタ	2 x 30億	30億	2 x 26億4000万	26億4000万	26億4000万
エンジンクロック	607MHz	772 MHz	830MHz	880MHz	800MHz
ストリームプロセッサ / CUDAコア	1024	512	3072	1536	1408
コンピューティングパフォーマンス	2.49 TFLOPS	1.58 TFLOPS	5.1 TFLOPS	2.7 TFLOPS	2.25 TFLOPS
テクスチャユニット	128	64	192	96	88
テクスチャフィルレート	77.7 Gtex/秒	49.4 Gtex/秒	159.4 Gtex/秒	84.5 Gtex/秒	70.4 Gtex/秒
ROP	96	48	64	32	32
ピクセルフィルレート	58.3 Gpix/秒	37.1 Gpix/秒	53.1 Gpix/秒	28.2 Gpix/秒	25.6 Gpix/秒
フレームバッファ	2 x 1.5 GB GDDR5	1.5 GB GDDR5	2 x 2 GB GDDR5	2 GB GDDR5	2 GB GDDR5
メモリクロック	853MHz	1002 MHz	1250MHz	1375MHz	1250MHz
メモリ帯域幅	2 x 163.9 GB/秒（384ビット）	192 GB/秒（384ビット）	2 x 160 GB/秒（256ビット）	176 GB/秒（256ビット）	160 GB/秒（256ビット）
最大ボード電力	365ワット	244ワット	375ワット	250ワット	200ワット

不評だったGF100ベースのGeForce GTX 480からGF110に何が変わったのでしょうか？私のGeForce GTX 580レビューより：

GPU自体はほぼ変わりません。これはGF100からGF104のような変更ではありません。GF100では、シェーダーマルチプロセッサが再設計され、主流の価格帯でパフォーマンスが向上しました（つまり、テクスチャ処理能力が向上しました）。ここでの重点は依然として計算能力です。実際には、機能面での変更は2つだけです。フルスピードのFP16フィルタリングとZカリング効率の向上です。

GF110はFP16テクスチャフィルタリングを1クロックサイクル（GF104と同等）で実行できますが、GF100では2クロックサイクル必要でした。テクスチャリングが制限されるアプリケーションでは、この高速化がパフォーマンス向上につながる可能性があります。カリングの改善により、GF110はオーバードローの多いタイトルで優位性を発揮し、利用可能なメモリ帯域幅を最大限に活用できます。NVIDIAは、これらの機能強化によりクロックあたり最大14%（程度）の効果が得られると主張しています。

That's a 12-layer PCB with 10-phase power, and NF200 in the middle — これは10相電源を備えた12層PCBで、中央にNF200が配置されている。

それ以外では、TSMCの40nmノードで製造され、それぞれ約30億個のトランジスタで構成される2つのシリコンについて話していることになります。GF110は520平方ミリメートルで、389平方ミリメートルで26億4000万個のトランジスタで構成されるAMDのCaymanプロセッサよりも大幅に大きいです。

さて、GeForce GTX 590 でこれらすべてのリソース (2 倍) を利用できるのはすばらしいことです。ただし、GeForce GTX 580 は 772 MHz のグラフィッククロックと 1002 MHz のメモリクロックを採用しているのに対し、GTX 590 の GPU はそれぞれ 607 MHz と 853 MHz に遅くなります。

その結果、このカードのパフォーマンスは、NVIDIAの最速シングルGPUフラッグシップ2機種に期待されるレベルには程遠いものとなっています。しかし、これはこれで良いのかもしれません。AMDはRadeon HD 6970をGeForce GTX 570のライバルとして発売し、580は独自の地位を築いていました。つまり、AMDのRadeon HD 6990は同社の最速シングルGPUカードの2倍近いパフォーマンスを実現しているものの、AMDが既に確立し、NVIDIAもそれに追いつく予定の700ドルという価格帯で競争力を持つために、GeForce GTX 590が同等の性能を発揮する必要はないのです。

AMDが「世界最速のグラフィックカード」を実現するために何をしなければならなかったかは既に知られています。では、Nvidiaはどのように対抗するのでしょうか？

クリス・アンジェリーニは、Tom's Hardware USの名誉編集者です。ハードウェアレビューの編集を担当し、注目度の高いCPUやGPUの発表を取り上げています。

Hardware