53
Nvidia GeForce GTX 590 3GBレビュー:1024基のCUDAコアで反撃

GeForce GTX 590:熱をもたらす

この隅に...

この隅に...

静音性を追求するのは皮肉に聞こえるかもしれない。NvidiaのFermiアーキテクチャをベースにしたGPUは、発熱と消費電力が非常に大きいことで悪名高い。同社が1枚のPCBに2基搭載して、AMDのデュアルCaymanベースのカードに勝てないと考えるのは、ほとんど滑稽と言えるだろう。しかし、Nvidiaはそれを実現したと主張している

しかし、そこに到達するのは容易なことではなかったと認めています。妥協も重ねてきました。例えば、NVIDIAはAMDを批判したのと同じミッドマウントファン設計を採用しています。発熱を抑えるため、GPUのクロック周波数を下げました。それでも、このカードはこれまでテストしたどのグラフィック製品よりも多くの電力を消費します。

そして、もう一方の隅には...

そして、もう一方の隅には...

でも、静かだ。信じられないくらい静かだ。ATIのRage Fury Maxx以来、私がテストした中で最も静かなデュアルGPUボードだ(昔ながらの静かさだ)。その点ではミッションは達成されたと言えるだろう。しかし、疑問が残る。Nvidiaは、AMDに「高性能なカードは必ずしも大きな音を出す必要はない」と示すためだけに、このファームを手放さざるを得なかったのだろうか?

ボンネットの下:デュアルGF110、両方ともカットされていない

Nvidia との話し合いで、同社は GF110 プロセッサを 2 つ使用したいと考えており、それらをハックする意図はないことを明確にしていました。GeForce GTX 580 と GF110: Nvidia が意図した方法 を読んだことがあるならすでにご存知かもしれませんが、カットされていない GF110 は、それぞれ 4 つのストリーミング マルチプロセッサを備えた 4 つのグラフィックス処理クラスターを使用します。各 SM には 32 個の CUDA コアがあり、GPU あたり合計 512 個のコアがあります。各 SM には 4 つのテクスチャリング ユニットもあり、チップ全体では 64 個になります。もちろん、SM ごとに 1 つの Polymorph エンジンもありますが、過去に見たように、Nvidia のジオメトリの並列化へのアプローチは必ずしもうまく拡張できるわけではありません。

GTX 580のレビューと同様に、GF110はここでも削減されません。

GTX 580のレビューと同様に、GF110はここでも削減されません。

GPUのバックエンドには6つのROPパーティションがあり、それぞれが32ビット整数ピクセルを8つ同時に出力できるため、1クロックあたり最大48ピクセルを出力できます。合計384ビットのメモリバスは6つの64ビットインターフェースに分割可能で、6つのストップすべてに256MBのGDDR5メモリが搭載されています。つまり、GPUあたり1.5GBのメモリが搭載され、GeForce GTX 590の3GBというメモリ容量に相当します。

Tom's Hardware の最高のニュースと詳細なレビューをあなたの受信箱に直接お届けします。

Nvidia は、独自の NF200 ブリッジを使用して GTX 590 の GF110 プロセッサを結合します。NF200 ブリッジは、1 つの 16 レーン PCI Express 2.0 インターフェイスを受け取り、それを 2 つの 16 レーン パス (各 GPU に 1 つずつ) に多重化します。

スワイプして水平にスクロールします

ヘッダーセル - 列 0GeForce GTX 590GeForce GTX 580Radeon HD 6990Radeon HD 6970Radeon HD 6950
製造工程40nm TSMC40nm TSMC40nm TSMC40nm TSMC40nm TSMC
ダイサイズ2 x 520 mm²520 mm²2 x 389 mm²389 mm²389 mm²
トランジスタ2 x 30億30億2 x 26億4000万26億4000万26億4000万
エンジンクロック607MHz772 MHz830MHz880MHz800MHz
ストリームプロセッサ / CUDAコア1024512307215361408
コンピューティングパフォーマンス2.49 TFLOPS1.58 TFLOPS5.1 TFLOPS2.7 TFLOPS2.25 TFLOPS
テクスチャユニット128641929688
テクスチャフィルレート77.7 Gtex/秒49.4 Gtex/秒159.4 Gtex/秒84.5 Gtex/秒70.4 Gtex/秒
ROP9648643232
ピクセルフィルレート58.3 Gpix/秒37.1 Gpix/秒53.1 Gpix/秒28.2 Gpix/秒25.6 Gpix/秒
フレームバッファ2 x 1.5 GB GDDR51.5 GB GDDR52 x 2 GB GDDR52 GB GDDR52 GB GDDR5
メモリクロック853MHz1002 MHz1250MHz1375MHz1250MHz
メモリ帯域幅2 x 163.9 GB/秒(384ビット)192 GB/秒(384ビット)2 x 160 GB/秒(256ビット)176 GB/秒(256ビット)160 GB/秒(256ビット)
最大ボード電力365ワット244ワット375ワット250ワット200ワット

不評だったGF100ベースのGeForce GTX 480からGF110に何が変わったのでしょうか?私のGeForce GTX 580レビューより:

GPU自体はほぼ変わりません。これはGF100からGF104のような変更ではありません。GF100では、シェーダーマルチプロセッサが再設計され、主流の価格帯でパフォーマンスが向上しました(つまり、テクスチャ処理能力が向上しました)。ここでの重点は依然として計算能力です。実際には、機能面での変更は2つだけです。フルスピードのFP16フィルタリングとZカリング効率の向上です。

GF110はFP16テクスチャフィルタリングを1クロックサイクル(GF104と同等)で実行できますが、GF100では2クロックサイクル必要でした。テクスチャリングが制限されるアプリケーションでは、この高速化がパフォーマンス向上につながる可能性があります。カリングの改善により、GF110はオーバードローの多いタイトルで優位性を発揮し、利用可能なメモリ帯域幅を最大限に活用できます。NVIDIAは、これらの機能強化によりクロックあたり最大14%(程度)の効果が得られると主張しています。

That's a 12-layer PCB with 10-phase power, and NF200 in the middle

これは10相電源を備えた12層PCBで、中央にNF200が配置されている。

それ以外では、TSMCの40nmノードで製造され、それぞれ約30億個のトランジスタで構成される2つのシリコンについて話していることになります。GF110は520平方ミリメートルで、389平方ミリメートルで26億4000万個のトランジスタで構成されるAMDのCaymanプロセッサよりも大幅に大きいです。

さて、GeForce GTX 590 でこれらすべてのリソース (2 倍) を利用できるのはすばらしいことです。ただし、GeForce GTX 580 は 772 MHz のグラフィック クロックと 1002 MHz のメモリ クロックを採用しているのに対し、GTX 590 の GPU はそれぞれ 607 MHz と 853 MHz に遅くなります。

その結果、このカードのパフォーマンスは、NVIDIAの最速シングルGPUフラッグシップ2機種に期待されるレベルには程遠いものとなっています。しかし、これはこれで良いのかもしれません。AMDはRadeon HD 6970をGeForce GTX 570のライバルとして発売し、580は独自の地位を築いていました。つまり、AMDのRadeon HD 6990は同社の最速シングルGPUカードの2倍近いパフォーマンスを実現しているものの、AMDが既に確立し、NVIDIAもそれに追いつく予定の700ドルという価格帯で競争力を持つために、GeForce GTX 590が同等の性能を発揮する必要はないのです。

AMDが「世界最速のグラフィックカード」を実現するために何をしなければならなかったかは既に知られています。では、Nvidiaはどのように対抗するのでしょうか?

クリス・アンジェリーニは、Tom's Hardware USの名誉編集者です。ハードウェアレビューの編集を担当し、注目度の高いCPUやGPUの発表を取り上げています。