GeForce GTX 580とGF110：NVIDIAが目指したプレイスタイル

16ページ中2ページ目:

GF110: NvidiaがFermiを改良

先ほども述べたように、GF110は明らかに進化を遂げており、NVIDIAは既にGF100で基盤を築いていたため、今回の変更点は実際にはごくわずかです。約30億個のトランジスタで構成される40nmチップは、依然として期待できます。

まず、GPU自体はほぼ変わりません。これは、GF100からGF104のような変更ではありません。GF100では、シェーダーマルチプロセッサが再設計され、主流の価格帯でパフォーマンスが向上しました（つまり、テクスチャ処理能力が向上しました）。ここでの重点は、依然として演算能力です。実際には、機能面での変更は2つだけです。フルスピードのFP16フィルタリングとZカリング効率の向上です。

GF110はFP16テクスチャフィルタリングを1クロックサイクル（GF104と同等）で実行できますが、GF100では2クロックサイクル必要でした。テクスチャリングが制限されるアプリケーションでは、この高速化がパフォーマンス向上につながる可能性があります。カリングの改善により、GF110はオーバードローの多いタイトルで優位性を発揮し、利用可能なメモリ帯域幅を最大限に活用できます。NVIDIAは、これらの機能強化によりクロックあたり最大14%（程度）の効果が得られると主張しています。

スワイプして水平にスクロールします

ヘッダーセル - 列 0	GeForce GTX 580	GeForce GTX 480	GeForce GTX 470
グラフィックス処理クラスター (GPC)	4	4	4
ストリーミングマルチプロセッサ（SM）	16	15	14
CUDAコア	512	480	448
テクスチャユニット	64	60	56
ROPユニット	48	48	40
グラフィッククロック	772 MHz	700MHz	607MHz
シェーダークロック	1544MHz	1401MHz	1215MHz
メモリクロック（データレート）	1002 MHz (4008 MT/s)	924 MHz (3696 MT/s)	837 MHz (3348 MT/s)
メモリ容量	1.5 GB GDDR5	1.5 GB GDDR5	1.25 GB GDDR5
メモリインターフェース	384ビット	384ビット	320ビット
メモリ帯域幅	192.4 GB/秒	177.4 GB/秒	133.9 GB/秒
フィルレート	49.4 GTexels/秒	42.0 GTexels/秒	34.0 GTexels/秒
製造工程	40nm TSMC	40nm TSMC	40nm TSMC
フォームファクター	デュアルスロット	デュアルスロット	デュアルスロット
ディスプレイ出力	DL-DVI x 2、ミニHDMI x 1	DL-DVI x 2、ミニHDMI x 1	DL-DVI x 2、ミニHDMI x 1

GF100からGF110への移行には、チップレベルの再設計が伴います。集積回路の設計には、設計者が付与したい特性に応じて、様々な種類のトランジスタを使用できます。NVIDIAのエンジニアはGF100の設計に立ち戻り、その大部分を修正したとされています。タイミングがそれほど重要でないパスには低速でリーク電流の少ないトランジスタを、その他の領域には高速でリーク電流の多いトランジスタを実装しました。

その結果、大幅な省電力化が実現し、Nvidiaは当初設計では無効化されていた第16^世代シェーダマルチプロセッサ（CUDAコア32基、テクスチャユニット4基、PolyMorphジオメトリエンジン1基を追加）を有効化するだけでなく、クロックレートも向上させることができました。GeForce GTX 480のコア/シェーダ/メモリ周波数はそれぞれ700/1401/924MHzでしたが、GeForce GTX 580はコアクロック772MHz、シェーダ周波数1544MHz、メモリクロック1002MHz（データレート4008MT/s）です。つまり、GF110は今年初めに期待していたスペックに近いものとなっています。512基のCUDAコア、64基のテクスチャユニット、そして16基のPolyMorphエンジンを搭載しています。

独立したバックエンドはブロック図上では同じように見えますが、主な変更点はメモリクロックの高速化です。6つのROPパーティションが引き続き搭載され、それぞれが64ビットのメモリインターフェース（合計384ビット）に接続されています。各パーティションは一度に8つの32ビット整数ピクセルを出力でき、1クロックあたり合計48ピクセルを出力します。

モザイク模様の物語を語る

Tom's Hardware の最高のニュースと詳細なレビューをあなたの受信箱に直接お届けします。

ジオメトリが突如として大きな話題を呼んでいる。NvidiaがFermiアーキテクチャとゲームとの関連性について説明した際、DirectX 11とテッセレーションが何度も話題に上がった。同社がPolyMorphエンジンを各シェーダーマルチプロセッサ（GF110 ASICのx16）に1つずつ搭載したという事実は、リアリティ向上のためにテッセレーションを多用するタイトルに大きな違いをもたらすとされていた。しかし、問題は当時、お披露目できるようなゲームがなかったことだ。確かにDiRT 2とAliens vs. Predatorはリリースされていたが、どちらの「第一世代」DirectX 11タイトルも、ジオメトリの追加場所が非常に厳選されている（どちらのタイトルも、ジオメトリの強化がゲームの未来であるというNvidiaの主張を裏付けることはできなかった）。

そして、HAWX 2が登場しました。このゲームはGeForce GTX 580がリリースされてから正式にリリースされますが、レビュー用のコピーが数日前に届きました。以前HAWXで使用したのと同様に、このゲームもテストスイートに組み込む予定です。議論の的となっているのは、AMDがHAWX 2のテッセレーション係数が非現実的に高く、自社製グラフィックスカードのパフォーマンスを阻害していると考えている点です。AMDは、定義可能なジオメトリレベルを可能にする何らかのパッチのリリースを強く求めていると主張しています。しかし、ゲームのリリースが始まれば、パッチの有無にかかわらず、ゲーマーが体験できるのはパッチのみとなり、どのような状況であっても、私たちはその状況をレポートします。

現時点では、ジオメトリが増加するにつれて各アーキテクチャのスケーリングパフォーマンスを測定するために Unigine を使用しています。

AMDはテッセレーションへのアプローチが正しいと主張していますが、複雑度が増すにつれてNVIDIAの設計の方がパフォーマンスをより維持できることは明らかです。追加のSM（およびPolyMorphエンジン）は、より高いクロックと連携して動作し、このテストではテッセレーションをExtremeに設定した場合、GeForce GTX 580が480に対してかなり圧倒的な勝利を収めました。Radeon HD 5870は、複雑度が上がるとNVIDIAのGeForce GTX 470にさえ追いつけません。

また興味深いのは、AMD の Radeon HD 6870 が、技術的に優れた 5870 よりも性能が優れているという事実です。AMD は、テッセレーションパフォーマンスは Barts GPU で取り組んだ特性の 1 つであると主張しており、シェーダーの欠陥にもかかわらず、新しいカードは (最小フレームレートも高く) 上位に入っています。

クリス・アンジェリーニは、Tom's Hardware USの名誉編集者です。ハードウェアレビューの編集を担当し、注目度の高いCPUやGPUの発表を取り上げています。

Hardware