5
GeForce GTX 580とGF110:NVIDIAが目指したプレイスタイル

GF110: NvidiaがFermiを改良

先ほども述べたように、GF110は明らかに進化を遂げており、NVIDIAは既にGF100で基盤を築いていたため、今回の変更点は実際にはごくわずかです。約30億個のトランジスタで構成される40nmチップは、依然として期待できます。

まず、GPU自体はほぼ変わりません。これは、GF100からGF104のような変更ではありません。GF100では、シェーダーマルチプロセッサが再設計され、主流の価格帯でパフォーマンスが向上しました(つまり、テクスチャ処理能力が向上しました)。ここでの重点は、依然として演算能力です。実際には、機能面での変更は2つだけです。フルスピードのFP16フィルタリングとZカリング効率の向上です。

最後に、このブロック図をグレー表示する必要はありません...

最後に、このブロック図をグレー表示する必要はありません...

GF110はFP16テクスチャフィルタリングを1クロックサイクル(GF104と同等)で実行できますが、GF100では2クロックサイクル必要でした。テクスチャリングが制限されるアプリケーションでは、この高速化がパフォーマンス向上につながる可能性があります。カリングの改善により、GF110はオーバードローの多いタイトルで優位性を発揮し、利用可能なメモリ帯域幅を最大限に活用できます。NVIDIAは、これらの機能強化によりクロックあたり最大14%(程度)の効果が得られると主張しています。

スワイプして水平にスクロールします

ヘッダーセル - 列 0GeForce GTX 580GeForce GTX 480GeForce GTX 470
グラフィックス処理クラスター (GPC)444
ストリーミングマルチプロセッサ(SM)161514
CUDAコア512480448
テクスチャユニット646056
ROPユニット484840
グラフィッククロック772 MHz700MHz607MHz
シェーダークロック1544MHz1401MHz1215MHz
メモリクロック(データレート)1002 MHz (4008 MT/s)924 MHz (3696 MT/s)837 MHz (3348 MT/s)
メモリ容量1.5 GB GDDR51.5 GB GDDR51.25 GB GDDR5
メモリインターフェース384ビット384ビット320ビット
メモリ帯域幅192.4 GB/秒177.4 GB/秒133.9 GB/秒
フィルレート49.4 GTexels/秒42.0 GTexels/秒34.0 GTexels/秒
製造工程40nm TSMC40nm TSMC40nm TSMC
フォームファクターデュアルスロットデュアルスロットデュアルスロット
ディスプレイ出力DL-DVI x 2、ミニHDMI x 1DL-DVI x 2、ミニHDMI x 1DL-DVI x 2、ミニHDMI x 1

GF100からGF110への移行には、チップレベルの再設計が伴います。集積回路の設計には、設計者が付与したい特性に応じて、様々な種類のトランジスタを使用できます。NVIDIAのエンジニアはGF100の設計に立ち戻り、その大部分を修正したとされています。タイミングがそれほど重要でないパスには低速でリーク電流の少ないトランジスタを、その他の領域には高速でリーク電流の多いトランジスタを実装しました。

その結果、大幅な省電力化が実現し、Nvidiaは当初設計では無効化されていた第16世代シェーダマルチプロセッサ(CUDAコア32基、テクスチャユニット4基、PolyMorphジオメトリエンジン1基を追加)を有効化するだけでなく、クロックレートも向上させることができました。GeForce GTX 480のコア/シェーダ/メモリ周波数はそれぞれ700/1401/924MHzでしたが、GeForce GTX 580はコアクロック772MHz、シェーダ周波数1544MHz、メモリクロック1002MHz(データレート4008MT/s)です。つまり、GF110は今年初めに期待していたスペックに近いものとなっています。512基のCUDAコア、64基のテクスチャユニット、そして16基のPolyMorphエンジンを搭載しています。

独立したバックエンドはブロック図上では同じように見えますが、主な変更点はメモリクロックの高速化です。6つのROPパーティションが引き続き搭載され、それぞれが64ビットのメモリインターフェース(合計384ビット)に接続されています。各パーティションは一度に8つの32ビット整数ピクセルを出力でき、1クロックあたり合計48ピクセルを出力します。

モザイク模様の物語を語る

Tom's Hardware の最高のニュースと詳細なレビューをあなたの受信箱に直接お届けします。

ジオメトリが突如として大きな話題を呼んでいる。NvidiaがFermiアーキテクチャとゲームとの関連性について説明した際、DirectX 11とテッセレーションが何度も話題に上がった。同社がPolyMorphエンジンを各シェーダーマルチプロセッサ(GF110 ASICのx16)に1つずつ搭載したという事実は、リアリティ向上のためにテッセレーションを多用するタイトルに大きな違いをもたらすとされていた。しかし、問題は当時、お披露目できるようなゲームがなかったことだ。確かにDiRT 2とAliens vs. Predatorはリリースされていたが、どちらの「第一世代」DirectX 11タイトルも、ジオメトリの追加場所が非常に厳選されている(どちらのタイトルも、ジオメトリの強化がゲームの未来であるというNvidiaの主張を裏付けることはできなかった)。

そして、HAWX 2が登場しました。このゲームはGeForce GTX 580がリリースされてから正式にリリースされますが、レビュー用のコピーが数日前に届きました。以前HAWXで使用したのと同様に、このゲームもテストスイートに組み込む予定です。議論の的となっているのは、AMDがHAWX 2のテッセレーション係数が非現実的に高く、自社製グラフィックスカードのパフォーマンスを阻害していると考えている点です。AMDは、定義可能なジオメトリレベルを可能にする何らかのパッチのリリースを強く求めていると主張しています。しかし、ゲームのリリースが始まれば、パッチの有無にかかわらず、ゲーマーが体験できるのはパッチのみとなり、どのような状況であっても、私たちはその状況をレポートします。

現時点では、ジオメトリが増加するにつれて各アーキテクチャのスケーリング パフォーマンスを測定するために Unigine を使用しています。

AMDはテッセレーションへのアプローチが正しいと主張していますが、複雑度が増すにつれてNVIDIAの設計の方がパフォーマンスをより維持できることは明らかです。追加のSM(およびPolyMorphエンジン)は、より高いクロックと連携して動作し、このテストではテッセレーションをExtremeに設定した場合、GeForce GTX 580が480に対してかなり圧倒的な勝利を収めました。Radeon HD 5870は、複雑度が上がるとNVIDIAのGeForce GTX 470にさえ追いつけません。

また興味深いのは、AMD の Radeon HD 6870 が、技術的に優れた 5870 よりも性能が優れているという事実です。AMD は、テッセレーション パフォーマンスは Barts GPU で取り組んだ特性の 1 つであると主張しており、シェーダーの欠陥にもかかわらず、新しいカードは (最小フレーム レートも高く) 上位に入っています。

クリス・アンジェリーニは、Tom's Hardware USの名誉編集者です。ハードウェアレビューの編集を担当し、注目度の高いCPUやGPUの発表を取り上げています。