GF110: NvidiaがFermiを改良
先ほども述べたように、GF110は明らかに進化を遂げており、NVIDIAは既にGF100で基盤を築いていたため、今回の変更点は実際にはごくわずかです。約30億個のトランジスタで構成される40nmチップは、依然として期待できます。
まず、GPU自体はほぼ変わりません。これは、GF100からGF104のような変更ではありません。GF100では、シェーダーマルチプロセッサが再設計され、主流の価格帯でパフォーマンスが向上しました(つまり、テクスチャ処理能力が向上しました)。ここでの重点は、依然として演算能力です。実際には、機能面での変更は2つだけです。フルスピードのFP16フィルタリングとZカリング効率の向上です。
GF110はFP16テクスチャフィルタリングを1クロックサイクル(GF104と同等)で実行できますが、GF100では2クロックサイクル必要でした。テクスチャリングが制限されるアプリケーションでは、この高速化がパフォーマンス向上につながる可能性があります。カリングの改善により、GF110はオーバードローの多いタイトルで優位性を発揮し、利用可能なメモリ帯域幅を最大限に活用できます。NVIDIAは、これらの機能強化によりクロックあたり最大14%(程度)の効果が得られると主張しています。
スワイプして水平にスクロールします
ヘッダーセル - 列 0 | GeForce GTX 580 | GeForce GTX 480 | GeForce GTX 470 |
---|---|---|---|
グラフィックス処理クラスター (GPC) | 4 | 4 | 4 |
ストリーミングマルチプロセッサ(SM) | 16 | 15 | 14 |
CUDAコア | 512 | 480 | 448 |
テクスチャユニット | 64 | 60 | 56 |
ROPユニット | 48 | 48 | 40 |
グラフィッククロック | 772 MHz | 700MHz | 607MHz |
シェーダークロック | 1544MHz | 1401MHz | 1215MHz |
メモリクロック(データレート) | 1002 MHz (4008 MT/s) | 924 MHz (3696 MT/s) | 837 MHz (3348 MT/s) |
メモリ容量 | 1.5 GB GDDR5 | 1.5 GB GDDR5 | 1.25 GB GDDR5 |
メモリインターフェース | 384ビット | 384ビット | 320ビット |
メモリ帯域幅 | 192.4 GB/秒 | 177.4 GB/秒 | 133.9 GB/秒 |
フィルレート | 49.4 GTexels/秒 | 42.0 GTexels/秒 | 34.0 GTexels/秒 |
製造工程 | 40nm TSMC | 40nm TSMC | 40nm TSMC |
フォームファクター | デュアルスロット | デュアルスロット | デュアルスロット |
ディスプレイ出力 | DL-DVI x 2、ミニHDMI x 1 | DL-DVI x 2、ミニHDMI x 1 | DL-DVI x 2、ミニHDMI x 1 |
GF100からGF110への移行には、チップレベルの再設計が伴います。集積回路の設計には、設計者が付与したい特性に応じて、様々な種類のトランジスタを使用できます。NVIDIAのエンジニアはGF100の設計に立ち戻り、その大部分を修正したとされています。タイミングがそれほど重要でないパスには低速でリーク電流の少ないトランジスタを、その他の領域には高速でリーク電流の多いトランジスタを実装しました。
その結果、大幅な省電力化が実現し、Nvidiaは当初設計では無効化されていた第16世代シェーダマルチプロセッサ(CUDAコア32基、テクスチャユニット4基、PolyMorphジオメトリエンジン1基を追加)を有効化するだけでなく、クロックレートも向上させることができました。GeForce GTX 480のコア/シェーダ/メモリ周波数はそれぞれ700/1401/924MHzでしたが、GeForce GTX 580はコアクロック772MHz、シェーダ周波数1544MHz、メモリクロック1002MHz(データレート4008MT/s)です。つまり、GF110は今年初めに期待していたスペックに近いものとなっています。512基のCUDAコア、64基のテクスチャユニット、そして16基のPolyMorphエンジンを搭載しています。
独立したバックエンドはブロック図上では同じように見えますが、主な変更点はメモリクロックの高速化です。6つのROPパーティションが引き続き搭載され、それぞれが64ビットのメモリインターフェース(合計384ビット)に接続されています。各パーティションは一度に8つの32ビット整数ピクセルを出力でき、1クロックあたり合計48ピクセルを出力します。
モザイク模様の物語を語る
Tom's Hardware の最高のニュースと詳細なレビューをあなたの受信箱に直接お届けします。
ジオメトリが突如として大きな話題を呼んでいる。NvidiaがFermiアーキテクチャとゲームとの関連性について説明した際、DirectX 11とテッセレーションが何度も話題に上がった。同社がPolyMorphエンジンを各シェーダーマルチプロセッサ(GF110 ASICのx16)に1つずつ搭載したという事実は、リアリティ向上のためにテッセレーションを多用するタイトルに大きな違いをもたらすとされていた。しかし、問題は当時、お披露目できるようなゲームがなかったことだ。確かにDiRT 2とAliens vs. Predatorはリリースされていたが、どちらの「第一世代」DirectX 11タイトルも、ジオメトリの追加場所が非常に厳選されている(どちらのタイトルも、ジオメトリの強化がゲームの未来であるというNvidiaの主張を裏付けることはできなかった)。
そして、HAWX 2が登場しました。このゲームはGeForce GTX 580がリリースされてから正式にリリースされますが、レビュー用のコピーが数日前に届きました。以前HAWXで使用したのと同様に、このゲームもテストスイートに組み込む予定です。議論の的となっているのは、AMDがHAWX 2のテッセレーション係数が非現実的に高く、自社製グラフィックスカードのパフォーマンスを阻害していると考えている点です。AMDは、定義可能なジオメトリレベルを可能にする何らかのパッチのリリースを強く求めていると主張しています。しかし、ゲームのリリースが始まれば、パッチの有無にかかわらず、ゲーマーが体験できるのはパッチのみとなり、どのような状況であっても、私たちはその状況をレポートします。
現時点では、ジオメトリが増加するにつれて各アーキテクチャのスケーリング パフォーマンスを測定するために Unigine を使用しています。
AMDはテッセレーションへのアプローチが正しいと主張していますが、複雑度が増すにつれてNVIDIAの設計の方がパフォーマンスをより維持できることは明らかです。追加のSM(およびPolyMorphエンジン)は、より高いクロックと連携して動作し、このテストではテッセレーションをExtremeに設定した場合、GeForce GTX 580が480に対してかなり圧倒的な勝利を収めました。Radeon HD 5870は、複雑度が上がるとNVIDIAのGeForce GTX 470にさえ追いつけません。
また興味深いのは、AMD の Radeon HD 6870 が、技術的に優れた 5870 よりも性能が優れているという事実です。AMD は、テッセレーション パフォーマンスは Barts GPU で取り組んだ特性の 1 つであると主張しており、シェーダーの欠陥にもかかわらず、新しいカードは (最小フレーム レートも高く) 上位に入っています。
クリス・アンジェリーニは、Tom's Hardware USの名誉編集者です。ハードウェアレビューの編集を担当し、注目度の高いCPUやGPUの発表を取り上げています。