重要なパフォーマンス:グラフィックカードのラップタイムを超える
自動車愛好家なら、友人と2台のスポーツカーの性能について議論したことがあるはずです。どちらか一方の方が馬力が高いかもしれません。あるいは、最高速度が速い、ハンドリングが優れている、あるいは車重が軽いといった具合です。たいていの場合、そうした会話はニュルブルクリンクでのラップタイム比較にまで発展し、結局はどの車も買えないという理由で話が終わってしまいます。
では、ビデオカードのラップタイム換算値とは何でしょうか?価格が同じ場合、勝者と敗者を分ける唯一の指標は何でしょうか?フレームタイムの変動、ティアリング、スタッタリング、ジェットエンジンのようなファン音など、これまで取り上げてきた様々な項目からもわかるように、平均フレームレートだけでは明らかに不十分です。さらに、テクスチャフィルレート、コンピューティング性能、メモリ帯域幅といった、より技術的な仕様も検討する必要があります。これらの数値は一体どのような意味を持つのでしょうか?そして、F1のピットクルーのように、新しいカードはヘッドフォンなしでは動作しないのでしょうか?評価において、各カードのオーバークロック余裕はどのように考慮するのでしょうか?
現代のグラフィック カードにまつわる誤解を詳しく調べる前に、パフォーマンスとは何か、またパフォーマンスではないものは何かを定義することから始めましょう。
パフォーマンスは一つの数字ではなく、包括されたものである
GPUのパフォーマンスに関する議論は、しばしばFPS(平均フレームレート)に基づいた一般論に集約されます。しかし実際には、グラフィックカードのパフォーマンスは、フレームのレンダリング速度よりもはるかに多くの要素を含みます。しかし、単一のデータポイントではなく、エンベロープ(全体)として考える方が適切です。このエンベロープには、速度(フレームレート、フレームレイテンシ、入力遅延)、品質(解像度と画質)、静音性(消費電力と冷却設計に起因する音響性能)、そしてもちろん価格という4つの主要な側面があります。
ゲームバンドルやベンダー固有のテクノロジーなど、カードの価値に影響を与える他の要素もあります。これらについては簡単に説明しますが、定量的な評価は行いません。実際、CUDA、Mantle、ShadowPlayのサポートの重要性は、ユーザーによって大きく異なります。
上のグラフは、私が説明しているこの変動範囲におけるGeForce GTX 690の位置を示しています。標準状態では、Unigine Valley 1.0のExtremeHDプリセットでテストシステム(後述)を使用して71.5 FPSを達成しています。ノイズは42.5 dB(A)で、聞こえる程度ですが、気になるほどではありません。ノイズギリギリの45.5 dB(A)でも許容できるのであれば、同じプリセットでカードをオーバークロックして安定した81.5 FPSを実現することも可能です。解像度やアンチエイリアシングレベル(画質に影響します)を下げると、他の条件が同じであればフレームレートが大幅に向上します。もちろん、1000ドルという(手頃ではない)価格は変わりません。
従来よりも制御された方法でテストを実行するために、ビデオ カードのパフォーマンスの基準を定義しましょう。
今日の話の目的上、パフォーマンスとは、特定のアプリケーション内で、指定された解像度でグラフィック ボードが出力できる 1 秒あたりのフレーム数として定義します(説明されている範囲内で、次の条件で)。
- 特定のアプリケーションの品質設定が最高値に設定されている(通常は Ultra または Extreme プリセット)
- 解像度は一定レベルに設定されます(通常、3 台のモニターのアレイでは 1920 x 1080、2560 x 1440、3840 x 2160、または 5760 x 1080)。
- 各メーカーのデフォルトのドライバー設定(グローバルまたはアプリケーション固有)
- 密閉された筐体内で、筐体から 3 フィート離れた位置で測定された 40 dB(A) の騒音レベルで動作します (理想的には、毎年更新される参照プラットフォームでテストされます)
- 周囲温度 20 °C/68 °F、気圧 1 気圧で動作(これは重要であり、熱スロットリングに直接影響します)
- コアとメモリは、サーマルスロットリングに関する限り、温度平衡で動作します(負荷時のコア/メモリクロック速度は、一定の40 dB(A)のノイズレベル(および対応するファン速度)の目標を与えられた場合、固定されたまま、または狭い範囲内で変化します)。
- 95パーセンタイルフレーム時間変動を8ミリ秒未満に維持する。これは、一般的なディスプレイリフレッシュレート60Hzでフレームの半分に相当する。
- GPU 使用率が 100% またはそれに近い状態で動作している (これはプラットフォームのボトルネックがないことを示すために重要です。ボトルネックがある場合、GPU 使用率は 100% を下回り、テスト結果はあまり意味がなくなります)
- データポイントごとに 3 回以上の実行から得られた平均 FPS およびフレーム時間の変動データ。各実行は 1 分以上で、個々のサンプルは平均値からの偏差が 5% 以下であることが必要です (理想的には、ベンダーの製品に大きな変動があると考えられる理由がある場合は特に、同じ時間の異なるカードをサンプリングする必要があります)。
- 1枚のカードの場合はFraps、内蔵フレームカウンタのいずれかで測定。SLI/CrossFireの複数カードの場合はFCATが必要
ご想像のとおり、基準となるパフォーマンスレベルはアプリケーションと解像度に依存します。しかし、これはテストを個別に繰り返し検証できる方法で定義されています。この意味で、これは真に科学的なアプローチと言えるでしょう。実際、私たちは業界関係者や愛好家の皆様に、私たちが実施するテストを繰り返し、相違点があればご指摘いただくようお願いしています。そうすることでのみ、私たちの仕事の完全性が保証されるのです。
このリファレンスパフォーマンスの定義は、オーバークロックや、特定のGPUがカードごとに異なる動作を示す可能性を考慮していません。幸いなことに、これが問題になるのはごく一部のケースに限られます。最新のサーマルスロットリング機構は、可能な限り多くの状況で最大フレームレートを引き出せるように設計されているため、カードはこれまで以上に限界に近い状態で動作しています。オーバークロックによって実用上のメリットが得られる前に、限界に達してしまうことがよくあります。
Unigine Valley 1.0は、この記事で広く使用しているベンチマークです。DirectX 11ベースの機能を多数備えており、非常に再現性の高いテストを生成します。また、3DMarkほど物理演算(ひいてはCPU)に依存しません(少なくとも全体テストと複合テストにおいては)。
ここで私たちは何をしようとしているのでしょうか?
この2部構成の記事では、ビデオカードのパフォーマンスエンベロープを構成する各要素を詳しく見ていくとともに、それらに関するよくある質問にお答えしたいと思います。入力遅延、表示のゴースト、ティアリングなど、ゲーム体験に関係するものの、フレームレートに限った話ではありません。また、これらの基準を用いてカードを比較したいと思っています。ご想像のとおり、この方法でのテストは非常に時間がかかります。しかし、得られる知見は努力に見合う価値があると考えています。だからといって、私たちのグラフィックカードレビューが変わるわけではありません。私たちは常に実験を続け、皆さんにもその過程を体験していただきたいと考えています。
グラフィックカードのパフォーマンスの定義については既に解説しましたが、本日の残りの部分では、方法論、垂直同期、ノイズ、そしてノイズレベル調整後のグラフィックカードのパフォーマンス、そして本当に必要なビデオメモリの量について考察します。パート2では、アンチエイリアシング技術、ディスプレイの選択による影響、PCI Expressリンクの様々な構成、そしてコストパフォーマンスについて考察します。
テストシステムのセットアップに移りましょう。他のレビューよりも特に、このページにはテスト自体に関する重要な情報が含まれているため、注意深く読むことをお勧めします。
現在のページ: 重要なパフォーマンス: グラフィックカードのラップタイムを超える
次のページ グラフィックカードの神話を打ち破る: テスト方法