32
入力遅延は、フレームジェネレーター強化ゲームパフォーマンス分析で頻繁に欠落している部分です。
GeForceグラフィックカードのフレーム生成の図
(画像提供:Nvidia)

PCグラフィックスは急速に変化しています。AIや「ニューラル」レンダリング技術によって生成されるピクセル数はますます増えています。DLSS、FSR、XeSSアップスケーラーを使えば、画質をわずかに犠牲にすることなく、フレームレートを自在に向上させることができます。特にNvidiaのBlackwellカードに搭載されているマルチフレーム生成技術といったフレーム生成技術を使えば、ゲーム内のスイッチ一つでフレームレートをさらに高めることができます。

MFGを適切に実装すれば、ゲームプレイ体験を向上させることができると考えています。例えば、 『Alan Wake II』『サイバーパンク2077』といった圧倒的なゲームを例に挙げてみましょう。高リフレッシュレート、可変リフレッシュレートのモニターで、どちらのゲームも45~50fpsで動作させると、モニターの低フレームレート補正機能の助けを借りても、非常にカクカクした表示になります。

Blackwellのマルチフレーム生成技術は、出力フレームレートをディスプレイのリフレッシュレート範囲よりはるかに高い値に引き上げることで、ぎこちない映像をスムーズな体験に変えます。MFGの継ぎ目がまだ見える場合もありますが、よりスムーズな出力と引き換えに許容できるトレードオフだと考えています。

ただ一つだけ問題があります。MFG を使用したゲームは見た目は滑らかになりますが、操作感は必ずしも向上しない可能性があります。これは、入力遅延がベースゲームループの実行速度に左右されるためです。DLSS などのアップスケーラーはベースラインパフォーマンスを向上させることでこの遅延を改善できますが、フレーム生成と MFG ではそれができません。

このレイテンシを少なくとも大まかに捉えるツールは既に存在します。Nvidia独自のFrameViewアプリケーションは「PCレイテンシ」メトリックを提供しており、IntelのPresentMonは「全入力からPhotonまでのレイテンシ」と呼ばれる測定値を公開しており、これは全体的なパフォーマンスログの一部としてオプションでキャプチャできます。

Tom's Hardware の最高のニュースと詳細なレビューをあなたの受信箱に直接お届けします。

これら 2 つのアプリケーションにはゲームと GPU ベンダーの互換性に関する落とし穴があり、完全にソフトウェア ベースのメトリックについては若干の懸念がありますが、これらのメトリックからのレイテンシ測定値が高いほど、ゲームプレイのエクスペリエンスが著しく悪くなるという相関関係があり、これは出発点としては十分です。

Nvidia フレーム

(画像提供:Nvidia)

最も重要なのは、この測定値をフレームジェネレーターで強化された出力と併せて伝えることで、より誠実なマーケティングにつながるということです。NVIDIAはこれを認識しているようで、 RTX 5090と同時にMFGを導入した際、『サイバーパンク2077』 でPCの低レイテンシーを利点として宣伝していました。対照的に、最近発売されたRTX 5050のMFG重視の公式マーケティング資料には、この項目が明らかに欠落しています。

いずれにせよ、グラフィック カードがそもそも入力から光子までの遅延の低減に貢献していない場合、framegen または MFG を使用して出力フレーム レートを上げ、その数値だけを伝えても、全体像はわかりません。

私たちは、この遅延を定量化することで、出力フレーム レートが生のパワーではなくゲーム内の設定を好みに応じて切り替えることに重点が置かれるようになる将来におけるゲームのプレイがどのようなものかを、より根拠を持って説明できるかどうかを確認したかったのです。

カードをテーブルに出す

ここでの提案は、特に独創的ではありませんが、いずれにせよ明確にしておく必要があるものです。framgen を有効にした場合、許容可能な最大遅延閾値(MALT と呼びます)があり、それを超えるとゲームがユーザー入力からどんどん乖離しているように感じられ始めるというものです。この不快な動作は、「ラバーバンド現象」や「スイミー現象」など、様々な形で現れます。

フレーム生成のパフォーマンスについて話すとき、企業やテスターは、出力フレーム レートを向上させるためにこれらの手法を使用する際に、「許容できる」と判断した MALT を含めるべきだと私たちは考えています。

MALTが低い場合、より高性能なハードウェアやゲーム内設定の軽量化など、より高いベースラインパフォーマンスが必要になります。そして、MALTが一定値を超えると、良好なインタラクティブ体験を確保できなくなります。

優れたMALTとはどのようなものでしょうか?それはゲームやゲームの種類によって異なる可能性があります。Alan Wake IIとMFGでの経験から、入力から光子までの遅延が30ミリ秒未満であれば良好、30~45ミリ秒であれば快適、45~60ミリ秒であれば実用的、それより大幅に高いと、ラバーバンド現象や入力と出力の不連続性が顕著に現れ始めると推測されます。

なぜフレームレートをプロキシとして使うのではなく(つまり、MFGを有効にするために60 FPSを「十分な」基準とするのではなく)、この遅延を直接測定するのでしょうか?おそらくエッジケースでしょうが、Nvidiaは、直感的に「十分」と思われるフレームレートが許容可能な入力遅延と一致しないという事例を少なくとも1件指摘しています。同社はMicrosoft Flight Simulatorをネイティブで50 FPSで動作させているにもかかわらず、入力遅延が172ミリ秒であることを観察しました。

つまり、測定できるものなら測定しましょう。

Nvidia フレーム

(画像提供:Nvidia)

周辺機器、コンポーネント、モニターの種類が膨大であるため、実現可能な遅延の閾値もシステムごとに異なる可能性があります。入力遅延に対する許容度も、私たちの許容度よりも厳しい場合もあれば、緩い場合もあります。PresentMonとFrameViewは無料ですので、ご自身でテストする際にかかるコストは時間だけです。

この記事のテストベッドでは、次のコンポーネントを使用しています。

スワイプして水平にスクロールします

CPU

ライゼン 9 7950X

マザーボード

ASUS TUF ゲーミング X670E-Plus WiFi

ラム

32GB

SSD

インランドゲーミングパフォーマンスプラス4TB NVMe(PCIe 4.0)

電源

コルセア RM1000x

モニター

ASUS ROG Strix XG27UCS (4K、160 Hz)

キーボード

HyperX アロイ オリジンズ 65

ねずみ

ロジクール G502

MALT正規化パフォーマンスの調査

329ドル程度のRTX 5060 Ti 16GBでも、DLSSとMFG 4Xを有効にした状態で『Alan Wake II』を1440pで200fpsまでプレイできる時代において、私たちは独自のアドバイスに従ってMALTに正規化した場合のパフォーマンス分析がどのようになるかを確認したいと考えました。閾値として60ミリ秒を選択し、様々な最新GPUでその範囲内に収まるように設定を調整できるかどうかを検討しました。

結果は極めて直感的です。最初の列は、同じ設定でより高性能なグラフィックカードにアップグレードした場合のシステムレイテンシを示しており、2番目の列は、そのヘッドルーム内で60msの入力レイテンシのしきい値を超えずに選択できるより高い設定を示しています。このグラフをZ字型に読むことで、同じMALTでより高性能なカードを使用することで得られるパフォーマンスの向上を理解できます。

スワイプして水平にスクロールします

Alan Wake II - 平均入力遅延 60 ミリ秒に正規化されたパフォーマンス

n-1設定でのFrameView PCのレイテンシ

ゲーム内設定を変更して、MFG 4X(高ラスタープリセット)で約 60 ms MALT に到達します。

MFG 4Xと60ms MALTを使用した場合の平均出力フレームレート

RTX 5060 Ti 16GB

N/A – ベースライン

2560x1440 ターゲット、DLSS Ultra Perf、RT なし

192FPS

RTX 5070

約39ミリ秒

2560x1440 ターゲット、DLSS パフォーマンス、低 RT

202FPS

RTX 5070 Ti

約47ミリ秒

2560x1440 ターゲット、DLSS 品質、中 RT

194FPS

RTX 5080

約55ミリ秒

3840x2160 ターゲット、DLSS ウルトラパフォーマンス、高 RT

190FPS

RTX 5090

約42ミリ秒

3840x2160 ターゲット解像度、DLSS バランス、Ultra RT

190FPS

少なくとも、 Alan Wake II用により強力な GPU を購入すると、特定の設定グループで 60 ms MALT の場合よりも低い入力遅延と高い出力フレーム レートを直感的に享受でき、同じ 60 ms しきい値でより高い解像度と画質の設定を享受できます。

ここでのポイントは、Alan Wake IIのようなスローペースのゲームでは入力レイテンシを可能な限り低くする必要がない場合は、フレーム生成でレイテンシに余裕がある限り、GPUリソ​​ースを高解像度の出力やより豊かなビジュアルに振り向けることが賢明だということです。この数値を監視することで、設定した設定が不快な体験につながる場合は、設定を調整することもできます。

MFG でパフォーマンスを微調整する際の課題の一つは、DLSS 品質設定がサードパーティ製ツールを使わずに現状では 5 段階の粗調整しか提供されていないことです。DLSS の中間設定がもっとあれば、特定のグラフィックカードのレンダリングリソース内で画質を最大限に高めながら、60 ミリ秒のしきい値よりも低い入力遅延(例えば、Ultra Performance と Performance の中間値を想定)を実現できる可能性があります。NVIDIA が将来、MFG を最大限に活用できるよう、より細かな DLSS 粒度をネイティブに提供する方法を検討してくれることを期待しています。

MALTedマーケティング

レイテンシとフレームレートを併せて考えることで、大胆な疑問を分析する助けにもなります。それは、「MFGはローエンドのGeForceカードがハイエンドの先行モデルを「打ち負かす」ことを許しているのだろうか?」という問いです。Nvidiaは、DLSS 4機能をフルに活用すればRTX 5070がRTX 4090に勝てると悪名高い主張をしました。私たちはその主張をそのまま検証したわけではありませんが、RTX 5080とRTX 4090を比較し、その違いが実際にあるかどうかを検証しました。

高ラスター設定、ウルトラ RT、4K ターゲット解像度でAlan Wake IIの 60 ms MALT に正規化すると、RTX 5080 は、このターゲット入力レイテンシを実現するために DLSS ウルトラ パフォーマンスを使用する必要がありますが、Ada フラッグシップでは、同じレイテンシで DLSS パフォーマンスを使用して画質を向上させることができます。

最高のグラフィックカード:GeForce RTX 4090 FE

(画像提供:Tom's Hardware)

もちろん、大きな違いは、MFG 4XによりRTX 5080がDLSS Ultra Performanceで190fpsの高速出力を実現していることです。これは理論上、RTX 4090のDLSS Performanceでの97fpsよりもはるかにスムーズな出力となります。この滑らかさの違いは、出力フレームレートから想像されるほど劇的ではありませんが、160Hzモニターではこの改善の真価が十分に伝わらない可能性があります。

両方のカードでDLSS Ultra Performanceを使用すると、RTX 4090のPCレイテンシーは25%低下し、平均46msとなり、出力フレームレートは133fpsに向上します。RTX 4090の2倍フレーム生成出力は、同じ設定でMFG 4Xを使用したRTX 5080にはまだ及ばないものの、RTX 4090はRTX 5080よりも全体的な入力レイテンシーが大幅に低く、より応答性の高いエクスペリエンスを好む人もいるかもしれません。

入力レイテンシと出力フレームレートの両方を合わせると、RTX 5080は理論上はよりスムーズな出力を実現できますが、RTX 4090ユーザーはこの点だけでアップグレードすべきではないでしょう。また、出力フレームレートだけを計測しているのでない限り、RTX 5080よりもローエンドのカードでもRTX 4090のゲーミング体験に匹敵、あるいは凌駕できるという大胆な主張には、確かに冷水が注がれることになります。

Nvidia フレーム

(画像提供:Nvidia)

ここで、最近発売されたRTX 5050に関するNvidiaのマーケティング資料について触れておきたい。掲載されているチャートを見ると、同社はeスポーツ以外のタイトルではベースラインフレームレートを低く設定しているようだ。サイバーパンク2077AvowedはどちらもMFG 4Xで約160fpsの上限に達しており、平均ベースラインは約40fpsとなっているようだ。

繰り返しになりますが、フレームレートと特定のゲームの入力遅延を結び付ける際に、直感が必ずしも役に立たないことは既に述べました。NVIDIAが40fps程度を実現するために設定を調整した際に、許容できる遅延の閾値を見出していた可能性も十分にあります。しかし、このように限界値を超えているように見える場合、こうした仮定を明らかにすることがより重要になります。

IntelはXeフレーム生成技術の使用に最低40fpsを推奨していますが、これは統合グラフィックスで優れたエクスペリエンスを求める開発者向けの数値です。ハイエンドグラフィックカードの場合、Intelは60fpsを基準とするのが理想的だと示唆しています。AMD、 FSR 3フレーム生成を使用する前のパフォーマンス目標として60fpsを推奨しています(さらに、「30fps未満のフレームレートの事前補間は絶対に避けるべき」とも警告しています)。

NvidiaはMFGで使用するための推奨フレームレートを私たちが調べた限りでは提供していませんが、IntelやAMDの手法にはない独自の秘策を秘めています。DLSS 4のNvidia Reflexには、VRで既に知られている再投影技術であるフレームワープが搭載されています。フレームワープは、様々なデータソースを用いて出力フレームをユーザーの最新の入力に近づけることで、体感される遅延を軽減します。

フレームワープとそれがもたらす知覚的な遅延削減により、MFGはXeFGやFSRよりも低い入力フレームレートを許容できる可能性があります。しかし、繰り返しますが、これらの仮定は測定可能であり、明確に伝える必要があります。結局のところ、NVIDIAのフレーム生成ソリューションが、RTX 5050のようなローエンドハードウェアにおいて、より高い入力遅延を堅牢に許容し、少ないリソースでより多くの処理を実行できるのであれば、それは他のフレーム生成アプローチに対する競争上の優位性となります。

結論 - 今のところ

これらすべてを念頭に置き、フレーム生成がますます普及している世界において、GPUのパフォーマンスについてどう考えるべきでしょうか? MFG は、より強力な GPU が不要になったり、ローエンドのパーツが魔法のようにハイエンドのものを凌駕したりすることを意味するものではありません。これは、スタックの上位カードへの優位性というよりも、既に購入しているパワーにさらに華を添えるようなものなのです。

ハイエンドの GPU は、同じ入力遅延でより優れた画質を提供したり、同じ設定ではるかに低い入力遅延を提供したりできますが、画像のアップスケーリングを行ったとしても、要求の厳しいゲームをより高い出力解像度で実行するには、依然としてそのパワーが必要です。

また、同じベンダーの製品であっても、フレーム生成技術はすべて同じではないことを覚えておくことが重要です。Nvidia Adaカードのフレーム生成は、MFGを使用したBlackwellのフレーム生成よりも私たちの目には少し劣っています。また、DLSS 4のMFGには、他のベンダーのソリューションにはない再投影などの技術が含まれています。この記事ではFSRやXeSSのフレーム生成をテストしていませんが、これらの技術には、MFGの3倍および4倍の乗算器が提供する、出力フレームレートをモニターのフレームレートに適切に合わせる柔軟性がありません。

この点に関して、MFGは、比較的入手しやすいグラフィックカードであっても、今日の高リフレッシュレートモニターでゲームのスムーズさを向上させるための架け橋と考えるのが最善策だと考えています。例えば、1440p 240Hzモニターはかつては非常に高価でしたが、今では300ドル以下で購入できます。GPUパワーのコストは、高リフレッシュレートモニターのコストと同じペースで下がっているわけではないことは明らかです。

329ドル以上のRTX 5060 Ti 16GBなら、DLSS Ultra PerformanceとMFG 4Xを併用すれば『Alan Wake II』で1440pで200fpsを実現できることを思い出してください。同じ設定でMFGを使わずに同じパフォーマンスを実現するには、3000ドル以上のRTX 5090が必要です。実際に試してみたので、その違いは明らかです。

可能な限り低い入力遅延と高い出力フレーム レートの両方を必要とする e スポーツのプロでない限り、同等の GPU に 3,000 ドルを費やすことなく、モニターのリフレッシュ レート範囲のより高い範囲を使用できるのは非常にすばらしいことです。

MFG を「プレイ可能な」出力フレームレートを実現するための手段として捉えるのは、最悪考え方です。これは誤った目標設定です。フレーム生成前の 20 FPS というプレイ不可能なフレームレートで動作するゲームを、MFG を使って魔法のように「プレイ可能な」 60 FPS や 80 FPS にまで高速化することはできません。なぜなら、そのような低いネイティブフレームレートでは入力遅延が許容基準を超えてしまう可能性が高いからです。

全体として、私たちの簡潔な調査から、フレームジェネレーションがますます普及する将来においては、ベンダーとメディアの双方が、フレームジェネレーションによるパフォーマンス向上について語る際に想定している入力遅延の基準をより明確にする必要があることが示唆されます。いずれの陣営も、エンドユーザーが実際に快適に視聴するには低すぎる入力フレームレートと高すぎる入力遅延を前提としたマーケティング資料やパフォーマンス/画質分析を作成してしまう可能性は十分にあります。

Tom's Hardwareのグラフィックス担当シニアアナリスト、Jeff Kampmanは、GPU、ゲームパフォーマンスなど、あらゆる分野を網羅しています。統合型グラフィックスプロセッサからディスクリートグラフィックスカード、そしてAIの未来を支えるハイパースケールシステムまで、GPU搭載のものなら何でもJeffが担当します。