MicrosoftのDirectStorage APIは、GPU解凍時に奇妙なパフォーマンスの癖を示すことが知られています。しかし、YouTuberのCompusembleは、NVIDIAの最新GeForce RTX 5090 GPUは、前世代のRTX 4090よりもGPU解凍の処理能力に優れており、GPU解凍とCPU解凍のパフォーマンス差が小さいと主張しています。
このYouTuberは、DirectStorage(DS)対応の2つのゲーム、『ラチェット&クランク:リフトアパート』と『スパイダーマン2』のベンチマークテストを行いました。これらのゲームは、 DirectStorageのGPU解凍とCPU解凍を使用し、RTX 5090で4K、1440p、1080p解像度でテストされました。なお、 DSがパフォーマンスの低下を引き起こすという前提に 基づき、比較のためにRTX 4090のテストは示されていません。
スワイプして水平にスクロールします
ゲーム | 平均FPS | 1% 低い FPS |
|---|---|---|
ラチェット&クランク:4K | -0.95% | -8.48% |
ラチェット&クランク:1440p | +1.19% | +5.26% |
ラチェット&クランク:1080p | +0.48% | +11.11% |
スパイダーマン2: 4K | -7.58% | -9.53% |
スパイダーマン2: 1440p | -3.41% | -12.50% |
スパイダーマン2: 1080p | -3.19% | -8.45% |
一方、『スパイダーマン2』では、3つの解像度全てにおいてGPU解凍がパフォーマンスに有利な結果を示しました。4K解像度では、RTX 5090はCPU解凍を使用した場合、平均FPSが8.2%向上し、1%ローでは10.53%向上しました。1440p解像度では、CPU解凍は平均FPSが3.53%向上し、1%ローでは14.29%向上しました。最後に、1080p解像度では、CPU解凍はGPU解凍と比較して、平均FPSが3.3%向上し、1%ローでは9.23%向上しました。
Consumable は、RTX 5090 のパフォーマンスは、旧型の RTX 4090 と比較して、GPU 解凍と CPU 解凍のどちらでも一貫していると主張しています。彼が録画した古いビデオは彼の主張を裏付けており、特にスパイダーマン 2 では、CPU 解凍と GPU 解凍を切り替えると RTX 4090 のパフォーマンスの低下が大きいことを示しています。スパイダーマン 2 で 4K の RTX 4090 を使用すると、CPU 解凍により平均フレーム レートが 10.34% 高くなり、1% 低下すると 17.95% 高くなりました。1440p では、CPU 解凍により平均フレーム レートが 6.25% 高くなり、1% 低下すると 18.87% 高くなりました。1080p では、CPU 解凍により平均フレーム レートが 3.25% 高くなり、1% 低下すると 25.86% 高くなりました。
RTX 5090は、FP32演算性能(105 TFLOPS vs. 83 TFLOPS)とメモリ帯域幅(1.8 TB/s vs. 1.0 TB/s)の両方で優れているだけでなく、VRAM容量も33%増加していることを考えると、これらはすべてGPU解凍の影響を軽減するのに役立つ可能性があります。RTX 5090は512ビット幅のメモリインターフェースと28 Gbps GDDR7メモリモジュールを誇り、RTX 4090よりも78%高いメモリ帯域幅を実現しています。GPU解凍はメモリシステムに非常に大きな負荷をかけます。解凍プロセスを実行するには、アセットをGPUメモリにストリーミングする必要があるためです。
もちろん、シェーダー計算は依然として重要なので、5090がCPUの限界に完全に依存してしまうような低解像度では、解凍処理のための余裕サイクルも確保できるのは理にかなっています。しかし、原因が何であれ(アーキテクチャも影響している可能性があります)、5090は4090ほどGPUによる解凍を気にしていないようです。それでも、私たちが望むのは、より多くのゲームがDirectStorageを使用してロード時間と全体的なパフォーマンスを向上させることです。ロード時間が多少長くなっても、フレームレートが不安定になるよりはましです。
Tom's Hardware の最高のニュースと詳細なレビューをあなたの受信箱に直接お届けします。
Aaron Klotz 氏は Tom's Hardware の寄稿ライターであり、CPU やグラフィック カードなどのコンピューター ハードウェアに関するニュースを扱っています。