68
Nvidia の新技術はベータ デモで VRAM 使用量を最大 96% 削減 — RTX ニューラル テクスチャ圧縮のようです…
Compusemble RTX ニューラルテクスチャ圧縮の初見(ベータ版)
(画像クレジット:Compusemble - YouTube)

NVIDIAのRTXニューラルテクスチャ圧縮(NTC)のベンチマークがついに完了し、実際の3Dワークロードにおける同技術の性能が実証されました。Compusembleは、RTX 4090上で1440pおよび4K解像度でNVIDIAの新しいメモリ圧縮技術をベンチマークし、従来のテクスチャ圧縮技術と比較して、NTCによるメモリテクスチャサイズが驚異の96%削減されることを明らかにしました。結果は以下のビデオでご覧いただけます。

Compusemble は NTC を「NTC を BCn にトランスコード」と「サンプル時の推論」の 2 つのモードでテストしました。前者は読み込み時にテクスチャを BCn にトランスコードし、後者は特定のビューをレンダリングするために必要な個々のテクセルのみを解凍することで、テクスチャメモリのサイズをさらに削減します。

DLSSアップスケーリングを有効にした1440p解像度では、「NTCトランスコードBCn」モードではテストアプリケーションのテクスチャメモリ使用量が272MBから98MBへと64%削減されました。一方、「NTCインファレンスオンサンプル」モードではテクスチャサイズがわずか11.37MBへと大幅に削減されました。これは、非ニューラル圧縮モードと比較してメモリ使用量が95.8%削減され、従来のニューラル圧縮モードと比較して88%の削減となります。

Compusembleのベンチマークでは、RTX Neural Texture Compressionを有効にするとパフォーマンスがわずかに低下することが明らかになりました。ただし、このベンチマークは現行世代のRTX 5090ではなく、前世代のRTX 4090でベータ版ソフトウェアを実行したため、新しいアーキテクチャではこれらのパフォーマンス低下が縮小する可能性があります。 

「NTC を BCn にトランスコード」モードでは、NTC をオフにした場合と比較して平均 FPS の低下はわずかでしたが、1% FPS の低下は、NTC を無効にした通常のテクスチャ圧縮よりも明らかに改善されました。「NTC のサンプルでの推論」モードでは最も大きな影響を受け、1,600 FPS 台半ばから 1,500 FPS 台半ばに低下しました。1% の低下は 840 FPS 台に大幅に低下しました。

1440pでは、DLSSアップスケーリングではなくTAAアンチエイリアシングを使用した場合、メモリ容量の削減は同じですが、GPUのパフォーマンス挙動は異なります。3つのモードはすべてDLSSよりも大幅に高速化し、ほぼ2000FPSで動作しました。「NTC inference on sample」モードでは、1%の低レートでも1300FPS台半ばで動作し、840FPSから大幅に向上しました。

当然のことながら、解像度を4Kに上げるとパフォーマンスが大幅に低下します。DLSSアップスケーリングを有効にすると、「NTCトランスコードBCn」モードでは平均FPSが1,100 FPS台、「NTC推論サンプル」モードでは平均1,000 FPSをわずかに下回ります。両モードとも1%の低フレームレートは500 FPS台でした。DLSSを無効にし、TAAアンチエイリアシングを適用したネイティブ解像度を選択すると、「NTCトランスコードBCn」モードでは平均FPSが1,700 FPS台、「NTC推論サンプル」モードでは平均FPSが1,500 FPS台まで上昇します。前者のNTCモードでは1%の低フレームレートが1,100 FPSをわずかに下回り、後者のモードでは1%の低フレームレートが800 FPSをわずかに下回りました。

Tom's Hardware の最高のニュースと詳細なレビューをあなたの受信箱に直接お届けします。

最後に、CompusembleはTAAを有効にした4K解像度で「NTC inference on sample」モードの協調ベクトルをテストしました。協調ベクトルを有効にした場合の平均フレームレートは1,500fps台でしたが、無効にした場合の平均FPSは650fpsをわずかに下回るまで低下しました。同様に、協調ベクトルを有効にした場合の1%低フレームレートは750fpsをわずかに下回り、無効にした場合の1%低フレームレートは400fpsをわずかに上回りました。

まとめ

Compusemble の RTX NTC ベンチマークでは、Nvidia のニューラル圧縮テクノロジにより、3D アプリケーションのメモリ テクスチャ フットプリントを大幅に削減できるものの、特に「サンプルの推論」モードではパフォーマンスが犠牲になることが明らかになりました。

DLSSとネイティブ解像度のパフォーマンス比較は、最も興味深い点です。ネイティブ解像度でのフレームレートの大幅な向上は、RTX NTCの処理に使用されるTensorコアに非常に大きな負荷がかかっていることを示しています。おそらくDLSSのアップスケーリング性能が阻害され、シェーダーコアのボトルネックとなる可能性があります。そうでなければ、DLSSモードはネイティブ4K TAAベンチマークよりも高いフレームレートで動作するはずです。

RTXニューラルテクスチャ圧縮は、少なくとも数年前から開発が進められてきました。この新技術は、従来のブロックトランケーションコーディング(BTC)ではなく、最新のNVIDIA GPUに搭載されたテンソルコアを用いて、3Dアプリケーションやビデオゲームのテクスチャを圧縮します。RTX NTCは、1990年代以来初のテクスチャ圧縮技術の大幅なアップグレードであり、現在のGPUで実行可能な解像度の最大4倍の高解像度テクスチャを実現します。

この技術はまだベータ版で、リリース日はまだ未定です。興味深いことに、NTCの最小要件は驚くほど低いようです。NVIDIAのRTX NTCに関するGitHubページによると、最小GPU要件はRTX 20シリーズGPUです。ただし、この技術はGTX 10シリーズGPU、AMD Radeon RX 6000シリーズGPU、Arc AシリーズGPUでも動作することが検証されており、RTX以外のGPUやコンソールでも主流になる可能性を示唆しています。

Aaron Klotz 氏は Tom's Hardware の寄稿ライターであり、CPU やグラフィック カードなどのコンピューター ハードウェアに関するニュースを扱っています。