76
Nvidia GeForce RTX 5090 と RTX 4090 の比較 — 新しい Halo GPU は前モデルと比べてどうでしょうか?
Nvidia GeForce RTX 5090 ファウンダーズエディション
(画像提供:Tom's Hardware)

Blackwell RTX 50シリーズGPUは、2022年後半に発売されたRTX 40シリーズAda Lovelace GPU以来、2年以上もの長きにわたる待望の製品です。NvidiaはCES 2025の基調講演で、今後発売予定のGeForce RTX 50シリーズカードを発表し、仕様、価格、そしてパフォーマンスのプレビューまで公開しました。DLSS 4などの新技術が大きな役割を果たし、大きな期待が寄せられています。新たな主役として、RTX 5090はRTX 4090の後継機となり、メモリ、コンピューティング、機能、そしてパワーを増強しています。まだ発売されていませんが、発売前に分析する価値のある要素が数多くあります。

RTX 5090は、発売されたら最高のグラフィックカードの一つになるのでしょうか?「最高」が「最速」を意味するのであれば、間違いなく前モデルを上回るでしょう。2倍速になるでしょうか?パフォーマンスの測定方法によってはそうかもしれませんが、それは従来のレンダリングとは異なるAI技術に大きく依存していると言えるでしょう。さあ、私たちが知っているスペックと機能を掘り下げ、GPU界の新旧の王者を比較してみましょう。

スワイプして水平にスクロールします

グラフィックカードRTX 5090RTX 4090
建築GB202西暦102年
プロセスノードTSMC 4NPTSMC 4N
トランジスタ(10億個)9276.3
ダイサイズ(mm^2)744608.4
SMS170128
GPUシェーダー2176016384
テンソルコア680512
RTコア170128
ブーストクロック(MHz)24072520
VRAM速度(Gbps)2821
VRAM(GB)3224
VRAMバス幅512384
L2キャッシュ128ですか?72
レンダリング出力単位240ですか?176
テクスチャマッピングユニット680512
TFLOPS FP32(ブースト)104.882.6
TFLOPS FP16 (INT8 TOPS)1676年?(3352)661 (1321)
帯域幅(GB/秒)17921008
TBP(ワット)575450
発売日2025年1月2022年10月
発売価格1,999ドル1,599ドル

まずはスペックから見ていきましょう。RTX 5090は170基のBlackwellストリーミングマルチプロセッサ(SM)を搭載しており、4090は128基です。これはGPUコア数が33%増加したことを意味します。CUDAコア、テンソルコア、RTコア、テクスチャユニットなどの数はSM数に直接関係するため、全体では基本的に33%の増加となります。

ただし、クロック速度も影響しており、4090のブーストクロックは2520MHzであるのに対し、(計算とNvidiaの公式仕様に基づくと)ブーストクロックは2407MHzです。つまり、純粋なコンピューティング性能では、5090は4090に対して「わずか」27%の向上しか提供していないことになります。ただし、これは他のアーキテクチャ上の違いがないという前提であり、これはほぼ確実に妥当な仮定とは言えません。

RTX 5090は、GDDR7とより大型で強力なチップのおかげで、メモリ容量、速度、帯域幅のすべてが向上しています。RTX 5090は4090よりもVRAMが33%多く、クロックも33%高く、結果として生の帯域幅が78%向上しています。L2キャッシュのサイズや、帯域幅に影響を与える可能性のあるその他の変更点については不明ですが、どちらも重要な考慮事項です。それでも、生のメモリ帯域幅が大幅に増加していることは明らかです。

NvidiaはRTX 50シリーズでAIに大きく賭けており、最も大きな変化のいくつかはここに見られます。RTX 4090は、FP16テンソル演算(スパースあり)で661TFLOPS、INT8テンソル演算(これもスパースあり)で1321TOPS(テラオプス)の性能を備えています。これは、FP16/INT8演算(スパースなし)でわずか123TFLOPS/TOPSのAMD RX 7900 XTXをはるかに上回ります。しかし、RTX 5090と比べるとまだ見劣りします。

FP16の数値は不明ですが、Nvidiaが前世代と同じ比率で開発を進めると仮定すると、RTX 5090は最大1676 TFLOPSのTensor FP16演算性能、そしてその倍の3352 TOPSのTensor INT8演算性能(いずれもスパース性あり)を実現します。これは、新世代のAI演算性能が154%(2.54倍)向上したことを意味します。そして、NvidiaはAIの潜在能力を最大限に活用しようとしています。

Nvidia GeForce RTX 5090のパフォーマンス(Nvidiaによる)

(画像提供:Nvidia)

以前お伝えしたように、Nvidia DLSS 4はBlackwellの新機能を活用してAIアルゴリズムを強化します。マルチフレーム生成は「未来を予測」し、レンダリングされた(場合によってはアップスケールされた)1つのフレームから最大3つの追加フレームを生成します。補間ではなくフレーム投影を使用しているため、遅延によるペナルティはDLSS 3のフレーム生成で既に見られたのとそれほど変わらないはずですが、追加フレームによってすべてがよりスムーズに見えるようになります。

実際、どんな感じでしょうか?まだ私たち自身でテストする機会がないので、最終的な判断は控えますが、かなり懐疑的です。おそらくうまく動作するでしょうが、ユーザー入力に基づいてレンダリングされた1フレームの後に、新しいユーザー入力なしでAIが生成した3フレームが続くと、すべてのフレームで新しいユーザー入力を受け付け、完全にレンダリングされるゲームと同じ感覚にはならないでしょう。

他にも変更が予定されていますが、Blackwell RTX 5090専用のものもあれば、旧型のRTXカードでも動作するものもあります。RTX Neural Materialsは、AIによる圧縮と学習技術を用いることで、ゲームで使用されるテクスチャやマテリアル記述に必要なメモリを約3分の1削減するようです。ただし、この機能を実現するには、ハードウェアパイプラインがシェーダーとAIを併用できる必要があるため、これも50シリーズ限定の機能となります。

一方、DLSS Transformerアップスケーリングは、以前のDLSSアップスケーリングアルゴリズムで使用されていた畳み込みニューラルネットワーク(CNN)ではなく、AIトランスフォーマーに基づいて構築された新しくトレーニングされたネットワークを使用します。トランスフォーマーはAI革命の中核を担っており、ChatGPT、DALL-E、その他のAIコンテンツジェネレーターなどを支えています。Nvidiaが公開した新旧DLSSアップスケーリングのサンプル動画は非常に印象的で、ぜひ実際に試してみたいところです。さらに、新しいDLSS Transformerアルゴリズムは、従来のCNNバージョンよりも高速に動作し、すべてのRTX GPUで利用可能になります。

Nvidia自身のパフォーマンスプレビューでは、RTX 5090はRTX 4090の最大2倍の速度になると示唆されていますが、DLSS 4やDLSS 3が1回も使用されていないゲームがいくつかあり、その差は曖昧になっています。Far Cry 6の結果を見ると、新しいAI機能を考慮していないゲームでは、5090は4090よりも約27%高いパフォーマンスを発揮するようです。A Plague Tale: Requiemでは、その差は約43%に拡大します(はい、ピクセル数もカウントしています!)。一方、DLSS 4 MFG(DLSS 3 FGに対して)を使用するゲームでは、Nvidiaは2.3倍から2.45倍の向上を示しています。

RTX 5090は、高価格に見合う価値があると言えるのでしょうか?それとも、そうでないのでしょうか?それは、あなたが何をしているかによって大きく左右されるでしょう。AIに関心を持つ個人や企業は、1,999ドルでRTX 5090を購入できるチャンスに飛びつくでしょう。こうした人々は、ここ数年、RTX 4090カードを購入してきました。Flux.devを用いた生成AIテストでは、5090はパフォーマンスが2倍も向上したことが示されています。

しかし、もしあなたが主にゲームをプレイしていて、フレーム生成が苦手なら、しばらく様子を見るのも悪くないかもしれません。DLSS 4が実際に使用された場合、見た目も感触も素晴らしいものになるかもしれません。あるいは、新しい16ピンコネクタから最大575Wの電力を引き出すことで、メルトゲート第2弾が発生するかもしれません。しかし、どう考えてもゲーミングGPUに2,000ドルというのは高額です。RTX 5090に電力を供給し、ゲームアップデートを継続的に提供するには、非常に高性能なPCが必要になるため、PCの他の部分もその性能を十分に発揮できるものにしたいはずです。

Tom's Hardware の最高のニュースと詳細なレビューをあなたの受信箱に直接お届けします。

ジャレッド・ウォルトンは、Tom's Hardwareのシニアエディターで、GPU全般を専門としています。2004年からテクノロジージャーナリストとして活躍し、AnandTech、Maximum PC、PC Gamerなどで執筆活動を行っています。初代S3 Virgeの「3Dデセラレータ」から最新のGPUまで、ジャレッドは最新のグラフィックストレンドを常に把握しており、ゲームパフォーマンスに関する質問は彼にお任せください。