83
Nvidia の GeForce RTX 5070 は 549 ドルで、前世代の RTX 4070 と比べてどうでしょうか?
Nvidia GeForce RTX 5070 発表
(画像提供:Nvidia)

NvidiaはCES 2025の基調講演で、近日発売予定のGeForce RTX 50シリーズBlackwell GPUを公式発表し、大きな話題を呼びました。Halo RTX 5090は確かにモンスター級の性能ですが、多くの人にとって主役となるのは、549ドルで販売される(それなりに)メインストリーム向けRTX 5070でしょう。RTX 4070は発売以来、最高のグラフィックカードの一つであり、今、その後継機が登場します。

Nvidiaは、5070は「RTX 4090」と同等のパフォーマンスを、約3分の1の価格と半分強の消費電力で実現すると主張しています。しかし、実際にはどうなのでしょうか?また、5070は既存のRTX 4070と比べてどうなのでしょうか?さあ、調べてみましょう。現時点では推測に基づく部分もありますが、仕様の大部分は正確です。

スワイプして水平にスクロールします

グラフィックカードRTX 5070RTX 4090RTX 4070
建築GB205西暦102年西暦104年
プロセスノードTSMC 4NPTSMC 4NTSMC 4N
トランジスタ(10億個)?76.332
ダイサイズ(mm^2)?608.4294.5
SMS4812846
GPUシェーダー6144163845888
テンソルコア192512184
RTコア4812846
ブーストクロック(MHz)251225202475
VRAM速度(Gbps)282121
VRAM(GB)122412
VRAMバス幅192384192
L2キャッシュ48歳?7236
レンダリング出力単位64歳?17664
テクスチャマッピングユニット192512184
TFLOPS FP32(ブースト)30.982.629.1
TFLOPS FP16 (INT8 TOPS)494 (988)661 (1321)233 (466)
帯域幅(GB/秒)6721008504
TBP(ワット)250450200
発売日2025年2月?2022年10月2023年4月
発売価格549ドル1,599ドル599ドル

まず、はっきりさせておきたいのは、RTX 5070があらゆるワークロードでRTX 4090に匹敵するという考えは、あまりにも楽観的に見えるということです。NvidiaがBlackwellでAIに力を入れていることは明らかで、DLSS 4をはじめとするニューラルレンダリング技術でその差を埋めようとしているのです。しかし、パッチやアップデートを必要とせずにより高いパフォーマンスを実現するドライバー側ソリューションがない限り、多くの既存ゲームでは、グラフィックスカードのスペックそのものが依然として重要です。

RTX 5070 には 48 個の SM が搭載されますが、4070 には 46 個の SM が搭載されます。これはまったく大きな変化ではなく、4090 の 128 個の SM とは大きく異なります。全体的な FP32 グラフィックス コンピューティングは、5070 で 31 TFLOPS、4070 で 29 TFLOPS、4090 で 83 TFLOPS になります。一般に、DLSS 4 や関連テクノロジを活用せずに 5070 の性能が 4090 に近づくことは非常に困難です。

VRAMも考慮する必要があります。4090は24GBですが、4070と5070はその半分です。12GBでも足りないゲームはそれほど多くありませんが、「インディ・ジョーンズ・アンド・ザ・グレート・サークル」はフルRTでアップスケーリングなしで4K解像度で12GBを超えます。今後、より高い解像度や設定で12GBを超えるVRAMを使用するゲームが増える可能性があります。

ここで「RTXニューラルマテリアル」が活躍する可能性があります。これは、NVIDIAが2023年に発表したニューラルテクスチャ圧縮の有効化であり、ゲームに完全に実装されることを意味します。これはどんなゲームでも動作するのでしょうか?NVIDIAのCEO、ジェンスン・フアン氏は質疑応答で、答えは「ノー」だと述べました。将来のゲーム(またはゲームパッチ)でこの機能を有効にするには、コンテンツクリエイターによる作業が必要になります。NTCやRTXニューラルマテリアルがなければ、12GBのメモリでは5070が4090に匹敵することはまずないでしょう。

帯域幅も考慮する必要があります。RTX 4090は384ビットインターフェースで21Gbps GDDR6Xを搭載していますが、5070は192ビットインターフェースで28Gbps GDDR7を搭載しています。つまり、4090の帯域幅は1008GB/秒、5070は672GB/秒です。繰り返しますが、NTCやニューラル素材がなければ、高解像度には対応できません。

LLMのようなAIワークロードも、大容量のVRAMを必要とします。量子化だけでは限界があり、LLMのニューラル圧縮は(私たちの知る限り)不可能です。24GBのVRAMを搭載したRTX 4090は、5070よりも大きなLLMをロードできますが、AIモデルのサイズに関しては4070に匹敵する程度です。

AIの計算性能を見ると話は別です。RTX 50シリーズはFP4数値形式をサポートすることは分かっていますが、それと同じくらい重要なのは、テンソルコアあたりの演算能力がRTX 40シリーズの2倍であるように見えることです。これは5070が4090を上回るには不十分ですが、理論上の性能では「わずか」25%程度遅いだけです。また、4090がFP8を使用する必要があるところで5070がFP4を活用できる場合、5070の方がより高速に動作する可能性があります。しかし、INT8 TOPSでさえ4090が優位です。

最大の問題は、もちろん価格です。1,599ドルのグラフィックカードを買う余裕のないゲーマーはたくさんいます。ましてや、現在4090が2,000ドル以上で販売されているのは、品薄状態によるものです。549ドルのGPUは、たとえほとんどのゲームで遅いとはいえ、全く別の話です。Nvidiaのxx70クラスGPUは伝統的に主流ゲーマーにとってのスイートスポットであり、5070もその傾向を引き継ぐと思われます。4090に勝てなくても、RTX 4080に近いパフォーマンスを安定して提供できれば、5070は最終的に大成功を収めるはずです。

しかし、結局のところ、すべてはAI機能とDLSS 4にかかっています。私たちはまだマルチフレーム生成を試していませんが、DLSS 3のフレーム生成を経験した上で、せいぜい懐疑的です。DLSS 3では、レンダリングされた1つのフレームから最大3つのフレームと、モーションベクターなどのデータを生成します。しかし、DLSS 4ではそれらのフレームをより高速に生成します。また、Q&Aでジェンセン氏が述べたように、DLSS 4は「未来を予測する」ため、最終的なレイテンシはDLSS 3のフレーム生成よりも悪くなく、フレーム数が増え、見た目も滑らかになるはずです。

マルチフレーム生成よりもはるかに有望なのは、DLSSのアップスケーリングとレイコンストラクションの機能強化とアップグレードだと私たちは考えています。これまでDLSSは、AIのトレーニングと推論にCNN(畳み込みニューラルネットワーク)を使用していました。現在、トランスフォーマーベースの新しいモデルが登場しており、これは既存のDLSS 2/3ゲームで利用できるようです。

トランスフォーマーモデルはAI開発の多くの分野に革命をもたらしました。CNNとトランスフォーマーDLSSを比較した上記の動画のサンプルシーケンスは、非常に有望に見えます。NVIDIAは以前からDLSSのレンダリング性能が「ネイティブよりも優れている」と主張してきましたが、DLSSトランスフォーマーモデルはついにその主張を実現するかもしれません。もし実現すれば、50シリーズの価値を高めるキラー機能となるでしょう。ただし、トランスフォーマーモデルは既存のGPUでも動作するため、必ずしもそうとは限りません。

以前も指摘したように、RTX GPUはレイトレーシングを新技術として謳っていましたが、時が経つにつれ、RTXシリーズの最も重要な側面としてAI機能が前面に出てくるようになりました。RTX 50シリーズでは、NvidiaはAIにさらに力を入れており、それをサポートするDLSSソフトウェアはRT機能を凌駕し続けています。マルチフレーム生成がキラー機能となるかどうかはさておき、40シリーズGPUをまだお持ちでないなら、RTX 5070を含む50シリーズはアップグレードを決意させるきっかけとなるかもしれません。

Tom's Hardware の最高のニュースと詳細なレビューをあなたの受信箱に直接お届けします。

ジャレッド・ウォルトンは、Tom's Hardwareのシニアエディターで、GPU全般を専門としています。2004年からテクノロジージャーナリストとして活躍し、AnandTech、Maximum PC、PC Gamerなどで執筆活動を行っています。初代S3 Virgeの「3Dデセラレータ」から最新のGPUまで、ジャレッドは最新のグラフィックストレンドを常に把握しており、ゲームパフォーマンスに関する質問は彼にお任せください。