NvidiaのAda Lovelaceアーキテクチャは、最上位層におけるパフォーマンスを新たな次元へと導きました。RTX 4090は、ラスタライゼーションベンチマークで前世代のRTX 3090 Tiを平均52%、レイトレーシングベンチマークで70%上回りました(もちろん、どちらも4K解像度)。4090は、GPUベンチマークランキングの頂点に堂々と君臨し、少なくとも予算に余裕のある方にとっては、最高のグラフィックカードの一つと言えるでしょう。
残念ながら、4090からRTX 4080への性能低下は急激で、ラスタライゼーションで23%、レイトレーシングで30%のパフォーマンス低下が見られます。さらに上位のRTX 4070 Tiに落とすと、4080と比較してさらに22%のパフォーマンス低下が見られます。記録を取っているなら(私たちは記録を取るのが大好きです)、AD104 GPUを搭載した3番手のAdaカードは、前世代の3090 Tiよりも遅いということになります。DLSS 3のフレーム生成を使用したベンチマークに基づくNvidiaの主張はさておき。
RTX 4070 Tiでさらに懸念されるのは、メモリインターフェースが192ビットしかないことです。それでも12GBのGDDR6Xメモリを搭載し、L2キャッシュも大容量なので、バス幅が狭くなっても致命的な問題にはなりませんが、4060や4050といったRTX 40シリーズの下位モデルを見据えると、状況はそれほど良くないかもしれません。
Nvidia は最近、AD103 GPU (基本的にはモバイル 4080) を使用する RTX 4090 モバイルから、貧弱なサウンドの RTX 4050 まで、RTX 40 シリーズのノート PC GPU のフル ラインを発表しました。こちらがモバイル パーツの完全な仕様リストです。
スワイプして水平にスクロールします
グラフィックカード | ノートパソコン向けRTX 4090 | ノートパソコン向けRTX 4080 | ノートパソコン向けRTX 4070 | ノートパソコン向けRTX 4060 | ノートパソコン向けRTX 4050 |
---|---|---|---|---|---|
建築 | 西暦103年 | 西暦104年 | 西暦106年? | 西暦106年? | 西暦107年? |
プロセス技術 | TSMC 4N | TSMC 4N | TSMC 4N | TSMC 4N | TSMC 4N |
トランジスタ(10億個) | 45.9 | 35.8 | ? | ? | ? |
ダイサイズ(mm^2) | 378.6 | 294.5 | ? | ? | ? |
SMS | 76 | 58 | 36 | 24 | 20 |
GPUシェーダー | 9728 | 7424 | 4608 | 3072 | 2560 |
テンソルコア | 304 | 232 | 144 | 96 | 80 |
レイトレーシング「コア」 | 76 | 58 | 36 | 24 | 20 |
ブーストクロック(MHz) | 1455-2040 | 1350-2280 | 1230-2175 | 1470-2370 | 1605-2370 |
VRAM速度(Gbps) | 18歳? | 18歳? | 18歳? | 18歳? | 18歳? |
VRAM(GB) | 16 | 12 | 8 | 8 | 6 |
VRAMバス幅 | 256 | 192 | 128 | 128 | 96 |
L2キャッシュ | 64 | 48 | 32 | 32 | 24 |
ROP | 112 | 80 | 48 | 32 | 32 |
TMUs | 304 | 232 | 144 | 96 | 80 |
TFLOPS FP32(ブースト) | 28.3~39.7 | 20.0-33.9 | 11.3-20.0 | 9.0-14.6 | 8.2~12.1 |
TFLOPS FP16 (FP8) | 226-318 (453-635) | 160-271 (321-542) | 91-160 (181-321) | 72勝116敗(145勝233敗) | 66勝97敗(131勝194敗) |
帯域幅(GBps) | 576 | 432 | 288 | 288 | 216 |
TDP(ワット) | 80~150 | 60~150 | 35-115 | 35-115 | 35-115 |
懸念材料となっているのはメモリ容量だけではありません。RTX 4070 Tiのレビューでは、パフォーマンスは悪くないが、驚くほど優れているわけでもないと述べました。これは基本的にRTX 3090の廉価版で、VRAMが半分、消費電力も低いということになります。4070 Tiは、ストリーミングマルチプロセッサ(SM)が60基、CUDAコア(GPUシェーダー)が7680基と、現行のRTX 3070 Tiよりわずかに多いという性能です。しかし、AD106はSMが最大でも40基、あるいは36基になる可能性があり、そうなるとコア数ではRTX 3060 Tiと同程度になり、パフォーマンスの向上はGPUクロックのみにかかってしまいます。
これら 2 つの要素 (VRAM の不足と GPU シェーダー数の比較的わずかな増加) を組み合わせると、以前の Ampere 世代の GPU と比較して、パフォーマンスがわずかに向上する可能性があります。
NvidiaはDLSS 3によるパフォーマンス向上を発表しますが、これは一部のゲームにしか適用されず、真のパフォーマンス向上も期待できません。状況はさらに悪化しそうです。現在120fpsでゲームを実行できるGPUの利点の一つは、ゲームの要求が厳しくなっても、数年後にはほとんどのゲームで60fpsを維持できることです。しかし、もしそれが実際のフレームレートでなかったらどうなるでしょうか?
DLSS 3のフレーム生成技術によって120fpsで動作するゲームを想定してみましょう。ベースパフォーマンスは70fpsです。今のところは順調ですが、ゲームの要求が厳しくなるにつれてベースパフォーマンスは40fpsを下回り、最終的には30fpsを下回ります。私たちの経験では、ベースフレームレートが30fps未満のフレーム生成では、モニターのフレーム更新回数が1秒あたり2倍になっても、体感的には30fps未満に感じられます。
同じ論理はより高いフレームレートにも当てはまります。そのため、DLSS 3で120fps、ベースフレームレートが70fpsの場合、見た目は少し滑らかに見えても、体感的には70fpsのように感じられます。ほとんどの人は、70fpsの入力レートと120fpsの入力レートの違いを区別できないでしょう。しかし、40fpsを下回ると、プロゲーマーでなくても違いを感じ始めるでしょう。
もっと率直に言えば、DLSS 3とフレーム生成は万能薬ではありません。ビジュアルを滑らかにし、ゲームプレイ感覚を多少向上させる可能性はありますが、特にパフォーマンスが60fpsを下回る場合、その効果は、新たなユーザー入力を考慮した実際の完全レンダリングフレームほど顕著ではありません。
だからといって、それが悪い技術だと言っているわけではありません。実際、かなり巧妙な技術ですし、存在自体を否定するつもりもありません。しかし、NvidiaはDLSS 3のスコアと非DLSS 3の結果を比較し、それらを同じものとして扱うのをやめるべきです。フレーム生成前のベースフレームレートに10~20%程度上乗せすれば、ゲーム感覚はほぼその程度で、ベンチマークで示されるような60~100%も高いfpsなどではありません。
話を元に戻すと、今後のメインストリーム向けおよび低価格帯のRTX 40シリーズGPUは、純粋なパフォーマンスにおいて既存モデルを凌駕するに違いなく、DLSS 3のサポートも提供されるでしょう。しかし、NVIDIAが価格を前世代機に近い水準に戻してくれることを期待したいところです。RTX 4060が499ドル、RTX 4050が399ドルであれば、同価格帯の既存カードと比べるとマイナーアップグレードに過ぎないからです。
Tom's Hardware の最高のニュースと詳細なレビューをあなたの受信箱に直接お届けします。
ジャレッド・ウォルトンは、Tom's Hardwareのシニアエディターで、GPU全般を専門としています。2004年からテクノロジージャーナリストとして活躍し、AnandTech、Maximum PC、PC Gamerなどで執筆活動を行っています。初代S3 Virgeの「3Dデセラレータ」から最新のGPUまで、ジャレッドは最新のグラフィックストレンドを常に把握しており、ゲームパフォーマンスに関する質問は彼にお任せください。