
NVIDIAはCES 2025の基調講演で、NV1やアーケードマシンからAIのパイオニアへと進化を遂げた同社の歴史を振り返りました。目標は、GeForceが築き上げたNVIDIAのGPUを基盤に、あらゆるアプリケーションに機械学習を適用することです。そして、私たちが本当に見たいのは、Blackwellアーキテクチャを採用した次世代のGeForceハードウェアです。
早速、NVIDIAはGPU発表の第一弾として、549ドルのRTX 5070を発表しました。NVIDIAによると、この製品はAIを様々な方法で活用することで、RTX 4090の3分の1の価格で同等の性能を実現します。また、モバイルRTX 5070はRTX 4090の半分の消費電力で同等の性能を発揮するため、ノートPCのパフォーマンスも向上します(NVIDIAが言及しているのはモバイル版4090だと推測しますが、現時点では明確な情報が得られていません)。
画像
1
の
2

発表された50シリーズの残りのラインナップは、この世代のハローとなるRTX 5090が1,999ドルで、3,400 AI TOPSの性能を備えています。RTX 5080は、その半分強の1,800 TOPSのAI性能を備え、現行のRTX 4080 Superの価格を引き継ぎつつ、はるかに魅力的な999ドルで提供されます。次に続くのがRTX 5070 Tiで1,400 TOPS、そして最後にRTX 4070が1,000 TOPSで、既に発表されている549ドルの価格帯で提供されます。
次世代GPUの発表は素晴らしいスタートを切りましたが、NVIDIAがこれらのアップグレードをどのように提供していく予定なのかを理解する必要があります。これらのGPUについては、まだ(公式には)明らかになっていない点も数多くあります。まずは、既に分かっていることから見ていきましょう。コア仕様の多くはNVIDIAによって既に公開されており、それに合わせて表も更新しました。
スワイプして水平にスクロールします
グラフィックカード | RTX 5090 | RTX 5080 | RTX 5070 Ti | RTX 5070 |
---|---|---|---|---|
建築 | GB202 | GB203 | GB203 | GB205 |
プロセスノード | TSMC 4NP | TSMC 4NP | TSMC 4NP | TSMC 4NP |
トランジスタ(10億個) | 92.2 | 45.6 | 45.6 | 31.0 |
ダイサイズ(mm^2) | 750 | 378 | 378 | 263 |
SMS | 170 | 84 | 70 | 48 |
GPU シェーダー (ALU) | 21760 | 10752 | 8960 | 6144 |
テンソルコア | 680 | 336 | 280 | 192 |
レイトレーシングコア | 170 | 84 | 70 | 48 |
ブーストクロック(MHz) | 2407 | 2617 | 2452 | 2512 |
VRAM速度(Gbps) | 28 | 30 | 28 | 28 |
VRAM(GB) | 32 | 16 | 16 | 12 |
VRAMバス幅 | 512 | 256 | 256 | 192 |
L2キャッシュ | 96 | 64 | 48 | 48 |
レンダリング出力単位 | 160ですか? | 112ですか? | 96ですか? | 64歳? |
テクスチャマッピングユニット | 680 | 336 | 280 | 192 |
TFLOPS FP32(ブースト) | 104.8 | 56.3 | 43.9 | 30.9 |
TFLOPS FP16 (INT8 TOPS) | 838 (3352) | 450(1801) | 352 (1406) | 247 (988) |
帯域幅(GB/秒) | 1792 | 960 | 896 | 672 |
TBP(ワット) | 575 | 360 | 300 | 250 |
発売日 | 2025年1月 | 2025年1月 | 2025年2月? | 2025年2月? |
発売価格 | 1,999ドル | 999ドル | 749ドル | 549ドル |
RTX 5090より下位のGPUを中心に、依然として疑問符が付く点がいくつかあることにお気づきでしょう。NVIDIAは最上位GPUの完全なスペックを公開し、後にトランジスタ数とダイサイズも公表したようですが、公式のROPS(レンダリング出力)数値はまだ公表されていません。
AI TOPS というパフォーマンス性能が公表されていることを考えると、まず注目すべきは、Nvidia が AI 演算処理を Ada Lovelace と比較して 2 倍に向上させたことです。少なくとも特定のデータ型においてはそうです。Blackwell RTX 50 シリーズの概要記事では、以前から仕様に関する噂がありましたが、ここでの唯一の実質的な改善点は、テンソルコアへのネイティブ FP4(そしておそらく FP6)サポートの追加です。Nvidia は業界標準となっているため「TOPS」と呼んでいますが、AI TOPS は実際には FP4 TFLOPS を指します。通常、TOPS は整数演算を指しますが、4 ビット浮動小数点演算もそれとそれほど変わりません。
Nvidiaはまた、「RTX Blackwell」も発表しました。シェーダーを介して125TFLOPSのFP32グラフィックコンピューティングを実現するもので、これはAda世代の同等製品と比較して1.5倍の性能です。AI性能は3倍になります。ただし、これはフルスペックのGB202チップの場合であり、RTX 5090で使用されている簡素化されたソリューションの場合ではありません。将来的には、より高スペックのRTX 5090 Ti、あるいはTitanが登場する可能性もあります。あるいは、そうでなくても、フルスペックのGB202ダイを搭載した、より高機能なAI / データセンター向け製品が登場する可能性は十分にあります。
現時点で発表されているRTX 50シリーズの製品は、いずれも標準の16GB(2GB)GDDR7モジュールを超えるものを提供していません。つまり、RTX 5090の512ビットインターフェースは32GBものVRAMを搭載する一方で、5080と5070 Tiの256ビットインターフェースは依然として16GBのGPUしか搭載できず、5070の192ビットインターフェースは「わずか」12GBのVRAMしか搭載できないということです。
現状では、より多くのゲームをプレイするにはこれで十分ですが、AIワークロードはVRAMを大量に消費するため、各GPUの将来モデルに24GB(3GB)のメモリモジュールが搭載され、あらゆるレベルでVRAM容量が50%増加するとしても全く驚きではありません。来年のミッドサイクルリフレッシュで、これが実現するかもしれません。
Blackwellに搭載されている第5世代Tensorコアが、他の数値形式でもスループットを2倍に向上させるかどうかは不明です。これらのGPUはゲーミングカードだけでなく、プロフェッショナル向けGPUやデータセンターAIソリューションにも搭載されるなど、多目的に活用されることを考えると、Tensorコアのあらゆる側面がアップグレードされたと考えられます。FP16のパフォーマンスは適宜更新していますが、疑問符が付いていることから、これらの数値は確実には分かりません。
興味深いのは、既知のクロック速度とコア数を代入すると、最終的なスペックのほぼすべてが明らかになることです。125 TFLOPSという数値には、最大4,000 INT8 TOPSも付随しますが、RTX 5090ではこれが3,400 TOPSにまでスケールダウンされます。これは、GB202をフル稼働させた場合の約85%に相当します。つまり、仮想チップの125 TFLOPSという数値は、RTX 5090では約107 TFLOPSにまでスケールダウンされることになります。これは理にかなっています。
現時点での噂では、GB202は最大192個のSMに対応しているのに対し、RTX 5090は170個しか対応していません。ブーストクロックが2.41GHzであることを考えると、RTX 40シリーズのブーストクロックと同じくらい控えめな数値なのかどうかも疑問です。40シリーズのGPUの多くは、記載されているブーストクロックよりも約200MHz高いブーストクロックで動作する傾向があるため、Blackwellでも状況が変わらなければ、2.6~2.7GHz程度のクロックが期待できます。
1.8TB/sという帯域幅は、以前噂されていた512ビットメモリインターフェースで動作する28Gbps GDDR7メモリと完全に一致しています。5080、5070 Ti、そして5070も28Gbps GDDR7を採用するのでしょうか、それとももう少し高いクロック速度になるのでしょうか?Nvidiaはメモリの全仕様を公開しており、少なくともRTX 5080は28Gbpsを超え、30Gbpsで動作します。5070 Tiと5070は5090と同じ28Gbpsを維持します。
Nvidiaは、すべてのゲーミングGPUのAIコンピューティング能力を倍増させたらどうなるでしょうか?当然のことながら、その能力を活用した新機能やソフトウェアソリューションを提供する予定です。RTX 5070は1,000TOPSのコンピューティング性能を備えており、RTX 4090(1,320TOPS)とほぼ同等の性能を3分の1の価格で実現できるため、より計算負荷の高いタスクへの対応が可能になります。
画像
1
の
3

最も可能性の高いユースケースの一つは、AIベースのテクスチャ圧縮です。これについては過去にも話題に上り、前世代のハードウェアで動作が実証されましたが、極端に高いフレームレートではありませんでした。2023年5月時点でのニューラルテクスチャ圧縮(NTC)は、標準的なBTC(ブロック切り捨て符号化)圧縮の半分以下の速度でした。しかし、18ヶ月後、AIのコンピューティング能力が向上し、トレーニングがさらに進んだらどうなるでしょうか?NTCが従来のBTCと同じ速度で動作できるようになる可能性は十分に考えられます。
私たちだけでなく、他のユーザーも、最近のゲームでGPUのVRAMが不足するのではないかと懸念していることを考えると、NTCがBlackwell世代のハードウェアの主要な新機能の一つとなるのは当然と言えるでしょう。メモリ使用量を3分の1に抑えながら高画質を実現するNTCを活用すれば、8GBのグラフィックカードでさえはるかに実用的になるでしょう。12GBの5070でも、それほど心配する必要はないでしょう。
ただ一つ、ちょっとした問題があります。多くのゲームはクロスプラットフォームであり、AMD GPUを搭載したコンソールで動作します。NVIDIAの新しいテクスチャ圧縮技術をサポートするゲームは、RTXグラフィックカードだけで済むとしても、一体どれだけあるでしょうか?RTX 50シリーズのグラフィックカードが必要になれば、その数ははるかに少なくなるでしょう。しかし、NVIDIAはAMDやIntelにはできない方法でゲーム市場を動かすだけの影響力を持っています。
Nvidiaは、ドライバーやDLSSの一部としてNTC設定をゲームに組み込むことで、ゲーム側が明示的にNTCをサポートしていなくても、この問題を回避できる可能性があります。これは、私たちの見解では理想的な状況です。なぜなら、多くのゲームでVRAMの実効容量が向上する可能性があるからです。また、NTCがRTX 50シリーズに限定されるのか、それとも他のRTX GPUでも利用可能になるのかについても興味深いところです。
つまり、たくさんの疑問があり、今後数日でさらに詳しく分かるでしょう。これはおそらく、基調講演のゲームデモで紹介されたDLSS 4ファミリーの技術の一部でしょう。「ニューラルレンダリンググラフィックス」という広い意味では、DLSS 4、RTX Neural Materials、DLSS: CNN、DLSS: Transformer、Text-to-Animation、RTX Neural Facesといった様々な新技術が動作しているのを確認できました。もちろん、これらはすべてフルレイトレーシングに対応しています。これらの新技術はすべて有効になっていますが、デモビデオの素晴らしさから見て取れるように、大きな期待が寄せられていることは間違いありません。
NVIDIAはデスクトップGPUに加え、モバイル向けラインナップの製品名も発表しました。RTX 5090、5080、5070 Ti、そして5070を搭載したノートPCが2025年3月に発売予定です。モデル名はデスクトップ向けラインナップと一致していますが、パフォーマンスは大幅に低下し、その他のスペックも同様に削減されると予想されます。
RTX 5090ノートPC向けGPUは1,850 AI TOPSで、価格は2,899ドルからとなります。つまり、デスクトップ版RTX 5080とほぼ同等です。モバイル版5080は1,350 AI TOPSに低下し、デスクトップ版5070 Tiよりわずかに低くなります。モバイル版5070 Tiはデスクトップ版5070と同じ1,000 AI TOPS、そして標準版5070ノートPC向けGPUは最大800 AI TOPSまで対応します。これは、おそらく近々登場するデスクトップ版RTX 5060 Tiを予感させるものでしょう。
基調講演の残りの部分は、ご想像の通り、自動車、医療、倉庫、ロボット工学など、様々な分野におけるAIの活用について多くの時間を費やしました。これらはすべて、ここ数年、NVIDIAから繰り返し聞かされてきた内容であり、興味深いものですが、私たちの本来の焦点ではありません。AIの分野では多くのことが起こっており、2020年から2021年にかけて耳にした暗号通貨やNFTの熱狂によく似ていると感じることもあります。ただし、今回はイーサリアムマイニングの終焉によって事態が沈静化するとは思えません。
Tom's Hardware の最高のニュースと詳細なレビューをあなたの受信箱に直接お届けします。
NVIDIAはまた、Grace Blackwell GB10スーパーチップをミニPCに搭載した新しい「AIスーパーコンピュータ」も披露しました。Project Digitsと呼ばれるこのスーパーコンピュータは、20個のGrace CPUコア、1PFLOPSのFP4性能、128GBのメモリ、4TBのSSDを搭載し、DGXソフトウェアスタックをフルに実行します。既存のDGXサーバーよりも手頃な価格で持ち運びやすく、デスクにも楽に設置できるソリューションとなるはずです。
これで基調講演は終了です。最も興奮したのは言うまでもなくRTX 50シリーズの発表でしたが、まだ不明な点が数多くあります。それらはすべて近日中に明らかになる予定です。RTX 50シリーズの正式発表は月末までに開始される予定です。どうぞお楽しみに。
ジャレッド・ウォルトンは、Tom's Hardwareのシニアエディターで、GPU全般を専門としています。2004年からテクノロジージャーナリストとして活躍し、AnandTech、Maximum PC、PC Gamerなどで執筆活動を行っています。初代S3 Virgeの「3Dデセラレータ」から最新のGPUまで、ジャレッドは最新のグラフィックストレンドを常に把握しており、ゲームパフォーマンスに関する質問は彼にお任せください。