Nvidia RTX 40シリーズとAda Lovelace GPUの発売は、様々な感情を呼び起こしました。一部の人は興奮し、一部の人は信じられない思いを抱き、多くの人はあからさまに軽蔑しました。最高のグラフィックカードを上回る性能を約束するGPUを開発するにあたり、Nvidiaは大きく、そして高価にこだわったのです。一方、AMDはよりコスト効率の高い技術を採用しており、これにより、今後発売されるRDNAカードはより魅力的で、より手頃な価格の選択肢となる可能性があります。
Nvidiaの部品表(BOM)は公開されていませんが、NvidiaのGPUが高価格なのは、同社が「ムーアの法則2.0」の採用を拒否し、チップレットなどの技術に目を向けていないことが大きな要因です。AMDはチップレットへの移行以降、CPU、特にコスト面でIntelに勝ち始め、今やGPUでも同様のことをしようとしています。RDNA 3を用いてアナログメモリインターフェースを旧プロセスに搭載するのは、アナログは新しいプロセスノードではスケーリングが非常に低いため、優れたアプローチです。キャッシュについても同様です。
画像
1
の
6

12個のグラフィックス処理クラスタ(GPC)はチップの他の部分とは容易に区別でき、それぞれに12個のストリーミングマルチプロセッサ(SM)が搭載されています。GPCとSMを合わせると、ダイ面積全体の約45%を占めます。残りの部分はどこにあるのでしょうか?
12個の32ビットGDDR6Xメモリコントローラがダイの外側の大部分を占め、PCIe x16コネクタはダイの下端の約3分の1を占めています。メモリコントローラと関連回路は、ダイ面積の約17%を占めています。しかし、メモリサブシステムはそれだけではありません。Nvidiaは以前の設計よりもはるかに大きなL2キャッシュを搭載しています。
ダイの中央部分には、16MBのL3ブロックが6つあり、その周囲には関連する配線やその他の回路(ROP?)が配置されています。L2キャッシュブロックはダイ全体の面積の少なくとも15%を占め、ダイの中央部分全体(L2とその他のロジック)は全体の25%を占めています。ダイ下部の残りの部分は、デュアルNVENCエンコーダ、PCIeインターフェース、物理ディスプレイインターフェースなどに使用されています。これは全体の約7%で、その他の様々なビットが散在しており、ダイの残りの約6%を占めています。
ダイ面積について議論する目的は、物事の全体像を把握することです。NvidiaはAD102チップにモノリシックアプローチを採用し、ダイ面積全体の約33%をメモリインターフェースとL2キャッシュに割り当てています。AMDはRadeon RX 7000シリーズとRDNA 3 GPUで採用しているMCD(メモリチップレットダイ)アプローチを採用し、そのほぼすべてをメインチップレットから分離する予定です。また、TSMC N5ではなくTSMC N6を採用すると報じられています。これにより、価格が下がり、同時に歩留まりも向上します。
TSMCは、Apple、AMD、Intel、Nvidiaといった大手パートナーとの契約交渉について明らかにしていません。しかし、TSMC N5(そして実質的にN5を「改良」した4N)のコストは、TSMC N7/N6の少なくとも2倍になるとの報道があります。AD102のダイサイズは608mm²で、Nvidiaは1ウェーハあたり約90個のフルダイしか取得できません。ちなみに、これはGA102と比べて1ウェーハあたり約2個多いチップ数です。
TSMC 4Nのウェハ単価がSamsung 8Nの2倍以上だとすれば、AD102のチップ単価は前世代のGA102やRTX 3090の2倍以上になるということになります。PC WorldのGordon Mah Ung氏が、Q&AセッションでNVIDIAのCEOであるJensen Huang氏に価格について質問しました。文脈を理解するために、引用させていただきます。
Gordon: [RTX] 4000がついに登場しました。皆さんにとっては大きなローンチだと感じているでしょう。世間の反応は概ね「なんてことだ。高すぎる」といった感じですね。新世代パーツの価格について、コミュニティの皆さんに何か伝えたいことはありますか? また、将来的には価格が下がって、私があちこちで耳にする悲鳴のような状況は解消されるのでしょうか?
ジェンセン氏:「まず第一に、12インチのウエハーは昨日よりもずっと高価になっています。少しだけ高くなっているのではなく、大幅に高くなっています。ムーアの法則は終わりました。ムーアの法則が1年半ごとに同じ性能を半分のコストで実現するという可能性は、もはや終わりました。完全に終わりました。ですから、チップのコストが時間とともに下がっていくという考えは、残念ながら過去の話です。」(強調筆者)
もちろん、グラフィックカードの開発にはGPU以外にも多くの要素が関わってきます。メモリ、PCB、VRM、PMIC、コンデンサなど、様々な部品が関わってきます。そして、これらの多くは過去2年間で価格が上昇しています。NVIDIAはGPUと関連技術の研究開発にも多大な労力を費やしています。そして、最終的な設計はこれらすべてを考慮し、最終的に成功する製品へと昇華させる必要があります。
では、利益の出る製品を作るには、新しい部品にどれくらいのコストがかかるのでしょうか?これは答えるのが難しいですね。
RTX 40シリーズの発表でもう一つ興味深いのは、NVIDIAが3つの異なるグラフィックカードモデルを発表し、それぞれが異なるGPUを搭載している点です。繰り返しになりますが、このようなアプローチはコスト増加を招き、NVIDIAはウェハー発注の最適な配分方法も検討する必要があります。RTX 4090に搭載されているAD102チップは、大型ダイと豊富なオプションを備えた新たな主役級チップです。AD103はメモリインターフェースとコア数を削減し、AD104はさらに削減しています。
NvidiaはAD103とAD104のダイショットやレンダリング画像をまだ公開していませんが、完全なスペックは明らかになっています。サイズはかなり小さくなっており、その多くはコア数、メモリインターフェース、L2キャッシュサイズの削減によるものです。4080モデルは当然ながら4090よりも量産品となりますが、4090は潜在的に演算性能が70%向上し、メモリ帯域幅と容量が50%増加し、消費電力は41%増加しているにもかかわらず、価格は「わずか」33%しか高くないことは指摘しておく価値があります。つまり、RTX 4080 16GBモデルの価格は、RTX 4090よりも相対的に劣っているということです。
RTX 4080 12GBでも同様の結果が出ています。4080 16GBは、演算性能が21%、メモリ容量が33%、メモリ帯域幅が42%向上していますが、消費電力はわずか12%しか増加していません。また、価格も33%高くなっています。RTX 4080の両モデルは、以前のNvidiaアーキテクチャと比較すると、価格が高すぎる上に性能不足に見えます。以前のNvidiaアーキテクチャでは、Haloカードは大幅に高価であるにもかかわらず、パフォーマンスの向上はそれほど大きくありませんでした。
RTX 30シリーズが発売された際、NvidiaはRTX 3090と3080からスタートしました。どちらもGA102チップを搭載していましたが、3080ではコア数が少なくなっていました。次に登場したRTX 3070と3060 Tiは、どちらもGA104チップを搭載していました。最終的に、NvidiaはGA106をこのファミリーに追加し、RTX 3060と3050で使用しました。モバイルRTX 3050 Tiと3050向けにGA107もリリースされましたが、デスクトップ向けは登場しませんでした。最終的に、デスクトップ向けカードだけを見ても、Nvidiaは3つの異なるGPUを搭載し、それぞれが10種類のグラフィックカードに搭載されていました。そして今、Nvidiaは3種類のGPUを搭載した3枚のカードを発表しており、各チップの数のバランスをどう取るかを検討する必要があります。
2023年末までにRTX 40シリーズの製品ラインナップがどうなるのか、どうしても気になります。噂によると、さらに2つのAda GPU(AD106とAD107)が開発中とのことです。いずれNvidiaは、発表済みの3つのSKU以外にも機能するビニングチップを供給し始め、グラフィックカードのモデルも増えていくでしょう。
一方、AMDは11月3日にチップレットを採用するシングルコアGPUを発表する見込みです。現時点での情報によると、GCD(GPUチップレットダイ)はわずか308mm²で、AD102の約半分のサイズです。そして、最大6個のMCD(メモリチップレットダイ)が接続されますが、いずれも比較的小型(38mm²)です。これはAD104(294.5mm²)とほぼ同じサイズです。噂が正しければ、AMDのNavi 31は最大12,288個のGPUシェーダコアを搭載することになります。これは、ほぼ同じサイズのチップに搭載されているNvidiaのRTX 4080 12GBよりも60%多い数です。
AMDは、同じGCDを採用したRX 7900 XT、RX 7800 XT、そしてもしかしたらRX 7800を、有効GPUコア数を変え、MCDを6、5、または4つにすることで発売できるかもしれません。AD102よりも歩留まりが大幅に向上し、コストも大幅に削減されます。AMDは、少なくともDLSS 3や高度なレイトレーシング効果を活用しないゲームにおいては、AD104と価格面で競合しつつ、大幅に高いパフォーマンスを実現できる可能性さえあります。優位性:AMD。
RTX 4080 12GB がなぜ RTX 4070 とだけ呼ばれないのかという疑問もあります。ブリーフィング中に Nvidia と話しているときに、まさにこの質問が出ました。特に異なるチップであるにもかかわらず、12GB チップを 4070 ではなく 4080 と呼ぶ背後にある考え方は何ですか?
Nvidiaの製品管理担当シニアディレクター、ジャスティン・ウォーカー氏は、「4080 12GBは非常に高性能なGPUです。3080 12GBよりも大幅に高速なパフォーマンスを発揮します。3090 Tiよりも高速で、80クラスの製品にふさわしい性能だと考えています」と述べています。
正直言って、それはひどい答えです。もちろん速いです!新しいチップと新しいアーキテクチャですから、速いはずです。GTX 1070が980 Tiよりも速かった時のことを覚えていますか?80クラスの製品名に「値しない」ということだったのでしょう。RTX 2070が1080 Tiに匹敵した時も、3070が2080 Tiに匹敵した時も、同じでした。
しかし、Nvidiaは4080 12GBモデルが「3080 12GBモデルより最大3倍高速」とパフォーマンス比較で述べています。ここで疑問が湧いてきます。なぜなら、これは明らかにDLSS 3対応、かつレイトレーシングを多用するゲームでの性能だからです。これらの基準を満たさないゲームをプレイしている場合はどうなるのでしょうか?
Tom's Hardware の最高のニュースと詳細なレビューをあなたの受信箱に直接お届けします。
Nvidiaのベンチマークに基づくと、結果は玉石混交になるでしょう。上のグラフの左側にある最初の3つのゲームは、DLSSもDLSS 3も使用していません。RTX 4080 12GBは、DLSS 3とレイトレーシングを除けば、RTX 3090 Tiと同等かわずかに遅いことがよくあります。将来のゲームでこのような状況がどの程度頻繁に起こるかは、予測するのがはるかに困難です。
RTX 40シリーズの発売は、多くの点でRTX 20シリーズの発売を彷彿とさせます。Nvidiaは再びレイトレーシングとDLSSを大々的に宣伝していますが、その物語は今や3ラウンド目を迎えています。RTハードウェアははるかに高性能で、DLSS 3も大幅に向上するはずですが、すべての大作ゲームが両方の技術を十分なレベルでサポートするでしょうか?答えは間違いなくノーです。対応するゲームもあれば、対応しないゲームもあるでしょう。
一方、世代交代による価格上昇が(再び)続き、一部のモデルのスペックは確かに疑問符が付くほどだ。RTX 4080 12GBは、現状ではRTX 4070に取って代わられるべきだったと感じさせる。NvidiaはTiやSuperなどを追加して、他のモデルを開発し始めることもできたはずだ。
RTX 3080 10GBは、当面は希望小売価格699ドルで推移する模様だ。いずれ登場するRTX 4070が、性能と機能の面でRTX 3080に取って代わるのは避けられないだろう。しかし、NVIDIAとそのパートナー企業は、Ada Lovelaceシリーズの他の製品に移行する前に、RTX 30シリーズの既存在庫を可能な限り高値で買い占めさせる必要がある。
AMDのRDNA 3ラインナップについても、まだ詳細は明らかになっていません。前述の通り、AMDの設計上の決定、特にGPUチップレットに関しては、NVIDIAが到底かなわない低価格が実現するはずです。AMDがパフォーマンスで圧倒的な勝利を収めることはないかもしれませんが、NVIDIAの価格を下回りながらもそれに迫ることができれば、それは問題にならないかもしれません。さらに、近い将来に発売される可能性のあるIntelのArc A770とA750も加わります。GPU市場の覇者は誰になるのか、今後数ヶ月で明らかになるでしょう。
ジャレッド・ウォルトンは、Tom's Hardwareのシニアエディターで、GPU全般を専門としています。2004年からテクノロジージャーナリストとして活躍し、AnandTech、Maximum PC、PC Gamerなどで執筆活動を行っています。初代S3 Virgeの「3Dデセラレータ」から最新のGPUまで、ジャレッドは最新のグラフィックストレンドを常に把握しており、ゲームパフォーマンスに関する質問は彼にお任せください。