
GPUシェーダーコア(NvidiaではCUDAコア)とROPは、現代のGPUにとって重要な要素です。近々発売されるRTX 50シリーズでは、Nvidiaは両方ではなく前者に重点を置いているようです。Harukaze5719氏がX(旧Twitter)で報告したところによると、Nvidiaの次期Blackwell RTX 50シリーズGPUは、Ada Lovelace RTX 40シリーズGPUと比べてCUDAコア数のみが向上し、ROPは各層で同じままです。唯一の例外はエントリーレベルのGB207ダイで、ROPS数はなんと33%も削減されます。
ROP(レンダリング出力ユニット、ラスターオペレーションパイプラインとも呼ばれる)は、従来のGPU 3Dレンダリングパイプラインにおいて重要な役割を果たします。その名の通り、ピクセルとテクセルの情報、つまりラスタライズワークロードの処理を担当します。ROPは一般的にシェーダコアほど重要ではありませんが、GPUパイプラインにおいて依然として重要な役割を果たします。最適なパフォーマンスを得るには、シェーダコアやその他の処理クラスターの数に応じてROPの数を調整する必要があります。
それで、このようになるでしょうか? すべての数値は kopite7kimi に基づいており、式は変更されていません (1 GPC = 1 ROP / 1 TPC = 2 SM / SM = 128 CUDA) https://t.co/158neeR86i pic.twitter.com/xmuvANTXi1 2024 年 6 月 11 日
Harukazeの新情報(人気リーカーKopite7kimi氏の情報に基づく)によると、NVIDIAはBlackwell GPUアーキテクチャのゲーミング向けバリアントにレンダリング出力ユニットを追加しないようです。おそらく主流となるGB206からフラッグシップのGB202ダイに至るまで、各種GPUはAda Lovelace(RTX 40シリーズ)の前身と全く同じROPS数を搭載するとされています。唯一の例外であるGB207は、ROPS数をさらに削減し、AD107と比較して33%削減されるとのことです。
NVIDIAがROPSの数を増やさないのは奇妙に思えるかもしれませんが、同社のアーキテクトはBlackwellに十分なROPが既に搭載されていると考えている可能性が高いでしょう。前述のように、ROPSはGPUパフォーマンスの全てを左右するものではなく、特にレイトレーシング、アップスケーリング、その他のエフェクトを組み込んだ最新のワークロードにおいてはなおさらです。アーキテクチャのバランスが崩れれば、ROPSを増やしても必ずしもパフォーマンスが向上するとは限りません。NVIDIAはBlackwellにおいて個々のROPSのパフォーマンスを向上させている可能性もあり、これが噂されている変更の新たな説明となるでしょう。
GB207のROPSが33%低下した例を見てください。Nvidiaの現行型AD107 GPUダイは、わずかにサイズが大きく、したがってより高価なAD106ダイと同等のROPS値を備えています。しかし、この一見有利な点にもかかわらず、AD107ベースのGPUはAD106ベースのGPUに太刀打ちできませんでした。RTX 4060のレビューで示したように、AD107を搭載したRTX 4060カードは、ゲーミング性能においてRTX 4060 Tiに遠く及びません。両者の主な違いは、CUDAコア数とその他のプロセッシングコア(RT、Tensor、テクスチャ)です。
AD107は「オーバースペック」だったため、NvidiaはGB207でROPS数を削減し、GB206との差がさらに広がる可能性があります。また、NvidiaはCUDAコア数を2,560に削減する見込みで、これはRTX 4060の3,072コアよりも少ない数です。一方、GB206は最大4,608個のシェーダーを搭載しており、これはAD106と同じです(ただし、RTX 4060 Tiでは4,342コアしか有効になっていませんでした)。これらの変更により、GB207とGB206の差はさらに広がる可能性が高いでしょう。
CUDAコアについて言えば、NVIDIAは最上位のGB202ダイに最大24,576個のシェーダー(ストリーミングマルチプロセッサ(SM)192個)を搭載すると予想しています。また、512ビットのメモリインターフェースも備えており、GDDR7と組み合わせることでメモリ帯域幅を大幅に向上させることができます。一方、GB203は現行のAD103と類似しており、最大84個のSMと10,752個のシェーダーを搭載します(AD103は80個のSMと10,240個のCUDAコア)。また、同じ256ビットインターフェース(ただしGDDR7をサポート)を備えています。これらの噂が正しければ、RTX 5090とRTX 5080の間には、非常に大きな差が生まれることになります。
スタックを下っていくと、GB205がAD104の後継となりますが、AD104が最大60個のSMと7,680個のシェーダーを搭載していたのに対し、新チップは最大50個のSMと6,400個のシェーダーを搭載する見込みです。また、メモリインターフェースはAD106と同じ192ビットです。GB206は、前身のAD106と同じ36個のSMと4,608個のCUDAコアを搭載し、128ビットインターフェースを備えています。そして最後に、GB207ダイは20個のSMと2,560個のCUDAコアのみを搭載し、128ビットGDDR6メモリインターフェースを備えています。
言うまでもないかもしれませんが、読者の皆様は提供されている情報はすべて鵜呑みにしないようご注意ください。この非公式データはリークによるものである可能性もあれば、あるいは単に噂話の達人が理にかなった情報に基づいて様々なアイデアを吐き出しているだけかもしれません。現在の噂によると、NvidiaはRTX 50シリーズGPUの最初の2モデルを年末頃にリリースする予定ですが、最後の3つのダイは2025年までリリースされません。そのため、変更やさらなる憶測の余地は十分にあります。コンシューマー向けBlackwellアーキテクチャの変更についてもまだ情報がありませんが、CUDA、Tensor、RTコアがアップグレードされ、ROPSなどの要素も変更される可能性が高いと考えられます。
しかし、一つ確かなことは、Nvidiaが本当に512ビットのメモリインターフェースと、最上位のGB202ソリューションで最大192個のメモリスロットを搭載する計画だとしたら、それは決して安くはないだろうということです。究極のパフォーマンス、強力なパワー、そして銀行口座への大金が、この価格帯で手に入るのです。
Tom's Hardware の最高のニュースと詳細なレビューをあなたの受信箱に直接お届けします。
Aaron Klotz 氏は Tom's Hardware の寄稿ライターであり、CPU やグラフィック カードなどのコンピューター ハードウェアに関するニュースを扱っています。