NVIDIAは、米国の輸出規制を遵守するため、中国市場向けの新たなGPU SKUのリリースを準備しています。ロイターの情報筋によると、NVIDIAの最新GPUは、同社史上最速のAI向けGPUであるBlackwell B200の派生製品となる予定です。このGPUは来年発売される予定ですが、仕様はまだ未定です。
仮称「B20」の新型チップは、Nvidiaの中国における主要パートナーであるInspurによって中国全土に販売される予定だ。B20は2025年第2四半期に正式デビューすると報じられている。
現時点では、Blackwell GPUのスペックは全く不明ですが、B20がエントリーレベルの製品となることは間違いないでしょう。これは、業界をリードするAI性能を誇るB200とは対照的です。米国は中国製GPUの輸出に対して厳格な性能規制を設けており、「Total Processing Power(TPP)」と呼ばれる指標を用いています。これは、GPUの演算能力のTFLOPS値と精度を考慮したものです。具体的には、TFLOPS(スパース性なし)とビット精度を掛け合わせることでTPPが得られます。
現在の上限は4,800TPPです。参考までに、Hopper H100とH200はどちらも16,000TPPと、この数値をはるかに上回っています。この指標はメモリ帯域幅やメモリ容量を直接考慮していませんが、H200がもたらす主な改善点はこれらです。RTX 4090でさえ、FP8演算で660.6TFLOPSを達成し、この上限をクリアしています。4,800TPPの上限内に収まる最も強力なNvidiaデスクトップGPUは、輸出規制に準拠するように特別に設計されたRTX 4090Dです。
Blackwellは演算性能の基準を引き上げ、デュアルダイソリューションではFP8演算で約4,500TFLOPSの性能を発揮する可能性があります。これは許容上限の7.5倍に相当します。より低性能のB100でさえ、高密度FP8演算で3.5PFLOPS、つまり28,000TPPを実現します。
B20は、米国がデータセンター向けGPUを対象とした「性能密度」(PD)規制も施行しているため、追加の制限にも直面しています(コンシューマー向けGPUはこの制限の対象外です)。TPPスコアをダイサイズで割るとPD指標が得られ、6.0を超えると制限の対象となります。この指標を用いると、RTX 40シリーズGPUはすべてデータセンターでの使用が制限され、BlackwellはAda Lovelaceよりも密度と性能が向上するはずです。そのため、Nvidiaは規制を遵守するために、B20の性能を大幅に削減するか、ダイのサイズを比例して大きくする必要があります。(既に発表されているB200の正確なダイサイズはまだ不明です。)
B20は、NvidiaのエントリーレベルAI GPUであるA30およびH20の後継機になると予想されます。例えば、H20のFP16演算性能はわずか296TFLOPSですが、H100/H200は1,979TFLOPSです。これはTPP(TPS)が2,368で、PDスコアを6.0未満に抑えることを意味します。PDスコアはわずか2.90です。一方、A30のTPPは2,640、PDスコアは3.20です。つまり、Nvidiaが中国向けにさらに高速なAI GPUを開発する余地はありますが、あまり高速化は期待できません。
B20は販売が難しいチップになるだろうと予想せざるを得ません。AmpereとHopperはどちらも既に性能限界を超えているため、Nvidiaは規制遵守のために中国専用のSKUを作成しました。Blackwellアーキテクチャのあらゆる進歩は、最大TPPが変更されていないため、規制遵守をさらに困難にしています。つまり、規制遵守を維持するには性能を低下させる必要があるということです。最良のケースは?Nvidiaは、おそらく4,000~4,500TPPでダイサイズが800mm²のGPUの開発を目指すでしょう。
Tom's Hardware の最高のニュースと詳細なレビューをあなたの受信箱に直接お届けします。
Aaron Klotz 氏は Tom's Hardware の寄稿ライターであり、CPU やグラフィック カードなどのコンピューター ハードウェアに関するニュースを扱っています。