
NVIDIAが噂されている人工知能(AI)および高性能コンピューティング(HPC)向けGPUの新ラインナップは、米国商務省が10月中旬に発表した最新の輸出規制に完全に合致していると、Moor Insights and Strategyの責任者であるパトリック・ムーアヘッド氏は考えている。同氏は、一部報道とは異なり、NVIDIAは新しいデータセンターGPUでAIプロセッサに対する米国の拡大された制裁を回避しようとしているわけではないと指摘する。一方、商務省は最近、データセンター向けに設計されていない製品であっても、ライセンスなしで中国に輸出できない製品について説明しており、GeForce RTX 4090もその1つであるようだ。
「昨日、NVIDIAが中国輸出向けの新型データセンターアクセラレータカードの噂で米国政府の輸出管理法を『回避』あるいは『ごまかし』ようとしていると示唆、あるいは解釈されていると思われる記事が相次ぎました」とムーア氏はブログに記した。「これは笑止千万です。NVIDIAにとってのマイナスは計り知れません。同社は激しいイノベーターであり、競争相手ではありますが、決して愚かではありません。」
総合的な処理性能
新たな規則では、性能に関して、Total Processing Performance(TPP) スコアが定義されています。これは、処理能力に演算時間(例えば、 8/16/32/64ビットのFLOPSまたはTOPS)を乗じた値であり、スパース性(行列乗算の場合)を考慮に入れていません。米国政府は、データセンター向けであれクライアントPC向けであれ、中国がスパース性(行列乗算の場合)を考慮に入れずにTPPスコア4800のプロセッサを入手することを望んでいません。
例えば、NVIDIAのH100は、スパース性を考慮したFP16/BF16の性能が989 TFLOPSと記載されています。これを2で割って16を掛けると、TPPスコアは7,912となり、中国への輸出にはあまりにも高性能すぎることがわかります。
これが、NVIDIAのGeForce RTX 4090/AD102(最高峰のグラフィックカードの一つ)が輸出許可対象品目に該当する理由です。FP8 Tensor FLOPS(660 TFLOPS)の性能はTPPスコアで5,280に達します。そのため、NVIDIAとそのパートナーは、11月16日以降、GeForce RTX 4090を中国に出荷できません。
パフォーマンス密度
最新の規則で導入されたもう一つのパラメータは、 パフォーマンス密度(PD)指標です。このパラメータは、多数の小型データセンターAIチップを統合することで、制限されたチップと同等の性能を実現できるという抜け穴を回避するために設計されています。PDは、 TPPを平方ミリメートルで測定されたダイ面積で割ることで算出されます。ダイ面積には内蔵キャッシュが含まれますが、HBMなどの外部メモリデバイスは含まれません。この指標は、TPPスコアが1600~4800の小規模な高密度チップ向けに設計されています。
例えば、NVIDIAのL4/AD104データセンターGPUのTPPスコアは1936(242 FP8 TFLOPS × 8 = 1,936)です。しかし、ダイサイズは294 mm²です。そのため、パフォーマンス密度は6.5となり、L4は中国に出荷できません。一方、NVIDIAのGeForce RTX 4070 Ti(非データセンター向け製品でTPPスコアは1936)は、中国への出荷に制限なく可能です。
解釈
ここで興味深いのは、製品がデータセンター向けに設計されているかどうかに関する政府の解釈です。今回のケースでは、米国商務省は、ブランド名ではなく製品の特性に基づいて、特定の製品の用途を評価する予定です。例えば、ブロワーまたはパッシブヒートシンクを備えたデュアルスロットのGeForce RTX 4070 Tiは、正式な名称が何であれ、データセンター向けボードとみなされます。
「メーカーがデータセンターでの使用を想定して製品を販売していなくても、製品の技術的特徴から判断すると、データセンターでの使用を想定して設計されている可能性がある」と、米国商務省産業安全保障局のシーア・D・ロズマン・ケンドラー次官は述べた。
Nvidiaの(噂の)中国データセンターGPUラインナップ
米国商務省が10月中旬にAIおよびHPCワークロード向けデータセンタープロセッサに関する新たな輸出規制を発表した後、その規制は非常に厳しく、高性能ハードウェアを中国をはじめとする各国に輸出することがほぼ不可能になった。NVIDIA、Intel、AMDは大量のAIおよびHPCハードウェアを中国顧客に出荷しており、これらの売上を失うことで数十億ドル規模の収益損失が発生する。そのため、NVIDIAが中国市場向けに特別にカスタマイズされたデータセンター製品のラインナップで米国政府を欺いているという噂が広まり始めた。
スワイプして水平にスクロールします
グラフィックプロセッサ | HGX H20 | L20 PCle | L2 PCle |
---|---|---|---|
アーキテクチャ | GPU | ホッパー | GH100 | エイダ・ラブレス | AD102 | エイダ・ラブレス | AD104 |
メモリ | 96 GB HBM3 | 48 GB GDDR6 ECC付き | 24 GB GDDR6 ECC付き |
総処理能力(FP16/BF16) | 2,368 | 1,912 | 1,544 |
パフォーマンス密度 | 2.9 | 3.13 | 5.2 |
メモリ帯域幅 | 4.0 TB/秒 | 864 GB/秒 | 300 GB/秒 |
INT8 I FP8 テンソル | 296 I 296 TFLOPS | 239 I 239 TFLOPS | 193 I 193 TFLOPS |
BF16 I FP16 テンソル | 148 I 148 TFLOPS | 119.5 I 119.5 TFLOPS | 96.5 I 96.5 TFLOPS |
TF32 テンソル | 74 TFLOPS | 59.8 TFLOPS | 48.3 TFLOPS |
FP32 | 44 TFLOPS | 59.8 TFLOPS | 24.1 TFLOPS |
FP64 | 1テラフロップス | 該当なし | 該当なし |
RTコア | 該当なし | はい | はい |
ミグ | 最大7ミグ | 該当なし | 該当なし |
L2キャッシュ | 60MB | 96MB | 36MB |
メディアエンジン | 7 NVDEC、7 NVJPEG | 3 NVENC (+AV1)、3 NVDEC、4 NVJPEG | 2 つの NVENC (AVI)、4 つの NVDEC、4 つの NVJPEG |
力 | 400ワット | 275W | 未定 |
フォームファクター | 8ウェイHGX | 2スロットFHFL | 1スロットLP |
インタフェース | PCIe Gen5 x16: 128 GB/秒 | PCIe Gen4 x16: 64 GB/秒 | PCIe Gen4 x16: 64 GB/秒 |
NVリンク | 900 GB/秒 | - | - |
サンプル | 2023年11月 | 2023年11月 | 2023年11月 |
生産 | 2023年12月 | 2023年12月 | 2023年12月 |
NVIDIAが中国向けに発表したとされるデータセンター向け製品ラインナップを詳しく見てみると、AIおよびHPC向けGPUに関する最新の米国輸出規制に違反する可能性を回避するために、これらの製品ファミリーが綿密に設計されていることがわかります。新製品はチャートの緑色のゾーンに収まるように設計されており、これにより米国の対中制裁を遵守しつつ、NVIDIAはますます制限が厳しくなる中国市場で失われた50億ドルの売上の一部を取り戻すことができます。
Tom's Hardware の最高のニュースと詳細なレビューをあなたの受信箱に直接お届けします。
アントン・シロフはTom's Hardwareの寄稿ライターです。過去数十年にわたり、CPUやGPUからスーパーコンピュータ、最新のプロセス技術や最新の製造ツールからハイテク業界のトレンドまで、あらゆる分野をカバーしてきました。