いいえ、NVIDIAは中国に対するGPU制裁に違反していないとアナリストが指摘

（画像提供：Nvidia）

NVIDIAが噂されている人工知能（AI）および高性能コンピューティング（HPC）向けGPUの新ラインナップは、米国商務省が10月中旬に発表した最新の輸出規制に完全に合致していると、Moor Insights and Strategyの責任者であるパトリック・ムーアヘッド氏は考えている。同氏は、一部報道とは異なり、NVIDIAは新しいデータセンターGPUでAIプロセッサに対する米国の拡大された制裁を回避しようとしているわけではないと指摘する。一方、商務省は最近、データセンター向けに設計されていない製品であっても、ライセンスなしで中国に輸出できない製品について説明しており、GeForce RTX 4090もその1つであるようだ。

「昨日、NVIDIAが中国輸出向けの新型データセンターアクセラレータカードの噂で米国政府の輸出管理法を『回避』あるいは『ごまかし』ようとしていると示唆、あるいは解釈されていると思われる記事が相次ぎました」とムーア氏はブログに記した。「これは笑止千万です。NVIDIAにとってのマイナスは計り知れません。同社は激しいイノベーターであり、競争相手ではありますが、決して愚かではありません。」

総合的な処理性能

新たな規則では、性能に関して、Total Processing Performance（TPP） スコアが定義されています。これは、処理能力に演算時間（例えば、 8/16/32/64ビットのFLOPSまたはTOPS）を乗じた値であり、スパース性（行列乗算の場合）を考慮に入れていません。米国政府は、データセンター向けであれクライアントPC向けであれ、中国がスパース性（行列乗算の場合）を考慮に入れずにTPPスコア4800のプロセッサを入手することを望んでいません。

例えば、NVIDIAのH100は、スパース性を考慮したFP16/BF16の性能が989 TFLOPSと記載されています。これを2で割って16を掛けると、TPPスコアは7,912となり、中国への輸出にはあまりにも高性能すぎることがわかります。

これが、NVIDIAのGeForce RTX 4090/AD102（最高峰のグラフィックカードの一つ）が輸出許可対象品目に該当する理由です。FP8 Tensor FLOPS（660 TFLOPS）の性能はTPPスコアで5,280に達します。そのため、NVIDIAとそのパートナーは、11月16日以降、GeForce RTX 4090を中国に出荷できません。

パフォーマンス密度

最新の規則で導入されたもう一つのパラメータは、 パフォーマンス密度（PD）指標です。このパラメータは、多数の小型データセンターAIチップを統合することで、制限されたチップと同等の性能を実現できるという抜け穴を回避するために設計されています。PDは、 TPPを平方ミリメートルで測定されたダイ面積で割ることで算出されます。ダイ面積には内蔵キャッシュが含まれますが、HBMなどの外部メモリデバイスは含まれません。この指標は、TPPスコアが1600～4800の小規模な高密度チップ向けに設計されています。

例えば、NVIDIAのL4/AD104データセンターGPUのTPPスコアは1936（242 FP8 TFLOPS × 8 = 1,936）です。しかし、ダイサイズは294 mm²です。そのため、パフォーマンス密度は6.5となり、L4は中国に出荷できません。一方、NVIDIAのGeForce RTX 4070 Ti（非データセンター向け製品でTPPスコアは1936）は、中国への出荷に制限なく可能です。

解釈

ここで興味深いのは、製品がデータセンター向けに設計されているかどうかに関する政府の解釈です。今回のケースでは、米国商務省は、ブランド名ではなく製品の特性に基づいて、特定の製品の用途を評価する予定です。例えば、ブロワーまたはパッシブヒートシンクを備えたデュアルスロットのGeForce RTX 4070 Tiは、正式な名称が何であれ、データセンター向けボードとみなされます。

「メーカーがデータセンターでの使用を想定して製品を販売していなくても、製品の技術的特徴から判断すると、データセンターでの使用を想定して設計されている可能性がある」と、米国商務省産業安全保障局のシーア・D・ロズマン・ケンドラー次官は述べた。

Nvidiaの（噂の）中国データセンターGPUラインナップ

米国商務省が10月中旬にAIおよびHPCワークロード向けデータセンタープロセッサに関する新たな輸出規制を発表した後、その規制は非常に厳しく、高性能ハードウェアを中国をはじめとする各国に輸出することがほぼ不可能になった。NVIDIA、Intel、AMDは大量のAIおよびHPCハードウェアを中国顧客に出荷しており、これらの売上を失うことで数十億ドル規模の収益損失が発生する。そのため、NVIDIAが中国市場向けに特別にカスタマイズされたデータセンター製品のラインナップで米国政府を欺いているという噂が広まり始めた。

スワイプして水平にスクロールします

グラフィックプロセッサ	HGX H20	L20 PCle	L2 PCle
アーキテクチャ \| GPU	ホッパー \| GH100	エイダ・ラブレス \| AD102	エイダ・ラブレス \| AD104
メモリ	96 GB HBM3	48 GB GDDR6 ECC付き	24 GB GDDR6 ECC付き
総処理能力（FP16/BF16）	2,368	1,912	1,544
パフォーマンス密度	2.9	3.13	5.2
メモリ帯域幅	4.0 TB/秒	864 GB/秒	300 GB/秒
INT8 I FP8 テンソル	296 I 296 TFLOPS	239 I 239 TFLOPS	193 I 193 TFLOPS
BF16 I FP16 テンソル	148 I 148 TFLOPS	119.5 I 119.5 TFLOPS	96.5 I 96.5 TFLOPS
TF32 テンソル	74 TFLOPS	59.8 TFLOPS	48.3 TFLOPS
FP32	44 TFLOPS	59.8 TFLOPS	24.1 TFLOPS
FP64	1テラフロップス	該当なし	該当なし
RTコア	該当なし	はい	はい
ミグ	最大7ミグ	該当なし	該当なし
L2キャッシュ	60MB	96MB	36MB
メディアエンジン	7 NVDEC、7 NVJPEG	3 NVENC (+AV1)、3 NVDEC、4 NVJPEG	2 つの NVENC (AVI)、4 つの NVDEC、4 つの NVJPEG
力	400ワット	275W	未定
フォームファクター	8ウェイHGX	2スロットFHFL	1スロットLP
インタフェース	PCIe Gen5 x16: 128 GB/秒	PCIe Gen4 x16: 64 GB/秒	PCIe Gen4 x16: 64 GB/秒
NVリンク	900 GB/秒	-	-
サンプル	2023年11月	2023年11月	2023年11月
生産	2023年12月	2023年12月	2023年12月

NVIDIAが中国向けに発表したとされるデータセンター向け製品ラインナップを詳しく見てみると、AIおよびHPC向けGPUに関する最新の米国輸出規制に違反する可能性を回避するために、これらの製品ファミリーが綿密に設計されていることがわかります。新製品はチャートの緑色のゾーンに収まるように設計されており、これにより米国の対中制裁を遵守しつつ、NVIDIAはますます制限が厳しくなる中国市場で失われた50億ドルの売上の一部を取り戻すことができます。

Tom's Hardware の最高のニュースと詳細なレビューをあなたの受信箱に直接お届けします。

アントン・シロフはTom's Hardwareの寄稿ライターです。過去数十年にわたり、CPUやGPUからスーパーコンピュータ、最新のプロセス技術や最新の製造ツールからハイテク業界のトレンドまで、あらゆる分野をカバーしてきました。

Deals