
中国企業は、主に新疆ウイグル自治区と青海省にある39カ所の新たなAIデータセンターに、11万5000台を超える高性能NVIDIA Hopper GPUを導入する準備を進めている。これらのGPUは、米国の輸出規制により中国への輸出が制限されている。ブルームバーグの報道によると、NVIDIAのH100およびH200 GPUの中国への輸出制限にもかかわらず、新疆ウイグル自治区と青海省の地方当局は、かなり大規模なデータセンターの建設を認可したという。さらに、AIコンピューティング性能に対する需要が鈍化しているにもかかわらず、中国におけるデータセンター建設は減速していないようだ。
巨大なクラスター
Hopper GPUの数(合計11万5000基、新疆ウイグル自治区義烏県のデータセンターに8万500基)を例に挙げると、イーロン・マスク氏のxAIは、現在利用可能な最先端AIモデルの一つであるGrok 3の学習に、約10万基のH100プロセッサを使用しました。DeepSeekは、R1モデルの学習に、5万基のNvidia Hopper GPU(H20 HGXユニット3万基、H800ユニット1万基、H100ユニット1万基を含む)からなるGPUクラスターを使用しました。DeepSeekがR2モデルの学習に使用したGPUは不明です。
中国企業は国営企業であるため、AIクラスターの仕様や性能を公開しない傾向があり、8万500基のGPUを搭載したこのデータセンターが、中国の既存のAIクラスターと比べてどの程度優れているかを判断するのは困難です。しかしながら、もし実現すれば、中華人民共和国で最も強力なAIデータセンターの一つとなる可能性があります。つまり、約8万基のHopper H100およびH200 GPUを搭載したクラスターは、中国のAIインフラ全体を大幅に強化することになります。さらに、高度な大規模言語モデル(LLM)や大規模推論モデル(LRM)の学習にも活用できます。
ブルームバーグが引用した中国政府の声明によると、新疆ウイグル自治区はすでに「24,000ペタフロップスの処理能力」を提供するデータセンターを建設しており、これはNVIDIA H100を約12,000台分に相当するとされており、重慶などの他の都市でも利用可能となっている。投資家誘致のため、地元当局はAIやグリーンテクノロジーの専門家に対し、電気料金の20%割引に加え、資金援助や住宅支援などの優遇措置も提供している。
中国向けに数万台の Hopper GPU を供給?
ブルームバーグは、計画通り39のプロジェクトすべてを完了するには、中国の闇市場で数十億ドル相当のH100またはH200プロセッサを搭載した14,000台以上のサーバーを調達する必要があると見積もっている。
新疆ウイグル自治区と青海省のデータセンター運営者やその顧客は、おそらく自社のワークロードにH20 HGXプロセッサを使用できるだろうが、当局への許可書類には使用予定のプロセッサが明記されており、プロジェクトにはH100の高性能とH200の大容量メモリが必要であることが示唆されている。正確な測定基準にもよるが、H100はAIデータ形式では縮小版H20の3.3~6.69倍、HPCデータ形式では1.52~64倍高速となる可能性がある。とはいえ、AIコンピューティングハードウェアのクラスタリングでは線形パフォーマンススケーリングは実現されないものの、11万5000個のH100 GPUを置き換えるには、38万~77万個のH20が必要になる。
スワイプして水平にスクロールします
グラフィックプロセッサ | HGX H20 | H100 SXM | 違い |
アーキテクチャ | GPU | ホッパー | GH100 | ホッパー | GH100 | - |
メモリ | 96 GB HBM3 | 80 GB HBM3 | 0.83倍 |
メモリ帯域幅 | 4.0 TB/秒 | 3.35 TB/秒 | 0.83倍 |
INT8 | FP8 テンソル(密) | 296 TFLOPS | 1980 TFLOPS | 6.69倍 |
BF16 | FP16 テンソル(密) | 148フロップス | 495 TFLOPS | 3.34倍 |
TF32 テンソル(密) | 74 TFLOPS | 495 TFLOPS | 3.69倍 |
FP32 | 44 TFLOPS | 67 TFLOPS | 1.52倍 |
FP64 | 1テラフロップス | 34 TFLOPS | 34倍 |
RTコア | 該当なし | 該当なし | - |
ミグ | 最大7ミグ | 最大7ミグ | - |
L2キャッシュ | 60MB | 60MB | - |
メディアエンジン | 7 NVDEC、7 NVJPEG | 7 NVDEC、7 NVJPEG | - |
力 | 400W | 700W | 1.75倍 |
フォームファクター | 8ウェイHGX | 8ウェイHGX | - |
インタフェース | PCIe Gen5 x16: 128 GB/秒 | PCIe Gen5 x16: 128 GB/秒 | - |
NVリンク | 900 GB/秒 | 900 GB/秒 | - |
これらの部品がどのように調達されるかについては説明されていないが、中国に密輸される GPU サーバーが多数あることはわかっている。
米国政府の調査に詳しい関係者は、新疆ウイグル自治区の具体的なプロジェクトについては把握していないとしながらも、ブルームバーグの取材に対し、中国にNVIDIAの無許可ハードウェアが存在することを確認した。しかし、組織化されたネットワークが、1つの国、ましてや単一の地域に10万個以上の制限付きプロセッサを供給できるとは考えにくいと彼らは指摘した。中国におけるそのようなチップの総数については、推計値がまちまちだ。バイデン政権の高官2人は、2万5000個に近い数字を挙げたが、これは中国のプロジェクトに必要な数をはるかに下回る。
これまでのところ、中国がこれらの建設計画で概説されている11万5000台以上の制限付きGPUを既に蓄積した、あるいは近々受け取るという直接的な証拠はない。それでも、施設の建設作業は継続されている。活動の大半が行われている義烏市では、安定した電力供給のために大規模な太陽光発電タワーが建設されている。この場所は、太陽光と風力エネルギーへのアクセス、安価な土地、そしてハードウェアの冷却に役立つ高地であることから選ばれた。
H100およびH200 GPUの入手性について言えば、Hopper GPUは世界中に数百万個設置されており、少なくとも一部のデータセンターでは、より高性能なBlackwellアクセラレータへの切り替えが進むでしょう。しかし、懸念されるのは、今後数か月または数四半期のうちに、大量のH100 GPUが廃棄されるということです。中華人民共和国の企業にとって、それらを調達して中国に密輸することは、一見合理的に思えます。しかし、これまで実際にそうした試みが行われたという証拠はありません。
NVIDIAは、シンガポールなどの他国から中国へのGPUの大規模な横流しの兆候はないと繰り返し強調している。しかしながら、東南アジア、特にマレーシアとシンガポールを経由した密輸が懸念材料となっている。シンガポールは現在、規制対象部品を含むAIサーバーをマレーシアに輸出した疑いで個人を起訴しており、これらのサーバーは最終的に中国に流入する可能性がある。米国当局はマレーシア当局に対し、無許可の技術移転に対する措置を講じるよう要請しており、マレーシアは確固たる証拠が提示されれば行動を起こすと表明している。
米国商務省産業安全保障局のジェフリー・ケスラー氏は先日、AI用GPUの中国への無許可の輸出が実際に発生していると議員らに報告した。ブルームバーグの報道によると、NVIDIAに不正行為の疑いはないものの、ワシントン当局は禁止されているGPUがどのようにして中国に流入したのかを調査しているという。
新疆ウイグル自治区、特にハミ地区は既に再生可能エネルギーの拠点となっており、地元政府は豊富なエネルギー資源を活用したコンピューティングインフラの開発を積極的に推進しています。
落とし穴がある
NVIDIAはブルームバーグに対し、この問題についてコメントし、非公式パーツや中古パーツを用いて機能的なAIインフラを構築することはリスクが高く、非現実的であると述べています。また、同社は中国およびその他の地域で規制されている製品については、運用サポートや技術サポートを提供していないと述べています。研究目的の小規模な導入であればサポート不足は問題にならないかもしれませんが、数千または数万のGPUを搭載した大規模なマシンは、パフォーマンスと効率を最大限に高めるために、NVIDIAの専門家によってクラスター化されるのが一般的です。
しかし、中国企業には選択肢がないため、パフォーマンスと効率を犠牲にしても、同社と協力せずに大規模なNvidiaベースのクラスターを構築しようとする可能性があります。
Google ニュースで Tom's Hardware をフォローすると、最新のニュース、分析、レビューをフィードで受け取ることができます。「フォロー」ボタンを忘れずにクリックしてください。
アントン・シロフはTom's Hardwareの寄稿ライターです。過去数十年にわたり、CPUやGPUからスーパーコンピュータ、最新のプロセス技術や最新の製造ツールからハイテク業界のトレンドまで、あらゆる分野をカバーしてきました。