
NvidiaのRTX 6000Dは、決して主力製品になるはずはありませんでした。米国の輸出規制を回避するために中国市場向けに特別に開発されたこの製品は、GDDRベースのBlackwell GPUでNVLinkを搭載しておらず、本格的なAIトレーニングではなく推論用途に特化しているため、制約のある設計となっています。
サウスチャイナ・モーニング・ポスト紙の取材に応じた調達関係筋2人は、需要が低迷しており、このチップの価値提案は「機能に対して高価」だと述べた。しかも、これはNVIDIAのフラッグシップゲーミングGPUであるRTX 5090との比較という、不快な点を考慮する前の話だ。RTX 5090は中国では正式に禁止されているものの、グレーマーケットのチャネルを通じて広く入手可能だ。ある基準によれば、このコンシューマー向けカードは6000Dの半分の価格で入手できるだけでなく、NVIDIAが輸出用に設計した同じ推論タスクにおいて6000Dを上回る性能を発揮する。
ブラックウェルの帯域幅なし
NvidiaはRTX 6000Dの正式な仕様を公開していませんが、複数の情報筋によると、従来のGDDRメモリを搭載したBlackwellアーキテクチャを採用し、約1,398GB/秒の帯域幅を実現しています。これは、1.4TB/秒のエクスポート制限をわずかに下回る値です。HBMや高帯域幅インターコネクトパッケージングを避けているという強い兆候があり、ダイ構造がよりシンプルになり、NVLinkではなくPCIeまたは外部NICに依存する可能性が高いことが示唆されています。
つまり、6000DはRTX 6000 Blackwellや5090の改良版によく似たPCIeワークステーションカードで、名前が異なり、価格が大幅に高いというだけのことです。しかし、スペックよりも、スケールアップを試みた際に何が起こるかが重要なのです。
NVLinkを搭載していない6000Dは、GPU間の通信にPCIeやConnectXなどの外付けNICに依存する可能性があります。そのため、大規模モデル推論ワークロードではすぐに不利になります。FP16で70Bパラメータのモデルを実行する場合、重みだけで140GB以上のメモリが必要になることがあります。INT8量子化でさえ、KVキャッシュを追加すると50GB以下に収めるのが困難になります。つまり、単一のモデルレプリカを提供するだけでも、多くの場合2つ以上のGPUが必要になるということです。そうなると、GPU間通信がボトルネックになります。
PCIe 4.0 x16 は約64GB/秒の帯域幅を提供します。一方、NVLink 5.0 は900GB/秒に迫ります。Nvidia のドキュメントでは、まさにこの理由から、テンソル並列処理を NVLink ドメイン内に維持することを推奨しています。all-reduce や activation exchange などの集合演算はレイテンシの影響を受けやすいからです。PCIe や 800Gbps Ethernet でこれを実行しようとすると、ステップ実行時間が膨大になってしまいます。クラスターに 6000D をさらに追加すれば、スループットのメリットがいかに低下するかは容易に想像できます。購入者の視点から見ると、他のハードウェアでより優れたパフォーマンスが得られるのに、わざわざ 6000D を追加する意味がどこにあるのでしょうか。
グレーマーケットの群れ
RTX 6000Dは中国で約7,000ドル(50,000円)で販売されていました。これは、NVLink非搭載のGDDRカードではなく、H20のようなローエンドのHBMベースGPUに支払う金額とそれほど変わりません。また、H20とは異なり、トレーニング用GPUを謳うわけでもありません。
では、非公式に入手可能なものと比べてみましょう。ゲーマー向けに設計されながらも、NVIDIAのBlackwellチップを搭載したグレーマーケットのRTX 5090は、わずか3,500ドル(25,000円)で取引されています。中には、ブロワータイプの筐体に最大80GB、あるいは改造されたユニットでは128GBまでVRAMを拡張した状態で転売されているものもあります。米国の輸出規制では厳密には禁止されているにもかかわらず、RTX 5090はどこにでも出回っており、しかもパフォーマンスも優れています。
では、グレーマーケットでより高性能な部品が問題なく入手できるのに、なぜ6000Dを選ぶのでしょうか? 1元あたりのスループットという観点から見ると、グレーマーケットの5090チップ群は6000Dをまるで冗談のように見せかけます。さらに、より優れた選択肢が間もなく登場する可能性がある中で、中国のバイヤーが6000Dにお金を使う理由は何でしょうか?
国内市場はすぐそこ?
6000Dの不振の大きな要因は、状況的なものです。中国のバイヤーは、NVIDIAが認可したH20(HBMベースのHopper GPU)の出荷を依然として待っていました。7月に輸出が承認されたものの、依然として宙に浮いた状態です。これは多くのハイパースケーラーが高密度推論向けに求めていたチップですが、中国によるNVIDIAの禁輸措置に関する最新の報道により、これらの注文が果たして履行されるのか疑問視されています。
同時に、トレーニング用に設計されたより強力なBlackwell製パーツであるB30Aの販売承認も期待されていました。しかし、NVIDIAチップの入手が新たに禁止されたことで、その可能性はかつてないほど低くなりました。B30Aは144GBのHBM3EとNVLinkサポートを搭載し、H20の最大6倍の性能をわずか2倍の価格で実現すると報じられていました。
中国サイバースペース管理局(CAC)の最新の動きからも明らかなように、中国は明らかにNVIDIAチップへの依存から脱却しつつあります。さらに深い変化が進行中です。中国は国産AIハードウェアの導入を強く推進しており、国営クラウドはAIアクセラレータの少なくとも50%を中国ベンダーから調達することを義務付けています。HuaweiのAscend、BirenのCloudMatrix、CambriconのNPU製品群が候補に挙がっています。HuaweiがCUDAに代わる技術として開発を進め、完全オープンソース化したCANNも同様です。
これにより(理論上は)開発者はワークロードをNvidiaからAscendへ移行することが可能になるが、移行は容易ではない。中国の法学修士(LLM)研究機関DeepSeekは、パフォーマンスの不安定さとチップ間通信の不備を理由に、次期モデルをAscend NPUでトレーニングする計画を中国政府から激しい非難を浴びながら断念した。
今のところ、中国の主要クラウドは事実上CUDAに縛られている。しかし、そこから脱却しようとする政治的・戦略的な圧力は高まっている。中国にとって、輸出規制が継続されれば欧米のクラウドに比べて決定的に遅れをとることになるNVIDIAのエコシステムに注力するだけのメリットはあまりにも少ない。
Google ニュースで Tom's Hardware をフォローすると、最新のニュース、分析、レビューをフィードで受け取ることができます。「フォロー」ボタンを忘れずにクリックしてください。
ルーク・ジェームズはフリーランスのライター兼ジャーナリストです。法務の経歴を持つものの、ハードウェアやマイクロエレクトロニクスなど、テクノロジー全般、そして規制に関するあらゆることに個人的な関心を持っています。