
Dellとおそらく他のNVIDIAパートナー企業もGB300ベースのサーバーの初期生産を開始していますが、大規模な出荷は2025年9月まで開始されない見込みだとDigiTimesは報じています。戦略的な設計の再利用とサプライチェーン全体の連携強化により、展開は前世代よりもスムーズに進むと予想されています。しかしながら、液冷はODM(オリジナル設計メーカー)にとって依然として課題となっています。
ブラックウェルウルトラへの移行
GB200では、NvidiaはBiancaマザーボード全体を提供します。これには、B200 GPU、Grace CPU、512GBのLPDDR5Xメモリ、そして電源供給コンポーネントがすべて単一のプリント基板(PCB)に統合されています。Nvidiaは、このシステム用のスイッチトレイと銅バックプレーンも提供しています。
GB300は現在検証段階と初期生産段階にあり、ODM各社からは大きな問題は報告されていないとDigiTimesは報じている。パートナーからのフィードバックによると、部品の認定は計画通りに進んでおり、NVIDIAは第3四半期を通して着実に生産量を増やす見込みだ。DigiTimesによると、2025年第4四半期までに出荷量が大幅に増加すると予想されている。
コンピューティングボードの主要サプライヤーであるWistronは、GB200とGB300の世代交代により、今四半期の売上高は横ばいになるとの見通しを示したと、レポートは伝えている。朗報だ。現行プラットフォームへの移行は、NVIDIAのシリコン問題、高密度サーバーレイアウト、冷却要件などにより幾度となく遅延に見舞われたが、今回の移行はそれに比べれば順調に進んでいるようだ。サーバーODMは、今や、自社に当てはまるあらゆる課題への対応方法を習得したようだ。
冷却漏れ
DigiTimesによると、GB200はデータセンターに大量に出荷されているものの、液冷システムに継続的な問題を抱えている。主な故障はクイックコネクトフィッティングで、工場でのストレステストを受けているにもかかわらず、液漏れが発生していることが判明している。データセンター運営者は、局所的なシャットダウンや徹底的な液漏れテストなどの対策を講じており、ハードウェアの信頼性よりも導入速度とパフォーマンスを優先している。
300ポンドを超える
GB300に続き、NvidiaはAIサーバー向けに、コードネーム「Vera Rubin」と呼ばれる次世代プラットフォームを準備中です。このプラットフォームは2段階で展開されます。第1段階では、Grace CPUをVera CPUに、Blackwell GPUをRubin GPUに置き換えますが、現行のOberonラックは維持されます。OberonラックはNVL144の名称を持ちますが(72個のデュアルコンピューティングチップレットGPUパッケージを搭載しています)、第2段階では、Vera CPUとRubin Ultra GPUを4個のコンピューティングチップレットで搭載した全く新しいKyberラックが登場します。
Tom's Hardware の最高のニュースと詳細なレビューをあなたの受信箱に直接お届けします。
Rubin GPUはBlackwell GPUよりも消費電力が大きいと予想されるため、次世代プラットフォームでは液冷への依存度がさらに高まります。DigiTimesのレポートによると、この冷却方法はパフォーマンス向上に不可欠ですが、信頼性の高い実装が依然として困難です。GB200システムでは、配管の設置状況や導入環境ごとの水圧のばらつきにより、水漏れを完全に排除することが困難であり、導入後のメンテナンス作業と人件費の増加につながっています。
Google ニュースで Tom's Hardware をフォローすると、最新のニュース、分析、レビューをフィードで受け取ることができます。「フォロー」ボタンを忘れずにクリックしてください。
アントン・シロフはTom's Hardwareの寄稿ライターです。過去数十年にわたり、CPUやGPUからスーパーコンピュータ、最新のプロセス技術や最新の製造ツールからハイテク業界のトレンドまで、あらゆる分野をカバーしてきました。