49
Nvidia の Blackwell AI GPU 過熱問題は誇張されているようだ — 半導体アナリストが冷却を明らかに…

NvidiaのGB200 NVL72サーバーラックの過熱に関する報道は、誇張されているとされている。Business Insiderは、Blackwellの冷却設計上の欠陥は既に修正されていると報じている。Semianalysisのチーフアナリスト、Dylan Patel氏はBusiness Insiderに対し、数ヶ月前から存在していたBlackwellの設計上の問題はほぼ解決されており、過熱の問題は大部分が誇張されていると述べたと伝えられている。

Semianalysisの半導体業界アナリスト5人は、複数のサプライヤーによる「手直し」を引き起こした冷却システムの問題は「軽微な」変更だと報告した。Blackwellの冷却欠陥は、最大120kWを消費するNVIDIAの72チップ搭載の大型サーバーラックで特に問題となっていた。ラックの設計上の欠陥により、内部のGPUが過熱し、NVIDIAは複数回の設計見直しを余儀なくされた。このため、NVIDIAのGB200ハードウェアの出荷が遅延し、設計変更に伴うさらなる遅延が発生している。

エヌビディア

(画像提供:Nvidia)

この物理的問題により、NVIDIAは最新のBlackwell GPUに水冷を必須とせざるを得なくなりました。また、データセンターは、水冷サーバーをサポートするために必要なインフラを整備するために、サーバーファームの改修を迫られています。

NVIDIAは、低速の空冷式GPUを開発することでこの問題を解決できる可能性があり、同社は現在もH200 NVLなどのGPUで空冷式GPUを開発しています。しかし、AI GPUの軍拡競争の最前線に居続けるために、NVIDIAはコストを度外視してパフォーマンスを優先しています。そのため、同社は空冷を犠牲にして数千ワットの電力を必要とするGPUを製造することを選択しました。

朗報としては、NVIDIAの72チップ搭載Blackwellの冷却問題は軽微で、既に大部分が解決されているようです。さらに、この問題が発生しているのはNVIDIAの主力製品である72チップ搭載サーバーラックのみです。

Tom's Hardware の最高のニュースと詳細なレビューをあなたの受信箱に直接お届けします。