49
テスラの3億ドル規模のAIクラスターが本日稼働開始
データセンター
(画像クレジット:Shutterstock)

@SawyerMerrittによると、テスラは月曜日に待望のスーパーコンピュータを発表する予定だ。このマシンは様々な人工知能(AI)アプリケーションに使用される予定だが、クラスターは非常に強力であるため、要求の厳しいハイパフォーマンスコンピューティング(HPC)ワークロードにも使用できる可能性がある。実際、NVIDIA H100ベースのスーパーコンピュータは、世界で最も強力なマシンの一つとなるだろう。

テスラの新しいクラスターは、10,000基のNVIDIA H100コンピューティングGPUを搭載し、技術計算では340 FP64 PFLOPS、AIアプリケーションでは39.58 INT8 エクサFLOPSのピーク性能を実現します。実際、テスラの340 FP64 PFLOPSは、世界第4位の性能を誇るスーパーコンピュータ、Leonardoの304 FP64 PFLOPSを上回っています。

テスラ

(画像クレジット: @SawyerMerritt/Twitter)

テスラは、新しいスーパーコンピュータを導入することで、コンピューティング能力を大幅に強化し、完全自動運転(FSD)技術のトレーニングをこれまで以上に高速化します。これにより、テスラは他の自動車メーカーに対する競争力を高めるだけでなく、世界最速のスーパーコンピュータの一つを所有することになります。

「現実世界のビデオトレーニングにより、当社は世界最大のトレーニングデータセットと、LLM より桁違いに大きい 200PB を超えるホット層キャッシュ容量を持つ可能性があります」と、Tesla の AI インフラ & AI プラットフォーム エンジニアリング マネージャーである Tim Zaman 氏は説明しています。

テスラ

(画像クレジット: @SawyerMerritt/Twitter)

新型H100ベースのクラスターはテスラのトレーニング速度を劇的に向上させると期待されていますが、NVIDIAはこれらのGPUの需要を満たすのに苦戦しています。その結果、テスラは10億ドル以上を投資し、カスタム設計され高度に最適化されたシステムオンチップ(SoC)をベースにした独自のスーパーコンピューター「Dojo」を開発しています。 

DojoはFSDトレーニングを加速するだけでなく、テスラの全車両におけるデータ処理も管理します。テスラはDojoと同時にNVIDIA H100 GPUクラスターもオンライン化しており、これにより同社は自動車業界で比類のないコンピューティングパワーを獲得することになります。

イーロン・マスク氏は最近、テスラが2023年にAIトレーニングに20億ドル以上、2024年にはFSDトレーニング用のコンピューティングにさらに20億ドルを投資する計画を明らかにしました。これは、テスラが計算ボトルネックの克服に注力していることを裏付けるものであり、競合他社に対して大きな優位性をもたらすはずです。 

Tom's Hardware の最高のニュースと詳細なレビューをあなたの受信箱に直接お届けします。

アントン・シロフはTom's Hardwareの寄稿ライターです。過去数十年にわたり、CPUやGPUからスーパーコンピュータ、最新のプロセス技術や最新の製造ツールからハイテク業界のトレンドまで、あらゆる分野をカバーしてきました。