31
テスラが自社製スーパーコンピューターを自慢、現在7,360基のA100 GPU搭載

テスラは、自社製AIスーパーコンピュータに数千基のNVIDIA A100 GPUを追加搭載しました。約1年前、テスラのスーパーコンピュータには5,760基のA100 GPUが搭載されていましたが、その後、その数は7,360基に増加しました。これは1,600基の追加、つまり約28%の増加です。 

テスラのエンジニアリングマネージャー、ティム・ザマン氏によれば、このアップグレードにより同社の AI システムは GPU 数で世界トップ 7 のスーパーコンピューターとなるという。 

当初は8基のA100 GPUでしたが、現在テスラのAIスーパーコンピュータには7,360基のA100 GPUが搭載されています。テスラは自社のAIスーパーコンピュータのベンチマーク結果を公表していませんが、同様のGPUを搭載したNERSC Perlmutterは、6,144基のNvidia A100 GPUを搭載し、70.87 Linpackペタフロップスを達成しています。HPC Wireは、このデータと他のA100 GPUスーパーコンピュータのデータをパフォーマンスの基準値として用い、テスラのAIスーパーコンピュータは約100 Linpackペタフロップスを達成できると推定しています。 

テスラは、自社製AIスーパーコンピューターにNVIDIAのGPUアーキテクチャを長期的に採用するつもりはありません。GPU搭載数で世界トップ7に入るこのマシンは、2020年にイーロン・マスク氏が初めて発表した、今後登場するDojoスーパーコンピューターの前身に過ぎません。1年前、私たちはテスラのD1 Dojoチップを目にしました。このチップは、NVIDIAのGPUに取って代わり、「あらゆる粒度で最大のパフォーマンス、スループット、帯域幅」を実現するように設計されています。

Nvidia A100からTesla Dojoまで

(画像提供:テスラ)

Tesla Dojo D1は、AIトレーニングを目的としたカスタムASIC(特定用途向け集積回路)設計であり、この分野における初期のASICの一つです。現在のD1テストチップはTSMC N7で製造されており、約5,000万個のトランジスタを搭載しています。

Tom's Hardware の最高のニュースと詳細なレビューをあなたの受信箱に直接お届けします。

Dojo D1 チップと Dojo システムに関する詳細情報は、来週の Hot Chips Symposium で公開される可能性があります。来週の火曜日には、Dojo D1 チップのアーキテクチャ、Dojo と ML のトレーニング、システム統合による AI の実現をテーマにした 3 つの Tesla プレゼンテーションが予定されています。 

マーク・タイソンはトムズ・ハードウェアのニュース編集者です。ビジネスや半導体設計から、理性の限界に迫る製品まで、PCテクノロジーのあらゆる分野を網羅的にカバーすることに情熱を注いでいます。