55
インテルがAI向けアクセラレーター「Gaudi 3」を発表:NVIDIAのH100 AI GPUより遅いが、価格も安い
インテル
(画像提供:Intel)

2024 年 10 月 1 日更新: Intel の Guadi 3 に関する詳細情報を追加し、サポートされているデータ形式を修正しました。

Intelは本日、AIワークロード向けアクセラレータ「Gaudi 3」を正式に発表しました。この新しいプロセッサは、AIおよびHPC向けの人気GPUであるNVIDIAのH100およびH200よりも低速であるため、IntelはGaudi 3の成功を低価格と総所有コスト(TCO)の削減に賭けています。

IntelのGaudi 3プロセッサは、64個のテンソルプロセッサコア(TPC、FP32アキュムレータ搭載の256x256 MAC構造)、8個の行列乗算エンジン(MME、256ビット幅ベクトルプロセッサ)、そして19.2TB/秒の帯域幅を持つ96MBのオンダイSRAMキャッシュを搭載した2つのチップレットを搭載しています。また、Gaudi 3は24個の200GbEネットワークインターフェースと14個のメディアエンジンを統合しており、後者はH.265、H.264、JPEG、VP9に対応し、ビジョン処理をサポートします。このプロセッサは、8つのメモリスタックに128GBのHBM2Eメモリを搭載し、3.67TB/秒という驚異的な帯域幅を提供します。

画像

1

8

インテル
(画像提供:Intel)

IntelのGaudi 3は、24個のTPCと2個のMMEを搭載し、96GBのHBM2Eメモリを搭載したGaudi 2と比較して、大幅な改善を遂げています。Gaudi 3プロセッサはFP8、BF16、FP16、TF32、FP32の行列演算に加え、FP8、BF16、FP16、FP32のベクトル演算もサポートしているため、TPCとMMEは簡素化されていません。

スワイプして水平にスクロールします

行0 - セル0ガウディ3ガウディ2H100
マトリックス | FP81835 TFLOPS865 TFLOPS1978.9 | 3957.8* TFLOPS
マトリックス | BF16 MME1835 TFLOPS432 TFLOPS989.4 | 1978.9* TFLOPS
マトリックス | FP16459 TFLOPS?989.4 | 1978.9* TFLOPS
マトリックス | TF32459 TFLOPS?497.7 | 989.4* TFLOPS
マトリックス | FP32229 TFLOPS?-
ベクター | FP857.3 TFLOPS?-
ベクター | BF1628.7 TFLOPS11 TFLOPS133.8 TFLOPS
ベクター | FP1628.7?133.8 TFLOPS
ベクター | FP3214.3?66.9 TFLOPS

*スパース性あり。 

パフォーマンスに関しては、Intelによると、Gaudi 3は約600W TDPで、BF16/FP8マトリックスで最大1,835 TFLOPS、BF16ベクターで最大28.7 TFLOPSの性能を発揮するとのことです。NvidiaのH100と比較すると、少なくとも理論上は、Gaudi 3はBF16マトリックス性能がNvidiaのハードウェアがスパース機能を使用する場合、わずかに劣る(1,835 TFLOPS vs. 1,979 TFLOPS)、FP8マトリックス性能がH100がスパース機能を使用する場合、わずかに劣る(1,835 TFLOPS vs. 3,958 TFLOPS)、BF16ベクター性能が大幅に劣る(28.7 TFLOPS vs. 133.8 TFLOPS)。 

画像

1

3

インテル
(画像提供:Intel)

Gaudi 3の実際の性能は、スペックそのものよりも重要です。AMDのInstinct MI300シリーズやNVIDIAのH100、B100/B200プロセッサと競合する必要があります。これはソフトウェアやその他の要因に大きく左右されるため、まだ不透明です。現時点では、IntelはGaudi 3がNVIDIAのH100と比較して大幅な価格性能比の優位性を提供できると主張するスライドをいくつか公開しています。

今年初め、インテルはベースボードに8基のGaudi 3プロセッサを搭載したアクセラレータキットの価格を12万5000ドルと発表しました。つまり、1基あたりの価格は約1万5625ドルになります。一方、NVIDIA H100カードは現在3万678ドルで販売されているため、インテルは競合他社に対して大きな価格優位性を持つことになります。しかし、BlackwellベースのB100/B200 GPUがもたらすパフォーマンス上の大きな優位性を考えると、インテルがライバルに対する優位性を維持できるかどうかは依然として不透明です。  

Tom's Hardware の最高のニュースと詳細なレビューをあなたの受信箱に直接お届けします。

画像

1

2

インテル
(画像提供:Intel)

「AIへの需要はデータセンターに大きな変革をもたらしており、業界はハードウェア、ソフトウェア、そして開発ツールの選択肢を求めています」と、インテルのエグゼクティブ・バイスプレジデント兼データセンター&人工知能グループ担当ゼネラルマネージャーであるジャスティン・ホタード氏は述べています。「Pコア搭載のXeon 6とGaudi 3 AIアクセラレーターの発表により、インテルはお客様があらゆるワークロードをより高いパフォーマンス、効率、そしてセキュリティで実行できるオープンなエコシステムを実現します。」

IntelのGaudi 3 AIアクセラレーターは、IBM CloudとIntel Tiber Developer Cloudから利用可能になります。また、Intel Xeon 6とGaudi 3を搭載したシステムは、Dell、HPE、Supermicroから第4四半期に一般提供が開始され、DellとSupermicroのシステムは10月に、Supermicroのマシンは12月に出荷されます。

インテル

(画像提供:Intel)

アントン・シロフはTom's Hardwareの寄稿ライターです。過去数十年にわたり、CPUやGPUからスーパーコンピュータ、最新のプロセス技術や最新の製造ツールからハイテク業界のトレンドまで、あらゆる分野をカバーしてきました。