
ComputerBaseの報道によると、AMDの最高技術責任者であるマーク・ペーパーマスター氏は、ISC 2025で同社のAIおよびHPC向けアクセラレーター「Instinct MI355X」を正式に発表し、AI推論の大幅なパフォーマンス向上を明らかにしたが、同時に、2023年の前身モデルと比較して、この新しい主力GPUの消費電力がほぼ2倍になっていることも指摘した。
AMDのCDNA 4が登場
AMD の AI および HPC GPU の Instinct MI350X ファミリーは、空冷用に設計された 1000W の消費電力のデフォルトの Instinct MI350X モジュールと、最大 1400W を消費し、主に直接液体冷却用に設計されたより高性能な Instinct MI355X の 2 つのモデルで構成されています (ただし、AMD は一部のクライアントが MI355X で空冷を使用できると考えています)。
両SKUとも、最大8TB/sの帯域幅を提供する288GB HBM3Eメモリを搭載しますが、MI350Xは最大FP4/FP6性能が18.45PFLOPSであるのに対し、MI355Xは最大FP4/FP6性能が20.1PFLOPSに達するとされています。Instinct MI350Xの両モデルは、FP4性能で最大15PFLOPSを誇るNvidiaのB300 (Blackwell Ultra) GPUを上回っていますが、AMDのMI350XとMI355Xが実際のアプリケーションでどの程度の性能を発揮するかはまだ不明です。
スワイプして水平にスクロールします
行0 - セル0 | AMD インスティンクト MI325X GPU | AMD インスティンクト MI350X GPU | AMD Instinct MI350X プラットフォーム (8x OAM) | AMD インスティンクト MI355X GPU | AMD Instinct MI355X プラットフォーム (8x OAM) |
GPU | インスティンクト MI325X OAM | インスティンクト MI350X OAM | 8xインスティンクトMI350X OAM | インスティンクト MI355X OAM | 8xインスティンクトMI355X OAM |
GPUアーキテクチャ | CDNA 3 | CDNA 4 | CDNA 4 | CDNA 4 | CDNA 4 |
専用メモリサイズ | 256 GB HBM3E | 288 GB HBM3E | 2.3TB HBM3E | 288 GB HBM3E | 2.3TB HBM3E |
メモリ帯域幅 | 6 TB/秒 | 8 TB/秒 | OAM あたり 8 TB/秒 | 8 TB/秒 | OAM あたり 8 TB/秒 |
ピーク半精度(FP16)パフォーマンス | 2.61 PFLOPS | 4.6 PFLOPS | 36.8 PFLOPS | 5.03 PFLOPS | 40.27 PFLOPS |
ピーク8ビット精度(FP8)パフォーマンス | 5.22 PFLOPS | 9.228 PFLOPS | 72 PFLOPS | 10.1 PFLOPS | 80.53 PFLOPS |
ピーク6ビット精度(FP6)パフォーマンス | - | 18.45 PFLOPS | 148 PFLOPS | 20.1 PFLOPS | 161.06 PFLOPS |
ピーク4ビット精度(FP4)パフォーマンス | - | 18.45 PFLOPS | 148 PFLOPS | 20.1 PFLOPS | 161.06 PFLOPS |
冷却 | 空気 | 空気 | 空気 | DLC / エア | DLC / エア |
標準ボード電力 (TBP) | 1000Wピーク | 1000Wピーク | OAMあたり1000Wピーク | 1400Wピーク | OAMあたり1400Wピーク |
前世代機とのパフォーマンス比較では、MI350XのFP8演算スループットは約9.3 PFLOPSですが、より高速なMI355Xは10.1 PFLOPSとされています。これは、Instinct MI325Xの2.61/5.22 FP8 FLOPS(構造化スパースなし/あり)から大幅に向上した数値です。また、MI355XはNvidiaのB300を0.1 FP8 PFLOPS上回っています。
より高速なGPUが登場
ペーパーマスター氏は、業界がスーパーコンピュータ向けにさらに強力なCPUとアクセラレータの開発を続け、今後10年ほどでゼタスケールの性能を達成すると確信していると述べた。しかし、その性能は消費電力の急激な増加を伴い、ゼタFLOPSの性能を持つスーパーコンピュータは500MWの電力を消費する可能性がある。これは原子力発電所の半分の電力に相当する。
ISC 2025において、AMDはトップクラスのスーパーコンピュータの演算性能が約1.2年ごとに倍増するという軌跡を一貫して辿っていることを示すデータを発表しました。グラフは1990年から現在までの性能を網羅し、ピーク時のシステムGFLOPSを示しています。初期の成長はCPUのみのシステムが牽引していましたが、2005年頃からは、CPUとGPU、アクセラレータを組み合わせたヘテロジニアスアーキテクチャへの移行が進みました。AMDが「AIアクセラレーション時代」と呼ぶ現在、El CapitanやFrontierなどのシステムは1エクサフロップスを超え、AI特化型ハードウェアの進化により、指数関数的な成長トレンドが続いています。
Tom's Hardware の最高のニュースと詳細なレビューをあなたの受信箱に直接お届けします。
しかし、パフォーマンスの向上には消費電力の犠牲が伴います。パフォーマンスの向上を維持するためには、メモリ帯域幅と消費電力のスケーリングが喫緊の課題となっています。AMDのスライドによると、FLOPSあたりの帯域幅比率を維持するためには、GPUメモリ帯域幅を2年ごとに2倍以上に拡大する必要があるとのことです。このため、GPUあたりのHBMスタックの数を増やす必要があり、結果としてGPUとモジュールはより大型化し、消費電力も増大しています。
実際、スーパーコンピュータ向けアクセラレータの消費電力は急速に増加しています。AMDが2023年半ばに発表したInstinct MI300Xのピーク消費電力は750Wでしたが、今週正式発表予定のInstinct MI355Xはピーク消費電力が1,400Wになります。ペーパーマスター氏は、2026~2027年には1,600Wのアクセラレータが登場し、2020年代後半には2,000Wのプロセッサが登場すると予測しています。一方、AMDの競合であるNVIDIAは、消費電力に関してはさらに野心的な姿勢を示しており、レチクルサイズのコンピューティングチップレットを4つ搭載したRubin Ultra GPUは、最大3,600Wの消費電力になると予想されています。
朗報なのは、消費電力の増加に加えて、スーパーコンピュータとアクセラレータの性能効率も急速に向上していることです。AMDのISC 2025基調講演の別のスライドでは、性能効率が2010年の約3.2GFLOPS/Wから、Frontierのようなエクサスケールシステムが登場した頃には約52GFLOPS/Wに向上したことが示されていました。
今後、この性能向上のペースを維持するには、エネルギー効率を2.2年ごとに倍増させる必要があります。1,000倍のエクサフロップス級の性能を実現するゼタスケールシステムでは、約500MWの電力と2,140GFLOPS/W(現在の41倍)の効率レベルが必要になります。このような性能向上がなければ、将来のスーパーコンピューターはギガワット規模の電力を必要とする可能性があり、これは原子力発電所1基分に匹敵し、運用コストがあまりにも高額になる可能性があります。
AMDは、10年後にスーパーコンピュータの性能を飛躍的に向上させるには、アーキテクチャ面で数々のブレークスルーを達成するだけでなく、業界全体がコンピューティング能力の進化に追随し、十分なメモリ帯域幅を確保する必要があると考えています。しかしながら、2030年代には、原子炉をスーパーコンピュータの動力源として利用するという可能性がますます現実的になってきています。
Google ニュースで Tom's Hardware をフォローすると、最新のニュース、分析、レビューをフィードで受け取ることができます。「フォロー」ボタンを忘れずにクリックしてください。
アントン・シロフはTom's Hardwareの寄稿ライターです。過去数十年にわたり、CPUやGPUからスーパーコンピュータ、最新のプロセス技術や最新の製造ツールからハイテク業界のトレンドまで、あらゆる分野をカバーしてきました。