24
AMD Instinct MI300 データセンター APU のクローズアップ写真: 13 個のチップレット、1,460 億個のトランジスタ

MI300

(画像クレジット: Marco Chiappetta)

AMDはCES 2023で次世代のInstinct MI300アクセラレーターを発表しましたが、私たちは幸運にも実際に試用し、この巨大チップのクローズアップ画像を数枚撮影することができました。

間違いなく、Instinct MI300は画期的な設計です。このデータセンターAPUは、合計13個のチップレット(その多くは3Dスタック)を統合し、24個のZen 4 CPUコア、CDNA 3グラフィックエンジン、そして8スタックのHBM3を融合したチップを構成しています。このチップは全体で1460億個のトランジスタを搭載し、AMDがこれまでに量産したチップの中で最大規模となります。 

画像

1

2

MI300
(画像提供:Future)

MI300はトランジスタ総数が1460億個で、128GBのHBM3メモリを搭載したIntelの1000億トランジスタPonte Vecchioをはるかに上回ります。蓋を取り外したチップは光沢のある外観のため、写真を撮るのは非常に困難ですが、中央のダイの両側に8つのHBM3スタックが配置されているのははっきりと確認できます。これらのHBMスタックの間には、冷却ソリューションがパッケージ上にトルクをかけられた際に安定性を確保するための構造用シリコンの薄片が配置されています。

チップのコンピューティング部分は、CPUコアまたはGPUコアの5nmチップレット9個で構成されていますが、AMDはそれぞれのコア数について詳細を明らかにしていません。Zen 4コアは通常8コアダイとして展開されるため、CPUダイは3個、GPUダイは6個になる可能性があります。GPUダイは、AMDのデータセンター向けグラフィックスアーキテクチャの第3世代であるCDNA 3アーキテクチャを採用しています。AMDはCU数を明らかにしていません。

これら9個のダイは、4個の6nmベースダイの上に3D積層されています。これらのダイは単なるパッシブインターポーザーではなく、I/Oをはじめとする様々な機能を担うアクティブダイであると説明されています。AMDの担当者は、ベルトサンダーで上面のダイを研磨し、4個のアクティブインターポーザーダイのアーキテクチャを明らかにした別のMI300サンプルを見せてくれました。I/Oタイル間の通信だけでなく、HBM3スタックとインターフェースするメモリコントローラー間の通信も可能にする構造をはっきりと確認できました。この2個目のサンプルは写真撮影が禁止されていました。

3D設計により、CPU、GPU、メモリダイ間のデータスループットが飛躍的に向上すると同時に、CPUとGPUがメモリ内の同一データを同時に処理(ゼロコピー)できるため、消費電力の削減、パフォーマンスの向上、プログラミングの簡素化につながります。このデバイスが、同じくオンパッケージHBMを採用しているIntelのXeon Max CPUのように、標準DRAMなしで使用できるかどうかは興味深いところです。 

AMDの担当者は詳細について明らかにしなかったため、AMDが上部ダイと下部ダイを接合するのに標準的なTSV方式を採用しているのか、それともより高度なハイブリッド接合方式を採用しているのかは不明です。AMDは近日中にパッケージングに関する詳細を発表するとのことです。 

画像

1

4

MI300
(画像提供:AMD)

AMDは、MI300はInstinct MI250と比較してAI性能が8倍、ワット当たり性能が5倍(FP8スパースで測定)であると主張しています。また、ChatGPTやDALL-Eのような超大規模AIモデルのトレーニング時間を数ヶ月から数週間に短縮し、数百万ドルの電力を節約できるとも述べています。 

現世代のInstinct MI250は、世界初のエクサスケールマシンであるFrontierスーパーコンピューターに搭載されており、Instinct MI300は、近々登場する2エクサフロップスのEl Capitanスーパーコンピューターに搭載される予定です。AMDによると、これらのHalo MI300チップは高価で比較的希少です。大量生産品ではないため、EPYC GenoaデータセンターCPUのように広く普及することはないでしょう。しかし、この技術は、異なるフォームファクターの複数のバリエーションに展開される予定です。

このチップは、NvidiaのGrace Hopperスーパーチップとも競合するでしょう。これは、Hopper GPUとGrace CPUを同一基板上に搭載したものです。これらのチップは今年中に発売される予定です。NeoverseベースのGrace CPUはArm v9命令セットをサポートし、システムにはNvidiaが新たに開発したNVLink-C2C相互接続技術によって統合された2つのチップが搭載されます。AMDのアプローチは、優れたスループットとエネルギー効率を実現するように設計されています。これらのデバイスを1つのパッケージに統合することで、通常、2つの個別のデバイスに接続する場合よりもユニット間のスループットが向上します。 

MI300 は、x86 コア、GPU コア、メモリなどさまざまな数のコンピューティング タイルを特徴とし、さまざまな構成が可能なチップである Intel の Falcon Shores とも競合しますが、これは 2024 年まで登場する予定はありません。 

Tom's Hardware の最高のニュースと詳細なレビューをあなたの受信箱に直接お届けします。

MI300

(画像提供:Future)

MI300パッケージの底面には、LGAマウントシステム用のコンタクトパッドが取り付けられています。AMDはソケット機構の詳細を明らかにしていませんが、近日中に詳細が明らかになるでしょう。チップは現在AMDの研究所にあり、Instinct MI300は2023年後半に出荷される予定です。El Capitanスーパーコンピューターは、2023年の導入時には世界最速のスーパーコンピューターとなります。現在、予定通りの稼働です。 

ポール・アルコーンはTom's Hardware USの編集長です。CPU、ストレージ、エンタープライズハードウェアに関するニュースやレビューも執筆しています。