AMD Advancing AIイベントのライブブログ：Instinct MI300の発売、Ryzen 8000「Hawk Point」搭載が予想

リフレッシュ

2023-12-06T16:35:27.580Z

2023-12-06T17:59:59.643Z

AMD は画面上に警告文を表示し始めたので、ショーはもうすぐ始まります。

2023年12月6日18:02:50.599Z

AMD CEOのリサ・スー氏がステージに登場。彼女はプレゼンテーションの冒頭、ちょうど1年前のChatGPTのローンチと、それが世界に与えた爆発的な影響について回想しました。

2023-12-06T18:04:37.678Z

生成AIは、学習と推論のワークロードのニーズを満たすために、多大な投資を必要とします。1年前、AMDは2027年までにAIワークロードのTAM（市場占有率）が1,500億ドルに達すると予測していました。現在、AMDはこの予測を2027年には4,000億ドルに修正しています。

2023-12-06T18:06:11.580Z

AMDは現在、AI導入の障壁を取り除き、パートナーと協力して新しいソリューションを開発することに注力しています。

2023-12-06T18:07:56.095Z

リサ・スー氏は、GPUハードウェアの入手性が最大の障壁であると述べました。そして今、同社はInstinct MI300アクセラレータの発売によってこの課題の解決に貢献しています。新しいCDNA 3アーキテクチャは、複数の面で大幅なパフォーマンス向上を実現します。

2023-12-06T18:09:31.823Z

MI300 には 1500 億個のトランジスタ、128 チャネルの HBM3、第 4 世代 Infinity Fabric、および 8 つの CDNA 3 GPU チップレットが搭載されています。

2023-12-06T18:09:44.092Z

Instinct MI300は画期的な設計です。このデータセンターAPUは、合計13個のチップレット（その多くは3Dスタック）を統合し、24個のZen 4 CPUコア、CDNA 3グラフィックエンジン、そして8スタックのHBM3を融合したチップを構成しています。このチップは全体で1460億個のトランジスタを搭載し、AMDがこれまでに量産したチップの中で最大規模となります。

2023-12-06T18:10:49.570Z

AMDは、特定のワークロードにおいて、NVIDIAのH100 GPUと比較して最大1.3倍のパフォーマンスを発揮すると主張しています。上記のスライドは、主張されているパフォーマンス上の優位性について概説しています。

2023-12-06T18:11:12.038Z

2023-12-06T18:12:29.505Z

スケーラビリティは非常に重要です。GPUの数が増えるにつれて、パフォーマンスは直線的に向上する必要があります。ここでAMDは、NVIDIAの8GPU H100 HGXシステムに匹敵する性能を、8GPU搭載のAMDプラットフォームで実現しています。

2023-12-06T18:14:05.889Z

MI300は、トレーニングではNvidiaと同等のパフォーマンスを発揮しますが、推論において最も大きな優位性を発揮します。AMDは推論において1.6倍の優位性を強調しています。

2023-12-06T18:15:36.797Z

Microsoft CTO の Kevin Scott 氏がステージに上がり、Lisa Su 氏と AI インフラストラクチャの構築における課題について話し合いました。

2023-12-06T18:16:41.080Z

詳細について話し合っている間に、MI300 についての詳細をいくつか紹介します。

2023-12-06T18:17:17.561Z

Microsoft は、MI300X クラウドインスタンスを本日プレビューで提供開始します。

2023-12-06T18:19:30.617Z

Lisa Su は AMD Instinct MI300X プラットフォームを展示しました。

2023年12月6日18:20:14.460Z

2023-12-06T18:25:14.348Z

AMD CTO Victor Peng 氏がステージに登場し、Nvidia の CUDA に対抗する AMD のオープンソース製品 ROCM の最新の進歩について語りました。

2023-12-06T18:26:02.486Z

2023-12-06T18:26:49.594Z

Peng 氏は、Nvidia の独自のアプローチとは対照的に、オープンな ROCm エコシステムの利点について語りました。

2023-12-06T18:27:56.519Z

AMDの次世代ROCm 6が今月下旬に発売されます。Radeon GPUのサポートは継続されますが、MI300向けの新たな最適化も施されています。

2023-12-06T18:29:19.621Z

ROCm は vLLM で最大 2.6 倍の改善を実現し、その他の最適化により MI250X の ROCm 5 と比較して MI300X では合計 8 倍の改善を実現します (これはあまり良い比較ではありません)。

2023-12-06T18:31:05.087Z

AMD は、Hugging Face や PyTorch などの業界の大手企業と連携して、オープンソースエコシステムの拡大に取り組んでいます。

2023-12-06T18:31:47.781Z

MI300 を含む AMD GPU は、バージョン 3.0 以降の標準 Triton ディストリビューションでサポートされます。

2023-12-06T18:34:02.781Z

Peng 氏は現在、Databricks、essential AI、Lamini のリーダーたちと話し合っています。

2023-12-06T18:43:30.129Z

話は AI のさまざまな形態と、将来起こりうる進化的アップデートに移りました。

2023年12月6日18時45分51秒

AMDの新しいInstinct MI300Xプラットフォームの仕様をいくつかご紹介します。このシステムは、8基のMI300Xアクセラレータを1つのシステムに統合しています。400GbEネットワークをサポートし、合計1.5TBという驚異的なHBM3容量を誇ります。

2023-12-06T18:48:53.588Z

現在、Instinctシリーズでは62,000のAIモデルが稼働しており、MI300Xではさらに多くのモデルが稼働する予定です。Peng氏は、ROCm 6の登場はAMDソフトウェアのより広範な採用における転換点となると述べています。

2023-12-06T18:50:40.713Z

Lisa Su がステージに戻り、Meta のエンジニアリングシニアディレクターである Ajit Mathews をステージに招待しました。

2023-12-06T18:51:55.008Z

Meta は、AI に対するオープンソースのアプローチが業界にとって最善の進路であると考えています。

2023-12-06T18:54:14.182Z

Metaは数年にわたりROCmのベンチマークを実施し、PyTorchでのサポート構築に取り組んできました。Metaは自社のデータセンターにInstinct MI300X GPUを導入する予定です。

2023-12-06T18:57:16.549Z

AMD は、市場の収益性の高い部分である企業向けに統合 AI ソリューションを市場に投入する取り組みを進めています。

Dellのグローバルインフラストラクチャソリューショングループ、コアビジネスオペレーション担当社長、アーサールイス氏に、同社と AMD とのパートナーシップについてお話を伺いました。

2023-12-06T18:59:06.847Z

Dell は AMD の MI300X をポートフォリオに追加し、8 つの GPU を内蔵した Poweredge サーバーを提供しています。

2023-12-06T19:03:54.841Z

Supermicro の創設者兼 CEO である Charles Liang 氏が登壇し、同社が新しいシステムで生成 AI の波をいかに取り入れているかについて語りました。

2023-12-06T19:06:04.929Z

Supermicro には、空冷式と水冷式の両方のバージョンの MI300X システムがあり、顧客はラックスケールソリューションを構築できます。

2023-12-06T19:11:20.322Z

レノボ・インフラストラクチャー・ソリューションズ・グループのエグゼクティブ・バイスプレジデント兼プレジデントであるカーク・スカウゲン氏が登壇しました。レノボは、新しいAI ThinkEdgeシステムの開発に注力しています。

2023-12-06T19:12:13.420Z

Lenovo は、ThinkSystem プラットフォームに MI300X を追加しました。

2023-12-06T19:13:20.006Z

AMD は膨大な数の OEM および ODM システムベンダーと提携しており、現在は新しいクラウドサービスプロバイダーとも連携しています。

2023年12月6日19時14分47秒

AMD のデータセンターグループの EVP 兼 GM である Forrest Norrod 氏がステージに登場しました。

AI パフォーマンスのニーズによりクラスターの成長が促進され、高性能ネットワークが必要になります。

2023-12-06T19:15:35.734Z

AMD は Infinity Fabric テクノロジーを使用してほぼ線形のパフォーマンススケーリングを実現し、Nvidia は NVLink を使用します。

2023-12-06T19:16:36.118Z

AMDは現在、Infinity Fabricテクノロジーを外部企業に公開しており、これは同社のネットワークプロトコルを利用する企業の数を拡大する大きな発表となるでしょう。一方、NVIDIAのCUDAは依然として独自の技術です。

2023-12-06T19:18:36.841Z

AMDは、データセンターネットワークにおいて、ファイバーチャネルよりもイーサネットの方が優れたソリューションだと考えています。イーサネットには、拡張性やオープン設計など、多くの利点があります。AMDは、AIおよびHPCワークロードのパフォーマンスをさらに向上させる新しいUltra Ethernet規格に参画しています。

2023-12-06T19:21:53.583Z

Norrod 氏は Arista、Broadcom、Cisco の代表者をステージに招き、データセンター向けイーサネット標準の継続的な採用の重要性について講演しました。

これがなぜ重要なのか疑問に思う方もいるかもしれません。NvidiaはMellanoxを買収し、同社のファイバーチャネルネットワーク機器を自社システムに積極的に採用しています。ちなみに、NvidiaはUltra Ethernetコンソーシアムのメンバーではありません。

2023-12-06T19:22:16.756Z

2023-12-06T19:29:32.659Z

ハードウェアに関する新たな発表がありました。Norrod 氏は AMD の CPU に対する従来のアプローチについて語っています。

2023-12-06T19:31:19.252Z

2023-12-06T19:32:40.003Z

MI300A の驚くべき統計データをご紹介します。

2023-12-06T19:34:08.741Z

AMDは、MI300AがOpenFOAMバイクテストで最大4倍のパフォーマンスを発揮すると主張していますが、この比較は理想的ではありません。H100はGPUですが、MI300AのCPUとGPUの融合コンピューティングは、共有メモリアドレス空間を通じて、メモリを大量に消費するワークロードにおいて本質的な優位性を提供します。CPUとGPUを緊密に結合した実装で統合されているNvidia Grace Hopper GH200スーパーチップとの比較の方が適切ですが、AMDはNvidiaのチップに関するOpenFOAMの結果が公開されているものは見つからなかったと述べています。

2023-12-06T19:35:21.291Z

AMD によれば、MI300A は Nvidia Grace Hopper スーパーチップの 2 倍の電力効率だという。

2023-12-06T19:35:42.089Z

2023-12-06T19:37:10.654Z

MI300Aの素晴らしいショットをご紹介します。

2023-12-06T19:38:40.831Z

AMDは、MI250Xアクセラレータを搭載したFrontierスーパーコンピュータでエクサスケールの壁を突破しました。現在、MI300AはEl Capitanに導入され、2エクサフロップスの性能を達成すると予想されています。

2023-12-06T19:39:55.242Z

2023-12-06T19:44:12.369Z

MI300A は、世界中のパートナーからまもなく入手可能になります。

2023-12-06T19:45:45.996Z

2023-12-06T19:46:44.954Z

AMD は、Windows で AI アクセラレーションソフトウェアエコシステムを実現するために熱心に取り組んできました。

2023年12月6日19時47分35秒

AMDは本日、Ryzen AI 1.0ソフトウェアをリリースしました。このソフトウェアにより、顧客はNPU搭載ノートPCにAIモデルを簡単に導入できるようになります。

2023-12-06T19:48:30.410Z

リサ・スーは、コードネーム「Hawk Point」のRyzen 8040シリーズの発売を発表しました。これらのチップは現在パートナー企業に出荷されています。AMDは、AIワークロードにおけるパフォーマンスが最大60%向上すると主張しています。

2023-12-06T19:53:17.576Z

AMD は Microsoft と協力して、AI 処理能力を活用した AI エコシステムを拡大しています。

2023-12-06T19:54:27.462Z

リサは、来年登場予定の次世代「Strix Point」プロセッサについて少し触れました。AMDはXDNA 1の性能についても言及し、Phoenix 7040シリーズではNPU単体で10 TOPS（テラオプス INT8）の性能を発揮し、Hawk Point 8040シリーズでは16 TOPSに向上すると述べています。

2023-12-06T19:57:01.249Z