インテル、サファイア・ラピッズ向けHBMメモリを発表、ポンテ・ヴェッキオのパッケージ詳細も

インテルは本日、国際スーパーコンピューティング（ISC）2021カンファレンスにおいて、スーパーコンピューティングおよびHPCアプリケーション向けの幅広いソリューションについて多数の発表を行いました。ハードウェア面のビッグニュースは、インテルのSapphire RapidsデータセンターチップがHBMメモリ、DDR5、PCIe 5.0を搭載し、CXL 1.1をサポートすることです。さらにインテルは、Ponte Vecchio GPUがOAMフォームファクターで提供され、パッケージあたり最大600Wを消費すると発表しました。Ponte Vecchio GPUは、4基または8基のGPUクラスターで提供されます。

Intel Xeon Sapphire Rapids に HBM (高帯域幅メモリ) が搭載される

Intelは、Sapphire Rapids Xeonサーバーチップに関する情報を、意図的なものも意図的でないものも含め、徐々に公開してきました。これらのチップには、10nm Enhanced SuperFinプロセスにエッチングされたGolden Coveアーキテクチャが搭載されることは既に分かっています。Intelは2020年6月にこのチップを初めて出荷し、DDR5、PCIe 5、CXL 1.1をサポートし、Eagle Streamプラットフォームに搭載される予定です。また、これらのチップは、トレーニングおよび推論ワークロードのパフォーマンス向上を目的としたIntel Advanced Matrix eXtensions（AMX）もサポートしています。

Intelは今回、これらのチップにHBMメモリが搭載されることを明らかにしましたが、チップがサポートする容量やメモリの種類については明らかにしていません。この追加メモリはSapphire Rapids CPUコアと同じパッケージに搭載されますが、HBMがヒートスプレッダーの下にあるのか、それともより大きなパッケージの一部として接続されるのかはまだ明らかになっていません。

Intel は、このチップが標準の Sapphire Rapids 製品スタックの一部として全顧客に提供される予定であることを確認したが、HBM なしのバリアントよりも若干遅れて、ほぼ同じ時間枠で市場に登場する予定である。

Intelは、HBMをOSにどう提供するかについてはまだ明らかにしていません。L4キャッシュとして、あるいは標準メインメモリの補助として提供される可能性があります。しかし、Intelは、これらのチップはメインメモリ（DDR5）の有無にかかわらず使用できることを明らかにしており、さまざまなメモリ構成に対応する複数のオプションが用意される可能性が高いと考えられます。

Intelは、HBMメモリはコア数にそれほど左右されないメモリ依存のワークロードに役立つと述べており、これらのチップは標準モデルよりもコア数が少ないことを示唆しているのかもしれません。これは、HBMを同じヒートスプレッダーの下に収める必要があることを考えると理にかなっています。対象となるワークロードには、数値流体力学、気候・天気予報、AIトレーニングと推論、ビッグデータ分析、インメモリデータベース、ストレージアプリケーションなどがあります。

Intel はそれ以上の詳細を明らかにしていないが、最近のリークによると、チップには最大 56 個のコアと 64GB の HBM2E メモリが搭載され、ダイ間に EMIB 相互接続を備えたマルチチップパッケージに収められるとのことだ。

Intel Ponte Vecchio OAM フォームファクター

インテルは、1,000億トランジスタを搭載した47タイルPonte Vecchioチップの製造に使用されているXe HPCシリコンが、新しいマルチGPU実装システム向けに検証中であると発表しました。さらに同社は、チップがOAM（Open Accelerator Module）フォームファクターで提供されることを発表し、以前の報道を裏付けました。

Tom's Hardware の最高のニュースと詳細なレビューをあなたの受信箱に直接お届けします。

OAMフォームファクタはOCP（Open Compute Platform）エコシステムでの使用を想定して設計されており、キャリアに搭載されたGPUダイがメザニンコネクタを介してマザーボードに接続されます。この配置は、NVIDIAのSXMフォームファクタに似ています。

これらのタイプのチップパッケージは、従来のカードフォームファクターよりも強力な冷却システムを可能にすると同時に、PCIe ケーブルではなく PCB を介して OAM パッケージに電力をルーティングする最適化された方法も提供するため、アドインカードフォームファクターよりもサーバーで広く使用されています。

リークされたIntelの資料によると、Ponte Vecchio OAMパッケージのピーク消費電力は600Wと記載されており、少なくとも一部のGPUモデルは液冷式を採用している可能性が高い。ただし、低消費電力モデルには空冷オプションが用意されている可能性も考えられる。

インテルは、4つまたは8つのOAMパッケージを搭載したノード（x4サブシステムまたはx8サブシステム）を提供します。これらのノードは顧客のサーバーに統合されます。インテルは現在、これらのマルチGPU設計を検証中です。

最初のPonte Vecchio GPUは、米国エネルギー省のAuroraスーパーコンピュータに搭載される予定ですが、このエクサスケールシステムはこれまで何度も（6年以上）延期されており、直近ではIntelの7nmプロセス開発の遅延が原因となり、最終的に16個のPonte VecchioコンピューティングタイルがTSMCによって製造されることになりました。設計の詳細については、こちらをご覧ください。

Intelは、Auroraが上記のx4またはx8フォームファクターを採用していないことを確認しました。各Auroraブレードは、6基のPonte Vecchio GPUと2基のSapphire Rapids CPU（3:1の比率）で構成されます。Intelは、ドイツ・ミュンヘンのSuperMUC-NGスーパーコンピュータでもPonte Vecchio関連の受注を獲得しています。このシステムは、Ponte VecchioとSapphire Rapidsを組み合わせた240基の新しいノードで構成されますが、これらのノードがx4またはx8スレッドを使用するかどうかは不明です。

ポール・アルコーンはTom's Hardware USの編集長です。CPU、ストレージ、エンタープライズハードウェアに関するニュースやレビューも執筆しています。

Hardware