72
インテルのPonte Vecchio Xe-HPC GPUは1000億個のトランジスタを搭載

インテルは、社内および社外の製造能力を活用するIDM 2.0戦略の概要を発表してからわずか数時間後、スーパーコンピューター向けGPU「Ponte Vecchio Xe-HPC」の詳細な説明を公開しました。インテル、サムスン、TSMCが様々なプロセス技術を用いて製造したコンポーネントを採用するPonte Vecchioは、インテルの未来ビジョンを最も的確に体現しています。

インテルのコードネーム「Ponte Vecchio」は、Xe-HPCマイクロアーキテクチャをベースとした同社初のGPUであり、インテルの次世代Xeonスケーラブル「Sapphire Rapids」プロセッサと共に、アルゴンヌ国立研究所のAuroraスーパーコンピュータに最初に搭載される予定です。このマシンは、1エクサフロップスを超えるFP64性能を備えた業界初のスーパーコンピュータの一つとなります。

インテル

(画像提供:Intel)

時間が経つにつれて、この部品は他の顧客にも提供されるようになり、Ponte Vecchio が複雑なプロセッサに対する Intel の新しいアプローチである分散型モジュラー アーキテクチャを使用していることを考えると、カスタマイズは比較的簡単なので、Intel がカスタマイズする可能性もある。 

インテル

(画像提供:Intel)

実際、Ponte Vecchio は 47 個のコンポーネントと 1,000 億個を超えるトランジスタを備え、PetaFLOPS クラスの AI パフォーマンスを提供する大規模なプロセッサであるため、モノリシックな Ponte Vecchio を構築することは不可能です (これについては後で詳しく説明します)。

ポンテ・ヴェッキオには次のタイル/チップレットが含まれています:

  • インテルの10nm SuperFinテクノロジーを使用して作られた2つのベースタイル
  • 16 個のコンピューティング タイルは、当初は TSMC によって製造され、その後、7 nm テクノロジが大量生産 (HVM) に対応できる状態になった時点で Intel によって製造されます。 
  • インテルの10nm Enhanced SuperFinプロセスを使用して製造された8つのRamboキャッシュタイル
  • インテルが作成した11個のEMIBリンク
  • ファウンドリ製のXe Link I/Oタイル2枚
  • DRAMメーカーが製造した8つのHBMメモリスタック

現在、Intelは研究室でPonte Vecchio Xe-HPC GPUのみを使用しています。デバイスのモジュール設計により、同社はコスト効率の高い製造を実現していますが、設計の熱、電圧、周波数の調整は難しく、ある程度の時間がかかります。

インテル

(画像提供:Intel)

Intel の Ponte Vecchio の説明で注目すべき興味深い点は、チップメーカーが「PetaFLOPS クラスの AI パフォーマンス」を提供すると述べていることです。さまざまな計算精度を必要とする AI ワークロードは数多く存在します。 

Tom's Hardware の最高のニュースと詳細なレビューをあなたの受信箱に直接お届けします。

Intelは通常、FP16をAIに最適な精度と見なしています。そのため、同社がPonte Vecchioを「手のひらサイズのペタフロップス規模のAIコンピューター」と表現する場合、これはGPUのFP16性能が約1PFLOPS、あるいは1,000TFLOPSであることを意味する可能性があります。この数値を具体的に示すと、NVIDIAのA100コンピューティングGPUは、FP16性能で約312TFLOPSです。 

 アルゴンヌ国立研究所のAuroraスーパーコンピューターは2022年に完成予定だ。

アントン・シロフはTom's Hardwareの寄稿ライターです。過去数十年にわたり、CPUやGPUからスーパーコンピュータ、最新のプロセス技術や最新の製造ツールからハイテク業界のトレンドまで、あらゆる分野をカバーしてきました。