Intelは、Hot Chips 2023チップカンファレンスで、同社初となるメッシュ間直接接続フォトニックファブリックを公開し、NvidiaやAyar Labsなども推進する光チップ間相互接続の未来に向けた同社の進歩を強調しました。しかし、Intelがデモに使用した8コア528スレッドチップは、コアあたり66スレッドを備え、最大1TB/秒のデータスループットを可能にする独自のアーキテクチャにより、注目を集めました。驚くべきことに、このチップの消費電力はわずか75Wで、電力の約60%は光相互接続に使用されていますが、この設計により、最終的には200万個のコアを持つシステムを400ナノ秒未満の遅延で直接接続できるようになる可能性があります。
IntelのPIUMA(Programmable Integrated Unified Memory Architecture)チップは、ペタバイト規模のグラフ分析におけるパフォーマンス向上に重点を置いたDARPA HIVEプログラムの一部であり、超スパースワークロードにおけるワット当たりパフォーマンスを1000倍向上させることを目指しています。Ayar LabsはIntelと協力して光学サブシステムを開発しました。
Intelのようなx86中心の企業にとって驚くべきことに、このテストチップはカスタムRISCアーキテクチャを採用し、グラフ分析ワークロードのパフォーマンスを合理化し、シングルスレッドパフォーマンスを8倍向上させています。また、このチップはIntel独自の内部ノードではなく、TSMCの7nmプロセスで製造されています。
画像
1
の
8

Intel は、対象となるワークロードを特徴付けた後、ワークロードによって生じるメモリ サブシステム、ディープ パイプライン、分岐予測、アウトオブオーダー ロジックへの極度のストレスに関連する課題を解決するアーキテクチャを作成する必要があると結論付けました。
Intelのカスタムコアは、8つのコアそれぞれに66のハードウェアスレッド、大容量のL1命令キャッシュとデータキャッシュ、そしてコアあたり4MBのスクラッチパッドSRAMを搭載するなど、極めて高度な並列処理を採用しています。この8コアチップは、それぞれ32GB/s/dirで動作する32個の光I/Oポートを備え、合計1TB/sの帯域幅を実現します。これらのチップは8ソケットOCPサーバースレッドに搭載され、システム全体で最大16TB/sの光スループットを提供します。各チップには32GBのカスタムDDR5-4000 DRAMが搭載されています。
IntelはTSMCの7nmプロセスを用いて、316mm²のダイに276億個のトランジスタを搭載したチップを製造した。12億個のトランジスタを消費する8つのコアはダイの中央に配置され、その両側には8バイト単位のアクセス粒度を持つ8つのカスタムメモリコントローラが配置されている。通信ルーターはチップの中央の「空いている」部分に配置されている。
このチップは、ダイの上部と下部にそれぞれ2つずつ、合計4つの高速8チャネル光I/Oチップレットを搭載しており、内部の電気信号を外部の光インターコネクトにブリッジします。これらのユニットはIntelのEMIBパッケージを介して接続され、AIBプロトコルを使用します。また、このチップはホストシステムとの通信用にPCIe 4.0 x8接続も備えています。
528 個のスレッドによって生成される膨大な量のデータをダイ上で移動するには、最適化された相互接続が必要です。そこで Intel は、コア、メモリ コントローラ、およびシリコン フォトニクス相互接続の間でデータをシャッフルする 16 個のルーターを備えた 2D オンダイ メッシュを設計しました (8 個のルーターは CPU コアに統合され、残りの 6 個のルーターは完全にデータ移動専用です)。
Tom's Hardware の最高のニュースと詳細なレビューをあなたの受信箱に直接お届けします。
上のアルバムでご覧いただけるように、フォトニクスコネクタはチップパッケージに統合されており、チップ側面から他のチップへの外部接続用に突出しています。チップは外部の「HyperX」光ネットワークに接続され、個々のプロセッシングコアに全対全接続を提供します。この驚異的なネットワークにより、最大200万個のコアを400ナノ秒未満のレイテンシで全対全に直接接続することが可能になります。
画像
1
の
5

最終的な結果は目覚ましいものでした。チップの消費電力はわずか75Wで、そのうち59%がシリコンフォトニクスに、21%がコアに充てられています。Intelは、光ネットワークの性能向上により、1コアから1000コアまでほぼ完璧な線形スケーリングが可能になったと主張しています。
光インターコネクトの将来性は、従来のチップ間通信技術と比較して優れた帯域幅、レイテンシ、そして消費電力特性を備えた将来のデータ転送方式を業界が模索する中で、研究を活発化させています。光チップインターコネクトの主流化はまだ先のことですが、Intel、Nvidia、Ayar Labsなどが推進しているような特殊な実装は、近い将来、大規模導入に向けて準備が整っつつあります。
ポール・アルコーンはTom's Hardware USの編集長です。CPU、ストレージ、エンタープライズハードウェアに関するニュースやレビューも執筆しています。