95
AgileX 詳細: PCIe Gen 5、DDR5、HBM3、Optane DIMM のサポート

AgileX の詳細: Intel が FPGA をアクセス可能に

Intelは、Data-Centric Innovation Dayにおいて、以前はFalcon Mesaというコードネームで発表されていた次世代10nm AgileX FPGAを発表しました。IntelのAgileXは、PCIe 5.0、DDR5、HBM3、Optane Memory DIMMのサポート、Xeonとのメモリコヒーレンスなど、次世代テクノロジーを満載しています。

アルテラは、インテルがカスタムファウンドリー事業の先陣を切った、そして数少ない有力顧客の一つでした。時が経つにつれ、アルテラがインテルの2.5D EMIB(Embedded Multi-Die Interconnect Bridge)パッケージング技術を最初に採用するのではないかという噂も広まりました。インテルは、この技術をチップレットのミックスアンドマッチ戦略において、インターポーザーに代わる安価で優れた代替技術として売り込んでいます。

クレジット: インテル

(画像提供:Intel)

インテルはアルテラを高く評価し、2016年初頭に167億ドルで買収しました。ちなみに、アルテラは20nm Arria世代の後継となる、インテルの14nmノードで前世代のStratix 10 FPGAを設計・製造していました。これらのFPGAは最終的に2017年後半に発売されました。

買収後もアルテラの設計チームはStratix 10の開発を続けていたため、インテルは並行して第2の開発チームを立ち上げ、10nm世代の開発に着手しました。本稿ではこの製品を構成するテクノロジーの全容について解説しますが、注目すべきは、これがアルテラと共同で構想・設計された初のFPGAであるということです。インテルはこの点を強く強調しています。なぜなら、アルテラのおかげで、アーキテクチャ開発、プロセス/パッケージングの協調最適化、I/O、ソフトウェアに至るまで、この新しいファミリーをゼロから設計することができたからです。

IntelはデータセントリックIPの幅広いポートフォリオを有しており、FPGAはこれらのIPをますます統合する傾向にあります。IP統合の強化は、Intelの主要なFPGA競合であるXilinxの7nm Versal(旧Project Everest)FPGAの背後にあるメッセージの一つでもありました。Xilinxは、競合FPGAを2019年に発売する予定です。 

AgileX: データ中心の世界のためのFPGA

概観すると、IntelはAgileXにおいて、高性能コンピューティング能力、あらゆるデバイス間の統合、そしてソフトウェアという3つの主要な目標に重点を置いています。つまり、AgileXは10nmプロセスで構築されたHyperflex 2アーキテクチャをベースとし、単精度演算で20TFLOPSの性能を実現します。Intelはまた、EMIB(エミッタ・インタラプト・インタラプト・インタラプト)技術を用いて、あらゆるチップレットタイルとプロセスノードをFPGAに接続しています。これにより、顧客のニーズに合わせてFPGAを高度にカスタマイズすることが可能になります。そして最後に、IntelはOneAPIプログラミング・インターフェースを通じて、あらゆるソフトウェア開発者がFPGAを利用できるようにしたいと考えています。

クレジット: インテル

(画像提供:Intel)

コンピューティング: Hyperflex 2

10nm AgileX FPGA には、Xeon プロセッサとのメモリ コヒーレンスも組み込まれており、いくつかの高帯域幅およびメモリ機能も含まれています。

Tom's Hardware の最高のニュースと詳細なレビューをあなたの受信箱に直接お届けします。

まず第一に、AgileXはパフォーマンスを大幅に向上させます。AlteraはStratix 10でHyperflexアーキテクチャ(PDF)を導入しました。Hyperflexの背後にある考え方は、コアファブリック全体、すべての配線セグメント、すべてのブロック入力、そしてFPGAのインターコネクト全体に、バイパス可能なハイパーレジスタを組み込むことです。HyperflexはALMレジスタの10倍以上のハイパーレジスタを備えており、ロジックセル間のあらゆるパスをレジスタ化できます。

これにより、タイミング、パイプライン、最適化を改善するための新たなアプローチが可能になり、配線遅延の原因となるクリティカルパスを排除するとともに、ソフトウェア最適化の機会をさらに拡大できます。このアーキテクチャと14nmプロセスを組み合わせることで、Stratix 10はロジック密度を4倍、クロック速度を2倍(消費電力を70%削減)に向上させました。

画像

1

2

IntelはHyperflex 2アーキテクチャの詳細を公開していませんが、AgileXはStratix 10と比較して最大40%高速化、または消費電力を40%削減すると述べています。また、IntelはDSP機能を倍増させ、単精度演算で20TFLOPS、半精度演算で40TFLOPSの性能を実現しました。Intelによると、AgileXはFP16およびBfloat16のハード化された機能を備えた唯一のFPGAです。

クレジット: インテル

(画像提供:Intel)

Intelがますます重要になっていると述べているメモリ面では、AgileXはDDR5、HBM3、Optane DC Persistent Memory DIMMのサポートを追加します。これにより、低レイテンシデバイスからSSDまで、メモリの全範囲をカバーします。

AgileXは、チップの境界を超えて相互接続を拡張するために、PCIe 4.0とPCIe 5.0の両方に対応していますが、PCIe 5.0のサポートは後日提供される予定です。これらの高速インターフェースは、PCIe 3.0と比較してデータレートを2倍または4倍に高めます。Intelはまた、112Gトランシーバーでトランシーバーのリーダーシップをさらに強化しようとしています。Intelによると、現在58G PAM-4トランシーバーを出荷しているFPGAベンダーは同社のみであり、Xilinxは依然として28Gです。

クレジット: インテル

(画像提供:Intel)

AI向けFPGA

AI分野において、Intelは「AI Plus」を重要な価値提案として掲げています。この技術により、FPGAは実際のニューラルネットワークを使用する前に、データの取り込みと前処理も実行できるようになります。Intelはまた、DSPブロックを調整し、AgileXのAIワークロードへの適合性を高めました。浮動小数点演算性能における優位性を維持するため、IntelはDSPハードウェアを追加することで40TFLOPSのFP16性能を実現し、今年市場投入予定のCooper Lake、Ice Lake、Nervana Spring Crestプロセッサと同様に、強化されたBfloat16のサポートも追加しました。Intelによると、AgileXは強化されたFP16とBfloat16をサポートする唯一のFPGAです。

クレジット: インテル

(画像提供:Intel)

整数演算に関しては、Intelは低精度のINT8からINT2までのサポートを追加し、AgileXは最大92 TOPSのINT8性能を実現すると発表しました。これらはすべて、IntelのOpenVINOツールキットとOneAPIによってソフトウェア側でサポートされています。

詳細: 最高のCPU

詳細: IntelとAMDのプロセッサ階層

詳細: すべてのCPUコンテンツ

現在のページ: AgileX の詳細: Intel が FPGA をアクセス可能に

次のページ Any-to-Any 統合とメモリコヒーレンス