8
インテルの新しいAVX10は、EコアにAVX-512機能をもたらします

Intelは本日、新しいAPX(Advanced Performance Extensions)を発表し、さらに新しいAVX10(このページ下部)も公開しました。AVX10は、PコアとEコアの両方でAVX-512機能を初めて統合的にサポートします。このAVX命令セットの進化により、IntelはAlder LakeおよびRaptor Lakeプロセッサに搭載されている新しいx86ハイブリッドアーキテクチャで発生した深刻な問題を回避することができます。

ただし、新しいAVX10 ISAはIntelの現世代CPUではサポートされず、将来のチップに搭載される予定です。Intelは、今後コンシューマー向けプロセッサとサーバー向けプロセッサの両方において、AVX10がベクターISAの主流になると発表しています。

インテル AVX10 (アドバンスト・インストラクション・エクステンション 10)

AVX10は、最も基本的なレベルでは、EコアとPコアの両方を搭載したIntelチップでAVX-512をサポートできますが、512ビット命令はPコアでのみ実行可能です。一方、統合された256ビットAVX10命令はpコアとeコアのどちらでも実行できるため、チップ全体でAVX-512機能をサポートできます。

そのため、Intel は、Alder Lake と Raptor Lake の両方で AVX-512 を無効にしたときのように、512 ビット ベクターのサポートを無効にする必要はありません。 

AVX10

(画像提供:Intel)

さらに詳しく見てみると、AVX10 (Advanced Instruction Extensions 10) ISA は AVX-512 のスーパーセットであり、256 ビットと 512 ビットの両方のベクター レジスタ サイズを持つプロセッサ用の AVX-512 ISA のすべての機能を備えています。

統合された AVX10 ISA には、「AVX512VL 機能フラグ付きの AVX-512 ベクトル命令、最大 256 ビットのベクトル レジスタ長、および 8 つの 32 ビット マスク レジスタと、埋め込み丸めをサポートする 256 ビット命令の新しいバージョン」が含まれ、このバージョンは p コアと e コアの両方で実行されます。

ただし、eコアは統合型AVX10の最大256ビットベクトル長に制限されるのに対し、Pコアは512ビットベクトルを使用できます。これは、ArmがSVEで可変ベクトル幅をサポートしていることに似ています。 

Intelは、既存のアプリケーションは、少なくとも同じベクトル長であれば、AVX10でもAVX-512と同等のパフォーマンスを実現できると述べています。また、Intelは次のように主張しています。

  • Intel AVX2 でコンパイルされたアプリケーションを Intel AVX10 に再コンパイルすると、追加のソフトウェア チューニングを必要とせずにパフォーマンスの向上が実現されます。 
  • ベクトルレジスタの負荷に敏感な Intel AVX2 アプリケーションは、16 個の追加ベクトルレジスタと新しい命令により、最大のパフォーマンスが得られます。 
  • 高度にスレッド化されたベクトル化可能なアプリケーションは、E コアベースの Intel Xeon プロセッサーまたはパフォーマンス ハイブリッド アーキテクチャを備えた Intel 製品で実行すると、より高い総合スループットを実現できる可能性が高くなります。

Intelは第6世代Xeon「Granite Rapids」チップからAVX10バージョン1(AVX10.1)をサポートしますが、この世代では512ビットベクター命令のみがサポートされ、新しい統合型256ビットベクター命令はサポートされません。この第1世代は、AVX-512からAVX10への移行チップとして機能します。

Granite Rapids以降に登場するチップは、AVX10.2をサポートします。AVX10.2は、統合された256ビットベクトル長のサポートに加え、新しいAIデータ型と変換、データ移動の最適化、標準規格のサポートといった新機能を追加します。今後のすべてのXeonプロセッサは、レガシーアプリケーションが正常に動作することを保証するため、すべてのAVX-512命令を引き続き完全にサポートします。

AVX10

(画像提供:Intel)

開発者からのフィードバック(明らかに否定的なもの)に対応するため、IntelはAVX10の列挙方式をAVX-512と比較して大幅に簡素化する予定です。また、新しいAVX10リビジョンへの移行ごとに、変更に値するだけの十分な数の新しい命令と機能が追加されるようにすることで、バージョンと列挙の肥大化を軽減する予定です。 

IntelはAVX10の導入に伴いAVX-512 ISAを凍結し、今後のAVX-512命令の使用はすべてAVX10 ISAを通じて行われるようになります。一方、新しいAMXには影響はありません。 

Tom's Hardware の最高のニュースと詳細なレビューをあなたの受信箱に直接お届けします。

Intel APX (アドバンスト・パフォーマンス・エクステンション)

Intel は本日、新しい APX (Advanced Performance Extensions) も発表しました (旧式の iAPX 432 と混同しないでください)。

 Intel社によると、APXでコンパイルされたコードは、Intel 64ベースライン向けにコンパイルされた同じコードと比較して、ロードが10%、ストアが20%少ないとのことです。また、レジスタアクセスは複雑なロードおよびストア操作よりも高速で、動的消費電力も大幅に削減されるとIntel社は述べています。興味深いことに、新しいAPXは、Intelが2019年にMPXを廃止した際に未使用のまま残されていた128B領域を新たな用途に活用し、XSAVEに再利用しています。

APX のトップレベルの機能は次のとおりです。

  • 16個の追加汎用レジスタ(GPR)R16~R31(本書では拡張GPR(EGPR)とも呼ばれる)
  • 多くの整数命令用の新しいデータ宛先(NDD)レジスタを備えた3オペランド命令形式
  • 条件付きISAの改良: 新しい条件付きロード、ストア、比較命令と、共通命令のステータスフラグ書き込みを抑制するコンパイラのオプションを組み合わせたもの 
  • 最適化されたレジスタ状態の保存/復元操作 
  • 新しい64ビット絶対直接ジャンプ命令

Intelは、APXがCPUコアのシリコン面積や消費電力に影響を与えないように実装したと主張しています。APXの詳細については、こちらをご覧ください。また、Intelはリンク先のページの下部に、APXとAVX10に関するリソースリストを掲載しています。

APX と AVX10 は、Intel が Intel 64 アーキテクチャを x86 の簡素化されたバージョンである x86S にスリム化することを検討しているという最近の発表に続いて登場しました。

ポール・アルコーンはTom's Hardware USの編集長です。CPU、ストレージ、エンタープライズハードウェアに関するニュースやレビューも執筆しています。