Arm 社は本日、Armv9 アーキテクチャに基づく次世代の CPU および GPU コア シリーズを他のシステム IP とともに発表しました。これらはすべて、同社の Total Compute Solutions テクノロジ コレクションにパッケージ化されています。
これらの新しいArmチップは、次世代のノートパソコンやモバイルデバイスに搭載されるフラッグシップCortex-X2コア(Armによると、最新のノートパソコン向けチップと比較してシングルスレッド性能が最大40%向上)から、ハイエンドのノートパソコンやモバイルアプリケーションでの多様な用途に対応する高効率の「Little」Cortex-A710コアまで、多岐にわたります。Armはまた、従来の「ビッグ」CPUとしての役割を担う新しいCortex-A710と、新しいMali GPUコアシリーズも提供しています。
新しいArmチップを搭載したノートパソコンとモバイルデバイスは2022年に発売される予定ですが、発売時期は各メーカーによって異なります。早速、Armエコシステムの近未来を見ていきましょう。
Arm Cortex-X2、Cortex-A510、Cortex-A710 コアおよび Mali GPU
画像
1
の
8

Cortex-X2 はスタックの最高級コアとして位置付けられ、Arm は Cortex-X1 と比較して、同じプロセス ノードとクロック (ISO プロセス/周波数) でのシングルコア パフォーマンスが 16% 向上し、機械学習パフォーマンス (行列乗算) が 2 倍になったと主張しています。
ArmはX2コアを、このシリーズで最も高いIPCを実現するように設計し、電圧/周波数曲線を最適化してパフォーマンスを向上させました。これらのコアをクラスター化したものは、ハイエンドのラップトップやノートブックに最大8コアのグループとして搭載されます。これは、各要素を統合する強化されたDynamIQ共有ユニット(DSU-110)ファブリックによって実現されます。8コアのX2クラスターは、最大16MBのL3キャッシュと32MBの統合システムレベルキャッシュ(SLC)もサポートします。CoreLink CI/NI-700インターフェースは、GPUコアやDRAMなどの他のIPブロックへの接続も提供します。これについては後ほど詳しく説明します。
X2コアは、WindowsおよびArmベースのChromebookの拡充に伴い搭載される予定です。Armによると、これらのデバイスは終日駆動可能なバッテリーと最高レベルのパフォーマンスを提供します。
いつものように、Arm には「ビッグ」コアと「リトル」コアの両方があり、どちらも、高性能のビッグ コアと低性能の効率コアを組み合わせた big.Little 風の設計に使用されます。
「ビッグ」Cortex-A710は、持続的なマルチコアワークロードにおいて、パフォーマンスと効率性のより優れたバランスが求められるタスクに最適です。シングルコアタスクでは前世代のCortex-A78と比較して最大10%のパフォーマンス向上、機械学習パフォーマンスは2倍を実現しています。このチップは、Arm初のArmv9アーキテクチャをサポートする「ビッグ」コアです。
「リトル」Cortex-A510は、同社にとって4年ぶりの新型小型コアとして登場し、Armv9アーキテクチャをサポートしています。Armによると、これらの小型高効率コアは主にバックグラウンドタスクや軽量ワークロード向けに設計されており、前世代の大型コアとほぼ同等の性能を提供します。Armによると、これらのコアはシングルコア処理で最大35%、機械学習性能では前世代の小型コアと比較して3倍の性能向上を実現します。
特筆すべきは、A510がインオーダーマイクロアーキテクチャを採用していることです。Armによると、このアーキテクチャはスマートフォンからスマートホーム、ウェアラブルアプリケーションに至るまで、効率重視の幅広いタスク向けに最適化されているとのことです。Armは最新のプリフェッチおよび分岐予測技術に加え、きめ細かなパイプラインチューニングを採用することで、インオーダー設計から最大限の効率とパフォーマンスを引き出せるとしています。Armによると、A510は前世代のビッグコアA73と比較して、IPCは10%以内、周波数は15%以内の差で、消費電力は35%削減されています。
Arm 社はまた、刷新された Mali GPU ラインナップも発表しました。同社によれば、これは同社のグラフィック コアとしてはこれまでで最も幅広いパフォーマンスを実現するものとなっています。
Mali-G710は、前世代のMali-G78と比較してパフォーマンスが20%向上し、機械学習性能が35%向上したと謳われ、フラッグシップモデルとして位置付けられています。一方、G510は効率が22%向上し、機械学習性能が2倍になったことで、テレビや拡張現実(AR)などのアプリケーションに最適です。一方、最下位モデルのMali-G310は、テクスチャリング性能が6倍向上したと謳われ、低価格帯のデバイスとして位置付けられています。
画像
1
の
5

ここでは、次世代デバイスにおける新しいコアの配置方法を見ることができます。ラップトップには、前のセクションで示した8コアのX2クラスターや、高速なX2コア4個と「大容量」のA710コア4個を組み合わせたクラスターなど、いくつかの構成が考えられます。
X2は、ハイエンドのモバイルデバイスの一部にも搭載される見込みですが、単一の主力コアとして、大型のA710コアと小型のA510コアのクラスターと組み合わせられます。3枚目のスライドに示すように、この構成は前世代と比べて大幅にパフォーマンスが向上しており、その一部はL3キャッシュ容量の倍増によるものです。Arm社によると、X2コアは最新のフラッグシップAndroidスマートフォンよりも最大30%高いパフォーマンスを提供し、A710コアは30%効率が向上し、小型コアからは35%高いパフォーマンスを引き出すことができます。
ご覧のとおり、様々な組み合わせにより、ウェアラブルやARデバイスといった低消費電力デバイスにも及ぶ、多様な組み合わせのデザイン哲学が実現できます。当然ながら、各要素を繋ぎ合わせるには、効率的で高性能なファブリックが必要です。
DynamIQ Shared Unit-110(DSU-110)は、まさにその役割を担う製品です。この設計は、コアとキャッシュスライスを接続する双方向デュアルリング構造を採用し、5倍のL3帯域幅と最大16MBのL3キャッシュをサポートします。さらに、CoreLink CI/NI-700は、DSU-110をGPUコア、DRAM、5Gモデム、サードパーティ製IPなどの他のシステムIPやデバイスに接続します。
画像
1
の
8

Armは、Total Compute傘下でCortexコアとMaliコアを提供しています。これには、同社が最近発表した、強化された機械学習機能、強化されたセキュリティ、Armv8との完全な互換性など、Armv9アーキテクチャの標準機能セットが含まれています。
Armは、2023年にすべてのコアを64ビットアーキテクチャに移行する予定です。機械学習側の改善には、Scalable Vector Extensions v2(SVE2)のサポート、Bfloat16形式のサポート、Int8とBfloat16の両方の数値形式の行列乗算命令のサポートが含まれます。
画像
1
の
84

以下に、3 つの新しいコアそれぞれの CPU マイクロアーキテクチャ スライド デッキと、GPU アーキテクチャ スライドのロールアップを示します。
Tom's Hardware の最高のニュースと詳細なレビューをあなたの受信箱に直接お届けします。
新しいArmチップを搭載したラップトップとモバイルデバイスは2022年に発売される予定ですが、発売時期は各メーカーによって異なります。当然のことながら、Cortex-X2搭載デバイスを注視していく必要があります。AppleのM1における最近の成功は、他のベンダーや顧客がモバイルおよびデスクトップPCアプリケーションにArmアーキテクチャを採用する意欲を高める可能性があるからです。
ポール・アルコーンはTom's Hardware USの編集長です。CPU、ストレージ、エンタープライズハードウェアに関するニュースやレビューも執筆しています。