5
Marvellの7nm ThunderX3 Arm CPUは96コア、384スレッドを搭載

Marvellの7nmプロセスによるThunder X3サーバーCPUは、96コア、384スレッドという驚異的な性能を備え、2020年に発売予定です。Marvellは、前世代のTX2と比較してIPCが25%以上向上し、ソケットあたりのパフォーマンスが3倍になると約束しています。このチップは、64コアのAmazon Graviton2や80コアのAmpere Altraを凌駕します。

サンダーX3

(画像提供:マーベル)

Marvellは2年サイクルで世代ごとに2倍以上の性能向上を目指しており、最新のThunderX3プロセッサは今年後半にリリース予定です。ThunderX4は2024年にリリース予定です。

ThunderX3はTSMCの7nmプロセスで製造されています。これにより、より多くのコアを搭載可能となり、正確には96コアとなります。これはTX2の3倍、Intelが現在ソケットプラットフォームで提供している最高クラスのコア数の約3.5倍に相当します。また、AMDのRomeの1.5倍のコア数です。4ウェイSMT(クアッド・ハイパースレッディング)はそのままに、384スレッドを実現しています。ArmコアはArm v8.3命令セットにアップグレードされました。このチップは2ソケット構成をサポートしています。 

Armは周波数については言及しなかったが、TDPは100Wから240Wの範囲であると明らかにした。

(画像提供:マーベル)

さらに、コアには128ビットのNeon SIMDユニットが4基搭載されています。これはx86 AVX-512ユニット1基に相当しますが、最上位のXeonスケーラブルプロセッサには2基搭載されています。一方、Romeはコアあたり256ビットのSIMDユニットを2基搭載しています。

I/Oに関しては、このチップは8チャネルDDR4-3200をサポートしており、これはIntelの次期Whitleyプラットフォームに似ています。また、PCIe 4.0は64レーンで、AMDのRomeの半分の容量です。

Tom's Hardware の最高のニュースと詳細なレビューをあなたの受信箱に直接お届けします。

Marvellは、命令サイクルあたり(IPC)性能が25%以上向上し、シングルスレッド性能が60%以上向上したと主張しています。ソケットレベルの性能は3倍以上、浮動小数点性能はSIMDユニットの追加によりさらに5倍向上しています。

(画像提供:マーベル)

採用と競争

Marvellは、これが「最も広くサポートされている」Armサーバープロセッサであると主張しています。しかし、採用の面では、今年はAmazonのAWS Graviton2チップ(64個のArm Neoverse N1コア搭載)や、Ampereが最近発表した80コアのAltraチップとの激しい競争に直面しています。

Marvell はまた、世界初の Arm ベースのスーパーコンピュータを含む、ThunderX2 のいくつかの主要顧客への導入についても改めて発表しました。

(画像提供:マーベル)

TX3 はクラウド、エッジ、HPC を対象としています。

x86に対抗する

世界のデータ センターのほとんどは x86 で実行されており、Marvell は、ThunderX シリーズ チップがこの市場に参入できると考える理由について時間をかけて説明しました。

(画像提供:マーベル)

Marvellは特に、Intelがプロセスリーダーシップを失っていることを指摘している。これはIntel自身も何度も認めていることだ。(Marvellは10nmプロセスの遅延をわずか2年としているが、Intelは3年の遅延を認めている。)Marvellは、これがIntelのダイあたりのコア数を増やす能力を阻害すると考えている。一方、AMDのチップレットアプローチはレイテンシが大きくなると予想される。

一方、Armはレガシーシステムを持たないというメリットがあり、電力効率も高いとMarvellは主張している。パフォーマンスと同様に重要なのは、エコシステムの準備が整っていることだ。

考え

いつものように、レビューではパフォーマンス、IPC、消費電力といった項目を評価する必要がありますが、TX3の96コアとコアあたり4スレッドという点は魅力的です。ただし、それをサポートするには優れたメモリサブシステムも必要です。一方、AWSのGraviton2は自社開発チップであることから、Armインスタンスに有利な価格設定を柔軟に行えるというメリットがあります。

x86製品と比較して、Intelはプロセスリーダーシップの喪失により、コア数の向上よりも価格変更を優先する傾向にあり、これはMarvellの主張と全く同じです。次期Cooper Lakeプロセッサは、28コアのダイを2つ搭載することで、56コアを搭載する予定です。

それでも、インテルは5nmノードでプロセスのリーダーシップを取り戻そうと意気込んでおり、CFOは先日、7nm世代では同等の地位を得られると予想していると述べた。一方で、インテルはアーキテクチャ、インターコネクト、パッケージングといった他の分野でもリーダーシップを発揮していると指摘している。

Intel の 7nm Granite Rapids には (クラス最高レベルの) Golden Cove (またはそれ以上の) コアが搭載され、Intel の Foveros アクティブ インターポーザーと 3D スタッキング テクノロジが活用されると予想されています。

Intelは、AMDのアプローチと同様に、パッケージング技術を活用して個々のチップレットのダイサイズを縮小しつつ、モノリシックに近い性能を維持することを目標としていると述べています。さらに、IntelがPonte Vecchioで既に実証しているように、これによりモノリシックを超えるダイサイズも実現可能になります。

これは私たちの推測に過ぎませんが、Intel は、高度なパッケージング技術によってプロセスの同等性とモノリシックを超えるダイ サイズを備えた 7nm 時代に移行し、コア数部門で復活を遂げると予想しています。ただし、こうした改善が市場に出るまでには時間がかかるでしょう。

最近、Lakefieldのダイショットから、Intelの4コアAtomクラスターのサイズがSunny Coveコア1個分と同程度であることが明らかになりました。つまり、Armがマイクロサーバーで大きな市場シェアを獲得しようとしていた2000年代前半と同様に、IntelがAtomシリーズでArm CPUに対抗しようとする可能性が考えられます。

商業的な視点から見ると、ほとんどのOEMやクラウドサービスプロバイダーは、データセンターCPU市場における競争の激化を望んでいたでしょう。しかし、AMDはまさにそれを実現しています。そのため、Armの最新の攻撃が以前のものよりも成功するかどうかはまだ分かりません。

Marvell は HotChips でアーキテクチャに関する詳細情報を公開する予定です。