AMDは先日開催されたTech Dayで、64コア/128スレッドのデュアルソケットNaplesサーバープラットフォームをIntel製サーバーと比較したデモを行いましたが、その発表は今週開催されたOCP(Open Compute Project)サミットに合わせて行われました。AMDは、Naplesの全体的なパフォーマンス傾向を明らかにするには至らない限定的なワークロードを発表しましたが、Intel製比較プラットフォームと比較すると、Naplesは優位性を示しました。さらに重要なのは、AMDが今後発売予定のサーバーSoCのアーキテクチャと設計に関する詳細も明らかにしたことです。
対照的に、AMDは可能な限りオープンプロトコルを活用し、CCIX、Gen-Z、OpenCAPIといった複数の新しいオープンインターコネクトの開発にも参加しています。そのため、業界全体にとって、競争力のあるAMDは、コスト優位性やセカンドソースという枠にとらわれない存在です。さあ、詳しく見ていきましょう。
ハイレベル
AMDのNaplesはサウスブリッジ機能をオンダイで実現しているため、I/Oハブやチップセットは不要です。AMDは、この統合接続機能によってパフォーマンスが向上し、コストが削減されると主張しています。例えば、デュアルソケットサーバーは追加ハードウェアなしで最大24台のNVMeドライブをサポートでき、Naplesはイーサネット機能を統合していますが、AMDはパフォーマンス指標を具体的には示していません。ZenマイクロアーキテクチャはNaplesプラットフォームにSMTのパワーを注入し、32個の物理コアと64個のスレッドの組み合わせにより、AMDは22個のコアを搭載したIntelのフラッグシップ製品E5-2699 v4よりも45%多くのコア数を実現しています。
単一の Naples SoC は、Intel の 40 レーンと比較して 128 レーンの PCIe 3.0 を提供し、これも印象的な改善ですが、Naples はデュアルソケット サーバーではその利点の一部を失います。十分な PCIe レーン割り当てにより 6 つの x16 接続が可能になり、AMD は、これが GPU を活用する機械学習アプリケーションで特に便利だと指摘しました。Naples は、メモリ バッファー (Intel の Jordan Creek スケーラブル メモリ バッファーなど) を使用せずにソケットあたり 8 つの DDR4 メモリ チャネルを備えていますが、Intel は 4 つのチャネルに制限されています。Naples の大規模なメモリ プロビジョニングでは、最大 170.76 GB/秒のスループットとプロセッサあたり最大 2.048 TB のメモリ容量がサポートされますが、Intel の E5-2699A v4 は、プロセッサあたり 78.6 GB/秒のスループットと 1.54 TB のメモリで停滞します。
AMDは、コア数と周波数が異なる複数のSKUをリリースする予定ですが、クロック速度、TDP、価格は現時点では明らかにされていません。同社は、Naplesが市場に投入された際に製品スタックに関する詳細情報を提供すると述べています(当然のことですが)。AMDはIPMIなどの幅広い帯域外管理インターフェースをサポートし、OS互換性は未定ですが、幅広いオペレーティングシステムおよびハイパーバイザーベンダーと連携しています。
2ソケットに拡張すると、最大4TBのメモリをサポートする16のメモリチャネル(32 DIMM)に増加します。AMDのInfinity Fabricはプロセッサを接続し、PCIeインターフェイスを介して通信するため、デュアルソケット構成では2つのNaples SoC間で64のPCIeレーンを消費します。2ソケット構成ではホストシステムに128のPCIeレーンが提供され、それでもデュアルソケットサーバーのIntelの80レーンを上回ります。AMDは、他の多くの詳細の中でも、Infinity Fabricの帯域幅機能を指定していません。Infinity Fabricのレーン要件により、AMDはクアッドソケット構成でNaplesを採用できず、ソケット間通信に利用可能なPCIeレーンがすべて消費されます。AMDがクアッドソケットの競合製品を市場に投入する予定があるかどうかは明らかではありません。
Tom's Hardware の最高のニュースと詳細なレビューをあなたの受信箱に直接お届けします。
AMDはInfinity Fabricに関する詳細情報を公開していませんが、HyperTransportプロトコルのアップデート版であることは分かっています。AMDは、プロトコルのQoS、セキュリティ特性、その他の主要な指標が改善され、VMのプロビジョニングと管理に役立つと述べています。
AMD はまた、Infinity Fabric が 64 コアまでほぼ線形のスケーリングを提供すると主張したが、脚注が示すように、同社は実際のシリコンでスケーリングを検証していない。
デモス
AMD はライブデモンストレーション用に 2 つのデュアルソケット テスト システムを構成し、Naples の「Speedway」リファレンス サーバー設計は、Broadwell サーバーと比較して、コア数、メモリ容量、メモリ速度、PCIe レーンの点で顕著な利点を備えています。
AMDはカスタム地震ワークロードの詳細についてあまり明らかにしておらず、AVX命令を使用していることは分かっているものの、結果を標準化されたワークロードと比較したり、テストの詳細な分析を提供したりすることは不可能です。AMDによると、このワークロードはCPU、メモリ、I/Oサブシステムに負荷をかける3次元波動方程式の反復を含む、計算負荷の高い解析であるとのことです。また、より詳細なシステム仕様や設定も提供されていないため、結果は鵜呑みにしないでください。
最初のワークロードは、10億サンプルのグリッドを10回反復するものでした。AMDは、コア数とメモリ速度をIntelシステムに合わせて制限しましたが、それでもワークロードを約半分の時間で完了することができました。
2回目のテストでは、AMDは同じテストを実施しましたが、64コアすべてを活用し、メモリ速度を2,400MHzまで引き上げました。一方、Intelシステムは1,866MHzのままでした。AMDが厳選したワークロードは、再びNaplesシステムでより速く完了し、2.5倍の優位性を示しました。ワークロードに関する情報が不足しているため、44コアNaples構成と64コアネイティブ構成のワークロード完了時間について、有用なスケーラビリティ比較を導き出すことは不可能です。
最後に、AMDはメモリ容量の優位性を強調するために特別に設計されたデモを提供しました。同社はデータセットを40億サンプルのグリッドの10回の反復まで増やしましたが、メモリ容量の不足によりIntelシステムでは実行できませんでした。
まとめ
AMDのNaples設計は印象的です。ベンチマークは明らかに非常に限定的で、Naplesを有利に見せるように設計されているものの、Ryzenの初期テストでは、ZenアーキテクチャがHPCワークロードに十分に最適化されていることが示されています。Naplesシリコンが業界標準の幅広いワークロードで実際に動作する様子を見るのは興味深いでしょう。
率直に言って、AMDはデータセンター市場においてIntelとの厳しい戦いに直面しています。Intelは、幅広いサーバーSKUと、急成長を続ける新技術ポートフォリオという強みを持っています。IntelはXeonでFPGAをオンパッケージ化しており、将来的にはダイオンパッケージ化も検討しており、これにより非常に高い柔軟性が実現します。シリコンフォトニクスや3D XPointといった他の新興技術も、AMDとの大きな差別化要因となっています。
インテルのデータセンターにおける最大の強みは、おそらく長年にわたる信頼性の高いプラットフォームの実績でしょう。データセンター事業者は、現場での信頼性が実証されるまでは新しいアーキテクチャの導入を控える傾向があるため、AMDがソリューションを展開する中で、その普及率は鈍化するかもしれません。また、インテルは幅広いアプリケーションを自社のアーキテクチャにほぼ完全に最適化されているため、AMDはエコシステムの実現に多大な労力を費やす必要があるでしょう。
AMDの最大の強みは、おそらく価格体系にあるでしょう。IntelのXeonポートフォリオは、特にハイエンドでは法外な価格設定となっているため、競合は歓迎されます。残念ながら、Naplesのストーリーの大部分はまだ明かされていないため、詳細については2017年第2四半期の発売まで待つ必要があります。
ポール・アルコーンはTom's Hardware USの編集長です。CPU、ストレージ、エンタープライズハードウェアに関するニュースやレビューも執筆しています。