57
EPYCのRyze:AMDスーパーコンピューターのスライドショー

EPYCのRyze

EPYCのRyze

革新的なEPYC設計は、コストを抑えるマルチチップ実装を特徴としており、価格競争においてAMDにIntelに対する確固たる立場をもたらしています。しかし、x86命令セットは潜在顧客にとってさらに大きな魅力です。AMDの顧客は、大規模から小規模まで、必要な認定サイクルを経た上ではあるものの、Intelのキットで実行されているのと同じx86コードをEPYCサーバー上で実行できます。いずれの場合も、x86アプリケーションはデータセンターの約95%を占めており、これはIntelの圧倒的な市場シェアからも明らかです。これはAMDにとって有利に働き、他の有望なARMベースの競合他社を脇に追いやっています。

x86の優位性を巡る戦いが繰り広げられていますが、Intelは継続的な供給不足と長年の遅延を抱える10nmプロセスに苦戦しており、これは大きな懸念材料です。特にAMDは7nm EPYC Romeプロセッサの発売を来年に控えているため、なおさらです。しかし、EPYCの価値提案は価格やx86命令セットの利点だけにとどまりません。大容量メモリ、スループット、そして豊富なPCIeレーン数により、これらのプロセッサはサーバーとスーパーコンピューターの両方において、多くの主要セグメントに最適です。それでは見ていきましょう。

Perlmutter: Milan 搭載の Shasta スーパーコンピュータ

CrayのShastaスーパーコンピュータ(詳細はこちら)に注目するのに、それほど時間はかかりませんでした。この新しいシステムには、AMDの未発表EPYC Milanプロセッサが搭載されています。これはAMDの次世代データセンタープロセッサです。この新しいスーパーコンピュータは、NVIDIAの「Volta-Next」GPUも搭載し、この2つを組み合わせることでエクサスケールクラスのマシンが実現し、世界最速のスーパーコンピュータの一つとなるでしょう。

米国エネルギー省が開発中のPerlmutterスーパーコンピュータは、CPUノードとGPUノードの両方を搭載し、ここにはCPUノードが示されています。この水冷式筐体には、8基のAMD Milan CPUが搭載されています。Milanプロセッサを覆う4つの銅製ウォーターブロックに加え、DIMMスロット間のPCB上にさらに4基のプロセッサが逆さまに搭載されています。このシステムは究極のパフォーマンス密度を実現するように設計されているため、すべてのDIMMも水冷式です。

しかし、素晴らしいスペックはさておき、ここでAMDが本当に勝ち取ったのはマインドシェアです。データセンターの顧客は、単一世代の製品ではなく、長期的なロードマップを重視します。Crayと米国エネルギー省の両社が、特に第2世代Romeプロセッサがまだ量産されていない時期に、第3世代EPYCに参入したことは、示唆に富む兆候です。昨年、第1世代Naplesプロセッサがデビューするまでは、スーパーコンピューティングのリーダー企業数社からこのような賛同を得ることは決して予想していませんでした。この成果は、AMDのマーケティング資料の単なる箇条書きではありません。EPYCプロセッサフ​​ァミリー、特に次世代RomeおよびMilanモデルは、データセンターにおけるIntelの優位性に深刻な脅威をもたらすでしょう。

世界最速スーパーコンピュータ「Frontier」にEPYCとRadeonが搭載

世界最速スーパーコンピュータ「Frontier」におけるEPYCとRadeon

Shastaスーパーコンピュータブレードについて言えば、AMDとCrayは、2021年に稼働開始予定の世界最速スーパーコンピュータとなるFrontierに両社が採用されたことを発表しました。Frontierは1.5エクサフロップスの演算能力を発揮し、これは現在のトップ160のスーパーコンピュータの演算能力を合わせたよりも高速です。この演算能力は、AMDの次世代EPYCプロセッサとRadeon Instinct GPUによって実現されます。

Tom's Hardware の最高のニュースと詳細なレビューをあなたの受信箱に直接お届けします。

AMDは、AIおよびスーパーコンピューティングのワークロードに最適なパフォーマンスを提供する新しい命令をサポートすることで、カスタムEPYCプロセッサを最適化しました。「これはZenアーキテクチャの将来バージョンです。Romeに搭載されているもの以上のものと考えてください」とAMDのCEO、リサ・スー氏は述べています。これは、AMDがこのタスクに次世代EPYC Milanプロセッサのカスタムバージョンを使用する可能性を示唆していますが、まだ確定していません。

これらのCPUは、広範な混合精度演算能力と高帯域幅メモリ(HBM)を備えた高性能Radeon GPUアクセラレータと組み合わせられます。AMDは、このGPUが将来的に市場投入されると明言しましたが、カスタム設計のEPYCプロセッサの将来については詳細を述べませんでした。AMDは、各EPYC CPUを、カスタムの高帯域幅・低レイテンシ・コヒーレントInfinity Fabricを介して4つのRadeon Instinct GPUに接続します。これは、AMDが現在プロセッサ内部でCPUとGPUダイを結合するために使用している基盤となるInfinity Fabricテクノロジーの進化形ですが、AMDはこれをPCIeバス経由で動作するように拡張しました。

Frontierの性能を概観すると、このスーパーコンピュータは1秒あたり最大15京回の演算処理が可能で、これは毎秒15京回の数学問題を解くことに相当します。Crayはまた、同社のネットワークソリューションの性能を、家庭用最速インターネット接続の2400万倍の帯域幅、つまり1秒間にフルHD映画10万本をダウンロードできる能力と謳っています。

すべての道はローマに通じる

すべての道はローマに通じる

AMD の 7nm Rome プロセッサは、データセンター プロセッサ向けのマルチチップ アーキテクチャの新しい波の先駆けとなっていますが、AMD は 64 コア 128 スレッド プロセッサがいつ市場に投入されるかについては明言を避けており、2019 年に投入されると漠然と述べています。Rome プロセッサと PCIe 4.0 をサポートするように設計された新しいマザーボードを展示したマザーボード ベンダーによると、完全に互換性のある Rome マザーボードの第一波は 2019 年第 3 四半期に投入される予定で、これが Rome チップの出荷開始の合図になると思われます。

Romeプロセッサは128本のPCIeレーンを備えています。このマザーボードは、これらのレーンを4つのx16スロットと2つのx8スロットに分配します。また、ボード左下には2つのPCIe 3.0 x16スロットと2つのM.2 SSDソケットも搭載されています。こうした接続性の高さこそが、AMDの現世代Naplesプロセッサの最大の魅力ですが、コア数の増加と、7nmプロセスによるコアあたりの消費電力とコストの削減により、来年にはさらに競争力の高いプラットフォームが実現するでしょう。

中国におけるEPYCの反響

中国におけるEPYCの反響

EPYCの波が中国に押し寄せている。中国のチップメーカーHygonはAMDとの合弁事業に参加し、Zenマイクロアーキテクチャのライセンスを取得して「Dhyana」データセンタープロセッサを開発している。これはAMDのEPYC Naplesチップの実質的なコピーと言える。これらのチップは、急成長を遂げる中国市場において、特に中国が自国製品の推進を禁じる保護主義的措置を講じていることを考えると、Intelにとって大きな脅威となる。激化する貿易戦争に拍車をかければ、中国市場での爆発的な成長の秘訣が揃うことになる。特に、合弁会社が来年から7nmのRomeプロセッサをスピンオフさせれば、その可能性はさらに高まるだろう。

Sugonは、NVIDIA Tesla CPU 4基とDhyana CPU 4基を搭載した個々のコンピューティングトレイを液浸冷却する、本格的なNebulaサーバーラックを提供しています。液浸冷却は比類のないパフォーマンス密度を実現しますが、相変化冷却装置を扱うには専用のインフラストラクチャが必要です。Sugonのソリューションは42台のコンピューティングブレードをホストし、相変化冷却装置を搭載したセカンダリキャビネットが付属しています。上のビデオでご覧いただけるように、これらのスレッドにはクイックリリース接続が備わっており、複雑なチューブ接続を必要とせずに、ほぼホットプラグ可能なノードを実現できます。

Dell/EMCが買収

Dell/EMCが買収

DellとEMCは最近提携し、世界最大のエンタープライズハードウェア販売業者となりました。そのため、AMDがEMCとのOEM契約を獲得したことは、ますます重要になっています。複数のODMもEPYCサーバーを開発していますが、OEMシステムは、より幅広いエンタープライズ顧客へのプラットフォームの訴求力を高めるのに役立ちます。Dellのサーバーは、信頼性の高いエンタープライズクラスシステムの特徴をすべて備えており、例えば、新規顧客がEPYCシステムへの移行を容易にする、包括的なサポートとメンテナンス契約が付属しています。

Dell/EMCは、EPYCサーバーラインを3つのモデルで発表しました。Dell EMC PowerEdge R7425は、このグループにおける主力製品であり、デュアルソケット2Uサーバーです。このサーバーは、ハイエンドのEPYCプロセッサーを搭載し、最大4TBのメモリと最大64コアをサポートします。仮想化環境や分析ワークロードなどに最適です。

HPEにもゲームがある

HPEにもゲームがある

HPE は、新しい Proliant DL385 Gen10 を初めて発表した際に、EPYC プロセッサを使用して SPECrate2017_fp_base および SPECfp_rate2006 で浮動小数点の世界記録を樹立したことを明らかにしました。

同社は現在、HPE Apollo 35システムを発売しています。このサーバーは、2TBのメモリと2基のプロセッサを搭載した4つのデュアルソケットスレッド(上図)で構成されています。4つのスレッドが1つの2Uシャーシに収まるため、優れたパフォーマンス密度を実現します。

AMDがHPEのProLiantラインナップに復帰したことは、重要な意味を持つ。AMDはここ数年このラインナップに参入しておらず、Intel製品が中心となっていた。しかし、AMDがEPYC Naplesプロセッサで足掛かりを確保したことで、Romeプロセッサを搭載した新モデルが間もなく登場することが確実となった。

Supermicroのサーバーを忘れないでください

Supermicroのサーバーを忘れないでください

両社間の広範な協業により、SupermicroはIntelの延長線上にあるとよく考えられています。しかし、同社はシングルソケットからデュアルソケットまで幅広いサーバーとマザーボードを揃え、EPYCサーバー事業にも参入しています。

AS-2123BT-HNC0R(その名前はまさにうなずけます)サーバーは4ノード設計です。各ノードには、お好みのEPYC 7000シリーズプロセッサーを2基搭載し、最大2TBのECC LRDIMM(DDR4-2666)をサポートします。ストレージは、SAS 3ポート6基とNVMeソケット4基を備えています。

...マザーボードも搭載

...マザーボードも搭載

Dell/EMCやHPEといった大手サーバーベンダーとは異なり、Supermicroはマザーボードも単体で販売しています。展示ではデュアルソケットモデルとシングルソケットモデルの両方が紹介されています。このSP3ソケットマザーボードは、EPYC 7000シリーズプロセッサ2基と、DDR4-2666で動作する最大2TBのECCメモリをサポートします。2つの統合型10GBe LANポートがネットワーク機能を提供し、10個のSATA 6Gb/sポートに加え、2つのSATA DOMと1つのM.2ポートが備えられています。

ギガバイトの見解

ギガバイトの見解

GigabyteはEPYCプラットフォームの早期導入企業の一つです。Gigabyte G291-Z20は、業界をリードする128 PCIeレーンをサポートすることで、EPYCサーバーの一般的なユースケースであるGPUコンピューティングに特化しています。このシステムは、最大8基のダブルスロットGPUをホストする2基のEPYC 7000シリーズプロセッサをサポートします。デュアル2200W 80 PLUS Platinum認証冗長電源は、幅広い機械学習ワークロードに電力を供給します。GigabyteはNvidiaのTesla V100をサポートするだけでなく、パッシブ冷却方式のRadeon Instinct MI25 GPU向けに独自のクーラーも開発しています。

ここで、AMDのもう一つの強みについて触れておきたいと思います。x86ホストプロセッサとGPUの両方を製造している唯一の企業であるAMDは、緊密に連携したカスタマイズされた製品を開発できます。AMDがInfinity Fabric(XGMI)インターフェースを介したCPUとGPU間の通信サポートを展開していくにつれて、この取り組みは成熟していくでしょう。XGMIは来年発売されるRomeプロセッサとともに市場に登場すると広く予想されています。

ASRock ラックスタック GPU

ASRock ラックスタック GPU

ASRock Rackは、4基のRadeon Instinct GPUを搭載したAMD EPYCシステムを展示していました。このコンパクトなシングルソケットソリューションは、マザーボードベンダーがAMDの豊富なPCIeレーン割り当てを活用して、デュアルソケットのIntelプラットフォームよりも多くのネイティブ接続を単一のEPYCサーバー内で提供できることを示す好例です。

AMDは、シングルソケットサーバーのPCIe接続において、128レーンという圧倒的なリードを誇っています。これは、Purleyのシングルソケットの最大値である48+20(CPU+チップセット)をはるかに上回っています。Intelは「レーン不足」を認めていますが、一般消費者への影響はないとしています。AMDは当然ながら異なる考え方を持ち、大規模なI/Oニーズを持つ顧客にとって大きなアドバンテージがあると主張しています。

現在のページ: ページ 1

次のページ 2ページ

ポール・アルコーンはTom's Hardware USの編集長です。CPU、ストレージ、エンタープライズハードウェアに関するニュースやレビューも執筆しています。