NvidiaはGTC 2023で、Armベースの次期Grace CPUの発表を行いましたが、システムの出荷時期が今年後半にずれ込むという同社の発表は、当初2023年前半を目標としていた発売時期からの遅延を表しています。本日、プレス向けの質疑応答セッションで、NvidiaのCEOであるJensen Huang氏にこの遅延について質問しました。この内容は後述します。Nvidiaはまた、GTC基調講演でGraceシリコンを初めて公開し、ArmベースのGraceチップはx86の競合製品と比較して60%の電力で最大1.3倍高速であるなど、多くの新たなパフォーマンスに関する主張を行いました。この点についても後述します。
ジェンセン・フアン氏に、Grace CPUとGrace Hopper Superchipシステムのエンドマーケットへの供給が遅れている理由について尋ねたところ、彼は冗談めかして発売日を延期した後(当初は間違いなく2023年上半期だったが、現在は2023年下半期)、次のように答えた。
「まず、GraceとGrace Hopperはどちらも生産中で、シリコンが現在工場内を流れていることをお伝えできます。システムは製造されており、多くの発表を行いました。世界中のOEMやコンピューターメーカーが製造しています。」フアン氏はまた、NVIDIAがこれらのチップの開発に取り組んでからわずか2年しか経っていないことにも言及した。これは、現代のチップの典型的な数年にわたる設計サイクルを考えると、比較的短い期間だ。
今日の「出荷システム」の定義は曖昧になりがちです。AMDやIntelの最初のシステムは、チップが一般向けに入手可能になるずっと前に、ハイパースケーラーに出荷され、導入されることがよくあります。しかし、NVIDIAはチップのサンプルを顧客に提供しているとは述べていますが、Graceがまだ実稼働に導入されているとは明言していません。そのため、同社の予測ではチップの出荷は遅れていることになりますが、公平を期すために言えば、Intelのような企業によるチップの発売が毎年遅れるのは珍しいことではありません。これは、数十年にわたって確立されたハードウェアおよびソフトウェアプラットフォームを備えた主流のx86チップをベースに構築したとしても、新しいチップを発売することの難しさを浮き彫りにしています。
対照的に、NVIDIAのGraceおよびGrace+Hopperチップは、革新的なチップ間相互接続技術を採用し、チップ設計の多くの基本的な側面を根本から再考したものです。NVIDIAがArm命令セットを採用していることは、ソフトウェアの最適化と移植に多大な労力がかかることを意味し、同社は全く新しいプラットフォームを構築する必要があります。
ジェンセン氏は、長文の回答の中でその一部に触れ、「私たちが作りたいものは非常に大きいため、チップレットではなくスーパーチップから始めました。そして、これらは現在両方とも生産中です。お客様にサンプル提供し、ソフトウェアを移植し、多くのテストを行っています。基調講演ではいくつかの数字をお見せしましたが、たくさんの数字で基調講演を煩わせたくはありませんでした。しかし、皆さんに楽しんでいただけるよう、たくさんの数字を公開する予定です。パフォーマンスは本当に素晴らしいものでした」と述べた。
画像
1
の
4

画像
1
の
2

Graceチップは一部のワークロードにおいて超高性能かつ効率的ですが、NVIDIAは汎用サーバー市場をターゲットにしていません。同社は、優れたシングルスレッド性能とメモリ処理性能、そして優れた電力効率が求められるAIやクラウドワークロードといった特定のユースケース向けに、これらのチップをカスタマイズしています。
「ほぼすべてのデータセンターは現在、電力制限に直面しています。そこで、Graceは電力制限のある環境でも並外れたパフォーマンスを発揮できるように設計しました」と、Huang氏は私たちの質問に答えて説明しました。「そうなると、非常に高いパフォーマンスと非常に低い消費電力、そして非常に高い効率性が両立しなければなりません。そのため、Graceシステムは、最新世代のCPUの中でも最高のものと比較して、電力効率とパフォーマンス効率が約2倍向上しています。」
「これは異なる設計ポイントを想定して設計されているので、当然のことです」とフアン氏は続けた。「例えば、今説明したことはほとんどの企業にとっては重要ではありません。しかし、クラウドサービスプロバイダーにとっては非常に重要であり、無制限に電力を供給されるデータセンターにとっては非常に重要です。」
画像
1
の
4

エネルギー効率はこれまで以上に重要な課題となっています。最近レビューしたAMD EPYC GenoaやIntelのSapphire Rapidsといったチップは、それぞれ最大400ワットと350ワットの電力を消費するようになりました。そのため、標準設定での膨大な電力消費を抑えるには、画期的な空冷ソリューションが必要となり、最高性能のオプションでは液冷が必要になります。
対照的に、Graceの消費電力が低いため、チップの冷却はより容易になります。GTCで初めて公開されたように、NVIDIAの144コアGraceパッケージは5インチ×8インチで、驚くほどコンパクトなパッシブ冷却モジュールに搭載できます。これらのモジュールは依然として空冷に依存していますが、スリムな1Uシャーシ1つに2つのモジュールを空冷できます。
画像
1
の
3

NVIDIAはGTCでGrace Hopper Superchipシリコンも初公開しました。このSuperchipは、Grace CPUとHopper GPUを同一パッケージに統合しています。上のアルバムでご覧いただけるように、このモジュールを2つ搭載すれば、1つのサーバーシャーシに収めることも可能となっています。この設計の詳細については、こちらをご覧ください。
この設計の大きな特徴は、PCIe インターフェースの 7 倍の速度を誇る、低遅延のチップ間接続によって実現される、強化された CPU + GPU メモリの一貫性により、CPU と GPU が、以前の設計では不可能だった速度と効率でメモリに保持された情報を共有できる点です。
Huang氏は、このアプローチはAI、データベース、レコメンデーションシステム、大規模言語モデル(LLM)など、いずれも需要が非常に高い分野に最適だと説明しました。GPUがCPUのメモリに直接アクセスできるようにすることで、データ転送が合理化され、パフォーマンスが向上します。
NVIDIAのGraceチップは若干遅れているものの、同社にはASUS、Atos、Gigabyte、HPE、Supermicro、QCT、Wiston、Ztといった多数のパートナーがOEMシステムを市場向けに準備しています。これらのシステムは今年後半に発売される予定ですが、NVIDIAは下半期の初めか終わりかは明言していません。
Tom's Hardware の最高のニュースと詳細なレビューをあなたの受信箱に直接お届けします。
ポール・アルコーンはTom's Hardware USの編集長です。CPU、ストレージ、エンタープライズハードウェアに関するニュースやレビューも執筆しています。