
Nvidiaは木曜日、データセンター規模での高度なAI開発向けに設計された最新のエンタープライズ向けスーパーコンピュータであり、同社最速のAIスーパーコンピュータであるEosのアーキテクチャを初めて一般公開するビデオを公開した。
現在NVIDIA自身が使用しているEosマシンは、最新のTop 500リスト(FP64で測定)において世界第9位の性能を誇るスーパーコンピュータにランクインしています。純粋なAIタスクにおいては、おそらく最速クラスと言えるでしょう。また、その設計図は、他の企業向けのエンタープライズ向けスーパーコンピュータの構築にも活用できます。
「EOSは日々、AI研究に取り組んでいるNvidia社内の何千人もの開発者の課題に応え、これまで解決できなかった問題の解決を支援しています」とNvidiaはビデオで述べた。
NVIDIAのEosは、人工知能(AI)および高性能コンピューティング(HPC)ワークロード向けに、それぞれ8基のNVIDIA H100 GPUを搭載した576基のDGX H100システムを搭載しています。システム全体では、1,152基のIntel Xeon Platinum 8480Cプロセッサ(CPUあたり56コア)と4,608基のH100 GPUを搭載しており、EosはHPCとAIでそれぞれRmax 121.4 FP64ペタフロップス、18.4 FP8エクサフロップスという驚異的なパフォーマンスを実現しています。
Eos (DGX SuperPOD アーキテクチャに基づく) の設計は、AI ワークロードとスケーラビリティに特化しており、最大 400 Gb/s のデータ転送速度を特徴とするインネットワーク コンピューティング テクノロジを備えた Nvidia の Mellanox Quantum-2 InfiniBand を使用しています。これは、大規模な AI モデルを効果的にトレーニングし、スケールアウトするために不可欠です。
NVIDIAのEosは、強力なハードウェアに加えて、AI開発と展開に特化した強力なソフトウェアも搭載していると同社は述べています。その結果、EosはChatGPTのような生成AIからAIファクトリーまで、幅広いアプリケーションに対応できます。
Nvidiaは動画の中で、「Eosは、AI開発・展開ソフトウェア、オーケストレーションとクラスター管理、高速コンピューティングストレージとネットワークライブラリ、AIワークロードに最適化されたオペレーティングシステムを含む統合ソフトウェアスタックを備えています」と述べています。「Saturn 5やSeleneといった過去のNvidia DGXスーパーコンピューターで得られた知識に基づいて構築されたEosは、NvidiaのAI専門知識を実践した最新の例です。[…] EosのようなAIファクトリーを構築することで、企業は最も要求の厳しいプロジェクトに着手し、現在そして将来にわたってAIの目標を達成することができます。」
Tom's Hardware の最高のニュースと詳細なレビューをあなたの受信箱に直接お届けします。
Eosの価格は不明ですが、NVIDIAのDGX H100システムの価格は機密情報であり、生産量など多くの要因に左右されるという点も問題です。一方で、NVIDIA H100は生産量に応じて1台あたり3万ドルから4万ドルの価格になることもあることを考えると、ここで提示されている数字がどれほど高額になるのか、想像に難くありません。
アントン・シロフはTom's Hardwareの寄稿ライターです。過去数十年にわたり、CPUやGPUからスーパーコンピュータ、最新のプロセス技術や最新の製造ツールからハイテク業界のトレンドまで、あらゆる分野をカバーしてきました。