13
AMD、Instinct MI250ベンチマークでNvidiaに挑戦状を叩きつける

AMDは今週、予想外の動きとして、Instinct MI250アクセラレータの詳細なパフォーマンス数値をNVIDIAのA100コンピュートGPUと比較した公開しました。AMDのカードは予想通り、すべてのケースでNVIDIAのボードを2~3倍上回りました。ハードウェア企業が自社の優位性を示すことは珍しくありませんが、競合他社と比較した詳細なパフォーマンス数値が公式ウェブサイトで公開されることは稀です。公開される場合、それは通常、自社製品に対する非常に高い自信を意味します。

最大3倍のパフォーマンス

AMD

(画像提供:AMD)

LAMMPSやOpenMMなど、広く利用され、業界で認められたテストを備えた物理学および分子動力学HPCアプリケーションは数多く存在します。これらは現実的なワークロードと見なすことができ、AMDのMI250XはNVIDIAのA100を1.4~2.4倍上回る性能を発揮します。

AMD

(画像提供:AMD)

現実世界の代数計算、宇宙論、粒子相互作用といったワークロードを模倣できるHPCベンチマークも数多く存在します。これらのケースでは、AMDの最上位コンピューティングアクセラレータは、NVIDIAの主力アクセラレータよりも1.9~3.05倍高速です。

AMDのMI250Xは、NvidiaのA100よりも高クロックで動作するALUがかなり多く搭載されていることを考えると、この新カードがライバルを劇的に凌駕する性能を示したことは驚くべきことではありません。一方、AMDがAIベンチマークを一切実行しなかったことは注目に値します。 

新しいアーキテクチャ、より多くのALU

 AMD の Instinct MI200 アクセラレータは、高性能コンピューティング (HPC) 向けに最適化された同社の最新の CDNA 2 アーキテクチャを採用しており、約 1.5 FP64 TFLOPS の持続的なパフォーマンスを実現するとされる、次期 Frontier スーパーコンピュータに搭載される予定です。MI200 シリーズ OAM ボードは、それぞれ 291 億個のトランジスタを搭載した 2 つのグラフィックス コンピューティング ダイ (GCD) で構成される AMD の Aldebaran コンピューティング GPU を使用します。これは、Navi 21 内の 268 億個のトランジスタと比べるとわずかに多い数です。GCD は TSMC の N6 製造プロセスを使用して製造されており、これにより AMD はより多くのトランジスタを搭載し、より多くのレイヤーで極端紫外線リソグラフィーを使用することで製造プロセスを簡素化することができました。

AMDのフラッグシップアクセラレータInstinct MI250Xは、14,080基のストリームプロセッサ(220基のコンピューティングユニット)を搭載し、128GBのHBM2Eメモリを搭載しています。MI250XコンピューティングGPUは、FP32/FP64演算で95.7 TFLOPS(行列演算でも同じ性能)の性能、およびBF16/INT8/INT4演算で383 TFLOPS/TOPSの性能を誇ります。 

Tom's Hardware の最高のニュースと詳細なレビューをあなたの受信箱に直接お届けします。

対照的に、NVIDIAのA100 GPUは542億個のトランジスタで構成され、6,912個のアクティブCUDAコアを備え、80GBのHBM2Eメモリを搭載しています。パフォーマンス面では、このアクセラレータはFP32で19.5 TFLOPS、FP64で9.7 TFLOPS、FP64 Tensorで19.5 TFLOPS、FP16/BF16で312 TFLOPS、そして最大624 INT8 TOPS(スパース性を考慮した場合1248 TOPS)を実現します。

理論上は、AMDのInstinct MI200シリーズは従来のHPCやマトリックスワークロードにおいて優れた性能を発揮しますが、AI分野ではNVIDIAが優位に立っています。これらのピーク性能は、AMDのMI200シリーズの場合、ALU数が大幅に多いことで説明できます。

AMDは、主力コンピューティングアクセラレータInstinct MI250X 128GB HBM2Eの性能を実証するため、1Pまたは2Pの64コアAMD EPYC 7742搭載システムを使用しました。これらのシステムには、AMD Instinct MI250X 128GB HBM2EコンピューティングGPUを1基または4基、あるいはNvidia A100 80GB HBM2Eを1基または4基搭載しています。AMDおよびCUDA向けに最適化されたソフトウェアを使用しました。

まとめ

AMDのInstinct MI250Xは、同社独自のデータによると、現時点で世界最高性能のHPCアクセラレータです。Aldebaranは14,080基ものALUを搭載し、FP32/FP64演算性能で95.7 TFLOPSという驚異的な性能を誇ります。まさに最速のコンピューティングGPUと言えるでしょう。  

一方、AMDはInstinct MI250Xを、NVIDIAのA100の約1.5年後、IntelのPonte Vecchioの数か月前に発売しました。2021年のコンピューティングアクセラレータが1年以上前に発売されたライバル製品よりも優れた性能を発揮するのは当然ですが、私たちが興味を持っているのは、このGPUがIntelのスーパーコンピューター向けコンピューティングPonte Vecchio GPUと比べてどうなのかということです。

アントン・シロフはTom's Hardwareの寄稿ライターです。過去数十年にわたり、CPUやGPUからスーパーコンピュータ、最新のプロセス技術や最新の製造ツールからハイテク業界のトレンドまで、あらゆる分野をカバーしてきました。