51
AMD、2025年までにチップ効率を30倍に向上させることを目指す(更新)

2021 年 8 月 30 日午前 7 時 (太平洋時間) 更新: AMD は、効率メトリックの計算に使用される式を公開しました。以下にその式を記載します。 

2021 年 8 月 29 日午後 1 時 (太平洋時間) 更新: AMD の測定基準に関する詳細を以下に追加しました。

AMDは本日、2025年までにEPYC CPUとInstinct GPUアクセラレータのエネルギー効率を30倍向上させるという、非常に野心的な目標を発表しました。AMD自身も、この目標がいかに高いものであるかを認識しており、この目標は業界全体の一般的な効率改善を150%上回るものです。

あらゆる目標と同様に、AMDは目標達成に向けた進捗状況を測定する手段を持つ必要があります。AIとHPCワークロードのパフォーマンスに注力していることから、AMDはFP16またはBF16 FLOPS(4K行列サイズのLinpack DGEMMカーネルFLOPS)を採用しました。これは、AIトレーニングワークロードで一般的に使用されるデータ型を使用していることを意味します。 

ノード

(画像提供:AMD)

AMDは、4基のMI50 GPUと1基のEPYC Rome 7742 CPUを搭載した既存システム(コンピューティングノード)の総合的なパフォーマンスを基準として、パフォーマンス測定の基準を設定しました。これは「2020年システム」の基準として定義されています。AMDは、同数のGPUとCPUを搭載した新世代のサーバーノードでマイルストーンを測定する予定です。

AMDは、BF16およびFP16データ型に固定機能(ハードウェアレベル)アクセラレーションを追加するだけで、目標達成に向けて大きく前進できることを理解することが重要です。これにより、比較的「容易」かつ大幅なパフォーマンスと効率性の向上を実現できます。例えば、MI60はFP16をサポートしていますが、BF16はサポートしていません。

画像

1

10

AMD 高度なコンピューティング需要の効率化を加速するスライド
(画像提供:AMD)

AMDは、目標達成のためにハードウェアとソフトウェアの両方の最適化に頼ると述べていますが、その過程で期待できるハードウェアアクセラレーションの種類については明言を避けています。CPUとGPUに固定機能のBF16アクセラレーションを追加するかどうかについては、明言を避けています。この追加機能だけでも、対象ワークロードにおいて目覚ましいパフォーマンス向上が期待できます。さらに、ソフトウェアの最適化は既存のハードウェアの大幅な改善につながることがよくあるため、AMDは目標達成に向けて複数の選択肢を持っていることになります。

AMDがこれまでノートPCの効率向上を目指してきた目標とは異なり、今回のテスト手法ではアイドル時の消費電力の測定値は考慮していません。代わりに、これらのワークロードの標準的な使用率(約90%)にデータセンターのPUE(Power Usage Effectiveness、データセンターの効率性を示す指標)を乗じた値を使用します。AMDによると、この値はワットあたりの電力消費量の指標にほぼ一致しています。以下は、AMDが提供している追加情報と計算式です。

AMD EPYC 7742 CPUと組み合わせたMI50の社内AMDラボ測定結果を使用しました。その結果、三角関数データ初期化を伴う4KマトリックスDGEMMでMI50あたり5.26TF、4KマトリックスのFP16で21.6TFが生成されました。4つのMI50(300W TBP)の定格電力、EPYCの225W TDP、DRAMの100W、それに電力変換損失とオーバーヘッドを合計すると、コンピューティングノードの電力は1582Wになります。

Tom's Hardware の最高のニュースと詳細なレビューをあなたの受信箱に直接お届けします。

HPC パフォーマンス/W ベースライン = 4*5.26TF/1582W

AIトレーニングパフォーマンス/Wベースライン = 4*21.56TF/1582W

これら 2 つのメトリックを平均して集計ベースラインを作成します。

AMDのエネルギー効率目標は、AIトレーニング、気候予測、ゲノミクス、大規模スーパーコンピュータシミュレーションなどの機能を実行する高速コンピューティングノードに対する処理要件の大幅な増加を受けて設定されました。AMDは、この目標を達成すれば、これらのシステム全体のエネルギー消費量は5年間で驚異的な97%削減されると発表しています。

「プロセッサのエネルギー効率の向上は、AMDにとって長期的な設計上の優先事項であり、現在、AIトレーニングや高性能コンピューティングの導入に当社の高性能CPUとアクセラレータを使用した最新のコンピューティングノードに適用するための新たな目標を設定しています」と、AMDのエグゼクティブバイスプレジデント兼CTOであるマーク・ペーパーマスター氏は述べています。「これらの非常に重要なセグメントと、大手企業が環境管理を強化するための価値提案に焦点を当て、AMDの30倍という目標は、これらの分野における業界のエネルギー効率実績を過去5年間で150%上回ります。」

AMDは既にCPUとGPUの設計において、電力効率の改善に様々な取り組みを行っており、AMDのZen CPUはワット当たりの性能比でIntelの最高峰を上回っています。また、RDNA 2 GPUの消費電力も大幅に改善し、NVIDIAからエネルギー効率の王座を奪いました。これらの改善の一部は、少なくともGPU側では製造ノードの飛躍的な向上によるものです。しかし、高密度製造プロセスのコストが膨らみ、研究開発期間が長くなるにつれて、AMDがこれらの改善だけに頼っているわけではないことは明らかです。

むしろ、3Dキャッシュスタッキング(RDNA 2チップに採用されているInfinity Cacheは消費電力を大幅に削減します)などの技術や、効率性を重視したエンジニアリングアプローチの強化が求められるでしょう。固定機能のアクセラレーションとソフトウェアの改善も大きな役割を果たすでしょう。AMDがこの目標を達成するためにどのような技術を追求するかはまだ分かりませんが、同社が今後4年間でこの種の改善を実現できると確信していることは、心強いものです。 

Francisco Pires 氏は、Tom's Hardware のフリーランス ニュース ライターであり、量子コンピューティングに関心を持っています。