78
AMDはRX 7900 XTXがDeepSeekベンチマークでRTX 4090を上回ると主張
AMD RX 7900 XTX
(画像提供:AMD)

AMDは、DeepSeekのAIモデルを用いて、フラッグシップモデルRX 7900 XTXとNVIDIA RTX 4090およびRTX 4080 Superを比較したベンチマーク結果を発表しました。XのDavid McAfee氏によると、RDNA3ベースのGPUはRTX 4090を最大13%、RTX 4080 Superを最大34%上回る性能を発揮しました。

AMDは、DeepSeek R1を用いて、複数のLLMと様々なパラメータで3つのGPUをテストしました。RX 7900 XTXは、DeepSeek R1 Distill Qwen 7Bを使用した際にRTX 4090に対して最大の勝利を収め、Ada Lovelace GPUを13%上回りました。AMDは、RTX 4090に対して他の3つのLLM構成もテストしました。RX 7900 XTXは、3つの構成のうち2つでRX 4090を上回りました。Distill Llama 8Bを使用した場合は11%、Distill Qwen 14Bを使用した場合は2%の高速化でした。Distill Qwen 32Bを使用した1つの構成では、RX 4090はRX 7900 XTXよりも4%高速でした。

DeepSeekは@AMDRadeon 7900 XTXで非常に良好なパフォーマンスを発揮しました。Radeon GPUとRyzen AI APUでの実行方法については、こちらをご覧ください: https://t.co/FVLDLJ18Ov pic.twitter.com/5OKEkyJjh3 2025年1月29日

AMDはRTX 4080 Superに対し、3つの構成でテストを行いました。RX 7900 XTXは、DeepSeek R1 Distill Qwen 7Bを使用した場合、RTX 4080 Superを34%上回りました。Distill Llama 8Bを使用した場合、この差は27%、Distill Qwen 14Bを使用した場合、22%にまで縮まりました。

もちろん、これはすべて鵜呑みにすべきではありません。なぜなら、テスト(繰り返しますが、テストはAMDによって実行されました)においてNvidia GPUがどのように構成されたかは不明だからです。すべてのAIワークロードがGPUの計算スループットを最大限に活用するわけではありません。これは、Stable Diffusionテストで確認されました。Stable Diffusionでは、FP8計算やTensorRTコードを使用していませんでした。

RX 7900 XTXが専用のAIプロセッサとして使用されることは一般的ではありませんが、そのアーキテクチャはAIワークロードの処理能力を十二分に備えています。RX 7900 XTXがベースとするRDNA 3アーキテクチャは、BF16とINT8をサポートし、行列演算が可能です。AMDは、そのAI処理能力の高さを示すため、RDNA 3に「AIアクセラレータ」という用語を正式に追加しました。RX 7900 XTXは192個のAIアクセラレータを搭載しています。

AMDは最近、RX 7900 XTXを含む、互換性のあるAMDコンシューマー向けハードウェアでDeepSeek R1を実行する方法を解説したチュートリアルを公開しました。DeepSeek R1は、欧米の最先端AIモデルに匹敵するパフォーマンスを、はるかに低い計算コストで提供する新しいAIモデルです。DeepSeek R1は、NVIDIAのアセンブリ言語のようなPTXプログラミング言語をはじめ、様々なハードウェアベースの最適化技術を用いることで、競合製品よりも11倍高速にモデルを実行できます。

Tom's Hardware の最高のニュースと詳細なレビューをあなたの受信箱に直接お届けします。

Aaron Klotz 氏は Tom's Hardware の寄稿ライターであり、CPU やグラフィック カードなどのコンピューター ハードウェアに関するニュースを扱っています。