11
AMD RDNA 3 プロフェッショナルGPU(48GB)はAIにおいてNvidia 24GBカードに勝てる ― LLMに「大規模」をもたらす
Radeon Pro W7900 デュアルスロット
(画像提供:AMD)

AMD は、同社のモンスター級の 48GB RDNA 3 GPU が Team Green の前世代 RTX 4090 を上回る性能を発揮できると主張する新しい DeepSeek ベンチマークで Nvidia に反撃しています。

AMDのRyzen CPUおよびRadeonグラフィックス担当副社長兼ゼネラルマネージャーであるDavid McAfee氏は、Radeon Pro W7900およびPro W7800 48GBカードはDeepSeek R1でRTX 4090を最大7.3倍上回る性能を発揮するとXに投稿しました。

McAfeeは、LM Studio 0.3.12とLlama.cppランタイム1.18を使用して、DeepSeek R1の複数のイテレーションでベンチマークされた3つのGPUのグラフを公開しました。DeepSeek R1のイテレーションは、Distill Qwen 32B 8ビット、Distill Llama 70B 4ビット、Distill Qwen 32B 8ビット、Distill Llama 70B 4ビットで構成されていました。前2つは会話型プロンプト(20トークン)を出力するように設定され、後者は要約プロンプト(3017トークン)を出力するように設定されました。

@AMD Radeon PRO W7800 48GB または W7900 48GB 1枚で、最大のDeepSeek R1 Distill(32Bの場合はそれ以上の精度)でも優れたパフォーマンスで動作させるのに十分なVRAMを搭載しています。pic.twitter.com/4uNTO6XAYG 2025年3月13日

DeepSeek R1 Distill Qwen 32B 8ビットテストでは、RTX 4090は1秒あたり2.7トークン、Pro W7800 48GBは1秒あたり19.1トークン、Pro W7900 48GBは1秒あたり19.8トークンを生成したとされています。Distill Llama 70B 4ビットテストでは、RTX 4090は1秒あたり2.3トークン、Pro W7800 48GBは1秒あたり12.8トークン、Pro W7900 48GBは1秒あたり12.7トークンを生成しました。

Distill Qwen 32B 8ビットでは、RTX 4090は毎秒2.5トークン、Pro W7800 48GBは毎秒15.7トークン、Pro W7900 48GBは毎秒16.2トークンを生成しました。R1 Distill Llama 70B 4ビットでは、RTX 4090は毎秒2トークン、Pro W7800 48GBは毎秒10.1トークン、Pro W7900 48GBは毎秒10.4トークンを生成しました。

AMD のベンチマークによれば、Radeon Pro W7800 または Pro W7900 48GB GPU は、RTX 4090 と比較して、Distill Qwen 32B 8 ビットで最大 7.3 倍、Distill Llama 70B 4 ビットで最大 5.5 倍、Distill Qwen 32B 8 ビットで 6.5 倍、Distill Llama 70B 4 ビットで 5.2 倍高速です。

David McAfee氏は、WPro W7800とW7900の48GBモデルには、最大規模のDeepSeek R1モデルを実行するのに十分なVRAMが搭載されていると主張しています。VRAMは、大規模言語モデルの処理において最も重要な要素の一つです。LLMのパラメータはVRAMに直接保存され、モデルサイズに正比例します。そのため、LLMが大きくなるほど、必要なVRAMの量も増えます。しかし、VRAM容量の増加に伴い、価格も非常に高くなります。

W7900 48GBの価格はなんと3,500ドル。RTX 5090のメーカー希望小売価格2,000ドルより1,500ドル、RTX 4090のメーカー希望小売価格1,500ドルより2,000ドルも高いのです(もっとも、4090がそのような価格で販売されることはほとんどありませんでしたが)。しかし、その一方で、48GB RDNA 3 GPUは、現在入手可能な最も近い現行世代の48GB Nvidia GPUであるRTX A6000 Adaの半額以下です。

Tom's Hardware の最高のニュースと詳細なレビューをあなたの受信箱に直接お届けします。

AMDのマーケティングは素晴らしいように見えますが、これは以前にも見たことがあります。AMDは以前、DeepSeek R1ベンチマークにおいて、RX 7900 XTXがRTX 4090を(ほぼ)上回るというベンチマーク結果を発表しました。しかし、Nvidiaはこれに応えて、RTX 4090(およびRTX 5090)のベンチマーク結果を公開し、同じDeepSeek R1構成でフラッグシップGPUであるRDNA 3を大幅に上回るパフォーマンスを示しました。

AMDは、NVIDIAの最新フラッグシップモデルであるRTX 5090と、RDNA 3ベースの48GBワークステーション向けグラフィックカードを比較したベンチマーク結果も公開しませんでした。AMDの48GBカードのVRAM容量は、32GB GDDR7を搭載したRTX 5090よりも大きいため、NVIDIAがAMDに対抗するために新たなベンチマーク結果を発表するかどうかは興味深いところです。

Aaron Klotz 氏は Tom's Hardware の寄稿ライターであり、CPU やグラフィック カードなどのコンピューター ハードウェアに関するニュースを扱っています。