IntelはArc B580で優れた総合的な価値を提供しています。12GBのメモリを搭載しながら、競合製品よりも低価格でありながら、全体的に優れたパフォーマンスを提供します。ドライバーにはまだ時折不具合が見られますが、Alchemist以降は大幅に改善されています。
長所
- +
優れた価値提案
- +
予算/中価格帯のGPUで12GB
- +
冷却性に優れた魅力的なデザイン
- +
優れたグラフィックとAIパフォーマンス
短所
- -
効率と密度は依然としてNVIDIAに遅れをとっている
- -
ドライバーの根強い懸念
- -
1月にAMDからの新たな競合の可能性
Tom's Hardwareを信頼できる理由 お客様に最適な製品とサービスをお選びいただけるよう、専門のレビュアーが何時間もかけて製品とサービスをテスト・比較しています。テスト方法について詳しくはこちらをご覧ください。
Intel Arc B580は次世代GPUの先陣を切る製品であり、競合製品より1か月以上、あるいは1年半遅れて登場しました。しかし、249ドルという価格、アップグレードされたBattlemageアーキテクチャ、そしてArc GPUの初期バージョンと比べて大幅に改良されたドライバーにより、一般ユーザーにも手の届きやすい価格帯となっています。Arc B580は、最高のグラフィックカードと比べてどうなのでしょうか?早速見ていきましょう。
今月初めにArc B580とB570を発表し、Battlemageアーキテクチャの詳細を数多く紹介しました。Intelは、NVIDIAの競合製品RTX 4060よりも10%高いゲームフレームレートを50ドル安い価格で実現するという、パフォーマンスに関する早期のティザーを発表しました。さあ、いよいよその包装を剥がし、Intel Arc専用グラフィックスカード第2弾がどのような性能を発揮するのかを見てみましょう。
スワイプして水平にスクロールします
グラフィックカード | アークB580 | アークB570 | アーク A770 16GB | アークA750 | アークA580 |
---|---|---|---|---|---|
建築 | BMG-G21 | BMG-G21 | ACM-G10 | ACM-G10 | ACM-G10 |
プロセス技術 | TSMC N5 | TSMC N5 | TSMC N6 | TSMC N6 | TSMC N6 |
トランジスタ(10億個) | 19.6 | 19.6 | 21.7 | 21.7 | 21.7 |
ダイサイズ(mm^2) | 272 | 272 | 406 | 406 | 406 |
Xeコア | 20 | 18 | 32 | 28 | 24 |
GPU コア (シェーダー) | 2560 | 2304 | 4096 | 3584 | 3072 |
XMXコア | 160 | 144 | 512 | 448 | 384 |
レイトレーシングコア | 20 | 18 | 32 | 28 | 24 |
ブーストクロック(MHz) | 2850 | 2750 | 2400 | 2400 | 1700 |
VRAM速度(Gbps) | 19 | 19 | 17.5 | 16 | 16 |
VRAM(GB) | 12 | 10 | 16 | 8 | 8 |
VRAMバス幅 | 192 | 160 | 256 | 256 | 256 |
L2キャッシュ | 18 | 13.5 | 16 | 16 | 16 |
レンダリング出力単位 | 80 | 80 | 128 | 128 | 128 |
テクスチャマッピングユニット | 160 | 144 | 256 | 224 | 192 |
TFLOPS FP32(ブースト) | 14.6 | 12.7 | 19.7 | 17.2 | 10.4 |
ピーク TFLOPS FP16 (INT8 TOPS) | 117 (233) | 101 (203) | 157 (315) | 138 (275) | 84 (167) |
帯域幅(GB/秒) | 456 | 380 | 560 | 512 | 512 |
TBP(ワット) | 190 | 150 | 225 | 225 | 185 |
PCIeインターフェース | x8 PCIe 4.0 | x8 PCIe 4.0 | x16 PCIe 4.0 | x16 PCIe 4.0 | x16 PCIe 4.0 |
発売日 | 2024年12月 | 2025年1月 | 2022年10月 | 2022年10月 | 2023年10月 |
発売価格 | 249ドル | 219ドル | 349ドル | 289ドル | 179ドル |
オンライン価格 | 250ドル | 220ドル | 230ドル | 200ドル | 170ドル |
Arc GPUの新旧を比較するだけでは、全体像は分かりません。スペック上は、B580は既存のA750よりも明らかに性能が劣っており、ましてやフルスペックのA770 16GBカードはなおさらです。(A770 8GBは、あまり人気が出ず、1年以上もどこにも売られていないため、今回は除外しました。)
B580のXeコア数は「わずか」20個ですが、A750は28個、A770は32個、そして下位グレードのA580でさえXeコア数は24個です。Battlemageのメリットはブーストクロックの向上だけだと考えるのは間違いです。クロック速度についてですが、Intelが公式に発表している「グラフィックスクロック」は非常に控えめな数値ですが、私たちのテストでは通常、GPUを最大ブーストクロックまたはその付近で動作させているため、表ではその数値を使用しています。
Battlemageには、アーキテクチャ設計の大幅な変更がいくつか加えられています。Intelが公開したこのスライドでは、特定のグラフィックスワークロードを対象とした低レベルベンチマークが示されており、最も大きな改善点のいくつかを確認できます。
左端には、計算と描画の「間接実行」バーがあります。AlchemistはハードウェアでXIをサポートしていなかったため、ソフトウェア(ドライバ)による回避策に頼らざるを得ませんでした。Battlemageは、この機能のネイティブハードウェアサポートを追加することで、大幅な改善を実現しています。メッシュと頂点のスループットも2倍以上、サンプラーフィードバックも同様に大幅に向上しています。レイトレーシングも、Xeコアあたり1.5倍から2.1倍の改善が見られます。
Battlemageのもう一つの大きな変更点は、AlchemistのSIMD32ユニットからネイティブSIMD16(Single Instruction Multiple Data、16ビット幅)命令への移行です。これによりGPU利用率が向上します。これは、同じ命令を必要とする32個のデータをすべて見つけるのが難しいワークロードが多数存在するためです。Intelによると、BattlemageはXeコアあたり70%のパフォーマンス向上を実現します。
計算してみると、20 XeコアのB580は、34 XeコアのAlchemistチップ(実際には存在しません)とほぼ同等の動作をするはずです。ただし、クロック速度も考慮する必要があり、B580はA770よりも平均で約20%高いクロック速度を実現しています。これは、実使用環境では誤差はありますが、約28%のパフォーマンス向上に相当します。
そのため、TFLOPSやTOPSの数値は実際にはあまり重要ではありません。アーキテクチャ内で比較すれば数値はより意味を持ちますが、異なるアーキテクチャ間で比較すると、全く意味がなくなります。これはNvidiaやAMDのGPUで10年以上前から見てきたことなので、目新しいことではありません。ただ、覚えておくべき点です。理論上のFP32演算性能が14.6 TFLOPS、INT8演算性能が233 TOPSのB580は、理論上のFP32演算性能が19.7 TFLOPS、INT8演算性能が315 TOPSのA770を概ね上回ります。
仕様変更は他にもあります。Alchemist の L2 キャッシュは最大 16MB でしたが、Battlemage では 18MB に増加しました。つまり、現世代の Nvidia や AMD GPU に見られるような「巨大な」 L2 キャッシュや L3 キャッシュは搭載されていません。ただし、Battlemage の L1 キャッシュは Alchemist より 50% 大きくなっています。
メモリインターフェースと容量も重要です。A770は一般的に256ビットインターフェースの16GB GDDR6メモリを搭載し、560GB/sの帯域幅を実現しています。しかし、A750とA580は容量を半分の8GBに抑え、クロックをわずかに下げることで512GB/sの帯域幅を実現しています。Battlemageは、192ビットインターフェースと12GBの容量に加え、高クロックのGDDR6メモリを搭載することで456GB/sの帯域幅を実現しています。これは、1440p以下の解像度でのゲームプレイを含め、ほとんどのユースケースに十分な性能です。
最後に、そしておそらく最も重要な点として、Arc B580とB570はPCIe 4.0 x8インターフェースを搭載しています。これはIntelがAlchemist GPU(A380とA310を除く)に搭載しているインターフェースの半分であり、最適なパフォーマンスを得るにはPCIe Resizeable BARのサポートが依然として必要です。インターフェース幅については、データはGPUに送信され、その後、計算負荷の高いワークロードのためにGPUに留まるため、問題にはならないはずです。
- 詳細:最高のグラフィックカード
- 詳細: GPUベンチマークと階層
- 詳細:すべてのグラフィックコンテンツ
Tom's Hardware の最高のニュースと詳細なレビューをあなたの受信箱に直接お届けします。
ジャレッド・ウォルトンは、Tom's Hardwareのシニアエディターで、GPU全般を専門としています。2004年からテクノロジージャーナリストとして活躍し、AnandTech、Maximum PC、PC Gamerなどで執筆活動を行っています。初代S3 Virgeの「3Dデセラレータ」から最新のGPUまで、ジャレッドは最新のグラフィックストレンドを常に把握しており、ゲームパフォーマンスに関する質問は彼にお任せください。