43
実際のNvidia GeForce GTX 970の仕様

私たちはこの問題についてこれまで沈黙を守ってきました。なぜなら、発言する前に状況を完全に明確にしたかったからです。私は自動車の比喩を使うのが好きなので、ここでもこの状況を説明するために比喩を使ってみようと思います。そうすれば、この混乱全体を俯瞰できると思うからです。

あなたはマッスルカーマニアで、2015年モデルの新型ダッジ チャージャー ヘルキャットを試乗することにしました。この車は、スーパーチャージャー付き8気筒6.2リッターHemiエンジン(24バルブ)を搭載し、6,000回転で707馬力を発生すると宣伝されています。この車は、低価格で購入できる最もパワフルな車の一つで、時速0~60マイル(約96km/h)加速は3秒以下、4分の1マイル(約1/4マイル)は12秒以下です。試乗して一目惚れし、ついに購入しました。それから数ヶ月、購入して以来、この車とそのパフォーマンスに大変満足しています。

残念です。しかし、チャージャー・ヘルキャットが、この情報を知る前よりも悪い車になったのでしょうか? 実際にはそうではありません。パフォーマンスは変わっていません。しかし、後味が悪いです。ダッジにとっては、広報上の悪夢となるでしょう。チャージャー・ヘルキャットのオーナーの中には、当初期待していた通りの速さなのに、騙されたと感じる人もいるでしょう。

スワイプして水平にスクロールします

ヘッダーセル - 列 0GeForceGTX 980GeForce GTX 970(実測値)GeForce GTX 970(初報)
グラフィックプロセッサGM204(マクスウェル)GM204(マクスウェル)GM204(マクスウェル)
プロセス28nm28nm28nm
シェーダーユニット204816641664
テクスチャユニット128104104
ROP645664
L2キャッシュ2MB1.75MB2MB
コアクロック1126MHz1050MHz1050MHz
メモリクロック1750MHz GDDR51750MHz GDDR51750MHz GDDR5
メモリバス256ビット256ビット256ビット
メモリ帯域幅224 GB/秒196 GB/秒 (3.5 GB)28 GB/秒 (512MB)224 GB/秒
メモリ容量4ギガバイト4ギガバイト4ギガバイト
最大TDP165ワット145ワット145ワット
補助電源コネクタ2x 6ピンPCIe2x 6ピンPCIe2x 6ピンPCIe

この問題は、GeForce GTX 970 が4GBカードとして販売されているにもかかわらず、特定のケースでグラフィックメモリが3.5GBと表示されるというユーザーからの報告を受けて表面化しました。これはメモリセグメンテーションの症状であることが判明しました。カードは4GBを3.5GBの高優先度セグメントと512MBの低優先度セグメントに分割しているのです。確かに、カードは4GBのRAMにフルアクセスできます。アクセス方法も理論上の帯域幅も異なりますが、メモリはすべて利用可能であり、アクセス可能です。この手法が実際の環境で顕著なパフォーマンス低下を引き起こすかどうかはまだ分かりませんが、これまでのところ、そのような影響は見られません。

しかし、そもそもなぜメモリリソースに奇妙な分割が生じているのでしょうか? 実は、これが真の問題を示唆する手がかりなのです。NvidiaがGeForce GTX 970の技術仕様とGM204 GPUリソ​​ースについて誤った報告をしたのです。

Tom's Hardware の最高のニュースと詳細なレビューをあなたの受信箱に直接お届けします。

4つのROPパーティションのうち1つは完全に有効化されておらず、部分的に無効化されていることに注意してください。この部分的に無効化されたパーティションは、メモリコントローラのリソースがこれらのパーティションを介してリンクされるため、3.5GBと512MBという奇妙なメモリ分割の原因となっています。ROPパーティションの8分の1が無効化されているため、メモリの8分の1(512MB)には、パーティションの半分の作業領域を介して特別な方法でアクセスする必要があります。このように、セグメント化されているにもかかわらず、4GBのRAMすべてが使用可能です。その結果、3.5GBの領域には196GB/秒の帯域幅でアクセスでき、512MBの領域には28GB/秒の帯域幅が利用可能になります。この弱点が露呈する特定の状況が存在する可能性はありますが、このようなシナリオを作り出すのは驚くほど困難です。実際の仕様が判明した今、私たちはこの弱点に注目し、指摘できるようにしていきますが、これらの新しい情報は、すでに収集したベンチマーク結果を無効にするものではありません。

さらに、L2キャッシュの8分の1は使用されていません。その結果、GeForce GTX 970には56個のROP(Random Access Memory)が搭載され、チップは1.75MBのL2キャッシュにアクセスできます。これは、NVIDIAが当初プレス資料で示していた64個のROPと2MBのL2キャッシュよりも少ない値です。

どうしてこんなことが起きたのでしょうか?

同社は、これは部分的に有効化された ROP クラスターを認識していなかった技術マーケティング チーム側の誤解によるものであり、今月になってメモリの問題の調査が開始されるまで社内では問題が特定されていなかったと主張している。

こういう時こそ陰謀論が飛び交い始める。今回のケースではそれも無理はない。チップメーカーと直接契約している、高度な技術を持つGPU専門家チームが、どうしてこれほど大きなミスを犯したのだろうか?

私は陰謀論者ではありません。人間の貪欲さと愚かさは、この世のあらゆる悪の単純な説明であり、責任を負わせるためにイルミナティのような闇の組織をでっち上げる必要はないと信じています。そもそも、NVIDIAがこのようなPR上の悪夢に身をさらす動機がほとんど見当たりません。そうすることで得られるメリットや利益は全くありません。オッカムの剃刀は、端的に言って、失敗を示唆しています。

Nvidiaのエンジニアの一人が、ローンチレビューをいくつか読んだだけで、この重大な問題に気づかなかったというのは驚きです。しかし、もしあなたがそのエンジニアだったら、大規模な製品ローンチで仕様の不備があったと報道するでしょうか?もしこの矛盾に気づいたとしたら、ローンチが成功した後に世界に情報を発信するでしょうか?それとも、自分の中に留めておいて、マスコミに知られないように祈るでしょうか?

それは重要ですか?

私は全知ではありません。NVIDIAがこの件を知っていて秘密にしていたのか、それとも先週の金曜日に私たち全員に発覚したのかは分かりません。しかし、同社が嘘をついていると信じる十分な理由はありません。正直なところ、現実的な観点から言えば、それが重要かどうかは分かりません。

だからといって、GPUの仕様に関する誤った情報を信じていいと思っているわけではありません。これは私が心から情熱を注いでいるテーマです。技術系メディアがハードウェアを分析し、その内部で何が起こっているのかを解明する際に、正しい情報を得ることが重要だと考えています。NVIDIAは、このような間違いが二度と起こらないよう、努力を重ねる必要があります。

しかし、純粋に実用的な観点から言えば、エンドユーザーにとってこれは実際には何の変化もありません。GeForce GTX 970は、市場で最もお買い得なグラフィックカードの一つであり続けています。発売当初と変わらず、非常に優れたパフォーマンスを発揮しています。そのため、価格面でより優れたパフォーマンスを発揮する選択肢が登場するまで、引き続きGeForce GTX 970を推奨します。

とはいえ、裏切られたと感じている購入者の気持ちはよく分かります。NVIDIAは確かにシェアを取り戻せるだけの力を持っています。しかし、私たちにとって価格性能比は何よりも重要であり、それはGeForce GTX 970が発売されて以来、今も変わりません。

ドン・ウォリグロスキーは、Tom's Hardwareの元シニアハードウェアエディターです。CPU、GPU、システム構築、新興技術など、PCハードウェアに関する幅広いトピックをカバーしています。