Steamroller、GCN、HSA、28 nm: おやまあ!
今年のCESは、これまでで最もクレイジーな旅でした。ラスベガスに2日早く到着し、滞在は1日遅れ、早朝から夜遅くまで続くスケジュールの中に50近くの会議を詰め込みました。しかし、最終的には2014年に登場してくるであろうテクノロジーをしっかりと把握することができました。中には明らかに進化を遂げるものもありますが、OculusのCrystal Coveプロトタイプのように、PCゲームを根本的に良い方向に変えていくものもあるでしょう。
AMDはCESでKaveriについて語りました。理論上は、愛好家にとって興味深い設計であるはずです。Steamrollerベースのx86コアを搭載し、話題となる新しいプロセッサアーキテクチャが誕生しました。また、AMD自慢のGraphics Core Next設計がAPUに採用されるのは今回が初めてです。同社は、コンピューティングリソースとソフトウェア開発者間の連携を向上させるため、ヘテロジニアスシステムアーキテクチャ(HSC)機能の実現に多大な労力を費やしました。さらに、GlobalFoundries社の新しい28nm製造プロセスを採用しています。
もちろん、結局のところ、アーキテクチャと AMD の Kaveri のビジョンを慎重に検討した後、最も重要なのは、この APU ファミリーが、以前の製品や同じ分野における Intel の最高の努力とどのように比較されるかということです。
より優れたコンピューティングデバイスの構築
「統合」という言葉はよく使われますが、多くの場合、否定的な意味合いを帯びています。統合グラフィックスって、ちょっと…? でも、統合は複雑なテクノロジーをより手頃な価格にする上で重要な要素です。多くの場合、パフォーマンスに非常に大きな効果をもたらします。そして、消費電力にも一般的に正の相関関係があります。AMDのAPUは複数のサブシステムを組み合わせることで、プログラマブルロジックと固定機能ロジック間の高速データ移動を可能にし、柔軟性を最大限に高め、理想的には、要求の厳しいワークロードを手頃な価格のハードウェアで実行できるようにしていることは、今では誰もが知っています。
Kaveriが複数のx86コア、グラフィックス処理、メモリ制御、キャッシュ、ハードウェアベースのアクセラレータ、そしてPCI Express接続を単一のシリコンチップに搭載しているのは当然のことです。前身の製品も同様に充実した機能を提供していました。しかし、Kaveriをパズルに例えると、AMDは各ピースを微調整することで、完成品に最新のテクノロジーとより高度な製造技術を反映させ、あらゆるワークロードに最適なリソースを活用するという同社のビジョンに向けた新たな一歩を踏み出しました。
このアプローチの1つの要素は、リソグラフィの見直しでした。AMDはGlobalFoundriesと提携して、32nm SOIから28nmバルクシリコンプロセスに移行しています。現在、関連する利点と欠点があります。以前、AMDはCPU向けに最適化された技術を使用してAPUを構築していました。これにより、A10-6800Kなどのチップは、Turbo Coreを通じて最高4.4GHzのクロックレートを達成できました。しかし、低密度、低抵抗、そして最終的にはより高い周波数へのチューニングは、AMDがダイに収めることができるトランジスタの数に悪影響を及ぼし、GPUの複雑さを制限していました。ユーザー入力を待つワークロードではx86コアが「十分高速」であると見なされている世界では、スケールを密度へとスライドさせる決定が下されました。AMDはこれをAPUに最適化されていると呼んでいますが、要するに、より低速で抵抗の高いトランジスタを使用して、面積利用率を向上させているのです。
Tom's Hardware の最高のニュースと詳細なレビューをあなたの受信箱に直接お届けします。
その結果、x86コアの周波数は低下し、KaveriとRichlandの比較からもそれが分かります。AMDは、PiledriverアーキテクチャからSteamrollerへの移行でこれを補っていると述べています。IPC(各コアが1サイクルあたりに実行する作業量)の向上に重点を置くことで、最大20%の性能向上が見込まれており、ほとんどのx86ワークロードにおいてKaveriはプラスの性能を発揮します。
一方、APUはより強力なグラフィックスサブシステムを搭載し、GCNアーキテクチャに基づいて最大512個のシェーダーを搭載しています。Richlandは、前世代のVLIW4 ALUを384個搭載していました。トランジスタ資源をGPUに再配分することで、AMDがターゲットとするパフォーマンス重視のワークロード(ゲーム、マルチメディア、コンテンツ制作)への対応力が向上し、より汎用的なタスクでは現状維持を実現しています。
総じて言えば、Kaveriは24.1億個のトランジスタを245平方ミリメートルに詰め込んだSoCです。Richlandはほぼ同じサイズ(246平方ミリメートル)でしたが、トランジスタ数はわずか13億個でした。いかがですか? 今では、10億個以上のトランジスタを搭載したプロセッサは、ありきたりなものと見なしています。しかし、これはAMDがGPUに重点を置いたダイに最適化された28nmバルクシリコンへの移行の影響を示しています。
今日のカヴェリ家
2つのモデル(A10-7850KとA10-7700K)は即時出荷が予定されており、3つ目のモデル(A8-7600)は2014年第1四半期に発売される予定です。フラッグシップモデルの価格は173ドルです。つまり、多くの機能が追加されますが、A10-6800Kと比較して22%高い価格となります。-7700Kでさえ、前世代の最高速モデルである152ドルよりも高価です。-7600は正式発売に先立ち、119ドルで販売される予定です。
スワイプして水平にスクロールします
ヘッダーセル - 列 0 | A10-7850K | A10-7700K | A8-7600 |
---|---|---|---|
グラフィックレベル | ラデオンR7 | ラデオンR7 | ラデオンR7 |
TDP | 95ワット | 95ワット | 65/45 W |
CPUコア | 4 | 4 | 4 |
CPUベースクロックレート | 3.7GHz | 3.4GHz帯 | 3.3 / 3.1 GHz |
最大ターボコアクロックレート | 4GHz帯 | 3.8GHz | 3.8 / 3.3 GHz |
GPUシェーダー | 512 | 384 | 384 |
GPUクロックレート | 720MHz | 720MHz | 720MHz |
「コンピューティングコア」 | 12 | 10 | 10 |
価格 | 173ドル | 152ドル | 119ドル |
発売されたばかりの Kaveri ベースの APU は両方とも 95 W の部品です (皮肉なことに、AMD は熱上限についてあまり懸念していないようです)。
A10-7850Kは、2つのSteamrollerモジュールと512個のシェーダーを搭載しています。プロセッサのベースクロックレートは3.7GHzですが、軽スレッドのアプリケーションでは最大4GHzまで到達します。一方、R7グラフィックエンジンは720MHzで動作します。
実際、Kaveriの3つのモデルはすべて720MHzのGPUを搭載しています。A10-7850Kと他の2つのSKUの最大の違いはシェーダー数です。A10-7700KとA8-7600はどちらも384基を搭載しています。-7700は3.4GHzのベースクロックで動作し、適切な熱条件下では最大3.8GHzまで上昇します。
A8-7600 は、TDP を手動で 65 W または 45 W に設定できるという点でユニークです。 熱上限が高いため、ベース クロックは 3.3 GHz、ピークは 3.8 GHz になり、45 W 設定では APU は 3.1 GHz と 3.3 GHz の間でサイクルを維持します。
Kaveri ベースの APU は、Socket FM2+ という新しいインターフェイスに搭載されます。AMD の A88X、A78、A75、A55 Fusion コントローラー ハブを採用した互換マザーボードは既に登場していますが、Socket FM2+ で適正な価格帯を実現するのは各ボード ベンダーの責任です。Socket FM2 ベースの APU を FM2+ 搭載ボードで使用することはできますが、その逆はできません。Kaveri ダイのブロック図には、PCI Express 3.0 コントローラー (現在ラボにあるマザーボードを考えると、おそらく 16 レーンの接続が可能)、最大 4 つのディスプレイ出力のサポート、CrossFire 用の AMD の Hawaii GPU に搭載されているものと同じ XDMA エンジン (この場合はデュアル グラフィックス機能を有効にします) も搭載されています。マルチ GPU レンダリングについては、本日のストーリーで後ほど詳しく説明します。
現在のページ: Steamroller、GCN、HSA、28 nm: Oh My!
次のページ コンピューティングコアの紹介
クリス・アンジェリーニは、Tom's Hardware USの名誉編集者です。ハードウェアレビューの編集を担当し、注目度の高いCPUやGPUの発表を取り上げています。