73
インテルがXe LPグラフィックスの仕様を発表:Tiger Lake GPUは2倍の速度

インテルの次世代Tiger Lakeプロセッサを搭載したノートパソコンが、グラフィックス性能を大幅に向上させて間もなく登場します。Tiger Lakeの統合GPUには、Team Blueの最新グラフィックスアーキテクチャ(Gen12)の低消費電力版である、待望のXe LPグラフィックスが採用されます。このアーキテクチャは数年にわたる開発期間を経ており、インテルがディスクリートグラフィックスカード市場への参入(あるいは再参入)を目指す意欲は、すべてXeアーキテクチャに基づいています。2018年、インテルはクライアントワークロードからデータセンターまで、「テラフロップスからペタフロップスまで」拡張可能な全く新しいアーキテクチャを開発する意向を発表しました。 

Xeには複数の実装があり、それぞれについて個別に解説してきました。Xe Graphicsについて私たちが知っていることはすべて概要を網羅しており、Xe HPとXe HPCはデータセンター向け、そして新たに発表されたIntel Xe HPGは、AMDやNvidiaのGPUに代わる魅力的な選択肢を求める愛好家やゲーマー向けのGPUです。しかし、ここではIntelの10nm SuperFinプロセスで構築された、主にラップトップとモバイルソリューション向けの統合型エントリーレベルグラフィックスソリューションであるXe LPに焦点を当てましょう。

インテルアーキテクチャ

(画像提供:Intel)

Intelによると、全体的な効率性の向上により、Xe LPは、パフォーマンスの全範囲において、以前のGen11グラフィックス(Ice LakeモバイルCPUで使用)を上回る性能を実現しています。より高い周波数で動作可能ですが、さらに重要なのは、同じ電圧でそれらの高い周波数とパフォーマンスを実現できることです。あるいは、より低い電圧でGen11と同等のパフォーマンスを提供し、消費電力を削減することも可能です。

もちろん、まだいくつかの制約があります。Xe LPは必ずしもすべてを同時に実行できるわけではありません。これは製品の実装に依存し、10Wまたは15Wのデバイスでは電力制限のために最大クロックを維持できない可能性があります。Ice Lakeの統合グラフィックスをテストした際にも、TDP制限を15Wから25Wに引き上げることで、Gen11グラフィックスは約35%高速化しました。いずれにせよ、Xe LPはより効率的なアーキテクチャを備えており、特にラップトップにとって非常に有益となるはずです。それでは、IntelがGen11と比較してどのような変更を加えたのか、そして機能とパフォーマンスの面で何が期待できるのかを詳しく見ていきましょう。 

Tom's Hardware の最高のニュースと詳細なレビューをあなたの受信箱に直接お届けします。

インテルアーキテクチャ

(画像提供:Intel)

ブロック図を見れば、最大の変更点は一目瞭然です。Xe LPは最大構成でEU(実行ユニット)が50%増加しています。Ice LakeのGen11グラフィックスは最大64EUだったので、計算リソースが即座に大幅に増加します。これにクロック周波数の上昇を組み合わせると、多くのワークロードでXe LPがGen11の約2倍の速度を発揮するはずです。ただし、この速度向上が、エンジンの大型化とクロック周波数の上昇によるものと、アーキテクチャの強化によるものとでどの程度の割合を占めるかは、まだ完全には明らかではありません。実際のハードウェアが入手できたら、ぜひテストしてみたい点の一つです。

ここで言うハードウェアとは、今後ノートPCに搭載されるTiger Lake CPUのことです。IntelのDG1グラフィックカードは既に存在し、IntelのDev Cloud経由でクラウドテスト環境の「早期アクセス」として利用可能です。Xe LP専用GPUも開発中とのことですが、低価格の専用GPUにはあまり興味がありません。潜在的なユースケースがないわけではありませんが、現在の噂に基づくと、ゲーミングソリューションというよりはメディアソリューションとしての方が適していると思われます。IntelはXe HPG搭載の専用グラフィックカードも発売する予定ですが、前述の通り、これについては別の記事で取り上げています。

現時点では、Gen11と比較したXe LPのアーキテクチャ変更の多くは、効率の向上、つまり非常に重要なワット当たり性能指標の向上を目的としているように見えます。EUが50%増加し、クロック周波数が高くなっても、消費電力が大幅に増加するのであれば、パフォーマンスの向上には全く意味がありません。Intelは、あらゆる比較でGen11の2倍の性能が実現できるとは言っていませんが、Xe LPは特定の電力エンベロープ内で確実により高い性能を実現できるでしょう。

画像

1

10

インテルアーキテクチャ
(画像提供:Intel)

EUが50%増加しただけでなく、Intelは基盤となるアーキテクチャの多くを刷新しました。Gen11グラフィックスには、それぞれ4ワイドのALU(算術論理ユニット)が2つ搭載されており、1つはFP/INT(浮動小数点と整数)をサポートし、もう1つはFP/EM(拡張数学 — 三角関数、対数、平方根、その他の複雑な数学など)をサポートしていました。各EUには、独自のスレッドコントローラ、スレッド状態とレジスタファイル、送信ユニット、分岐ユニットが搭載されていました。Xeグラフィックスでは、各EUにFP/INTを実行できる8ワイドのベクターユニットが1つと、FP/INTパイプラインと並行して実行できる独立したEMユニットが搭載されています。また、2つのEUが1つのスレッドコントローラを共有することで、ダイ面積と消費電力を節約しています。

基本的に、IntelのGPUはこれまでかなり狭い範囲しかカバーしていませんでした。Nvidiaの現在のアーキテクチャは、ワークロードを基本的に32幅のベクトル命令に分割します。AMDのNaviにおける大きなアップデートの一つは、GCNの64幅ウェーブフロントからデュアル32幅ウェーブフロントへの移行でした。比較すると、4幅のEUは非常に狭く、8幅に移行することで効率が向上するはずです。Xe HP/HPGはより高いパフォーマンス目標を掲げているため、16幅、あるいは32幅に移行するかどうかは疑問です。

8つのALUパイプラインすべてにFPとINTを組み込んだことで、整数演算性能もGen11と比較して2倍に向上しました。Intelはまた、2倍のINT16演算と4倍のINT8演算(それぞれ16ビット整数と8ビット整数)のサポートも追加しました。これらは主に推論アプリケーションで有用であり、高精度が必ずしも必要ではありません。これは実際には、Gen11で削減されたINT演算リソースの削減を覆すものですが、ソフトウェアの変更に伴い、IntelはGPUにINT演算を再び追加することが正しい判断であると判断しました。これは、NvidiaがTuringアーキテクチャにFPとINTの同時演算サポートを追加した際に行ったことと似ています(ただし、Xe LPはINT + FPの同時演算をサポートしていません)。

Xe LP の新機能は L1 キャッシュで、レイテンシが短縮され、L3 キャッシュへの要求が軽減されます。以前は Gen11 ではテクスチャ サブシステムにキャッシュがありましたが、より汎用的な L1 キャッシュ設計に移行したことで、柔軟性が向上しました。最大 L3 キャッシュ サイズも 16MB に倍増しましたが、これはおそらく Ice Lake の L3 が最大 8MB しかなかったことが一因でしょう。Ice Lake のコア数が多いデスクトップ版があれば、L3 キャッシュも大きくなっていたでしょう。注目すべきは、Tiger Lake の開示情報で Intel が統合型 Xe LP には 3.8MB の L3 キャッシュがあり、CPU には GPU に対して LLC (最終レベル キャッシュ) として機能する最大 12MB のキャッシュがあることも明らかにしたことです。LLC とシステム メモリへのグラフィックス インターフェイスも倍増し、64 バイト/クロックのチャネルが 2 つになりました。繰り返しになりますが、帯域幅の拡大とレイテンシの低減により、グラフィックス パフォーマンスが大幅に向上するはずです。

また、IntelのDG1チップは、Tiger Lakeに統合されているXe LPソリューションとは明らかに異なる点にも留意しておきましょう。Intelは詳細なスペックを公開していませんが、DG1テストカードは3GBのGDDR6と96個のEUを搭載しているとの報道があります。DG1にはCPUが搭載されていないため、L3キャッシュサイズなど、チップの他の部分が変更される可能性があります。DG1とXe LP専用ソリューションの今後の展開を見守る必要があります。

最後に、Xe LPはエンドツーエンドのデータ圧縮をサポートします。これが何を意味するのか詳細を尋ねたところ、IntelのDavid Blythe氏は、これはAMDやNvidiaが採用しているデルタカラー圧縮を超えるものだと述べました。エンドツーエンドの圧縮では、ほとんどのユースケースにおいて、解凍イベントはワークフローから完全に排除されないまでも稀であり、ソースからシンクまで圧縮されたデータを送ることができます。これにより、ゲームストリーミング(レンダリングとビデオエンコード)、ビデオチャット録画(カメラとビデオエンコード)など、ますます普及しつつある相互運用シナリオにおいて、帯域幅と電力特性が向上します。Intelのエンドツーエンド圧縮は、あらゆるAPIと事実上すべてのエンジンにわたって圧縮を統合する初のソリューションです。

Xe LPは、最大LPDDR4x-4267およびLP5-5400(Tiger Lake)をサポートすることで、メモリ帯域幅が拡大する可能性があるだけでなく、その帯域幅をより有効に活用できます。デュアルチャネルDDR4-3200システムメモリ構成では「わずか」64GBpsの帯域幅しか提供されませんが、Xe LPに必要なデータを供給するには実際には十分かもしれません。

より大きく、より速く、より良く。これがXe LPの真髄です。なぜもっと大きくならないのか疑問に思う方もいるかもしれませんが、それは電力目標に起因しています。IntelはXe LPの最大TDP構成を明らかにしていませんが、Tiger LakeはIce Lakeと同様の道を辿ると予想されます。Ice Lakeの製品群を見ると、TDPは9Wから28Wまでの範囲で、ブースト電力は短時間でそれを超えることもありました。28WでもGen11グラフィックスは電力制約に陥り始めていたため、IntelはEUを増やすだけでなく、ワットあたりのパフォーマンスの向上に注力したと考えられます。

ダイサイズも考慮する必要がありますが、基本的に128個以上のEUカウントを持つ統合GPUは実現不可能だと思います。AMDのRenoirはVega 8を採用しており、これは多くの点でXeに似ています。AMDは512個のシェーダコア(ALU)を搭載し、それぞれが1クロックあたり1つのFMA命令(2FLOPS)を実行でき、最大2.1GHzで動作します。Xe LPは768個のALUを搭載し、それぞれが1つのFMA命令を実行でき、おそらく1.5GHz程度で動作します。2つのGPUは確かに同じではありませんが、最終的にはほぼ同じサイズ、つまり2.1TFLOPS程度の演算性能になります。

画像

1

4

インテルアーキテクチャ
(画像提供:Intel)

Xe LP には他にも変更点があります。Xe LP ディスプレイエンジンは、DisplayPort 1.4b および HDMI 2.0 機能を備え、最大 4 台のディスプレイをサポートします。(関連記事: DisplayPort vs. HDMI ) これは、DisplayPort を使用した 4K 60Hz HDR には十分であり、DSC (クロマ圧縮) を使用する場合は 8K にも十分です。HDMI は 8K60 に制限されていますが、ノート PC ユーザーにとってはそれほど問題にならないと思います。私はまだ、より高いリフレッシュ レートで 4K ディスプレイを駆動できる GPU を入手しようとしているため、8K にはまだ熱心ではありません。とはいえ、DisplayPort 2.0 と HDMI 2.1 はどちらも 1 年以上前に標準化されたため、Intel がサポートしなかったのは少し残念です。Adaptive Sync も、最大 360 Hz のリフレッシュ レートでサポートされています (DisplayPort では最大 240 Hz、HDMI ではおそらく 240 Hz)。

次に、アップデートされたXe LPメディアエンジンは、Gen11の2倍のエンコード/デコードスループットを備え、Gen11にはなかったAV1デコードアクセラレーションをフルに搭載しています。最大4台の4K60ディスプレイをサポートすることで、Intelはメディアエンジンをアップグレードし、低スペックのXe LPソリューションでも4K60 HEVCコンテンツを4つの出力すべてに出力できるようになりました。Xe LPは、最大7つの4K60 HEVCストリームを同時にデコードし、最大3つの4K60 HEVCストリームをエンコードまたはトランスコードできます(CPUベースのエンコード品質よりも優れています)。

メディアストリーミングの優れた性能を活かし、IntelはXe LPチップを4基搭載し、Xeの強化されたメディア機能を活用したデータセンターメディアアプリケーションに特化したSG1(Server Graphics 1)製品の発売も計画しています。この製品は、最大28本の4K60ストリームのデコード、または12本の4K60ストリームのエンコード/トランスコードに対応します。

最後に、IntelはTiger Lake搭載ノートPCでOpenVINOワークロードを実行し、GPUコンピューティングとDL Boostを活用したAIアルゴリズムによる画像のアップスケールを実現したデモを行いました。このテストでは、Tiger Lake搭載ノートPCはIce Lake搭載ノートPCの2倍以上の速度を示しました。これが他のアプリケーションでどのように機能するかはまだ分かりません。

画像

1

16

インテルアーキテクチャ
(画像提供:Intel)

もちろん、Intelのドライバーに問題が残っている限り、Xe LPの機能強化はゲーマーにとってあまり意味をなさないでしょう。ここ1、2年で状況は確かに改善しており、Ice Lake Gen11ノートPCの統合グラフィックスを最近テストしたところ、テストした9つのゲームすべてが動作し、1つを除いてすべて25W TDPを適用した状態で720pで30 fpsを達成できたことを嬉しく思います。ちなみに、Gen9.5グラフィックス(Coffee Lake RefreshのUHD Graphics 630)では9つのゲームのうち3つだけが30 fpsを超え、Core i7-4770K(Gen7 HD Graphics 4600)では1つのゲームも30 fpsを達成できませんでした。

だからといって、Intelがドライバーに関してまだ改善の余地がないというわけではありません。新しいゲームは定期的にリリースされており、それらのゲームが適切に動作することを保証することは、どのGPU企業にとっても継続的な課題です。Intelはすでにドライバーチームに変更を加えており、Xe LPではさらなる機能強化が予定されています。その一つとして、シェーダーコンパイラーの作業をハードウェアではなくソフトウェアに移行することが挙げられます。Intelによると、これにより最適化の機会が向上し、ハードウェアの複雑さが軽減されるとのことです。

Intelは、ゼロから構築された新しいDirectX 11ドライバーもリリースする予定です。DirectX 11を採用していない新作ゲーム(Doom Eternal、Red Dead Redemption 2、Death Stranding、Horizo​​n New Dawnなど)の数を考えると、これは少し奇妙です。とはいえ、DX11はサポートの容易さから人気のAPIです。しかし、次世代コンソールがレイトレーシングのサポートを追加するため、将来のゲームはDirectX 12またはVulkan RTのいずれかを使用する可能性がはるかに高くなります。レイトレーシングにはどちらか一方が必要なため、より多くのゲームエンジンがDX12またはVulkanRTに完全に移行すると予想されます。

Intelのドライバ戦略におけるもう一つの興味深い側面、そしてAMDやNVIDIAが模倣すればメリットとなる可能性のあるのが、「インスタント・ゲーム・チューニング」です。これは、エンドユーザーに全く新しいドライバをダウンロードしてインストールさせることなく、最新のプロファイルと最適化を提供するという考え方です。これによりアップデートが大幅に高速化され、パフォーマンスと互換性が向上することが期待されますが、実際に機能するかどうかを評価するには、しばらく動作を確認する必要があります。

Intelは、ゲームストリーミングとゲームシャープニングのアルゴリズムをドライバーに追加しています。どちらもオーバーヘッドは低いはずです。これは、IntelがGPUとドライバーの標準機能に関してAMDとNVIDIAに追いついていることを意味しますが、今日のゲーム環境では必須の機能です。

終わりに

繰り返しになりますが、これらはすべてIntelのXe LPグラフィックスソリューションに主に当てはまります。本格的なゲーマーは、Intelが提供するXe HPGソリューションにはるかに興味を持つでしょうが、そこで何が起こっているのかについては、まだほとんど詳細が分かっていません。Xe LPよりもはるかに高速でありながら、ここで説明した他のXe拡張機能の恩恵も受けているはずですが、実際のパフォーマンスは2021年まで分かりません。

Tiger LakeとXe LPについては、Intelが9月2日に新CPUを発売する見込みです。発売後どれくらいでラップトップが登場するのでしょうか?Intelのパートナー企業次第ですが、新学期(バーチャル)シーズンが本格化する中で、購入可能な選択肢が豊富になると予想されます。個人的には、TDP28Wの手頃な価格のモデルが手に入ることを心待ちにしています。薄型軽量でありながらゲームもプレイできるソリューションとして、十分な性能を発揮してくれるはずです。Tiger Lakeが入手でき次第、Xe LPのベンチマークテストを実施しますので、ご安心ください。 

ジャレッド・ウォルトンは、Tom's Hardwareのシニアエディターで、GPU全般を専門としています。2004年からテクノロジージャーナリストとして活躍し、AnandTech、Maximum PC、PC Gamerなどで執筆活動を行っています。初代S3 Virgeの「3Dデセラレータ」から最新のGPUまで、ジャレッドは最新のグラフィックストレンドを常に把握しており、ゲームパフォーマンスに関する質問は彼にお任せください。