20
Snapdragon 810 パフォーマンスプレビュー

建築

建築

Snapdragon 810の大きな特徴は、64ビットCPUアーキテクチャへの移行です。しかし、810にはアップデートされたGPU、全く新しいメモリインターフェース、そして全く新しいGobiモデムが搭載されています。このGobiモデムこそが810の最大の技術的飛躍であり、キャリアアグリゲーションにより最大450Mbpsのカテゴリー9 LTE速度をサポートします。Snapdragon 805のモデムはSoCアイランドから外されましたが、810ではモデムがSoCアイランドに戻されたため、消費電力とコストの両方の削減が期待されます。

スワイプして水平にスクロールします

クアルコムのSnapdragon 8xxファミリー
行0 - セル0スナップドラゴン810スナップドラゴン805スナップドラゴン801スナップドラゴン800
製造工程20nm28nm HPm28nm HPm28nm HPm
CPU4x ARM Cortex-A57 @ 2.0GHz + 4x ARM Cortex-A53 @ 1.5GHz (big.LITTLE)Qualcomm Krait 450(2.65GHz)×4Qualcomm Krait 400 4基(最大2.45GHz)Qualcomm Krait 400 4基(最大2.26GHz)
建築ARMv8-A (32/64ビット)ARMv7-A (32ビット)ARMv7-A (32ビット)ARMv7-A (32ビット)
グラフィックプロセッサクアルコム Adreno 430 @ 600MHzクアルコム Adreno 420 @ 600MHzQualcomm Adreno 330(最大578MHz)クアルコム Adreno 330 @ 450MHz
メモリインターフェースLPDDR4-1600 2x 32ビット (25.6GBps)LPDDR3-800 2x 64ビット (25.6GBps)LPDDR3-800/933 2x 32 ビット (12.8/14.9GBps)LPDDR3-800 2x 32ビット (12.8GBps)
カメラISP14 ビット デュアル ISP (1.2GP/s スループット、最大 55MP の画像センサー)12 ビット デュアル ISP (1.2GP/s スループット、最大 55MP の画像センサー)デュアルISP(930MP/sスループット、最大21MPの画像センサー)デュアルISP(640MP/sスループット、最大21MPの画像センサー)
DSPヘキサゴン V56 @ 800MHzヘキサゴン V50 @ 800MHzヘキサゴン V50 @ 800MHzヘキサゴン V50 @ 680MHz
統合モデムMDM9x??、LTE Cat 9、最大450 Mbps-MDM9x25、LTE Cat 4、最大150 MbpsMDM9x25、LTE Cat 4、最大150 Mbps

CPU

Snapdragon 810は、QualcommのカスタムKrait CPUアーキテクチャから離れ、Marvell、MediaTek、Nvidiaなどの他のSoCベンダーに倣い、ARMの標準64ビットコアを採用しました。具体的には、810は4つのCortex-A57コアと4つのCortex-A53コアをbig.LITTLEヘテロジニアス構成で採用しており、OSスケジューラは8つのコアすべてを利用できます。2つのCPUクラスターは、ARMのCCI-400キャッシュコヒーレントインターコネクトによって接続されています。これらのCPUはどちらも現時点では既知のものなので、ここでは主な機能のみをレビューします。

Cortex-A57はCortex-A15の後継機です。A15は新しいアーキテクチャでしたが、A57はA15の設計にわずかな変更を加えただけです。A57も投機的発行スーパースケーラの15ステージ以上のパイプラインを備えており、最初の12ステージ(フェッチ/デコード)はインオーダー、最後の3~12ステージ(発行/実行)はアウトオブオーダーです。IPCもA15から変更されておらず、1サイクルあたり最大3命令のデコード、最大8命令の発行、最大3命令のリタイア(8つのパイプラインはそれぞれ長さが異なります)が可能です。これは、AppleのA7(おそらくA8)やNvidiaのDenver(実際には動的コード最適化によって2~7幅のコア)の半分です。コアが達成できる命令並列性のレベルに影響を与える命令リオーダーバッファは、最大128マイクロオペレーション(MOP)を保持します。これはA15と同じですが、AppleのA7(おそらくA8)やIntelのHaswellデスクトップアーキテクチャが保持する192マイクロオペレーションよりも少ないです(Denverにはハードウェアリオーダーバッファはありませんが、変換ソフトウェアがリオーダー処理を行い、1000以上の命令を並列性のために検査します)。L1命令キャッシュは、A15の32KBに対して48KB(48エントリTLB)に拡張されますが、データキャッシュ(32エントリTLB)はA15と同じ32KBのままです。L1キャッシュは共有L2キャッシュによってバックアップされています。

Cortex-A57(出典:ARM)

Cortex-A57(出典:ARM)

big.LITTLEセットのもう1つのCPUコアは、Cortex-A7アーキテクチャをベースにしたCortex-A53です。A57は高性能を目的とした複雑なアウトオブオーダーコアであるのに対し、A53は低消費電力に最適化された非常にシンプルなインオーダーコアです。A53は8ステージの短いパイプライン(Snapdragon 810に搭載されているオプションのAdvanced SIMDモジュールは合計10ステージを使用し、浮動小数点演算の実行に必須)を備え、ほとんどの命令で対称型デュアル発行を実現しています。ARMは、同一プロセスノード上でA53がCortex-A9と同等のパフォーマンスを発揮すると主張しています。

Cortex-A53(出典:ARM)

Cortex-A53(出典:ARM)

A57 と A53 はどちらも、置換する CPU と多くの低レベル機能を共有していますが、新しい 64 ビット AArch64 アーキテクチャと A64 命令セットのサポートが追加されています。64 ビットに移行する最も明白な利点は、4 GB を超える物理 RAM をアドレス指定できることです。これは、CPU と GPU の両方が同じシステム RAM を共有するモバイル デバイスではますます重要になっています。32 ビットの A15 では既に、32 ビットの仮想アドレス空間を 40 ビットの物理アドレス空間に 4 KB のページ解像度でマッピングする Large Physical Address Extensions (LPAE) が使用されています。これにより、Windows プログラムが 32 ビット x86 で動作していたのと同様に、複数のアプリがそれぞれ最大 4 GB のメモリを同時に参照できます。ARMv8-A では、仮想アドレス空間と物理アドレス空間の両方で 48 ビットをサポートすることで、メモリ アドレスの制限が緩和されます。完全な64ビットアドレス空間はまだ必要ありません(x86-64も48ビットのユーザー空間アドレスを使用しています)。アドレス空間を制限することでハードウェアが簡素化され、消費電力も削減されます。新しいアーキテクチャは、従来の4KBに加えて64KBのページサイズをサポートしているため、42ビットアドレスを使用する場合、ページテーブルウォークが4レベルから2レベルに削減されます。

4GBを超えるRAMを搭載したスマートフォンやタブレットが登場するのは、少なくとも2016年までは難しいでしょう。しかし、64ビットへの移行によって、他のパフォーマンス向上も期待できます。レジスタは64ビット幅になり、その数も増加しました。汎用レジスタは14個から32個に、SIMD/浮動小数点レジスタは16個から32個に増加しました。ARMによると、これらのレジスタ増加により、コンパイラはループ展開を実行するための余裕が生まれ、「さまざまなソフトウェアコードで一般的になりつつある、ますます複雑化するアルゴリズムに対応する、より優れたスケジューリングオプション」が提供されるとのことです。

ARMは既存の32ビットデコードテーブルを改変するのではなく、64ビット命令に独自のデコードテーブルを与えました。扱いにくい大きなテーブルを1つではなく、シンプルなテーブルを2つにすることで、ハードウェア実装が簡素化され、分岐予測やJITコンパイラ(JavaScript)の高速化のためのその他の手法が容易になり、Webブラウジングの高速化に役立ちます。

Tom's Hardware の最高のニュースと詳細なレビューをあなたの受信箱に直接お届けします。

ARMは64ビット命令セットアーキテクチャ(ISA)の開発にも同様のアプローチを採用しました。AMDがx86で行ったようにA32 ISAを拡張するのではなく、ARMは全く新しい、合理化されたA64 ISAを開発しました。これにより、ハードウェア実装はさらに簡素化され、消費電力も削減されます。例えば、メモリシステムの複雑さを増大させるロード/ストア命令は削除され、電力コストに見合うメリットがない条件付き命令もいくつか削除されました。

A64は、IEEE754-2008規格を満たすための高度なSIMD機能も提供します。これには、ベクトルによる倍精度浮動小数点値の処理や、新しい数値丸め命令などが含まれます。SIMDレジスタ幅も、AArch32の64ビットから128ビットに拡張されました。

この情報に基づいて、Snapdragon 810は、以前のSnapdragon 80x SoCよりも優れたCPUパフォーマンスを提供するでしょうか?一般的に、特に64ビットコードを実行する場合は、答えは「はい」です。Krait 400/450は基本的に、低消費電力および/または高クロック周波数向けに最適化されたA15の簡易版です。IPCはA15/A57に似ており、同じ3ワイドフロントエンドですが、実行ポートが1つ少なくなっています。Kraitの整数パイプラインも短く、40マイクロオペレーションしか保持しない非常に小さい命令並べ替えバッファと、L1キャッシュも小さくなっています。実行ポートが1つ少なく、並べ替えバッファが小さいため、全体的なスループットは間違いなく低下しますが、Kraitの短いパイプラインと高いクロック速度により、分岐予測ミスからの回復が速くなります。

消費電力はどうでしょうか?他の条件が同じであれば、A57はより複雑なため、消費電力は高くなります。しかし、スリープモードへの移行、電力効率の高いA53コアへのタスクのオフロード、そしてより微細な20nmプロセスで製造されていることで、Kraitと比較して消費電力のペナルティを軽減できるはずです。

グラフィックプロセッサ

Snapdragon 810に搭載されているCPUについてはかなり多くの情報が知られていますが、Adreno 430 GPUについてはほとんど情報がありません。Qualcommはアーキテクチャの詳細を一切公開しておらず、前世代のAdreno 420と比較してパフォーマンスが30%向上し、消費電力が20%削減されるという漠然とした主張をしているだけです。420はアーキテクチャが大幅に刷新されているため、430は420の改良版であると考えて間違いないでしょう。

昨年、Adreno 420はOpenGL ES 3.1(およびAndroid Extension Pack)、OpenCL 1.2、DirectX 11機能レベル11_2のサポートに加え、ジオメトリシェーダー、ダイナミックハードウェアテッセレーション、アダプティブスケーラブルテクスチャ圧縮(ASTC)のサポートを追加しました。これらの機能はすべて430にも引き継がれています。

Snapdragon 805のプレビューでは、メモリ帯域幅の大幅な増加と、Adreno 420のテクスチャキャッシュおよびL2キャッシュの大型化が、より多くのテクスチャユニットとシェーダーユニットに供給されている可能性が高いことを指摘しました。これはベンチマーク結果によって裏付けられています。20nmプロセスへの移行により、十分なメモリ帯域幅とより広いダイ面積が利用可能になったため、Adreno 430ではより多くのシェーディングリソースが追加される可能性があります。

Galaxy Note 4やNexus 6など、Snapdragon 805搭載デバイスで気づいた点の一つは、ゲームをプレイしている際にサーマルスロットリング(熱による性能低下)が顕著になることです。多くの場合、サーマルスロットリングによって、420が旧型のAdreno 330に対して持つ性能上のメリットが打ち消されてしまいます。430は、より微細なプロセスへの移行によって、トランジスタ数の増加(おそらく)による消費電力のペナルティを少なくともいくらか相殺できるはずです(Qualcommは他にも省電力化のための調整をいくつか行っている可能性が高いでしょう)。しかし、特にオールプラスチック製のスマートフォンでは、430でもサーマルスロットリングの問題は依然として残るでしょう。

メモリ

Snapdragon 805は、64ビットデュアルチャネル(合計128ビット)バスを介してLPDDR3-800メモリにアクセスし、25.6GBpsのメモリ帯域幅を実現します。これは、Snapdragon 801とApple A8の14.9GBpsを大幅に上回ります。Snapdragon 810では、メモリ帯域幅は変わりませんが、32ビットデュアルチャネル(合計64ビット)のLPDDR4-1600インターフェースに移行しています。

LPDDR4は、完全に再設計されたアーキテクチャを採用し、16ビットチャネルを2つ(LPDDR3では16ビットチャネル1つ)に増やすことでメモリアレイとI/Oパッド間の信号伝送距離を短縮し、消費電力を削減するとともに、より高い信号周波数を実現しています。また、この新しいメモリは、低電圧スイング終端ロジック(LVSTL)I/O信号伝送を採用しており、LPDDR3と比較して電圧を50%低減しています。これらの機能強化により、データレートの向上(Snapdragon 805では、より広い128ビットバスを使用することで既に実現)と消費電力の35~40%削減が実現されています。

アンコア

Snapdragon 810 は、最大 55MP のイメージセンサーと 1.2GP/s の合計スループットをサポートするデュアル 14 ビット ISP 設計を採用しており、これは 805 の機能を反映しています。810 には、Dolby Atmos と最大 24 ビット/192kHz の音楽再生をサポートする新しい Hexagon V56 DSP が搭載されています (別途オーディオ コーデックのサポートまたは外部 DAC への USB パススルーが必要です)。

Qualcommは4Kビデオの強力な支持者であるため、Snapdragon SoCが完全な4Kビデオサポートに向けて明確な進歩を見せているのは当然のことです。Snapdragon 800/801はUltra HD H.264ビデオをハードウェアでエンコード/デコードできますが、H.265(HEVC)は完全にソフトウェアで処理されます。805は4K H.265ビデオのハードウェアデコードを追加し、810は4K H.265ビデオのハードウェアエンコードを追加することでUltra HDへの移行を完了しました。810sハードウェアエンコーダーは、4K @ 30fpsと1080p @ 120fpsに対応しています。また、メインディスプレイに4K @ 60fpsで出力できるほか、HDMI 1.4a経由で外部ディスプレイに4K @ 30fpsで出力したり、Miracast経由でワイヤレスで1080p @ 60fpsで出力したりすることも可能です。

810は当初、最大300Mbpsの速度をサポートするQualcommのGobi 9x35 Cat 6モデムを搭載する予定でした。しかし、Samsungが今年中に独自のCat 10モデムを準備しているとの報道を受け、QualcommはSnapdragon 810のモデムをCat 9にアップグレードする必要性を感じました。このモデムはMDM9x35でも、最近発表されたCat 10 MDM9x45でもなく、正式な名称のない独自のソリューションです。重要なのは、3 x 20MHzのキャリアアグリゲーションを使用することで、最大450Mbpsの帯域幅を実現できることです。

全体的に見て、Snapdragon 810は805に比べていくつかの大きな強化点を備えています。例えば、オクタコア64ビットCPU、カテゴリー9 LTEモデム、LPDDR4メモリのサポート、そして強化されたGPUパフォーマンスとメディア機能などです。紹介が終わったので、ベンチマークを実行して、Qualcommのパフォーマンスに関する主張(そして根強い噂)を検証してみましょう。