80
ベンチマーク: Copilot+ PC がローカル AI ワークロードを処理する方法
Copilot+ PC 上の AI ワークロード
(画像提供:Future)

Qualcomm Snapdragon Xプロセッサを搭載した新世代Windowsノートパソコン、 Copilot+ PCが店頭に並んでから数週間が経ちました。オフィスに数台導入し、一般的なIntelまたはAMD搭載ノートパソコンと同じテストを数多く実施してきましたが、私たちが本当に知りたいのは、これらのコンピューター上でローカルAIワークロードがどのように動作するのかということです。

残念ながら、現時点ではSnapdragon X搭載ノートPCで実行できるローカルAIアプリケーションはそれほど多くありません。Copilot+ PCには、Codesigner、Windows Studio Effects、そして文字起こし機能付きのライブキャプションという3つのWindows専用機能があります。これらの機能の価値を考えるかどうかは別として、再現可能な指標を残さないため、ベンチマークには使用できません。ストップウォッチを使って、プロンプトを入力してからCodesignerがイメージを構築するまでの時間を計測することはできますが、それでもCodesignerはSnapdragon X搭載Copilot+ PC専用であるため、IntelまたはAMD搭載PC上の同じアプリケーションと比較することはできません。

そのため、現時点では、Snapdragon X搭載ノートPCとIntel Core Ultra 7「Meteor Lake」搭載ノートPCの両方で実行した実環境AIテストを数件しか実施できていません。現在、テスト用のRyzen 7840U「Phoenix」搭載ノートPCは手元にありませんが、Ryzen「Strix Point」搭載ノートPCが数週間後に発売されることを考えると、これらの比較はいずれにせよ古臭く感じられるでしょう。

スワイプして水平にスクロールします

テストしたノートパソコン
ラップトップCPU
レノボ ThinkPad X1 Carbon (第12世代)インテル Core ウルトラ 7 155H
エイサー スウィフト ゴー 14インテル Core ウルトラ 7 155H
サーフェスプロスナップドラゴン エリート X (X1E-80-100)
サーフェス ラップトップ 15スナップドラゴン エリート X (X1E-80-100)

 ウィスパートランスクリプション 

最初のテストでは、Whisper AI Base English Modelを用いて12分間のMP3音声ファイルをテキストに変換しました。WhisperはローカルAIの最も実用的なユースケースの一つです。仕事や教育目的で会話を録音する人(学生の講義録音やジャーナリストのインタビュー録音など)は、会話をテキストに変換する必要性を強く感じているからです。WhisperはOpenAIが開発していますが、誰でも無料でダウンロードして独自のプログラムで使用できます。 

Whisper の導入方法は様々ですが、今回はカスタム Python スクリプトで使用しました。このスクリプトは、文字起こし開始前の時刻を出力し、文字起こしを実行してテキストファイルに書き込み、終了時刻を記録します。これらの時刻の差を取得することで、各システムがテストをどれだけ速く実行したかがわかります。すべてのシステムで同じモデルを使用しているため、文字起こしの精度は評価していません。もしこれを自社で実施するのであれば、Base モデルよりもはるかに精度の高い Whisper Large モデルを使用するのが望ましいのですが、Qualcomm はまだ Snapdragon 向けの Whisper Large バージョンを提供していません。 

スクリプトの Intel バージョンと Arm バージョンではコードが若干異なります。これは、Intel Meteor Lake がGPU にアクセスするために Pytorch の Ipex オープン拡張機能を使用するのに対し、Snapdragon X では NPU へのアクセスを許可するために ONNX ランタイム用の QNN 実行プロバイダーを必要とするためです。適切なランタイムを使用することを確認することが重要です。そうしないと、スクリプトは転写 (またはその他のタスク) の作業を CPU に送信しますが、NPU または GPU は同じタスクをはるかに高速に (かつより少ない電力で) 完了します。CPU で AI ワークロードを実行することは、常に最も遅いオプションです。ただし、以前の一連のMeteor Lake テストでは、内部の Intel Arc GPU は実際には NPU よりも高速である一方、Snapdragon プロセッサでは NPU が最適な選択であることがわかりました。 

Whisper では、結果はまちまちでした。Python スクリプトによる音声ファイルの書き起こしに要した時間だけを見ると、Snapdragon 搭載のラップトップは Intel 搭載の競合製品とほぼ同等の速度で、モデルごとに数秒の誤差はありますが、完了時間は Snapdragon X 搭載の Surface Pro で 1 分 4 秒、Core Ultra 7 搭載の X1 Carbon で 1 分 13 秒でした。全体的には Snapdragon 搭載のラップトップの方が数秒速かったものの、Surface Laptop 15 では 1 分 9 秒、Acer Swift Go 14 (Core Ultra 7) では 1 分 8 秒でした。 

Tom's Hardware の最高のニュースと詳細なレビューをあなたの受信箱に直接お届けします。

SnapdragonラップトップのWhisper

(画像提供:Tom's Hardware)

しかし、大きな落とし穴があります。Qualcommの開発者から送られてきた指示に従ってPythonスクリプトを実行すると、Snapdragon Xシステムは書き起こしを開始する前にさらに43~47秒の前処理時間がかかります。この時間は、MP3ファイルをメルスペクトログラムに変換し、Whisperモデルに送って書き起こすのに使われます。下のスクリーンショットを見ると、「開始: 1:45:42」と「書き起こし前: 01:46:28」の間に、グラフが大きく表示されているのが分かります。  

SnapdragonラップトップのWhisper

(画像提供:Tom's Hardware)

Intelデバイスでは、この処理は必須ではありません(おそらく自動的に行われるのでしょうが)が、Pythonスクリプトの起動から転写開始まで約4~7秒の遅延があります。スペクトログラム処理を考慮すると、Intelは約40秒速くジョブを完了します。 

 安定した拡散画像生成 

ベンチマークしたもう1つのワークロードは、人気のテキスト画像生成ツールであるStable Diffusion 1.5を使用したものです。Qualcommは、AI Hub上でStable Diffusionを任意の画像プロンプトで使用するための公式な方法をまだ提供していませんが(Qualcommのサンプルプロンプト1つなら使用できます)、幸いなことに、数人の開発者がGIMP用のStable Diffusion 1.5プラグインを作成しており、これをテストに使用しました。Intel搭載のラップトップでは、ブラウザでプロンプト作成用のローカルUIを提供するAutomatic1111またはOpenVINO GIMP Pluginのいずれかを使用できました。どちらも同じ結果が得られました。 

Stable Diffusion 1.5 では、Surface Pro と Surface Laptop 15 は、車を運転している猫の絵(私がいつも使っている課題)を描くのにそれぞれわずか 7.1 秒と 7.2 秒しかかかりませんでした。テストした 2 台の Intel Core Ultra 7 搭載ラップトップ、ThinkPad X1 Carbon (Gen 12) と Acer Swift Go 14 は、同じタスクをそれぞれ 12.9 秒と 13 秒で完了しました。

Snapdragonラップトップの安定した拡散

(画像提供:Tom's Hardware)

ここでわかるのは、WhisperではQualcommがIntelとほぼ互角であるということです。ただし、私たちが使用した現在の実装では、45秒の変換プロセスが追加されています。また、追加の変換プロセスがないStable Diffusionでは、Snapdragonチップが45%高速化しています。 

Intelシステムの場合、AIワークロードをArc GPUにオフロードしていました。これは、NPUがそれほど強力ではないため、Intelにとっては好ましい状況でした。一方、Snapdragonシステムの場合、AIワークロードのすべてをNPUに送り込んでいました。NPUは強力でありながら効率的です。

残念ながら、Qualcomm 搭載と Intel 搭載のラップトップの両方でテストできる、より入手しやすい AI ワークロードを見つけることができませんでした。しかし、今後、両方のプラットフォームで動作するローカル AI アプリやモデルが増え、より正確な比較が可能になると期待しています。 

今のところ、Snapdragon X は Intel の「Meteor Lake」に対してわずかに優位に立っているように見えますが、Intel が数か月以内に新しいプラットフォーム Lunar Lake をリリースする予定であり、AMD が数週間以内に Strix Point CPU をリリースすることを考えると、x86 企業が先行するか、少なくともすぐに同等のレベルに達する可能性があります。

Avram Piltchは特別プロジェクト担当の編集長です。仕事で最新ガジェットをいじったり、展示会でVRヘルメットを装着したりしていない時は、スマートフォンのルート化、PCの分解、プラグインのコーディングなどに取り組んでいます。技術的な知識とテストへの情熱を活かし、Avramはノートパソコンのバッテリーテストをはじめ、数多くの実環境ベンチマークを開発しました。