
カリフォルニア大学リバーサイド校の研究論文によると、同時異種マルチスレッド(SHMT)は、デバイスのCPU、GPU、AIアクセラレータのパワーを一度に活用できるソリューションとなる可能性があるとのことです。論文によると、この新しいマルチスレッド技術により、パフォーマンスが2倍になり、消費電力が半減し、結果として効率が4倍になるとのこと。ただし、これは概念実証段階なので、期待しすぎないようにしましょう。まだ初期段階です。
多くのデバイスは既に、プロセッサコアを2つのスレッドに分割して計算効率を高める同時マルチスレッディング(SMT)などのマルチスレッド技術を採用しています。しかし、SHMTはCPU、GPU、そして少なくとも1つのAI搭載アクセラレータといった複数のデバイスにまたがって動作します。SHMTの目的は、各プロセッサが別々の処理を同時に実行し、GPUとAIのリソースを複数のタスクに分散させることです。
研究者たちは、品質を考慮したワークスティーリング(QAWS)スケジューラを作成することでこの成果を達成しました。このスケジューラは、高いエラー率を回避し、すべてのコンポーネント間でワークロードを均等に分散するように調整されています。QAWSポリシーでは、高い精度と正確さが求められるタスクは、エラーが発生しやすいAIアクセラレータには割り当てられません。また、あるコンポーネントがパフォーマンスの期待値を満たしていない場合は、タスクは他のコンポーネントに動的に再割り当てされます。
パフォーマンスが2倍、消費電力が半分、効率が4倍になるというのに、一体何が問題なのかと疑問に思うかもしれません。論文によると、「SHMTの限界はモデル自体ではなく、プログラマーがアルゴリズムを再検討して、SHMTを容易に活用できる並列性を実現できるかどうかにかかっています」とのことです。これは、SHMTを活用するにはソフトウェアをどのように記述する必要があるか、そしてすべてのソフトウェアがSHMTを最大限に活用できるわけではないことを示唆しています。
ソフトウェアの書き換えは大変な作業であることが知られています。例えば、AppleはMac PC向けにIntel製チップから自社製Armチップに切り替えた際に、多大な労力を費やしました。特にマルチスレッドに関しては、開発者が適応するのに時間がかかる場合があります。ソフトウェアがマルチコアCPUを活用できるようになるまでには数年かかりましたが、開発者が同じタスクに複数のコンポーネントを活用するようになるにも、同様の時間がかかる可能性があります。
さらに、論文ではSHMTのパフォーマンス向上が問題のサイズに左右されることが詳しく説明されています。1.95倍という数値は、論文でテストされた最大の問題サイズに基づいていますが、問題サイズが小さいほどパフォーマンスの向上は小さくなります。問題サイズが小さいほど、すべてのコンポーネントが並列に動作する機会が少なくなるため、最小の問題サイズでは実質的にパフォーマンスの向上は見られませんでした。
Tom's Hardware の最高のニュースと詳細なレビューをあなたの受信箱に直接お届けします。
あらゆる種類のコンピューターがAIプロセッサなどの複数のコンピューティングデバイスを搭載するケースが増えているため、開発者が処理速度向上のためにより多くのハードウェアを使用するようになるのは避けられないでしょう。SHMTが論文で概説されている最良のシナリオには達しないとしても、SHMTや類似の技術が主流になれば、PCやスマートフォンの性能向上に大きく貢献する可能性があります。
マシュー・コナッツァーは、Tom's Hardware USのフリーランスライターです。CPU、GPU、SSD、そしてコンピューター全般に関する記事を執筆しています。