72
Wi-Fi信号は、事前学習済みのAIの助けを借りて、部屋の正確な画像を作成できるようになりました。「LatentCSI」は、Stable Diffusion 3を活用してWi-Fiデータをデジタル絵筆に変換します。
TP-Link Archer BE9700 Wi-Fi 7ルーター
(画像提供:Tom's Hardware)

私たちの周囲にあるWi-Fiデバイスは常に互いに信号を共有し、常に反響する環境を作り出しています。この環境下では、電波は空間認識の限界に達しています。信号は送信機と受信機の間だけでなく、壁や家具など、空間にあるあらゆるものに反射するため、最終的に物の位置に関する情報を運ぶことになります。この反射的なデータはWi-Fi CSI(チャネル状態情報)と呼ばれ、以前は部屋の大まかなスケッチを描くのに使用できましたが、AIの導入により、はるかに正確なマッピングが可能になりました。

東京理科研究所の研究者たちは、潜在拡散モデルとWi-Fi CSIを組み合わせることで、あらゆる部屋の高解像度画像を正確かつ効率的に生成する方法を考案しました。CSIベースの画像化自体は新しいものではありませんが、部屋の外観を推定するのに十分なデータがないため、せいぜい粗い結果しか得られません(そもそも計算負荷が大きすぎるため、処理速度も遅くなります)。ここでAIが役立ち、これらのギャップを埋めて、実際にフォトリアリスティックな画像を実現します。これは、CSIをピクセル空間ではなく潜在空間にマッピングすることで実現されます。そのため、この手法は「LatentCSI」と呼ばれています。

AIモデルに入力された参照画像と、それに基づいてAIが生成した結果の比較

LatentCSI が生成できる結果(画像クレジット: Nagano et al., LatentCSI (arXiv:2506.10605v3, 2025)、CC BY-SA 4.0)

ピクセル空間とは、大量の生データを持つ通常の画像を指します。一方、潜在空間とは、最新の画像生成器(Stable Diffusionなど)が使用する、画像の圧縮された内部表現です。LatentCSIは、Wi-Fi CSIを潜在空間に変換し、事前学習済みの拡散モデルに入力することで、Wi-Fiだけでは捉えられない細部や質感までも再現する高解像度画像を生成します。研究者たちは、通常の画像ではなくWi-Fiデータを受け入れるように改良されたエンコーダを搭載したStable Diffusion 3を使用しました。これにより、処理速度が大幅に向上し、オーバーヘッドも削減されています。

しかし、「事前学習済み」がキーワードです。研究者たちは実際に部屋の写真を撮影し、それを使ってモデルを学習させたため、モデルは部屋の外観を既に把握しています。つまり、AIがここで重要な役割を担い、Wi-Fi CSIは、部屋の現在の「外観」、つまり何人の人がそこにいるのか、どこに立っているのか、そして室内の物体の全体的な配置などに関するリアルタイム情報を提供します。この科学的な詳細を知りたい方は、論文全文をご覧ください。

いずれにせよ、LatentCSIは従来のWi-Fi画像よりも著しく優れているものの、環境について既に強力なベースライン理解を備えた事前学習済みモデルでしか動作しないという制約があります。ルーターのデータのスナップショットをISPに送るだけで、部屋の状況を推測してレンダリングさせることはできません。しかし、一部の最新モデムはすでにモーションセンサーに対応しているため、プライバシーに関する懸念が生じることは容易に想像できます。たとえ肯定的なユースケースを想像しようとしても、結局は監視に結びついてしまいます。将来は間違いなく明らかですが、今のところはまだラボのデモ段階です。

Tom's HardwareをGoogleニュースでフォローするか、お気に入りの情報源として追加して、最新のニュース、分析、レビューをフィードで受信しましょう。「フォロー」ボタンを忘れずにクリックしてください!

Tom's Hardware の最高のニュースと詳細なレビューをあなたの受信箱に直接お届けします。

ハッサム・ナシルは、長年の技術編集者兼ライターとしての経験を持つ、熱狂的なハードウェア愛好家です。CPUの詳細な比較やハードウェア全般のニュースを専門としています。仕事以外の時間は、常に進化を続けるカスタム水冷式ゲーミングマシンのためにチューブを曲げたり、趣味で最新のCPUやGPUのベンチマークテストを行ったりしています。