ここ数年、Appleはユーザー保護だけでなく、効果的な競争優位性確保のため、自社製品やサービスへの新たなプライバシー機能の追加にますます力を入れています。世界開発者会議(WWDC)において、Appleはファイルシステムレベルの暗号化、デバイス内ディープラーニング、そしてユーザーから収集するデータをより効果的に匿名化することを目的とした「プライバシー差分」と呼ばれる全く新しい統計手法を含む、3つの新たなプライバシー機能を発表しました。
ファイルシステムネイティブ暗号化
Appleは今年のWWDCで、APFSと呼ばれる新しいファイルシステムを発表しました。これは、数十年も前から使用されているHFS+ファイルシステムを、フラッシュストレージと最新のCPUアーキテクチャに最適化したファイルシステムに置き換えるものです。多くの最新機能に加え、この新しいファイルシステムにはネイティブ暗号化サポートも含まれています。
macOSでは、File VaultやVeraCrypt(TrueCryptの後継の一つ)といったフルディスク暗号化アプリケーションを使用する代わりに、ディスク上のあらゆるデータを直接暗号化できます。暗号化なし、単一鍵暗号化、ファイルデータごとにファイルキーを使用する複数鍵暗号化など、複数のオプションから選択できます。また、機密性の高いファイルシステムのメタデータを別の鍵で暗号化することも可能です。iOSでも同様で、iOSは既にファイルベースの暗号化機能を備えていますが、まもなく新しいファイルシステムのネイティブ暗号化の恩恵を受けることになります。
新しいAPFSファイルシステムはまだプレビュー段階であり、サードパーティ製アプリケーションで予期せぬ問題が多数発生する可能性があるため、iOSにもOS Xにも少なくとも来年までは導入されない可能性があります。AppleがOSにAPFSをデフォルトで実装する前に、これらの問題はApple自身、あるいはサードパーティ開発者によって解決される必要があります。
差分プライバシー
Googleの過去数回のI/Oイベント、特に最近のイベントの後、多くの人が、Googleがデータ分析、機械学習、AIを活用したサービスへの注力を強化していることに対し、Appleがどのような対応を取るのか疑問に思い始めています。問題は技術的な問題(Appleがこの分野でGoogleと競合できる能力があるかどうか)だけでなく、プライバシーの問題でもあります。
Appleはユーザーのプライバシーを最優先に考えており、これらのクラウドベースの機能のほとんどはその目標と矛盾しています。そのため、Appleは、ある程度のユーザーデータを収集しつつも、Apple自身でさえ個々のユーザーを特定できないようなソリューションを必要としていました。
Appleは、この問題の解決策となると思われる「差分プライバシー」と呼ばれる技術を発表しました。差分プライバシーの仕組みは、Appleがユーザーからデータの断片を収集し、各断片にデータノイズを追加することで、断片をある意味で「スクランブル」するというものです。
Tom's Hardware の最高のニュースと詳細なレビューをあなたの受信箱に直接お届けします。
プライバシーに関してはここまでは順調だが、Appleはこのデータをどのように活用してサービスを向上させるのだろうか?この技術により、Appleは個人ではなく集団から収集したデータから、特定のパターンや傾向を浮き彫りにすることができる。
差分プライバシーは最近まで主に研究段階でしたが、Appleは今や10億台のデバイスにこれを導入しようとしています。ジョンズ・ホプキンス大学の暗号学教授マシュー・グリーン氏をはじめとする一部の専門家は、このことに懸念を抱いています。
差分プライバシーに関する理論全体が完全に間違っていて、システムがまったく役に立たない限り、Google やその他の企業、政府機関が、まずユーザーのデータをすべて収集し、その後で名前や住所などの識別可能な情報をプロフィールから削除してユーザーデータを「匿名化」する方法よりも大幅に改善されている可能性があります。
データの一部が削除された後でも、ユーザーに関する様々な情報を相関させることで、ほとんどのユーザーを特定することは容易です。そのため、現在の「データ匿名化」システムはすでに完全に破綻しているように見えます。差分プライバシーは、少なくとも準同型暗号などのより優れた手法がより多くのサービスで実用化されるまでは、ユーザーのプライバシー保護にとって前進と言えるでしょう。
しかし、差分プライバシーであれ、準同型暗号であれ、あるいは他のものであれ、それらはあくまで「データ収集問題」に対する「プライバシーソリューション」として意図されているに過ぎません。そもそもデータを収集しないことが、プライバシー侵害やデータ漏洩からユーザーを守るための最も費用対効果が高く、最も簡単な方法であることに変わりはありません。ここで、Appleが導入したもう一つのプライバシー機能、デバイス内ディープラーニングについて触れたいと思います。
オンデバイスディープラーニング
以前も議論したように、スマートフォンにディープラーニングアクセラレータが組み込まれるのは、ほんの数年後かもしれません。しかし、Appleは早ければ今年中にも次期iPhoneでそれを実現する可能性があります(これは、iPhoneのソフトウェアとハードウェアの両方を制御できることのメリットの一つです)。旧型のスマートフォンでも、Appleの強力なモバイルGPUを活用すれば、ディープラーニングアクセラレータを有効化できる可能性がありますが、カスタムアクセラレータを使用するほど効率的ではないでしょう。
デバイス上でのディープラーニングは、アルゴリズムの機能セットを確立する「トレーニング」段階においては、クラウドベースのディープラーニングに匹敵することは決してありません。しかし、「推論」段階、つまり確立されたアルゴリズムを実行する段階では、ほとんどの種類のサービスにとって「十分な性能」を発揮する可能性があります。計算はローカルで行われるため、企業のサーバーとデバイスの間、そして(おそらく混雑している)無線ネットワークを介してリクエストを絶えず送受信するよりも、実際にはより効率的(かつ高速)になる可能性があります。
しかし、デバイス上でのディープラーニングの最大のメリットはプライバシー保護です。GoogleやFacebookの「AI」にあなたのメッセージや写真の分析を許可するということは、GoogleやFacebookがそれらのデータすべてにアクセスできるようになるだけでなく、彼らのサーバーをハッキングする可能性のある人物や、あなたの許可の有無にかかわらずそれらのデータを要求する政府もアクセスできるようになることを意味します。
WWDC で、Apple は新しい写真アプリを発表しました。このアプリでは、画像の内容をローカルで分析して、特定のコンテキスト (頻繁に撮影する人物など) に基づいて画像をグループ化したり、ユーザーが特定の単語を検索して、その単語を説明する画像のみを表示したり (「山」を検索すると山の写真のみを表示するなど) することができます。
将来、AppleはGoogleなどの企業と同様に、この種のディープラーニング計算を他のアプリやサービスにも拡張できる可能性があります。ただし、真のプライバシー(データをユーザーの所有物として保持する)というメリットは得られます。これらのデータは、今後導入されるファイルシステムによってネイティブに暗号化されるようになります。Appleが特定のサービスを提供するために絶対にアクセスしなければならないデータについては、差分プライバシー方式を用いてより高度な「匿名化」が可能です。
ルシアン・アルマスはTom's Hardwareの寄稿ライターです。 @lucian_armasuでフォローできます。
ルシアン・アルマスは、Tom's Hardware USの寄稿ライターです。ソフトウェア関連のニュースやプライバシーとセキュリティに関する問題を取り上げています。