
DeepSeekの最新のR1大規模言語モデルは、そのリリースがAI関連銘柄に大暴落をもたらしたことですでに悪名高いものとなっているが、同社のプライバシーポリシーに関する暴露は、さらに人々の眉をひそめることになるかもしれない。同社は、キー入力、パスワード、画像やテキストなどのクエリに入力されたデータなど、オンラインユーザーの膨大なデータを記録し、それを中国にあるサーバーに保存しているのだ。
DeepSeekによると、生年月日、メールアドレス、電話番号、パスワードなどの個人情報はすべて収集対象です。ユーザーがR1 LLMに提供するコンテンツ(テキストや音声プロンプト、アップロードされたファイルなど)もDeepSeekによって収集される可能性があります。また、DeepSeekは、ユーザーが連絡を取った際に、ユーザーの身分証明書(おそらく運転免許証など)を保管する可能性があると述べています。
しかし、それだけではありません。DeepSeekは、IPアドレス、携帯電話の機種、言語など、ユーザーのハードウェアに関連するあらゆる情報を記録します。その収集活動は非常に徹底しており、同社は「キー入力のパターンやリズム」まで記録しています。インターネット上でユーザーを追跡する典型的な方法であるCookieも、ユーザーデータの収集に寄与しています。
これらの情報がどこに保管されているかについては、プライバシーポリシーによると、すべて中国にあるサーバー内に保管されているとされており、これは深刻な論争を巻き起こす可能性があります。アメリカ人の個人情報が中国政府の手に渡るのではないかという懸念は、バイデン政権がTikTokを禁止しようとした際の重要な要因であり、DeepSeekも同様の精査を受ける可能性が高まっています。
Tom's Hardware の最高のニュースと詳細なレビューをあなたの受信箱に直接お届けします。
中国のAI企業DeepSeekが開発したR1は、オープンソースのLLM(学習モデル)であり、わずかな計算能力で最先端のパフォーマンスを誇ります。6,710億のパラメータを持つR1は、AIの中でも最も重要なモデルの一つであり、学習に要したGPU時間はわずか280万時間でした。MetaのLlama 3は、その11倍にあたる3,080万時間ものGPU時間を要しました。
DeepSeekは1ヶ月以上前からこれらの成果を誇示していましたが、R1は1月20日にローンチされ、株式市場がその影響を真に認識したのはつい昨日のことでした。市場はNvidiaなどのAI企業の株を売るという形で反応しました。DeepSeekへの注目度が高まった一方で、中国で開発されるAIやソフトウェアに関わるあらゆるものにとって特に厄介な問題である、ユーザーのプライバシーの取り扱いについても多くの人が疑問を抱いています。
マシュー・コナッツァーは、Tom's Hardware USのフリーランスライターです。CPU、GPU、SSD、そしてコンピューター全般に関する記事を執筆しています。