
ここでの主な問題は、AI の不透明性から生じています。AI の運用上のブラック ボックスは、AI 製品開発者であるだけでは製品の出力を識別するのに十分ではないことを意味しているようです (これは最も基本的な機能です)。
AIベースの画像生成器による合成・生成出力に「目に見えない」透かしを入れる技術は数多く進歩していますが、テキストとなると問題ははるかに複雑になります。実際のテキストには、識別データを追加する余地がないため、このような問題が発生します。画像には(人間の目には)目に見えない形で様々な要素を組み込むことができますが、画像に何らかの変化(たとえ目に見えないものであっても)を加えると、専門ツールで検出できるデータが追加されてしまうのです。
しかし、テキストはまったく別の問題であり、本当に熱心な人であれば、単純な「コピー アンド ペースト」コマンドでコピーできる目に見えない透かしを無視して、Large Language Model の出力全体を単純に再入力してテキスト情報だけを残すこともできるという問題もあります。
AI が生成したテキストの分析と識別は、クロード・シャノンが開拓した情報理論の研究に基づいているように思われます。この研究は、情報の本質的な評価は「驚き」の領域で起こると説明しました。つまり、情報が驚くべきものである場合、つまり、期待に応えたり期待を裏切ったりする場合は、その情報は関連情報となります (関連度は、その驚きの度合いに応じて異なります)。
Tom's Hardware誌の次世代GPUに関する記事で、2つの異なるタイトルを考えてみましょう。「Nvidia、最新世代でもゲームパフォーマンスの王座を堅持」と「AMD、Nvidiaからゲームパフォーマンスの王座を奪取」です(これらのタイトルが良いか悪いかはここでは議論しません)。重要なのは、どちらか一方が他方よりも驚きが大きく、情報のインパクトも高くなるということです。
Tom's Hardware の最高のニュースと詳細なレビューをあなたの受信箱に直接お届けします。
AIの「書き方」パターンにおける驚きのなさこそが、これらのツールが検出しようとしているものです。しかし、AI Classifierのヒット率が26%と非常に低いことからもわかるように、現状ではツールはAIの出力検出にはあまり向いていません。GPTZeroでさえ、AIの出力検出能力は、猿がランダムに同じことを試みた場合の精度をわずかに上回る程度です。
AIに正しく透かしを入れる責任はありますが、それを間違えないようにする責任はさらに大きいです。とはいえ、OpenAIがこのツールを削除するという決定は、最良の選択だったと言えるでしょう。
Francisco Pires 氏は、Tom's Hardware のフリーランス ニュース ライターであり、量子コンピューティングに関心を持っています。