51
ボットの混乱:AI生成のクリックベイトが検索とウェブパブリッシングの終焉を早める
AI生成のクリックベイト
(画像クレジット:Shutterstock(2229944461および2250015499))

人間のライターと仕事をするのは、時に難しいものです。提出が遅れたり、指示を忠実に守らなかったり、そして最悪なことに、報酬を要求したりします。出版業界の幹部の中には、ジャーナリストの代わりにAIを使うことがこうした問題の解決策だと考える人もいます。ChatGPTやGoogle Bardのようなチャットボットは、説得力のある文章を無料で作成できるので、ライターが1本書くのにかかる時間で、数十本の記事を簡単に作成できます。そして、Googleがそれらのページをリストアップし、人々がクリックして利益を得られる、と考えるのです。 

この考え方の問題点は、読者とGoogleの検索スパイダーの両方が、たとえ間違いだらけの単語の羅列であっても、それを鵜呑みにするだろうと想定していることです。そして、出版社独自のAIソフトウェアがChatGPTやGoogle Bard/SGEよりも優れていると、全く誤った前提を置いています。 

話を進める前に、「AI生成」と「AI支援」の出力を区別しておく必要があります。AI技術が現在よりもはるかに優れた性能を発揮すれば、ライターがより迅速かつ正確に記事を作成できるようになる可能性はあります。Googleはジャーナリストの出版を支援するツールをテストしていると報じられていますが、もしそれがGoogleドキュメントの「Smart Compose」(文中の次の単語を提案する機能)のような強力なツールであれば、非常に役立つかもしれません。しかし、現在出版社が目にしているのは、AIが著者となり、運が良ければ人間が支援するコンテンツです。

残念ながら、AI生成記事の質は一様に低い。重大な事実誤認に満ち、文章は平板で生気のない、あるいは華美で誇張されたものだ。最近、GizmodoがAI生成したスター・ウォーズ映画を時系列順に並べた記事は、時系列が間違っており、同社が修正した後も、明らかなスペルミスや事実誤認が続いている。CNETに掲載されたAI生成の銀行記事は、基本的な計算さえできておらず、「年利3%の複利の普通預金口座に1万ドルを預けると、1年後には1万300ドルの利息が得られる」と述べている。 

こうした恥ずかしいミスにもかかわらず、Googleのランキングこそが​​究極の評価基準だと考えているため、AI生成記事に楽観的な見方をする人もいます。Gizmodoを統括するG/O Media編集ディレクターのメリル・ブラウン氏は、Voxのピーター・カフカ氏に対し、 AIコンテンツは「間違いなくもっと活用したい分野」であり、「検索エンジンにも好評だ」と述べています。スター・ウォーズの記事は、Googleで「スター・ウォーズ 映画」というキーワードで検索した際に一時的にトップ10にランクインしましたが、これは必ずしもAI生成記事への支持を示すものではありません。

 人間がAIのファクトチェックをするのは解決策ではない理由 

多くのAI推進派は、問題のあるAI出力への解決策は、人的資源を投入することだと考えています。つまり、編集者やファクトチェッカーを雇って、ボットを優れたライターに見せかけるのです。しかし、人間がボットの成果物を過度に編集することは、そもそもボットを使う目的である「低摩擦」に反するだけでなく、すべての誤りを発見することもできません。

Tom's Hardware の最高のニュースと詳細なレビューをあなたの受信箱に直接お届けします。

私は20年以上、人間の作品を編集してきました。そして、読む原稿はすべて真剣に受け止めています。もちろん、間違いを見つけて修正することはありますが、一度でもフリーランサーを雇って、AI生成作品によくある問題(誤った事実、非論理的・矛盾した記述、あるいは明らかな盗作)を抱えた記事を提出してきたら、二度とその人とは仕事をしません。 

私の目標は、信頼できる人からの、明快で洞察力に富んだ原稿を、さらりと読み通すことです。もし大幅な書き直しをしなければならないなら、記事全体を一から書き直し、自分の署名を入れる方が賢明です。もし、誰かが捏造していることを知っているからと、人の文章を綿密にチェックしなければならないとしたら、見落としや間違いが見落とされてしまうでしょう。 

AIが生成したコンテンツでは、たとえ勤勉で才能のある人間の編集者であっても、人間が書いた原稿よりも誤りを見逃してしまう可能性が高くなります。AIが生成した事実上の誤りの配置は予測不可能です。例えば、人間が「earn(稼ぐ)」という単語を間違えるとは予想できないかもしれません(CNETの複利記事で問題になった問題)。AIが生成したコンテンツは、必ずしも正しいとは限りません。そのため、人間の編集者は、あらゆる事実を詳細に調査するだけでなく、まさにそのトピックに関する専門家でなければなりません。

私はテクノロジージャーナリストですが、GPUライターほどグラフィックカードについて詳しいとは言えませんし、PSUレビュアーほど電源について詳しいとも言えません。ですから、PSUライターがテストしたユニットのホールドアップタイムが19.4ミリ秒で、それが良い数値だと言ったら、私は彼を信じるでしょう。 

AI生成コンテンツの目標が市場投入までのスピードと低コストであることを考えると、非常に詳細な専門知識を持ち、十分な時間をかけて事実確認できる人間の編集者が各記事を読む可能性はどれほどあるでしょうか?そして、人間は、自身の専門知識と才能を本質的に軽視する、気が滅入るプロセスに携わりながら、細部への厳密な注意を維持できるでしょうか?

人気ゲームメディア企業Gamursの最近のAI編集者求人では、1日に50本の記事を公開する必要があると書かれていました。これは1本あたり10分未満で、おそらく記事の書き出し、画像の検索、CMSへの公開といった作業が含まれるでしょう。そんな人がすべての間違いを見逃したり、言葉遣いの悪い文章を書き直したりできると本当に思っている人がいるでしょうか?いいえ、そうではありません。しかし、投稿されるすべての間違いのスケープゴートにされる可能性はあります。

レストランのトイレを安く設置するために、格安の配管工を雇ったと想像してみてください。ラリオの仕事は信頼性の低いことで有名で、便利屋としての経験がある友人のピートに、配管工の仕事ぶりを5分ほどチェックしてもらうように頼みます。天井から汚水が垂れてきても驚く必要はありません。また、数人の新規顧客がレストランに来て注文をした後、悪臭に気づいて去っていったとしても、成功とは考えるべきではありません。 

AI生成 vs AI支援

他のツールと同様に、LLMは良いことにも悪いことにも使えます。AIは、著者が信頼性が高く役立つ文章をより速く作成するのを支援する可能性があります。便利なAIライティングアシスタントは、ChatGPTではなくGrammarlyのようなものです。文章を書いた後に改善するための提案をしたり、ユーザーが入力した非常に具体的なアイデアや事実に基づいて下書きを作成したりしてくれるでしょう。

台北で開催されるComputex見本市のようなニュースイベントに参加するというシナリオを想像してみてください。ベンダーを訪問し、これまで経験したことのないほどクリック感のあるタイピング感覚の画期的な新型キーボードを見せてもらいます。写真を撮り、製品を実際に触り、記事にまとめたい事実や体験談をいくつか収集しますが、次の会議に間に合うまで20分しかなく、600~1,000ワードの詳細なレポートを書く時間が足りません。

そこでAIアシスタントツールを起動し、学んだ事実、強調したい主要な特徴、感情(「今までで一番カチッとしたスイッチだった」)、そして方向性を箇条書きで入力します。AIは音声操作もできるので、次の会議に向かう途中でスマホにこれらのアイデアを音声入力することもできます。ツールは私のアイデアをニュース記事にまとめた最初の下書きを作成し、それを5分から10分かけて、自分の思い通りの仕上がりになるように修正します。

これは極めて理論的なシナリオです。なぜなら、Googleドキュメントの「Help Me Write」のようなツールは、実際には文章作成を手助けしてくれないからです。これらのツールは、ライターのキーボード操作を奪い、ライター自身の情報までも取り込み、すべての作業を自動化してくれます。私がGoogleドキュメントにアルバート・アインシュタインの伝記の推敲を依頼した際、原文にはどこにもなかった詳細を勝手に書き足してしまい、アインシュタインは生涯アイスクリームを愛していたとか、1955年に亡くなったとか言ってしまいました(どちらも原文には記載されていませんでした)。

AIは矛盾している

AIに文章を書いてもらう際の問題点の一つは、AIが自ら矛盾する視点を提示する可能性があることです。編集者として、そのような点をどのように編集すればいいのでしょうか?

例えば、先日Google Bardに、2つのミッドレンジCPU、AMD Ryzen 5 5600X3D CPUとIntel Core i5-13400を比較する記事を書いてもらいました。記事ではいくつかの重要な事実が抜け落ちており、5600X3Dの価格はIntel Core i5よりも170ドル高く、Core i5のブーストクロックとキャッシュはどちらも誇張されていました。しかし、真の問題は、Google Bardが示したアドバイスが決定的なものではなかったことです。 

AI生成の吟遊詩人の回答

(画像提供:Tom's Hardware)

バードが各プロセッサをどのように説明しているかを見てみましょう。

「ゲームやその他のメモリを大量に消費するアプリケーションで優れたパフォーマンスを発揮するCPUを探しているなら、Ryzen 5 5600X3Dは良い選択です」と同社はAMDのチップについて述べている。

「ゲームやその他のシングルスレッドアプリケーションで優れたパフォーマンスを発揮するCPUを探しているなら、Core i5-13400は良い選択です」と同社はIntelのプロセッサについて述べている。

ボットによると、どちらのCPUも「ゲームやその他の用途で優れたパフォーマンスを発揮する」とのことですが、どちらが正しいのか疑問に思うでしょう。ゲームはシングルスレッドなのか、それともメモリを大量に消費するのか? 実際には、ゲームはスレッド数が少なくてもメモリを大量に消費することはありますが、ほとんどのゲームテストではRyzen 5 5600X3Dの方が高速です。人間であれば、これを読んだ時点でどちらかの立場を取らざるを得ないでしょう。専門家なら、これを書いている時点で既にどちらかの立場を取っているでしょう。 

しかし、AIボットは一貫した視点を提供しません。なぜなら、多くの異なる著者の競合するアイデアを混ぜ合わせ、盗作の寄せ集めのように振る舞うからです。AIがより多くの情報源から情報を得るほど、特定の文章や段落を元の情報源まで遡ることが難しくなり、盗作の疑いがかけられる可能性が低くなります。もしAIが一度に一人の著者から情報を得るだけであれば、首尾一貫した一貫した視点を持つことができるでしょう。 

AI 作家はもっと上手くなるよね?

生成AIの不正確さや文章の稚拙さといった現状の問題について友人や家族に話すと、多くの人が「ええ、今はひどいけど、これから良くなるわよ」と言います。これは他のテクノロジーでは見られない考え方です。「この薬は病気を治すわけではなく、ひどい副作用もあるけれど、将来のバージョンがあなたを助けると思うから、飲んでみる価値はあるわ」と言う人はいません。「この自動運転車に乗ってみたらどう?今日は歩行者に轢かれるかもしれないけど、明日のバージョンはきっと驚くようなものになるわよ」と言う人もいません。

現実には、主要な法学修士課程(LLM)であるChatGPTの精度が低下しているという証拠があります。しかし、ここでは生成AIがより優れた文章を書く能力を持つと仮定しましょう。正しい事実を選択し、文脈に応じて適切な言葉を使用し、論理的に一貫性を保つ能力は向上するかもしれません。しかし、実際の意味と権威を生み出す能力は向上しません。 

彼らの論文「

確率的オウムの危険性:言語モデルは大きすぎる可能性があるか

ベンダーらは次のように書いている。

「…一見一貫性のある合成テキストに伴うリスクは、そのような合成テキストが、いかなる個人や団体も責任を負うことなく会話に持ち込まれる可能性があるという事実と深く結びついています。この説明責任は、真実性に対する責任を伴うと同時に、意味を位置づける上で重要です。」

スター・ウォーズの映画リスト、CPUの選び方アドバイス、スクリーンショット撮影のような簡単なタスクのやり方など、どんな情報であっても、その言葉の背後にいる著者、そしてその視点は重要です。情報源を知ることで、偏りや信頼性を検証することができます。 

買い物をする際は、実店舗の意見よりも評判の良い商品レビュー担当者の意見を信頼すべきですが、AIはこれらの視点を融合させ、同等の重みで扱います。チュートリアルを作成する際には、そのタスクを実際に実行した人間が執筆を行うことが非常に重要です。AIは、Print Screenキーを押すと画面の内容がクリップボードにコピーされることを教えることができますが、私がWindowsでスクリーンショットを撮る方法に関する記事を書いた際、PicPickというアプリのダウンロードを推奨しました。長年にわたり、このアプリのおかげで仕事が格段に楽になったからです。

LLMは、予測アルゴリズムを用いて、入力されたプロンプトに応じた単語の並びを出力するテキスト生成器です。LLMは、人間の経験に基づいて文章を生成しません。人間の言葉だけを入力とするため、たとえ単語の要約能力が向上したとしても、一次情報源にはならず、共有できる視点も持ちません。

 AIコンテンツはGoogleに「好評」されているか? 

コンテンツウェブサイトは、Googleの検索結果で上位表示をめぐって常に競争を繰り広げています。そのため、私たちは統計データをチェックして人々が何を探しているかを把握し、そのニーズに応えるコンテンツの作成に努めています。多くの人がスター・ウォーズ映画の時系列を探していることを知っていて、その情報をうまく提示できれば、それは大きな助けになります。

しかし、多くの場合、出版社は検索ユーザーに真の価値を提供することなく、特定のキーワードでGoogleの上位表示を競い合っています。Googleで上位表示を狙ってAIに記事を書かせるのは、読者を侮辱し、大手検索エンジンを騙そうとする冷笑的な行為です。これは逆効果となり、AIライターを活用していない出版社も含め、すべての出版社に損害を与える可能性があります。

G/O mediaが自社のAIコンテンツが「Googleに好評」と発表したことに対し、GoogleのSearch LiaisonのTwitterアカウントは、検索エンジンはコンテンツの有用性のみを重視しており、人間が作成したかボットが作成したかは考慮していないと投稿した。「人間ではなく、検索順位を第一に考えるコンテンツを大量に作成することは避けるべきです」と彼らは述べている。 

とはいえ、Googleはウェブサイトが検索結果で上位にランクされるべき指標として、EEAT(経験、専門知識、権威、信頼)を使用しています。EEATは著者と出版物に結びついていますが、AIボットはこれらの要素を一切持ち合わせていません。

以前も書いたように、Googleの新しいSearch Generative Experience(SGE)は、オープンウェブにとって存在そのものを脅かす脅威です。SGEがベータ版からリリースされ、デフォルトの検索エクスペリエンスになれば、何千ものウェブサイトが廃業に追い込まれるでしょう。なぜなら、Googleはほぼすべての検索クエリの最初の画面に、AIが生成した独自のコンテンツを表示するようになるからです。その結果、他のすべてのウェブサイトへのトラフィックが事実上遮断されることになるからです。 

ウェブサイトのライター(フォーラム投稿やユーザーレビューなど)に破壊的な影響を与えるだけでなく、SGEは読者にとっても有害です。権威性に欠け、事実誤認を含み、他人の文章を盗用して、不快な盗作の寄せ集めと化しているからです。GoogleがSGEをデフォルトのエクスペリエンスにしないことを願うばかりです。もしそうしないとしても、その理由はおそらく、人間は人間が書いたコンテンツを求めているからでしょう。

Googleがオーガニック検索を自社のAI生成コンテンツに置き換えることを支持する最も説得力のある論拠は、検索結果の質が低い、つまり意味のないクリックベイトやAI生成のくだらない内容ばかりであるという点です。AI生成記事はまさにその証拠です。 

Googleは、自社独自のAI出力をリアルタイムで生成できるにもかかわらず、一体なぜAIが作成した他サイトの記事をインデックス化し、トラフィックをそちらに送る必要があるのでしょうか? Googleが自社のコンテンツの多くがAIによって生成されていると認識すれば、オーガニック検索を放棄し、外部サイトへのトラフィック送信を完全に停止する口実が得られるでしょう。 

Googleがまだモデルを変えていないため、今日少しトラフィックを獲得できる可能性は、あまり良いトレードオフではないように思える。そして、近いうちに誰もがその代償を払うことになるかもしれない。

注: 当社のすべての論説と同様に、ここで表明された意見は執筆者個人のものであり、Tom's Hardware チームのものではありません。 

Avram Piltchは特別プロジェクト担当の編集長です。仕事で最新ガジェットをいじったり、展示会でVRヘルメットを装着したりしていない時は、スマートフォンのルート化、PCの分解、プラグインのコーディングなどに取り組んでいます。技術的な知識とテストへの情熱を活かし、Avramはノートパソコンのバッテリーテストをはじめ、数多くの実環境ベンチマークを開発しました。