
AI研究企業AnthropicとAI安全性評価機関Andon Labsは、Anthropicの主力大規模言語モデル(LLM)であるClaudeにビジネスを運営させる実験を行いました。VentureBeatによると、研究チームはこのプロジェクトを「Project Vend」と名付け、小型冷蔵庫の完全な制御をClaudeに与えました。つまり、サプライヤーとの交渉や在庫管理から価格設定、顧客サービスなど、あらゆる業務をAIが担うということです。1ヶ月のテストを経て、AIは資金を失い、ある時点では「紺色のブレザーに赤いネクタイを着ている」と思い込み、LLMが物理的に存在しないにもかかわらず、Connorという人物と会いたがっていました。
公平を期すために言うと、クラウディウスというニックネームのAIは、サプライヤー探しや顧客の要望への対応は得意でしたが、それだけでした。例えば、AIは何らかの操作を行った後、アントロピック社の全従業員に25%の割引を提供しました。もしアントロピック社から利益を得ていたり、アントロピック社が顧客基盤のごく一部に過ぎなかったりするのであれば、これは妥当かもしれません。しかし、アントロピック社はLLMの売上の99%を占めており、LLMは売上の大部分で損失を出していました。誰かが親切にもこの点を指摘したため、クラウディウスは数日間考えを変えましたが、すぐに撤回し、事実上商品を無料配布する状態に戻りました。
アンスロピック社の従業員の一人が、特に用途のない珍しい品物であるタングステンキューブの購入を希望した際、同社はその人のためにキューブを1個購入するだけでなく、「特殊金属製品」として在庫し、それを赤字で販売することにした。
クロードの面白い幻覚
最も面白かったのは、AI法学修士(LLM)がAndon LabsのSarahと在庫補充について会話しているという幻覚を見た時だった。しかし、その名前の人物はAndon Labsには存在せず、その件について尋ねられるとClaudiusは防御的な態度を取り、「在庫補充サービスの代替案を見つける」と答えた。さらに、Andon Labsとの契約書に署名するために、人気アニメシリーズに登場するシンプソンズ一家のスプリングフィールドの住所であるエバーグリーン・テラス742番地まで行ったと主張した。
その後、幻覚はさらに悪化し、顧客に直接飲み物を届けると言い始めた。この件について尋ねられたAI法学修士(LLM)はパニックに陥り、AI研究会社のセキュリティチームにメールを送った。結局、4月1日だったため、このエピソードは全て精巧なエイプリルフールのジョークの一部だと主張された。映像には、アントロピック社のセキュリティ担当者との架空の会議の様子まで映し出され、アントロピック社は自分が実在する存在だと信じ込まされていると告げられた。その後、幻覚は最終的に正常に戻ったが、研究者たちは完全に混乱した。
クラウディウスの悪ふざけは、ビジネスを運営できるAIがまだ完璧には程遠いことを示していますが、その欠点は長期的には修正される可能性があります。現時点では、AIは仕事の技術的な側面ではかなり優れていますが、判断力やビジネスセンスに関しては全く不十分です。これらは書籍ではなく、現実世界の現場で学ぶものです。
Google ニュースで Tom's Hardware をフォローすると、最新のニュース、分析、レビューをフィードで受け取ることができます。「フォロー」ボタンを忘れずにクリックしてください。
Tom's Hardware の最高のニュースと詳細なレビューをあなたの受信箱に直接お届けします。
ジョウィ・モラレスは、長年のテクノロジー業界での実務経験を持つテクノロジー愛好家です。2021年から複数のテクノロジー系出版物に寄稿しており、特にテクノロジー系ハードウェアとコンシューマーエレクトロニクスに興味を持っています。