
今年、社会から隔離された生活を送らない限り、LLM(大規模言語モデル)を搭載したチャットボットが検索エンジンからメールの受信トレイまで、あらゆる場所で利用されていることはご存知でしょう。ChatGPT、Bing Chat、Google Bardを使えば、多くの興味深いタスクを実行できますが、答えやアドバイスを探している場合は、必ずしも信頼できるとは限りません。
巨大なAIボットはインターネット上から情報を収集し、多くの場合、情報源を明示することなく、それらを混ぜ合わせます。情報がない場合、不足している情報を埋めるために 「幻覚」をしたり、事実を捏造したりします。
読者の皆様には、AIのインタラクティブな自然言語処理能力と、信頼できる人間によるアドバイスや検証を組み合わせたツールが求められています。そこで、Tom's Hardwareの専門家によるレビュー、購入ガイド、チュートリアル、ニュースを学習したチャットボット「HammerBot」を導入します。このボットは、ご質問にテキストで回答するだけでなく、ご質問のトピックに関する記事へのリンクも提供し、より詳しい情報をご提供します。
ハンマーボットの仕組み
HammerBotのバックエンドの仕組みについても詳しくご紹介します。現在、開発者はOpenAIのtext-davinci-003モデル(GPT-3)を使用し、当社の論文をカスタムデータセットで学習させています。データはWeaviateのベクターデータベースに保存されており、ボットは主にPythonでコーディングされており、AI出力のカスタマイズを容易にするフレームワーク であるLangChainを使用しています。
プロンプトを入力すると、サーバーはWeaviateに保存されているデータセットに対してクエリを実行し、検索結果を取得します。その後、検索結果はLLMに送信され、LLMは質問に対する一貫した回答を作成します。
Tom's Hardware の最高のニュースと詳細なレビューをあなたの受信箱に直接お届けします。
多くのチャットボットは、地球上のあらゆることについて話しかけてきます。しかし、HammerBotに編み物のパターンを尋ねてはいけません!HammerBotは、話す内容に制限を設けて設計されています。Tom's Hardwareでしか得られない専門知識に重点を置いているため、トレーニング範囲外の質問には「わからない」または「答えられない」と答える場合があります。
既知の問題
HammerBotの出力を改善する方法が見つかると確信しています。以下にいくつか例を挙げます。
- 回答が古くなっている場合があります。時々、旧世代の製品を推奨することがあります。
- 回答が必ずしもトップ リンクになるとは限りません。検索結果のトップ リンクは、チャットの回答に最も直接的に関連するリンクではない場合があります (例: 回答に Ryzen 5 5600X について言及されているが、トップの結果は Ryzen 5 5600X のレビューではない)。
- おすすめのオファー:セクションには、チャットに一致する製品がない可能性があります。
- かなり短い回答:現時点では、ほとんどの回答が少し簡潔です。
- モバイルで入力すると、チャット ウィンドウが拡大表示される場合があります。
- 必ずしも Tom's Hardware の意見ではない 意見を表明する場合があります。
より多く、より良いものがすぐに登場
既知の問題(および未知の問題)の一部を解決するだけでなく、ベンチマーク、製品仕様、最新の価格といった構造化データへのアクセスを含む新機能を追加することで、HammerBotをより強力なツールにしたいと考えています。現在、モデルは記事のテキストからこれらのデータの一部を取得していますが、その形式では整理されていません。
ボットに2つのCPUを比較するように指示すると、両方のCPUが入ったチャートと、それぞれのスペックを並べた表が表示されるようにしたいと考えています。また、PCの買い物リスト作成もボットに手伝ってもらいたいと思っていますが、まだ実現には至っていません。
HammerBotに何をしてほしいですか?このスレッドで教えてください。
Avram Piltchは特別プロジェクト担当の編集長です。仕事で最新ガジェットをいじったり、展示会でVRヘルメットを装着したりしていない時は、スマートフォンのルート化、PCの分解、プラグインのコーディングなどに取り組んでいます。技術的な知識とテストへの情熱を活かし、Avramはノートパソコンのバッテリーテストをはじめ、数多くの実環境ベンチマークを開発しました。