
自称アーティスト、バカ、そしてメーカーが、最も明白な AI ライバルである ChatGPT の技術を使用して、今では信用を失った Google の Gemini デモを作り直しました。
グレッグ・テクノロジーグレッグは、自身の名を冠したテック系エンジニアが公開した短い動画の中で、アヒルの絵について話し合ったり、手信号の絵文字について質問したり、OpenAIのGPT-4V AIにプレイ中のゲームを識別させたりしている。グレッグの動画は、Gemini AIのデモほど洗練されていないかもしれないが、音声と視覚からの指示をリアルタイムで組み合わせている点が実に素晴らしい。
グレッグ・テクノロジーのビデオ録画の背景については、Googleの
Gemini AI ローンチビデオ「Geminiを実際に体験」と題されたこのビデオは、発売日当時、主力ビデオとして公開され、Google CEOのサンダー・ピチャイ氏によると「Geminiの驚異的な機能を理解するには、実際に動作しているのを見るのが一番」と謳われていた。
すぐに、驚くほどかわいくて洗練されたGoogle Gemini AIが
ビデオは演出されたAIウォッチャーたちを失望させた主な問題は、提示された動画がリアルタイムで録画されておらず、Geminiが一連の静止画に反応していたことです。さらに、音声によるインタラクションはすべて動画制作プロセスの一環として後から吹き替えられたものでしたが、Geminiはデモ全体を通してテキストプロンプトに実際に反応していました。
Tom's Hardware の最高のニュースと詳細なレビューをあなたの受信箱に直接お届けします。
マーク・タイソンはトムズ・ハードウェアのニュース編集者です。ビジネスや半導体設計から、理性の限界に迫る製品まで、PCテクノロジーのあらゆる分野を網羅的にカバーすることに情熱を注いでいます。