25
Runway の強力な Gen-2 テキスト動画変換ツールが誰でも無料で利用可能に
Runway Gen-2でのビデオ生成
(画像提供:Future)

数週間前、Runway Gen-2についてお伝えしました。これは、ユーザーの指示に基づいて4秒間の動画クリップを生成するオンラインテキスト動画変換ツールです。これまで、この無料サービスはRunwayのDiscordサーバー上のプライベートチャンネルでのみ運用されていたクローズドベータ版のみでした。しかし、本日よりGen-2は一般公開され、Discordではなく同社のウェブサイトからご利用いただけます。 

Runway Gen-2を使用するには、Runwayのサイトで無料アカウントを作成し、app.runwayml.com/ai-tools/gen-2 にアクセスしてツールにアクセスする必要があります(または、コントロールパネルのリンクをクリックしてください)。同社は、既存の動画を加工して見た目を変える(例えば、人物をクレイアニメに変える)Gen-1ツールを数ヶ月前から一般公開していましたが、Gen-2は「ロボットがビールを飲んでいる」といった簡単なテキストプロンプトをクリップに変換します。 

滑走路 Gen-2 の CItyscape クリップ

(画像提供:Tom's Hardware)

写真をアップロードして、Gen-2にその画像をインスピレーションとして使うように指示することもできます。私は自分の顔写真をアップロードして、「ビールを飲んでいる男性」を表示させました。 

ビールを飲んでいるこの男

(画像提供:Future)

このビデオの人物は私によく似ている。白髪頭の中年の白人男性で、白髪交じりのあごひげを生やし、光る緑色の眼鏡をかけている。だが、実際にはビールを飲んでいるわけではなく、口の中に何を詰め込んでいるのかはよく分からない。

この男がビールを飲んでいるのがこのクリップのきっかけでした

(画像提供:Tom's Hardware)

プロンプト(および必要に応じて写真)を入力したら、「生成」ボタンをクリックすると、ツールがリクエストの処理待ち状態かどうかを通知します。その後、動画の完成度を示すパーセンテージが表示されます。私のテストでは、プロンプトを入力してから動画が完成するまでに常に1分もかかりませんでした。これは、Gen-2のベータ版を使用した際に経験したことと一致しています。ただし、ベータ版ではプロンプトをDiscordボットに送信しましたが、ボットは進行状況のパーセンテージを表示せず、1分ほど経ってから動画を返信するだけだった点が異なります。

Runway Gen-2でのビデオ生成

(画像提供:Future)

動画が完成すると、画面に表示され、その場で再生することも、ボタンをクリックしてMP4ファイルとしてダウンロードすることもできます。また、アカウントのアセットセクションにも保存されます。

Tom's Hardware の最高のニュースと詳細なレビューをあなたの受信箱に直接お届けします。

Gen-2のベータ版とは異なり、無料で生成できる動画の数には制限があるようです。私の無料アカウントでは、動画の長さが60秒に制限されていました。1クリップあたり4秒とすると、合計15クリップになります。  

クレジットを使い切った場合、またはアップスケール(高解像度)やRunwayのウォーターマークのない動画などの追加機能をご希望の場合は、スタンダードアカウントにご登録いただく必要があります。スタンダードアカウントは月額15ドル、または一括払いの場合は年額144ドルです。この料金で、毎月125秒の動画を視聴でき、追加料金をお支払いいただくことで、さらに長い動画を視聴できます。 

数週間前にプライベートベータ版にアクセスして以来、Gen-2をかなりプレイしてきました。多くのクリップの出来栄えには感心していますが、非常に一貫性がなく、目の表情がおかしかったり、体の一部が歪んでいたりと、まるで不気味の谷から出てきたかのようなキャラクターもいます。

滑走路 Gen-2 を使用して生成された男性

(画像提供:Tom's Hardware)

良くも悪くも、このツールは特定のキャラクターの再現がかなり苦手です。何度か、ペッパピッグ、パディントンベア、そして「ブルーズ・クルーズ」のブルーといったアニメキャラクターの動画を作成させようとしましたが、動画は確かにそれらのキャラクターに似ていて、大抵はアニメっぽいのですが、似顔絵の精度はそれほど高くありません。特に、ペッパピッグの写実的な画像は本当に不気味で、まるでホラー映画から切り取ったかのようでした。

Peppa Pig video clip made with Runway Gen-2

(画像提供:Tom's Hardware)

Peppa Pig's Family Eating Bacon Runway Gen-2

(画像提供:Tom's Hardware)

企業ロゴを使った動画制作を依頼するのも無理はありません。トムズ・ハードウェアの名前やロゴを使った動画を何度か依頼したのですが、意味不明な文字が表示されました。 

TH logo clip

(画像提供:Tom's Hardware)

しかし、Runway Gen-2が本当に得意とするのは、ロボットがアルコール飲料を飲んでいる様子や、その他「バーらしい」ことをしている様子の画像を生成することです。ロボットがバーでお酒を飲んだり、タバコを吸ったり、踊ったり、ビールを注いだり、トイレで手を洗ったりしている様子を画像生成に指定するたびに、かなり良い結果が得られました。スタンドアップコメディを披露したり、ラウンジで歌ったりするロボットの映像も、なかなか良い出来でした。一方、バーでビリヤードやテーブルサッカー、ダーツをするロボットを画像生成に指定すると、結果はまちまちでした。

Robot at Bar

(画像提供:Tom's Hardware)

Robot at Bar

(画像提供:Tom's Hardware)

私が見つけた他の成功分野としては、家族が一緒に食事をしたり、都市や自然の風景をタイムラプスで撮影したりすることなどが挙げられます。

Families Eating (Generated by Runway Gen-2)

(画像提供:Tom's Hardware)

Runway Gen-2には限界があるにもかかわらず、多くのクリエイティブなクリエイターが多くのクリップをつなぎ合わせて、より長い動画に仕上げています。Runway Gen-2の動画で最も有名なのは、Pizza Laterというクリエイターが制作した、ペパロニ・ハグスポット・コマーシャルというピザのCMでしょう。Pizza Laterは後に友人と共同で、FlatuLessという偽の鼓腸薬のCMを制作しました。そのCMは下記に埋め込みました。 

音楽とナレーションは他のAIツールで作成され、すべてのクリップはAdobe After Effectsを使って人間がつなぎ合わせたものであることに注意してください。Pizza LaterがRed Giant VHSフィルターを使用しているため、クリップはまるで古いCMのようです。

Runway Gen-2 を試して、それを使って何が作成できるかを確認したい場合は、runwayml.com にアクセスして無料アカウントにサインアップするだけです。

Avram Piltchは特別プロジェクト担当の編集長です。仕事で最新ガジェットをいじったり、展示会でVRヘルメットを装着したりしていない時は、スマートフォンのルート化、PCの分解、プラグインのコーディングなどに取り組んでいます。技術的な知識とテストへの情熱を活かし、Avramはノートパソコンのバッテリーテストをはじめ、数多くの実環境ベンチマークを開発しました。