41
DeepMindのAIがQuake IIIのプレイを学習

写真提供:DeepMind

写真提供:DeepMind

開発者は、トレーニングモードやマルチプレイヤーゲームモードのシングルプレイヤー版、その他ゲームの一部に、愚かなボットを組み込むことがよくあります。これらのロボットは、適切な意思決定をすることは稀です。おそらくほとんどの人が、ボットが壁にぶつかったり、ぐるぐる回ったりするのを見たことがあるでしょう。DeepMindの人工知能はもう少し洗練されており、5月30日には、同社のボットがQuake IIIのキャプチャー・ザ・フラッグモードで人間のプレイヤーに勝てると発表しました。

DeepMindは、人間にたっぷりと謙虚な気持ちを味わわせてくれる機械の開発に長年取り組んできました。最も有名な例はAlphaGoです。AlphaGoは世界最高の囲碁棋士を圧倒的な強さで打ち負かし、棋士はAlphaGoが宇宙を探検している間、まるで自分の裏庭でAIと対戦しているようだと評しました。同社はまた、AIエージェントにStarCraft IIのプレイを教える取り組みも行っています。(別の組織であるOpenAIは、エージェントにDota 2を教えました。)

Quake IIIは囲碁とは大きく異なります。まず、一人称視点でプレイする3Dゲームであり、キャプチャー・ザ・フラッグ(Capture the Flag)モードは1対1の対戦ではなくチーム対戦です。DeepMindは、手続き型生成マップを利用するモードのバリエーションも採用しました。つまり、エージェントは事前に定義された空間における最適な解を単純に学習するのではなく、キャプチャー・ザ・フラッグの原理そのものを学習し、習得する必要がありました。

エージェントがQuake IIIのプレイ方法をどれほど上手く学習したか、その一例として挙げましょう。DeepMindはこれらのエージェントを「For The Win(FTW)」と名付けましたが、まさにその名にふさわしいものでした。当初はキャプチャー・ザ・フラッグについて何も知らなかったにもかかわらず、ゲームのルールと成功の核となる原則を非常に早く習得しました。最終的には、エージェントと人間が対戦するトーナメントで、40人の人間プレイヤーを圧倒しました。まさに科学的な成果と言えるでしょう。

DeepMindは、FTWの成功の一部は、エージェントの文字通り人間離れした反応速度に起因する可能性があると認めた。(繰り返しになるが、私たちのほとんどは、どんなに頑張って勝とうとしても、一体どうやってボットに打ち負かされるのかと疑問に思ったことがあるだろう。)そこで、FTWの反応速度が遅くなったが、案の定、エージェントは人間に勝利した。さらに、同社は、ほとんどのプレイヤーがFTWを人間よりも協調性が高いと評価したとも述べている。

つまり、下手なプレイヤーをボットと呼ぶのはもうやめるべき時が来たということです。FTWは、AIがゲームのルールを学習し、基本を理解し、人間と同等の反応速度のハンディキャップを課されても人間に勝てるほどゲームを巧みにこなせることを示しました。これらのボットは実際にはほとんどの人間よりも優れたチームメイトでもあるので、これらのエージェントが主流になれば、誰かをボットと呼ぶことはむしろ褒め言葉になるかもしれません。

AIにとって何を意味するのか

Tom's Hardware の最高のニュースと詳細なレビューをあなたの受信箱に直接お届けします。

FTWがキャプチャー・ザ・フラッグ、そして後にQuake IIIの他のゲームモードで成功を収めたのが、単なる遊びだったというわけではありません。DeepMindは、このプロジェクトの取り組みは「マルチエージェントトレーニングが人工知能開発を前進させる可能性を浮き彫りにする。マルチエージェントトレーニングによって提供される自然なカリキュラムを活用し、人間とさえチームを組める堅牢なエージェントの開発を促す」と述べています。

同社はまた、FTW が (おそらく意外なことに) 人間のような方法でキャプチャー・ザ・フラッグの遊び方を学習したとも述べています。

「教師なし学習を通じて、エージェントと人間の典型的な行動を確立し、エージェントが実際にチームメイトの後を追ったり、敵の基地に陣取ったりといった人間のような行動を学習することを発見しました。[...] これらの行動は、強化学習と集団レベルの進化を通じてトレーニングの過程で出現します。エージェントがより補完的な方法で協力することを学ぶにつれて、チームメイトの後を追うなどの行動は好まれなくなります。」

このプロジェクトに関する詳しい情報は、DeepMind の Web サイト、Science に掲載された論文、および 2018 年にこのテーマについて公開された YouTube 動画でご覧いただけます。

ナサニエル・モットは、Tom's Hardware US のフリーランスのニュースおよび特集記事ライターであり、最新ニュース、セキュリティ、テクノロジー業界の最も面白い側面などを扱っています。