66
ディープマインドとブリザード、「スタークラフトII」をマスターできるAIエージェントの開発に研究者を招待

StarCraft II のミニゲームをプレイする AI エージェント

StarCraft II のミニゲームをプレイする AI エージェント

DeepMindとBlizzardは、StarCraft IIがオープンな人工知能研究環境となり、プレイヤーが独自のAIエージェントを開発・訓練してゲームで勝利できるようになると発表しました。他のゲームボットとは異なり、新しいAIエージェントは人間のプレイヤーと同じようにゲームを学習し、ゲームを捉えます。不公平なアドバンテージを与えるようなプログラミングのショートカットはありません。

ディープマインドAI

DeepMindは創業当初から、複雑な問題を解決できるAIエージェントの構築に取り組んできました。同社のAIエージェントは、Atariのゲームをプレイすることから始まり、世界トップの囲碁のグランドマスターに勝利するまでに成長しました。これは、AIの専門家が少なくとも10年は不可能だと考えていた偉業です。また、DeepMindのAIは、Googleのデータセンターの冷却コストを40%削減するなど、実社会での応用にも活用されています。

DeepMindの最新プロジェクトは、はるかに複雑なゲーム「StarCraft II」を制覇することです。同社のAIエージェントが、独自の3Dワールドを持つ「StarCraft II」のような戦略ゲームで、人間のトッププレイヤーに定期的に勝つことを学習できれば、そのAIはより高度な現実世界のアプリケーションにも活用できるようになります。

「スタークラフトII」を制覇するのが難しい理由

StarCraft IIのようなゲームがAIエージェントにとって囲碁よりもはるかに学習が難しい理由は複数あります。一つは、StarCraft IIは囲碁よりもはるかに自由度が高いことです。また、ゲームプレイのルールも多く、はるかに複雑なゲームとなっています。

もう一つの理由は、囲碁では両プレイヤーがゲーム内で何が起こっているかを常に正確に把握しているのに対し、StarCraft IIでは、ゲームを通して各プレイヤーが対戦相手について知っていることが戦場の霧によって曖昧になってしまうことです。そのため、StarCraft IIではAIにとって予測不可能な展開となるはずですが、最終的にはAIがゲームの特定の時点で人間プレイヤーが用いる最も一般的な戦略を解明する可能性はあります。

ゲームのリプレイが増えれば増えるほど、StarCraft IIのAIエージェントはより優秀になるはずです。StarCraft IIはオンラインで対戦する人気ゲームなので、データソースとして使えるリプレイは豊富にあるはずです。

StarCraft IIでは、実行できる基本アクションが 300 種類ありますが、Atari ゲームでは 10 種類 (上、下、左、右など) しかありません。

Tom's Hardware の最高のニュースと詳細なレビューをあなたの受信箱に直接お届けします。

下の動画の左側では、初期段階のトレーニングエージェントは、ワーカーに採掘を継続させることさえできていません。これは人間のプレイヤーにとっては簡単なタスクです。動画の右側では、トレーニング済みのエージェントはより意味のあるアクションを実行できますが、DeepMindによると、StarCraft IIに組み込まれている最も簡単なAIでさえも倒すことができません。

DeepMindチームは、AIエージェントにStarCraft IIを上手くプレイさせる訓練が簡単ではないことを十分に理解しているようです。そのため、DeepMindとBlizzardのツールを活用して独自のエージェントを作成し、誰もがそのプロセスから学ぶことができるようにすることを推奨しています。

ツールには次のものが含まれます。

  • ブリザードが開発した、研究者にゲームへの洞察を提供する機械学習API
  • 65,000 回のゲームリプレイ(数週間で 50 万回以上)
  • DeepMind の PySC2 ツールセットのオープンソース版により、開発者は Blizzard の機能レベル API をより簡単に使用できるようになります。
  • 研究者がAIエージェントをテストできるミニゲームのセット
  • DeepMindとBlizzardが執筆した研究論文では、テストAIエージェントとStarCraft IIの内蔵AIとの初期結果が報告されている。

ルシアン・アルマスは、Tom's Hardware USの寄稿ライターです。ソフトウェア関連のニュースやプライバシーとセキュリティに関する問題を取り上げています。