AlphaGoが囲碁の世界チャンピオンに18回輝いたイ・セドルを破ってから1年後、このAIは世界最高の囲碁棋士と目される柯潔と対戦した。AlphaGoはわずか0.5点差で柯潔を破った。これはAIの「より安全な」勝利戦略によるものかもしれない。
アルファ碁AI
AlphaGo AIは、Googleのデータセンターの冷却コストの削減や、いくつかの病気のより良い治療法の発見にすでに使用されているDeepMindの中核技術に基づいて構築されています。
AlphaGoはDeepMindのAIの特別なバージョンで、囲碁の打ち方しか知りません。Googleは、コンピュータービジョンを通して学習するAlphaGoに、プロ(人間)の囲碁棋士同士の何百万もの対局を「見せ」、さらにAlphaGoに自分自身と対戦させることで、自身のミスから学習させました。基本的に、AlphaGoは人間と同じように学習します。つまり、他者が課題をうまくこなすのを見て、その課題を何度も繰り返し、スキルが向上するまで学習するのです。
この機械学習技術は、AlphaGoに囲碁の打ち方を教える革新的な方法であっただけでなく、AlphaGoの学習成功に不可欠なものでした。というのも、それまでチェスに特化した人工知能がプログラムされていたのと同じ方法で、囲碁を打って勝つように人工知能をプログラムすることは不可能だったからです。
Googleによると、囲碁の可能な手は宇宙の原子の数よりも多いため、AIが勝ち手を見つけるまで全ての手を「先読み」することは不可能だったはずだ。専門家が囲碁でAIが勝つには、AlphaGoが誕生するまで少なくとも10年はかかると考えていたのもこのためだ。
AlphaGo は、人間が最も効果的にプレーする方法を学習することにより、さまざまな囲碁のシナリオで勝利の手を再現するだけでなく、勝利の手がどのようなものになるかを示す独自のパターンを作成することもできました。
最終的に、この結果、AlphaGoは李世ドル、そして今や柯潔といった世界最高の囲碁棋士さえも破ることができました。しかし、最終的な勝者が決まるまでには、柯潔にはまだあと2回の挑戦が残っています。
Tom's Hardware の最高のニュースと詳細なレビューをあなたの受信箱に直接お届けします。
AlphaGoが3戦1勝
AlphaGoとイ・セドルはこれまで5回対戦しているが、今回はAIと柯潔の対戦は3回のみとなる。
初戦で柯潔はAlphaGoに0.5点差という、可能な限り僅差で敗れた。しかし、スポーツではよくあることだが、最終スコアは必ずしも試合がどれほど接戦だったかを明確に示すものではない。DeepMindの創業者デミス・ハサビス氏によると、AlphaGoは大差で勝つことよりも、とにかく勝つことに興味があるという。結局のところ、囲碁において重要なのは勝利であり、AlphaGoもこの点を重視しているようだ。
AlphaGoに対する戦略
AlphaGoに何を期待すべきか全く分からなかったイ・セドルとは異なり、柯潔はこの対局にかなり備えていた。セドルとの対局だけでなく、「マスター」というニックネームでAlphaGoがオンラインで展開した他の対局も見ていたため、GoogleのAIがどのような指し方を好むかをある程度理解していた。
柯潔は、以前AlphaGoがオンラインで使っていた戦略を試したが、結局うまくいかなかった。AlphaGoはトレーニング中に既にそのような手を自身に当てていたはずだと柯潔は知っていたはずだ。つまり、AlphaGoはそのような状況で「自分自身を倒す」方法も知っているはずだ。
AlphaGoに対してより効果的な戦略は、AlphaGoがこれまで見たことのない戦略かもしれません。しかし、Googleがトッププレイヤーによる何百万もの対局をAlphaGoに見せていることを考えると、そのような「見たことのない手」を思いつくのは、特に何百万時間ものビデオを見て練習することができない人間のプレイヤーにとっては難しいかもしれません。
しかし、ハサビス氏によると、AlphaGoのAIは、囲碁の戦略を考える際に、不可能な手はないと考えるように仕向けることで、囲碁プレイヤーを「解放」したようにも見えるという。これは、囲碁プレイヤーが将来、より革新的な手を試すことにつながる可能性があるが、柯潔が今後AlphaGoとの対戦でその戦略を試すかどうかはまだ分からない。
Googleはまだこれについて何も言及していないものの、AlphaGoのニューラルネットワークと、すべての計算を行うハードウェアは、昨年から大幅にアップグレードされている可能性が高い。Googleは最近、第2世代の「Tensor Processing Unit(TPU)」であるCloud TPUを発表した。これは推論性能が大幅に向上しただけでなく、高いトレーニング性能も備えている。Googleは以前、AlphaGoのエンジンとしてTPUを使用していたため、柯潔との対局でも次世代版のTPUがAlphaGoに使用された可能性がある。
次のAlphaGo対局
柯潔対AlphaGoの次の対局は木曜日に行われ、決勝戦は土曜日にストリーミング配信されます。これらの対局が行われる中国・烏鎮で開催される「Future of Go Summit」では、5人の人間棋士と1台のAlphaGo AIによる対局、そしてAlphaGo AIインスタンスの支援を受けた2人の人間棋士による対局も行われます。
ルシアン・アルマスは、Tom's Hardware USの寄稿ライターです。ソフトウェア関連のニュースやプライバシーとセキュリティに関する問題を取り上げています。