BLOG

AIは囲碁や将棋の必勝法等にどのような影響を与えていくのか:研究員の眼

2017年06月23日 15時04分 JST | 更新 2017年06月23日 15時04分 JST

はじめに

5月23日~27日に、グーグル傘下のディープマインド(Google DeepMind)社によって開発されたコンピューター囲碁プログラムの「AlphaGo(アルファ碁)」が、中国の世界最強とされるプロ棋士である柯潔(かけつ)氏との3番勝負で3戦全勝した。

2016年3月9日~15日には、韓国の世界トップクラスのプロ棋士の1人である李世乭(イ・セドル)氏との5番勝負で4勝1敗で勝ち越しており、これにより、AlphaGoは人間を超える実力を備えたことを証明した。

こうした時期がいつかやってくるということは想定されていたとはいえ、あまりにも早期に実現されたことから、若干寂しい思いもする結果であった。もちろん、AI(人工知能)の研究における画期的な進展を示すものとして、歓迎されるべきものであることは言うまでもない。

さて、個人的には、コンピューター・プログラム等の進展によって、各種のボードゲーム(囲碁、将棋等)の先手や後手の必勝法の解明が進展して、これまで人間同士の対局の経験等によって得られてきた以上の情報がどの程度得られてくることになるのかについて、大きな関心を有している。

先手・後手有利の状況

各種のボードゲームについて、先手や後手の有利性を巡る現在の状況は、以下のようになっている。

「囲碁」については、陣地取りのゲームで、明確に先手が有利と考えられており、先手の有利性を「コミ」という仕組みで調整している。

コミは時代によって経験等に基づいた改正が行われてきており、以前は4目半であったものが、1974年に5目半に、さらに2002年に6目半に改正されている。

「将棋」についても、一般的に先手が有利と考えられているが、その理由については、碁ほどに万人が納得するような説明はなされていないように思われる。

ただし、日本将棋連盟が公表していたプロ棋士の対局データに基づけば、先手の勝率が52%~54%程度となっていた。なお、将棋の場合には、囲碁のような調整の仕組みはない。

「チェス」については、先手がかなり有利とされており、過去の人間やコンピューター同士の対戦データに基づくと、先手の勝率が55%程度になっているようである。

ただし、この勝率は引き分けを0.5勝とした場合の数値であり、引き分けが3割~4割程度を占めていることから、勝敗が付く場合の先手の勝率はさらに高くなっている。従って、実力者同士の対局では、後手はまずは引き分けを狙うとも言われている。

なお、これらのゲームにおいては、先手と後手をランダムに決定するために、囲碁ではニギリ、将棋では振り駒等の方式が採用されている。

二人零和有限確定完全情報ゲーム

実は、このようなゲームは、ゲーム理論において「二人零和有限確定完全情報ゲーム」として分類されている。偶然(運)に左右されないゲームがこれに相当している。その具体的な定義については、その漢字表現から感覚的に理解してもらうことにして、ここでは詳しくは説明しない。

これらのゲームは、理論上は完全な先読みが可能で、双方のプレーヤーが最善の手を打てば、必ず、①先手必勝、②後手必勝、③引き分け、のいずれかになることが知られている。

ただし、選択肢が多くなると完全な先読みを行うことは困難になるので、人間の行うゲームとして成立する形になっている。コンピューターの場合、人間と比べれば、より多くのパターンの解析を行うことができるため、一定のゲームにおいては、完全な解析を通じて、ゲームの結果の解明が行われている。

例えば、「オセロ」については、6×6の盤のケースでは、双方が最善の手を打った場合、「16対20で後手が必勝」となることが1993年に証明されている。

さらに、小さい頃に、誰しもが遊んだ経験があると思われる「五目並べ」については、「先手必勝」であることが、既に100年以上も前に証明されている。

また、将棋の簡略版として2008年に考案された「どうぶつ将棋」については、2009年に「78手で後手必勝」となることが確認されている。

「チェッカー」については、2007年にアルバータ大学の研究グループによって、双方が最善の手を打った場合、必ず引き分けになることが証明されている。

このように、一部のゲームは解析が完了しているが、囲碁や将棋やチェスについては、いまだいかなる結論になるのかはわかっていない。即ち、仮にこれらのゲームが(何の調整の仕組みもない状態で)先手必勝だとしても、どの程度先手が有利なのか等は解明されていない。

コンピューターによる囲碁・将棋等の必勝法の完全解明の可能性

その意味で、コンピューター・プログラム等の進展によって、これらのゲームの必勝法の完全解明がなされることがあるのだとすれば、大変興味深いことである。

ただし、これだけコンピューターの性能が向上している現在においても、囲碁や将棋について、その全てのパターンを解析して、結論を導き出すことについては相当な負荷がかかり、新たなIT技術の適用等が可能になってくれば、実現してくる可能性もあるのかもしれないが、現段階での実現はかなり困難なことと考えられている。

実際に、計算機科学者の松原仁公立はこだて未来大学教授によれば、勝負が付くパターンの数について、結論が出ている「チェッカー」や「6×6のオセロ」の場合には、10の30乗のレベルであるのに対して、(8×8の)オセロは10の60乗、チェスは10の120乗、将棋は10の220乗、囲碁は10の360乗のレベルになるとのことである。

因みに、太陽の寿命は100億年程度と言われているが、これは約3.2×10の17乗 秒ということになるので、先の数値がいかに大きな数であるかが分かることになる。

コンピューターによる囲碁・将棋等の必勝法の解明の進展

そこで、まずは、高い能力を有するコンピューター・プログラムの対局を通じて、囲碁や将棋等の先手の有利性の程度等を少しでも解明していくことができるのであれば、それが当面の現実性のある目標ということになるものと思われる。

例えば、AlphaGo同士の対局を通じて、現在のトップレベルの対局ではどの程度の「コミ」が適正なのか、今後囲碁の技術等が進歩していくと先手の有利性の程度はどのように変化していくことになるのか、というようなことが解明されていけば、大変面白いのではないかと考えられる。

ただし、グーグルは、AlphaGoで培った技術を医療やエネルギー分野に応用することに注力するということで、今回の勝利の後に人間との対局については終了することを表明している。

AlphaGoは、「深層学習(Deep Learning)」という人間の脳をまねた多層構造のニューラルネットワークを用いた機械学習と、「強化学習(Reinforcement Learning)」という自己対局の繰り返しによって、自らで勝ち方を生み出すシステムを作り上げているようである。

これによれば、今後こうしたコンピューター・プログラム自身が、これまでにない新たな戦法を開発していくことも期待されていくことになる。これまでに人間が考え出した戦法に基づいて得られている結果が、コンピューターによる対局で異なる結果となっていくことも考えられることになる。

なお、ディープマインド社は、柯潔氏との対戦終了後、AlphaGo同士の棋譜50局を公開したが、これによれば、これまでの常識では考えられない手が続出していたとのことである。

今後とも、AlphaGo等のコンピューター・プログラム同士による対局は引き続き一定程度行われていくことになるものと思われる。それでも、人間を超える実力を備えるという目標を達成した後では、先に述べたような興味関心への分析に対しては、これまでのような資源配分は行われないものと思われる。

本来的なAIの応用に注力していくことになるのはやむを得ないものと思われるが、若干残念な気もしている。

最後に

実は、必勝法の存在や先手や後手がどの程度有利なのかという点については、本当はあまり気にすることではないのかもしれない。現在のルールは、過去からの人間の対局を通じて得られた経験データ等に基づいて、一定の判断が行われて、設定されてきたものである。

仮に、これから、人間以上の先読みが可能なコンピューター・プログラムが、その自己対局等に基づいて、何らかの結果を導いたとしても、人間同士の対局でそのような結果が得られるとは限らない。

従って、コンピューター・プログラムによって得られる結果はあくまでも参考程度のものでしかないともいえる。

一方で、コンピューター・プログラムが強くなっていくことを通じて、人間もまたその技術を学ぶことで強くなるというような形で、人間の能力も向上していくことが考えられる。

実際にそのような形で、お互いが切磋琢磨して、さらなる高次元の勝負が行われるようになり、ゲームの醍醐味が増していくことが期待されているものと思われる。

また、コンピューターによって、ゲームの結果が完全に解明されたとしても、ゲームの面白みが失われて、ゲームの寿命が終わるということにはならないだろう。「五目並べ」もそれ自体引き続き幅広く楽しまれているし、ルールを変更した「連珠」が競技として普及している。

結局は、ゲームを楽しむのは人間であり、ゲームのルールを作るのも人間自身である。必要とあらばルールを変更することも、スポーツの世界ではしはしば行われている。ゲームの世界も結局は、必要に応じて、適当なルールの調整を行っていくことも、また必要不可欠だと言うことだろう。

仮に、完全なゲームの解析がコンピューターで行われたとしても、ちょっとしたルールの変更がこうした分析の前提を大きく変更することになり、これらの解析の意味を低下させてしまうことにもなる。こうしたルールの変更にコンピューターがどの程度柔軟に対応できるのかはわからない。

いずれにしても、人間がゲームの主体である限り、人間はそうしたルール変更等も自在に行うことができ、それに対応できる柔軟性を有している。

AIがいくら高度に発展し、ゲームの必勝法を解明したとしても、人間は、自分たちが決めたルールの中で、自らの頭で考え出した最善の手を尽くすことで、引き続きゲームの奥深さの魅力を感じつつ、ゲームを楽しむことができる、ということだろう。

関連レポート

スポーツのサーブ権交代のルールは勝敗にどう影響しているのか-各種球技のサーブ権のルールの意味合いを知れば、オリンピックをより楽しめるかも-

機械対人間の競争~進歩が生む問題への対応も必要に~

ロボ・アドバイザー入門

(2017年6月12日「研究員の眼」より転載)

メール配信サービスはこちら

株式会社ニッセイ基礎研究所

取締役 保険研究部 研究理事

中村 亮一