FIFAワールドカップの結果をアクチュアリーとAIが予測-果たして、どちらの予測があたるのか:基礎研レター

日本人としてはAIの予測の方が若干は心地よく感じられるかもしれない。
Jorge Silva / Reuters

1―はじめに

サッカーの2018FIFAワールドカップロシア大会が6月14日に開幕した。開幕前には、いくつかの機関から結果に関する予測や予想が出されている。私が注目したのは、フランスのアクチュアリアル・コンサルティング会社で保険ソフトウェアベンダーでもあるADDACTISが行ったもの(*1)と、投資銀行のGoldman Sachsが公表したAI(Artificial Intelligence:人工知能)によるもの(*2)である。

私自身がアクチュアリー(*3)であることやAI時代のアクチュアリーの役割についてはここ最近話題に上ることも多いことから、両者の手法とその結果の差異を大変興味深く感じたので、調べてみた。

(*2) 報告書「The World Cup and Economics 2018」

(*3) 保険や年金、金融などの多彩なフィールドで活躍する「数理業務のプロフェッショナル」(日本アクチュアリー会HPより)

2―ADDACTISのアクチュアリーによる予測

ADDACTISの資料によれば、ADDACTISは、フランスのアクチュアリーのチームであるACTUARISがthe addactis® Modeling softwareと呼ばれる確率論的モデリングソフトウェアを使って、500万回のシミュレーションを実施して、FIFAワールドカップロシア大会の結果予測を行っている。

このチームは、2014年のワールドカップブラジル大会において、ドイツとアルゼンチンの決勝戦とドイツの優勝を正しく予測した。

1|具体的なアプローチ

具体的な保険数理的アプローチについては、プレスリリース資料で、以下のように説明されている。

「マルコフ連鎖モンテカルロモデル(*4)を適用し、the addactis® Modeling software の使用を通じて、各試合の最も可能性の高い結果を探し出し、試合が進むにつれて敗者を控除していくのではなくて、500万のシナリオをシミュレートしている。シミュレーションモデルは、将来の可能性のある全てのケースと使用される基準をレビューしている。」

(*4) Wikipediaによる説明は、以下の通り

「マルコフ連鎖モンテカルロ法(Markov chain Monte Carlo methods、MCMC)とは、求める確率分布を均衡分布として持つマルコフ連鎖を作成することをもとに、確率分布のサンプリングを行うアルゴリズムの総称である。M-H アルゴリズムやギブスサンプリングなどのランダムウォーク法もこれに含まれる。充分に多くの回数の試行を行った後のマルコフ連鎖の状態は求める目標分布の標本として用いられる。試行の回数を増やすとともにサンプルの品質も向上する。」

2|予測結果(優勝確率等)

これによると、各国の優勝確率は、ブラジルが16.66%でトップ、次がドイツで15.30%、フランスが13.75%、スペインが12.60%、アルゼンチンが10.22%と続いている。

これらの5カ国が10%を超える優勝確率で、5カ国の合計で68.53%となり、約7割を占めている。因みに第6位のコロンビアの優勝確率は3.96%と上記5カ国とはかなりかけ離れた数値となっている。

因みに、この予測によれば、日本の優勝確率は0.00%で32カ国中31位となっている。0%ということではないかもしれないが、小数点以下2桁の有効数字では数字が現われないほど極めて低い確率となっている。

参加32カ国中では、日本に加えて、韓国、サウジアラビア、パナマの4カ国が0.00%となっている。アジア・太平洋州の国では、イランが0.11%で最も高く、オーストラリアは0.01%となっている。

次に、予選リーグを勝ち抜いて、決勝トーナメントに進出する確率については、日本は12.47%で29位、日本より低いのは、オーストラリア11.76%、韓国9.09%、パナマ3.45%となっている。これは、基本的には各国の実力を反映する形にはなっているが、予選リーグの組み合わせも考慮された結果となっている。

3|予測結果(決勝の組み合わせ)

ADDACTISは決勝の組み合わせも予測しているが、これによると最も可能性が高い決勝戦はブラジル対ドイツで5.49%、次がブラジル対スペインで4.56%、以下、確率3%を超える組み合わせは、ドイツ対フランス3.88%、スペイン対フランス3.79%、ブラジル対アルゼンチン3.54%、フランス対アルゼンチン3.28%となっている。ただし、以上の6つの組み合わせの合計確率は24.54%で、結構高いようでそれでも1/4を占めるにすぎない。決勝の組み合わせを予測するのは大変難しい。

4|直近の実際の試合結果の状況

因みに、このレターを出稿した6月19日時点では、予選リーグにおいて、(日本はまだだが)各チームがほぼ1試合を消化している。優勝確率が高い上位5カ国のうち、ドイツがメキシコに敗れる等、勝利を収めたのはフランスのみである。

また、もしブラジルがEグループで1位となり、ドイツがFチームで2位となった場合、決勝トーナメントの1回戦でブラジルとドイツが対戦することになり、決勝での対決と言うシナリオは崩れることになる。

なお、ADDACTISは予選リーグの終了後に、新たなシミュレーションを行い、予測を洗練するとしている。

3―Goldman SachsのAI(人工知能)による予測

次に、投資銀行Goldman Sachsは、独自のAI(人工知能)アルゴリズムに基づいて、結果を引き出している。

1|具体的なアプローチ

具体的なアプローチについては、報告書で、以下のように概要が説明されている。

「20万のモデル、『機械学習』の最近の進展を利用して、チームの特性や個々の選手のデータを調べて、どの要因が試合のスコアを予測するのに役立つかを分析する。これにより、私たちに多数の予測がもたらされ、それらが全体的な予測を生成するために結合される。各チームがラウンドを進行する確率を測定するために、トーナメントの可能な進展を100万回シミュレートする。」

さらに、より詳しく以下のように説明されている。

「チームの特性、個々のプレーヤー、最近のチームのパフォーマンスに関するデータを、4つの異なるタイプの機械学習モデルに入力して、各試合で獲得したゴール数を分析する。モデルは、2005年以来の競争力のあるワールドカップと欧州カップの試合のスコアを使って、得点と得点の関係を学ぶ。変数の代替組み合わせを循環させることによって、成功のためにどの特徴が重要か、どれがベンチに留まっているべきかの感覚を得る。次に、このモデルを使用して、トーナメントの各対決で得点されるゴール数を予測し、丸められたスコアを使用して勝者を決定する。」

各種の変数が全体的な説明力にどの程度貢献しているのかについては、チームのレーティングが40%と最も高く、次がプレーヤーのレーティングが25%、最近のチームや対戦相手の実績(最近10試合の勝敗の割合)がそれぞれ10%弱で続いている。

2|予測結果(優勝確率等)

この結果、各国の優勝確率は、ブラジルが18.5%トップ、次がフランスで11.3%、ドイツが10.7%、ポルトガル9.4%、ベルギー8.2%、スペイン7.8%、英国6.5%、アルゼンチン5.7%となっており、ADDACTISの予測に比べて、ブラジルの優勝確率が高く、その他の有力国の優勝確率は低くなっている。

一方で、ポルトガル、ベルギー、英国といったADDACTISの予測では、それぞれ2.26%、3.76%、3.81%と有力国に比べて相対的に低い優勝確率が、それぞれ9.4%、8.2%、6.5%と高くなっている。

因みに、Goldman Sachsは過去3回のワールドカップにおいてもブラジルが優勝することを予測していたが、それぞれ2006年ドイツ大会はイタリア、2010年南アフリカ大会はスペイン、2014年ブラジル大会はドイツが優勝しており、結果として優勝国を当てることはできなかった。

なお、Goldman Sachsの予測によれば、日本の優勝確率は24位で0.4%となっており、極めて低い確率であることには変わりはないが、ADDACTISの予測に比べれば、日本にとっては優しい結果となっている。

さらに、日本が決勝トーナメントに進出する確率も36.5%とかなり高くなっている。ただし、これは参加国中22位の水準である。

また、各グループの結果も予測しているが、これによれば日本は1分け2敗(セネガルと引き分け)となり、予選リーグで敗退する予測になっている。

3|予測結果(決勝の組み合わせ)

決勝の組み合わせについては、ADDACTISと同様に、ブラジルとドイツを予測している。フランスの優勝確率が単独では2位であるにも関わらず、決勝の組み合わせがブラジルとフランスにならないのは、決勝トーナメントの組み合わせで、ブラジルとフランスが各グループを1位通過して、順当に勝ち進んでいけば、両チームは準決勝で対戦することになるからである。

なお、決勝の結果については、ブラジルが1.70ゴールを挙げて、ドイツの1.41ゴールを上回り、優勝するとしている。

4―最後に

以上、ワールドカップロシア大会の結果については、多くの予測や予想が出されているが、その中で「アクチュアリーとAIによるという2社の例」を紹介してきた。

予測手法が過去のデータ等をベースにしているとはいえ、その予測手法の違いやアクチュアリーという専門家とAIによる予測との違いから、その予測結果はかなり異なる特徴を有するものとなっている。

・どちらの予測でも今回のワールドカップでの優勝確率の最も高い国はブラジルである。

・過去に優勝経験がある有力国の優勝確率については、両者でかなり様相が異なっている。

・AIは、ブラジルに、より高い評価を与えている。

・アクチュアリーの優勝確率の予測は、有力国に集中しているが、AIの予測は相対的に有力国以外にも幅広く分布している。さらに、ポルトガルやベルギーといった優勝未経験国の優勝確率もかなり高くなっている。

・決勝の組み合わせを予測するのは、予選リーグでの各種の番狂わせの発生等を考慮するとかなり難しい。それでも強いチームは勝ち上がってくることが予測されることになる。

さて、皆さんは、アクチュアリーとAI、どちらの予測がより適切と考えるだろうか。

日本人としてはAIの予測の方が若干は心地よく感じられるかもしれない。それでも、予選リーグの予測は1分け2敗と厳しい内容である。日本人としては、これらの予測を大きく上回る結果を期待したいものである。

なお、念のため最後に一言だけ添えておく。ここまで、アクチュアリー対AIという言い方をしてきたが、あくまでもそれぞれの専門家等の資格を有する個人やグループ、会社による予測である。アクチュアリーと言っても、同様のデータに基づいていても、異なる予測手段や判断基準の採用で、別のアクチュアリーは今回の結果とは異なる結果を導き出すことになるかもしれない。AIも然りだろう。

いずれにしても、アクチュアリーとAI、どちらの予測がより的中することになるのか。あるいは両者の予測とはかなり異なる結果が発生することになるのか。1ヵ月後の7月15日(日)には決勝が行われ、結果が判明することになる。

引き続き、これからの1ヵ月間が大変楽しみである。

関連レポート

(2018年6月19日「基礎研レター」より転載)

株式会社ニッセイ基礎研究所

常務取締役 保険研究部 研究理事

注目記事