BLOG
2018年03月12日 09時48分 JST | 更新 2018年03月12日 09時48分 JST

なぜフェイクニュースはリアルニュースよりも早く広まるのか

「うそ」の拡散を牽引しているのは、「インフルエンサー」とは言えない、ということだ。

米マサチューセッツ工科大学(MIT)メディアラボのソルーシュ・ボーソーイ氏らのチームがサイエンスに発表した論文が話題を呼んでいる

By Kenny Louie (CC BY 2.0)

ツイッターの創業以来11年間の膨大なツイートの蓄積から、フェイクニュースの拡散力をリアルニュースと比較した、初めての本格的な研究だ。

「うそは宙を舞うが、真実は後からのろのろとついていく」

『ガリバー旅行記』で知られるアイルランドの作家、ジョナサン・スウィフトは1710年のエッセーでそう述べている。

MITのチームの論文は、スイフトの慧眼を300年後にデータで論証した。

「うそ」がリツイートされる確率は「事実」よりも70%高く、より深く広く早く拡散する――論文はそう指摘する。

問題は、その理由だ。なぜ、ソーシャルメディア時代にも、「うそは宙を舞う」のか?

ボーソーイ氏らは、"外国政府の介入"や"ロボットによる大量拡散"よりも、ずっとシンプルで人間くさい理由を挙げる。

「人は、新奇な情報に注意を奪われがちだからだ」と――

●ツイッター全量が対象

ジョナサン・スウィフトは、1710年のエッセー「政治的なうそ」の中で、こう述べている。
うそは宙を舞うが、真実は後からのろのろとついていく。だから、真実に気づいたときには手遅れだ。すでにゲームは終わり、作り話はその役目を果たしている。それは、話題が変わった後や仲間と別れた後に、気の利いたウィットを思いつくようなものだ。あるいは、患者が亡くなった後に、絶対に効く薬を見つけた医者のような。
うその方が真実よりも早く広まる、というのは、世間知としては長く知られてきた。それをツイッターの徹底したデータ分析から裏付けているのが今回の研究だ。

この研究がこれまでと違うのは、ツイッター社が持つ創業以来の全量データ、つまり創業者のジャック・ドーシー氏が2006年3月21日に投稿した史上初のツイートから、2017年までの11年間の膨大なデータを対象としている点だ。

通常、ツイッターを研究対象とする場合、データ利用には上限と金額という2つの制約がかかる。

ツイッター社が提供する無料のAPIを利用する場合、データは全体の1%を上限としたサンプルとなる。それ以上のデータ規模が必要な場合、1000ツイート0.1ドル、全データの利用料金は年間100万ドル(1億円以上)とも言われてきた有料扱いだ。

ツイッターのツイート数は、1日あたりでも5億件以上と言われる。

予算が潤沢ではない多くの研究の場合、1%上限の無料APIを利用することとなる。

ちなみにツイッター社は昨年11月から、新たに過去30日分のデータにアクセスできる「プレミアムAPI」を月額149ドルで提供。将来的には全データを「プレミアムAPI」のアクセス対象にする、と述べている。

それにしても今回の研究が、現時点で全量データを研究対象としている点は、やはり画期的だ。

●「うそ」と「事実」の拡散

この全量データの中から、今回対象としたのは、英語によるツイートだ。

そしてボーソーイ氏らが研究のべースとしたのは、「スノープス」「ポリティファクト」などファクトチェックに取り組む6つのサイトが真偽の判定をおこなった、2448件のネットの「うわさ」。

その内訳は、1699件が「うそ」、490件が「事実」、259件が「どちらとも言えない」。

これらの「うわさ」のツイッターへの投稿を起点として、リツイート(転送)によって広まった一連の樹形図をそれぞれ一つの「カスケード(滝)」と定義。

12万6300件にのぼる大小の「カスケード」(「うそ」8万2600件、「事実」2万4400件)について分析を加えている。

その対象となったユーザーは300万人(「うそ」270万人、「事実」17万人)、ツイートやリツイートの件数ベースでは450万件を超す。

そこから見えてきたのは、情報拡散における「うそ」の優位性だ。

●うその早さ

研究では、「深度」「サイズ」「振幅」「分岐」など様々な尺度から、情報の拡散を検証している。

まず「深度」では、起点となったツイートからのリツイートを1次、さらにそのリツイートを2次と、拡散の段階を、最初のツイート(起点)からのへだたりで示す。

それを見ると、「事実」は10次を超えたあたりでほとんどのリツイートが終了。しかし「うそ」はその後も伸びを続け、上位0.01%は19次以上リツイートされていた。

また、拡散の総数でみる「サイズ」でも、「事実」は1000人程度で広がりが止まる。だが「うそ」はなお広がり続け、上位1%は1000人から10万人の規模に達する。

拡散のスピードにおいても、「うそ」が勝っている。

1500人に到達するのに、「事実」は「うそ」の6倍の時間、10次の「深度」に到達するのには20倍の時間がかかっていた。また、「うそ」が19次の「深度」に達する時間を見ても、「事実」が10次に届く時間の約10倍の早さだった。

「うそ」の拡散をテーマ別(※件数はカスケード単位)に見ると、「政治」2万7600件、「都市伝説」1万6500件、「科学・技術」1万2000件、「ビジネス」1万1000件、「テロ・戦争」8000件、「エンターテインメント」6000件、「自然災害」1300件。

「政治」が群を抜いて多い。そして、「深度」「サイズ」などでも、他のテーマを上回っている。

さらにそのスピードを見ても、他のテーマが1万人に到達するほぼ3倍の早さで、「政治」は2万人に到達していた。

論文では、「うそ」は「事実」よりも、リツイートで拡散する確率が70%も高い、とまとめている。

●「属性やボットは関係ない」

この研究で目を引くのは、これまで拡散の要因と考えられてきた、ユーザーの属性や、拡散の自動化プログラム「ボット」の影響力について、否定的な見立てを示している点だ。

「うそ」が拡散力で「事実」を上回る原因は、ユーザー属性や「ボット」ではない、と。

属性に関しては、フォロワー(閲読登録者数)が多く、エンゲージメント(他のユーザーの反応ややりとり)も多く、ツイッターの利用歴も長い、ネット上の影響力を持ったいわゆる「インフルエンサー」が、情報の拡散に関与する、と一般的に見られてきた。

だが研究では、「うそ」と「事実」の拡散で、関わったユーザーの属性を調べたところ、フォロワー数、エンゲージメント数、ツイッター歴などすべてにおいて、「うそ」拡散ユーザーのデータは、「事実」拡散ユーザーに比べて低かった。

「うそ」の拡散を牽引しているのは、「インフルエンサー」とは言えない、ということだ。

さらに「ボット」の問題がある。

これまでのフェイクニュース拡散をめぐる研究では、「ボット」による自動拡散の影響力が指摘されてきた。

ツイッター社が2017年11月に連邦議会に報告したデータでは、米大統領選最終盤の2016年9月~11月に選挙関連のツイートをしていたロシア関連の「ボット」は3万6700件。そのツイート数は140万件で、2億8800万回表示された、としていた。

さらに、ツイッター社は2018年1月にこのデータを更新。新たに1万3500件のロシア関連「ボット」が判明し、その総数は5万件を超えた、と発表していた。

※参照:ソーシャル有名人「ジェナ」はロシアからの"腹話術"

今回の研究では、あらかじめアルゴリズムによって「ボット」を検知し、分析対象からは外してあったという。

「ボット」によるツイートを、あとから分析に加えたところ、「うわさ」の拡散を加速させる効果については、認められたという。

ただ、「うそ」「事実」両方の拡散を同じように加速させており、それぞれの拡散の傾向には違いは出なかった、という。

つまり、フェイクニュースの拡散を牽引したのは、「ボット」とも言えない、との指摘だ。

だとすると、その要因は人間の側にあることになる。

●「新奇性」が引きつける

そこで研究では、拡散した「うわさ」に対する感情要素に着目する。

「うわさ」に対する「怒り」「恐怖」「期待」「信頼」「驚き」「悲しみ」「喜び」「嫌悪」という8つの感情表現を抽出し、「うそ」と「事実」で比較した。

すると、「うそ」に対しては、「驚き」「嫌悪」といった"未知のもの"に対する強い反応が出ていた。一方、「事実」に対しては「悲しみ」「期待」「喜び」「信頼」などの反応が目立ったという。

ここから、論文では、「うそ」はこれまで知らなかったこと、つまり「新奇性」により人間の注意を引きつける力があることが認められた、と述べる。

新奇性がリツイートの原因になる、あるいは新奇性がうそニュースがより多くリツイートされる唯一の理由、とは言えないが、うそニュースにはより多くの新奇性があり、新奇性のある情報はよりリツイートされる傾向にある、ということはわかった。
そして、そのような感情を喚起することこそ、フェイクニュースの"作成術"の基本でもある。

●データの偏り

我々はデータセットの収集において、選択バイアスがある可能性については認識している。つまり、ファクトチェック機関によって調査されることになった「うわさ」のみを検討対象にしている、ということだ。
筆者たちは補足文書で、このような但し書きを添えている。これは、今回の研究を見る上で、留意しておかなければならない点だ。

この研究では、一見して真偽の判断がつかないような"境界線"の情報のみに着目して、「うそ」と「事実」の拡散力を比較している。

つまり、「米朝首脳会談で合意」といった、そもそも信憑性が疑問視されることの少ないマスメディアなどのストレートニュースについては、研究の対象に入っていないのだ。

これは、分析に使ったデータで、「うそ」が「事実」に比べて3倍以上と、遥かに多い点からもわかる。

ただそうだとしても、学ぶところが多い研究であることは、間違いない。

サイエンスの同じ号には、この分野の第一人者たちが共同執筆者に名を連ねる「フェイクニュースの科学」と題した論文もある。

トランプ大統領誕生を後押しした右派メディアの「トランプ・メディア生態系」を浮き彫りにした、バーバード大学のヨハイ・ベンクラー氏とマサチューセッツ工科大学(MIT)のイーサン・ザッカーマン氏や、ファクトチェックがフェイクニュースへの確信を強めてしまう「バックファイアー効果」の研究で知られるダートマス大学のブレンダン・ニーハン氏、ソーシャルメディアのアルゴリズムによる民主主義への影響を指摘した「デジタルゲリマンダー」の提唱などでも知られるハーバード大学のジョナサン・ジットレイン氏、『インターネットは民主主義の敵か』で知られる同じくハーバード大学のキャス・サンスティーン氏、『スモールワールド』で知られるマイクロソフト・リサーチのダンカン・ワッツ氏ら、錚々たるメンバーだ。

※参照:「ブライトバート」がつくり出した"トランプ・メディア生態系"
※参照:偽ニュースの見分け方...ポスト・トゥルース時代は、まだ来ていない
※参照:フェイスブックの情報選別:〝偏向〟しているのは人間かアルゴリズムか

フェイクニュースをめぐる現時点の研究成果と求められる対策の見取り図のようになっており、全体状況をつかむのに最適の内容だ。

--------

■新刊『信じてはいけない 民主主義を壊すフェイクニュースの正体』(朝日新書)

(2018年3月11日「新聞紙学的」より転載)