NEWS

データジャーナリズム最新事例とこれからの民主主義 MITメディアラボ所長・伊藤穰一氏が語る【全文】

2014年05月13日 19時04分 JST | 更新 2014年05月13日 23時09分 JST
The Huffington Post

5月12日、朝日新聞主催で、「MITメディアラボ×朝日新聞シンポジウム メディアが未来を変えるには ~伝える技術、伝わる力~」が東京都内で開催された。新しい時代のメディアとデジタル技術の関係について掘り下げたシンポジウムで、MITメディアラボ所長、ニューヨーク・タイムズ取締役でもある伊藤穰一氏が、データジャーナリズムと政治について、事例を挙げながら語った。講演を全文でお伝えする。

----

■「データジャーナリスト」の定義

まず、データジャーナリストという言葉を少し、定義してみたいと思います。

色々な使い方がありますが、だいたい、コンピュータとデータを上手に使う、ジャーナリストかニュースルーム(ニュースの制作現場)にいる人たちです。

アメリカでデータジャーナリストというと、データベースも叩けて、ソフトウェアも書けて、ビジュアライゼーションのデータジャーナリストもいれば、解析とか研究のデータジャーナリストもいます。今までのジャーナリストの訓練とぜんぜん違うバックグラウンドの人達がデータジャーナリストになってきていて、最近、アメリカではジャーナリストの数がどんどん減っていってる中で、データジャーナリストの数はどんどん増えてるんですね。

■データジャーナリズム事例 プロパブリカ

プロパブリカっていう非営利団体のメディアオンラインメディア、ここはひとつのデータジャーナリズムのスタイルです。この記事は、「アメリカの国の医療費が良くない医者に流れていた」と。

この記事の中を見ると国のデータベースからひっぱってきたいろいろな書類がレファレンスされていて、クリックすると全部出てくるんですね。国のオープンデータをクロールして中身を見て、かなりきちっと書かれた記事で、面白いのは、ネットでやるとクリックして本物のドキュメントが見れるので、編集されている部分と生のデータの部分がある、信憑性の高い書き方になるんですね。

■データジャーナリズム事例 ウォール・ストリート・ジャーナル

またちょっと違う視点で、アメリカのヘッジファンドの事例です(ウォール・ストリート・ジャーナル)。アメリカは公益団体が保有するデータを出すFreedom Information Actというのがあって、日本も2006年くらいかな、そういう法律が通っていますが、国に製薬会社のレポートを出せ、っていうと、FDAという薬品を認可する機関からいろいろなデータが出てくるんですね。

製薬会社から発表される前に薬のデータがもらえるのでそのデータを使って投資したり、空売りして稼いでいる。それによってとても国の負担になっているし、一部のやりかたがわかっていて、お金持っている人たちだけがそういう特殊な情報を持っている、というのはいかがなものか、となるわけです。

どっちかというとデータジャーナリストというより、データを使っている投資家について、の記事なんですけども、全部オープンにするとしても、このオープンの仕方、たとえばレポート出せと言われてもウェブサイトに出すまでに、1週間とか1カ月とかかかっているんで、一般の人達と特殊な人達の情報の差が出ている、と。そういうことを指摘した記事ですね。

■データジャーナリズム事例 Homicide Watch D.C.

アメリカでは、日本でもそうですが殺人事件が新聞によく書かれていますが、貧しいコミュニティの殺人事件はほとんど出ない。

これは夫婦が作ったサイトで、国のデータベースを使って、あらゆる殺人事件のデータを出して、その人たちの情報を出して、警察に取り調べを勧める、というもので、ニュースに載らないような人たちの殺人事件も追っかけようよ、という透明性を中心にしてやっている。マスコミが足りない部分を個人やNPOが補うというものですね。

■データジャーナリズム事例 ニューヨーク・タイムズのSnowfall

こうした事例は全部、データジャーナリストが国のデータをどうやって引き出して使うか、というケースだと思うんですけれども、それはデータベースを引っ張ってくる技術と、もうひとつはビジュアライゼーションで、どうやって複雑なデータをどうやってわかりやすくするかということです。

ニューヨーク・タイムズの、雪崩で死亡した人たちを報道した「Snowfall」という記事なんですけど、シームレスに動画と地図、テキストを混ぜて、去年のピューリッツァー賞を取ったビジュアライゼーションです。

ビジュアライゼーションというカテゴリの中では迫力があって、ピューリッツァー賞を取ったせいかはわからないけど、もう動詞になって、「Snowfalling」といって、記事のスタイルが生まれました。メディアミックスを使って、新しいビジュアライゼーションを、大きな新聞社も実験しているわけです。

■データジャーナリズム事例 ガーディアンのスノーデン報道

ガーディアン、イギリスの新聞社ですが、彼らは(エドワード・)スノーデンの、NSAのデータを全部もらって、一番最初に記事を書いて、ビジュアライゼーションして、そのサイトを作った。

あまりにもたくさんの情報があってわかりづらい、と批判されるぐらいのサイトで、いろいろなインタラクションがあるので、何日もかけて見るようなサイトです。

■データジャーナリズム事例 ブルームバーグの死亡率報道

これはブルームバーグがやったものですが、アメリカの死亡率のデータを使って、なぜ、こうなっているかというトレンドをなるべくわかりやすくする、というものです。

■課題は人材をどう育てるか

というわけで、2つ。データを集めて解析する、というのとビジュアライゼーションする、というのがデータジャーナリズムだと思うんですが、ここでちょっと想像して欲しいんです。

ニュースルームの中に、数学ができて統計ができてプログラムができる人たちと、数学が嫌いだから新聞社に入った、という人たちが共存しているんですね。文化系、理科系と分けることができますが、データジャーナリストはどういう形にニュースルームに入ってきてるかというのが、これからの重要な課題だと思うんですね。

アメリカではコロンビア大学とノースイースタン大学くらいしか、データジャーナリズムをジャーナリズムスクールで教えているところはなくて、ほかはもう勝手に技術者が勝手にジャーナリズムに興味を持って入ってきている、というのが多いと思います。

ただ、本当は両方できる人たちを育てるのがポイントだと思います。

たとえば、ネイト・シルバーというニューヨーク・タイムズでブログをやっていて、統計学で前回のアメリカ大統領選挙をドンピシャで当てたんですね、でも、本人と話すと「当たり前だ」と。「今までの世論調査のデータを見て、歴史的に解析して、普通に数学すれば当たるんだ」と。

その時にはかなりジャーナリストに「言い切れるのか」と叩かれていて、彼は「数学で言い切れる。お前らが数学がわからないだけだ」と。

でも、もともとネイトはスポーツから来てるんですね。スポーツというのは数字が好きな人たちがけっこう入っていて、とうとうネイトもニューヨーク・タイムズやめて、ESPN、スポーツサイトに戻ったわけですけれども、そういう意味では、スポーツの世界ではデータジャーナリズムが多かったんじゃないかな。スポーツの業界からデータジャーナリストが生まれてくる可能性もあるかなと思います。

■もう一つの課題、アプリ化

そして最近もうひとつ流行っているのは、アプリにできるかと。

アプリにするとビジネスモデルにもつながるし、普及もできるし、インターフェイスもいろいろいじれるので、特にモバイルの方が重要になってきています。ニュースルームの中でも必ず、「これ、アプリにできるか?」という議論が出るんですけど、ここでまた難しい関係性が生まれてきていて、特にアメリカではビジネスの部分と、ジャーナリズム、エディトリアルの部分はきれいに分けていて、ジャーナリストにビジネスのことを考えさせない。

もっと極端に言うと、ハフィントンポストはその間だと思うんですが、伝統的なマスコミというのはジャーナリストには極端な話、自分たちがどんだけ記事が読まれたかもなるべく教えないで、本当に自分の書きたいことを書かせる、とやってるんで、アップとかエンゲージメントとか、お金が儲かっているかとか、ジャーナリストに気にさせるべきかというのは、業界で大きな議論になっていることだと思います。

■ビッグデータにどう対応するか

もうひとつ、さっきの話で、病院のデータだとか、殺人のデータとかを出すのは難しくないんですけど、これがビッグデータ、ものすごく大量なデータの解析になってくると、数学も難しくなりますし、コンピュータも大きくなってくる。

我々のMITメディアラボで、「ソーシャルフィジックス」という言葉をサンディ・ペントランドという教授が使ってるんですが、これをどういうことかというと、「人間関係の物理学」というのを数学的に彼らは表現していて、たとえば携帯電話の位置情報と、ソーシャルネットワークを分析すると、AIDSかどうかとか、糖尿病かどうかとか、どういうコミュニティに入っているかだいたいわかっちゃうんですね。

もうひとつ見ると、ソーシャルグラフを見てると、だいたい誰がいつ、どういうことをするかというのは、もうあのデータ解析でわかっちゃう。

個人名がわからなくても、位置情報とかネットワークにつながっているというのがわかっていて、こんな情報はあんまり重要じゃないな、と思っても、それをビッグデータで掛け算していくと、実はとっても重要なデータになるわけですね。

例えば、携帯電話の位置情報を解析している会社があるんですが、この会社は個人名や性別といった個人情報を取らない。位置情報だけを取っている。

でもこれを取っていれば、どこで起きて、どこを歩いて、どこの会社に行ってるかわかるわけですね。携帯電話を10分ごとに捨ててもわかるんですよ。

個人情報が入っていなくても、位置情報だけでも、個人情報がわかってしまう。メールの解析でも、自分のメールが取られなくても、自分の周辺の人たちのメールがどこに送られているのかわかれば、結局わかってしまうんですね。

既得権益を透明にするためにデータ解析をするのはいいことだと思いますが、でもどうしても、大きなコンピュータや力とかデータのアクセスを持っているところが、データを使うんで、データジャーナリズムと、プライバシーと、国家の情報ポリシーというのは、すごく関係してくると思います。

■ビッグデータによる相関分析はホットな分野

もういちど、ここだけポイントにしたいんですけれども、本当に英語では「correlation」っていうんですけれども、これとこれがどういう関係があるか、っていうのは、解析してはじめてわかる。

たとえば、こういう色が好きな人とか、この道を通る人がどうだとか、そういうようなデータを使って、いろんな情報を引き出してきて、モニタリングしていくって感じなんで、そういうあの、ネット上にあるデータを使って個人の詮索ができてしまうんですね。

これはすごく面白い分野で、特に医療関係の話になってくると、この人は脳梗塞になる確率が高い、とそのときに家族が近くにいるようにメッセージを送ろう、とかこの人は糖尿病になりそうだから運動させるべきだ、とか、そういうポジティブな使い方もあるんだけど、当然、保険会社が悪用したり、というのもあるので、注意しながら考えていくべきことかと思います。

■これからの政治とデータジャーナリズムの関係

去年、この図を出したんですけれども、従来型のメディアと国民の関係って、国があってマスコミが情報を国民に伝えて、国民は投票を通じて国にフィードバックする、というのが民主主義と国民とメディアの関係性だった。しかし今のように、ソーシャルメディアとか、国民が勝手に技術を使ってコラボレーションして、発言できるようになってくると、Network Publicsphereと英語で呼んでいますが、ひとつの場で、メディアと国民と国が一緒に集まって、参加型の民主主義になっていくんじゃないかなと思います。

今までは結局、国民が集まってしゃべることができなかったから、マスコミでバンッと報道して、そして国民たちがこの人かこの人に投票して、その人たちで議論する、っていう間接民主主義だった。そこから、だんだんインタラクティブな民主主義に変化していくんじゃないかなという気がします。

この文脈のなかで、データジャーナリズムも考えていくべきだと?