BLOG
2014年07月24日 13時02分 JST | 更新 2014年09月22日 18時12分 JST

記事や物事の理解を深めるための米国発のデータジャーナリズム

米国のデータジャーナリズムは、まず新聞のウェブサイトをはじめとしたオンライン・ジャーナリズムを抜きにしては語れない。伝統的な調査報道方式で、データから新たなニュースを生み出すことに加え、有力紙ニューヨーク・タイムズなど、データを分かりやすいグラフィックスにし、そこから読み取れる事実に語らせることに力を入れている。

ビッグデータを利用しての読み解きもおこなわれるようになった。統計専門のブロガーが開いたデータジャーナリズム専門のブログもあり、消費者は、さまざまな形式のデータジャーナリズムをオンラインで楽しんでいる。

■ グラフィックスだけを一つのサイトにまとめる

「こうやって『スピン』というボタンをクリックしていくと、民主党が多数になるはずです」

4月22日、米紙ニューヨーク・タイムズ本社内にあるモダンなホールの壇上で、花形経済記者のデビッド・レオンハルト氏が、同社のデータジャーナリズムによるグラフィックスだけを一つのサイトにまとめた「アップショット(The Upshot)」を、紹介していた。

この日の目玉は、ことし11月の中間選挙で焦点となる連邦上院議員選挙に関するグラフの集積。「ローリング・ダイス」というコーナーでは、与党民主党が多数派を維持できるかどうか、日々さまざまなデータ(世論調査、資金の集まり具合、 歴史的データ)を駆使してアルゴリズムを組み、各州の候補者の勝敗がルーレットの色で分かるようにした。データの組み合わせで、「スピン(=ルーレットのサイコロを投げる)」というボタンをクリックすると、さまざまな民主党の勝敗の確率のケースが見られるというもの。

default

「アップショット」に載った上院選挙予想。左上のボタンを押すと、現時点の民主党、共和党の獲得議席予想が出る。下部は各州の予想

いまのところ、民主党が多数派を維持する確率は僅差とされ、レオンハルト氏が壇上で「スピン」を3回ほどクリックしたが、共和党が僅差で勝利する数字しか出て来ない。数回目でやっと民主党勝利の確率がやや共和党を上回り、同氏は明らかにほっとしていた。しかし、それほど共和党の追い上げが激しいというのを実感する瞬間で、会場の空気が張りつめた。

実は、このプレゼンは都市開発の会議の冒頭にあった。しかも、タイムズ発行人アーサー・サルツバーガー・ジュニア氏が、民主党選出のニューヨーク市長、ビル・デブラシオ氏を紹介し、公約についての講演があった直後だ。

デブラシオ氏を応援するため会議に来ていた市民も多い上、タイムズは政治的にかなりリベラルな新聞。アップショットで民主党が勝利の数字が出なければ、レオンハルト氏も彼を紹介したジル・エイブラハム編集主幹(当時、5月末更迭) も、相当気まずい思いをすることになったに違いない。

しかし、米有権者にとってこのサービスはかなり役に立つ。1カ月に1回ほどしか出てこない主要報道機関の伝統的な世論調査の意味が問われるともいえる。なぜなら、このサイトで毎日、上院選の予想をチェックすると、いつごろどこに寄付をするか、どのような形でボランティアをするのか、あるいは何もしなくてもいいのか、有権者は好きな時に判断できるからだ。

■ ジャーナリストに新たなニュース発掘の機会を

もう一つ、この日に紹介したのは「不平等プロジェクト」というグラフで、レオンハルト氏が記事でも常に追究しているテーマだ。これによって、米国人が世界中で一番豊かと思っている米国の中間層は、いまやカナダの中間層に追いつかれたことが分かった。同時に、米国の貧困層の所得は、欧州の貧困層のそれよりも下回る。

デビッド・レオンハルト氏は、ピュリツアー賞受賞経験がある、同社の花形記者。経済セクション1面に掲載される彼の分析記事は明解で切り口もうならせるものがある。

彼がアップショット立ち上げの際、サイトに掲載したブログによると、タイムズにとってデータジャーナリズムは、読者が記事や物事を理解するための支援という位置づけだ。

同氏はブログで、こう分析する。

「第1に、多くの読者は、自分がこうありたいと思うほど、ニュースに関して、よくは理解していない。しかし、オバマケア(医療保険制度)や選挙戦、格差、株式市場など込み入ったニュースについて、友達や親類、同僚にうまく説明したがっているという事実がある」

「第2に、データはジャーナリストに大きな可能性をもたらす。データに基づく報道というのは、過去は調査報道担当の記者のものであり、何カ月も数字や統計を並べて、そこからスクープが浮かび上がってくるのに時間を費やしていた。 しかし、いまのパソコンは、日々生み出されるデータを簡単に分析できる。データに基づく報道は、日々のニュースの発信の中で大きな役割を果たせるはずだ」

「読者の理解を支援する」「ジャーナリストに新たなニュース発掘の機会を与える」という二つの理由から、アップショットがタイムズの中で独立したサービスとして始まったというわけだ。

そして、最も優先されるのは、「発掘したデータや既存のデータを使い、ニュースの理解を深め、説明すること」(同ブログ)としている。

ただ、こうした独立サイトができるのも、以前からウェブサイトでのグラフィックスに、タイムズが力を注いできたからといえる。データから分かりやすいグラフィックスにする強力なチームがいるのは、以前から注目されていた。

例えば、筆者が渡米してからの2004、08、12年の大統領選挙に関するグラフィックスの充実は、それを読み取るだけで何本も、選挙戦に関する原稿が書けるほどで、オンラインでの読者サービスが極めて限られている日本の新聞には全くないものだった。

ちなみに、タイムズは11年3月からメーター制のデジタル購読料を課金。しかし月10本までの記事やグラフィックス、スライドショーは無料で読める。それ以前、つまり 年より前の大統領選のグラフィックスは、いくら見ても無料だった。

■大統領の資金集めの状況をグラフィックスに

予備選が始まる前から、各候補者の資金集めの状況は「キャンペーン・ファイナンス」というコーナーにいけば日々その変化が分かる。筆者はこれを参考にして、08年と12年は、現職のオバマ氏がい かに、一般有権者から草の根的に資金を集め、逆に共和党候補者がいかに高所得者から金額の大きい寄付金を集めているかを書いた。

具体的には、12年の大統領選挙の場合、オバマ氏に対して寄付した金額が一回に200ドル以下だった人が57%と過半数を占めた。これに対し、ミット・ロムニー対立候補の陣営では、200ドルから上限の2500ドルを寄付した人の割合が76%だ。

また、両候補への寄付金が、どの州のどの都市から集まっているのかひと目で分かる地図もある。地図の下に左右にカーソルで動かせるゲージがあり、これは時系列を示す。これを左右、つまり地図からみると東西に動かすと、両候補者への寄付金が、どの時点にどの州で多く集まっているかが分かる。

大統領選の投開票日後も、手厚いグラフィックスがサイトにアップされ、筆者が投票結果をより理解する大きな助けとなった。

例えば、各州の行政単位である郡ごとに、どちらの得票数が多かったかという地図だ。民主党の得票数が多かった郡が青、共和党が赤になっており、カーソルをその郡に当てると得票数も分かる。これによって、オバマ氏が選挙人の獲得数で勝利した州でも、郡単位の得票数でみると、州都など都市部以外ではあまり勝利していないことが色ですぐに分かる。

同性愛者の結婚の問題や、貧富など格差是正を訴えるオバマ氏のリベラルな公約は、やはり多様な人が集まる都市部でしか受け入れられていないことが、地図の色で明解だ。これを見て、オバマ氏勝利のアメリカ国旗と花吹雪が舞うテレビ映像を見ながらも、米国がいかに保守とリベラルにはっきりと分断されているかを認識した。

これが50州分あるため、紙面ではとても掲載できないが、オンラインではこれだけのサービスが可能だ。

データに基づくグラフィックスに筆者が驚いたのは、過去には有権者が得られなかったものを、オープンにしてくれたことだ。タイムズが掲載した候補者のファイナンスや得票データは、選挙陣営では巨額の投資をして、有名な「ポーリング・アナリスト(世論調査アナリスト)」 を雇い、専門のデータ会社も使って得ている。その手の内の一部を、タイムズのサイトで見ることができるのは画期的だ。

従ってタイムズでは、アップショットによって、新たに「データジャーナリズム」を開始したというわけではない。むしろ従来、オンラインの記事の間にアップされていた数多くのグラフィックスを、1カ所に集めたことによってスタートさせた。グラフィックスの編集者名も、以前から見慣れたもので、アマンダ・コックスとジョシュ・カッツの二人。彼らと記者を含む15人がチームでアップショットを担当している。

2014-07-24-2014072412.35.51.png

■英紙ガーディアンの注目されるデータブログ

同様に、英紙ガーディアンのデータジャーナリズムも、筆者のお気に入りだが、新しく始まったものではない。

ガーディアンは、11年6月に「デジタルファースト」を掲げ、新聞とは別に、オンラインでのサービスを差別化させることを生き残りの道に選んだ。その一環として、12年から「オープン・ジャーナリズム」の実践を宣言。そしてその一部として10年から取り組む「データジャーナリズム」を位置づけている。

昨年4月、ニューヨークのジャーナリストの親睦団体ニューヨーク・プレス・クラブで、オープン・ジャーナリズムの提唱者であるガーディアン編集長アラン・ラスブリジャー氏の話を聞いた。同氏は、チャートを示しながらこう話した。

「私は、人々をジャーナリズムに勧誘するために、すぐに反応し(responsive)、統合する(incorporating)、協力型の(collaborating)ジャーナリズムを作りだしたかった。ジャーナリズムに読者が関わり、ジャーナリストと読者との間の垣根を取りたかった」

ガーディアンの場合、こうした三つの大きな使命の一部にデータジャーナリズムが取り込まれているため、タイムズのグラフィックスのサービスやアップショットのように独立したものとして提供されている訳ではない。

09年に始まった「データブログ」が、注目されているが、データを分析する記事で構成され、タイムズのようにグラフィックスが中心ではない。データジャーナリズムといっても、いろいろな手法があることが分かる。

例えば、6月2日掲載された「選挙動向の分析にオープンデータが及ぼす影響」(図2)。英国は来年の総選挙にかけて、スコットランドの「分離独立」を問う住民投票など、将来を左右する選挙が相次ぐ。ところが記事は、一部のオープンデータの欠落で、選挙委員会の今後の方針や、選挙動向の分析が大きなダメージを受けていることを指摘している。

dateblog

ガーディアンのデータブログ。国政選挙の動向の分析に必要な行政レベルのデータが少ないため、実態に近い分析結果が得られないと指摘する

■データを読み取ることで浮上した意外な事実

米国に戻って、ニューヨーク・タイムズのライバルともいえるワシントン・ポストでの動向を探ってみよう。最近、ツイッターなどで評判になっていたのが、5月31日掲載の「武器と複数銃殺事件」というグラフィックスだ。

これによると、1984年以来、一度に数人以上を銃器で殺害した事件で使われた銃器の4分の3が合法的に購入された。また、人種差別のもととなっている犯罪率だが、こうした事件に関しては、圧倒的に犯人に白人が多いことが明白だ。

これを見ると、普段、銃規制の賛成派、反対派が主張している争点を、どう判断すべきなのか、新たな材料がみえてくる。つまり、リベラル系は銃規制の強化を訴え、保守系は銃規制の緩和を求めているが、これだけ合法的に購入された銃器の犯罪関与が大きいと、客観的には購入時点の人物調査を強化するというのは妥当ではないかということ。そして、何らかの理由で、大量殺人につながる銃撃事件は、白人に特有で、アフリカ系アメリカ人の犯罪率が高いという通常のデータが当てはまらないという意外な事実だ。

ポストがグラフィックスに付けた短い記事は淡々とした数字のまとめだけだ。しかし、ここから読者は、はっきりと読み取れるものがあるし、新たな発見がある。明解なだけに、冒頭、ニューヨーク・タイムズのレオンハルト記者が指摘したように、友達や家族と簡単にシェアできるし、説得力もある。こうしたものが、データジャーナリズムが目指すところであるのは間違いない。

default

ワシントン・ポストの銃器関連事件のグラフィックス。複数を殺害した事件に使用された銃器の種類や取得方法が、銃のマークにカーソルを合わせれば分かる

■問題発掘型の 「538・com」

米国では、「データ・ジャーナリズムは売れる」という例もある。

日本でもよく知られた若手の統計ブロガー、ネイト・シルバー氏のサイト 「538(ファイブサーティーエイト)・com」は昨年、ライセンシング契約を結んでいたニューヨーク・タイムズから独立。今度はブランドとブログのURLを人気のスポーツ専門チャンネル「ESPN」に売却した。そればかりでなく、ESPNから追加投資を受けて、あらゆる分野におけるデータジャーナリズムに特化し、「538」を新たにスタートさせた。

しかし、「538」が手掛けるデータジャーナリズムが、ニューヨーク・タイムズやワシントン・ポスト、ガーディアンなどと競合しているかといえば、全くそうではない。そのために、ESPNのような投資家が現れるということを強調しておきたい。

「538」が、新聞社が手掛けるデータジャーナリズムと異なるのは、「問題発掘型」だからだ。新聞社が報道するのは、あくまでもメインストリームのニュースに絡み、データからアプローチしたもの。データは説明の材料になっている場合が多い。これと一線を画す「538」は、数字から読み解いて、問題を提起している。

例えば「すべての政治は大統領次第」(3月17日)の特集をみてみる。1930年から、過去の州知事選挙の結果が、いかに大統領の人気と連動しているかを示すグラフだ。これをひと目みて、何を言おうとしているのか分かるには、記事を読まないと無理だ。

グラフは、大学教授かエコノミストが作るような統計グラフだからだ。新聞社であれば、これをもっとビジュアル化し、直感的にデータが示すことを読者に理解させるように作るだろう。それこそが、新聞社のグラフィックス担当の腕のみせどころといえる。ところが、「538」では、統計からの解き明かしがブログの「売り」となる。

ブログ本文によると、折れ線がゼロ、つまり下部に近い方が、州知事選挙と大統領の人気の関係は薄まる。しかし、近年折れ線は上向きとなり、与党の州知事選レベルの勝敗は、大統領の人気頼みに近くなってきていることが分かる。

これは、州レベルの政策よりも、連邦レベルの政策が、知事選でも争点となる傾向が強まっているためだと分析。地方分権を重んじる米連邦制の特徴が薄まってきていることを浮き彫りにしている。

2014-07-24-2014072412.39.12.png

■記者出身者ではなく 統計ブロガーの手による

「『気候変動』、いや『地球温暖化』から読み取る政治的修辞」(6月4日)では、棒グラフによって、民主党の下院議員が共和党議員より「気候変動」という言葉を使うことが多いことを示している。これは何を意味するのか。

実は、共和党は、温暖化ガスによる地球温暖化はこの世に起きていないという立場をとっている。これは議員の支持基盤であるエネルギー産業を擁護するためとされるが、データ的には海水の水位が上がり、世界が異常気候に襲われているのは事実だ。

このため、保守系の主張で、地球温暖化ではなく、「気候変動」という言葉が使われ始めた。地球温暖化対策をすべきとするオバマ政権と与党民主党は、気候変動という言葉を使わなくてもよい立場なのに、共和党議員よりも連発している、という問題提起だ。

「538」のこうしたアプローチは、ネイト・シルバー氏が、ジャーナリスト出身ではなく、統計ブロガーであることが影響している。しかし、「538」から は常に、統計を基にした斬新な切り口が発信され、それが後付けとしてニュースが成立している。

ちなみに、シルバー氏は78年生まれ。選挙の激戦州であるミシガン州出身だ。オバマ氏が初当選した大統領選があった2008年春、「538」を統計分析ブログとして立ち上げた。大統領選挙では、50州のうち49州の予想が的中。さらに連邦上院選挙の結果は、選挙が行われた州の結果を当てて、オンラインブログなどで注目された。

10年に、ニューヨーク・タイムズに 「538」をライセンシングし、同紙のサイトでブログを展開。12年大統領選挙では、50州でどちらの党が選挙人を獲得するか、すべて予想が当たった。13年に前述のように、ESPNの投資を受けて、ブログをニューヨーク・タイムズから独立させた。

■有権者=読者がデータに「価値」を見いだす土壌

米国で、このようにさまざまな形のデータジャーナリズムが開花している背景は何なのか。

第1に、選挙や政治家に対する関心が、日本とは比べものにならないほど、高いという背景がある。このため、ポーリング・アナリストやポーリング専門のデータ会社といった職種が、大統領選挙や中間選挙の年ではなくても、多く成立している。

特に 08年のオバマ氏が初当選した大統領選挙から、データのエキスパートの存在が注目をされるようになった。有名なインターネット企業などから集めた若いエンジニアたちが、オバマ陣営に提供したデータでオバマ氏の勝利が決まると、いかに選挙におけるデータが重要な役割を果たすのか、有権者も知るきっかけになった。

また、前述のニューヨーク・タイムズのグラフィックスなども、有権者に対し、データを使って選挙を読み解くことを可能にした。そして、より有権者がデータに慣れ親しむ土壌を作ったともいえる。新聞やオンラインに載るグラフィックスをきちんと読むことが、より深い理解につながり、関心が高い選挙について、友人や家族に話すことができる。

ニュースの中に盛り込まれるデータや、そこから読み取れることに、有権者=読者が「価値」を見いだす土壌が、米国の選挙や政治への関心にあったといえる。

■オンライン上で増える長文記事や連載

第2の背景は、オンライン・ジャーナリズムが、非常に発達し、データジャーナリズムの発展を助けたことだ。米国でも英国でも、新聞のウェブサイトはプリント版に載せたものと同じ、あるいはそれ以上の長さの原稿を全文載せている。

また、ブログニュースサイトの「ハフィントンポスト」、政治専門ニュースサイト「ポリティコ」、調査報道専門サイト「プロパブリカ」など、オンラインオンリーの報道機関も、長文の連載や調査報道記事を積極的に掲載している。

加えて、「ロングフォーム」と呼ばれる、長文の独自記事や連載はこの2年ほど、オンライン上で増え続け、現在「流行のスタイル」といってもいいほどだ。これもニューヨーク・タイムズが始めた試みで、オンラインに載せたロングフォームは、インタラクティブなグラフィックスや写真のスライドショー、ビデオなど、紙面では提供できないデータを盛り込むことで、より文章の内容を深く、豊かにすることができる。このため、オンライン・ジャーナリズムを支える前出のサイトなども、タイムズに追随し、長文でデータが豊富な記事に力を入れ始めた。

この長文トレンドを生んだのは、12年に掲載され、13年にピュリツアー賞を受賞したニューヨーク・タイムズの「大雪」という特集記事だ。ピュリツアー賞は現在、記事に加えてオンラインのグラフィックスなども審査対象にしており、「大雪」の受賞は、オンラインのグラフィックスが大きく貢献した。

「大雪」は、ワシントン州で、16人のトップスキーヤーを巻き込んだ雪崩の一部始終を6回の連載にした。取材に6カ月かけ、13人の生存者、救助隊、州警察など関係者の話を集めた。

さらに、雪崩がどうして起きたのか、ウェブ上では、まるで雪崩を空撮したかのようなマルチメディアの映像を公開し、メディア業界で反響を呼んだ。この記事も、丹念に集められたデータと証言を積み上げたデータジャーナリズムといってもいい。

長文をオンラインで読むのは、スマートフォンやタブレット端末の場合、スクロールしていけばいいので、ページをまたぐ紙面と異なり、苦労を伴わないで読むことができる。

このため、驚いたことに長文オンライン記事は、若い読者層が読んでいる割合が高い。スマホやタブレットのお陰で、プリント版が失ってきた若い読者に対し、本格的なジャーナリズムを提供するチャンスが訪れているともいえる。

2014-07-24-2014072412.40.51.png

■データありきではない 正しいプロセスを踏む

最後に、データジャーナリズムは、1日にしてできるものではなく、長年積み上げて来た「ジャーナリズムの担い手」がいなくてはできない、ということを強調しておきたい。

日本では報道機関が「データジャーナリズムを導入するかどうか」という発言が、ツイッターなどで見られる。しかし、データジャーナリズムは、全く新しく「導入」できるものではない。きちんとした取材と理解をしている記者や編集者がいてこそ、データをどうニュースにしていくのか、という正しいプロセスが成立する。データありきではない。

ニューヨーク・タイムズもガーディアンも、オンラインを使ったサービスを始める前から、調査報道による長文記事、さらに凝ったグラフィックスを紙面に掲載し、ジャーナリズムに「価値」を見いだす読者を教育してきた。それだからこそ、今日、オンラインの特徴を生かした「データジャーナリズム」が開花したといえる。

Journalism 2014.7月号より転載)