BLOG

STAPの教訓生かせ、オープンデータで研究不正を防止せよ

2015年01月12日 15時26分 JST | 更新 2015年09月08日 21時10分 JST
ASSOCIATED PRESS
**TO GO WITH STORY TITLED JAPAN A-BOMB** A visitor walks to the main entrance of the Riken Institute in Wako City, north of Tokyo, Wednesday, Feb. 12, 2003. For nearly six decades, historians have been unable to solve one of the mysteries of Japan's World War II A-bomb project which was carried out at the institute: How close were Japanese scientists to building the bomb before the U.S. air raid stopped them? American air raid at the night of April 12, 1945 had destroyed samples and its laboratory.(AP Photo/Koji Sasahara)

論文だけでなく、元データを誰でも再利用できるよう共有する「オープンデータ」。昨年のSTAP論文不正問題では、オープンにされていた実験データを、他の研究者が検証できたことが、追及の突破口を開いた。税金を使って得たデータは原則オープンデータとするべきだ。研究データを公の資産とするための「研究データのガバナンス」を組織横断的に確立し、研究不正の防止に努めている研究センターもある。一方でデータガバナンスはコストカットの対象にされやすい。以下に述べる理研での教訓は、国のオープンデータ政策の重要性を示している。

平成21年から理研のウェブサイトで公開されている上の図は、「研究データガバナンス」の問題が理研で発生しないように対策を呼びかけるために作成し、当時からプレゼンで使っていたイラストである。平成22年には理研でワークショップを主催して、理研の理事やセンター長らにこの図を見てもらいながら、「起こりうる研究不正を未然に防止し、研究者を不当な疑惑から守るために、理研における研究データの管理方法を改革する必要がある」ことを議論した。当時このワークショップをきっかけにデータガバナンスの改革を始めた理研内の研究センターもあった。(第18回理事長ファンドワークショップ「理研総合データベースを核にした研究基盤連携網の構築」平成22年3月11-12日)

理研の幹部に研究データガバナンスの改革を訴えるきっかけとなったのは、平成19年に文部科学省が始めた画期的なオープンデータ推進事業(「ライフサイエンス分野の統合データベースプロジェクト」)であった。当時「理研の研究データをきちんとデータベースにして公開してほしい」という依頼が文科省から理研に寄せられていた。これを受けて、理研のデータベース群を整理・公開して文科省のプロジェクトへ引き渡す役割を私が担当した。

当時理研からオープンデータとして引き渡せるものがどれぐらいあるか調べるために、理研内の研究データの管理体制を調査した。その結果、任期制雇用の研究者にデータ管理を任せている研究室が多く、人の異動で管理者がいなくなったデータベースも散見された。理研は機関として、研究データを管理する義務を研究者に課しているが、管理するための組織的な手段を提供しきれているとは言えず、万一不正が疑われた際に、研究者への疑惑を晴らすために必要なデータの証拠保全が万全とは言えなかった。

そこで当時の理研の理事に報告し、理研としての組織横断的なデータガバナンスの改革が必要であると訴えた。当時の理事会は研究データベース管理の問題を理解し、平成20年から「理研総合データベース事業」を開始して、先ずは各研究センターの主要なデータから、組織横断的にデータベースの統合管理を進めた。また理研内の啓蒙活動として、理研の理事やセンター長らを招いてワークショップを定期的に開催し、研究データ管理やデータベース公開の在り方の意見交換を行ってきた。当時議論していたデータガバナンスの改革案は「データベース管理を研究者任せにせず、理研として組織横断的に管理し、将来的にオープンデータ化すべき」というものであった。

その結果、いくつかのライフサイエンス系研究センターではデータガバナンスの改革が行われた。以前は研究者が自分のPCでデータ管理を行っていた状況から、組織横断的にデータ管理できるところまで改善され、主要な実験に関しては、誰が何に携わってどこに残っているかが明確になったセンターもあった。しかし、平成23年の段階では、神戸のCDB(小保方氏らが所属していた神戸の発生・再生科学総合研究センター)はデータガバナンスの改革を開始していなかった。

そこで平成23年の理研のアドバイザーカウンシル(理研の最高外部諮問委員会)に報告し、理研総合データベースにおける各研究センターのデータ登録状況のグラフを見せて現状説明しながら、理研全体での取り組みが必要であることを訴えた。当時のアドバイザリーカウンシルはこれを理解し、「理研のデータベース統合プラットフォーム(理研サイネス、※注1)の構築はオリジナルデータの保存および 開かれた国際的データベースへの貢献に理研が明確な方針を打ち出すきっかけとなることだろう」という提言が出された。

こうした提言を踏まえ、理研の方針を決める中期計画検討会のヒアリング(平成24年5月10日)において、「実験データをすべて理研として管理すべき」と理事らに提案した。しかし、下された経営判断は「コストがかかりすぎる」という理由で、最終的にコスト削減の対象となった。この方針転換により、それまで理研内で育成してきたデータ管理の専門家集団は解散させられ、改革の道半ばで中断を余儀なくされた(平成25年3月末で廃止)。その解散の1年後にSTAP細胞の研究不正疑惑で研究者と理研が対立する事態が発生し、データ保全がないことが真相解明の障害となった。

STAPのような大きな問題が起きる前は、データ管理よりも研究成果の最大化が理研では重視されていた。平成22~23年頃の発表資料を再確認すると、上に示した「研究データガバナンスの問題」の図を使って、データガバナンスの必要性を、当時の主要な理事や理研の科学者会議のメンバーに対して説明した記録が残っている。説明の中で、平成20年に筑波大で起きた研究不正疑惑(長照二教授、プラズマ研究センター長)などを例に挙げ、データ保全がされていないと研究室主宰者にとって命取りとなる可能性があることを指摘したが、説明に対する反応は、「データガバナンスを行うことで、そのデータからどのような科学的な発見ができるのか? サイエンスについてのみ語ってほしい。」「使うか分からないデータの管理にお金をかけるのは無駄である。」という反応が主流であったため、これを覆すには至らなかった。

そのような状況下で、少なくとも平成20年から24年までの5年間、理研内でデータガバナンス改革を推進できたのは、当時の文科省が「統合データベースプロジェクト」で理研に組織的なデータ公開を迫ってきたことによるところが大きい。特に、データを誰でも再利用できるように「オープンデータ」を求めていた点は重要である。昨年のSTAP問題を解明してく上で、オープンにされていた実験データを、他の研究者が検証できたことが疑惑の解明につながった。研究機密のデータをすぐに公開できなくても、5年後10年後であれば公開可能であろう。将来的に元データを全て「オープン化する」という方向づけで組織横断的に管理すれば、研究者が不正を犯しにくくする心理効果も高まるだろう。

また、「データガバナンスは放棄されやすい」という教訓を心に刻んでほしい。研究室の閉鎖に伴って、行き場のないデータベースの管理を私のところに相談に来る研究者は結構多い。研究所は、一般管理費を徴収しているのだから、データ管理を研究者だけに負担させたり、管理責任を研究者だけに押しつけてはならないだろう。研究所と研究者双方のデータ管理意識を高めるためには、「税金を使って生み出したデータは、個人のものでもなく、組織のものでもなく、公のもの(オープンデータ)」であるという高い理念を確立し、これを研究機関のみならず国の一切の諸制度に反映した法制度にして、国民全体の利益とすることを期待したい。

※注1:

理研では平成21年に、理研の電子ラボノートと研究データベースを必要に応じて公開できるシステム(理研サイネス)を構築してデータガバナンスを強化する旨のプレスリリース「理研のデータベース構築基盤の公開基準をセマンティックウェブに統一」を出した。この技術の改良版が、文科省の震災復興支援の指導により平成23年から一般に開放され、現在では自治体や一般市民からも社会的に幅広く利用されるようになり、日本のオープンデータ活用推進の原動力となったことなどが高く評価され、経産省・総務省・文科省・民間団体などから多数の表彰を受けている。