BLOG
2018年02月09日 15時09分 JST | 更新 2018年02月09日 15時09分 JST

論文中の塩基配列の誤りを探し出すツール

「このプログラムが広く利用されるようになるかどうかは、費用と使いやすさ次第でしょう」

研究論文を精査して塩基配列の誤りを発見するオンラインソフトウエアが開発された。このプログラムを使って60編以上の論文で不適切な塩基配列が発見されたが、そのほとんどはがんに関する論文だった。

------

ウェストミード小児病院こども研究所(オーストラリア・シドニー)のがん研究者Jennifer Byrneとグルノーブルアルプス大学(フランス)のコンピューター科学者Cyril Labbéは、論文中の塩基配列の誤りを発見するプログラム「Seek & Blastn」(scigendetection.imag.fr/TPD52/)を開発し、2017年10月にプログラムの初期バージョンを公開した。現在彼らは、他の研究者にこのプログラムを試してもらい、その結果をもとに改良していきたいと考えている。近年では、科学誌の編集者や出版社のほとんどが剽窃を検出するソフトウエアなどを利用して論文を検査しているが、Byrneらは最終的に自分たちのプログラムもそのツールの1つとして提供していきたいと考えている。

Byrneは、2015年にがん細胞の遺伝子の機能に関する5編の論文に問題があることに気付いて以来、ヒトのがんに関する論文の誤りを探すようになった。5編の論文はいずれも、短い塩基配列を用いて特定の遺伝子を不活化し、腫瘍細胞への影響を観察するという、ありふれた実験を行ったとするものだった。

Byrneは偶然にも、当該遺伝子について1998年に報告した研究チームの一員であったため、この遺伝子のことをよく知っていた。このため、5編の論文を読んだ彼女は、論文の著者が実験に用いたという塩基配列が間違っていることに気が付いた。この5編の論文のうち4編は、その後撤回されている。

さらに25編の論文で同様の誤りを発見したByrneとLabbéは、論文中で不適切に記された塩基配列を探し出すためのツール「Seek & Blastn」を開発した。このソフトウエアは、アップロードされた論文から塩基配列を抽出し、公開データベースBlastnの塩基配列と照合する。

Byrneは、「『Seek & Blastn』は、論文中で説明される塩基配列のステータス(標的遺伝子を不活化したなどと論文中で説明された塩基配列)と、実際の塩基配列との不一致を探すものです」と説明する。例えば、論文中で「特定のヒト遺伝子を標的とする」と説明された塩基配列と一致する配列がBlastnデータベースで見つからなければ、プログラムが「不一致」を知らせる。また、標的となる遺伝子は存在しないと説明された塩基配列と一致するものがBlastnデータベースで見つかった場合にも、その事実を知らせる。

現段階のプログラムはヒトの塩基配列の誤りしか発見することができないが、Labbéは、将来的にはヒト以外の生物種の塩基配列もチェックできるようにしたいと言う。また、オリジナルの論文で説明が不明瞭な場合にも、正確な判定ができない。そのため、論文中の誤りを見落としたり、問題のない論文に誤りがあるとしたりする可能性があり、全ての論文は人力でも確認しなければならないという。

2人は「Seek & Blastn」を利用して、さらに60編の論文で塩基配列の不一致を検出した。Byrneによると、これらの論文の多くは、塩基配列の不一致の他に、画像やグラフの質の悪さや文章の大きな塊の重複などの問題があり、こういった特徴を合わせると、そのうちのいくつかの論文はお互いに「驚くほどよく似ている」という。彼らは今、仲間たちの助けを借りて、人力で論文を調べている。

彼らが論文中に発見した誤りの中には軽微なものやうっかりミスもあるが、多くは研究の結果や論文の結論を無効にする可能性があるとByrneは言う。「論文中に不適切な塩基配列を見つけると、この実験の結果はどのようにして導き出されたのだろうか、この論文の結論は実際に行われた実験を反映しているのだろうかと心配になります」。

ByrneとLabbéが2017年10月にScientometricsに発表した論文によると、彼らは問題のある論文を48編発見したが、そのうちの30編が不適切な塩基配列のDNA(またはRNA)短鎖の使用を報告していたという(J. A.Byrne and C. Labbé Scientometrics110, 1471–1493)。これらは全て中国の研究者が執筆した論文だった。ByrneとLabbéは、2015年の5編の論文を除き、問題のある論文を具体的に明らかにしていないが、掲載誌の編集者には連絡済みという。Byrneによると、多くの編集者は無反応であったが、さらに3編の論文が撤回されたという。2人は合計90編以上の論文で不適切な塩基配列を発見している。

インディアナ大学ブルーミントン校(米国)の統計学者で、重大な間違いのある論文を多数発見しているDavid Allisonは、「Seek & Blastn」のような自動ツールは、単に不正行為をした科学者を探し出すだけでなく、質の高い科学の実践と、科学者の間違いを防ぐために利用された場合、その真価が発揮されると言う。彼はまた、こうしたツールは、特定の科学誌や分野における誤りの発生率の定量にも役立つかもしれないと考えている。

オープンアクセスジャーナルの出版社Hindawi(英国ロンドン)の研究公正部門長Matt Hodgkinsonは、多くの出版社が論文の審査過程の一環として「Seek & Blastn」を利用するようになるだろうと見ている。同社の科学誌BioMed Research Internationalは、2編の論文を撤回している。

「このプログラムが広く利用されるようになるかどうかは、費用と使いやすさ次第でしょう」とHodgkinsonは言い、問題のない論文を問題ありと判断してしまうリスクを考えると、科学誌の編集者や編集委員がこのツールが示した結果の確認を行うことも必要だろうと指摘する。

Nature ダイジェスト Vol. 15 No. 2 | doi : 10.1038/ndigest.2018.180207

原文:Nature (2017-11-23) | doi: 10.1038/nature.2017.23003 | Online software spots genetic errors in cancer papers

Nicky Phillips

【関連記事】

TOOLBOX: 大学シラバスからデータを掘り出すツール

Nature ダイジェスト Vol. 15 No. 2 | doi : 10.1038/ndigest.2018.180231

TOOLBOX: 文献管理ソフト8選

Nature ダイジェスト Vol. 14 No. 11 | doi : 10.1038/ndigest.2017.171131

Natureダイジェスト・オンラインマガジンを購読する

​​​​​​​論文中の塩基配列の誤りを探し出すツール