今や、科学者向けの文献管理ソフトはよりどりみどりだ。その中から代表的な8つを検討した。
------
ILLUSTRATION BY THE PROJECT TWINS
Adam Rockerは、自分のデジタル文献ライブラリを管理しているソフトウエアが、研究に役立つ巧妙な手法を教えてくれるとは思っていなかった。音楽ファイル管理プログラムがユーザーにお薦めの曲を知らせてくるのと同じように、Rockerのお気に入りの電子ファイリングシステム「ReadCube」は、定期的に彼のライブラリをスキャンして、関連する論文を勧めてくる。その機能が彼に予期せぬ宝物をもたらしたのだ。
現在オタワ大学(カナダ)で医学を学ぶ大学院生のRockerは、当時、ゼブラフィッシュの細菌感染症の研究をしていた。そんな彼にReadCubeが、マイクロ流体力学を利用して魚を閉じ込める方法に関する論文を勧めてきた。普通なら彼が読むことなど絶対にない分野の論文だったが、そこで述べられていた手法は、彼自身の手法に比べてはるかに簡便だった。Rockerはプロジェクトを既にかなりのところまで進めていたため、新しい手法を採用するには至らなかったが、この研究に目を向けさせられたことは「本当にためになりました」と言う。
実際、今日の文献管理ツールは単なる電子ファイリングツール以上のものになっていて、いずれもスイス・アーミーナイフのように多様な機能を展開することでユーザーに訴えかけている。
この記事では、「colwiz」「EndNote」「F1000Workspace」「Mendeley」「Papers」「ReadCube」「RefME(Cite This For Meに統合)」「Zotero」という代表的な文献管理ソフト8種類のツールについて検討する(「代表的な文献管理ソフト」参照)。あるものは文献ライブラリの閲覧や構築を効率よく行えるようにし、またあるものは参考文献リストを作成したり、共通のワークスペースを提供して共同研究を補助したり、ユーザーが興味を持ちそうな論文を薦めたりする。
文献管理ツールの目的は、研究者がダウンロードして散らかしてしまったPDFを整理できるようにすることにある。彼らが学術誌のウェブサイトからPDFファイル(ファイル名はしばしば、アルファベットと数字を組み合わせた意味不明なものが割り振られていたりする)を取得し、適当なフォルダに入れると、たちまちカオス状態になる。これは、ほとんどの科学者が頭を悩ませている問題だ。
ベルヴィージェ生物医学研究所(スペイン・バルセロナ)の神経科学者Raúl Delgado-Moralesは、「少なくとも私の経験では、科学者のデスクトップのフォルダにはよく分からない名前のPDFファイルが3000個ぐらい入っていて、ファイルが必要になったときには決して探し出すことができないのです」と言う。
文献管理ツールは、ハードディスクのインデックスを作成することにより、この混乱に対処する。典型的な機能としては、PDFをドラッグ・アンド・ドロップでアプリのウィンドウに入れると、ソフトウエアがDOIまたはタイトルを使って識別を試みたり、関連のあるメタデータ(タイトル、キーワード、著者名など)をオンラインサーバーから検索してきたりする。
ファイルを入れる特定のフォルダをソフトウエアに監視させることもでき、そうしておけば、著者名、キーワード、あるいは自分が付けたメモを検索するだけで、PDFを探し出すことができる。例えばDelgado-Moralesは、ユーザーが選択した方法で自動的にファイル名を変更する便利なアプリ「Papers」を使って文献ライブラリを整理することで、問題を解決できた。同様の機能を提供しているツールは他にもある。例外はRefMEで、PDF自体ではなく文献リストのみ保管する。
コア機能
文献管理ツールのほとんどは、研究者がさまざまなオンラインソースから文献をインポートするのを補助する機能を備えている。多くのツールは、「PubMed」や「Google Scholar」などの外部データベースのアプリ内検索の他、学術誌のウェブサイトなどから文献データや関連するPDFを収集するウェブブラウザのプラグインも提供している。
無料のオープンソースソフトウエアプロジェクト「Zotero」は、ウェブブラウザから情報を抽出するという課題を解決するために2005年に立ち上げられた。Zoteroのプロジェクト・ディレクターであるジョージ・メイソン大学(米国バージニア州フェアファックス)のSean Takatsは、「これがZoteroの主要な特徴であり、他の文献管理ツールと比較したときの強みでもあります」と言う。一方、RefMEには、スマートフォンのカメラでバーコードを読み取ることで参考文献を追加するという珍しいオプションがある。
文献管理ツールの機能の中で一般的なのは、論文の文中に引用文献を挿入したり、任意のフォーマットで参考文献リストを作成したりする機能だ。EndNoteは広く利用されている市販ソフトウエアで、数十年前からこの機能を提供してきたが、今日では多くの新しいツールとの競争にさらされている。
文献管理ツールの多くは一般的なワープロソフトと連動していて(通常は「Microsoft Word」と連動しているが、フリーウエアである「OpenOffice」や関連するフリーウエアスイートと連動しているものもある)、ユーザーが論文を執筆する際には、言及したい論文を選んでボタンをクリックするだけで、文書にコードが挿入されて文中に引用を示すことができる。さらにユーザーは、プルダウンリストの中から選択するだけで、各学術誌の指定する書式で参考文献リストを作成したり文中で引用したりすることができる。
ほとんどのツールには、論文を読んで注釈を付けるためのPDFリーダーが組み込まれている他、これらのコメント(やPDF自体)をiPadとデスクトップコンピューターの間などで同期させるクラウドベースの機能もある。ReadCubeとcolwizは、PDFの読み取りをさらに充実させている。例えばReadCubeでは、PDFの本文中の引用と著者名がアクティブなハイパーリンクとして表示され、引用された文献や参考文献リストに直接アクセスできる。提携する出版社のウェブサイトにあるPDFを閲覧したり注釈を付けたりする際にも、同じ機能を利用することができる。
こうしたツールの多くは、ライブラリ中の特定の項目に関連した論文を識別したり、ライブラリの内容に基づいてユーザーが関心を持ちそうな論文を勧めたりすることができる。F1000Workspaceは、ReadCubeと同様にアルゴリズムを用いて論文を勧めるが、1万人程度の専門家コミュニティーが推薦する論文も勧める。なお、論文を勧めるスタンドアローンソフトも多い(Nature513, 129–130; 2014)。
共有への動き
多くの文献管理ツールは、研究者がグループライブラリを設定したり、重要な論文を遠方の共同研究者と共有したりすることを可能にするが、このプロセスは出版社の著作権を侵害しないように注意深く管理されている。例えば、Mendeleyのパブリックグループでは、論文に関する情報、すなわちライブラリのカタログのエントリに相当するものしか共有できない。PDFを共有し、改変することができるのはプライベートグループのユーザーだけで、3人以上で共有するときには有料アカウントにアップグレードする必要がある。
ミネソタ大学(米国ミネアポリス)で組織心理学の博士号取得予定のBrenton Wiernikは、共同研究で自分の専門分野の文献の系統的なレビューとメタ分析を行うために、Zoteroの共有ライブラリを利用している。彼は、こうした研究には、論文を共有ライブラリにダウンロードする人や、それを読む人の他、注釈とタグを付ける人や主要なデータのログを記録する人など、15~20人は必要だと考えている。
このプロセスはDropboxのフォルダ共有に似ているが、Zoteroにはメタデータやメモや注釈を追跡・保管できるという利点がある、とWiernik。例えば研究者は、論文に専用のタグを付けて作業中であることを示すことで、共同研究者に別の論文の作業をするように促し、二度手間を回避することができる。
F1000Workspaceにもcolwizにも、文献を共有するだけでなく、原稿を準備したりプロジェクトを管理したりする機能がある。F1000Workspaceでは、研究者がプラグインを利用してMicrosoft Wordの原稿を安全な場所にアップロードすることにより、チームのメンバーが共有するコピーにコメントを付けることが可能だ。ただし、同社の製品開発マネージャーであるJoão Peresによると、原稿のテキストをブラウザで編集することはできないという。
Peresは、F1000Workspaceから学術誌のエディターに直接論文を送る「ワンクリック」投稿機能の提供を計画していて、F1000Researchからそれを始めようとしている。colwizのユーザーもオンラインドライブで書類を共有し、チームのメンバーが閲覧したりコメントしたりすることができる。
このように文献管理ツールの機能にはかなりの重複があるため、ユーザーがどれを選ぶかは、個人的に何を重視するかによって決まることが多い。例えば、サンディア国立研究所(米国カリフォルニア州リバモア)の材料科学者Richard Karneskyは、オープンソースの精神への共感からZoteroを選んだ。
研究者が文献管理ツールを利用する最大の理由は、おそらく、この技術が記憶を検索できるようにしてくれるからだ。製薬会社イーライリリー社(米国インディアナ州インディアナポリス)の上級リサーチサイエンティストであるBoyd Steereは、PDFがぎっしり詰まったデジタルフォルダを、プリントアウトした紙が山積みになった机に例える。
あちこちに付箋紙が貼られ、欄外に書き込みがあり、落書きやメモ書きや矢印がちりばめられた紙の山から必要な情報を探し出すのは一苦労だ。けれどもデジタル文献管理ツールがあれば、埋もれていた知識は単純なキーワード検索になるのだ。
Nature ダイジェスト Vol. 14 No. 11 | : 10.1038/ndigest.2017.171131
原文:Nature (2015-11-02) | : 10.1038/527123a | Eight ways to clean a digital library
Jeffrey M. Perkel
【関連記事】
Nature ダイジェスト Vol. 14 No. 9 | : 10.1038/ndigest.2017.170918
Nature ダイジェスト Vol. 14 No. 9 | : 10.1038/ndigest.2017.170914