ネイチャー社のデータジャーナルScientific Data8月4日付け記事“Making data count” を紹介する。当該記事は、PLOS、University of California Curation Center(CDL)、DataOneによるデータレベルの評価指標の開発プロジェクト"Making Data Count: Developing a Data Metrics Pilot(小欄記事)”の進捗と、開発に伴い2014年12月に行われた利用・インパクト指標の有用性に関する調査(小欄記事)の結果を考察したもの。
調査概要:ソーシャルメディア、リストサーブ、CDLおよびPLOSブログへの投稿者を対象としたオンライン調査。回答数は、研究者(247人)、データ管理者(73人)。分野は、
生物学(53%)、環境(17%)、社会科学(10%)。
考察:
- 個人からの依頼によるデータ共有は研究者間で頻繁に行われ、その手段であるメール等の個人的方法は追跡が困難である。他方、75%はデータベースやリポジトリで何らかのデータを公開しており、さらにメール等の方法ではデータの一部を共有しているに留まるが、リポジトリではデータの大部分あるいは全部の共有が行われている。
- 引用は研究を評価する指標として高く評価されているが、正式なデータセットの引用はあまり行われておらず、現在はその有用性が限定的である、研究者は正式なデータ引用を強く望み、2011年の調査でも、95%の研究者は正式な引用はデータ共有の公正な条件であると考えていることが示唆された。
- ページビュー、ソーシャルメディアは、ステータスの低さ、データに関連する動きが欠如しているため、研究者、データ管理者のいずれもあまり重視していない。他方引用は最も重視され、ダウンロード数はその次に有用な指標と考えられている。引用とダウンロード数に対する評価の差は驚くほど小さく、またリポジトリの多くがダウンロードをすでに追跡しており、ダウンロード数を公表することを強く推奨する。
- 同プロジェクトではDataONEのデータセット94,752件をインポートした。DataONEネットワークに変更を加え、国際的な利用統計基準COUNTERに準拠したダウンロード統計をトラックすることが可能である。今後Dryadのデータセットをインポートし、2015年秋には開発の最終段階が完了する。