Journal of eScience Librarianship誌7月19日掲載の“Discovery and Reuse of Open Datasets:An Exploratory Study”(試訳:オープンデータセットの発見性と再利用:予備的調査)(pdf:15ページ)を紹介する。
以下抄録より抜粋する。
目的:本稿は、引用あるいはダウンロードされている20個のデータセットとこれらデータセットを収録するリポジトリを分析し、学術図書館員が機関リポジトリに収録される研究データの発見と再利用を促す際の見識を提供する。
方法:トムソン・ロイター社Data Citation Indexとリポジトリのダウンロード統計を使用し、引用/ダウンロードされた20個のデータセットを特定した。データセットとこれらを収録するリポジトリの特性を独自に作成した見出しに従ってまとめた:基本情報;助成機関とジャーナル情報;リンクおよび共有;再利用を促す要因;リポジトリの特性;およびデータ記述。
結果:この小規模の調査からは、引用/ダウンロードされたデータセットは、再利用を促すために推奨される基本事項に準拠しており、データがうまく記述されており、多様なソフトウェアにより使用できる書式となっており、確立したオープンアクセスリポジトリで共有されている。次の3要素がデータセットの発見性に寄与していた。(1)分野に特化したリポジトリでの公開、(2)Web上の1つ以上の場所での索引、(3)永久識別子の使用。この分析で使用した引用/ダウンロードされたデータセットは、特定のいくつかの分野のものであり、またデータ出版を義務付ける機関により助成される傾向にあった。