Data Science Journal誌に3月22日掲載の記事"On the Reuse of Scientific Data"(試訳:科学データの再利用について)を紹介する。
抄録
科学政策はデータ共有とオープンデータを促進するが、それら自体は目的ではない。データ共有の議論は、研究を再現し、公的資産へのパブリックアクセスを実現し、研究投資を推進し、研究とイノベーションを前進させるものである。これら期待されるデータ共有の利益を達成するため、データは他者により実際に再利用されなければならない。データ共有の実施、特に動機とインセンティブは、おそらく、再利用の上に横たわる争点となる概念と、再利用が生じる性質の異なる事情のせいで、データの再利用より多く研究されてきた。ここでは、データの再利用を検討する手段として、データ、共有、およびオープンデータの概念を詳細に解説する。データの使用と再使用との区別を調査し、最後に、コミュニティーが求める価値あるデータの再利用について、研究上の疑問点を6つ提示する:データの使用は再利用とどう区別できるか。再現性が本質的ゴールとなるのはいつか。データ統合が本質的ゴールとなるのはいつか。新たなデータの収集と既存データの再利用はどう相殺されるか。データを収集する動機はデータの再利用にどう影響するか。データ開放の基準と形式は再利用の機会にどう影響するか。我々は科学政策と、データの再利用における投資に対するこれら疑問の意味するところを取りまとめ結論とする。