データ共有と再利用はなぜ難しいのか(発表資料)

2017年05月01日

北米・中南米

米国立衛生研究所(National Institutes of Health, NIH)Big Data to Knowledge(BD2K)がシリーズで開催するウェビナーBD2K Guide to the Fundamentals of Data Science(試訳:データサイエンスの基礎BD2Kガイド)として、カリフォルニア大学情報学Christine L. Borgman氏とCandidate Irene Pasquetto氏による講演(4月21日開催)の発表資料が公開された。講演タイトルは、"Why Data Sharing & Reuse Are Hard To Do?"(試訳:データ共有と再利用はなぜ難しいのか)。

以下、抄録を紹介する。

抄録

研究者は新しい方法や設備を利用して、前例のないほど大量のデータを作成している。これらデータにアクセスし、再利用することで、知識発見の体系的方法を必要とする複雑な研究課題を解決することができる。しかし、研究データを手に入れることは容易ではないことが多く、またデータが共有されるにしても、本来作成された状態ではない形で再利用することはできない。科学におけるデータの実践に関する研究を基に、生物科学、海洋学、天文学、分子生物学、ゲノム学の研究者が直面するデータ共有と再利用の課題を比較する。データ共有で決定が困難な点は、何を、いつ、どのような形式で、またどのような方法で公開すべきかである。再利用については、どのデータが、誰によって(必要とされる専門性)、また誰と(共同研究環境)再利用されるのか、どのような条件で(データの品質とキュレーションの課題)、なぜ(データ統合の必要性、制御、比較)、どのような効果(分析の種類)があるかである。