研究データの再生と法的権利との問題を取り上げた、ネイチャー誌8月3日付け記事“Legal confusion threatens to slow data science(試訳:法的曖昧さはデータサイエンス減速の脅威)を紹介する。
ペンシルベニア大学のデータサイエンティストDaniel Himmelstein氏は、薬物、遺伝子、疾病を収録する28個のパブリックソースのデータをつなぐ無料のオンラインリソースHetionetを手がけている。しかし、パブリックソースのデータの許諾を得るのは驚くほど困難な作業で、彼はそれに数か月を費やした。
許諾のためにコンタクトした研究者からは、「許諾など思いもよらなかった」との回答や、回答のないもの、法的問題が明確にならなければ回答できないとするものなど、再配布を禁じた1件を除き、明確な許諾のない3件を含む最終版を7月に公開した。
このような状況は、データのパブリックへの投稿は他者がそのデータを合法的に再版できるということを研究者の多くが理解していないことを露呈している。「法的な曖昧さのために、研究者はデータセットをより有用なリソースにリンクさせるということに消極的になり、科学を減速させてしまう」と彼は言う。
事実であるデータを著作権で保護することはできないため、アクセスについての明確な規約なくパブリックに投稿されたデータセットは、法的に問題なく再版できるのかというと、一概にそうとも言い切れない。
欧州連合(EU)はデータベースの編纂にかかる投資を保護することを目的として、著作権とは別に、特定のデータベースに権利を与えている。段階的に法的保護を与える国もあれば、米国のようにデータベースの統治に別個の権利を設けず、曖昧さが残る場合もある。そのため、データ共有を推進する組織はパブリックデータベースの作成に、データの再利用と再配布の方法、データベースの権利の放棄について明示することを推奨している。
明確な許諾がなくとも規約を犯さない限り、法的な罰則を受けるとは考えにくい。しかしHimmelstein氏は、法的な明確さの欠如により、他の研究者が学術データの再生を躊躇するのでは、と指摘する。
[ニュースソース]
Legal confusion threatens to slow data science - ネイチャー 2016/8/3