Natureは、10月26日、"Giant, free index to world's research papers released online"と題する記事を公開した。
本記事は、米国の技術者が10月7日にオンライン公開した、ペイウォール論文を含む世界の1億700万本の論文に含まれる単語や短いフレーズの無料インデックス"The General Index"を紹介したもの。
本インデックスの作成者によると、Google Scholarのような無料の検索エンジンは、出版社の同意を得て有料文献のテキストをインデックス化しているが、ユーザーは特定の種類のテキストクエリでしか検索できず、自動検索も制限されているため、より専門的な検索を用いたコンピューターによる大規模な分析ができないという。本インデックスは、研究者が出版された論文に法的にアクセスできなくても、これらから洞察を取得し、容易に分析できるようにすることを目的としている。
また作成者は、本インデックスには論文の全文は含まれておらず、5語(5-grams)以内の文章の断片に限定されるため、公開しても出版社の有料論文の再利用に関する著作権ポリシーには違反しないと主張している。しかしある法学者は、作成者が本インデックスの作成に必要だった全論文の入手やコピー方法を明らかにしておらず、その方法が出版社の規約に違反せずに行われたかどうかが問題だと指摘している。
作成者は、自分の行為は合法だと確信しており、科学を発展させるための行為だと述べている。
[ニュースソース]
Giant, free index to world's research papers released online ― Nature 2021/10/26 (accessed 2021-11-02)