本インデックスは、OA(オープンアクセス)学術論文をアーカイブし、永続的に利用できるようにするための継続的な取り組みの一環。
本インデックスのデータセットには、IA Scholarにアーカイブされている6,000万件以上のメタデータおよび論文や書籍、コードなどの1億2,000万件以上の学術成果物から抽出された13億件以上の引用が含まれている。
本インデックスにより、閲覧や検索が容易になり、どのような作品が特定の学術リソースを引用しているかを把握できるようになる。
データセットはCC 0ライセンス下で公開されており、ダウンロードも可能。また、データの抽出と照合のために作成された関連ソフトをオープンソースツールとして提供している。プレプリントサーバーarXivでは、本インデックスの技術的な詳細をまとめたホワイトペーパーも公開されている。
[ニュースソース]
Internet Archive Releases Refcat, the IA Scholar Index of over 1.3 Billion Scholarly Citations — Internet Archive 2021/10/19 (accessed 2021-10-25)