OpenAIREは、10月8日、"OpenOrgs:the OpenAIRE service for bridging registries of research organisations"と題する記事を公開した。
本記事は、レジストリから収集した研究機関情報の曖昧さに対処する新たなツール"OpenOrgs"を紹介している。
同じ機関でも、データソースによって名称の表記やメタデータが異なる場合がある。特に、RORやISINなどのPID(Persistent Identifier、永久識別子)スキーマが異なると、機関を識別できない可能性がある。
本ツールは、自動化されたプロセスと人間によるキュレーションを組み合わせている。まずアルゴリズムが、異なったデータソースにおいて、名前やメタデータ情報、PIDなどから類似性がある機関をグループ化する。次にキュレーターが同じ機関かどうかを識別するというもの。キュレーターは、アルゴリズムが見逃した重複やメタデータを追加することもできる。
なお、9月に開催された"Open Science Fair"で本ツールを発表したデモ動画も公開されている。
[ニュースソース]
OpenOrgs:the OpenAIRE service for bridging registries of research organisations ― OpenAIRE 2020/10/08 (accessed 2020-10-19)
OPENORGS:tHE OPENAIRE TOOL FOR BRIDGING REGISTRIES OF RESEARCH ORGANIZATIONS ― Open Science Fair (accessed 2020-10-19)