文字サイズ

  • 大
  • 中
  • 小

STI Updates

理研、分散データベース群の高速統合検索技術を開発

独立行政法人理化学研究所(理研)は、3月19日、約30万個の分散データベース群を高速に統合検索する技術を開発したことを公表した。

文献情報やゲノム情報など生命科学分野における個別データベース群を、理研内に分散データベースとして試験的に構築し、これらを高速で横断検索し、重要情報を含むデータベースを容易に選び出す技術「GRASE(General and Rapid Association Study Engine)」を開発したというもの(理研総合データベース(RIKEN Hub Database)上で公開)。

さらに、この技術を使って「機能」と「遺伝子」のつながりを、既存の知識情報に基づき推論的に検索できる強力なウェブ検索サイト「PosMed(Positional Medline)」も公開された。このサイトでは、医学用語に限らず、あらゆる英語のキーワードから検索することができるとのこと(日本語のキーワードは医学用語のみ使用できる)。

これらのサービスは理研ウェブサイト内のRIKEN Hub Database Projectで公開しており、誰でも無料で利用することができる。

理研には、多くの研究室があり、データ公開も様々な形式で行われているため、どこにどのようなデータが公開されているのか、専門分野外の人には分かりづらく、公開データの再利用や、コンピュータを使った統合利用が容易ではなかった。そこで、SWF (Semantic Web Folders) を用いて、理研が公開するデータの永続性を担保するとともに、文部科学省が推進する“ライフサイエンス統合データベース”からの統合検索を可能にし、外部者からのアクセスを容易にすることが求められていた。理研側でこのハブ機能を担うのが、この“理研総合データベース(RIKEN Hub Database)”である。

[ニュースソース]
約30万個の分散データベース群を高速に統合検索する技術を開発 - 生命情報基盤データベース群の統合検索エンジンとして活用 -