文字サイズ

  • 大
  • 中
  • 小

お知らせ

「自動索引技術の研究・実証のためのデータ無償貸与」の参加者を公募します
2021年10月20日 | トピックス
1.概要
 国立研究開発法人科学技術振興機構(以下、「JST」という。)では科学技術情報インフラを構築する事業の一環として、国内外の科学技術文献情報を横断的に検索・分析可能とするためにJSTが保有する科学技術用語辞書にもとづく索引語の付与を行っています。
 「自動索引技術の研究・実証のための無償データ貸与」では、文献情報へ索引語を自動付与する技術を保有し、以下の課題へ取り組もうとする公募参加者に対して審査のうえでJSTが保有する文献データ等を貸与いたします。
 なお、審査のうえで文献データ等を貸与されることになった参加者(以下「データ受領者」という。)には取り組みの成果を報告書に取り纏めてJSTへ報告していただくことになります。

2.課題
 医学・薬学分野の日本語科学技術文献情報に対して分野特有の索引語であるサブヘディングを高い精度で自動付与する。※詳細は別添「公募要領別添資料」を参照してください。

3.貸与期間
 審査に基づきJSTがデータ貸与を認めた日から2022年3月31日(木)

4.応募資格
 BERT(Bidirectional Encoder Representations from Transformers)等のTransformerアーキテクチャによる事前学習モデルを用いた自然言語処理のノウハウを持つ日本国内の学校や企業等の組織からの応募とします。 

5.応募方法
 (1) 募集期間
 2021年10月21日(木)~11月24日(水)
 (2) 提出書類
 別添「応募様式」に沿って全ての項目を記載のうえJSTへ提出してください。
 応募組織が「大学等の教育機関および国公立研究機関」以外の場合は、別添「表明・確約書」を合わせてご提出ください。

6.審査
 BERT(Bidirectional Encoder Representations from Transformers)等のTransformerアーキテクチャによる事前学習モデルを用いたJSTの自動索引処理への貢献が見込まれる具体的で優れた実施計画であるか、提出書類により審査を行います。

7.貸与データ
 (1) 貸与データの種類 ※詳細は別添「公募要領別添資料」を参照してください。
   ◇文献データ:国内の医学・薬学文献の標題・抄録、国内の医学・薬学文献の全文テキスト
   ◇索引データ:上記の文献データに対して人手付与した索引語
   ◇辞書データ:JST科学技術用語シソーラス、大規模辞書
   ◇索引語付与の精度評価用データ
 (2) 貸与データの取り扱い
    貸与データが第三者に漏洩しないように厳重な管理を行うとともに、万一漏洩が発生した場合に備え、予め暗号化処理等の措置をお願いします。
    貸与期間終了後は、貸与データの利用を停止し、JSTの指示に従ってデータの消去・削除をお願いします。

8.成果の取り扱い
 (1) 成果報告書
    以下の項目を記載した報告書をJSTへ提出していただく必要があります。
    データ貸与期間の終了時までに報告書をJSTへ提出するものとします。また、データ貸与期間の途中に索引語付与の精度評価などの中間報告を求める場合があります。
    ◇処理概要(学習データ作成、学習モデル作成、辞書データ活用、索引語付与の処理概要)
    ◇処理の実行環境、処理性能の実測値
    ◇索引語付与の精度評価 ※詳細は別添「公募要領別添資料」を参照してください。
    ◇課題分析
    報告書の著作権はデータ受領者に帰属しますがJSTが自動索引のために利用できるものとします。
 (2) プログラム
   JSTが求めた場合、JSTは、データ受領者が開発したプログラムの性能を検証する目的で利用できるものとします。
 (3) 機械学習済モデル
    提供データにより学習させた学習済モデルに関する権利はJSTに帰属するものとします。データ受領者は学習済モデルを本研究開発のみに利用できるものとし、営利目的を含め、他の目的には利用できないものとします。

9.成果の公表
 データ受領者およびJSTは、別途締結する秘密保持の契約を遵守のうえで、本データ貸与により得られた成果の発表または公開もしくは公表を行うことができます。公開もしくは公表を行う場合は、事前に相手方の承諾を得るものとします。学習済モデルを公開することはできません。

10.契約書(案)
   応募にあたり契約書(案)の参照を希望される場合は下記の問い合せ先へご連絡ください。

11.サンプルデータの事前提供
   応募にあたり事前にサンプルデータを希望される場合は下記の問い合わせ先へご連絡ください。

12.問い合わせ先
   情報企画部システム高度化グループ 関根、鈴木
   kodoka@jst.go.jp
                                                                以上