国立研究開発法人科学技術振興機構(以下「JST」)は、科学技術文献の活用業務に係る自然言語処理研究および技術実証事業において2023年度に採択した研究テーマ「学術文献に対する根拠付き自動要約とその基礎データ作成に関する研究開発」について事後評価を実施した。
1.研究テーマの概要
自動要約の研究開発は多く、最近は大規模言語モデルを応用した生成型の要約の手法も提案されている。本研究開発課題では、日本語の学術文献を対象として当該文献の本文との関係が把握可能な以下のような要約手法を開発する。
● 根拠付の生成型要約
一つの文献の本文テキストから一つの報知的(informative)要約を出力する(単一文書要約)。要約手法としては、入力文書の文、あるいは、節を抜き出して配列したいわゆる抽出型(extraction)ではなく、新たな文を合成する生成型(abstraction)とするが、各生成文の根拠の出力を必須とする。
2. 事後評価の概要
2-1.評価の目的、方法、評価項目及び基準
科学技術文献の活用業務に係る自然言語処理研究および技術実証事業における規程等に基づき、事後評価の目的、方法、評価項目及び基準に沿って実施した。
2-2.評価対象研究代表者及び研究課題
2023年度採択研究課題
(1) 河原 大輔(早稲田大学理工学術院 教授)
生成型・抽出型を融合した根拠付き自動要約
2-3.事後評価会の実施時期
2024年8月2日(金)
2-4.評価者(情報企画部研究開発推進委員会)
委員長 大山健志 JST情報企画部 部長
委員 神門典子 国立情報学研究所 情報社会相関研究系 教授
委員 森 辰則 横浜国立大学大学院 環境情報研究院 教授
委員 菊井玄一郎 JST情報企画部 情報資産企画グループ 主任専門員
委員 堀内美穂 JST情報企画部 文献業務グループ 調査役
委員 松澤義朗 JST情報企画部 知識インフラグループ 調査役
3. 事後評価結果