日中・中日機械翻訳実用化プロジェクト
 
概要

世界の科学技術の進展において、日本発・中国発の研究成果の重要性が今後益々高まると考えられます。

本プロジェクトは、「日中・中日言語処理技術の開発研究プロジェクト(2006~2010年度、代表機関:情報通信研究機構)」の成果を受け、2013~2017年度の5年間のプロジェクトとして、科学技術分野の日中・中日機械翻訳の実用化を目指しています。

具体的には、以下のステップでプロジェクトを推進中です。

第1ステップ(2013~2014年度) 言語資源の整備
第2ステップ(2015~2016年度) 機械翻訳エンジンの高精度化
第3ステップ(2017年度) 実用化のための応用開発

 
協力関係

プロジェクトの推進にあたっては、日本のみならず、中国の機関とも協力し、広く成果の活用を図っていきます。

日本側: 科学技術振興機構(JST)、京都大学 大学院情報学研究科 黒橋研究室(黒橋禎夫教授)
中国側: 科学技術信息研究所(ISTIC)、
中国科学院自動化研究所*、北京交通大学*、ハルビン工業大学*(* 2014~2015年)

 
進捗・成果
  • プロジェクトワークショップを日中両国で定期的に開催
  • 日中韓科学技術情報機関連絡会での進捗報告
    日本:JST、中国:ISTIC、韓国:科学技術情報研究院(KISTI)の3機関によるによる科学技術情報流通に関する情報交換や共同プロジェクトの立ち上げなどを主な目的とした会合。
    第5回(2014年11月10~11日)、第6回(2016年5月11日~13日)において本プロジェクトの進捗と中間成果について説明。
  • アジア言語を対象とした機械翻訳エンジンのコンテスト「WAT」(Workshop on Asian Translation)の立ち上げと共催
    第1回2014/10/4東京
    第2回2015/10/16京都
    第3回2016/12/12大阪(COLING 2016 併設ワークショップとして開催)
    詳細は右のHPまで  WAT   (*京都大学のページに飛びます)
  • 最新成果

    2016年度、人工知能の主要技術であるニューラルネットワークを用いた機械翻訳システムを開発し、WAT 2016において日中・中日機械翻訳でトップとなる翻訳精度を達成しました。

    また、JSTが提供する科学技術文献データベースJSTChinaの中日機械翻訳に適用を開始しました。

    機械翻訳精度の向上には、学習データ(対訳コーパス)が極めて重要な役割を果たすため、引き続き対訳コーパスの整備を行っていきます。


    ※ ニューラル機械翻訳の仕組み(日英の場合のイメージ)

    ※ 中日機械翻訳の例

    原文(中国語) 機械翻訳文(日本語)
    目的探讨TBX5基因多态性与心房颤动的相关性。 目的:TBX5遺伝子多型と心房細動との関連性を検討する。
    方法房颤患者100例(房颤组)和非房颤患者(对照组)107例进行TBX5基因rs3825214单核苷酸多态性和房颤的关联研究。 方法:心房細動患者100例(心房細動群)と非患者(対照群)107例において、TBX5遺伝子rs3825214の一塩基多型と心房細動の関連研究を行った。
    所有患者均采集外周血提取基因组DNA,采用聚合酶链反应‐限制性片段长度多态性技术(PCR‐RFLP)检查患者TBX5基因rs3825214多态性的基因型和等位基因分布。 すべての患者は末梢血からゲノムDNAを抽出し、ポリメラーゼ連鎖反応‐制限断片長多型(PCR‐RFLP)を用い、患者のTBX5遺伝子rs3825214多多型の遺伝子型と対立遺伝子分布を検査した。
 
お知らせ

日中・中日言語処理技術の開発研究プロジェクトの成果である日英コーパス、日中コーパスについては、研究目的に限り研究者の方に無償で貸与しております。ご希望の方は以下のページをご参照下さい。

ASPEC  (*京都大学のページに飛びます)
 
お問い合わせ

本プロジェクトに関するお問い合わせは、

国立研究開発法人科学技術振興機構 情報企画部システム高度化グループ
Mail: aspec-at-jst.go.jpまで (-at-の部分を@に替えて下さい。)