欧州委員会(European Commission)は、1月18日、多様性に富む欧州統合の一環として多言語使用(multilingualism)を助長すべく、約100万のコーパスとEU22ヶ国(23ヶ国中)の公用語への高品質翻訳リポジトリを無料公開した。
ベースとなったのは23ヶ国の公用語で存在するEU法。法律文書は技術、政治、社会問題等を網羅し他言語対応が可能。データは、手作業で翻訳したテキストから単語やフレーズの正確かつ文脈的翻訳方法を学習する機械翻訳システムで作成した。文法/スペルチェック、オンライン辞書、多言語文書分類システム等、他の言語ソフト開発にも有用。
これにより、使用人口の少ない言語コミュニティーに属する人々でも、最も多く使われている言語で作成された文書やウェブに容易にアクセスできる。なお、現在はアイルランド語のみ未対応。
[ニュースソース]
European Commission makes computer-assisted translation easier and more accessible