KISTI(韓国科学技術情報研究院)は、2023年12月28日、生成系言語モデルKONI(KISTI Open Natural Intelligence)13bを開発したと発表した。
同院は、機微情報やセキュリティー問題などを重視する政府系研究機関や公共機関、費用の問題で導入をためらう中小企業において、ChatGPTのようなLLM(Large Language Model、大規模言語モデル)技術の活用に多くの課題があったことに言及。
既存のLLMが抱えるハルシネーション※1を最小化するために、RAG(Retrieval-Augmented Generation、検索拡張生成) 技術※2の適用が容易な同モデルを開発。PEFT(Parameter Efficient Fine Tuning)※3の導入によりファインチューニング時の計算コストを削減できるほか、多様な分野のLLM需要に迅速に対応できるようアダプター形式のファインチューニングなどを適用したという。
※1 AI(Artificial intelligence、人工知能)が、事実とは異なるあるいは文脈にそぐわない回答を生成し出力する現象。
※2 既存の情報サービスシステムが保有するデータを回答生成に活用できる技術。
※3 モデル全体ではなく、一部のパラメーターだけをファインチューニング(学習済みモデルに対する新たなデータを用いた追加学習)することでLLMを効率的に再学習する手法。
[ニュースソース]
KISTI, 생성형 언어 모델 KONI 개발 ― KISTI 2023/12/28 (accessed 2024-02-08)
[小欄関連記事]
2023年12月18日 KISTI、AIモデルを適用した科学技術情報キュレーションシステムの正式運用を発表
2023年03月09日 KISTI、次世代論文投稿審査システム"ACOMS+"の開始を発表
2021年11月15日 KISTI、"ScienceON"における機械学習データの公開および同データを活用した新たなサービスを開始
2020年07月08日 KISTI、科学技術知識インフラサービス"ScienceON"でAI論文要約サービスを試行