NDL(National Diet Library、国立国会図書館)は、11月8日、OCR(Optical Character Recognition/Reader、光学的文字認識)テキストを画像に重ねて表示する機能を「次世代デジタルライブラリー」※に追加したと発表した。
これにより、同ライブラリーの画像ビューワで表示する古典籍資料の画像上に、くずし字などのテキストデータを重ねて表示できるようになったという。
同館は、11月1日に、同ライブラリーに、江戸期以前のくずし字資料など約6万点のデジタル化済み古典籍資料のOCR全文テキストデータを追加し、当該資料の全文検索が可能になったことを発表していた。
※NDLの実験的な検索サービスで、著作権の保護期間が満了した図書や古典籍資料(約35万点)が検索可能。
[ニュースソース]
次世代デジタルライブラリーにOCRテキストを画像に重ねて表示する機能を追加しました -- NDL 2022/11/08 (accessed 2022-11-09)