諫早市立諫早図書館(長崎県諫早市東小路町)は本年度、人工知能(AI)による古文書解読システムを本格導入し、江戸時代の佐賀藩諫早領時代の諫早家文書の一つ、「諫早日記」の解読を進めている。同システムを開発したTOPPAN(東京)によると、全国約30機関で導入。九州では同館と熊本大のみ。
諫早家の出来事などを記した諫早日記の解読は2007年度から開始。ボランティアの解読委員会(10人)が、毛筆を崩した書体の「御家流」で記述された日記を崩し字辞典で確認したり、互いに話し合ったりしながら、1冊ずつ現代の文字に直してきた。
全1033冊のうち、虫食いや重複などを除いた868冊が解読対象だが、23年度末時点で完了したのは35%超の308冊にとどまる。同館はボランティアの高齢化もあり、同年度、AI古文書解読システムを試験導入。当初、AIのみの解読精度は約69%だったが、同システムの精度向上などを調整し、本格導入後はAIのみで約90%に向上した。
同社は解読できない崩し字を読み解くために学習用データを独自収集し、数百万文字をAIに登録。解読したい崩し字の画像からAIが形の似ている文字を推定し、現代の文字を横に表示する。複数の候補があれば、合致する可能性が高い複数の候補を示し、人間が選択することもできる。
諫早日記のAI解読も同様の流れで行った後、解読委員が誤字の有無や文章として読み進められるかどうかなどの校正作業を実施。解読委員の1人は「(AIの)文字の判別は優れており、作業のスピードは上がった。ただ、文章として成り立っているか、微妙な点もあり、細かく確認するのはこれまでと変わらない」とし、じっくりと古文書と向き合う作業を続ける。
同館は同システムの導入に伴い、従来の解読作業より約1・5倍~2倍のスピードアップに期待を寄せる。石山雅晴館長は「解読委員会の確認作業抜きではあり得ない活動。解読委員会の長年の苦労に報いるため、AIを活用し、できるだけ早く、読みやすい状態でホームページに公開し、研究や市民の活動に還元したい」と話す。
諫早家の出来事などを記した諫早日記の解読は2007年度から開始。ボランティアの解読委員会(10人)が、毛筆を崩した書体の「御家流」で記述された日記を崩し字辞典で確認したり、互いに話し合ったりしながら、1冊ずつ現代の文字に直してきた。
全1033冊のうち、虫食いや重複などを除いた868冊が解読対象だが、23年度末時点で完了したのは35%超の308冊にとどまる。同館はボランティアの高齢化もあり、同年度、AI古文書解読システムを試験導入。当初、AIのみの解読精度は約69%だったが、同システムの精度向上などを調整し、本格導入後はAIのみで約90%に向上した。
同社は解読できない崩し字を読み解くために学習用データを独自収集し、数百万文字をAIに登録。解読したい崩し字の画像からAIが形の似ている文字を推定し、現代の文字を横に表示する。複数の候補があれば、合致する可能性が高い複数の候補を示し、人間が選択することもできる。
諫早日記のAI解読も同様の流れで行った後、解読委員が誤字の有無や文章として読み進められるかどうかなどの校正作業を実施。解読委員の1人は「(AIの)文字の判別は優れており、作業のスピードは上がった。ただ、文章として成り立っているか、微妙な点もあり、細かく確認するのはこれまでと変わらない」とし、じっくりと古文書と向き合う作業を続ける。
同館は同システムの導入に伴い、従来の解読作業より約1・5倍~2倍のスピードアップに期待を寄せる。石山雅晴館長は「解読委員会の確認作業抜きではあり得ない活動。解読委員会の長年の苦労に報いるため、AIを活用し、できるだけ早く、読みやすい状態でホームページに公開し、研究や市民の活動に還元したい」と話す。