AIでくずし字判読するアプリ「みを」の正式版がリリース

ROIS-DS人文学オープンデータ共同利用センター(CODH)は、くずし字を読み取れるアプリ「みを(miwo)」のAndroid版とiOS版を正式リリースしたと8月30日に発表しました。「みを」という名称は、『源氏物語』第14帖「みをつくし」にちなんだもの。

CODHでは、画像に含まれるくずし字を翻刻する機能を備えたAIくずし字認識技術を開発。その技術を誰でも気軽に使えることを目指して開発されたのが本アプリとのこと。

主要機能は以下の通り。

  1. カメラで撮影した画像や、ネットからダウンロードした画像を対象に、くずし字を認識して現代の文字に変換する(翻刻する)ことができます。
  2. 認識した文字を画像上に表示できます。また文字の位置を表す四角形を表示することもできます。
  3. 認識結果が正しくない場合、文字を修正することができます。
  4. 認識結果をテキストとして出力し、コピーして他のアプリで使うことができます。
  5. 認識結果をアプリ内に保存し、後で呼び出すことができます。
  6. CODHのくずし字データセットと連携し、アプリ内からくずし字の用例を検索できます。

2021年4月19日から6月18日まで開催されていた展覧会プログラム「文字形—AIが開く くずし字の風景 @ 慶應義塾ミュージアム・コモンズ」で行われた「みを」のデモ画像がYouTubeで公開されています。

「みを」のAIは江戸時代の版本から集めたくずし字データを学習しているため、江戸時代の版本に対する制度が比較的高めになるとのこと。また、現在のところ石碑や看板などに書かれたくずし字は認識することができません。

▼関連リンク