トッパン・フォームズは今夏以降、人工知能(AI)による手書き文字認識技術を活用したBPO(ビジネス・プロセス・アウトソーシング)サービスの本格提供を始める予定だ。手書き文字認識技術は、資本業務提携先であるAI開発ベンチャー企業のコージェントラボ(東京都渋谷区)が開発する「Tegaki」を使う。

 この手書き文字認識は、1文字ごとおよび文全体の確信度(正解の確率)を表示するのが大きな特長。確信度が低い場合、元の手書き文字を見て正しいかどうか人間がチェックできる。

 トッパン・フォームズICT事業部の南宣吉担当部長は「これまでは、BPOセンターなどに集めたキーパンチャーが手書きの帳票を見ながらテキスト化するなど人海戦術で対応していた。

 手書き文字認識サービスを実用化すれば、例えば夜中に自動でテキスト化して、翌日の朝から確信度の低い文字について人間がチェックすればいいので、業務を大幅に効率化できる。処理速度が向上すれば、キーパンチと並行して行うことも可能だ」と解説する。

 4月からトッパン・フォームズでトライアルをしている。「業務に使えることは既に分かっている。実際にどの程度のビジネス的な効果があるのか、半年を目安に定量的な効果を調べる。夏以降本格展開する」(南担当部長)という。

熟練者を超える認識率へ

 手書き文字の認識については、熟練した人でも97~98%。将来的に学習効果が上がれば、AI文字認識エンジンは熟練者を超えることが可能だという。

 手書き文字認識システムの構成は以下の通り。まず手書きの帳票をスキャナーで読み取ってイメージデータにする。そのイメージデータを手書き文字認識エンジンにかけて、テキストにする。そのテキストをパソコン画面に表示するという流れだ。その際、例えば1文字1文字の確信度や文全体の確信度を表示する。表示方法は現在検討中。

高い精度で手書き文字を認識する
高い精度で手書き文字を認識する

 手書き文字認識エンジンのアルゴリズムについては非公表としている。人が書いた文字に何の文字かというラベルを貼り、教師データとしている。この教師データを使って手書き文字認識アルゴリズムに学習させている。ディープラーニング(深層学習)を使って教師データの量を増やす工夫をして、精度を上げているという。

 コージェントラボのデイビッド・マルキンAIアーキテクトは、「手書き文字認識アルゴリズムはテキスト全体を見ながら1文字1文字を判断しているので、文字が消えていても類推できる」と話す。このアルゴリズムは、日本語に限らず他の言語も認識できる。

 手書き文字認識アルゴリズムの精度を上げるとともに、トッパン・フォームズは、AIアルゴリズムが認識しやすい帳票の開発も並行して進めている。例えば、住所を記入する枠を広げたり、指定した行数で記入してもらえるような工夫をしたりしている。