マネックス証券は今春から、深層学習(ディープラーニング)技術を活用した校正ツールの導入によって、公開前のコンテンツの表現をチェックしている。

 人工知能(AI)校正ツールを開発したのは、AI活用支援のDATUM STUDIO(東京都新宿区)。マネックス証券が創業の1999年から蓄積してきたウェブサイト3000~4000ページおよび、4000回以上のメールマガジンのテキストデータを教師データとして、時系列データに特化した深層学習アルゴリズムであるLSTM(Long Short Time Memory)に学習させて、AI校正ツールの学習済みモデルを開発した。開発期間は、2016年11月から2017年4月までの6カ月間。

 ルールベースで誤字脱字や文法をチェックするワープロの校正機能と異なり、過去の文書からの学習により、マネックス独特の表現、言い回しに沿っているかを確認できるツールとなる。

 三根公博執行役員はAI校正ツールの開発経緯について、こう語る。

 「当初は表現のルールを作ろうとしたが、あまりに表現の種類が多すぎてルール化できなかった。そこで深層学習アルゴリズムに過去のテキストデータを学習させて、ルールを作ってもらった」

文章中で続く言葉を予測

 公開前のコンテンツ(テキスト)をAI校正ツールに読ませると、画面の左側にそのテキストが表示され、数秒たつと右側に赤字が入ったテキストが表示されるイメージだ。「間違っているかもしれない文字については、その可能性をAI校正ツールが重み付けと自動生成ロジックによって赤字を入れている」(三根執行役員)という仕組みだ。

AI校正ツールの画面イメージ
AI校正ツールの画面イメージ

 本ツールにおける校正の基本的な考えは、ある言葉の次にはどんな単語、言葉がくるかを予測して、その登場確率が低いと赤字を入れる。ただし、課題もある。分かりやすく例えると、「米大統領ドナルド」という言葉の後ろでも「ダック」と予測する可能性がある。「トランプ」と続くと、赤字で指摘してしまうわけだ。

 メールや記事のタイトル、署名や肩書きなど定型文は、予測確率が高い。「NY概況および東京市場見通し」「東京市場概況および個別銘柄概況」といった言葉だ。ウェブサイトやメールのいずれについても、出現頻度が高い単語も予測しやすい。「日経平均」「市場予想」など株価/株式に関連する単語だ。苦手とするのは時事的な言葉のように出現回数が少ない単語だ。例えば、英国の「EU離脱国民投票」など。EU離脱は史上初なので学習データに登場しないからだ。

 校正担当者は、右側の画面を見ながら赤字をチェックして修正するかどうかの最終判断をしている。校正担当者は2~3人。AI校正ツールを導入しても人数は減らしていない。

この記事をいいね!する