ヤフーの代表的なサービスである「Yahoo! ニュース」には、毎日数多くのコメントが寄せられる。その中には読む人に不快感を与える不適切なコメントも多く含まれている。ヤフーでは、こうした不適切なコメントの検出にディープラーニングを活用した。日経クロストレンドと日経クロステックが主催した「第2回 ディープラーニングビジネス活用アワード」のメディア部門賞を獲得した「不適切なコメント投稿を検知するAI開発」がそれだ。増え続けるコメントへの対応に追われる現場の課題感と、ディープラーニング黎明(れいめい)期から着実な研究開発を続けてきた技術部門の研究成果がぴたりと合致して出来上がったAI(人工知能)だった。

 Yahoo! ニュースを見るときの楽しみの1つに、様々な人が書き込んだニュースコメントを読むことが挙げられる。世の中には自分と同意見の人がいるだけでなく、多彩なものの見方があることを知る情報の羅針盤の役割を果たす。そんなYahoo! ニュースのコメント掲出の裏で、ディープラーニングが活躍していることをご存じだろうか。

 ニュースコメントは多様な人が投稿するから価値があるのだが、一方で問題のあるコメントが投稿されることも多い。多くの人に不快感を与えるコメントや、内容は問題がないとしても元の記事との関連がないコメントなどである。こうした投稿が多くなると、利用者はYahoo! ニュースのコメントを見ることで不快感を覚えたりストレスを感じたりするようになる。それでは本末転倒だ。

 コメント機能が注目されるようなってから利用者は急拡大し、2015年ごろに1日14万件ほどだった投稿は現在では多い日で40万件に上るようになった。従来は不快な投稿に対しては主に人手によるパトロールを実施して削除するように対応してきたが、「増え続けるコメントに人員を増やすことで対応するのか。さらに人を増やしたとしても同一の基準で判断できるのか。そうした課題に直面していました」とYahoo! ニュースのコメントを担当するプロジェクトマネージャーは話す。コメント欄が存在感を増すとパトロール態勢にも負荷がかかるというジレンマがあったのだ。

Yahoo! ニュースのコメント欄は、世の中には自分と同意見の人がいるだけでなく、多彩なものの見方があることを知る情報の羅針盤の役割を果たしている
Yahoo! ニュースのコメント欄は、世の中には自分と同意見の人がいるだけでなく、多彩なものの見方があることを知る情報の羅針盤の役割を果たしている

不快判定をディープラーニングで行うという発想

 機械学習技術を採用し、不快判定のサポートをするシステムはすでに使っていたが精度に課題があった。「スコア化された不快度にしきい値を設定してコメントを削除するシステムでしたが“誤爆”(誤削除)は許されません。スコア算出の精度があまり高くなかったため、しきい値を上げざるを得ませんでした。すなわち、人手を掛けないで不快判定をするという効果はあまり得られなかったのです」(プロジェクトマネージャー)

 プロジェクトマネージャーは19年4月にコメント担当になり、不快判定作業の現実を目の当たりにした。機械学習を使った従来型のシステムもアップデートはしていたが劇的な精度向上は見られなかったため、これまでの延長線上ではない新しい技術があるのなら試してみたいと思っていた。「不快判定の“グレー部分”をAIなどを使ったシステムに多く任せることができれば、人にしかできない改善業務に人手を充てられます。ちょうどその頃、Yahoo! 知恵袋にディープラーニングを適用した不快判定を導入したという話があり、担当者に相談に行きました」と同氏は語る。