スマートニュース(東京都渋谷区)が開発するスマートフォン向けニュースアプリ「SmartNews」が昨秋、米「App Store」のニュース部門で1位を獲得するなど米国で人気を集めている。配信記事の選定などにおいて、人手や文法に基づく自然言語処理に頼らず、「機械学習」を活用する同社の強みが、グローバル展開で大いに生かされた。

 スマートニュースを創業した浜本階生社長は、ニュースを自動で配信するサービスの品質に自信を深めている。「これまでは人間が記事の選定をしないと高い品質を保てないと考えられていた。私たちは機械学習の技術にフォーカスして、人手をかけた記事選定と同等以上の品質を達成できた」。

 同社のコア技術は機械学習に基づく自然言語処理だ。従来の自然言語処理の技術は文法に基づくものが主流だったが、今では大量のデータからコンピュータに規則を学ばせる機械学習のアプローチが急速に発展している。機械学習の研究開発に強いPreferred Infrastructure(東京都文京区)や、自然言語処理の第一線の研究者である東北大学大学院情報科学研究科の岡崎直観准教授の協力を得つつ、「サーバー側の処理を毎日のように改善してきた」(浜本社長)という。

 スマートニュースは毎日1000万件の記事を収集して、それを1000本ほどに絞り込んでスマホやタブレットに配信している。機械学習の技術はそれぞれの記事の配信地域(ロケール)での人気度の判定、「スポーツ」や「経済」といった記事の分類、文の改行位置を定めるための品詞の判定など、サービスのサーバー側の処理で利用している。

 SmartNewsの利用者が最初に受ける印象は、雑誌や新聞のようなすっきりとした多段(マルチカラム)レイアウトの美しさだろう。記事のタイトルで使われている言葉に長体をかけて、適切な位置で改行するといった工夫をしている。こうした職人技のような画面レイアウトの背後にあるのも、機械学習をもとにした品詞を正しく判定する技術だ。

多様性を考慮して記事を選ぶ

 スマートニュース社内では、記事の重要度を表す「スコア」を全ての記事について算出している。サーバー側から記事にスコアを付けて送信し、端末側の「レイアウトエンジン」がスコアに基づいて記事をレイアウトする仕組みだ。スコア算出のアルゴリズムは社外秘だ。

 スコア算出の基礎は記事の人気度の評価である。しかし人気度をそのまま使うと、特定のニュース源に偏ったり、似たような記事が選ばれたりする可能性がある。このためスコア算出の最終段階で、「多様性のある情報がバランスよく組み合わされて利用者に届くように、スコアを自動で修正している」(浜本社長)と言う。

記事配信の流れ
記事配信の流れ