AI(人工知能)は遠い存在ではない。普段身近に使っているソフトウエアやWebサービスにも組み込まれており、誰もが利用している。そうした身近な技術を見直すことで、AIで何が実現でき、どんな新ビジネスを生み出せるかも見えてくる。AIの広がりについて、博士が新人の助手に指南する。

身近に利用しているAIの代表と言えば、迷惑メールの自動振り分け機能。ベイズ推定といわれるAIの一種が使われている
身近に利用しているAIの代表と言えば、迷惑メールの自動振り分け機能。ベイズ推定といわれるAIの一種が使われている
【AI基礎講座】気付いていますか? あなたのすぐそばにいるAI (画像)
柔裸瑠(にゅうらる)博士
クロトレ大学教授。コンピューターの黎明(れいめい)期からAI一筋で研究をしてきた。最近ついに還暦を迎える。昔は鬼博士と呼ばれていたが、最近は丸くなってきた。
【AI基礎講座】気付いていますか? あなたのすぐそばにいるAI (画像)
助手のアミ
ある中堅ベンチャー企業で社長秘書をやっていたが、まったく新しい道を進もうと、クロトレ大学の助手として転職してきた。学生のころから数学や理科系は苦手。

【AI基礎講座】気付いていますか? あなたのすぐそばにいるAI (画像)

AIってとても広い概念なんだね。ディープラーニングだけがAIじゃないんだと分かったよ。


【AI基礎講座】気付いていますか? あなたのすぐそばにいるAI (画像)

うん、それはよかった。AIっていうと最新技術のようじゃが、いわゆる機械学習はすでにいろんな場面で使われているのじゃ。


【AI基礎講座】気付いていますか? あなたのすぐそばにいるAI (画像)

えー。そうなんだあ。例えばどんなところ?


【AI基礎講座】気付いていますか? あなたのすぐそばにいるAI (画像)

前回も紹介したが、迷惑メールの識別、ネット通販でのレコメンデーションとか、デジタルカメラの顔認識が代表的じゃ。


【AI基礎講座】気付いていますか? あなたのすぐそばにいるAI (画像)

ディープラーニングも実用化されているの?


【AI基礎講座】気付いていますか? あなたのすぐそばにいるAI (画像)

うん。身近なものでは、機械翻訳がそうじゃな。「Google翻訳」のようにディープラーニングを活用することで、より自然な翻訳を実現しているサービスがあるのじゃ。


メールの言葉解析で「迷惑」スコアを診断

 前回は、AIの歴史や分類の仕方について解説した。今回は、AIがどんなところに使われているのかを説明しよう。AIの中でも、機械学習は最近登場した技術のように考えてしまいがちだが、実は比較的長い歴史を持つ。さまざまな問題に対処するために、多くのアルゴリズム(問題を解くためのプログラミング上の手法)が考案されてきた。

 身近なところでは、迷惑メールの判別、クレジットカードの不正利用の検出、株価予測、郵便の宛先自動認識などに機械学習が導入されている。

 迷惑メールの判別には、ベイズ推定という理論に基づくベイジアンフィルターを使う。このベイズやベイジアンとは何だろうか。ちょっとだけ詳しく紹介しよう。

 ベイズ推定のもととなっているベイズの定理は、1700年代の数学者トーマス・ベイズが提唱したもの。ある観測結果を得ることで、別の事象が起こる確率が変わるときに、成り立つ定理である。これによって最終的な結果を推定する。

 例えば、街中を次に通る人が男性か女性かという問題を考える。何も情報がなければ、確率は50%ずつだと予想される。その街が秋葉原である、あるいは男子校が近くにある、という情報を事前に得ているなら、男性である確率が高いと考える人が多いだろう。また、男性が1人通過し、その次も男性が通過したという情報を加味すれば、男性が通る確率が更新されて、さらに高くなると推定できる。

街中の男女比を考えるとき、「周囲が秋葉原らしい」「男子校がある」といった情報があれば、男性の比率が多くなると推定できる
街中の男女比を考えるとき、「周囲が秋葉原らしい」「男子校がある」といった情報があれば、男性の比率が多くなると推定できる

 迷惑メールの判定では、「出会い」「恋愛」など迷惑メールにありがちなキーワードを含んでいるかを観察する。キーワードを含んでいる数が多いほど、迷惑メールである可能性が高まるというわけだ。

 キーワードはあらかじめ辞書データに収録してある。辞書データを作るには、教師データとして、迷惑メールとそうでないメールを多数用意する。迷惑メールに含まれている言葉を迷惑カテゴリに追加し、一般のメールに含まれている言葉を一般カテゴリに追加していく。

迷惑メールが含むキーワードを集めた辞書を機械学習で作成しておき、届いたメールにそのキーワードがどのくらいの頻度で含まれているかをスコア化する
迷惑メールが含むキーワードを集めた辞書を機械学習で作成しておき、届いたメールにそのキーワードがどのくらいの頻度で含まれているかをスコア化する

 新しいメールが来たら、メールのテキストを一つひとつの単語に分解する。この作業を形態素解析と呼ぶ。英文の場合は、スペースで単語が区切られているので、形態素解析は簡単だが、日本語の文章では助詞などを手がかりにする。

 テキストを単語に分解したら、辞書データと照らし合わせて、合計スコアが一定以上になった場合は、迷惑メールであると判別する。

クレカや株価分析もAIが担う

 クレジットカードの不正利用の検出にはいくつかの方法がある。最近は、過去の正常な決済データを学習し、正常か異常かを分類する仕組みを作って、不正を検出する機械学習ベースの手法が主流になっている。そのアルゴリズムとしては、ロジスティック回帰分析やサポートベクターマシン、ランダムフォレストなどがあるが、これらについては、次回もう少し詳しく解説を行う予定だ。

 過去の株価チャートを学習することで、将来の株価を予測するというAIもある。真偽は不明だが、80%以上の的中率を実現したと標榜するものもある。AIが株を自動的に売買するシステムも実用化されている。

 文字の読み取りについては、昔からスキャンした文書をテキスト化する光学式文字読み取り(OCR)と呼ばれる技術がある。昔のOCRはあらかじめ決められたルールに基づいて文字を認識していた。最近のOCRでは機械学習的なアプローチが採用されており、手書き文字の認識率が大きく向上している。例えば、郵便局では郵便番号の自動認識だけでなく、宛先を認識して、配達順に並べ替えることまですべて自動で行われている。

高度な対話チャットボットも登場

 最近は、顧客対応業務などでチャットボット(テキストや音声を通じて会話を自動的に行うプログラム)を活用する企業が増えている。このチャットボットも広い意味でのAIの一種だ。チャットボットは昔からあり、以前のチャットボットは人間があらかじめ決めたルールに基づいて会話を行うルールベースだったため、あまり融通が利かなかった