AI(人工知能)が従来のプログラムと異なるのは、正しい答えを導き出すために自動で学習できること。それを実現するための機械学習には、さまざまな種類がある。機械学習の種類や仕組みが分かれば、AIで何ができるのかも見えてくる。博士が新人の助手に機械学習の勘所をレクチャーする。

クロトレ大学教授。コンピューターの黎明(れいめい)期からAI一筋で研究をしてきた。最近ついに還暦を迎える。昔は鬼博士と呼ばれていたが、最近は丸くなってきた。

ある中堅ベンチャー企業で社長秘書をやっていたが、まったく新しい道を進もうと、クロトレ大学の助手として転職してきた。学生のころから数学や理科系は苦手。

今日は、AIの中でも多くの場面で使われている機械学習について説明するのじゃ。

機械学習って、なんかすごそうな名前ですねえ。

英語で言えばMachine Learning(マシンラーニング)。略してMLということもある。一口に機械学習といっても、さまざまな手法がある。

えー、どんな種類があるのかな。

ふふふ、アミ君もAIが好きになってきたようじゃな。今回はちょっと難しいぞお~。

あらいやだ。お手柔らかにお願いしまーす。
教師あり学習では人間が正解を用意
機械学習とは、人間の脳のような学習機能をコンピューターに持たせる技術の総称だ。この「学習」というのがポイントであり、多くのデータをもとに推論を繰り返して、その規則性やパターンを見つけていく。
機械学習は、その学習の仕方によって「教師あり学習」と「教師なし学習」に大別できる。
教師あり学習とは、問題と正解がセットになったデータを使うことで、コンピューターに学習させる方法だ。通常は、あらかじめ入力する値とそれに対する正解がセットになった学習用データを人間が大量に用意する。これが教師というわけだ。
具体的には、学習用データを機械学習のプログラムに読み込ませて、正解になるか調べる。不正解だったときは、機械学習の計算式の中にある変数に、正解に近づくように少しずつ微調整を加える。この微調整は、人間が操作するのではなく、自動的に変更が加わる仕組みになっている。機械が勝手に学習する、というわけだ。これを繰り返していくと、未知の入力に対しても正解を導き出せるようになる。
例えば、「馬」と「牛」を区別させるなら、馬と牛の写真データを大量に用意する。コンピューターに、写真を読み込ませて、これは馬、これは牛と正解を伝える学習を繰り返す。すると、未知の画像データを与えたときに、その画像が馬である可能性が70%、牛である可能性は30%などと、ある程度の判別ができるようになるのだ。
それに対して、教師なし学習では正解が与えられない。膨大な入力データの中から、コンピューター自身が自分でその特徴や定義を発見していくというものだ。例えば、さまざまなデータの中から、同じような特徴を持つものを区別するときに使われる。
用途によって多彩なアルゴリズム
教師あり学習、教師なし学習のそれぞれについて、さまざまなアルゴリズム(プログラム上の手法)が提案されている。アルゴリズムによって得意不得意があるので、目的や用途に応じて、技術者は最適なアルゴリズムを選んでいる。
機械学習の用途は、回帰、分類、クラスタリング、次元削減、レコメンデーションに大別できる。それぞれを詳しく説明していくと、1冊の本では収めきれないほどになってしまうので、ここでは、その中から基本となる回帰、分類、クラスタリングについて、概略を説明する。
「回帰」で株価も予想できる?
回帰とは、過去の実績から未知の値を予測するというもの。例えば、株価が4月に1万5000円、5月に1万6000円、6月に1万7000円だったとすると、7月には1万8000円近くになりそうだと予測できる。これまでの実績から考えると、こういう結果に行きつく(回帰する)だろうという因果関係を求めるためのものだ。
このコンテンツ・機能は有料会員限定です。
- ①2000以上の先進事例を探せるデータベース
- ②未来の出来事を把握し消費を予測「未来消費カレンダー」
- ③日経トレンディ、日経デザイン最新号もデジタルで読める
- ④スキルアップに役立つ最新動画セミナー