データに含まれる複数の規則性を発見する、リアルタイムに学習し常にモデルを更新する…。従来の機械学習の弱点を解決すべく、一歩進んだ手法の採用が広がる。

 「項目数が4600くらいあり、人手で計算するのは大変」(大林組技術本部企画推進室の岩波洋部長)

 大林組はNECと共同で、エネルギー需要予測システムを開発し、実験を進めている。予測には、NECの「異種混合学習技術」を利用している。データのなかに潜む複数の規則性を発見、データが参照すべき規則を切り替える一歩進んだ機械学習である。

 2010年に完成した大林組技術研究所本館は、省エネルギービルである。省エネのための様々な仕掛けがある。例えば、従業員の在/不在により照明や空調を調節する。太陽光発電を利用して環境対策を講じ、蓄電池や蓄熱槽を設置して安い夜間電力を活用することで低コスト化を図っている。

 このビルで、大林組は蓄電池や蓄熱槽を効率的に使うため、エネルギー需要を予測する実証実験をNECと共同で取り組んだ。多くのセンサーを利用しており、データの項目数は合計すると約4600に上る。この大量のデータを分析してエネルギー需要を予測するのは、スキルの高いデータサイエンティストでもかなり骨が折れる作業だ。

 そこで採用したのが、異種混合学習技術である。データから複数の規則性を発見するとともに、その規則性に基づきデータを分割する一歩進んだ機械学習である。

一般的な機械学習と異種混合学習の違い
一般的な機械学習と異種混合学習の違い

 一方で、リアルタイムの機械学習の実用化が進んでいる。住友精密工業とPreferred Infrastructure(東京都文京区、PFI)、ブリスコラ(東京都港区)は、ビニールハウスのデータ異常検知の自動化を実現した。PFIとNTTが共同で開発したオンライン/リアルタイム分散機械学習基盤である「Jubatus」(ユバタス)を利用している。ビニールハウスの温度などの環境を適切に保つため、温度や湿度、ボイラーの状況を測るなどのセンサーを設置。それらのデータをリアルタイムで収集し、異常があれば関係者に通知するというシステムを構築した。

 ビニールハウスに異常があるかどうかは、温度のしきい値を設定して、それを超えたら異常というように単純にはいかない。個々のビニールハウスの設備といった環境や季節などによって、適正な温度が異なるからだ。

 そこでリアルタイム機械学習を採用した。個々のビニールハウスの年間の観測データを学習させて、それから逸脱した状態(異常)を検知するシステムである。学習によって、異常のしきい値は自動的に設定され、運用開始後も常に学習を続けて分析モデルを最適に維持する。

 リアルタイム機械学習は、機器などの異常検知やクレジットカードの不正使用の検知など、緊急性が高い用途に強い。

人にはできない発見をする

 機械学習は、コンピュータの計算能力によって、分析モデルや予測式などを作り出す技術である。通常のデータ分析では、データサイエンティストが予測式などを作成し、実際にデータを分析する。相関が見つかるまで、この作業を繰り返す。分析ツールを使えば、分析モデルの作成が効率化できる。しかし、人が「相関があるのでは」と考えられるデータの種類は限られる。

 機械学習はこの繰り返し作業を自動化してくれる。「人では見当もつかないようなルール(予測式)などを、コンピュータの計算能力で見つけ出せる」(日本アイ・ビー・エム東京基礎研究所数理科学&レジエンス工学担当の渡辺日出雄部長)という特徴がある。

機械学習の仕組み
機械学習の仕組み

 IBMでも様々な用途で機械学習の研究を進めており、その1つにヒヤリハット状況の識別がある。自動車のドライブレコーダーのデータを分析し、事故の一歩手前のような状況を識別する技術である。この識別ルールを人が作るのは難しいが、機械学習によってヒヤリハットの識別に有効な特徴を抽出する手法を開発した。

 不良品のチェックなど、熟練した人ならばごく普通にできることを、データ分析モデルとして作り上げることは容易ではない。熟練者に聞いても、判断基準を明確に答えられない場合が多く、データにすること自体難しいからだ。

 AI(人工知能)をはじめ、数十年前から人を“まねる”技術の開発は進められてきた。ただ、広く普及している状況ではなかった。ここにきて、IoT(Internet of Things)といわれるように、多くの機器がインターネットにつながり、センサーなどの大量のデータが容易に収集できるようになってきた。一方で、低コストでコンピュータの処理能力を手に入れられるようになった。そのため、機械学習が身近になり、ビッグデータの分析のニーズの高まりと相まってその利用が急速に進んでいる。

この記事をいいね!する