画像・音声認識系、産業用ロボットや自動運転などの運動系などで深層学習ビジネスは花開く。どんなビジネスが立ち上がろうとしているのか、最前線を追う特集の第3回は、前回に続いて日本のAIスタートアップを紹介し、さらに画像認識での活用が進みやすい背景を解説する。

 医療画像では、クロスコンパス・インテリジェンスが「眼底の画像診断に深層学習技術を適用すべく開発を進めている」と佐藤聡代表取締役社長兼CTO(最高技術責任者)が明かす。同社は大手半導体メーカーのルネサスエレクトロニクスと共同で、深層学習の活用で製造装置の異常を予測する技術を開発するなどの実績を残している。

 松尾准教授が提示する様々な領域において、水面下で多くの実証実験が取り組まれている。表に出ているのはごく一部だ。UEIの清水社長は「秘密保持契約を結んでいるので社名は明かせないが、深層学習技術を活用する様々な実証実験が繰り広げられているのは確かだ」と深層学習ビジネスがブレーク間近であることを示唆する。

畜産への活用探るLeapMind

 第一次産業で深層学習技術を活用する事例では、こんな取り組みがある。肉牛を管理している東北地方のある会社では、牛の自動監視に深層学習技術を使おうとしている。出荷の前には牛を太らせて価値を高める。ただし、牛は体重が増えるとうつぶせに寝るようになり、時には息ができなくなり死んでしまうことがよくあるという。そのために今は、人間が夜通しで見ていなければならないが、これを自動化できないかという強いニーズがあるのだ。

 それに応えるために、2012年創業のLeapMind(東京都渋谷区)は監視カメラと深層学習技術を組み合わせたソリューションのプロジェクトに取り組んでいる。同社の渡辺一矢取締役COO(最高執行責任者)は「1年での実用化を目指している」と話す。

 深層学習技術の活用を得意とするLeapMindには様々な案件が持ち込まれる。例えば、職人が持っているノウハウの伝授に、深層学習技術が使えないか、農業や製造業など様々な領域で要望があるという。一般に漢方薬に使う薬草の栽培は難しく、後継者がなかなかいないという課題があるといわれているが、カメラを設置してどういう作業をしているのか、水のやり方などの動きを深層学習させてノウハウの伝授に生かす。

深層学習ビジネスの実装期間と料金
深層学習ビジネスの実装期間と料金

 上の図は、LeapMindが作成したもので、横軸は実装期間、縦軸はプロジェクト単位の料金を指す。左下のエンタメや食品、マーケティングなどは、実装期間が短く、数百万円単位と料金が安い。右上にある自動運転や医療などは、実装期間は数年かかるし、プロジェクトの料金が億円単位と高い。認識するものとしては、顔や画像は実装期間が極めて短く、料金が安い。しかし、自然言語の認識は、実装に時間がかかり、料金が高い。

 すぐにも実用化する深層学習技術の応用例としては、魚の切り身に混入している異物の自動検知がある。「鯖の中には、人間には分からない小さな虫が入っていて、取り除かないと食中毒になりかねない。深層学習技術で検出して機械が自動で取り除くプロジェクトがある。また、小さな骨を除去する機械を作っている企業から、ウインナーの異物を自動検知できないか、要請が来ている。深層学習技術で正確な位置決めも可能。半年ぐらいで実用化できそうだ」と、渡辺COOは解説する。

 LeapMindに依頼が来る商品関連プロジェクトでは、大変ユニークな応用例がある。深層学習技術による画像認識アルゴリズムで、冷蔵庫に収納している食品を認識させて、買い物で何を買ったらいいのかを提案するというものだ。冷蔵庫には360度カメラを設置して中にある食品を撮影して、どんな食品があるのかを認識・分類。冷蔵庫にある食品を使う料理の提案もできるようにする。世界的な大手家電メーカーと取り組んでいるという。

教師付きデータを自動合成

 これまで見てきた取り組みのほとんどは、監視カメラの画像や医療画像などにラベルを貼った豊富な教師付きデータを深層学習して学習済みモデルを作成している。では、そうした教師付きデータがない場合はどうしたらいいか。答えは合成することだ。

 東京都豊島区は昨年夏ぐらいから、区内に設置してある防災カメラ51台のうち、池袋駅西口や東口、目白駅前や大塚駅前などにある17台に群衆解析機能を付けている。ある一定以上の混雑度(人の密度)になると、アラートを出してくれる。

 「2011年3月11日の東日本大震災では、多くの帰宅困難者が池袋駅前に集まり混乱した。池袋駅以外の目白駅前や大塚駅前なども監視する必要があるために、群衆解析機能を導入した」と、豊島区役所総務部防災危機管理課の樫原猛課長は話す。

 この群衆解析機能を提供しているのがNEC。群衆の人数をカウントするのに、従来は防災カメラの画像から頭の数を数えていたが、頭が重なるとカウントできなかった。

 そこでNECは1人の画像から2人、3人と人数を増やしていき、人が重なった画像もそれぞれ合成していき、同時に人数のラベルを貼って教師付きデータを自動で作成した。自動合成した教師付きデータを深層学習させて群衆解析アルゴリズムを開発した。

 教師付きデータがなくても、自動で合成できれば深層学習を適用できるというわけである。群衆の人数をカウントして単位面積当たりの混雑度を算出しており、群衆が動く方向を示す。

 水面下では深層学習技術を活用する様々な実証プロジェクトが走っている。短期間で実装できるものから順次実用化されていく。今後1~2年は、深層学習ビジネスの発表が相次ぐ。

深層学習技術で群衆の人数をカウント
深層学習技術で群衆の人数をカウント
この記事をいいね!する