画像・音声認識系、産業用ロボットや自動運転などの運動系などで深層学習(ディープラーニング)ビジネスは花開く。どんなビジネスが立ち上がろうとしているのか、最前線を追う。第1回は、松尾豊・東京大学大学院特任准教授が注目する37分野の深層学習ビジネスを紹介する。
第3次人工知能(AI)ブームに沸くなか、「50年来のブレークスルー」(松尾豊・東京大学大学院特任准教授)と言われているディープラーニング(深層学習)技術を活用するビジネスに注目が集まっている。人間がプログラムを書かなくても、コンピューターが自ら特徴量を抽出できるのが、深層学習技術だ。
富士通は8月から中東で、この深層学習技術を活用する「スマート都市監視」のソリューションを本格展開する。街に設置してある監視カメラや防災カメラの画像から、人や乗用車、バス、トラックなどを抽出して、分類することができる。さらに、車種や色、人間が着ている服の種類や色などを抽出して分類するというもの。
車種や色などが分かれば、盗難車を探したり、追跡したりできる。乗用車やバス、トラックなどをカウントできれば、1日に排出される排気ガスの量なども算出可能だ。どこが渋滞しているのか把握できるので、車の流れを良くするための施策を立てられる。河川の両岸に設置した監視カメラに深層学習を適応すると、これまで人がやっていた「洪水が起きそうかどうか」の監視業務を自動化できる。監視カメラと深層学習の組み合わせによって、こうした社会が抱える課題の解決につなげられる。

ドバイのカメラ画像で学習
学習するための教師付きデータが豊富にあり、様々な課題を抱えているところに深層学習ビジネスのチャンスがたくさんころがっている。その1つが監視カメラや防災カメラの画像データを深層学習で解析するソリューションビジネスだ。
富士通は昨年春から秋にかけて、中東ドバイの都市開発公社と共同で技術検証を行い、深層学習技術に対するニーズがあるとの確証を持つに至って、今夏の本格リリースとなった。
同公社は砂漠に街をつくっている。街には至る所に監視カメラが設置されている。中東は監視社会でもあり、例えばカタールのように、監視カメラの設置が法律で義務づけられている国すらある。しかも、数カ月間カメラ画像を保存しなければならない。こうした監視カメラの画像は、ラベルをつければ教師付きビッグデータになり、深層学習技術を使って学習済みモデルを作ることができる。この学習済みモデルが人や乗用車、バス、トラック、車種などを自動抽出して分類できる画像認識アルゴリズムというわけだ。
富士通はドバイの都市開発公社から監視カメラ画像の提供を受け、人がラベルを貼って教師付きデータにしている。この教師付きデータを深層学習して学習済みモデル(画像認識アルゴリズム)を作成している。学習では計算パワーが必要になるために、スーパーコンピューターを活用した。
「都市開発公社との商談はまだ成立していないが、前向きに評価していただいている。すぐに使える形にしておかないと採用してくれないので既にパッケージ化している。クラウド型とオンプレミス型の両方に対応できる体制を敷いており、足りない機能などは要望に応じて順次開発していく」と、富士通テクニカルコンピューティングソリューション事業本部TCフロンティアセンターの有山俊朗センター長は話す。
地場の業者とともに事業展開を進めていく。現段階で有山センター長は「中東と一部の欧州におけるスマート都市監視のビジネス規模は少なくても数十億円になる。監視カメラを入れると100億円規模になるし、もっと拡大するかもしれない」と試算する。
さっさとやればいい事業が山ほど
深層学習用コンピューターやコンサルティング、セミナー開催などを展開しているUEI(東京都文京区)の清水亮社長兼CEO(最高経営責任者)は「当社は深層学習ビジネスで既に利益を出している」と話す。UEIは、深層学習ビジネスの中でも支援サービスの領域を手掛けている。このビジネス領域では、深層学習用フレームワークをオープンソース化している、米グーグルやPreferred Networks(東京都千代田区、PFN)、米マイクロソフト、米フェイスブックなどが代表的なプレーヤーだ。
ほかのビジネス領域としては、半導体やミドルウエアの提供などがあり、代表的なプレーヤーは米エヌビディアだ。深層学習するには計算機パワーが必要になるが、同社はそのためのGPU(画像処理半導体)の開発・販売で収益を上げている。
もう1つの領域は、深層学習を活用した製品やサービス、ソリューションといった応用ビジネスだ。本特集記事では、ここの領域でどんなビジネスが生まれようとしているのか探った。
自他共に認める、日本におけるAI研究とビジネスの「旗振り役」である松尾准教授は「さっさとやればいい深層学習ビジネスの分野はたくさんある」と話す。松尾准教授は、深層学習ビジネスの分野を、核となる技術によって大きく4つに分けている(下表)。

「認識系技術」「運動系技術」「言語処理系技術(意味理解が伴わないもの)」「言語処理系技術(意味理解が伴うもの)」の4つだ。そのうえで、「さっさとやればいいもの」「研究が必要なもの」「議論が必要なもの」の3つに分類する。
すぐにも取り組むべきものとして、認識系技術では、冒頭で紹介した富士通が手掛けている「実世界最適化支援(店舗内行動、街づくりなど)」や「防災系画像処理(河川、火山、土砂崩れ)」をはじめとして、「警備、防犯技術」「介護施設、病院、独居老人などの見守り技術」「防犯や交通違反検知を含めた社会インフラ構築」「顔による認証・ログイン・広告技術」「わいせつ画像判定、意匠の類似判定など、既存領域での画像活用」「国家の安全保障、入国管理、警察業務、輸出入管理業務などでの利用」「医療画像処理(X線、CT、皮膚、心電図)」「日本語の一般音声認識技術」など多岐にわたる。これだけ見ていても、ここ数年で様々な深層学習ビジネスが立ち上がってくることが想像に難くない。
運動系技術では、すぐにやるべきものに限っても、認識系技術同様に様々な分野がある。例えば、グーグルやトヨタ自動車、日産自動車、ホンダ、ZMP(東京都文京区)などがしのぎを削って開発に取り組む「自動運転系」や「自動操縦系」をはじめとして、ファナックや安川電機などが力を入れている、組み立て加工を中心とする「産業用ロボット」、ソニーが再び参入を表明している「ペットロボット系」、手術ロボットや介護ロボットといった「医療・介護・バイオ系」などがある。