IoT(Internet of Things)化したクルマから生まれるデータの量と種類は拡大の一途。収益機会は自動車メーカー以外にも生まれ、異業種との“かけ算”が価値を高める。特集第1回は、NTTドコモ、東京無線協同組合などによるAIタクシー需要予測の実証実験を紹介する。
今すぐタクシーに乗りたいと思っているお客のところにクルマを走らせることができれば、乗車率は大幅に上がるはず。お客を乗せれば乗せるほど乗務員の収入が増えるので、タクシー業界に対する注目度は確実に高まる。利用者にとっても、乗りたいときに空車のタクシーが来てくれれば公共交通としての利便性は高まるだろう。
ただし、「そんな夢みたいなことはできっこない」というのがタクシー業界の常識だった。ベテランの乗務員の中にはこれまでの勘と経験によって、乗ってもらえそうな場所を走ることができるといわれるが、経験が浅い乗務員にはなかなかできない芸当だった。
ところが、そんな常識を打ち破る取り組みが昨年6月から今年3月にかけて、東京23区と三鷹市、武蔵野市で行われた。
人工知能(AI)を活用するタクシー需要予測の実証実験だ。今回の実証実験では、500mメッシュごとに30分後までのタクシー乗車台数を10分ごとに予測し、タブレットに表示する(下図)。実験に参加した乗務員は、タブレットを見て乗車台数が多いと予測されるエリアへタクシーを走らせればいい。

AIタクシー需要予測で大幅改善
AIタクシー需要予測の実証実験に取り組んでいるのはNTTドコモ、東京無線協同組合、富士通、富士通テン(現:デンソーテン)だ。東京無線に加盟している60社のうち、4社の乗務員26人が12台のタクシーを使って実証実験に臨んだ。実証の結果を見ると、少なからず驚いてしまう。
2016年12月と同年11月の乗務員1人当たり1日の売り上げを比較すると、東京無線全体平均(1万640人)の12月の売り上げは11月に比べて4500円増だったのに対して、実証実験に参加した乗務員の平均(26人)は6723円増だった。実証実験参加者の方が、全体平均に比べて実に1.5倍も増額が多いのだ。
「正直言って、この数字を聞いたときは驚いた。高すぎるのではないかと思ったほどだ。実証実験の最終結果が出るのはこれからだが、実用化されれば大きな差別化になると思う」と、東京無線業務部の安倍英洋部長は話す。
安倍部長は「このAIタクシー需要予測は、電車がとまった場合にお客さまが急増する影響はもとより、コンサートをはじめとするイベントなども考慮してタクシーの需要を予測してくれる。だから、タブレット画面のメッシュを見ているだけでどこに行ったらいいか分かるのでとても便利だ。新人を採用する際に強力な武器になる。他社から乗り換える乗務員も出てくるのではないかと思う」と期待する。
ただし、全乗務員が予測に従うと1カ所に車両が集中してしまう恐れがある。新人の乗務員に優先的に使わせる、ベテランの乗務員はよく知らない場所まで乗客を送った帰りの時に乗車予測人数を見てタクシーを走らせるなど、「どう運用するかが重要だ。数字が多いところにタクシーが殺到してしまったら意味はない」(安倍部長)。うまく運用してすべての乗務員の乗車率を向上させる知恵が求められる。

4月下旬に実験の最終結果が出てから、導入時期や運用方法を検討する。タクシー会社にとっては有力な武器になるのは間違いない。NTTドコモがシステム化して、最終的に富士通テンがナビゲーションシステムと一体で販売するとみられているが、具体的にはまだ明らかになっていない。なお、3月にタクシー会社2社、6台の車両が加わったという。
人口統計×運行×気象×施設
タクシー需要予測モデルの開発では、NTTドコモのリアルタイム移動需要予測技術を使った。構成は上の図の通り。今回、タクシーの需要予測モデルの学習に使ったデータは、人口統計データ、4425台のタクシーの運行データ、気象データ、施設データなどだ。いずれのデータも、2015年9月から2016年8月までの1年間のデータを使った。
この期間のデータで学習して予測モデルを作ったところ、予測正解精度は92.9%を達成した(2016年12月)。ちなみに正解とは、タクシー乗車の予測値が実測値±20%以内または±1台以内。予測正解精度は(予測結果が正解のメッシュ数)÷(予測したメッシュ数)となる。
その後、データが蓄積されてきており、期間を広げながら学習を進めているという。
人口統計データは、携帯電話ネットワークの仕組みを利用して作成されており、日本全国を500m四方のエリアに分割(メッシュ)し、それぞれのメッシュのある時点における人の数の推計値。それを時系列で見た時の増減を見れば、マクロでの人の移動を把握することができるため、移動需要予測に使っている。
気象データは、雨雲レーダーによる雨量などの情報。施設データは、どこにどのような施設(イベント会場や駅、病院、学校など)があるかを示すデータだ。気象データ、施設データともに入手先は非開示。
こうしたデータを一旦前処理している。前処理の一例としては、学習効果を最大限に引き出すために、学習するためのデータ量を増やす処理となる。具体的には、実験対象の東京23区、三鷹市、武蔵野市と似たエリアのデータを活用する手法を採用している。
「一口に似たエリアと言っているが、何をもって似たものとみなすのか、まとめ方の量と質のバランスにおいて、試行錯誤を行い、ノウハウを確立した」(NTTドコモ)という。
ハイブリッドで予測
今回開発したタクシー需要予測モデルは2つあり、ハイブリッドで予測を出している。上記で説明した前処理した学習データを2つのAI技術に与えて予測モデルを開発した。1つは多変量自己回帰。タクシー乗車需要に影響する特徴を人間が設計・エンジニアリングしてタクシー需要予測モデルを作っている。
もう1つはディープラーニング(深層学習)。タクシー乗車需要に影響する特徴をデータから学習してタクシー需要予測モデルを作っている。
2つのタクシー需要予測モデルを使い、時間帯ごとに500mメッシュのタクシーの需要を予測する。2つの手法のうち、実測値に近い予測値を出している方を時間帯ごとの500mメッシュ単位で選んでいる。つまり、ハイブリッドでいいとこ取りして1つの予測モデルを作成している。

タクシーの需要予測モデルでは、人口統計データ、タクシーの運行データ、気象データ、施設データを掛け合わせて使うことがポイントだ。データ連係で需要予測精度を高める。データ連係は今後の大きなトレンドであり、クルマのデータを軸にデータ保有企業、分析企業、IT企業など様々な業界に、新たな収益機会を生み出すことになりそうだ。
実はこうしたデータ連係の動きはほかにもある。道路インフラ管理を目的としたデータ連係だ。