企業にとって膨大なデータの収集・分析は、成長に不可欠な作業になりつつある。ところが多くの企業では肝心の分析より、様々なデータをまとめる「事前準備」に手間とコストが費やされがちだ。国内最大のタクシー配車アプリを運営するJapanTaxi(東京・千代田)は、2019年7月、新たなツール「trocco」を用いて、この課題を乗り越えた。
大手タクシー会社の1つ、日本交通のグループ企業であるJapanTaxiは現在、47都道府県にまたがる約900のタクシー会社・約7万台のタクシー車両をネットワークし、2019年12月に900万ダウンロードに達したタクシー配車アプリ「JapanTaxi」を運営する。国内最大のタクシー配車サービス運営会社だ。
ユーザーは、アプリを介して迎えに来てほしい場所を指定。来られそうなタクシーをアプリ上で探し、必要であれば車両を指定して実際に呼ぶ。やって来て乗車したタクシーの後部座席前に車載タブレット端末が設置されている場合、タブレット付属のカメラがユーザーを撮影し、その性別にふさわしい動画広告を、タブレット端末の画面に配信する。降車時は、同じタブレット端末でQRコードやクレジットカードなどの決済手段で決済できる。
このため、JapanTaxiには、日々、膨大なデータが集まってくる。ユーザーがアプリ経由で注文したデータや決済データはもちろん、ユーザーの年齢・性別といった属性データやタクシー車両の位置情報、動画広告の配信データ、どれだけ広告が視聴されたかといったデータなど、数え上げれば切りがない。
GCPのBigQueryにデータを集約
実はJapanTaxiは、主なクラウドサービスである「Google Cloud Platform(GCP)」「Amazon Web Service(AWS、アマゾン・ウェブ・サービス)」「Microsoft Azure(マイクロソフト・アジュール)」を組み合わせたマルチクラウド環境で、業務システムを構築・運用している。データ分析のためには、業務システムから抽出した膨大な量の様々なデータを一カ所にまとめる必要があり、GCPのデータウエアハウスサービス「BigQuery(ビッグクエリー)」に集約していた。
従来は、オープンソースソフトウエアの「Digdag(ディグダッグ)」と「Embulk(エンバルク)」をデータ連携ツールとして活用していた。しかし、データの規格が異なることもあり、一定の頻度で不具合が発生しがち。しかし、オープンソースソフトウエアなので、不具合が発生したときなどは自社での対応が基本となるため、人手が足らず、手が回らなくなることがあった。このため2018年に、大手ベンダーのツールに切り替え、データ連携とワークフローを管理するようにした。
ところが、このツールは扱うデータ量に比例して利用料金が増える課金方法だったため、データ量の増加が即、コスト増になって跳ね返ってきた。加えて、「マイクロソフト・アジュールからビッグクエリーにデータを移す際、ベンダーのツールのデータベースを踏み台にするため、そのための開発工程が必要になったり、個人情報の二重管理が必要になったりといった別の課題が明らかになってきた」(JapanTaxi次世代モビリティ事業部モビリティ研究開発グループデータエンジニアの伊田正寿氏)。
このコンテンツは有料会員限定です。お申し込みをされますと続きをご覧いただけます。
- ①2000以上の先進事例を探せるデータベース
- ②未来の出来事を把握し消費を予測「未来消費カレンダー」
- ③日経トレンディ、日経デザイン最新号もデジタルで読める
- ④スキルアップに役立つ最新動画セミナー