IoTを活用した先進的プロジェクトの創出・社会実装に向けた環境整備を目的とするIoT推進ラボと経済産業省などは3月6日、「第3回ビッグデータ分析コンテスト」2部門3つの賞の表彰式を行った。東京電力ホールディングスと気象庁が提供したデータを基に、太陽光発電所の発電量を予測し、精度を高めたり、モデルに工夫をしたりした優秀な個人やチームに加え、今回が初となるデータの可視化を使ったストーリーテリングの優秀者も表彰された。
総応募者数は331人と過去最高を記録。初めて設けられた「可視化部門」へは200人が応募し「予測部門」の131人を大きく上回った。総応募者数は、観光客数を予測した1回目が128人、流通・小売りをテーマに売り上げ予測や商品開発を競った2回目が137人(ともに経産省資料)で、年を追うごとに裾野が広がってきたと言える。一方、コンテストに向けたデータ提供といった今後の課題もある。
両部門に向け提供されたデータは(1)3カ所の太陽光発電所における発電量データ(4年分、10分単位)、(2)気象予報データ(5年3カ月分、神奈川県と山梨県の一部)、(3)アメダスデータ(同、全国1252地点の観測値を10分単位で統計)、(4)地上気象観測データ(同、全国155地点の気象観測所の観測値を10分単位で統計)の4種類だ。
可視化部門、独自データを加味
可視化部門の目的は、見る人の共感を得ることを意識し、適切な課題設定をした後、データ分析から得られた示唆や価値をストーリーにしてまとめるというもの。独自にデータを収集して、提供データと組み合わせてもよい。
金賞を受賞した成果物には提供データのほか、経産省・資源エネルギー庁のデータが組み合わされている。都道府県別の太陽光発電導入状況や件数などを任意の場所を地図上でマウスオーバーすると他県と比べられるよう、分かりやすく見せた。

コンテスト審査員の1人、樋口知之 統計数理研究所所長は「データの可視化には、予測するのとは違った才能が必要になってくる。全体的にオーソドックスなものが多かったが、金賞はインタラクティブ性に優れ、ユーザーの立場に立ってデザインされていた」と評価した。
一方予測部門で出された課題は太陽光発電所3カ所の発電量の予測。具体的には浮島発電所(神奈川県川崎市)、扇島発電所(同)、米倉山発電所(甲府市)における、2016年1月1日~17年3月31日の30分単位の発電量(kWh)を予測するというもの。条件として学習データは提供データのみ使用、ある特定日を予測したい場合、前日20時に確定している情報のみ使用、汎用的モデリングを使用――などがある。賞は「精度賞」と「アイデア賞」の2つ。
データ提供社数が減少
表彰式に先立ち2月に行われた審査会では、課題も浮き上がった。コンテストの主催・運営を担当する経済産業省の吉本豊 商務情報政策統括調整官が表彰式で協賛企業に呼びかけた「データ提供を」という点だ。データが限られると、コンテストのテーマ設定が難しくなる。
第1回のコンテストへデータを提供したのは観光予報プラットフォーム、内閣官房まち・ひと・しごと創生本部事務局、NTTドコモ、ホットリンク、ナイトレイの5団体 。第2回はローソン、ホットリンク、クミタスの3社で 、今回は東京電力ホールディングスと気象庁の2団体。応募者は増加しているが、データを提供する側が少なくなっている。
コンテストで人材発掘や汎用性が高い手法の試行を期待するには、データを入手できる環境がよくなることが大切だ。第4回のコンテスト実施を予定するなか、企業・団体から、さらなる協力が必要になる。
ビッグデータ分析コンテストは企業などから提供されたビッグデータを活用し、分析の精度などを競うもの。学生を含め一般から広く参加を募り、IoT推進ラボの活動への理解を深める目的のほか、産業界のデータを分析することで、優秀なデータサイエンティストの発掘やデータ提供企業とのマッチングを目指す。第1回は2015年12月~16年1月に、第2回は16年7月~9月に実施された。
3回を通してコンテストの場はオンライン上で実施された。インターネット広告大手のオプトホールディングが設計・運営を担当している。