第一線のデータサイエンティストは、普段分析についてどういう点に留意しているのでしょうか。また、スキルを磨いて成長していくためにどんなことをしているのでしょうか。今回は、米シカゴ市警察で第一線のデータサイエンティストとして活躍している鈴木崇之氏にインタビューを行い、そのヒントを探ってみました。
なぜ、データアナリストになろうと思ったのでしょうか。
大学の学部生時代、実は私は都市工学を専攻していました。卒業論文で、複雑に絡まったデータをひもとくことで新たな発見ができる快感を初めて味わいました。その後修士時代は米国に渡り、「事業改善地区制度」という研究に取り組みました。
データアナリストとしてのキャリアは、金融機関からスタートしています。主に官公庁のデータを使って地域産業や経済活動の分析や将来予測をしました。その後、教育系のITベンチャー企業に移り、学習履歴データ分析を活用したR&D(研究開発)やデータ収集の設計などに携わり、多くの事を学びました。次に「都市」というフィールドでデータ分析業務をしたくなり、先進的な取り組みをしていたシカゴ市警察に転職したんです。
現在の業務内容や仕事流れ、仕事の楽しさを教えてください。
シカゴ市警察では2018年9月、地域コミュニティーとの連携やデータ透明性などについて700項目余りの「改革事項」を取り決めました。改革事項のうち、データに関わる部分を扱っているのが、18年に誕生し私が所属しているチームです。例えば、「警察活動の偏見の有無」の評価方法を検討して実際に分析したり、各事件の情報の流れから業務効率を評価したりです。位置情報付きのデータも豊富にあり、日常的に分析しています。
プロジェクトは個人単位で進められ、データベースの担当者と話し合って、必要なデータを取得・分析していきます。最終成果物は分析の過程と結果のリポート、データ可視化ツールによるダッシュボードです。
データベースではテーブルの乱立などによって、「正しいテーブル」にたどり着くのは意外に大変です。データへのアクセスに調整が必要な場合もあります。データにはノイズがあるなど、データ同士の関係性が一筋縄ではいかないものがあります。だからこそ、エラーが起こった箇所やその要因を特定し、あるいはテーブル結合した後にデータ不一致が起こった際の原因の特定といった課題を1つずつ整理しながら明らかにしていく過程は楽しいです。
データ分析で重要だと思うこととは
米国のデータサイエンティストは待遇が良いと聞いています。実際のところ、どうですか。
(予算の範囲内では)良い待遇を得ていると思います。マシンもそれなりに高性能のものを用意してもらっています。先日、オープンソースのQGISというソフトを使っていたところ、それを見た上司がより性能の良い有償のGISソフトを導入してくれました。公務員のため、ぜいたくできるわけではないですが、不便なく過ごせています。
このコンテンツ・機能は有料会員限定です。
- ①2000以上の先進事例を探せるデータベース
- ②未来の出来事を把握し消費を予測「未来消費カレンダー」
- ③日経トレンディ、日経デザイン最新号もデジタルで読める
- ④スキルアップに役立つ最新動画セミナー