10年近くも前に「21世紀で最も魅力的な職業」と称賛されたデータサイエンティストだが(※1)、今でも70%の企業にはデータサイエンティストが存在しない(※2)。それはなぜか、どうすれば企業のデータ活用は進み、データ人材の育成は進むのだろうか。

(出所/Shutterstock.com)
(出所/Shutterstock.com)

 データサイエンティスト人材が増えない理由は明確だ。データサイエンティストには、ビジネス課題やその背景を理解し、解決に導くための「ビジネス力」、数学や分析手法、統計学などを理解・活用する「データサイエンス」、サイエンスの結果を実装・運用できる「エンジニアリング」、の3つが必要とされているが、その3つを高次元で兼ね備えているスーパーマンは、なかなか存在しないからだ。

 しかし、「データサイエンティストに相応しい優れた人材は我が社にはいない」と諦めないでほしい。

データが企業の競争力の源泉に

 ここ10年でデータの量・質は加速度的に進化しており、細かな部品のデータ、声のトーンによる気持ちの変化など、これまで取れていなかったデータを取得・処理できるようになっている。膨大なデータを取得・分析しながら、いかに正確な打ち手を行っていくかが、今後、業界の垣根を超えた企業の競争力の源泉となっていく。

 特に、機械学習やディープラーニングなどを活用した、収益に結び付くさまざまな分析モデルや、それをベースに仕組み化された業務は、各企業における門外不出の財産となる。

 さらには、その分析モデルや業務プロセス自体を汎用化して他社へ横展開、といった新しいビジネスにもつながっていくだろう。

 このように企業の競争力の源泉となりうるデータ活用を高次元で実現するため、データサイエンティストを自社で内製化したいという企業は多く、各企業はデータサイエンティストの採用・育成に励んでいる。

 ただし、データサイエンティストの育成には非常に時間がかかるほか、そもそもデータサイエンティストが社内に存在しないという企業も多い。

RやPythonはデータ活用の障壁ではない

 ここで、筆者が所属するビヨンド・ザ・データについて少し触れたい。

 弊社は日本最大級の共通ポイントである「Ponta」を運営するロイヤリティ マーケティングと、コンサルティングファーム最大手のアクセンチュアの協業によって2020年1月に誕生した。ロイヤリティ マーケティングが保有する、9600万人を超えるPonta会員基盤とアクセンチュアのコンサルティングノウハウをベースに、クライアント企業の「データ活用」を推進し成果につなげるための支援をしている。

 前述の通り、ニーズが高まっている「社内でデータサイエンティストを育成したい」というクライアントに対して、データサイエンティスト育成支援のためのソリューションも展開している。

 データサイエンティストの育成やデータ活用のハードルは高いと感じられるかもしれないが、実は最初の1歩は簡単だ。

 自社にデータがあって、いますぐデータ活用に取り組みたいのであればRやPythonといったオープンソースの分析ツールを使うことで、簡単に始めることができる。誰でも無償で使用でき、数百万行程度のデータであれば、最近のPCでストレスなく取り扱うことが可能だ。

 RやPythonには、使いやすい機械学習やディープラーニングのライブラリが豊富に存在し、イチからプログラミングするよりはるかに楽にさまざまな分析ができる。

 ビヨンド・ザ・データでは、こういったニーズに応えるため、初心者でもRやPythonを使って機械学習ができるようになる学習カリキュラムを用意している。

 データサイエンティスト人材の育成が困難な理由は、RやPythonといったツールの利用法や分析手法の習得ではないのだ。

「時間帯別・カテゴリー別に廃棄ロス率」分析ではダメなワケ

 RやPythonでの分析は明日から始めることができる一方で、データ活用は成果に結びつかなければ意味がない。

 例えば、「配送センターにおける廃棄ロスの多さ」という課題に対して、何の仮説もなく「時間帯別・カテゴリー別に廃棄ロス率」をアウトプットしたとしても、課題解決にはつながりにくい。もちろん、「Aカテゴリーは昼12~13時に廃棄率が高くなる」といったことは分かるだろう。ただし、そこにビジネス仮説や想定される打ち手が紐づいていないと、ビジネスインパクトにはつながらない。

 この例では、「入荷量と出荷量のギャップが大きくなりやすい商品のロス率が高いのでは」「出荷先が複数にまたがっている拠点のロス率が高いのでは」といった仮説から「ロス率のインパクトが高い商品の出荷予測精度を向上させる」ことで解決できるのでは、という打ち手を紐づけて考える必要がある。

 しかし、それだけではインパクトを出すことはできない。予測精度が向上したところで、工場の生産ロット制限・配送上の制約(トラック1台当たり効率など)といった業務課題をクリアしなければならないためだ。課題に対する解決策や打ち手の仮説と、それらを実業務に当てはめたときの実現性を踏まえて分析し、アウトプットを作り出して業務に定着させることで、初めてデータサイエンティストは評価されるのである。

 (1)課題がある現場を探し、(2)解決への仮説を立て、(3)的確な分析をして、(4)打ち手を立案し、(5)打ち手を業務に適用する、ここまでがデータ活用の5つのステップと言える。

怖がってはいけない、大きく考えて小さく始める

 業務を大きく変えなければならない。そんな大きなところから考えるとなると、やはりデータ活用は難しく、時間がかかる、と感じた方も多いのではないだろうか。

 データ活用の領域は、トライアンドエラーが基本だ。

 ビジネス課題からデータ活用による業務改革を見据える一方で、本当に効果が出るのか、どの程度、収益インパクトが出そうなのかを、まずは小さな領域(業務領域、商品カテゴリー、地域、など切り口は何でもよい)でデータ活用の実証実験を行って小さな成功を積み上げる。そして、横展開していくことで大きなインパクトを出すというのが定石だ。

 まさに、データ活用は明日から始められるのである。そして、業務課題があふれる企業の現場こそが、データサイエンティスト育成の格好の舞台となる。小さなトライを各社で重ねられれば、データサイエンティストは真に魅力的な職業となり、担う人材も増えていくはずだ。

※1 「Harvard Business Review」(2012年10月号)
※2 データサイエンティスト協会調べ(2019年11月)
この記事をいいね!する