一口に「データ連携」と言っても様々な方法がある。例えば、「行」のデータを結合する方法と「列」のデータを結合する方法。どちらの結合を目指すのかで、その目的や実現に際して直面する課題、難易度も大きく異なってくる。

(写真/Shutterstock)
(写真/Shutterstock)

 異なるデータを連携させる際のパターンは大きく2つに分けることができる。それは「行」のデータを結合していく方法と「列」のデータを結合していく方法だ。この違いはデータを記述した表をイメージすると分かりやすい。

 例えば、顧客データを表にした場合、表の左側、すなわち表側(ひょうそく)にはユーザーID、表の上部分にある表頭(ひょうとう)には各項目が記載されている。つまり行の結合は同じ種類のデータを、列の結合は異なる種類のデータを連携させていく方法である。

 社外とのデータ連携という話になったとき、行結合を目指すのか、列結合を目指すのかはまったく異なる仕事になる。誰とデータを連携するのか、という座組みも異なれば、その目的や実現に際して直面する課題、難易度も異なってくる。それぞれのデータ連携のパターンの特性を見てみよう。

 まず行結合はどのような座組みの下で、何を目的に行われるのか。分かりやすいのは、本連載第97回で紹介した石油化学工業協会によるデータ連携の取り組みだ。これは業界全体が抱えるメンテナンス上の課題について「症例」データを各企業から数多く集めている。データ連携の目的は、課題の発生予測の精度を業界全体で向上させよう、という取り組みである。

 このように、行結合によってデータの件数を増やし、既存分析の精度を高めたり、クロス集計のパターンを増やしたりすることができる。それぞれのデータ保有主体がデータを出し合うことで、より精度の高い予測ツールなどを手にすることができる。「何のためにデータ活用をするのか」という目的についても明らかであることが多い。

このコンテンツ・機能は会員限定です。