カブドットコム証券は「ソーシャルメディア・センサー」と呼ぶ、ビッグデータ活用基盤の開発に取り組んでいる。「Twitter」や「Facebook」に代表されるソーシャルネットワーキングサービス(SNS)で発信される膨大な情報を分析し、SNSを行き交う情報が株価や顧客の動向にどう影響を与えているかを明らかにするのが狙い。最終的に、株売買の参考情報として投資家に提供することを視野に入れている。

 2011年7月から11月にかけて、46銘柄を対象に検証を実施した。具体的には、1日当たり約900万件のTwitterの情報(ツイート)を収集し、あらかじめ銘柄ごとに定めたキーワードで絞り込んで、銘柄に関連する情報の記載の有無や株価などへの相関を分析した。キーワードの数は各銘柄につき1000程度、合計で約4万3000。2カ月間で2億件の情報に対して分析を繰り返しながら、より相関関係の強いキーワードを絞り込みに用いていくことで抽出の精度が高まり、銘柄ごとの“辞書”を作るノウハウを蓄積した。

 ソーシャルメディア・センサーの開発には、分散処理ソフト「Hadoop」をベースにした日本IBMの分析ソフト「InfoSphere BigInsights」と、テキストマイニングツール「IBM Content Analytics」を用いている。

この記事をいいね!する