インターネット証券大手のカブドットコム証券は、売買が急増すると予想される株式銘柄を選び出す「予想売買高急増ランキング」の情報サービスを5月に開始した。取引開始前、取引時間中に常に売買が急増しそうな銘柄をいち早く知りたい個人投資家向けのサービスだ。

 同社は株式市場の予測にビッグデータを活用しようと早い時期から取り組んできた。2012年、TwitterやFacebookへの投稿と株価との関連を入念に調べた。50銘柄と1000個のキーワードを選定し、2カ月間で2億件の情報を収集して解析した。

 その結論は残念ながら、「ソーシャルデータと株価の相関は確かにあるが、先行指標としては使えない」(事務・システム本部システム部開発課の中澤康至課長)というものだ。ソーシャルメディアへの書き込みは株価の動きを後追いする性格のもので、予測には使えなかった。

大量の数値データへの回帰

 今回開発した売買高予想はビッグデータ活用の発想を完全に転換している。ソーシャルメディア上の非構造化データではなく、大量の数値データを元にしている。取引所に集まる全ての売り注文と買い注文のデータを利用することが今回の予測システムの特徴だ。「大量の注文情報をリアルタイムに計算することで、銘柄ごとに寄り付きの始値や引けの終値の予測値、売買の出来高などを算出している」(中澤課長)と言う。

 売り注文や買い注文の全体の量を見ているだけでは、売買が急増するかどうかは分からない。価格で折り合えなければ取引が成立しない。例えば、前日の大引け後から当日の取引開始前までに出された買い注文と売り注文は、取引所のマッチングのアルゴリズムに従って価格が決まり、売買が成立する。

 同社が今回利用しているアルゴリズムは、取引所で使われているものと同じである。データも取引所に寄せられた全ての注文情報を同社の情報サーバーで収集している。

 注文情報とマッチングのアルゴリズムから予想される出来高と、過去の出来高情報の推移とを比較することで、出来高が急増しそうな銘柄を選び出す。過去の出来高情報は銘柄ごとに過去25営業日分、1分単位で蓄積。比較に使う過去の出来高データは全体で420万件となる。

 取引所とつながっている情報サーバーは毎秒8500件の出来高データを計算サーバーに送り込む。計算サーバーはこれらのデータと前営業日、過去5営業日、過去25営業日の3種類の平均データなどと比較し、全体で毎秒30万件の演算を実行してリアルタイムで情報を更新する。

 取引所での立会いが始まると、実際の出来高と過去の出来高が比較される。売買急増情報を投資家に配信する情報配信サーバーは15秒間隔でランキング情報を更新する。

 今回の情報サービスは投資家の注目を集めているようだ。今回の情報サービスは同社の株式取引ツール「kabuステーション」でオプション契約をしている人が利用できるが、その契約件数が直近と比べて約5割増で推移しているという。

「予想売買高急増ランキング」の仕組み
「予想売買高急増ランキング」の仕組み