米ツイッターは、140文字に限定したマイクロブログのサービス「Twitter」を提供する。ユーザーが興味のある相手を「フォロー」すると、その人たちの書き込みが自分のタイムラインに表示される。テキスト文字のほかに、写真や動画、URLのリンクなどを掲載できる。ユーザーのID、タイムスタンプ、GPS(全地球測位システム)による位置情報などの情報も追加可能だ。

 米ツイッターは、140文字に限定したマイクロブログのサービス「Twitter」を提供する。ユーザーが興味のある相手を「フォロー」すると、その人たちの書き込みが自分のタイムラインに表示される。テキスト文字のほかに、写真や動画、URLのリンクなどを掲載できる。ユーザーのID、タイムスタンプ、GPS(全地球測位システム)による位置情報などの情報も追加可能だ。

 気軽に書き込めるので、多くのユーザーが周囲の状況や利用した商品の感想などの「生の声」を発信するのが特徴である。2013年3月の同社公式ブログによると、アクティブユーザー数は2億以上、1日のツイートは4億件に達している。

 Twitterへの書き込みは、ユーザーが「非公開」を指定しない限り「公開」が原則である。ビッグデータビジネスの観点では、Twitter自身よりも外部での活用の価値が注目されている。書き込み内容を外部の企業にデータ素材として提供し、分析に活用してもらうという使い方だ。統計的な解析や絞り込んだデータのグラフ化などを行う。

 ツイートのテキストを自然言語処理し、属性も加えて統計分析をして解析。特定の話題や事項に関する、多数の人の感想を分析する「センチメント分析」を、世論調査やマーケティングに生かす例が多い。

 また特定の企業や製品に対するクレーム、質問、評判などをいち早くキャッチして迅速に対応する、カスタマーサービスのツールとしても利用されている。

 こうしたデータ活用には大きく2つの手段がある。1つが企業自身や解析事業者などが公用しているTwitterにアクセスしてツイートを収集する方法。

 2つめがツイッターの公式リセラーと契約して、キーワードや言語、地域などで絞り込んだデータを購入する方法だ。公式リセラー経由で提供するデータは、高速かつ大量の中身を流すので「Firehose(消防ホース)」と名付けられている。日本ではNTTデータがリセラーとなっており、米国や欧州にもそれぞれリセラーがある。具体的には、2011年に米セールスフォース・ドットコムが買収した米ラディアン6などが挙げられる。

 ツイッターは2013年1月、2006年の創業以来の公開ツイートをすべて米国議会図書館に寄付した。ツイート1700億件、データ量は133テラバイトになる。これらのデータは閲覧ではなく、研究者が種々のツールを使って解析し、学術研究に活用する予定である。