米グーグルの提供する各種サービスは、いずれもバックエンド側でなんらかの形でビッグデータの技術を利用している。中核事業の検索サービスでは米国内で67%のシェアを持ち、月間検索数は137億件に達する。

 米グーグルの提供する各種サービスは、いずれもバックエンド側でなんらかの形でビッグデータの技術を利用している。中核事業の検索サービスでは米国内で67%のシェアを持ち、月間検索数は137億件に達する。

 あるユーザーの過去の検索やほかのユーザーの検索履歴だけでなく、ユーザーの居場所、グーグルの他サービスの登録情報と履歴、外部公開データ、グーグル自身の独自収集データなど、各種の情報を掛け合わせ、ユーザーが求めている内容を予測する。その上で近いものを順位付けして表示する。

 検索結果の表示のどれをユーザーが選んだか、どの程度の時間で選んでその後どのような行動をしたのか、スペルが間違っているのを訂正しているかなど、結果に対するユーザーの行動を、その後の検索精度を引き上げるために活用している。

 米国国勢調査局などの公開地理データ、「ストリートビューカー」で撮影した道路周辺の写真、衛星写真などを利用してマップを作成。店舗・建物・鉄道などに対するユーザーの検索履歴、店舗や企業のグーグルに対する広告出稿データ、ユーザー自身が投稿した店舗の口コミ評価や閉店情報、メニューや店舗の写真などで、地図に付随する情報とナビゲーションの精度を向上させている。

 ユーザーがスマートフォンで場所や施設を探す場合には、GPS(全地球測位システム)の情報も加味して、検索サービスと同等の処理で優先順位をつけて結果を提示。経路検索では、道路の制限速度や列車の時刻表などの情報も活用する。実際にユーザーが移動に使った経路は履歴情報として利用している。

 各種のデータとメールの内容を掛け合わせて、特に重要な相手から来たと予測されるメールを「優先メール」として上位に表示したり、迷惑メールなど有害なメールを自動的にはじいたりする。大容量のストレージをユーザーに無料で提供し、保存メールに対して強力な検索サービスを提供する。

 ユーザーの音声をテキスト化する「Google Voice」に入力された音声データを分析し、予測変換などの精度を上げている。提示したテキストデータをユーザーが訂正すると、その履歴をフィードバックとして活用する。複数言語間の翻訳サービスでも同様にユーザーの訂正履歴などを使って精度を改善している。

 「Google Now」はスマートフォン端末に記録したカレンダーなどの情報から、次に向かう目的地への経路などユーザーが欲しいと予測される最新情報を提示する。カレンダー、GPSなどで取得した各種行動情報や位置情報などに、道路の渋滞状況、天気、Gmailの内容、ニュース、ローカルのイベント情報、提携サイトでの購入履歴などを掛け合わせて分析する。

 例えば、現在の居場所からカレンダーに入力した次のミーティングや提携サイトで買った映画チケットの情報から、所要時間を予測し出かけるべき時刻になるとアラートを出す。ユーザーがよく見るカテゴリーのニュースやスポーツチームの試合結果、Gmailに届いた予約メールを参考にした搭乗する飛行機の遅延情報なども提示する。

 ユーザーのウェブや地図検索などの結果に合わせて、ブラウザー内に広告を表示する。各種の蓄積情報を利用して、ユーザーが欲していると思われる内容と関連の深い広告を選び出している。興味を持っているユーザーに絞って広告を表示することで、広告主にとっての費用対効果を引き上げている。

 特徴は自動入札によるオークション方式を採用していること。広告主は希望する検索キーワードに対して、希望の料金で入札する。高い金額を提示した広告主のリンクがより上位に表示される。

 グーグルの売上高の約85%が広告関連であり、売上高利益率は2013年第1四半期で32%にも達している。

 グーグルのビジネスモデルは安価なコンピューティングパワーに支えられている。

 このため、創業時から、安価なハードウエアで大量データを分散処理するための、ソフトウエア技術を自前で開発してきた。ビッグデータ処理で多用される分散処理ソフト「Hadoop」も、グーグルが検索エンジン用に開発したバッチ処理ソフトを基に開発されている。

 グーグルはスケールメリットを利用して、電子メールなどのアプリケーションを提供するクラウドサービス「Google Apps for Business」などを企業向けに提供している。