時系列での相関を調べることが出来る「Google Correlate」が公開

Googleは5月25日に、時系列での相関を調べることが出来る「Google Correlate」をGoogle Labsで公開しました。

Googleは、どれくらい検索されたかを時系列グラフで表示できる「Googleトレンド」「Google Insights for Search」を提供していますが、「Google Correlate」は”Correlate”という通り、検索語や時系列の数値をアップロードすることによって、それと似た相関のあるものを見つけることが出来ます。この相関を見つける技術は、マンガ風に紹介していますが、Googleがインフルエンザ流行傾向を予測するために28か国で公開した「Google flu Trends」の技術を利用しています。

これまで、自社の商品やサービスの検索ワードと相関のある検索ワードを調べるためには、検索ワードを推測して探さなければ行けませんでした。もしかすると、予想外なワードが相関していると出てくるかもしれません。順番としては、Google Correlateで相関のあるワードを見つけ、そのワードをGoogle Insights for Searchで詳細に調べる、というようになるのではないでしょうか。

ユーザーが利用する方法は以下3つです。

  • 相関を見たい検索語を入力する
  • 時系列データをcsvでアップロードするか、値を直接入力する
  • 時系列のグラフをマウスで描く(Search By Drawing)

相関はピアソン相関係数で計算しているそうで、今のところ正の相関しか見ることはできませんが、逆相関を調べるためには入力する値に”× -1″をしてマイナス値にすることによって調べることが出来ます。

現在、Google Correlateで使用されているデータは、2003年以降のアメリカ全体とアメリカの各州ごとの検索結果のため、現時点では日本語の検索クエリーなどはほとんど使えません。(全く使えないと思いきや、いくつか試してみると時々結果が出る言葉もあります。)

ちなみに「japan」で検索してみると、震災のあった2011年3月当たりでドカンと急上昇していますが、相関結果の4つ目に「japan location」とあります。アメリカ人は日本が地図のどこにあるかあまり知らないと言うことなんでしょうね。


Leave a Reply

Your email address will not be published. Required fields are marked *