Archive - 5月 2011

Google DocsのSpreadsheetsにピボットテーブル機能がようやく追加されました

google_spreadsheet_pivot

 

 

Microsoft Excelでデータ分析をされている方であれば、ピボットテーブル機能を使ったことがある方は多いと思います。そのピボット機能が、5月17日にGoogle DocsのSpreadsheetsに追加されました。

既に日本語にも対応していて、Google Docsのページから[新規作成] – [スプレッドシート]を選択すると以下のようなポップアップが表示されます。

注意点として、10万行までの対応ということと、Microsoft Excelで作成されたピボットテーブルは、アップロードしても反映されません。

以下↓が紹介ビデオです。

[youtube]http://www.youtube.com/watch?v=giuD7KSmock&feature=player_embedded[/youtube]

 

同じオンラインオフィススイートのZoho Sheet2008年8月にマクロ機能と共にピボットテーブル機能は追加されていますし、日本語化はされていませんがオンラインBIサービスのZoho Reportsではスタート時の2009年12月からピボットテーブル機能はサポートされています。そのため、Google Docsのピボットテーブル機能の追加は遅いと言わざるをえませんが、BIツールのクラウド化が始まっている中、Googleにもこの分野で頑張って欲しいです。


BIベンダーなどがEMC Greenplum HDをサポートでBig Data分析を更に強化

emc

 

 

オープンソースのBIスイートを提供しているPentahoJaspersoft、オープンソースのETLツールのTalend、大手BIベンダーのSASMicroStrategy、Big Data分析に特化したDatameerKarmasphereなどの企は、既にhadoopのサポートはしていましたが、EMCとのエコシステムを構築し、まずはEMC Greenplum HDのサポートを行うことにより、Big Dataへの対応を更に強化していくそうです。これらの企業の中で、PentahoとJaspersoftはサポートするという発表を既に行いました。

EMC Greenplum HDは5月9日にラスベガスで行われたEMC WORLD 2011で発表された製品で、2011年第3四半期から提供が開始されます。

EMC unveils Hadoop appliance, BI software(英語)

EMC、Apache HadoopベースのBIソフトとアプライアンスを発表(日本語)

PentahoやJaspersoft、TalendなどのオープンソースのETLツールは、プログラムレスで簡単にデータ分析に使用するデータの作成処理を構築できるというメリットの一方、ほとんどのETLツールはバッチ処理に比べるとデータ処理速度が遅く、Big Data時代に対応できているとは言えませんでした。

hadoopをETLツールに簡単に組み込むことができるようになれば、ETLツールで構築する処理とは別にhadoopを組み込んだバッチ処理をスケジューリングしなければいけないという手間が省け、一元化した保守・運用も可能になります。

参考記事:
■EMC Greenplumについて
Dashboard INSIGHT
EMC Delivers Hadoop ‘Big Data’ Analytics to the Enterprise

■JaspersoftとPentahoのEMC Greenplumへの対応について
PR Newswire
Jaspersoft Adds Big Data Support for EMC Greenplum HD
Dashboard INSIGHT
Pentaho Makes Hadoop Faster, More Affordable and Easier to Use with EMC

Google Prediction APIが一般公開され、Google Storage for Developersに対応すると発表

googleio2011

Google I/O 2011が5月10日~11日(現地時間)に行われており、初日のKeynoteでもMusic BetaやHoneyComb、android端末への映画配信など、今年も内容が盛りだくさんです。

その中で昨年のGoogle I/Oで発表されたGoogle Prediction APIが、同じく昨年発表されたGoogle Storage for Developersでも使えるようになり、一般向けに公開されることが発表されました。同時に今まで招待制だったGoogle Storage for Developersも一般公開されています。

Google Prediction APIは、Googleの機械学習アルゴリズムを使うことによって、ヒストリカル(履歴)データから将来予測ができるようになります。Google Prediction APIを使うとどのようなことができるようになるかという例は以下です。

  • レコメンド機能
  • スパム検知
  • 顧客の感情分析
  • ECサイトなどのアップセル分析やチャーン分析
  • ドキュメント・メールの自動分類
  • 言語の自動認識

更にこのPrediction APIを応用すると、以下のことも将来的にできるようになるそうです。
[engagdet 日本版]
自動車の走行を効率化するGoogle Prediction API、フォードと連携

Google StorageでのPrediction APIの使い方は以下の流れになります。

  1. 機械学習に必要なトレーニングデータを用意する
  2. トレーニングデータをGoogle Storageにアップロードする
  3. Prediction APIのメソッドをトレーニングデータに対して呼び出し、モデル構築が行われる
  4. Predictionクエリを送ると、最適な予測結果が返ってくる
  5. もし、トレーニングデータを追加してモデル再構築したい場合、再度全てのデータをアップロードする必要はなく、既存のトレーニングデータに追加して再構築することができる(ストリーミングアップデート機能)

上記の5番は今回公開されたVer. 1.2の更新版からで、もう一つの追加機能として、既に構築されているモデルをメソッドで呼び出すだけで使えるようになりました。このモデルはPrediction Galleryで公開されており、一般のモデル投稿もできるようになっているので、将来的に様々なモデルを自分で構築しなくてもよくなるでしょう。

参照記事:
The official Google Code blog
Google Prediction API helps all apps to adapt and learn
Forbes
Google’s Free Predictive Software

AVOSがReal-Time Business Intelligence PlatformのTap11を買収すると発表

Tap11

 

 

 

YouTube創業者のChad Hurley氏とSteve Chen氏らが設立したAVOS社の最新動向です。

4月27日に米Yahoo!からDeliciousを買収するという報道がされ、日本でも話題になったたばかりですが、AVOSは5月9日、Real-Time Business Intelligence PlatformのTap11を買収すると発表しました。

Tap11のプラットフォームは、マーケティング担当者が実施したキャンペーンの影響をFacebookやTwitterなどを監視することによって効果測定・分析できる単一のダッシュボードを提供しています。

Chad Hurley氏とTap11のCTOであるBraxton Woodham氏の言葉から、Deliciousとの相乗効果を狙っていることがうかがえます。

Chad Hurley氏:
「我々のビジョンは、ユーザーが新しいコンテンツを保存し、シェアし、発見することができる世界最高のプラットフォームを作ることだ。 Tap11の買収により、我々は消費者や企業ユーザーに、公開したリンクのインパクトをリアルタイムで分析する強力なツールを提供できるようになる。」

Braxton Woodham氏:
「我々はChadとSteveと共にTap11を次のレベルに持っていくことに興奮している。10億人以上のユーザーが、ソーシャルウェブ上のデータを体系的にアーカイブ・分析するよいツールがなく、マーケティングインテリジェンスの莫大な損失だった。ソーシャルエコシステムを通して消費・共有されるコンテンツのインパクトを完全に測定するため、我々のボリュームアルゴリズムを活用する予定だ。Deliciousと組み合わせることによって、我々は消費者とパブリッシャーに深い、関連した洞察・レコメンドを提供することができるようになる。」

今後のAVOS社の動向にも目が離せません。

参照記事:
TechCrunch
After Delicious, YouTube Founders Acquire Business Intelligence Platform Tap11
Mashable
YouTube Founders Acquire Social Media Analytics Company Tap11
GigaOM
With Tap11 Buy AVOS Is Playing a Big Game With Big Data
Mobile MarketingWatch
YouTube Pioneers Announce Acquisition of Social Media Analytics Company Tap11

Google、データを地球のグラフィック上で可視化できる「The WebGL Globe」を公開

webgl_globe

5月5日、Googleが様々なデータを地球のグラフィック上で可視化できる「The WebGL Globe」を公開しました。Googleはサンプルとして、Google検索が使用された回数を可視化した「Search Globe」と都市別の人口を可視化した「Population Globe」の2つを公開しています。

開発に使われた技術は、ブラウザ上で3次元コンピューターグラフィックス(3DCG)を表示するWebGLですが、対応しているブラウザがGoogle Chrome 9以降またはFirefox 4、MacではChrome以外にWebKit Nightlyで、もし対応ブラウザを持っている方は、公式サイトから実際にご覧ください。対応ブラウザを持っていない方用にYouTubeの動画を貼ります。

[youtube]http://www.youtube.com/watch?v=mpOlpZBZU-A[/youtube]

なぜこのブログで紹介したかと言いますと、このWebGL Globeはオープンソースとして公開されていて、開発者が座標データなど自分の持つデータを使って、独自の“Globe”を作成することができるからです。技術的なハードルは高く、自由度もないですが、未来のBIを見ているようで感動したので紹介しました。

このWebGLで作成された作品が開発者によって少ないですが公開されています。恐らく、このWebGL Globeを使った作品も今後公開されてくると思いますので楽しみです。