Category - 可視化ツール

モバイルファーストの次世代リアルタイムデータビジュアライゼーションツール「Zoomdata」がローンチ

Zoomdata

題名だけ見るとカタカナだらけで逆によくわからなくなってしまっていますが、本当にこの題名が示す通り、”モバイルデバイスに最適化され、リアルタイムにストリームデータを可視化できるツール”となっているのが、今回ご紹介する「Zoomdata」です。

11月13日に、このツールのローンチと同時に110万ドルをシードファンディングとして調達したことを発表しました。

インフラとしての仕組みは、オンプレミスの基幹システムやクラウド上のデータ、ソーシャルメディアデータ、HDFS上のデータなどマルチソースのデータを統合し、リアルタイムにストリームデータを可視化・分析が可能となっており、分析結果を他のメンバーに共有するソーシャル機能もあります。

ちなみにGigaOMの記事によると、このリアルタイム分散処理システムは去年9月にTwitterがオープンソース化したStormを活用しているとのことです。

ヒストリカルデータを保持しながら別のリアルタイムのストリームデータを処理できるため、過去とのリアルタイム比較が可能となっています。

Zoomdataの特徴であり強みとなっているのは、パレット上でお絵かきをするようなモバイル端末での直感的な操作感とビジュアライゼーションです。

データ可視化スクリプトとして注目を集めているD3.jsから多くのインスピレーションを受けており、なおかつモバイル端末らしくスワイプやピンチ、ドラッグ&ドロップなどを使い直感的に操作・分析可能で、ユーザーエクスペリエンスを追求したデータ分析ツールとなっています。

残念ながらデモ動画は公開されておらず、実際にはどのように動くのかを見ることが出来ません。その操作感を早く動画で見てみたいですね。

果たしてこのツールが成功するのか・失敗するのかの議論はさておき、近年のBI関連スタートアップ(例えばRoambiandaraなど)は明らかにモバイルファーストもしくはモバイル特化型で機能も絞って特化した企業が増えてきており、これまでムダに高機能で高価なデスクトップ型BIツールに手が出せなかったSMBsをターゲットにしていることがよくわかります。

先月、タッチパネルに最適化されたWindows 8が発売され、モバイルBI市場は更に拡大していくでしょう。ただ単にモバイル端末にデータを表示出来るだけでない付加価値にレガシーBIベンダーがどのように対応してくるのかに注目です。

『Datameer 2.0』個人でもビッグデータを統合〜分析〜可視化できるツールに革新的進化!

img-devices

 

Apache Hadoopをベースとしたビッグデータ分析サービスを提供するDatameerが、2010年に公開した製品のメジャーバージョンアップとなるDatameer 2.0のリリースを発表しました。

恐らくビッグデータに関心がある方であればDatameerの名前は聞いたことがあるでしょう。

これまで(version 1.4まで)はエンタープライズ版のみ提供しており、Cloudera、EMC、MapR、AWSなど様々なHadoopディストリビューションに対応し、プログラミング能力を必要としないためコンピュータエンジニアの経験がほとんどないユーザでも大量のデータを取り扱えるビッグデータ分析ツールとして知られています。

そして今回発表されたバージョン2.0では、3つの大きなアップデートがありました

個人向け・小規模組織向けのエディションを追加

まず1つ目が、これまでのエンタープライズ版に加え、パーソナル版とワークグループ版の追加です。

パーソナル版はその名の通り、一つのローカルPCで動作する個人向けの製品で、ワークグループ版は一つのサーバーで動作する小グループ向けの製品となっています。

ユーザーはDatameerのソフトウェアをダウンロードしインストールするだけで、ローカルPC上で製品に実装されているhadoopが動くようになります。

企業向けのサービスが個人でも使えるようになるということで、データはあるけど管理したり分析したりという時間が取れないというような小規模組織は多いと思いますので、企業向けで成功しているこうしたプロダクトが個人向けのエディションを追加してくれることは嬉しいですね。

データ可視化が大幅アップグレード。”WYSIWYG Infographic Designer”

2つ目が、データビジュアリゼーションに関することです。

これまでもダッシュボードでグラフやチャートを作成することができましたが、種類が限定的でそれぞれのグラフがただ並んでいるようなデザインしかできませんでした。

Datameerは今回のデザイン面での追加機能を”WYSIWYG (What You See Is What You Get) Infographic Designer”と表現しており、インフォグラフィックのような可視化をアプリケーション内で自由に作成・配置し、データが更新される度に自動的にインフォグラフィックも更新される、いわゆる”Live Infographics”を実現しています。

最近のソフトはグラフやチャート自体はキレイになってきていますが、あるボックスの中でしか位置を動かせないなど配置の自由がないものが多いですが、Datameer 2.0では自分が置きたいと思ったところに置けるようになっています。 

HTML5により、あらゆる端末から操作・分析が可能に

そして3つ目はインターフェイスについてです。

FlashからHTML5になったことよってFlash未対応端末でも操作・閲覧可能で、Windows、Mac OS、Linux、VMWareはもちろんiOSとandroidにも対応し、ほぼ全てのPC、スマートフォン、タブレットから利用出来るようになりました。

 

その他にも、サポートするデータソースも拡充され、TwitterやFacebookなどのソーシャルメディアからNetezzaやTeradataなどのDWHアプライアンスとの連携も出来るようになるなど、これ以上ないほどの進化を遂げています。

これにより、様々なデータの統合・データマネジメント・ビルトインされた200以上のアナリティクス機能・グラフィカルな可視化までを、このツール一つで出来るようになりました。

料金は、(どうやら期間限定で)パーソナル版がデータサイズが100GBまでで$299/年。ワークグループ版はユーザーが50人、データサイズが1TBまでで$2999/年。エンタープライズ版は要相談となっています。

トライアルしてみないとどのぐらい使えるものかわかりませんが、まだ限定公開のため、サインアップ後に招待が来るまで待つ必要があります。

登録させるほどすぐに招待が来るそうなので、もしサインアップする方がいれば、こちらからしていただけると嬉しいです。

Datameer 2.0の紹介動画は以下です。(製品画面があまり出ないですが。)

[vimeo width=”500″ height=”281″]http://vimeo.com/43651176[/vimeo]

クラウド型データ可視化プラットフォームもここまで来た!ビジュアルプログラミング環境『Quadrigram』がローンチ

quadrigram

 

スペインのバルセロナに拠点を置くBestiario社は今月、ブラウザ上でビジュアルプログラミング言語(VPL:Visual Programming Language)を使い、データのロード・加工・分析・可視化・共有まで可能なプラットフォーム「Quadrigram」をローンチしました。

[vimeo width=”550″ height=”309″]http://vimeo.com/41136214[/vimeo]

Bestiario社は2005年の設立以降、アートと科学の概念を組み合わせ、グラフ理論、幾何学的アルゴリズム、物理モデルや地理的表現などに基づいたフレームワークを使い複雑なデータセットを可視化し、データ理解を可能にするソリューションを提供しており、その経験がこの「Quadrigram」の開発に結実した、ということです。

データ可視化だけを目的としたサービスは最近多くリリースされていますが、最初に列挙した通り、下記のフローをこのプラットフォーム上で直感的なVPL(詳細はこちら)で一貫して行うことができ、完成度がかなり高いツールとなっています。

  1. データロード
  2. データハンドリング
  3. 探索的データ分析・解析
  4. データ可視化
  5. アウトプット共有

このVPLについては実際に動画を見ていただくと、どんなものかわかるでしょう。

[vimeo width=”550″ height=”309″]http://vimeo.com/36892914[/vimeo]

ワークスペース上にモジュールライブラリーというタブが並んでおり、このライブラリーから必要なモジュールをドラッグ&ドロップで自由に配置し、モジュール同士を接続してインフォメーションフローを作成していきます。

ライブラリーには以下の種類のモジュール(詳細はこちらがあります。

  • Data Strucures
    StringやNumberなどのデータフォーマットの宣言や変換を行います。

  • Operators
    単純な計算から、データ抽出やカラーパレット作成などの様々な機能を実行します。

  • Controls
    ボタンやテキストボックス、スクロールバーなどの作成からユーザーシステムのプロパティ取得などのコントロール部分を作成します。
     
  • Visualizers
    基本的なパイチャートや棒グラフから複雑ネットワークなどでデータを可視化します。

  • Resources
    ローカルファイルやデータベース、ソーシャルメディアからAPIで取得、その他のデータ分析ツールなど、ロードするデータソースを指定します。

上記それぞれのリンク先を見て頂ければわかりますが、それぞれのライブラリーには既に多数のモジュールがあり、かなり高度な分析や表現ができるようになっています。

データ解析についても、RやGephiなどのOSSがサーバーサイドで統合されており、テキストマイニングや複雑ネットワークもこの中だけで完結させることができます。両方とも私が日常的に利用しているツールなので個人的にはこれだけでも、とても魅力的です。

サイトではチュートリアルも用意され始めており、今後更に増やす予定となっています。

 

ローカルアプリケーションではなく、ブラウザ上で行うクラウドアプリケーションでここまでのことが出来ることに驚きました。

料金プランを見てみると、ストレージ容量やCPUが心もとないため、ビッグデータ分析には向かないと思われるでしょうが、Quadrigram側としてはビッグデータの定義でいうVolume(容量)ではなく構造化データ・非構造化データのVariety(種類)を解決するサービスとして開発したことをブログ記事でも言っています。

まだローンチしたばかりで登録すれば誰でもすぐに試用できるわけではないため、ネット上でもまだそれほど話題になっていません。

コンセプトとしてはとても素晴らしいツールだと思いますが、実際に利用したユーザからの評価が集まり始めてから、本当に使えるツールかどうかわかってくるでしょう。

ブラウザ上でインフォグラフィックを作成できる『easel.ly』がオープンベータを開始

easel.ly

 

インフォグラフィックをブラウザ上で作成できるwebサービス「easel.ly」のオープンベータが開始されています。

[vimeo width=”550″ height=”309″]http://vimeo.com/37781587[/vimeo]

 

ブラウザベースのインフォグラフィック作成ツールといえば、インタラクティブなインフォグラフィックを作成できる「infogr.am」や、マレーシアに本拠地を置き今年の2月に正式有料サービスとしてリリースされた「Piktochart」、インフォグラフィック共有サービスでもおなじみの「visual.ly」(作成ツールは今後公開)など、ここ1〜2年のインフォグラフィックの盛り上がりと共にこうしたインフォグラフィックを作成するサービスのスタートアップが世に出てきました。

easel.lyはPiktochartと同じように、サイトで用意されているものや自分でアップロードしたベクター素材をドラッグ&ドロップで大きさを変更したり向きを変えたりできます。ただ、色の変更やデータをアップロードしてのチャート作成機能もまだ用意されておらず、ベータ公開するにはまだ早すぎたのでは?と思えます。

easel.lyは現在Chrome、Firefox、Safariをサポートしているので、それらのブラウザを利用している方は試してみてください。正式リリースがいつになるかわかりませんが、実際にインフォグラフィックを作ってみたいと思っている方はPiktochartを使ってみるのがいいと思います。

もっと本格的にインフォグラフィックを作ってみたい!という方は、やはりAdobe Illustratorなどのソフトを使うべきでしょう。どのように作成するのかは、以下を参考にしてみてください。

商用も可能な無料のベクター素材はDesign Spiceさんの記事が参考になります。

GeoCommons 2.0を使えば地図上でのデータ可視化が簡単に!

GeoCommons2.0

2008年にTechCrunchに取り上げられたGeoIQ社が提供する地図マッシュアップサービスのGeoCommonsが、5月31日に2.0としてバージョンアップしました。バージョンアップの主な特徴は以下です。

  • データ可視化エンジンの強化・高速化
    数万のポイントでも数千のポリゴンでもストレス無く即時にに表示されるようになりました

     

  • クロスブラウザプラットフォーム
    FlashだけでなくHTML5にも対応したため、iPadなど様々なデバイスから見ることが出来るようになりました

     

  • カスタムアイコンクリエイター
    好きなアイコンをポイントにすることができるようになりました

     

  • データ編集が簡単に
    リロードする必要なく、簡単な編集であればブラウザ上でデータ編集ができるようになりました

実際にどれだけ簡単にデータを地図上で可視化出来るのかを試してみました。

使うデータは、ちょうどGeoIQのブログにGoogle Fusion Tablesにあるデータとの連係に関する記事があったので、そこにあるデータで試してみることにしました。GeoCommonsに取り入れるデータに最低限必要なものは経度緯度か住所です。

今回は簡単なものということでこちらの世界各国の2011年のFacebokユーザー数のデータを使います。持っているデータ項目は以下4つです。

  1. 国名
  2. 2011年時点の人口
  3. Facebookユーザー数
  4. 人口に占めるユーザー数の割合

まずは、データのアップロードです。今回はブログ記事にあるようにGoogle Fusion Tablesのクエリを使ってURLリンクから直にデータをアップロードします。

今回は全ての項目を取り込むので、URLには以下を指定します。
http://www.google.com/fusiontables/exporttable?query=select+*+from+(Fusion Tablesでの番号 )
フォーマットはcsvでないと取り込めなかったのでcsvで。

地図上での位置を指定する方法は以下2つあります。

  • 境界で分けられて用意されたデータセットに名称で紐づける
  • 住所や場所名称などから緯度経度をジオコーディングする

今回は国という大きなくくりなので、前者の境界データセットを選択します。

今回は国名で紐づけるので、「World Boundaries」から国名を持っているデータセットを選択します。今回は 「World Country Admin Boundary Shapefile with FIPS Codes」を選択しました。

アップロードしたデータにあるCountryとデータセットにあるCountry Nameを選択すると、自動的にマッチング処理が行われます。名前にいくつかアンマッチがあったようで221カ国のうち196カ国が紐付きました。

ヘッダーの行を選択します。

あとは今回作成した地図の名前や詳細を書き込んで作成完了です。

 

以下の地図が今回作成した地図です。色分けされていますが、今回は各国の人口に占めるユーザー数の割合を使用しました。色が濃いほど割合が大きく、割合が少ないほど色が薄くなります。大画面で見たい場合はこちら

 

今回は無料版なので細かい設定はできませんが、企業向けサービスのGeoIQでは、詳細な設定やRDBから直接ロードしてのリアルタイム分析など、データ分析における機能が充実しています。企業であれば独自のエリアポリゴンをシェイプファイルで作成すれば、このツールで簡単にデータ分析ができるようになります。

参考記事:
FlowingData
GeoCommons 2.0, now with more mapping features