Archive - 6月 2011

GeoCommons 2.0を使えば地図上でのデータ可視化が簡単に!

GeoCommons2.0

2008年にTechCrunchに取り上げられたGeoIQ社が提供する地図マッシュアップサービスのGeoCommonsが、5月31日に2.0としてバージョンアップしました。バージョンアップの主な特徴は以下です。

  • データ可視化エンジンの強化・高速化
    数万のポイントでも数千のポリゴンでもストレス無く即時にに表示されるようになりました

     

  • クロスブラウザプラットフォーム
    FlashだけでなくHTML5にも対応したため、iPadなど様々なデバイスから見ることが出来るようになりました

     

  • カスタムアイコンクリエイター
    好きなアイコンをポイントにすることができるようになりました

     

  • データ編集が簡単に
    リロードする必要なく、簡単な編集であればブラウザ上でデータ編集ができるようになりました

実際にどれだけ簡単にデータを地図上で可視化出来るのかを試してみました。

使うデータは、ちょうどGeoIQのブログにGoogle Fusion Tablesにあるデータとの連係に関する記事があったので、そこにあるデータで試してみることにしました。GeoCommonsに取り入れるデータに最低限必要なものは経度緯度か住所です。

今回は簡単なものということでこちらの世界各国の2011年のFacebokユーザー数のデータを使います。持っているデータ項目は以下4つです。

  1. 国名
  2. 2011年時点の人口
  3. Facebookユーザー数
  4. 人口に占めるユーザー数の割合

まずは、データのアップロードです。今回はブログ記事にあるようにGoogle Fusion Tablesのクエリを使ってURLリンクから直にデータをアップロードします。

今回は全ての項目を取り込むので、URLには以下を指定します。
http://www.google.com/fusiontables/exporttable?query=select+*+from+(Fusion Tablesでの番号 )
フォーマットはcsvでないと取り込めなかったのでcsvで。

地図上での位置を指定する方法は以下2つあります。

  • 境界で分けられて用意されたデータセットに名称で紐づける
  • 住所や場所名称などから緯度経度をジオコーディングする

今回は国という大きなくくりなので、前者の境界データセットを選択します。

今回は国名で紐づけるので、「World Boundaries」から国名を持っているデータセットを選択します。今回は 「World Country Admin Boundary Shapefile with FIPS Codes」を選択しました。

アップロードしたデータにあるCountryとデータセットにあるCountry Nameを選択すると、自動的にマッチング処理が行われます。名前にいくつかアンマッチがあったようで221カ国のうち196カ国が紐付きました。

ヘッダーの行を選択します。

あとは今回作成した地図の名前や詳細を書き込んで作成完了です。

 

以下の地図が今回作成した地図です。色分けされていますが、今回は各国の人口に占めるユーザー数の割合を使用しました。色が濃いほど割合が大きく、割合が少ないほど色が薄くなります。大画面で見たい場合はこちら

 

今回は無料版なので細かい設定はできませんが、企業向けサービスのGeoIQでは、詳細な設定やRDBから直接ロードしてのリアルタイム分析など、データ分析における機能が充実しています。企業であれば独自のエリアポリゴンをシェイプファイルで作成すれば、このツールで簡単にデータ分析ができるようになります。

参考記事:
FlowingData
GeoCommons 2.0, now with more mapping features

あらゆるNPOにビジネスインテリジェンスを

 

 

このブログや私がプライベートで行っているプロボノの目的の一つに、NPOなどの非営利組織にもビジネスインテリジェンスを導入することがあります。しかし、実際には2つの大きな問題があります。

  1. BIツールの導入費用は高く、無料期間があっても30日などで長く使えるものがない

    日本語化されているようなメジャーなBIツールを導入しようとする場合、初期費用だけで数百万、そして毎年のランニングコストもかかります。NPOなどの非営利組織にはデータ分析のためにそのような資金を捻出する余裕はありません。一応無料期間を設けているBIツールもありますが、ほとんどが30日間で長く使えず、機能限定版として安価で提供されているものもありません。

    最近はBI分野にもベンチャーが出てきていてかなり安価なものも出始めているので、今後このブログで紹介しようと思います。

  2. オープンソースのBIツールはSelf-Service BIとは言えないほどITの知識が必要

    Pentaho、Jaspersoft、SpagoBIなどのBIツールは、お世辞にも簡単に誰でもデータ分析ができるとは言えません。レポーティング画面を作成することはもちろんですが、BIツールに取り込むデータをETLツールなどで加工したりと事前の作業も必要になります。大規模なNPO組織の場合であればIT担当者もいると思いますが、その他多数の組織はPCやインターネットに詳しい人がいたとしてもプログラムを書けたりデータのことをわかっている人がいることは稀でしょう。

以上が、プロボノとしてどのようにBIをNPOに広めていけばいいのか悩んでしまう原因です。

 

恐らくBIの入門としては、Microsoft Office Excel 2010がインストールされたPCを持っていること前提ですが、Excel 2010PowerPivot for Excelの組み合わせが最適だと思います。理由は以下です。

  • ”無料”でExcelのプラグインとしてインストールできる
  • ほとんどの人はExcelを使った経験があるので、操作になれている
  • データのリレーションを作成したり様々な集計を行う際にはDAX(Data Analysis Expressions)という言語を使う必要があるが、Excelの関数(sumなど)を使ったことがあればそれほど難しくない

どんなことがどのように出来るのかは、以下のMicrosoftのサイトがわかりやすいです。
Self-Service BI 体験サイト

 

もう一つ注目しているのは、QlikViewというBIツールを提供しているQlikTechの動きです。2010年2月に、「Change Their World」という活動を始めました。これはヘルスケア、環境問題、人道支援などを行うNPOなどの組織を支援するプログラムで、助成対象の組織にはユーザーライセンス、ユーザートレーニング、ホスティングサービスなどが無料で提供されます。

QlikTechの日本語サイトにも紹介されていて、この「Change Their World」 助成プログラムに申請することも可能です。
Change Their World(日本語)

しかし実際に助成プログラムが採用されている組織はまだ少なく、しかもどこも規模が大きい組織なので採用基準はかなり高いと思われます。現在、採用されているNPOなどの組織は以下のようなものがあります。

  • Circle of Blue
    きれいな淡水源の減少危機をレポートするジャーナリストや科学者の国際的ネットワークです。WaterViews(デモ有り)と23カ国での活動報告書の作成にQlikViewを使用します。
  • Plan France
    開発途上国の350万の家族の貧困解決や子どもの権利促進の活動行う組織です。プロジェクト・リソース管理のためにQlikViewを使用しています。

  • Doctors Without Borders Sweden
    スウェーデンの国境なき医師団です。簡単に正しいドナーセグメントへのターゲットができるようになること、そしてフィールドへ送るお金のオーバーヘッドコストを削減するためにQlikViewを使用しています。
  • AIDS Accountability International
    世界的な製薬企業が参加している抗エイズ薬供給推進イニシアティブです。これまで不足していたステークホルダーへ透明性という問題に対して、データを統合して簡単にアクセスできるようにし、コミットメントが達成されているかを伝達できるようにするため、QlikViewを使用しています。
  • The Church of Sweden
    スウェーデンで最大のキリスト教会で、ACTアライアンスのメンバーとして貧困や不平等に対する人道支援活動をしています。ドナーのデータベースの解析から深い洞察を得て、募金活動の効率性を高めるためにQlikViewを使用しています。
  • The Honeynet Project
    ハニーポットを使ってインターネット上の攻撃手法などを研究するプロジェクトです。悪意のあるボットやマルウェア、ウェブ上のデータを視覚化し、迅速に攻撃とその発信元のIPアドレスを特定するためにQlikViewを使用しています。
  • The Microfinance Information Exchange, Inc.
    マイクロファイナンス機関の財務や社会的な成果を投資家やマイクロファイナンス機関に情報提供しています。もともとデータ活用がされている組織ですが、ユーザーがより良いデータ視覚化をできるようにし、より柔軟なデータ操作のオプションを提供するためにQlikViewを使用しています。
  • Norwegian Computer Society
    ノルウェーのITプロフェッショナルが集まったNPOです。500人のIT戦略の愛好家が60人のコミュニティに分かれて活動しています。マネジメントレポートの作成や分析ツールとしてQlikViewを使用します。

    ※QlikTechはスウェーデンに本社があるため、北欧の組織が多いのだと思います。

 

6月2日には、研究とITを統合してヘルスケア向上を目指しているCenterstone Research InstituteというNPOが「Change Their World」プログラムでQlikViewの利用拡大することが発表されました。

実は、このQlikViewは実際の製品と同じ機能を持つ(機能制限がない)トライアル版があり、期間に制限がありません。企業・組織情報を入力しないとダウンロードできないので、営業の連絡がかかって来るかもしれないため「絶対にオススメ」とは言えないのですが、もし真剣にデータ活用を考えている組織の方であれば、試してみてください。私も実際にQlikViewを使ったことがありますが、Self-Service BIと言えるほど簡単に画面構築することができます。


最後に

今のところ、最初の2つの課題を解決できるBIツールは、「Excel 2010とPowerPivot for Excel」もしくは「QlikView」だと思っています。もしNPO関係者でデータの活用方法に困っている、「Excel 2010とPowerPivot for Excel」もしくは「QlikView」を活用してみたいという方がいましたら、TwitterもしくはFacebookでご連絡ください。プロボノとしてなので時間に限りはありますが、ツールの紹介と実際にデータ活用環境構築デモができたらと思っています。

もし他の企業でNPOへのBI支援を行っているところをご存じの方がいましたら、ご連絡ください。よろしくお願いします。

The New York TimesのData Visualizationがすごい

Housing's_Rise_and_Fall_in_20_Cities

 

 

米ニューヨークタイムズのData Visualizationはうまいことについてはご存じの方もいるかもしれませんが、画像だけでなく時にはFlashなどを使って、データをインタラクティブに見せるのが本当にうまいです。

まずは2011年5月の記事をいくつか紹介します。

Housing’s Rise and Fall in 20 Cities

まずは直近5月31日。S&P社が公開しているアメリカ主要20都市の住宅価格INDEXで、2000年1月を100とした場合の2011年3月31日までの遷移です。左側の都市を選択すると該当の線が青くなります。また、線上にカーソルを持って行くと、そこの日付とINDEXの数値がポップアップされます。

 

The Deadliest Years

5月23日、最近アメリカでトルネードが多発して死者が多く出ているというニュースをよく見ますが、1950年から毎年のトルネードで犠牲になった方の数などを表したのが以下です。水色の点はトルネードの発生場所で、点から出ている線がトルネードが通った跡です。黄色いバブルは、犠牲者の数によって大きくなります。上の年のつまみをドラッグ&ドロップするとそれぞれの年のデータが表示されます。また、左上の「Play」を押すと自動的に年が一定時間ごとに移動します。改めて今年はトルネードが多く発生し、犠牲者が多く出ていることがわかります。

 

Mapping the Nation’s Well-Being

5月5日、米Gallup社が2010年に毎日ランダムに1000人の成人に”健幸度”について聞いてINDEX化したものが以下です。左側の各種INDEXを選択すると地図が変化し、それぞれの地域にカーソルを持って行くと詳細なパーセンテージが表示されます。

 

The Death of a Terrorist: A Turning Point?

5月3日、オバマがビン・ラディン容疑者の殺害を発表した後、13,864人のリーダーの方に以下2つの質問をしました。①”彼の死は我々のテロに対する戦争において重要(Significant)か。” ②”この出来事に対してネガティブかポジティブどちらの意見を持っているか。” その結果を以下のようにプロットしています。それぞれのポイントにカーソルを持って行くと、そこにプロットされたコメントがポップアップされます。濃くなっているポイントは複数の人がそこのポイントでコメントをしていることを表しています。

データを可視化することによって、普段はそれほど見入らないニュースでも「おっ?これは。」となりませんか?特に最後のビン・ラディン殺害についての意見をVisualizationしたものは、ただの数字よりも一見して概要がわかり、更に多くのコメントも見ることができます。日本のニュースサイトでここまで可視化をしているサイトはないでしょう。これはやはり欧米の方がインフォグラフィックやBIが進んでいるからということも要因にあると思います。

もしこれらの記事が好きな方がいれば、定期的にThe New York Timesを覗いてみてはいかがでしょうか。

 

以下にその他過去のモノをご紹介します。

The Jobless Rate for People Like You

Stop, Question and Frisk in New York Neighborhoods

600 Club Gets a New Member

Paths to the Top of the Home Run Charts

President Map

ComponentOne OLAP for SilverlightがBest of Tech・Ed 2011のBI部門を受賞

olap_for_silverlight

 

Best of Tech・Edは毎年1回、Microsoftのパートナー企業が市場に提供しているMicrosft向けの製品・サービスの中から、革新的で優れたモノを選ぶコンテストで、今年は5月中旬にアトランタで開催されました。

今年は15のカテゴリーに344の製品・サービスがノミネートされ、48の製品・サービスが決勝に進み、その中でBI部門を受賞したのが ComponentOne OLAP for Silverlight です。5月18日に授賞式が行われましたが、5月31日にComponentOne社が受賞したことについて正式に発表しました。

この開発ツールを使うことによって、キューブを構築せずにインタラクティブなレポート、チャート、ピボットテーブル、ダッシュボードを簡単に作成できるようになります。基本的には簡単な表やグラフしか作成できませんが、ComponentOne社の別の製品である Studio for Silverlight のコントロールスイートも含まれているので、更に30種類以上のチャートや地図連携など、50以上のユーザーインターフェイスを使ったアプリケーション開発もできます。

Visual Studioでの開発が必要なので、もちろんSelf-Service BIにはほど遠い製品ですが、データをグリグリ回すのではなくある程度見方が決まっている場合、SQL Server Reporting Servicesよりインタラクティブにレポーティングを作成できますし、主要なBIベンダーのBIツールを導入するより圧倒的に安価なのでニーズがあるのでしょうか。

Studio for Silverlightは日本ではグレープシティが販売していますが、OLAP for Silverlightはまだ販売されていないようです。

参考記事:
ComponentOne OLAP for Silverlight Named Winner in Microsoft Best of TechEd 2011 by Penton Media’s Windows IT Pro, SQL Server Magazine, DevProConnections and SharePoint Pro