Category - データ可視化

Visual.lyがインフォグラフィック作成のクラウドソーシングプラットフォーム「Visual.ly Marketplace」をローンチ

visually_marketplace

 

2ヶ月弱前に、「アウトソーシングはデータ分析だけに留まらず。データビジュアライゼーションのアウトソーシングも主流に!?」という記事を書きましたが、早速動きがありましたので共有します。

世界最大のインフォグラフィックのコミュニティサイトであるVisual.lyは18日、インフォグラフィック作成に特化したクラウドソーシングプラットフォームである「Visual.ly Marketplace」をローンチしました。

[vimeo width=”550″ height=”309″]http://vimeo.com/50264295[/vimeo]

 

去年の7月にサイトがオープンした当初はインフォグラフィック作成ツールの開発が進んでいましたが、これまで公開された作成ツールはテンプレート上にTwitterやFacebookのデータを載せられるような簡単なもので、自由にカスタマイズ可能なツールにはなっていません。(もしかすると、デザイナーには公開されているのかもしれませんが。)

この1年、特に目立った動きはありませんでしたが、デザイナーを多く囲っているVisual.lyだからこそ可能なアウトソーシングプラットフォームの構築を進めていたようです。

海外ではデザイナー会社やフリーランスのデザイナーに発注したり、日本でもカーツメディアワークスアイオイクスなどのインフォグラフィクス制作サービスを行なっている企業もありますが、企業(もしくは組織、個人)とデザイナーをマッチングさせるサービスはこれまで存在しませんでした。

この「Visual.ly Marketplace」上でデザイナーとどのようにマッチングさせるのか、その仕組みはこうです。

  1.  依頼者がプロジェクトを作成

    まずは依頼者がプロジェクトを作成します。そのインフォグラフィックでどのようなストーリーテリングをしたいのかを記入し、求めるインフォグラフィックのフォーマットや表現的なスタイル、レイアウトなどを選択します。
    そして、そのインフォグラフィックに必要なデータとその説明、使用するデータ以外に伝えておきたいことなどが記載されているファイルをアップロードします。
     
  2. Visual.lyが自動的にデザイナーをマッチング

    プロジェクトの作成が終わると、Visual.ly Marketplaceの独自のアルゴリズムによって、プロジェクト作成時に選択したインフォグラフィックの仕様や地理的情報(例えば日本の企業がプロジェクトを作成すると日本人のデザイナーとマッチング)などを条件に、48時間以内に(現在は)5,000人の中から最適なデザイナーをマッチングさせます。

  3. 納品まで掲示板形式でのやり取りを行う

    マッチング後、掲示板形式のページで依頼者とデザイナーが、ドラフトのアップロード機能や認証機能などを使ってのやり取りを行いながら、1stドラフト~2ndドラフト~Finalドラフトと作成していくことになります。
     

サンプルプロジェクトのデモ動画がありますので、こちらをどうぞ。

気になる料金ですが、インフォグラフィックのデザインのみであれば$1,495で、18日間で納品。

インフォグラフィックの作成だけでなく、ストーリーテリングの部分もデザイナーに依頼したい場合は$2,995で、26日間で納品。

現在はパブリックベータ期間中で、静的画像でのインフォグラフィックのみのサポートとなりますが、今後はインタラクティブなインフォグラフィックや動画のインフォグラフィックにもサポートしていく予定となっており、マッチングに関してもデザイナーだけでなく、データアナリストやリサーチャー、ジャーナリストともマッチングできるような仕組みにしていくとのことですので、今後の展開にも要注目です。


アウトソーシングはデータ分析だけに留まらず。データビジュアライゼーションのアウトソーシングも主流に!?

Data_Visualization

 

先週、The Economistにデータビジュアライゼーションのアウトソーシングに関する記事が書かれました。

これまでのデータビジュアライゼーションに関するコンテストといえば「The Information is Beautiful Award」や「Data Journalism Award」のように、各組織や個人がそれぞれの目的のために作成したものを投稿する形が主流となっています。

visual.ly」のようなインフォグラフィックを投稿するサイトでも、それらはやはり自分たちが作成したもので、確かにこれまでデータビジュアライゼーションに関するアウトソーシングのことはあまり聞きませんでした。

それを考えると、以前行われたニールセンのデータヴィジュアライゼーションコンテスト(記事)は先進的事例だったのかもしれません。

ニールセンは、冒頭記事に書かれているように次の取り組みとして、The Economistと組んでINNOCENTIVEでのプロジェクトとして「The Economist-Nielsen Data Visualization Challenge」を開催しています。これも以前のコンテストと同じように、ニールセンが定期的に調査している「Global Consumer Confidence Report」(ニールセンが作成したレポート)のデータを使ったものになっています。

 

恐らく、データに関するアウトソーシングと言えば、データ分析のアウトソーシングプラットフォームであるKaggleが最初に思い浮かぶ方が多いのではないでしょうか。

Kaggleと言えばオープンした2010年当初、理系の科学者・数学者向けの予測モデル構築やアルゴリズム生成に関するコンテストが多いという印象が強かったですが、近頃はデータマイニングハッカソンや、予測モデルの中でも「EMI Music Data Science Hackathon」や「Million Song Dataset Challenge」のようなレコメンデーションエンジン構築に似たコンテスト、はたまた「Facebook Recruiting Competition」のような複雑ネットワークを使ったデータ解析など、多種多様なコンテストが増えています。

そして、更に最近になると「Harvard Business Review ‘Vision Statement’ Prospect」のような、データ解析だけでなくデータの可視化まで含めたコンテストが出てきています。

 

データ分析のプロフェッショナルであるデータサイエンティストだけでなく、そこから導き出したシナリオ(ストーリー)を可視化するインフォメーションデザイナーの人材不足も、やはり顕在化してきているようです。

このようなことから、The Economistの記事に書かれているように、データビジュアライゼーションのアウトソーシングは今後増えていくのではないでしょうか。

 

データジャーナリズムの先端を行くNYTimesのビジュアライゼーションが詰まったブログ『ChartsNThings』

The_First_Day_Pop

 

今月17日にFacebookのIPOが実施され、それに関する多くの記事が書かれました。

IPOの規模はハイテク企業で最大」「過去5年間の米大型IPOで最悪の出だし」「初週は過去10年間で(ほぼ)最悪」など、各紙それぞれの視点でその他のIPOと比較する記事が書かれています。

今回はその中で、The New York Timesがどのような視点でFacebookのIPOに関するデータ可視化を行ったのかを学びます。

過去にThe New York Timesのデータビジュアリゼーションについて取り上げた記事を書きましたが、その後もデータジャーナリズムの先駆者として多くのデータ可視化に取り組んでいます。個人的には英国ではThe Gurdian、米国ではThe New York Timesがデータジャーナリズムの先端を走っているように思います。

インフォグラフィック共有・作成サイトの「visual.ly」のブログでも1ヶ月前に「10 Things You Can Learn From the New York Times’ Data Visualizations」という記事が書かれており、データビジュアリゼーションに関わる多くの人達からも参考とされているよことがわかります。

そのThe New York Timesは今回のFacebookのIPOに関し、2400にも上る1980年以降のテック系企業のIPOとの比較を可視化しました。

このビジュアリゼーションでは5ステップで、以下のことがとてもわかり易く可視化されています。

  1. これまでのテック系IPOではGoogleが最大であった
  2. FacebookのIPOはGoogleの4倍もの規模で最大となった
  3. logスケールで表現し直し、他の企業と比較しやすくした
  4. IPO初日終了時はどうなる傾向にあるのか
  5. そして、3年後はどうなる傾向にあるのか

The New York Timesのビジュアリゼーションが詰まったブログ「ChartsNThings

このビジュアリゼーションはどのような過程で完成に至ったのでしょうか。その過程がブログ「ChartsNThings」で紹介されています。

実は、今回のFacebookのIPOに関するビジュアリゼーションに限らず、このブログ「ChartsNThings」ではThe New York Timesで記事となるビジュアリゼーションがどのような過程で作成されたのか事細かに説明されています。

スケッチのみの場合もあれば、チャートやグラフを使用する場合はRを使ったデータ分析や可視化をしたり、D3などのチャートライブラリなど利用したりと、目的に応じて多種多様な手法が使われていることがわかります。

今回の場合ですと、IPOから3年後どうなるかというビジュアリゼーションでは以下のものが最終形態として作成されています。

今回のビジュアリゼーションを担当されたAmanda Cox氏はこちらの方がスマートであるとしていますが、オンラインではブラウザのスペースも限られ、10秒でわかるようにということで今回のものを作成されたということです。

このように、このブログではデータジャーナリズムの先端を行くThe New York Timesのデータ可視化の様々なTipsが満載です。常に読者のことを考えたデータ可視化は大変勉強になるので、是非こちらのブログを購読してみてはいかがでしょうか。

1年の天気情報とソーシャルメディア上の感情を1枚に可視化したチャート「Weather chart C°F」

Weather_Chart

 

オランダにあるデザインスタジオ「CLEVER°FRANKE」は、アニュアルレポートとして毎年この時期になると、全てのクライアントとのプロジェクトを止め、このレポート「Weather chart C°F」の制作に集中して取りかかります。今年で3回目のレポートとなり、過去2年のアウトプットも彼らのworkから見ることができ、今年のものと共にポスターとして販売されています。

このデータ可視化のアイデアが浮かんだきっかけは、このデザインスタジオが初めに入居した建物のすぐ隣りにオランダ気象研究所があったことからだそうです。

今年は過去2年のレポートと毛色がガラっと代わり、天気とソーシャルメディアの感情の相関を可視化することが目的となりました。

そして、先ほど名前の出たオランダ気象研究所からの公式レポートと、天気について語られていたソーシャルメディア上の714,843個ものメッセージを比較し、この1つのラジアル図(放射状チャート図)で可視化しています。

下図の凡例にあるように、この360度の円に日々の気温、降水量、日照時間、風速、10段階の天気評価(Weather Rating)、ソーシャルメディア上の総量とArtificial Intelligence Appliedで分析したポジネガをプロットし表現しています。

この1枚では詳細な相関がわかりにくいため、それぞれの凡例とソーシャルメディア上の感情の相関を見た結果などがこちらの詳細PDFにあります。

結果として、以下の様なインサイトが言えることがわかりました。

  • 天気に関してのつぶやきはウィークデイ(月~金)で朝の7時~8時が最も多い
  • 天気に対してポジティブな時より、ネガティブな時の方が圧倒的に多く反応がある
  • ソーシャルメディア上の感情と一番強い相関があるのは日照時間である

こちらはオランダでの結果ですので、日本での天気とその期間のソーシャルメディアデータを分析してみると、また違った結果が出るかもしれません。

結果としてはそれほど衝撃的なものではありませんが、もし当然の結果が出たとしても、それは実際にデータを分析して可視化したからわかったことで、説得力を持っています。また、自分にとっての当たり前も他人にとっては当たり前ではないかもしれません

このような分析結果は、二次情報ではありますが蓄積しておくと役に立つ日が来るかもしれません。特に自分の興味範囲のデータはEvernoteなどの外部脳を使って、イザという時に検索できるようにしておくことをオススメします。

最も生まれた人が多い日はいつ?生まれた人の多い誕生日ランキングをヒートマップにしてみた

How_Common_Is_Your_Birthday-_Japan_ver.

 

※追記。先程知ったのですが、ロケットニュースさんでもIDEA*IDEAさんでも取り上げられていてバズってますね。この記事はその日本版です。

先週、データジャーナリストのMatt Stiles氏が、アメリカで生まれた人の多い誕生日ランキングをヒートマップで可視化したものをブログ「The Daily Biz」で公開したところ、TwitterやFacebookで話題となりました。

日本でも7月~9月生まれが多いという話をよく聞くので、月別に見た傾向はさほど違いがないのかな、と思いましたが日別に見るとどのような違いがあるのでしょうか。

既にまとめられた情報がないかなと探したところ、テレビ朝日「シルシルミシル」が2011年5月4日に厚生労働省の統計データ(1981年~2010年)を使った誕生日ランキングを放送したそうで、それをまとめたブログ記事を書かれた方がいたので、そのデータを参考に私もヒートマップを作成してみました。

Matt Stiles氏はRとIllustratorを使って可視化していますが、BIコンサルタントのAndy Kriebel氏がインスパイアされてTableau Publicで作成したものをブログで公開し、同じく話題となりました。

今回は、私も先ほどの厚生労働省のデータを使いTableau Publicでヒートマップを作成しました。マウスカーソルを日にちの上に持っていくとその日のランクが表示されます。もっと大きくキレイに見たい場合はこちらをどうぞ。

やはりランクが高い日は7月〜9月に集中しているところはアメリカと近い傾向が出ていますが、ランクが高い日の間にランクが低い日が入っている場所がアメリカと比べて多いことがわかります。

アメリカは7月4日が独立記念日のため、ランクが高い日の多い7月の中でもこの近辺だけが低くなっています。アメリカでは全州が休みとなるナショナルホリデーが少なく、州ごとに異なっていたり、月曜固定のために毎年日にちが異なっているために、このような傾向が少なっています。

一方、日本はハッピーマンデー制度によって2000年以降は曜日固定の祝日が増えていますが、まだ日にち固定の祝日が多く存在しています。

ヒートマップを見てみると、明らかに国民の祝日や、休みがよく取られる正月三が日や8月15日前後のお盆休みでの出産が避けられ、その前後での出産が多いことがわかります。

また、4月1日のランクが低いことも、4月2日生まれから学年が変わるために出産を遅らせているという日本特有の特徴ではないでしょうか。

その他にも、ヒートマップで可視化したことによってテキストで見るよりもわかることが多くあります。もちろんヒートマップではなく別の見せ方にするとまた新しいことがわかるかもしれません。

日本版Data.govが本格的に始まれば、このようなデータを簡単に取得し可視化することができるようになるので、このような情報がどんどんインターネットで共有されるようになるでしょう。