Archive - 4月 2012

データジャーナリズムから学ぶ、データからのストーリーテリング。データジャーナリズムに関する初めての教科書「Data Journalism Handbook」がリリース!

djh

 

下記のITジャーナリストの佐々木俊尚さんの以下のツイートや、Wired.jpでのジャーナリストの津田氏による発言などにより、データジャーナリズムは欧米だけでなく、日本でも次第に知られるようになってきています。

 

前記事の日本版Data.govが2013年度に公開されれば、データジャーナリズムは更に日本で一般的になるでしょう。

データジャーナリズムはいつ生まれ、どのような経緯でここまで一般的な言葉になったのか、簡単に調べてみました。

 

以下はGoogle Insights for Searchで「Data Journalism」と「”Data Journalism”」を検索してみたものです。2008年7月と2010年8月に何かのきっかけがあったことがわかります。 

この2つの違いは、前者が”Data”と”Journalism”の語順などは関係なしに検索された場合で、後者が”Data Journalism”という一つの言葉として検索された場合です。要するに、前者は「ジャーナリズムとデータに関連すること」が検索されており、後者はデータジャーナリズムそのものについて検索されているものになります。

ということは2008年7月に、「ジャーナリズムにデータが必要だという何かのきっかけ」があり、2010年8月に「データジャーナリズムという言葉が広まったきっかけ」があったのではないかと考えました。

 

GeekによるジャーナリズムへのITの応用

まず、2008年7月に何があったのでしょうか。

元々はWeb Developerであり、2005年にGoogle Mapとシカゴ警察の犯罪データをマッシュアップしたサイト『chicagocrime.org』をローンチし、2005年の「 Batten Award for Innovations in Journalism」を受賞したAdrian Holovaty氏がinternal Guardian conferenceで以下のようなスピーチを行なっていたことがわかりました。

@ Future of Journalism: Adrian Holovaty’s vision for data-friendly journalists

データジャーナリズムという言葉はこの記事には出てきていませんが、「未来のジャーナリズム」と題して、データ志向のジャーナリスト「データジャーナリスト」について公共データにも触れながら語っています。

オープンガバメントの重要性についてはそれ以前から語られていましたが、特に政府・行政の保有するデータ公開の重要性については、この記事を書いているthe Gurdianは2006年からキャンペーンを行なっていた(参考記事)そうで、恐らくこのスピーチが「ジャーナリズム×オープンデータ」について広まったきっかけだったのではないかと推測します。

 

TED × データジャーナリストのDavid McCandles氏

そして「データジャーナリズムという言葉が広まった」2010年8月には何があったのでしょうか。

恐らく、データジャーナリストとして著名なDavid McCandless氏によるTEDでのスピーチ「The beauty of data visualization」により、情報の可視化がジャーナリズムにも必要だということを広めるきっかけとなりました。(日本語字幕もあります)

時折ユーモアを交えながら、大量のデータから重要な情報を抜き出し可視化をして伝えることの重要性を、例を交えて説明されています。

David McCandless氏はスピーチの始めに次のように述べています。

情報の可視化は重要なパターンや関連を見えるようにし、情報にデザインを与えることで意味が引き立ち、ストーリーが伝わり、重要な情報だけに集中できるようにする。

大量データの時代にあり、ビッグデータからどのように有意な情報を発見するか、という話題ばかり出ていますが、その情報から何が言えるのかを説得力を持って説明するためには、インフォメーションデザインは大事なスキルであると言えます。

動画を見る時間がない方は、こちらに動画に使われた画像とともにスピーチが日本語訳されたものがあるのでどうぞ。

 

「Data Journalism Handbook」がリリース!

そして、2011年12月から今日までグラフは急上昇し続けています。

以下2つの出来事もその要因であると思われます。

1つ目がGoogleが協賛しているGlobal Editors Networkによるデータジャーナリズムコンテスト「Data Journalism Award」の開催です。ジャーナリズムのニューカマー・新組織の発掘を目的として2011年12月に概要が発表され、4月27日に58のノミネートプロジェクトが発表されたばかりです。

そして2つ目が、今記事の目玉となる「Data Journalism Handbook」が作られるきっかけとなったMozilla Festival 2011の開催です。

データジャーナリストのリーダーが多数所属しているOpen Knowledge Foundationと欧州ジャーナリズムセンターのメンバーが、データジャーナリズムについての教科書である「Data Journalism Handbook」の作成を発表しました。これまでデータジャーナリズムに関する書籍はまだなく、データジャーナリズムの基本から学べる初めての書籍となります。

書籍は2012年4月待つに行われるInternational Journalism Festivalでリリースされ、後にWeb上で無料公開されることになりました。

[vimeo width=”550″ height=”400″]http://vimeo.com/31940484[/vimeo]

 

そして昨日、予定されていたとおりData Journalism Handbookインターネット上で無料公開されました。e-book形式で、改定される度にアップデートされるので、是非登録もされておくことをオススメします。

e-bookだけでなく、紙の書籍もO’REILLYから5月に出版され、O’REILLYAmazonでも予約が始まっています。

 

様々なデータが入手できる今、情報が多い分、報告書に全てを盛り込みたくなる気持ちは理解できます。分厚い報告書を前にして作成者は満足感を得られるかもしれません。しかし、本当に大事なことはそれらのデータから何が言え、どうするべきなのかということです。

おそらく、報告書にはサマリーとしてそれぞれの調査結果から言えるポイントを列挙しているでしょう。しかし、そのポイント同士を繋げ線にしなければ結局その報告書から何が言えるのかがわかりません。そこでストーリーテリングの要素が必要になります。

ジャーナリストでなくとも、様々な調査結果などから報告書を作成する機会のある社会人の方々は、「Data Journalism Handbook」でデータからのストーリーテリングを勉強してみてはいかがでしょうか。

 

日本版Data.govへ大きな一歩!統計APIを公開へ。

OpenGovernment

 (via Wordle)

あまり話題になっていないようですが、日本のオープンガバメント(Gov 2.0)に関する素晴らしい情報が入ってきているので共有します。

(オープンガバメントに関して詳しい方は途中を飛ばして読んでください)

 

近年、特に欧米諸国ではインターネット(IT)を活用することで、積極的な政府情報の公開や行政への市民参加を促進する「政府のオープン化」が進んでいます。

米国では、2009年にオバマ大統領がオープンガバメントに関する覚書にサインして以降、政府主導により様々な取り組みが行われています。(政府の公式ブログ

その中で日本はと言うと、経産省が2010年7月にオープンガバメントの実証実験を行うオープンガバメントラボをオープンしましたが、現在まで目立った進捗はなく、震災後の助け合いジャパンiSPPに代表されるような民間からの働きかけがあった時に話題になる程度です。

 

オープンガバメントの代表格「Data.gov」

米国のオープンガバメントに関する取り組みの中で代表的なものと言えば、政府機関が保有する情報・データを入手できるサイト「Data.gov」です。

このサイトでは、単に統計データの集計結果を公表しているのではなく、ローデータを様々な形(CSV、JSON、PDF、RDF、RSS、XLS、XML)で取得可能となっており、利用者が自由に取得・加工・分析することができるようになっています。また、このData.govの構築に関わったSocrata社による「Open Data API」を利用することによってAPI経由での取得も可能です。

このData.govと同じようにオープンデータとして公開している国は、現在30カ国(韓国も、アフリカではケニアも)ありますが、残念ながら日本にはまだありません。

 政府以外で、このオープンデータに関する取り組みを行なっているのが、データ版のWorld Wide Webと言えるLinked Dataに取り組む方たちで、Linked Open Data(LOD)のデータソースの一つとして、政府の持つデータを絡めた取り組みも行われています。

 
 
 
 

日本版「Data.gov」への大きな一歩。統計API公開。

これまで、日本版Data.govへの動きがなかなか見られませんでしたが、総務省による中小企業のクラウドサービス普及に向けた団体「クラウドテストベッドコンソーシアム」により、総務省所管の統計センターが保有するデータをAPIを通じて公開する「統計API」を2013年度に公開する計画があるということです。

こちらの記事(日経コンピュータDigitalに登録者のみ全文閲覧可能)か、日経コンピュータ購読者であれば2012年4月12日号の16ページを参照していただきたいのですが、記事にはこう書かれています。

総務省や経産省が目指しているのは、米連邦政府が2009年に開設した行政データの公開サイト「Data.gov」の日本版だ。

今後の動きはこうです。

  • 2012年4月、開発済みの統計APIを中小企業約60社へ試験的に提供(まずは53種類のデータから)
     
  • 2012年5月、経済産業省がITベンダーやユーザー企業と行政データの活用方法を議論する「IT融合フォーラム」(仮称)を発足
     
  • 2012年6月、政府の高度情報通信ネットワーク社会推進戦略本部(IT戦略本部)がデータ公開に必要な個人情報の保護やデータの権利処理方法の基準案を公表(医療や警察関連の行政データも公開検討)
     
  • 今夏、450種類以上ある政府統計の全てのデータをAPIで公開できるよう、統計センターが総務相に2013年度からの事業計画を申請

 

APIの詳細な仕様などについての資料は、当コンソーシアムのHPで公開されているので、興味ある方は読んでみてください。

これまでほとんど情報が出てきていなかった日本版Data.govへの取り組みですが、個人的には今回公表された情報にはワクワクしています。

今後の私のミッションとしては、このAPIが中小企業だけでなく全てのユーザーにオープンになった時、それぞれのユーザーがどのようにこれらのデータを活用できるか、情報を随時キャッチアップしながら考えていこうと思います。