これからのジャーナリズムはデータ主導型であるべきだ

アマゾンの創始者ジェフ・ベゾスがワシントン・ポストの買収に2億5千ドルもつぎ込んだのは、ただの道楽かチャリティー活動の一環だと誰もが思っているようだ。また、今後どうやって新聞を発行していくつもりなのか?という疑問の声もあがっている。

8月に開催したReadWriteMixのイベントに技術系の投資家キース・ラボワを招待したのだが、それを機にこの問題について再考することとなった。これからの時代、物事の価値というものはどこで生み出されるようになるのか、という問いについてラボワに意見を求めたところ、彼は「データ・サイエンスだ」と答えたのである。

言い換えれば、進化と改善の連続的なサイクルの中で製品、事業、産業を再形成するために必要なのは、処理能力や通信速度、ストレージの増大によってもたらされる単なるデータの蓄積ではなく、そのデータを使いこなす優れたアプリケーションだということだ。

ベゾスが富を築いた技術の世界においては、製品を改善し新しい機能を導入するために、人々がその製品をどのように使っているかを示すデータを利用するのが当たり前である。
同じことをメディアの世界でもやってみたらどうだろうか?鼻で笑ったりせず、歯を食いしばりもせず、作業の膨大さを軽んじることもなく、そのデータの利用とやらをやってみたら?

「データ・ジャーナリズム」には新しい定義が必要だ

「データ・ジャーナリズム」という言葉はこれまで、「公開されているデータセットを駆使して報道を行うこと」という狭義の解釈がなされてきたが、これは次の2つの点から考えて完全に不十分である。

まず初めに、良いレポーターであるためには、情報を厳しく吟味し分析するのに正しい情報のすべてのソースを使うこと、またすべての利用可能なツールを使うことが不可欠である。これにはデータベースと、データベースを管理し解析するためのツールが含まれる。これを「データ・ジャーナリズム」と呼ぶ必要はない。ジャーナリズムそのものだからだ。

2番目に、報道は確かに必要だが、ジャーナリズムの役割を果たすにはそれだけでは足りない。レポーターには仲間が必要だ。編集者、カメラマン、それにデザイナー。オンライン・メディアであれば、これにプロダクトマネージャー、技術者、データサイエンティストも加えようではないか。データは製品が生み出される全工程に渡って提供されなければならない。

データ・ジャーナリズムの概念も変わってきており、地方自治体のデータベースから発信される超ローカルなレポート、といった非常に狭い意味合いになってしまっている。これはこれで称賛に値する取り組みではあるのだが、せっかくの素晴らしいアイデアをこんなにも小さい、それほど重要でもなさそうな目的に使って良いものだろうか。

誤解しないでもらいたい。私はインタラクティブ・マップに展開されたレストランの保建衛生調査報告は好きなのだ。ただ我々にはジャーナリストとして、自分たちが持っているデータを使ってやるべきことがもっと他にあるだろうと言いたいのである。

読者の対話が不可欠だ

では、そのデータとは一体何を指すのか?もちろん読者の反応である。我々の記事を読み、コメントし、シェアするという彼らのリアクションのことだ。我々が配信する全ての記事は大量のデータの痕跡を残す。しかし我々はその大半を、晴れた午後のサンフランシスコの霧のように消散させてしまっているのだ。

例をあげよう。ある日私は解析ツールの一つであるチャートビートをチェックしていて、ちょっと前の記事のトラフィックが跳ね上がっていることに気が付いた。それはアップルのiOS7ベータ版からiOS6にOSをダウングレードするという内容の記事だった。誰もが今月末にiOS7がリリースされることを予期していたから、なぜ突然その記事が興味を引いたのか理由が分からなかった。ベータ版のテストで予期せぬ不具合が起きたのでもない限り。

ReadWriteのレポーター、セレナ・ラーソンとアドリアナ・リーが調査を開始し、一般ユーザーが開発者と同様に影響を受け、電話を使えなくなってしまったという事実を突き止めた。我々はすぐさま、アップルが開発者でないユーザーをベータ版から締め出しているという陰謀説の誤りを正した。(技術的には、登録された開発者のみがiOS7にアクセスするべきなのである。しかし、意思あるところにはデジタルの道は開けるのだ。)

さらに我々は、期限切れのベータ版の旧バージョン、原因不明な自動更新の失敗、ユーザーにダウングレードを強いることとなったアクティベーションサーバーのサービス終了等についても究明を行った。

モバイル担当編集者のダン・ロウィンスキは、このベータ版のリリース方法を分析する追跡調査を行った。昨年、モバイルソフトウェア・エグゼクティブのスコット・フォーストールがアップルを追放されて以来の大仕事だった。

読者の声を聞き、行動を知る

読者の声を聞くことは、編集者に手紙が届くようになった頃からずっと続いている。新しく登場したのはウェブ解析で、これによって長い間慣れ親しんできた顕在的な対話と同じくらい興味深い、潜在的な対話が可能となった。

なぜ人々は記事を読んだのか?どうやって記事を見つけたのか?それについてどう思ったのか?これらは読み書きの誕生以来ずっと、語り手を悩ませ続けてきた基本的かつ人間的な問いである。特に目新しいものではない。

ただ、この時代の我々は答えを得るのにもっといいツールを手に入れたというだけのことである。使っていればの話だが。

出版業界では分析論が酷評されているが、それはその使用法が間違っているからである。Demand MediaとHuffington Postがいい例だ。例の悪名高い見出しのことを思い出してほしい。アクセス数を稼ぐために、「スーパーボールは何時に始まるのか?」などという質問が見出しになったのである。

The Onionの皮肉なライターも、マイリー・サイラスがMTVのVideo Music Awardsで行ったひどいパフォーマンスをCNNがトップ記事で特集したことを取り上げて、分析競争を批判している。もちろんこれはパロディーなので、CNNデジタルの本当の管理編集者はTwitterで「私はこんな記事は書いていない」とつぶやくことになった

データの力は編集者が握るべき

SEO対策と短期間のページビュー追跡に明け暮れていては、データは間違った人間の手に渡ってしまうと主張したい。人間よりもアルゴリズムに興味があるエンジニア、金の亡者のインターネットご都合主義者、あるいは執筆に追われて参っている働き過ぎの編集者といった人たちの手に。

この業界で必要なのは(少なくともReadWriteで努力しているのは)データへの卑しい執着ではなく、我々の読者である実在する人間の代弁者たるデータへの興味である。数的指標に埋もれているのは彼らからのシグナルだ。コミュニケーションを望み、手を伸ばして結びつこうとする彼らのこうした試みこそが、より良い記事とより良い表現にむけて我々を導く指針となるのである。

確信を得るためには、もっと適切な数的指標が必要だ。ページビューは、筆者と読者の相互関係を示す最も大ざっぱな近似値に過ぎない。読むのにどれだけ時間をかけているのか、ページをどのくらいのペースでスクロールしているのか、続けて読んでいるのか、段落の間を行ったり来たりしているのか、リンク先を辿ったあとに戻ってくるのか、それともどこかへ行ってしまうのか?

また、彼らはどうやって記事を見つけたのか?検索ワードを見てみるのもいいが、疑問が増えるばかりで答えは出てこない。そこから読者の興味と情熱について何が分かるのか?読者はテーマのどこに疑問を抱くのか?読者が既に知っていることは何か?記事を読み進めていくうえで必要となる知識は何だろうか?

とはいえ、データが全てではない

公の場で話すとき、私は聴衆の反応を見るようにしている。前のめりになっているか、ふんぞり返っているか、瞳をキラキラさせて聴き入っているか。彼らの反応を受け取ることで、より良い仕事ができるのである。

オンラインでも同じことだ。少なくともそうでなくてはならない。分析は耳をすますためのツールである。読者のデータは彼らの反応だ。整然と整理されたものではないが。

しかし、新たに踏み入ろうとする分野について考えるような場合、過去のデータに惑わされるべきだろうか?そのデータは的確な追求の助けになるだろうか?最初に計画していたよりも、トピックをより深く掘り下げる気持ちにさせてくれるだろうか?これらはすべて、データがジャーナリズムに影響を及ぼし得る有効な手段だと思う。

最終的に必要なのは、自分の出版物の立ち位置がどこであるか、ジャーナリストとしての自分が何者であるか、という点に関する明確な意図である。そのような強い磁力がなければ、データはどこにも導いてはくれない。誰に届けたいのか、彼らのために何をしたいのかが分かっていれば、目的地に向けて旅をする際にデータが地図を埋める手助けをしてくれることを、私は信じて疑わない。

Pocket