Daten sind der Treibstoff des Journalismus

Daten sind ein Rohstoff. Diese Einsicht ist ein geflügeltes Wort, spätestens seit der Werbefachmann Michael Palmer 2006 schrieb: „Daten sind das neue Öl.“ Palmer postulierte im Bild dieser Metapher, dass unbearbeitete Daten wertlos seien. Erst wenn sie bearbeitet würden, entstünden aus ihnen nützliche Produkte, so wie aus Öl Plastik, Dünger oder Benzin gemacht wird.

Im gleichen Jahr schrieb der amerikanische Journalist und Programmierer Adrian Holovaty einen wegweisenden Text mit dem Titel „A fundamental way newspaper sites need to change„.  Seiner Meinung nach sollten sich Zeitungen und andere Medien nicht nur auf Geschichten konzentrieren. Sie sollten viel mehr Informationen unter dem Aspekt betrachten, wie ihr Inhalt sich in strukturierter Form, also in Datenbanken, ablegen lässt. Dann, so Holovaty, könnte aus Geschichten auf Dauer ein Mehrwert abgeschöpft werden. Denn solche strukturierten Informationen können mit anderen Datenbanken verknüpft und automatisiert abgerufen werden. Und mit ihnen können wiederum publizistische Angebote angereichert werden – aufbereitete Daten als Dünger des medialen Feldes.

Weiterlesen im Open Data Blog auf ZEIT Online.

Journalistenhanduch Universalcode: Kapitel Datenjournalismus

Seit vergangenem Jahr wird an dem Handbuch „Universalcode – Journalismus im digitalen Zeitalter“ gearbeitet. Ulrike Langer und Christian Jakubetz hatten 2010 das Vorhaben angeschoben. Anlass war, dass es im deutschsprachigen Raum kein entsprechendes Werk rund um zeitgemäßen Onlinejournalismus gibt. Mittlerweile liegen rund 750 Bestellung des Buches vor und es geht bald in den Druck (24,90 EUR – Kauf per Klick auf den Warenkorb oben rechts im Widget); neben der Printversion wird es auch günstigere elektronische Ausgaben geben. Reich wird damit niemand; Herausgeber wie Autoren arbeiten ehrenamtlich. Aktuelles zum Buch ist bei Christian Jakubetz zu erfahren.

UPDATE (4.8.11): Die derzeitige Version der Vorschau im Widget enthält die unten genannten Artikel nicht mehr.

Zusammen mit Ulrike Langer von medialdigital habe ich das Kapitel über Datenjournalismus verfasst. Es lässt sich im folgenden Widget komplett lesen (ab Seite 10) oder hier in etwas größer und auf Doppelseiten. Ab Seite 37 findet sich der lesenswerte Beitrag von Marcus Bösch über „Mobile Reporting“.

Datenjournalismus auf der re:publica 2011

 

Zusammen mit Daniel Dietrich vom Open Data Network habe ich den Track re:open auf der Netzkonferenz re:publica 2011 in Berlin vorbereitet. Daniel hat hier einen Überblick über alle Veranstaltungen rund um OpenData und Datenjournalismus aufgelistet. Ich möchte den Datenjournalismusteil detaillierter beschreiben und auf einige andere Vorträge außerhalb des Tracks verweisen. Manche werden auf Englisch gehalten.

Die folgenden vier Veranstaltungen  finden am Mittwoch, den 13. April, im kleinen Saal der Kalkscheune statt. Sie werden nicht live per Stream verfügbar sein.

Datenjournalismus auf der re:publica 2011 weiterlesen

"Open Data is about Data Democracy"

A few weeks ago, Chris Taggart from OpenlyLocal in the UK gave an interesting presentation. He was attending an event in Berlin: ePSI platform: Open Data: Apps for Everyone? Taggart aka @countculture spoke about how the hyperlocal site came into being in 2009, originally planned as a datajournalism project. In the end  he gives a kind of utopian notion about how a data driven democracy could look like. He is going to present in Berlin again in April at the re:publica 11. Find his blog here.

[display_podcast]

This is a partial transcript:

„I had no desire to spend my hours with programming and messing around with data. Actually I wanted to do some data journalism. And I thought lots of people are looking at government data – let me look at local government data. […] It was supposed just to be a tiny little project. It started off with twelve councils, trying to scrape of their websites. The basic stuff: Who the councilors are, which comittees they sit on. What were the meetings of these comittees. I wasn‘t even going to do a website at first. It just going to be data. Maybe just an API with one page describing how to use it. Then I thought maybe I put a few pages up there. […]

"Open Data is about Data Democracy" weiterlesen

Übersicht: Datenjournalismus im Februar 2011

Hier im Blog war es einen Monat lang still. Es gab viel zu tun. Vor allem die Arbeit an der Vorratsdatenanwendung war zeitintensiv. Zumindestens im Nachhinein soll hier aufgelistet werden, was im Februar rund um Datenjournalismus Bemerkenswertes los war.

Media companies must become trusted data hubs: Drei Datenjournalisten haben zusammen ein lesenswertes programmatischen Text geschrieben. Er dokumentiert recht gut, was das Geschäftsmodell für Datenjournalismus sein kann. Und vor allem, welche mögliche neue Rollen der „Presse“ und Journalisten zukommen können: Sie sollten in den „Trust market“ investieren, auf ihre Rolle als vertrauensstiftende Institution setzen und zuverlässig Fakten und Informationen liefern. Also nicht weiter beim Wettlauf im „Attention market“ mitmachen, dem ewigen Kampf um Aufmerksamkeit teilnehmen.

Vorratsdaten-App: Etwas Making-off zu der Vorratsdaten-Anwendung findet sich im OpenData Blog auf ZEIT Online. Oben ist ein Mockup aus der Konzeptionsphase zu sehen. Von den ganzen Schaltern/Filtern verabschiedeten wir uns recht bald – sehr aussagekräftig wäre diese Funktionalität nicht gewesen. Übersicht: Datenjournalismus im Februar 2011 weiterlesen

Fluglärmkarte BBI: Making of

Abb. 1: Die fertige Fluglärmkarte

[Leider ist die Karte seit dem Relaunch von taz.de nicht erreichbar – Anfragen deswegen bitte an die taz richten – Stand: 22.10.13]

Der Ärger um den Fluglärm, den der neue Flughafen BBI südlich von Berlin mit sich bringen wird, kocht seit vergangen September hoch. Bei der Kontroverse spielen Datensätze eine zentrale Rolle: Einmal Geodaten – die Flugrouten – sowie die Zahlen zu der absehbaren Lärmbelastungen. Während die Routen recht einfach auf einer Karte darstellbar sind, ist Lärm schwerer zu visualisieren. Was als laut wahrgenommen wird, ist bis zu einem gewissen Grad auch subjektiv. Den einen droht tatsächlich – anderen vermeintlich – eine Beeinträchtigung der Lebensqualität durch den neuen Fughafen. So lässt das Thema die emotionalen Wellen hochschlagen.

Vor diesem Hintergrund war die Idee, den zu erwartenden Fluglärm  faktenbasiert in einen verständlichen Zusammenhang zu setzen. Das „Mapping“ der Daten auf ihren Ort, sprich die Kartendarstellung, dürfte – so war unsere Hoffnung – recht abstrakte Zahlenwerte in Tabellen verständlicher machen. Für den Kunden Taz, der die Anwendung schließlich in sein Onlineauftritt integrierte, waren zwei Aspekte interessant: Das Thema würde mindestens noch ein Jahr aktuell sein, da die Planung der Routen durch die Deutsche Flugsicherung (DFS) nicht abgeschlossen war. Und nicht zuletzt dürfte es auch im Landtagswahlkampf Berlins eine Rolle spielen. Insofern war es essentiell, dass die Karte updatebar ist, also neue Flugroutenentwürfe/-pläne sowie Lärmstudien integriert werden können.

Darüber hinaus dürfte die Anwendung als „Linkbait“ dienen: Die entsprechende Website dürfte viel verlinkt werden und Besucher auf die Seite bringen, die sonst die Seiten der Zeitungen nicht besuchen. Auf dieser Überlegung beruht auch das Feature, einige Artikel der Zeitung zum Thema mit unmittelbaren Ortsbezug über ein Icon in der Karte zugänglich zu machen.

Fluglärmkarte BBI: Making of weiterlesen

Datenjournalismus und die Zukunft der Berichterstattung

Innerhalb eines halben Jahres hat sich das vormals exotische Thema Datenjournalismus zu einem ernstzunehmenden Genre gemausert. Es ist zwar weiterhin eine spezielle Nische, die sich zwischen Infografik und Multimedia-Storytelling behaupten muss. Aber 2011 dürfte deutlich werden, dass diese Nische ein wichtiges Alleinstellungsmerkmal für Onlinejournalismus werden kann. Auch in dem Zusammenhang sollten Zeitungsverlage und Medienhäuser endlich aktiv für Netzneutralität, Informationsfreiheit und OpenData eintreten:

Klickstrecken, „Bewegtbild“, Podcasts und so weiter sind nur Remixe althergebrachter Medienformate. Datenjournalismus dagegen setzt auf Datenbanken und Interaktivität, die nur im Browser oder einer App funktionieren können. Er bohrt die Möglichkeiten auf, die über den Rahmen herkömmlicher Infografiken hinausweisen: data-driven journalism ist nicht nur Recherche sondern auch Veröffentlichungsformat; es kann Lesern Recherche-Umgebungen bieten, die den Einstieg in große Datensätze ermöglichen und diese dabei gleichzeitig in den Kontext klassischen Journalismus‘ setzen: Berichterstattung, Hintergrund, Analyse, Reportage.

Datenjournalismus grenzt sich vom althergebrachten CAR (computer-assisted reporting) ab, das rein auf Seiten der Recherche passiert. Letztlich meint Datenjournalismus ja immer auch die Bereitstellung der Rohdaten, bestenfalls im Sinne von OpenData in offenen maschinenlesbaren Formaten.

Datenjournalismus und die Zukunft der Berichterstattung weiterlesen

Was tun mit der kommenden Wikileaks Veröffentlichung?

wikileaks tweet november 2010

Seit gestern zeichnet sich ab, was die angekündigte nächste Veröffentlichung von Wikileaks zum Inhalt haben könnte: „Next release is 7x the size of the Iraq War Logs. intense pressure over it for months.“

Laut einem Bericht von Bloomberg würden die New York Times, der Guardian und der Spiegel bereits an Dokumenten aus dem Außenministerium der USA arbeiten. Demnach erwarte man seitens der US-Regierung, dass bereits ab dem 26. November (morgen) hundertausende Korrospondenzen aus dem internen Schriftverkehr von diplomatischen Einrichtungen etc. veröffentlicht werden könnten. Seitens Wikileaks ist die Rede von der siebenfachen Menge der Irak-Tagebücher  (390.000 Einträge) – also insgesamt rund 2,7 Millionen Datensätze.

Was ist zu erwarten?

  1. Es ist unklar, ob der gesamte Datensatz nach Veröffentlichung allen unmittelbar zugänglich gemacht wird – bei den Afghanistan Tagebüchern war es so, bei den Irak Tagebüchern nur über spezielle Seiten.
  2. Wikileaks unter Ägide von Julian Assange mag zur martialischen Sprache neigen („new world, where global history is redefinend“) – aber bislang war sich auf die Ankündigungen der Organisation zu verlassen. Die Administration in den USA scheint offenbar zu wissen, zumindest in Teilen,  um welche Datensätze es sich handelt und bereitet sich auf stressige Zeiten vor. Und unwahrscheinlich ist es nicht, dass Wikileaks weiterhin auf die Medienpartner NYT, Guardian und Spiegel setzt, mit denen bereits zweimal offenbar verlässlich zusammengearbeitet werden konnte.

    Was tun mit der kommenden Wikileaks Veröffentlichung? weiterlesen

Tauchgang im Echtzeit-Web: Erfahrungen mit der Castor Twitter LiveMap

livemap

Erkenntnisse und Schlüsse aus einem Experiment mit dem Echtzeitnetz

Was war die grundlegende Idee der Live Twitter Map zu dem Castortransport? Gregor Aisch und ich haben versucht eine Anwendung zu bieten, die nahezu in Echtzeit den Social-Media-Kanal Twitter sowohl mit einem thematischen als auch geografischen Bezug abbildet.

Dafür, dass die LiveMap in wenigen Tagen vor dem Castortransport entstand, sind wir sehr zufrieden. Mehr als 30.000 eindeutige Besucher haben die Karte bislang genutzt; was eigentlich als „proof of concept“ gedacht war, erweist sich als praxistaugliche Anwendung. Die Einbettung durch taz.de, die in der Seitenleiste ihres vielbeachteten Castortransport-Tickers darauf hinweist, brachte bislang weit mehr als 10.000 Besucher nur von dort.

Entwurf der Anwendung

Die Stärke der Karte, das muss eingeräumt werden liegt weniger in ihrer Live-Funktionalität. Die klappt manchmal nicht reibungslos. Doch die Archivfunktion wird auch in der kommenden Zeit einen nützlichen Überblick bieten, wie sich die Situation im Wendland und an der Transportstrecke entwickelte: Es lässt sich im Nachhinein in die Situationen eintauchen; Nachrichten von vor Ort dank der GPS- Funktion lesen und eben viele Tweets aufrufen, die sich auf castorrelevante Ortsangaben bezogen.

Was haben wir gelernt?

Sicher lässt sich die App noch ausbauen, der ein oder andere Bug (Programmierfehler) ausbügeln und die Usability erhöhen. Tauchgang im Echtzeit-Web: Erfahrungen mit der Castor Twitter LiveMap weiterlesen

Datenjournalismus bei den US-Wahlen

Außer Wetterdaten gibt es wohl kaum einen Datensatz, der von so großem unmittelbaren Interesse ist wie Wahlergebnisse. Nicht nur wegen ihres politischen Gewichts sind das sehr spezielle Datensammlungen. Ihre Erhebung gleicht bei großen Wahlen einer logistischen Meisterleistung – Millionen von Menschen, die zeitgleich in ihrer Nachbarschaft Daten produzieren, die anschließend innerhalb kürzester Zeit ausgewertet und zentral zusammengetragen werden müssen. So groß ist das Interesse, dass am Wahlabend alle Medien darum wetteifern, die besten Prognosen und Vorauswertungen der ständig wachsenden Datenbasis zu liefern.

Neben eher klassischen Darstellungen der Wahlergebnisse waren rund um Wahltag in den USA online neue Herangehensweisen in der Berichterstattung zu beobachten. Es folgt eine kleine Auswahl dieser Formen des Datenjournalismus‘.

Weiterlesen im OpenData Blog auf zeit.de