Datenjournalismus: Folien zu der re:puclica Session

Auf der re:publica habe ich eine Einführung in das Thema Datenjournalismus gegeben. Gut 20 Leute hörten zu. Das in der Präsentation angeführte Beispiel über die Anzahl der gefallenen Bundeswehrsoldaten in Afghanistan war nicht sehr gut gewählt. Nicht wegen dem Thema, aber wegen mangelnder Tiefe durch den geringen Datensatz und die damit einhergehende Probleme bei der Visualisierung und dem geringen Erkenntnisgewinn. (Über die ungeeigneten Grundeinstellung der Google Motion Chart (Gapminder-Derivat) schreibt auch Christiane Schulzki-Haddouti in ihrer lesenswerten OpenData-Serie für Zeit Online in Sachen Parteispenden.)

Interessantes Feedback gab es jedenfalls; sicher richtig war die Anmerkung, dass Data Driven Journalism grundsätzlich bedeutet, dass aus Datensätzen Geschichten gewonnen werden, also von Daten “getrieben” werden. Mehr oder minder Konsens war, dass Datenjournalismus noch am Anfang stünde; nicht zuletzt deswegen, da gerade erst die entsprechenden Werkzeuge/Softwaretools entstehen bzw. frei verfügbar sind (siehe Gephi) – und die wollen ersteinmal beherrscht werden.

Auf dem am Wochenende folgenden Hackday wurde eine englischsprache Mailingliste zum Thema Data Driven Journalism ins Leben gerufen.

Hackday: Öffnet euch oder ihr werdet geöffnet

Wer bekommt die meisten Agrarsubventionen, wo gehen eigentlich die Gelder des Konjunkturprogramms hin und wer sagt was im Bundestag? Wer sich für solche Fragen interessiert, konnte einige Antworten auf dem ersten deutschen Hackday in Berlin finden. Auf der Veranstaltung, die sich am vergangenen Wochenende unmittelbar an die Netzkonferenz re:publica anschloss, wurde sich zwei Tage lang über Datensätze aus Politik und Verwaltung hergemacht. Unter den 40 Teilnehmern, unter anderem auch aus England und Dänemark, fanden sich nur zwei Frauen.

Hackday: Öffnet euch oder ihr werdet geöffnet weiterlesen

Data Driven Journalism: Versuch einer Definition

Das Internet ist nicht arm an Buzzwords – Schlagworten, die für einige Zeit Konjunktur haben und sich eben etablieren oder wieder verschwinden. Data Driven Journalism (DDJ) geistert vermehrt seit vergangenem Jahr durch das Web. Im März 2009 startet die englische Tageszeitung The Guardian auf ihrer Website das Datablog; es ist eingebettet in einen Datastore und dürfte bislang als Referenz für DDJ gelten. Einer breiteren Öffentlichkeit wurde das Thema „Datenjournalismus“ in Deutschland durch die Zeitschrift „M – Menschen Machen Medien“ im März 2010 näher gebracht. Im Periodikum des Fachbereichs Medien der Gewerkschaft ver.di mit einer Auflage von 50.000 ging es um die „Spannende Recherche im Netz“.

Begonnen hat es allerdings schon 2006: Als eine Art Manifest in Sachen DDJ gilt der Text „A fundamental way newspaper sites need to change“ von Adrian Holovaty. Er meinte, dass viele Informationen bereits in einer strukturierten Form (=Datensätze) vorliegen oder sinnvollerweise in einer solchen abgelegt werden könnten. Als Beispiel nannte er einen Brand in einem Wohnhaus – es gäbe Fakten, die immer gleich sind – letztlich die berühmten W-Fragen: Wo, wann, wie viele Betroffene, Verletzte, Tote, wie viele Feuerwehrmänner waren im Einsatz etc.

Zeitungsredaktionen usw. könnten also Datenbanken über Ereignisse mit einer konsistenten Datenstruktur aufbauen, so Holovaty, die sowohl für die eigenen Recherche als auch online als Angebot für die eigenen Nutzer/innen bereitgehalten werden können – man denke beispielsweise an eine Karte, auf der sich die Feuer anzeigen lassen und eben nach diversen Kriterien Filtern lassen.

Was ist also das Neue am Daten-getriebenen Journalismus?

Die Recherche in Datensätzen, etwa Statistiken, ist wahrlich nichts Neues. Das gilt auch für die rechnergestützte Recherche, das Computer-assisted-reporting (CAR), welches seit Jahrzehnten praktiziert wird.

Data Driven Journalism: Versuch einer Definition weiterlesen