Anfang des Monats ging es auf der englischprachigen ddj-Mailingliste um die Definition des Datenjournalismus‘.
Nicolas Kayser-Bril (@nicolaskb) beklagte, dass es nach wie vor keine treffende Definition gebe. Deswegen nahm er es in Angriff, den englischsprachigen Wikipediaeintrag zu „datajournalism“ und anverwandte Begriffe zu überarbeiten. Er stellte auf der Liste sein Vorhaben wie folgt vor:
Datenjournalismus sei demnach ein Mantel-/Containerbegriff für einen Trend im Journalismus und des Informationsmanagments. Er sei Folge der zunehmenden Menge an numerischen Daten in der Produktion und Verbreitung von Informationen. Ebenfalls ginge es um einen Zusammenarbeit von Inhalteerstellern – Journalisten – und Designern, Progammieren und Statistikern.
Datenjournalismus würde laut Kayser-Bril verschiedene Konzepte zusammenbringen und mit Journalismus verknüpfen. So würden sich Journalisten bei computergestützter Recherche (Computer-assisted-reporting, CAR) und datengetriebenen Journalismus (data-driven-journalism, DDJ) großen Datensätzen bedienen, um Geschichten, Infografiken und (interaktive) Datenvisualisierungen zu erstellen. Es werden auch Serious Games erwähnt; im Sinne, dass sie Interaktion mit Informationen ein Schritt weiter bringen könnte – siehe dazu auch Newsgames & Gamification (etwa unter newsgaming.de).
Weiter wird von Kayser-Brill auch Datenbank-Journalismus (database journalism) oder strukturierter Journalismus (structured journalism) angeführt. Bei diesen Methoden werden Informationen in einem System organisiert und über eine Datenbankschnittstelle abrufbereit gemacht – entgegen dem traditionell geschichtenzentrierten Journalismus. (Ein Beispiel dafür könnte die gelungene Nordafrika-Zeitleiste, die auf die Artikeldatenbank des Guardian zurückgreift und stetig wächst, sein – eine Art Metadatenjournalismus – Link).
Mirko Lorenz (@mirkolorenz) antwortete auf Kayser-Bril und erinnerte an einen Text von Michelle Minkoff: Bringing data journalism into the curricula (Minkoff arbeite bei AP in Washington). Sie führte dort drei Level von Datenjournalimus ein.
M. Lorenz beschreibt diese Stufen so:
- Daten in Geschichten – Daten dienen hier als Ausgangspunkt für Geschichten; die Datensätze werden ggf. mit veröffentlicht.
- Daten Spezial – Tiefergehende Datengeschichten, interaktive Visualisierungen, die wie eine „neue Kamera“ fungieren, um Klarheit in die Daten zu bringen
- Datenanwendungen – Eigenständige Apps, wie bspw. die erwähnte Serious Games, Rechner (siehe etwa den Miet- versus Kaufkosten für Wohnungen – Is is better to Rent or Buy – der NYT)
Tom Kronenburg (@TomKronenburg) ergänzte bei dem Austausch auf der Mailingliste noch seine Sicht der Dinge; er identifiziert vier Typen von Datenjournalismus (er betont dabei vor allem auch die Rolle von Open Data oder Public Sector Information – PSI).
Journalisten würden laut Kronenburg Daten nutzen, um
- berichtenswerte Fakten oder Geschichten zu finden (althergebrachtes CAR)
- verborgende Trends in großen Datensätzen zu finden
- Datenbanken zu erstellen (siehe oben: structured journalism)
- Datenvisualisierungen zu produzieren (alle möglichen Formen von interaktiven Visualisierungen usw.)
Schließlich wird auf der Mailingliste auch noch angemerkt, dass der Aspekt von Echtzeitdaten in Zukunft für den Journalismus an Bedeutung zunehmen wird und Teil einer Definition des Begriffs Datenjournalismus sein sollte.
UPDATE 14.11.11: Im Folgenden noch die Punkte von Lorenz Lorenz-Meyer (@lorenzlm) aus dem Interview mit ihm für Anna Lena-Krampes Masterarbeit – Interview: Was ist Datenjournalismus? (29.10.2011)
Lorenz-Meyer benennt dort am Ende Kriterien für Datenjournalismus:
- große, strukturierte oder strukturierbare Datenbestände
- mit diversen Methoden werden nennenswerte Strukturen identifiziert
- die Strukturen werden als Beleg für eine Hypothese genutzt oder direkt für die Geschichtenerzählung.
Typisch für Datenjournalismus, aber nicht zwingend notwendig, hält Lorenz-Meyer Elemente wie Interaktivität oder Veröffentlichung der Daten.
UPDATE-Ende
—
Ich persönlich würde noch die Rolle von Daten/ Datensätzen als deutlicher Bestandteil eines Datenjournalismusprodukts als Grundvorraussetzung betonen. Denn das hantieren mit Daten und recherchieren in Tabellen sowie Datenbanken ist uralte Methode des Journalismus‘ – so enthalten die meisten journalistischen Produkte numerische Informationen, also Daten im eigentlichen Sinne – deswegen sind diese Texte, Bilder, Infografiken, Audio- oder Videostrücke aber noch kein Datenjournalismus. Für mich gehört zu einem Datenartikel (als Produkt des Datenjournalismus‘), dass den verwendeten Datensätze Raum gegeben wird. Dass sie diskutiert werden, die Herkunft der Daten aufgezeigt wird und ggf. Rohdaten veröffentlicht werden.
Wie dem auch sei – was grundsätzlich noch fehlt, ist eine solide Untersuchung und Auswertung wie die Leser/ User datenjournalistische Werke empfinden, nutzen und bewerten. Langsam ist Datenjournalismus alt genug – immerhin 2,5 Jahre – dass so etwas gemessen und abgefragt werden könnte. Oder?
—
Grafik oben: Mirko Lorenz, 2010 (CC by-sa – Link)
Woran machst Du denn die 2,5 Jahre fest. Gibt’s da ein einschneidendes Ereignis, eine bestimmte Geschichte?
@marcus – ich mache das am Start des Datablog des Guardian fest – Frühjahr 2009
okay. Das ist sicher eine Marke. 🙂
Danke für die hilfreiche Zusammenfassung!
Ich stimme zu, dass die Nutzung von Daten (auch vielen davon, und auch in großen Datenbanken) immer schon ein Teil des (guten) Journalismus war. Das führt Dich offenbar dazu, diese Art von Journalismus, so diese Daten nicht gesondert im Rahmen der Story mit veröffentlicht werden, nicht als Datenjournalismus zu bezeichnen. Warum? Was wäre schlimm daran, etwas, das es schon immer gab, auch ein Zuhause unter diesem neuen Genre zu geben?
Mir scheint, Du schließt mit Deinr Forderung nach sichtbarem Extraraum für Daten einige Arten von Geschichten als Datenjournalismus aus, die Tom Kronenburg und Mirko Lorenz an erster Stelle erwähnen. Oder verstehe ich Dich falsch? Was wäre mit einer Geschichte, zu der es nur kam, weil der Journalist einen Haufen Daten durchwühlt hat, um dann eine einzige Datenabnormität zu finden, die ihn auf eine großartige, evtl. sogar enthüllende Geschichte gebracht hat, in der er diese Zahl zwar vielleicht erwähnt, aber vielleicht nicht mal eine Infografik dazu zeigt? (Das entspräche den Geschichten vom Typ eins bei Kronenburg und Lorenz.)
Oder ein noch extremeres Beispiel: Ein Journalist befasst sich sehr lange mit Daten zu einem Thema (z.B. amtlichen Daten) und findet dann, dass bestimmte Daten einfach nicht existieren, oder Ihre Erhebung gesetzlich verhindert wird, und schreibt darüber. Kein Datenjournalismus?
@björn – danke für den kommentar; mein punkt ist: es braucht ein- und abgrenzung, sonst ist datenjournalismus als bezeichnung wenig brauchbar. so dürfte fast jede art von investigativen journalismus mit größeren informationsbeständen, etwa akten, zu tun haben – die könnten digital als daten vorliegen bzw. eingescannt werden und lägen dann als daten vor. heutzutage spielen emails fast immer eine rolle; faktisch daten auf der festplatte. ein bericht, der auf solchen daten fußt, könnte dann also auch datenjournalismus genannt werden. der begriff datenjournalismus wird dann als beschreibung aber nutzlos.
ich fasse datenjournalismus enger: nämlich daten-getriebene im sinne, dass ein datensatz veröffenlicht wird, diskutiert oder bestenfalls eine datenbank dahinter online die geschichte dynmamisch und interaktiv darbietet.
Meine fünf Cent (schon ein paar Tage alt):
http://www.scarlatti.de/?p=861