Kurzes making-of zur NZZ-Lobby Visualisierung

Es war ein anhaltendes Ping Pong mit Sylke Gruhnwald von der NZZ: Zusammen mit dem freien Grafiker und Programmierer Christopher Pietsch habe ich von Berlin aus an der heute erschienen Lobbyismus-Visualisierung mit der Datenredakteurin in Zürich gearbeitet. Begonnen haben wir damit vergangenen Herbst; es ist somit meine letzte Arbeit für OpenDataCity – dort schied ich zum Jahreswechsel aus.

Kurzes making-of zur NZZ-Lobby Visualisierung weiterlesen

Fünf Jahre Datenjournalismus: Im Mainstream angekommen

datablog_5yrs

Anfang März 2009 schrieb Simon Rogers den ersten Artikel im Guardian Datablog: „This is a place to discuss data and what we can do with it.“ Rogers experimentierte mit damals neuen Tools wie Google Fusion Tables, setzte konsequent auf die Tabellen von Google Docs, probierte immer wieder neue Dinge aus und zeigte, wie ohne Programmierkenntnisse mit Daten hantiert werden konnte. Als 2010 die beiden großen Wikileaksgeschichten (Afghanistan, Irak) erschienen, konnte der Guardian auch Dank der Expertise in Sachen interaktiver Datenvisualisierung gelungene Arbeiten abliefern.

CAR, computer-assisted-reporting, gab es schon seit Jahrzehnten. 2009 war nicht das Jahr in dem Daten erstmals journalistisch online und in interaktiven Anwendungen genutzt wurde. Adrian Holovatay, dessen Text „A fundamental way newspaper sites need to change“ als ein wichtiger Impuls für Datenjournalismus gilt, hatte schon 2005 mit automatisiertem „Crimemapping“ per Datensätzen begonnen. Der Start des Datablogs des Guardians war dennoch ein wegweisendes Ereignis: Ein großes international gelesenes Medium widmete sich auf neue Weise regelmässig und explizit Datensätzen, die im journalistischen Alltag  zwar von je her eine Rolle spielten. Aber selten zuvor war Daten die Hauptrolle zugekommen und sie unmittelbar für die Schilderung eines Sachverhalts oder Vorgangs genutzt worden. Und soweit es sich nachvollziehen lässt, wurde der Begriff data-driven-journalism und Datenjournalismus 2009/2010 geprägt. Genau in der Zeit übrigens, in der auch das Thema „Open Data“ Konjunktur bekam: Datensätze wurden vermehrt als gesellschaftliche Ressource begriffen.

Fünf Jahre Datenjournalismus: Im Mainstream angekommen weiterlesen

Datenjournalismus im November & Dezember 2013

Eine Auswahl von Links und Materialien

trafficjam

Wie effektiv kleine interaktive Datenanwendungen eingesetzt werden können, um einen Sachverhalt zu erklären, zeigt dieses Stück über Staus: What Are Traffic Waves and Why Do They Happen So Much?

Es gab diverse Jahresrückblicke:

  • die NYT mit: The Year in Interactive Storytelling (Link)
  • die Washington Post: The Year in Graphics (Link)
  • Andy Kirk (visualising data) mit „10 significant visualisation developments: July to December 2013“ (Link)
  • Robert Kosara aka EagerEyes übt einen Vorausblick: The State of Information Visualization, 2014 (Link)

Das Tool Datawrapper beherrscht nun auch Kartendarstellung. Der maßgebliche Entwickler des Werkzeugs, Gregor Aisch, beginnt dieses Jahr in der Grafikabteilung der NYT – ein Interview mit ihm findet sich hier im Blog.

Die Wind Map begeistert, weil sie die Balance zwischen „dataporn“ und nützlicher Visualierung hält – jetzt gibt es die Winddaten für den ganzen Globus als Earth Wind Map (unten links auf „earth“ klicken, um aus verschiedenen Parametern zu wählen).

Tolle Ressource: 300 sites providing freely available geographic datasets (Link).

Datenjournalismus im November & Dezember 2013 weiterlesen

In eigener Sache

Seit Beginn diesen Jahres bin ich nicht mehr für und bei OpenDataCity tätig.

Ende 2010 hatten Marco Maas und ich uns zusammen überlegt, nicht nur über Datenjournalismus zu reden, sondern ihn auch zu machen. Mit Gregor Aisch entwickelten wir die Castor-Livemap und bald die Fluglärmkarte für die taz. Zusammen mit Michael Kreil entwarfen und programmierten wir die Vorratsdatenanwendung auf Zeit Online. Michael wurde bald fester Teil von OpenDataCity.

Seitdem haben wir von Hamburg und Berlin aus so manche größere und kleinere Anwendung konzeptioniert und umgesetzt – mal in Kooperation mit oder im Auftrag von Medien, mal auf eigene Faust. OpenDataCity bestand Ende 2013 aus einem Kernteam von sieben Personen plus einem halben Dutzend freier Mitarbeiter. Pi mal Daumen haben wir in den letzten drei Jahren 200 Trainingstage für Datenjournalismus absolviert, mal inhouse oder in Einrichtungen der Journalismusbildung. Wir berieten einige Medienhäuser und sprachen auf diversen Kongressen, Tagungen und anderen Veranstaltungen.

Wir haben geholfen, Datenjournalismus als Genre und Methode im deutschsprachigen Raum zu verankern. Das hat Spaß gemacht, war manchmal anstrengend, aber fast immer eine spannende Herausforderung. OpenDataCity wird auch ohne meine Mitarbeit weiter gute Arbeit leisten.

Ich selber werde mich weiterhin mit Datenanwendungen und interaktivem Journalismus beschäftigen. Aber vermehrt widme ich mich in diesem Jahr meiner Firma Lokaler. Ihr Produkt ist eine flexible Kartenanwendung, eine „Middleware“, die nach zweieinhalb Jahren Entwicklung nunmehr einsatzbereit ist. In den nächsten Monaten starten einige größere Projekte damit. Darauf will ich mich konzentrieren.

Pi mal Daumen: Datenjournalismus zur Sexarbeit in Deutschland bei Welt Online

welt_titel

Die „blaue Gruppe“ bei Springer, die nach der Schmuckfarbe der Welt benannt ist, will eigentlich wenig mit der „roten Gruppe“ der Bild zu tun haben. Doch die Überschrift „Augsburg misst die größte Hurendichte Deutschlands“ würde man eher in der Boulevardabteilung erwarten. Doch lautet so der Titel eines Textes bei Welt Online vom 3.11.13, der sich unter Einsatz von Datenvisualisierungen dem Thema Sexarbeit in Deutschland widmet. Er ist wohl eines der Ergebnisse der dreijährigen Recherche des Welt-Investigativteams zu Sexarbeit und Menschenhandel, die in einem Video am Ende des Artikels erwähnt wird.

Im Kern war die Idee wohl, dass man bei Polizeien und Verwaltungen aller Städte über 100.000 Einwohner in Deutschland nach der Anzahl (aber nicht Geschlecht) der Sexarbeitenden in der jeweiligen Stadt fragen wollte. Doch: „Von den 80 größten deutschen Städten sieht sich ein Viertel nicht in der Lage, die Zahl der vor Ort tätigen Prostituierten auch nur ungefähr zu beziffern.“ Genannt werden nur drei Städte (Augsburg, München, Stuttgart) mit „präzisen Angaben“, von zwei andere Städten (Frankfurt, Berlin) gab es „Hochrechnungen“; Hamburg und Köln lieferten „grobe Schätzungen“. Welcherlei Qualität die verwendeten Zahlen der anderen gut 50 Städte sind, wird nicht dokumentiert (UPDATE: einer der Autoren merkt an, dass bei der Visualisierung unter dem Punkt „Diagramm“ per Mouseover Zusatzinfo pro Stadt zu finden sind).

Mit den Zahlen (hier als Tabelle), die alle als „Schätzungen“ deklariert werden, wird auf einer Karte Effekthascherei betrieben: Mittels Kreise wird gezeigt, wo es pro 100.000 Einwohner am meisten Sexarbeitende geben soll. Hierbei wird ein klassischer Fehler gemacht: Der Kreisinhalt für Städte mit 150 bis 180 Sexarbeitende pro 100.000 EW ist knapp zehnmal geringer wie der  ein Zehntel von dem für Städte mit 220 bis 250 – bei also nicht einmal mehr als halb so großen Werten. Pi mal Daumen: Datenjournalismus zur Sexarbeit in Deutschland bei Welt Online weiterlesen

Verpasste Datenjournalismusthemen

Bildschirmfoto 2013-10-29 um 09.18.08„Verschwendungsatlas“ des Bundes der Steuerzahler

Einen Monat nach der Bundestagswahl herrscht Ebbe in Sachen Datenjournalismus in Deutschland. Alle Energie (und Gelder) scheinen in die etlichen Visualisierungen und Datengeschichten zur Bundestagswahl geflossen zu sein.

So wird einmal mehr deutlich, dass es hierzulande bei Zeitungen und Nachrichtenportalen Teams bräuchte, die tages- oder zumindest wochenaktuellen Datenjournalismus machen könnten. Das wäre durchaus notwendig, denn an datenlastigen Themen mangelt es nicht; manche Dimension lässt sich eigentlich nur schlüssig mit Unterstützung einer Datenvisualisierung für die Rezipienten darstellen. Und der große Vorteil an entsprechend geplanten datenbankgetriebenen Apps ist: Sie können sich fortschreiben, mit neuen Zahlen füttern, wiederverwenden lassen.

Vier Beispiele: Verpasste Datenjournalismusthemen weiterlesen

Visualisierungen & Daten zur Bundestagswahl 2013

wahlkarte_b
Berlin-Wahlkarte – B. Morgenpost (siehe auch making-of)

wenn_atlas
Wie wäre die Wahl ausgegangen, wenn… – Datenlese/SpOn

nonvoters2
Atlas der Nichtwähler 2009 und 2013 – mappable.info

datenhelfer
Diverse Projekte der Wahl-Daten-Helfer

wanderung_sz
Wählerwanderung – süddeutsche.de

kantine
Wahlkantine – Teil 1 – Teil 2 – Teil 3 auf Zeit Online

wahlatlas_sz
Wahlergebnisse kartiert – süddeutsche.de

Visualisierungen & Daten zur Bundestagswahl 2013 weiterlesen

Interview mit Datenjournalistin Christina Elmer

Christina Elmer @chelm, geboren 1983, arbeitet im Wissenschaftsressort von Spiegel Online und betreut als Recherche-Trainerin Workshops in Redaktionen und Ausbildungsprogrammen. Zuvor gehörte sie zum Team Investigative Recherche des Stern und arbeitete als Redakteurin für Infografiken bei der Deutschen Presse-Agentur (dpa), wo sie zuvor „dpa-RegioData“ mit aufgebaut hatte. Der Weg dorthin: Volontariat beim Westdeutschen Rundfunk (WDR), Studium der Journalistik und Biologie an der TU Dortmund, Freie Autorin für Wissenschaftsthemen.

Bezeichnest du dich selbst als Datenjournalistin? Wenn ja, wie würdest du dein berufliches Selbstverständnis beschreiben? 

Ja, aus meiner Sicht passt diese Bezeichnung. Viele meiner Recherchen basieren auf Statistiken oder anderen strukturierten Datensätzen. Daraus Ansatzpunkte für Geschichten herauszukitzeln, würde ich als Kern der datenjournalistischen Arbeitsweise bezeichnen. Mein Fokus liegt dabei immer auf der Frage, ob am Ende eine relevante Story steht. Die kann sich entweder aus der Analyse ergeben oder auch darin bestehen, wichtige Datensätze überhaupt öffentlich zu machen.

Du sagst, die Recherche in Statistiken oder strukturierten Daten sei für dich der Kern datenjournalistischer Arbeit. Ist Datenjournalismus also ein anderes Wort für „Computer Assisted Reporting“ (CAR), wird er durch die Recherche definiert?

Wer datenjournalistisch arbeitet, benutzt zwangsläufig immer auch Werkzeuge und Methoden aus dem Computer Assisted Reporting. Allerdings geht der Datenjournalismus für mich darüber weit hinaus. Wenn Datenjournalisten bei ihren Recherchen dafür sorgen, dass Informationen überhaupt öffentlich werden. Wenn sie diese Daten zugänglich machen, indem sie sie ansprechend aufbereiten und auf offenen Plattformen veröffentlichen. Und wenn sich aus diesen Anwendungen neue Wege des Storytellings ergeben. Das sind alles relevante Bestandteile datenjournalistischer Arbeit, die aus meiner Sicht aber nicht in jedem Projekt zwingend eine Rolle spielen müssen.

Interview mit Datenjournalistin Christina Elmer weiterlesen

Bundestagswahl: Wie gut waren die Vorhersagen der Umfrageinstitute?


Wie gut sind die Prognosen der Umfrageinstituten? Kurz gesagt: Solala. Betrachtet man die jeweils letzten Umfragen vor den vergangenen vier Bundestagswahlen, zeigt sich, dass es deutliche Unterschiede bei der Vorhersagegenauigkeit der Demoskopen gibt. (Richtigerweise muss man sagen: Es handelt sich nicht um Prognosen oder Vorhersagen im eigentlichen Sinne – die Umfragen sollen Abbild einer politischen Stimmung sein.) Update: Dank eines Hinweises von @zoonpolitikon sei hier noch auf die Fehlertoleranz/ Standardabweichung aufmerksam gemacht. Die Zahlen der Umfrageinstitute lagen meist innerhalb der üblichen +/- 2,5 bis 3 Prozentpunkte. Mehr dazu hier.

Durch die Bank weg haben alle der sechs hier betrachteten Umfrageinstitute bei der Wahl in 2005 deutlich daneben gelegen: CDU/CSU sahen alle bei 41 oder 42 Prozent – tatsächlich kamen die auf 35,2 Prozent. Anderseits lag Forsa im Jahr 2002 deutlich näher als die anderen Institute am Endergebnis: Mit insgesamt nur 2,7 Prozentpunkten Abstand. Bei der Bundestagswahl 1998 war Allensbach noch besser: Insgesamt lag man nur 2,4 Prozentpunkte vom Wahlergebnis weg.

Betrachtet werden bei diesem Vergleich die Zahlen für die Parteien im Bundestag (CDU/CSU, SPD, Grüne, FDP, Linke/PDS). Die Abweichung der Vorhersage für jede Partei – egal ob positiv oder negativ – wurden zusammengezählt. So ergibt die Gesamtabweichung beim folgenden Beispiel 6,4 Prozentpunkte.


Die letzten Umfragergebnisse der Institute vor der jeweiligen Wahl wurden bei wahlrecht.de gefunden. Hier die Datei mit den Umfrageergebnissen pro Partei und Wahl bei Google Docs.

Im Überblick ganz oben ist zu sehen, dass Allensbach und Forsa zumindest bei zwei von vier Wahlen die genausten Prognosen gebracht haben. Mal sehen, wie richtig sie am Wahlabend im September liegen. Wenn die Vorhersagen so fehlerhaft sind wie 2005, könnte der Wahlabend doch spannend werden.

Siehe die Kritik an diesem Beitrag: „Was Wahlumfragen (nicht) sagen“

und auch: „Warum Wahlprognosen mehr können als Umfragen – am Beispiel Hamburg-Mitte“ bei hamburger-wahlbeobachter.de

 

Datenjournalismus im Sommer 2013

Eine Auswahl von Links, Materialien, Tools und Terminen

Bildschirmfoto 2013-08-18 um 10.39.05

Das beeindruckende Projekt eines internationalen offenen Handelsregisters, Open Corporates, bietet nun die Option, die Netzwerke der Firmen zu visualisieren. Für einige Beispiele haben sie die wahnsinnig verschachtelten Firmenkonstrukte extra visualisiert. Oben ist ein Auschnitt des Netzes von Goldmann-Sachs zu sehen. Umgesetz haben die Visualisierung Kiln aus Italien, die ein Making-of veröffentlicht haben.

Auf visualisingdata.com findet sich eine große Sammlung von Websites, die Zugang zu unterschiedlichsten Open Data-Datensätzen von NGO, Regierungen usw. bereitstellen. Ebenfalls ist dort ein Überblick über „10 significant visualisation developments: January to June 2013″ zu finden.

Am Knight Center for Journalism in the Americas läuft noch bis Mitte September ein Massive Open Online Course (MOOC) zu den Grundlagen des Datenjournalismus.

Marcus Anhäuser hat im Juli ein Interview zu Hacks/Hackers in Berlin geführt. Und auch Björn Schwentker zu seinem Projekt „Zensus unzensiert“ befragt.

Datenjournalismus im Sommer 2013 weiterlesen