Werkstattbericht: Wie der Zugmonitor entstanden ist

Dem SZblog habe ich einige Fragen rund um den Zugmonitor beantwortet:

Wie man auf die Idee kommt, Millionen Bahndaten aus dem Netz in eine Datenbank zu schreiben, um sie dann auszuwerten.

Unsere allererste Idee war, über das Informationsfreiheitsgesetz Zugang zu detaillierten Verspätungsdaten der Bahn zu verlangen. Uns war klar, dass sich damit journalistisch etwas machen ließe. Im vergangenen Sommer verfielen wir dann auf einen anderen Ansatz, der uns besser geeignet erschien: Wir begannen, die Verspätungsdaten online von der Internet-Seite der Bahn abzugreifen, zu scrapen, wie das heißt. Der Plan war, diese Daten auszuwerten und nahezu live an die Öffentlichkeit weiterzugeben. Wobei wir mit der grundsätzlichen Idee nicht die ersten waren. Das Projekt zugfinder.de macht seit Herbst vergangenen Jahres etwas Ähnliches, und die Stiftung Warentest hatte zuletzt im Frühjahr 2011 ebenfalls mit ausgelesenen Daten – in geringerem Umfang – einen Report über die Pünktlichkeit der Bahn veröffentlicht. Der Unterschied zu uns ist, dass wir neben der Statistik alle Fernzüge und ihre Verspätungen auf einer interaktiven Deutschlandkarte darstellen wollten, in Echtzeit.

Weiterlesen im Redaktionsblog auf süddeutsche.de

Interview: Datenjournalismus und demokratische Öffentlichkeit

Unlängst habe ich der neuen Diskursplattform des Deutschlandfunk ein Interview gegeben:

[...] Inwieweit spielt Datenjournalismus mit Blick auf Öffentlichkeit und Demokratie eine Rolle? 

Datenjournalismus wird in einigen Jahren kein Aufsehen mehr erregen. Weil er selbstverständliche Methode und alltägliches Werkzeug der Berichterstattung sein wird. Es gibt jetzt schon enorme Datenmengen in den Verwaltungen und der Politik – Akten und Statistiken zum Beispiel. Und es wird exponentiell mehr geben, weil immer mehr digitale Geräte Einsatz finden und mehr und mehr Sensoren aktiv Daten sammeln.

Es ist Aufgabe von Journalisten auch hier ihrer Berichterstattungspflicht und Watchdogfunktion gerecht zu werden. Insofern ist es essentiell wichtig für eine immer digitaler kommunizierende Gesellschaft, dass Journalisten und Medienhäuser sich mit Daten befassen. Das Internet bietet die perfekte Infrastruktur dafür, datenbankgestützt zu berichten. Dafür notwendige Technologien und Herangehensweisen gilt es zu erlernen und zu entwickeln, aber auch angebrachte Erzählformen dafür zu finden. [...]

Das gesamte Interview lesen.

BpB Open-Data-Dossier: Hyperlokal

Für ein vor kurzem erschienenes Dossier zu Open Data der Bundeszentrale für politische Bildung habe ich vergangenen Herbst (2011) zwei Texte geschrieben. Den folgenden und einen zu Datenjournalismus allgemein.

Das Medium Internet befindet sich im ständigen Wandel und verändert weiterhin den Journalismus: Sowohl das Handwerk, den Beruf des Journalisten, aber auch Form und Art, wie Nachrichten konsumiert werden. Auch Open Data spielt dabei eine Rolle, das aus seinen Datenbanken punktgenau Informationen liefern wird. Das kann nicht nur den Lokaljournalismus verändern, sondern auch die Lokalpolitik.

Der klassische Lokaljournalismus lebt davon, dass Leser immer das sehr interessiert, was sie unmittelbar umgibt, was ihren Alltag und ihr soziales Umfeld – Familie, Freunde, Bekannte, Kollegen – berührt: Der Verein um die Ecke, das Fest im nahen Kindergarten, die Baustelle vorne an der Kreuzung, der Einbruch beim Nachbarn gegenüber und das Angebot vom Laden die Straße herunter.

Das Internet als Medium erlaubt es nun, das Nachrichten kleinteiliger und spezifischer werden. Und zwar dynamisch: Nachrichten werden an den Standort des Nutzers, der vielleicht automatisch erfasst wurde, angepasst. Hyperlokaljournalismus konzentriert sich also auf diese unmittelbare Umgebung. Neben dem Begriff “hyperlokal” wird auch “mikrolokal” benutzt.

Weiterlesen

BpB Open-Data-Dossier: Datenjournalismus

Für ein vor kurzem erschienenes Dossier zu Open Data der Bundeszentrale für politische Bildung habe ich vergangenen Herbst (2011) zwei Texte geschrieben. Den folgenden und einen zum Thema “Hyperlokal“.
a

Datenberge sind ein Rohstoff: Regierungen, Unternehmen und Nichtregierungsorganisationen sitzen auf Unmengen von Daten und könnten diese zu Open Data machen. Die Journalismusform, die mit diesen Datensätzen arbeitet, nennt sich Datenjournalismus.

Das Datensätze einen Rohstoff darstellen ist mittlerweile zu einem geflügelten Wort geworden: “Daten sind das neue Öl”. So hatte es 2006 der Werbefachmann Michael Palmer formuliert. Unbearbeitet seien Daten wertlos. Sobald Datensätze aber behandelt werden, würden sie zu digitalen Äquivalenten von Plastik, Chemikalien oder Gas.

Es gleicht einem kollektiven Geistesblitz in Zeitlupe, der derzeit im Netz zu beobachten ist: Daten, in Tabellen gepresst, häufen sich in Datenbanken und werden minütlich mehr. Sie gehen auf Reise durchs Internet, werden von Sensoren immer neu gemessen oder per Hand erhoben. Diese Datenberge sind ein Rohstoff. Und Regierungen, Unternehmen und Nichtregierungsorganisationen sitzen auf Unmengen von Daten und könnten diese zu Open Data machen. Die Journalismusform, die mit diesen Datensätzen hantiert, nennt sich Datenjournalismus

Weiterlesen

Tutorial: Grenzen, Gebiete und Daten mit Fusion Tables kartieren

Bevölkerungsdichte in Schleswig Holstein nach Landkreisen (Quelle: Stat. Bundesamt)

Die oben stehende interaktive Karte mit Google Fusion Tables zu erzeugen, ist nicht schwer. Wer noch nie mit Fusion Tables (FT) gearbeitet hat, der lese sich bitte aber zuerst das Tutorial zum automatisierten Eintragen von Adressen auf eine Karten mit FT hier im Blog durch, um einige grundsätzlichen Sachen zu erfahren.

Neben Markern kann das Tool auch Gebiete sowie Grenzen darstellen und diese abhängigen von Werten einfärben. Dafür braucht es erst einmal die Gebiete, etwa Bundesländergrenzen als KML-Dateien (Keyhole Markup Language – aus dem virtuellen Globus “Keyhole” wurde 2004 Google Earth).

Beim Bundesamt für Kartographie und Geodäsie gibt es ein Geodatenzentrum (Geodäsie = Wissenschaft von der Ausmessung und Abbildung der Erdoberfläche). Die Kreisgrenzen (und Staatsgebiet, Bundesländer sowie Regierungsbezirke der BRD) finden sich dort zum Download. Zur Nutzung heißt es: “Die nachfolgenden Daten dürfen für private und firmeninterne Zwecke entgeltfrei genutzt werden. Darüber hinaus sind Vervielfältigung, Verbreitung und öffentliche Zugänglichmachung mit nachfolgender Quellenangabe ohne Einschränkungen gestattet, sofern sie unentgeltlich erfolgen.

Weiterlesen

Big Data im Sport – im Kino und bei Zeit Online

Anfang Februar kommt der Film “Moneyball” in die deutschen Kinos. Eine Verfilmung des gleichnamigen Buches mit dem Untertitel “The art of winning an unfair game”. Es erschien im Jahr 2003. Darin geht um einen Baseballverein, dem es gelingt, durch Datenanalyse der Spielerstatistiken trotz geringen Budgets eine sehr erfolgreiche Mannschaft aufzustellen. Diese Herangehensweise prägte einen eigenen Begriff: Sabermetrics (SABR- Society for American Baseball Research).

Nun hat Zeit Online vor einigen Tagen eine Datengeschichte rund um die Budgets der Fußball-Bundesligavereine gebracht. Sie runtergebrochen auf Kosten pro Tor, Pass usw.. Eine interessante Idee und technisch gut umgesetzt. Vorbildhaft sind die dargestellten Daten auch als Google Doc veröffentlicht. Update: Auch wird die App nach jedem Spieltag aktualisiert, siehe Hinweis von @venohr.

Ein paar Sachen stören allerdings. Das Video oben rechts lenkt von der Anwendung ab und kann nicht Ersatz für eine fehlende redaktionelle Einbettung sein: Artikel, die den Kontext darstellen, Geschichten erzählen, Hintergrund zum Thema bieten. So fehlt etwa eine wesentliche Angabe – die Quelle oder Datengrundlage für die Investitionssummen der Vereine.

Weiterlesen

Datenjournalismus: Bilanz 2011 und Ausblick

In Sachen Datenjournalismus war im deutschsprachigen Raum im Jahr 2011 einiges los. Manche, wie Medienjournalist Christian Jakubetz, meinen dennoch, dass der Hype um Datenjournalismus bereits zurückgehe und das Thema in zwei Jahren vom Tisch wäre.

Eine Einschätzung gegen die einiges spricht. Im Frühjahr 2012 etwa wird es eine Recherche und Datenjournalismus-Fachtagung in Hamburg geben. Das in Berlin bereits sechs Mal statt gefundene Datenjournalismus-Treffen wird im neuen Jahr am 25. Januar in anderer Form weitergehen: Mehr praxisorientiert und von mehr Leuten in der Vorbereitung getragen (die offene Mailingliste dazu findet sich hier). Und wie in diesem Jahr wird es auf der Netzkonferenz re:publica im kommenden Mai auch um Datenjournalismus und Open Data gehen.

Steigendes Interesse, auch jenseits des Journalismus

Aus Sicht meiner Warte stelle ich fest, dass die Anfragen nach Referenten- und Trainingstätigkeiten rund um das Thema stetig zunimmt; ebenso die Wünsche danach, als Interviewpartner zur Verfügung zu stehen – nicht zuletzt für Studierende, die ihre Abschlussarbeit zu dem Thema schreiben (ich schätze, dass zur Zeit mindestens fünf solcher Arbeiten im deutschsprachigen Raum geschrieben werden/ wurden – z.B. eine wie diese hier (pdf)). Weiterlesen

13 Open Data Interviews

Bis August diesen Jahres (2011) habe ich zehn Monate lang am Stück das Open Data Blog auf zeit.de geschrieben.

Hier veröffentliche ich nun die meisten Interviews, die ich für dieses Blog geführt habe, unter einer Creative Commons-Lizenz (CC-by). Erschienen sind sie zwischen Oktober 2010 und September 2011 (zum Abschluss hat mein Nachfolger Markus Heidmeier ein Interview mit mir geführt). Die 13 Interviews werden im Folgenden chronologisch zurückgehend vom aktuellsten zum ältesten hin aufgelistet (Update 11.01.2012):

Weiterlesen

Zukunft des Journalismus: Reformation statt Revolution

In den USA wird leidenschaftlich über die Zukunft des Journalismus debattiert. Worum geht es dabei eigentlich: Technologien, Geschäftsmodelle oder Aufgaben von Journalisten in der Demokratie?

Clay Shirky ist ein Apokalyptiker. Der Medienwissenschaftler aus den USA schrieb 2009 in seinem Text “Newspapers and Thinking the Unthinkable” ketzerisch: „Die Gesellschaft braucht keine Zeitungen. Was wir brauchen ist Journalismus.“ Im gleichen Atemzug kündigte er ein jahrzehntelanges Chaos an: Die ungestörte Symbiose zwischen Zeitungen, Werbetreibenden und Lesern wäre nach über hundert Jahren endgültig vorbei. Es sei an der Zeit, im Medienhandwerk zu experimentieren. Doch, so warnte Shirky, viele der Versuche seien zum Scheitern verdammt. Aber einige Experimente würden schließlich das hervorbringen, was das Nachrichtenwesen der Zukunft sein werde.

Propheten sind manchen ein Dorn im Auge. Zum Beispiel Dean Starkman, der vor kurzem einen langen Text verfasste, im dem er die von ihm als “News Gurus” Gebrandmarkten kritisiert (Update 29.12.11: Bei Vocer findet sich eine deutsche Übersetzung des Textes). Shirky macht er zu einem der Protagonisten eines “Future-of-News“ (FON) Konsenses. Jeff Jarvis, der auch in Deutschland einen Namen hat, zählt für Starkman ebenfalls dazu (Jarvis wird auch als “Cyber-Utopist” bezeichnet; sein neues Buch wurde neulich von Evgeny Mozorov brutal verrissen).

Weiterlesen