Irak-Protokolle: Zähmung einer Datenflut

Warlogs Irak NYT Karten
Karten der Toten in Bagdad pro Jahr - New York Times

Was für eine Herausforderung: Knapp 400.000 Datensätze waren sinnvoll aufzubereiten. Vier bedeutende Medien – Spiegel, Guardian, New York Times und Al Jazeera  – haben in der Nacht auf Samstag die Ergebnisse ihrer Heransgehensweise bei der Zähmung der Datenflut präsentiert. Ergänzend dazu bietet Wikileaks selber ein Recherchewerkzeug für die Irak Protokolle an; die Organisation verweist darüberhinaus noch auf eine Plattform für kolleborative Recherche. Im Folgenden eine Übersicht der Umsetzungen.

Irak-Protokolle: Zähmung einer Datenflut weiterlesen

Scoopcamp Hamburg: Folien zu dem Workshop OpenData und Lokaljournalismus

Zusammen mit Ulrike Langer (medialdigital.de) habe ich auf dem Scoopcamp in Hamburg (29.9.2010) einen Workshop gestaltet. Drei Stunden sprachen wir über OpenData und Lokaljournalismus. Wir zeigten diverse Beispiele, um Lokaljournalist/innen zu insperieren, Datenprojekte in ihren Medien umzusetzen.

Im Folgenden die beiden Foliensätze: Ulrike Langer zeigte diverse Beispiele (unten), ich führte zuvor in die Themen OpenData und Datenjournalismus ein sowie gab einen kurzen Überblick zu Tools. Die Links zu den genannten Bsp. sind in den Folien eingebunden. Ergänzende Links finden sich auch hier: http://okfnpad.org/scoopcamp

Datenjournalismus vor dem Internet: Wetterbericht, Finanzdaten und Co.

Schaubild Datenjournalismus vor dem Internet

Formen von Datenjournalismus sind lange schon allgegenwärtig. Wetterberichte und -vorhersagen etwa begegnen einem andauernd: Im Radio, in der Zeitung, im Fernsehen – auf Monitoren im Nahverkehr der Großstädte, auf dem Smartphone und im Internet selbstverständlich auch. Wetterberichterstattung erfüllt zumindest einige Kriterien von Datenjournalismus – wenn wir den als Prozess und Veröffentlichungsform verstehen: Datensätze sind zentraler Bestandteil der Berichterstattung und es erfolgt eine unmittelbare Präsentation ihrer selbst – entweder als Rohdaten (z.B. Lottozahlen) oder in aggregierter Form visualisiert (bspw. Wetterkarten oder Börsenkurse).

Die erste journalistische Berichterstattung über komplexere Datensätze dürften Finanzinformationen gewesen sein. Börsen entstehen im 13. Jahrhundert. Aber seit wann gibt es Journalismus? Datenjournalismus vor dem Internet: Wetterbericht, Finanzdaten und Co. weiterlesen

Interviews (Audio) data-driven-journalism round table Amsterdam

gracht_wikimedia_commons

Im Anschluss an den Data-driven-journalism round table (über den ich gestern berichtete) gab es noch die obligatorische Grachtenfahrt. Auf dem Schiff befragte ich einige deutschsprachige Teilnehmer und Organisatoren zu ihrer Einschätzung der Veranstaltung. Die Audioqualität ist durch den Geräuschpegel im Hintergrund etwas beeinträchtigt; die Interviews sind zwischen zwei bis sechs Minuten lang.

Vorher noch ein Hinweis: In der Aufzählung der mir interessant erscheinenden Dinge auf der Tagung habe ich die die Tools des Angebots digitalmethods.net vergessen – großartige Werkzeuge von der Universität Amsterdam.

Hier die Reihenfolge der Interviews, die weiter unten gehört oder heruntergeladen werden können.

Wilfried Rütten, Direktor des European Journalism Centre EJC)

Mirko Lorenz, Organisator der Tagung, arbeitet für EJC, DW (Link)

Sebastian Mondal, Datenjournalist, dpa

Sönke Lorenzen, Media Analyst bei Greenpeace International

Marco Maas, freier Datenjournalist (u.a. ZDF Parlameter) – Link

—–

Bericht vom data-driven-journalism round table in Amsterdam

badge data driven journalism ejc

Gestern nahm ich am data-driven-journalism round table in Amsterdam teil. Im Folgenden werde ich einige Punkte von der Tagung nennen, die ich bemerkenswert fand. Eine vollständige Dokumentation inklusive Videos und Präsentationen der Referate wird es bald vom European Jourmalism Centre EJC – dem Ausrichtter der Tagung geben, darunter auch die Arbeiten von Anna Lena Schiller, die jedes der Referate gleich illustrierte.

Die Veranstaltung brachte in vier Panels fast 20 Personen aus Europa und den USA zusammen, die zu verschiedenen Aspekten der recht jungen journalistischen Disziplin data journalism kurze Vorträge hielten. Darunter Mitarbeiter vom Guardian (datablog), LA Times (datadesk) und der Ney York Times. Eine einzige Frau war unter den Vortragenden; ingesamt waren etwa 60 Personen den ganzen Tag dabei. Bericht vom data-driven-journalism round table in Amsterdam weiterlesen

WarLogs, Big Data und die Folgen für den Journalismus

Warlogs Guardian IDE Timeline
Guardian - Warlogs: Ausschnitt aus interaktiver Zeitleiste

Schnell hieß es am Montag in Folge der Veröffentlichung der Afghanistan-Protokolle: Heute hat sich der Journalismus für immer verändert.

„Dies ist nicht nur bedeutend für die Berichterstattung und die Wahrnehmung des Kriegs an sich. Es ist auch eine Machtdemonstration von Wikileaks und ein Blick in den Journalismus der Zukunft. Denn man kann auch sagen: Wikileaks hat drei der bedeutendsten Print-Medien die Pistole auf die Brust gesetzt – und die haben sich nicht lang gewehrt. Letztlich hat die so oft angezweifelte Plattform die Kooperationspartner gezwungen, sich einer neuen Berichterstattungswelt zu öffnen.

So schrieb Thomas Knüwer und goss Häme über Spiegel-Online aus; die Website habe gegenüber der New York Times und vor allem dem Guardian in der Präsentation der Afghanistan Protokolle oder Warlogs sehr schlecht ausgesehen. (Eine Einschätzung, die der Chefredakteur von SPON gegenüber Meedia letztlich teilte).

Tatsächlich scheinen sich die drei Zeitungen einer Situation á la „friss oder stirb“ ausgesetzt gesehen zu haben. Allerdings geht laut dem Artikel The Story Behind the Publication of WikiLeaks’s Afghanistan Logs (Columbia Journalism Review) der ganze Vorgang auf das Engagment eines Guardian-Redakteurs zurück.

WarLogs, Big Data und die Folgen für den Journalismus weiterlesen

Hyperlocal: Lokaljournalismus und OpenData in den USA und Deutschland

Lokaljournalismus lebt davon, dass die Leser immer auch das interessiert, was sie kennen: Der Verein um die Ecke, der Einbruch beim Nachbarn gegenüber und das Angebot vom Laden die Straße herunter. Hyperlokal, auf den unmittelbaren Straßenzug eingegrenzte Berichterstattung sei deswegen die Zukunft des Lokaljournalismus im Web, heißt es.

Im Folgenden geht es zuerst um entsprechende Angebote in den USA – namentlich Everyblock. Im zweiten Teil des Beitrags wird dann ein Blick auf den Stand in Deutschland geworfen und die Probleme mit den Informationen aus der öffentlichen Hand (OpenData). Schließlich geht es um Geschäftsmodellefür Netz-Lokalberichterstattung und den Anzeigenmarkt im mobilen und geolokalen Internet.

Everyblock Beispiel Ausschanklizenz

Hyperlocal, so wird die Zukunft des Lokaljournalismus sein. Meinen manche. Vorreiter dieses Ansatzes ist das US-Projekt Everyblock, das 2007 startete. Mittlerweile ist es für 16 große US-Städte verfügbar. Es generiert keine eigenen Inhalte sondern aggregiert sie, sammelt sie ein. Man versteht sich als „geographischer Filter“ heißt es in der Selbstdarstellung. Dabei geht es nicht um statischen Daten für eine Gegend, etwa Adressen von Schulen. Sondern um Nachrichten im weitesten Sinne, die sich auf einen Standort beziehen und ein Datum haben.

Hyperlocal: Lokaljournalismus und OpenData in den USA und Deutschland weiterlesen

Motion Charts-Tutorial: Afghanistan und Bundeswehrlogistikkosten

Wie hoch sind die Kosten des Kriegs in Afghanistan? Auf eine diesbezügliche kleine Anfrage der Fraktion hat Tom Strohschneider in seinem Freitagblog aufmerksam gemacht (in den Kommentaren dort geht es bspw. um die Validität der Daten). Auf die Anfrage von der Partei Die Linke im Bundestag hatte es unlängst eine Antwort der Bundesregierung (pdf – Drucksache 17/2026) gegeben. Sie enthält zahlreiches statistisches Material, etwa über die Anzahl und Typen des militärischen Geräts – darunter beispielweise einige dutzend Flugdrohnen.

Im Folgenden werden die Kosten für die Logistikdienstleistungen, die seitens der Bundeswehr extern vergeben werden, genauer betrachtet. Dafür wurden die Daten aus dem pdf extrahiert, in eine sinnvolle Datenstruktur gebracht und dann mittels Googles Texte&Tabellen (Docs) in einer interaktiven Motion Chart (Bewegungsdiagramm) visualisiert (siehe oben). Die einzelnen Arbeitsschritte dafür werden weiter unten erläutert. Der genutzte Datensatz findet sich hier.

Was kann Daten(bank)journalismus nun mit diesen statistischen Informationen anfangen? Die grundsätzliche Frage des Journalisten an ein Thema lautet: Welche Geschichte gibt es zu erzählen? Der Ansatz des data-driven journalism ist die Annahme, dass in den Daten Geschichten verborgen sind; die können computergestützt gehoben werden und anhand der so neu entstehenden Datensätze selbst können die entsprechende Geschichten erzählt werden.

Motion Charts-Tutorial: Afghanistan und Bundeswehrlogistikkosten weiterlesen

Fußball und Statistik: Tracking der Spieler per Kamera und per Hand

Tracking Soccer Player
Es ist mittlerweile üblich geworden, etliche zusätzliche statistische Daten zu Fußballspielen und anderen Sportarten jenseits der reinen Ergebnisse zu erhalten. Die Frage lautet: Wie werden die erhoben ? Die Anwort: Sowohl automatisiert als auch per Hand.

Der Auschnitt aus der Infografik oben (pdf) zeigt den Aufbau der SportVU-Technologie. Drei Kameras, die jeweils ein Drittel des Spielfelds betrachten, liefern Informationen an einen Computer, der die Daten zusammenführt und Auskunft über Ballbesitz, Laufstrecke, Standort usw. der einzelnen Spieler, des Balls und der Schiedsrichter liefert – siehe folgendes Video.

Fußball und Statistik: Tracking der Spieler per Kamera und per Hand weiterlesen