Motion Charts-Tutorial: Afghanistan und Bundeswehrlogistikkosten

Wie hoch sind die Kosten des Kriegs in Afghanistan? Auf eine diesbezügliche kleine Anfrage der Fraktion hat Tom Strohschneider in seinem Freitagblog aufmerksam gemacht (in den Kommentaren dort geht es bspw. um die Validität der Daten). Auf die Anfrage von der Partei Die Linke im Bundestag hatte es unlängst eine Antwort der Bundesregierung (pdf – Drucksache 17/2026) gegeben. Sie enthält zahlreiches statistisches Material, etwa über die Anzahl und Typen des militärischen Geräts – darunter beispielweise einige dutzend Flugdrohnen.

Im Folgenden werden die Kosten für die Logistikdienstleistungen, die seitens der Bundeswehr extern vergeben werden, genauer betrachtet. Dafür wurden die Daten aus dem pdf extrahiert, in eine sinnvolle Datenstruktur gebracht und dann mittels Googles Texte&Tabellen (Docs) in einer interaktiven Motion Chart (Bewegungsdiagramm) visualisiert (siehe oben). Die einzelnen Arbeitsschritte dafür werden weiter unten erläutert. Der genutzte Datensatz findet sich hier.

Was kann Daten(bank)journalismus nun mit diesen statistischen Informationen anfangen? Die grundsätzliche Frage des Journalisten an ein Thema lautet: Welche Geschichte gibt es zu erzählen? Der Ansatz des data-driven journalism ist die Annahme, dass in den Daten Geschichten verborgen sind; die können computergestützt gehoben werden und anhand der so neu entstehenden Datensätze selbst können die entsprechende Geschichten erzählt werden.

Motion Charts-Tutorial: Afghanistan und Bundeswehrlogistikkosten weiterlesen

Fußball und Statistik: Tracking der Spieler per Kamera und per Hand

Tracking Soccer Player
Es ist mittlerweile üblich geworden, etliche zusätzliche statistische Daten zu Fußballspielen und anderen Sportarten jenseits der reinen Ergebnisse zu erhalten. Die Frage lautet: Wie werden die erhoben ? Die Anwort: Sowohl automatisiert als auch per Hand.

Der Auschnitt aus der Infografik oben (pdf) zeigt den Aufbau der SportVU-Technologie. Drei Kameras, die jeweils ein Drittel des Spielfelds betrachten, liefern Informationen an einen Computer, der die Daten zusammenführt und Auskunft über Ballbesitz, Laufstrecke, Standort usw. der einzelnen Spieler, des Balls und der Schiedsrichter liefert – siehe folgendes Video.

Fußball und Statistik: Tracking der Spieler per Kamera und per Hand weiterlesen

Robotorjournalismus: Berichterstattung per Algorithmus

Vergangenes Wochenende sprach die Medienjournalistin Ulrike Langer im Deutschlandradio Wissen zum Thema „Algorithmen machen Schlagzeilen„. Die acht Minuten sind hörenswert; u.a. geht es auch um den Wandel bei den Nachrichtenagenturen.

Die Ära des Maschinenjournalismus dämmert herauf und wird noch einiges an Arbeitsplätzen in Redaktionen vernichten – ähnlich wie Arbeiter am Fließband in der Schwerindustrie schon vor Jahrzehnten durch Roboter ersetzt wurden.  So dürfte es nach „demand media“  nicht mehr weit sein zu „demand news“.  Den Weg in diese Richtung weist das Projekt „News At Seven“ des „Intelligent Information Labatory“ der Northwestern University in den USA:  Nachrichtensprecher werden automatisiert (siehe Video). So werden beispielsweise Filmbesprechungen über Portale, die Wertung via User und Kritiker sammeln (IMDB, Rotten Tomato, Metacritic) ausgewertet und das Skript für eine Sendung on-demand auf Grund eines Suchbegriffs erzeugt: Die beiden animierten Moderatoren sprechen mit einer künstlichen Stimme und können auf eine Floskel- und Redewendung Datenbank zurückgreifen.

Robotorjournalismus: Berichterstattung per Algorithmus weiterlesen

Überblick über Politik- und Monitoringsoftware

Für einen kommenden Vortrag auf einem Journalisten-Workshop ist diese Übersichtskarte entstanden. Sie bildet nicht-staatliche Politik- und Monitoringsoftware ab. Die Angebote werden von Privatpersonen, Vereinen und Firmen betrieben. Ein Teil ist noch in der Entwicklung, andere laufen schon seit Monaten oder Jahren.

Die erste Version der Karte (png) zeigt ein Ökosystem von Anwendungen, das noch am entstehen ist – aber eindeutig wächst. Wenn die Angebote alle im Betrieb sind und fleissig genutzt werden, dürfte sich aus dem Zusammenspiel der Informationen mittelfristig einiges in der politischen Landschaft bewegen. Auch für Journalisten dürften so neue Erkenntnisse – aber auch neue Formen der Berichterstattung – möglich werden.

Etwa durch OpenHaushalt, das in einer Alpha-Version schon online ist, um den Bundeshaushalt zu  öffnen und transparent zu machen. Bislang liegen die Haushalte seit 2003 vor; später soll man wohl ausführlich suchen und einzelnen Haushaltsposten kommentieren können.

Kurz vor der Fertigstellung befindet sich Lobbypedia, ein Lobbyregister –  es wird allerdings zuerst nicht von allen bearbeitet werden können. Interessant dürfte auch OpenBundestag werden: Dort sollen unter anderem der Stand von Gesetzgebungsverfahren abgebildet werden. Die beiden letzteren Anwendungen sollen im Juni oder Juli diesen Jahres starten.

Über Software für Bürger(beteiligung)

Reparier‘ meine Straße – eine klare Ansage: So heißt ein Dienst aus Großbritannien – fixmystreet.com. Dahinter steckt mal wieder mySociety (siehe auch den Überblick zur Wähler Software). Bei FixMyStreet kann man Schäden wie eine kaputte Straßenlaterne auf einer Katasterkarte eintragen. Per Mobiltelefon lässt sich mittlerweile gleich noch ein Foto hochladen. Die zuständige Verwaltung wird über den Eintrag in Kenntnis gesetzt und kann in der Software Rückmeldung geben, ob und wann der Schaden behoben wird. Schlicht, simpel, sinnvoll. Während in England FixMyStreet von einer NGO initiert wurde, hat das Land Brandenburg – bislang einzigartig in Dtl. – die Idee von Verwaltungsseite aufgegriffen: Der Maerker.Brandenburg nuzt auf ähnliche Weise die Methode des „Crowdsourcing“.

Über Software für Bürger(beteiligung) weiterlesen

Übersicht: Software für Wähler

Mitte Juli soll es endlich so weit sein. Dann will die Plattform meinedemokratie.de starten – der Launch wurde schon einige Male verschoben. Das Angebot, so heißt es in dem dazugehörigen Blog, versteht sich „als zentrale Informationsplattform für alle politischen (und gesellschaftlichen) Beteiligungsmöglichkeiten.“

meinedemokratie.de, so scheint es, setzt auf Partizipationsmöglichkeiten und will sich nicht wie viele andere Politik-Anwendungen an der parlamentarischen Politik abarbeiten. Doch steht vor der Partizipation immer auch Information und für das Monitoring parlamentarischer Prozesse gibt es ein paar gute Softwarelösungen:

Übersicht: Software für Wähler weiterlesen

Bericht vom Open Democracy Camp

Auf dem Open Democracy Camp ging es um die Zukunft von webbasierter politischer Beteiligung von unten

„Die größte Gefahr ist, dass unsere Projekte nur Beteiligung vortäuschen und zu einer Art Kummerkasten verkommen“ hieß es auf dem OpenDemocracyCamp dieses Wochenende in Berlin. Es ging um Partizipation und internetbasierte System für direkte Demokratie. Dabei wird vor allem von „Liquid Democracy“ gesprochen: Jeder kann bei Abstimmungen seine Stimme zu bestimmten Themen an andere Personen delegieren – oder selbst abstimmen. Die Verteilung der eigenen Stimmacht kann jederzeit fließend geändert werden. Per webbasierten Systemen – meinen die Befürworter des Ansatzes – könne diese Idee realisiert werden.

Organisatoren des OpenDemocracyCamps waren der Liquid Democracy e.V. (liqd.de) und das Opendata Network; beides Gruppen, die sich letztes Jahr erst gründeten. Wie auf Barcamps üblich stellten die rund 40 Teilnehmer des OpenDemocracyCamps ihr Programm selber zusammen: Erst wurden Vorschläge für Vorträge kurz präsentiert; gab es Interesse im Publikum an der „Session“ bekam sie Platz im Ablauf. So fanden sich am Samstagmittag 15 Themen, die mal parallel, mal kürzer oder länger präsentiert und diskutiert wurden: Es ging um grundlegende Prinzipien von Basisdemokratie, konkrete Softwareprojekte, Ideenmärkte, Daten-Schnittstellen für Transparenz in Organisationen bis hin zu Idee einer „Open Transport Map“ (siehe auch das Online-Protokoll unter piratepad.net/odc10). Letztere soll Fahrpläne von allen möglichen Verkehrsmitteln zusammenführen und zugänglich machen. Laut dem Ideengeber könne das Vorhaben klappen: „Es gibt einen Haufen Bahn-Nerds“, meinte er.

Bericht vom Open Democracy Camp weiterlesen

Datenjournalismus: Folien zu der re:puclica Session

Auf der re:publica habe ich eine Einführung in das Thema Datenjournalismus gegeben. Gut 20 Leute hörten zu. Das in der Präsentation angeführte Beispiel über die Anzahl der gefallenen Bundeswehrsoldaten in Afghanistan war nicht sehr gut gewählt. Nicht wegen dem Thema, aber wegen mangelnder Tiefe durch den geringen Datensatz und die damit einhergehende Probleme bei der Visualisierung und dem geringen Erkenntnisgewinn. (Über die ungeeigneten Grundeinstellung der Google Motion Chart (Gapminder-Derivat) schreibt auch Christiane Schulzki-Haddouti in ihrer lesenswerten OpenData-Serie für Zeit Online in Sachen Parteispenden.)

Interessantes Feedback gab es jedenfalls; sicher richtig war die Anmerkung, dass Data Driven Journalism grundsätzlich bedeutet, dass aus Datensätzen Geschichten gewonnen werden, also von Daten „getrieben“ werden. Mehr oder minder Konsens war, dass Datenjournalismus noch am Anfang stünde; nicht zuletzt deswegen, da gerade erst die entsprechenden Werkzeuge/Softwaretools entstehen bzw. frei verfügbar sind (siehe Gephi) – und die wollen ersteinmal beherrscht werden.

Auf dem am Wochenende folgenden Hackday wurde eine englischsprache Mailingliste zum Thema Data Driven Journalism ins Leben gerufen.

Hackday: Öffnet euch oder ihr werdet geöffnet

Wer bekommt die meisten Agrarsubventionen, wo gehen eigentlich die Gelder des Konjunkturprogramms hin und wer sagt was im Bundestag? Wer sich für solche Fragen interessiert, konnte einige Antworten auf dem ersten deutschen Hackday in Berlin finden. Auf der Veranstaltung, die sich am vergangenen Wochenende unmittelbar an die Netzkonferenz re:publica anschloss, wurde sich zwei Tage lang über Datensätze aus Politik und Verwaltung hergemacht. Unter den 40 Teilnehmern, unter anderem auch aus England und Dänemark, fanden sich nur zwei Frauen.

Hackday: Öffnet euch oder ihr werdet geöffnet weiterlesen

Data Driven Journalism: Versuch einer Definition

Das Internet ist nicht arm an Buzzwords – Schlagworten, die für einige Zeit Konjunktur haben und sich eben etablieren oder wieder verschwinden. Data Driven Journalism (DDJ) geistert vermehrt seit vergangenem Jahr durch das Web. Im März 2009 startet die englische Tageszeitung The Guardian auf ihrer Website das Datablog; es ist eingebettet in einen Datastore und dürfte bislang als Referenz für DDJ gelten. Einer breiteren Öffentlichkeit wurde das Thema „Datenjournalismus“ in Deutschland durch die Zeitschrift „M – Menschen Machen Medien“ im März 2010 näher gebracht. Im Periodikum des Fachbereichs Medien der Gewerkschaft ver.di mit einer Auflage von 50.000 ging es um die „Spannende Recherche im Netz“.

Begonnen hat es allerdings schon 2006: Als eine Art Manifest in Sachen DDJ gilt der Text „A fundamental way newspaper sites need to change“ von Adrian Holovaty. Er meinte, dass viele Informationen bereits in einer strukturierten Form (=Datensätze) vorliegen oder sinnvollerweise in einer solchen abgelegt werden könnten. Als Beispiel nannte er einen Brand in einem Wohnhaus – es gäbe Fakten, die immer gleich sind – letztlich die berühmten W-Fragen: Wo, wann, wie viele Betroffene, Verletzte, Tote, wie viele Feuerwehrmänner waren im Einsatz etc.

Zeitungsredaktionen usw. könnten also Datenbanken über Ereignisse mit einer konsistenten Datenstruktur aufbauen, so Holovaty, die sowohl für die eigenen Recherche als auch online als Angebot für die eigenen Nutzer/innen bereitgehalten werden können – man denke beispielsweise an eine Karte, auf der sich die Feuer anzeigen lassen und eben nach diversen Kriterien Filtern lassen.

Was ist also das Neue am Daten-getriebenen Journalismus?

Die Recherche in Datensätzen, etwa Statistiken, ist wahrlich nichts Neues. Das gilt auch für die rechnergestützte Recherche, das Computer-assisted-reporting (CAR), welches seit Jahrzehnten praktiziert wird.

Data Driven Journalism: Versuch einer Definition weiterlesen