Yahoo Pipes und Twitterfeed-Tutorial: Bundestag-RSS filtern

yahoo pipes schemaYahoo Pipes ist ein großartiges Werkzeug, um Informationen von Websiten oder aus anderen Datenquellen abzugreifen, zusammenzuführen und automatisiert zu filtern. Es benötigt keine großartigen Programmierkenntnisse, sondern erlaubt logische Operationen über eine grafische Oberfläche. Die so gewonnen Informationen können dann in verschiedenen Formaten veröffentlich werden (Mashup). Eben ist das Werkzeug, für dessen Nutzung ein Yahoo-Account benötigt wird, in der zweiten Version erschienen. Das Update nach drei Jahren soll schneller arbeiten und demnächst neue Funktionen erlauben, heißt es im offiziellen Blog.

Hier wird im folgenden Beschrieben, wie aus dem RSS-Feed der Bundestagswebsite alle Drucksachen, die Anfragen an und Antworten der Bundesregierungen sind, herausgesiebt werden. Weiter wird gezeigt, wie sich die Links auf das pdf-Dokument automatisch auf Twitter (twitter.com/anfrage) veröffentlichen lassen.

Wofür ist das nützlich? Nur ein kleiner Teil der Drucksachen des Bundestages sind Anfragen der Opposition bzw. Antworten der Bundesregierung auf  diese (ein anderes zu filterndes Thema wären bspw. die „Anträge). Die Anfragen selbst enthalten nicht selten interessante Informationen; die Antworten wiederrum verraten einiges über Regierungshandeln – nicht zuletzt durch die Verweigerung von Informationen. Insofern zeigt das im folgenden erklärte Verfahren ein Weg zur Arbeitserleichterung in der Recherche und dem Monitoring auf – an der alle teilhaben können, die ein RSS-Reader nutzen oder sich über Twitter mit Informationen versorgen.

Yahoo Pipes und Twitterfeed-Tutorial: Bundestag-RSS filtern weiterlesen

Das Gesellschaftswerkzeug

Das Internet wird auch in Deutschland erwachsen: Ein Verbund von Politikanwendungen wird die Bürger in naher Zukunft ermächtigen, wieder selbst Entscheidungen zu treffen

Illustration von Der Freitag

Einöde. So lässt sich jener Teil der Internetlandschaft beschreiben, der von der Bundesregierung bestellt wird. So oft auch von E-Demokratie die Rede ist, so wenig wird von den Bundesministerien dafür getan. Anders in den USA und Großbritannien: Dort werden OpenGovernment-Initiativen vorangetrieben, wird Regierungs- und Verwaltungshandeln transparenter, soll die Teilhabe und Mitsprache der Bürger verbessert werden. Einiges daran ist kritikwürdig – es drückt aber eine realistische Beurteilung der Potenziale des Internets für gesellschaftliche Prozesse aus.

Dagegen zeugen etwa die in der vergangenen Woche verkündeten 14 Thesen des Bundesinnenministers zur Netzpolitik von großem Nachholbedarf. Zwar herrschte Erleichterung darüber, dass Thomas de Maizière sich überhaupt konstruktiv mit dem Thema auseinandersetzen will. Doch hatten die vorausgehenden „netzpolitischen Dialoge“ gezeigt, dass der CDU-Politiker den Blick nicht über den Tellerrand richtet. Dass die US-Regierung unter data.gov zahlreiche Datensätze aus allen Ressorts veröffentlicht, war dem Minister nach eigenem Bekunden sogar unbekannt.

Das Gesellschaftswerkzeug weiterlesen

Motion Charts-Tutorial: Afghanistan und Bundeswehrlogistikkosten

Wie hoch sind die Kosten des Kriegs in Afghanistan? Auf eine diesbezügliche kleine Anfrage der Fraktion hat Tom Strohschneider in seinem Freitagblog aufmerksam gemacht (in den Kommentaren dort geht es bspw. um die Validität der Daten). Auf die Anfrage von der Partei Die Linke im Bundestag hatte es unlängst eine Antwort der Bundesregierung (pdf – Drucksache 17/2026) gegeben. Sie enthält zahlreiches statistisches Material, etwa über die Anzahl und Typen des militärischen Geräts – darunter beispielweise einige dutzend Flugdrohnen.

Im Folgenden werden die Kosten für die Logistikdienstleistungen, die seitens der Bundeswehr extern vergeben werden, genauer betrachtet. Dafür wurden die Daten aus dem pdf extrahiert, in eine sinnvolle Datenstruktur gebracht und dann mittels Googles Texte&Tabellen (Docs) in einer interaktiven Motion Chart (Bewegungsdiagramm) visualisiert (siehe oben). Die einzelnen Arbeitsschritte dafür werden weiter unten erläutert. Der genutzte Datensatz findet sich hier.

Was kann Daten(bank)journalismus nun mit diesen statistischen Informationen anfangen? Die grundsätzliche Frage des Journalisten an ein Thema lautet: Welche Geschichte gibt es zu erzählen? Der Ansatz des data-driven journalism ist die Annahme, dass in den Daten Geschichten verborgen sind; die können computergestützt gehoben werden und anhand der so neu entstehenden Datensätze selbst können die entsprechende Geschichten erzählt werden.

Motion Charts-Tutorial: Afghanistan und Bundeswehrlogistikkosten weiterlesen

Fußball und Statistik: Tracking der Spieler per Kamera und per Hand

Tracking Soccer Player
Es ist mittlerweile üblich geworden, etliche zusätzliche statistische Daten zu Fußballspielen und anderen Sportarten jenseits der reinen Ergebnisse zu erhalten. Die Frage lautet: Wie werden die erhoben ? Die Anwort: Sowohl automatisiert als auch per Hand.

Der Auschnitt aus der Infografik oben (pdf) zeigt den Aufbau der SportVU-Technologie. Drei Kameras, die jeweils ein Drittel des Spielfelds betrachten, liefern Informationen an einen Computer, der die Daten zusammenführt und Auskunft über Ballbesitz, Laufstrecke, Standort usw. der einzelnen Spieler, des Balls und der Schiedsrichter liefert – siehe folgendes Video.

Fußball und Statistik: Tracking der Spieler per Kamera und per Hand weiterlesen

Robotorjournalismus: Berichterstattung per Algorithmus

Vergangenes Wochenende sprach die Medienjournalistin Ulrike Langer im Deutschlandradio Wissen zum Thema „Algorithmen machen Schlagzeilen„. Die acht Minuten sind hörenswert; u.a. geht es auch um den Wandel bei den Nachrichtenagenturen.

Die Ära des Maschinenjournalismus dämmert herauf und wird noch einiges an Arbeitsplätzen in Redaktionen vernichten – ähnlich wie Arbeiter am Fließband in der Schwerindustrie schon vor Jahrzehnten durch Roboter ersetzt wurden.  So dürfte es nach „demand media“  nicht mehr weit sein zu „demand news“.  Den Weg in diese Richtung weist das Projekt „News At Seven“ des „Intelligent Information Labatory“ der Northwestern University in den USA:  Nachrichtensprecher werden automatisiert (siehe Video). So werden beispielsweise Filmbesprechungen über Portale, die Wertung via User und Kritiker sammeln (IMDB, Rotten Tomato, Metacritic) ausgewertet und das Skript für eine Sendung on-demand auf Grund eines Suchbegriffs erzeugt: Die beiden animierten Moderatoren sprechen mit einer künstlichen Stimme und können auf eine Floskel- und Redewendung Datenbank zurückgreifen.

Robotorjournalismus: Berichterstattung per Algorithmus weiterlesen

Überblick über Politik- und Monitoringsoftware

Für einen kommenden Vortrag auf einem Journalisten-Workshop ist diese Übersichtskarte entstanden. Sie bildet nicht-staatliche Politik- und Monitoringsoftware ab. Die Angebote werden von Privatpersonen, Vereinen und Firmen betrieben. Ein Teil ist noch in der Entwicklung, andere laufen schon seit Monaten oder Jahren.

Die erste Version der Karte (png) zeigt ein Ökosystem von Anwendungen, das noch am entstehen ist – aber eindeutig wächst. Wenn die Angebote alle im Betrieb sind und fleissig genutzt werden, dürfte sich aus dem Zusammenspiel der Informationen mittelfristig einiges in der politischen Landschaft bewegen. Auch für Journalisten dürften so neue Erkenntnisse – aber auch neue Formen der Berichterstattung – möglich werden.

Etwa durch OpenHaushalt, das in einer Alpha-Version schon online ist, um den Bundeshaushalt zu  öffnen und transparent zu machen. Bislang liegen die Haushalte seit 2003 vor; später soll man wohl ausführlich suchen und einzelnen Haushaltsposten kommentieren können.

Kurz vor der Fertigstellung befindet sich Lobbypedia, ein Lobbyregister –  es wird allerdings zuerst nicht von allen bearbeitet werden können. Interessant dürfte auch OpenBundestag werden: Dort sollen unter anderem der Stand von Gesetzgebungsverfahren abgebildet werden. Die beiden letzteren Anwendungen sollen im Juni oder Juli diesen Jahres starten.

Über Software für Bürger(beteiligung)

Reparier‘ meine Straße – eine klare Ansage: So heißt ein Dienst aus Großbritannien – fixmystreet.com. Dahinter steckt mal wieder mySociety (siehe auch den Überblick zur Wähler Software). Bei FixMyStreet kann man Schäden wie eine kaputte Straßenlaterne auf einer Katasterkarte eintragen. Per Mobiltelefon lässt sich mittlerweile gleich noch ein Foto hochladen. Die zuständige Verwaltung wird über den Eintrag in Kenntnis gesetzt und kann in der Software Rückmeldung geben, ob und wann der Schaden behoben wird. Schlicht, simpel, sinnvoll. Während in England FixMyStreet von einer NGO initiert wurde, hat das Land Brandenburg – bislang einzigartig in Dtl. – die Idee von Verwaltungsseite aufgegriffen: Der Maerker.Brandenburg nuzt auf ähnliche Weise die Methode des „Crowdsourcing“.

Über Software für Bürger(beteiligung) weiterlesen

Übersicht: Software für Wähler

Mitte Juli soll es endlich so weit sein. Dann will die Plattform meinedemokratie.de starten – der Launch wurde schon einige Male verschoben. Das Angebot, so heißt es in dem dazugehörigen Blog, versteht sich „als zentrale Informationsplattform für alle politischen (und gesellschaftlichen) Beteiligungsmöglichkeiten.“

meinedemokratie.de, so scheint es, setzt auf Partizipationsmöglichkeiten und will sich nicht wie viele andere Politik-Anwendungen an der parlamentarischen Politik abarbeiten. Doch steht vor der Partizipation immer auch Information und für das Monitoring parlamentarischer Prozesse gibt es ein paar gute Softwarelösungen:

Übersicht: Software für Wähler weiterlesen

Bericht vom Open Democracy Camp

Auf dem Open Democracy Camp ging es um die Zukunft von webbasierter politischer Beteiligung von unten

„Die größte Gefahr ist, dass unsere Projekte nur Beteiligung vortäuschen und zu einer Art Kummerkasten verkommen“ hieß es auf dem OpenDemocracyCamp dieses Wochenende in Berlin. Es ging um Partizipation und internetbasierte System für direkte Demokratie. Dabei wird vor allem von „Liquid Democracy“ gesprochen: Jeder kann bei Abstimmungen seine Stimme zu bestimmten Themen an andere Personen delegieren – oder selbst abstimmen. Die Verteilung der eigenen Stimmacht kann jederzeit fließend geändert werden. Per webbasierten Systemen – meinen die Befürworter des Ansatzes – könne diese Idee realisiert werden.

Organisatoren des OpenDemocracyCamps waren der Liquid Democracy e.V. (liqd.de) und das Opendata Network; beides Gruppen, die sich letztes Jahr erst gründeten. Wie auf Barcamps üblich stellten die rund 40 Teilnehmer des OpenDemocracyCamps ihr Programm selber zusammen: Erst wurden Vorschläge für Vorträge kurz präsentiert; gab es Interesse im Publikum an der „Session“ bekam sie Platz im Ablauf. So fanden sich am Samstagmittag 15 Themen, die mal parallel, mal kürzer oder länger präsentiert und diskutiert wurden: Es ging um grundlegende Prinzipien von Basisdemokratie, konkrete Softwareprojekte, Ideenmärkte, Daten-Schnittstellen für Transparenz in Organisationen bis hin zu Idee einer „Open Transport Map“ (siehe auch das Online-Protokoll unter piratepad.net/odc10). Letztere soll Fahrpläne von allen möglichen Verkehrsmitteln zusammenführen und zugänglich machen. Laut dem Ideengeber könne das Vorhaben klappen: „Es gibt einen Haufen Bahn-Nerds“, meinte er.

Bericht vom Open Democracy Camp weiterlesen

Datenjournalismus: Folien zu der re:puclica Session

Auf der re:publica habe ich eine Einführung in das Thema Datenjournalismus gegeben. Gut 20 Leute hörten zu. Das in der Präsentation angeführte Beispiel über die Anzahl der gefallenen Bundeswehrsoldaten in Afghanistan war nicht sehr gut gewählt. Nicht wegen dem Thema, aber wegen mangelnder Tiefe durch den geringen Datensatz und die damit einhergehende Probleme bei der Visualisierung und dem geringen Erkenntnisgewinn. (Über die ungeeigneten Grundeinstellung der Google Motion Chart (Gapminder-Derivat) schreibt auch Christiane Schulzki-Haddouti in ihrer lesenswerten OpenData-Serie für Zeit Online in Sachen Parteispenden.)

Interessantes Feedback gab es jedenfalls; sicher richtig war die Anmerkung, dass Data Driven Journalism grundsätzlich bedeutet, dass aus Datensätzen Geschichten gewonnen werden, also von Daten „getrieben“ werden. Mehr oder minder Konsens war, dass Datenjournalismus noch am Anfang stünde; nicht zuletzt deswegen, da gerade erst die entsprechenden Werkzeuge/Softwaretools entstehen bzw. frei verfügbar sind (siehe Gephi) – und die wollen ersteinmal beherrscht werden.

Auf dem am Wochenende folgenden Hackday wurde eine englischsprache Mailingliste zum Thema Data Driven Journalism ins Leben gerufen.