DataWrangler Tutorial – Aus gescanntem Dokument wird eine Tabelle

Wrangler Demo Video from Stanford Visualization Group on Vimeo.

Anhand der Rechenschaftsberichte der Parteien für 2009 wird hier gezeigt, wie sich DataWrangler nutzen lässt. Diese Browser-Anwendung der Universität Standford erlaubt eine Echtzeitmanipulation von Datensätzen mittels einer grafischen Benutzeroberfläche. Es ist ein etwas kompliziert anmutendes Tool – aber es lohnt sich damit zu beschäftigen, da es viel Datenarbeit ersparen kann.

Vor zehn Tagen veröffentlichte taz.de zwei Werkzeuge rund um Parteispenden, die wir von OpenDataCity umgesetzt haben. Einmal eine interaktive Karte der Spender für 2009 über 10.000 Euro sowie ein Recherchetool für die 6700 Spenden über 10.000 Euro in den Jahren 1994 bis 2009. Das ist nur die Spitze des Eisberges; bei manchen Parteien machen die undokumentierten Spenden unter 10.000 Euro die Hälfte der gesamten Finanzen aus. Mehr dazu in diesem taz-Kommentar.

Eigentlich hätte das alles schon viel früher erscheinen sollen; die Vorbereitungen dafür liefen schon seit Ende vergangenen Jahres. Doch dann kamen die Umwälzungen in Nordafrika sowie der Tsunami und die GAUs von Japan dazwischen. So rutschte die Geschichte immer weiter nach hinten und das Pech wollte es, dass Spiegel Online ausgerechnet eine Woche früher ebenfalls eine Parteispendenvisualisierung anbot. Die ist recht gelungen und funktional. Glücklicherweise konzentriert sie sich auf Großspenden über 50.000 Euro und bietet nur die Zahlen ab 1998 auf. Auch stellt SPON – entgegen der taz – die grundlegenden Daten nicht zur Weiterverwendung zur Verfügung (hier finden sich die Daten für 1994 bis 2009).

DataWrangler Tutorial – Aus gescanntem Dokument wird eine Tabelle weiterlesen

Dilemma schema.org

Was der neue semantische Web-Standard der Suchmaschinen für Onlinejournalismus bedeutet

Ausschnitt aus der Liste mit Auszeichnungselementen von schema.org

Zeitungssterben ist mittlerweile ein alter Hut. Was aber auf uns zukommt ist Webseitensterben. Onlinemedien, Nachrichten- und Zeitungswebsites werden es zukünftig noch schwerer haben. Das faktische Ableben von netzeitung.de vor einiger Zeit war davon nur ein Vorbote. Die Zwickmühle, tragfähige Erlösmodelle zu entwickeln, bevor sie Ertrag bringen; die Notwendigkeit, in Vorleistung zu gehen, wird noch größer durch schema.org.

Diese neue Auszeichnungssprache haben Anfang Juni Google, Bing und Yahoo Anfang in ungewohnter Allianz etabliert. Sie besteht bislang aus rund 300 Elementen, mit denen sich im HTML-Code der Seite Informationen wie Orte, Personen, Veranstaltungen, Produkte auszeichnen lassen. Der Besucher der Website selbst sieht das nicht, aber die Suchmaschinen, die in regelmässigen Abständen große Teile des Internets immer wieder indexieren, kartieren, „crawlen“ – sie profitieren davon.

Dilemma schema.org weiterlesen

Stefan Wehrmeyer – Open Data und Nahverkehr

Stefan Wehrmeyer über Nahverkehrsdaten,
Berliner Gazette (Creative Commons | sa | by | nc)

Stefan Wehrmeyer studiert in Potsdam am Institut für Softwaresystemtechnik. Sein Projekt Mapnificent stellt Fahrpläne zahlreicher Städte weltweit dynamisch auf einer Karte dar; vor kurzem appellierte er an die Berliner und Brandenburger Nahverkehrsbetriebe, ihre Fahrplandaten zu öffnen. In der Simulation TransitPulse gibt Wehrmeyer einen Ausblick darauf, was mit solchen Informationen möglich wäre.

Herr Wehrmeyer, Sie versuchen seit einiger Zeit, Verkehrsunternehmen zu bewegen, ihre Fahrpläne über offene Schnittstellen anzubieten. Wie ist die Resonanz?

Stefan Wehrmeyer: Die Resonanz derjenigen, die am Nahverkehr interessiert sind, war sehr positiv. Die Forderung nach offenen Fahrplandaten leuchtet den meisten ein. Nur die Verkehrsunternehmen selbst reagieren eher reserviert.

Speziell in Berlin scheint es Probleme zu geben. Worum geht es dabei?

Wehrmeyer: Der Verkehrsbund Berlin Brandenburg (VBB) reagierte auf den Appell mit Unverständnis: die Daten seien doch da, man müsse nur fragen. Allerdings gab es keinen Bereich auf der Website der Berliner Verkehrsbetriebe (BVG) oder des VBB, der überhaupt die Herausgabe von Daten an Entwickler erörtert. Der VBB hat nun eine Seite für Entwickler angelegt und das ist ein guter erster Schritt. Die dort veröffentlichten Bedingungen schränken aber leider die Nutzung sehr ein.

Was stört Sie an den Nutzungsbedingungen?

Wehrmeyer: Mich stört einiges. Zum Beispiel, dass die Daten nicht unter einer freien Lizenz veröffentlicht werden. Auch die Verknüpfung mit anderen Daten, ein sogenanntes Mashup, muss explizit erlaubt werden. Die Erhebung statistischer Daten zur Qualität des Nahverkehrsangebots ist gleich ganz verboten. Außerdem ist in den Bedingungen die Rede von Geheimhaltung, von Wirtschaftsprüfung und von Prüfung von Sicherheitssystemen. Da hat es die Rechtsabteilung definitiv zu gut gemeint. Durch solche Bedingungen steigt die Hürde enorm, etwas mit den Daten zu erstellen. Auf Nachfrage beteuerte der VBB, alles nicht so strikt zu meinen, aber leider lesen sich die Nutzungsbedingungen wie ein Knebelvertrag.

Stefan Wehrmeyer – Open Data und Nahverkehr weiterlesen