Neues von der Definition des Datenjournalismus’

Anfang des Monats ging es auf der englischprachigen ddj-Mailingliste um die Definition des Datenjournalismus’.

Nicolas Kayser-Bril (@nicolaskb) beklagte, dass es nach wie vor keine treffende Definition gebe. Deswegen nahm er es in Angriff, den englischsprachigen Wikipediaeintrag zu „datajournalism“ und anverwandte Begriffe zu überarbeiten. Er stellte auf der Liste sein Vorhaben wie folgt vor:

Datenjournalismus sei demnach ein Mantel-/Containerbegriff für einen Trend im Journalismus und des Informationsmanagments. Er sei Folge der zunehmenden Menge an numerischen Daten in der Produktion und Verbreitung von Informationen. Ebenfalls ginge es um einen Zusammenarbeit von Inhalteerstellern – Journalisten – und Designern, Progammieren und Statistikern.

Weiterlesen

Self-education Python study group

What’s the plan? We meet once a week online in the evening to study together.

The Peer-to-Peer-University platform will be used for the self-education Python course starting on November 1st, 2011. More about the P2PU-platform down below.

The course is self-organized and thus free. But its very important you are motivated to learn together with others and be an engaging member of the group.

Every week we decide on how much exercices out of the course book Learning Python the hard way we are going to work on the coming week. (The html-version of the book is for free; pdf/ePub available for 3 USD.)

Sign-up here! Press “Participate” on the left of the screen.

Weiterlesen

Claudia Schwegmann – OpenAid: Open Data in der Entwicklungszusammenarbeit

Claudia Schwegmann founder openaid germany

Claudia Schwegmann hat 2009 die Organisation OpenAid gegründet. Selbst hat sie einige Jahre in der Entwicklungzusammenarbeit gearbeitet. Im Interview erklärt sie die Hintergründe zu der Konferenz Open Aid Data Ende September in Berlin.

Frau Schwegmann, warum haben Sie Open Aid gegründet?

Claudia Schwegmann: In meiner Arbeit in der Entwicklungszusammenarbeit (EZ) habe ich mich zuletzt mit der Wirkung von Entwicklungsprojekten befasst. Eine wichtige Voraussetzung für Wirkung ist Feedback. Die Empfänger der Hilfe müssen Rückmeldung über die Qualität der EZ geben können. Das ist nur möglich, wenn sie zu einem gewissen Grad die Prozesse und Planung kennen. Der Mangel an Informationen in der EZ war letztlich ausschlaggebend dafür OpenAid zu gründen. Später bin ich dann auf die 2008 gegründete “International Aid Transparency Initiative” IATI gestoßen, mit der OpenAid sich jetzt schwerpunktmäßig befasst.

Worum geht es bei IATI genau?

Schwegmann: Dieses Frühjahr wurden die IATI-Kriterien für einen Standard für Daten zu Entwicklungsvorhaben schließlich festgeschrieben. In einem maschinenlesbarem Format, als Open Data, sollen fünf grundlegende Informationen über Entwicklungsvorhaben gespeichert werden: Wer ist beteiligt? Worum geht es? Was soll bis wann erreicht werden? Wie lassen sich die Vorhaben einordnen und was sind die finanziellen Details?

Weiterlesen

Die große Verantwortung der Piraten

Die Piratenpartei sitzt im Berliner Abgeordnetenhaus. Und das mit Recht. Nun lastet eine große Verantwortung auf ihnen. Sie müssen zeigen, wie sich transparente politische Arbeit auch innerparlamentarisch umsetzen lässt. Dann wird den anderen Parteien nichts anders übrig bleiben, selber offener zu werden.

Es erstaunt wenig, dass auch am Wahlabend Politiker der etablierten Parteien sich über programmatische Punkte der Piraten mokierten. Etwa über die Forderungen nach dem kostenlosen öffentlichen Personennahverkehr. Oder nach einer liberalen Drogenpolitik. Punkte übrigens die auch bei den Jusos, Linken und Grünen immer wieder eine Rolle spielen. Themen, an die sich die etablierten Politikfunktionäre aus Bequemlichkeit, versteckt hinter lauten Sachzwängen und vor lauter Denkverbote nicht heranwagen. Aus Angst vor Lobbyverbänden und der Boulevardpresse bleibt ihnen nicht anders übrig, als zu versuchen, andere Herangehensweisen ins Lächerliche zu ziehen.

Weiterlesen

Datenjournalismus ist eine große Chance

msnbc hurricane tracker

Seit vergangenem Jahr ist weitläufig bekannt: Onlinejournalismus kann mit großen Datensätzen eine neue Form der Berichterstattung leisten – Stichwort WikiLeaks. Der so genannte Datenjournalismus oder data-driven-journalism hat nützliche Erzählmethoden hervorgebracht. Der umstrittene Julian Assange spricht auch von „wissenschaftlichen Journalismus“, der sich ausschließlich an der Faktenlage sowie den vorliegenden Daten orientiert und die Meinung sowie Wertung des Autors gänzlich zurücktreten lässt. Und schon 2006 legte der programmierende Journalist Adrian Holovaty aus den USA dar, warum sich Nachrichtenseiten im Netz angesichts der wachsenden Datenmenge fundamental ändern sollten.

Jüngst war zu beobachten, wie sinnvoll Datenjournalismus auch in der tagesaktuellen Berichterstattung sein kann: Während der Hurrikan Irene drohte, New York mit voller Wucht zu treffen, boten einige Onlinemedien in den USA interaktive Visualisierungen an. Diese beruhten auf Open Data der US-Wetterbehörde und boten die Möglichkeit, den voraussichtlichen Weg des Hurrikans vorzuzeichnen. Siehe etwa die New York Times (NYT) oder MSNBC (die jeden Sturm verfolgen). Darüber hinaus bot die NYT eine interaktive Karte mit den Evakuierungszonen und zeigte die Folgen des Sturms für die Region.

Weiterlesen im Open-Data-Blog auf zeit.de

Der Freitag: Titelthema Open Data

Unter der Überschrift “Das virtuelle Gold” widmet die Wochenzeitung Der Freitag in der aktuellen Ausgabe vom 4. August 2011 sein Titelthema Open Data (Bild oben von Der Freitag). Es findet sich ein Interview zum Informationsfreiheitgesetz in Bremen, wo entgegen anderer Bundesländern eine Veröffentlichungspflicht öffentlicher Informationen herrscht. Ebenfalls gibt es eine Übersicht über diverse Open-Data-Projekte und Themen. In meinem Datenblog in der Freitag-Community habe ich eine überarbeitete Fassung des Open-Data-Glossars veröffentlicht und für das Titelthema den Text “Flankenschutz nötig” verfasst:

Daten sind bares Geld wert. Öffnen Staat und Wirtschaft ihre Tresore, hilft das allen – oder macht wenige reich. Was jetzt zu tun ist

Die Euphorie hält an. Die Offenlegung staatlicher und anderer Datenbestände von öffentlichem Interesse – kurz Open Data – kann mehr Demokratie ermöglichen, aber auch neue Geschäftsmodelle erschließen. So sehen es die Befürworter. Und obwohl diese Erwartungen bislang nur zum Teil erfüllt wurden, greift das Prinzip weltweit um sich. Im Kern geht es dabei darum, weitgehend alle nicht personenbezogenen Informationen, die Politik- und Verwaltungsapparaten vorliegen, in maschinenlesbaren Datensätzen zu veröffentlichen. Damit die Daten aber wirklich als „offen“ bezeichnet werden können, müssen sie von Bürgern weiterverwendet werden dürfen – also unter einer entsprechenden Lizenz stehen, die das kostenfrei erlaubt.

Datenanalyse gilt als eines der kommenden „großen Dinger“ im Netz, erste Umrisse einer neuen, datenzentrierten Wirtschaft zeichnen sich ab. Immer mehr Menschen nutzen Geräte, die Informationen digital speichern. Da immer mehr dieser Geräte auch miteinander vernetzt werden, wächst die weltweite Datenmenge exponentiell:Der Economist hat ausgerechnet, dass sie sich alle fünf Jahre verzehnfacht. Nun gilt es, die Spreu vom Weizen zu trennen und die nutzbringenden Informationen aus diesem Datenberg auszusortieren.

Seit zwei Jahren fällt der Blick verstärkt auf die Daten im Bereich von Politik und Verwaltung, die in deren digitalisierten Aktenschränken massenhaft gehortet werden.

Weiterlesen auf freitag.de

 

Programming Journalist: Python Fernkurs

UPADTE 22.09.2011: Am 1. November 2011 startet ein selbstorganisierter Python-Fernkurs.

UPDATE 24.8.11: Das Feedback zu dem unten skizzierten Kurs war gemischt; in der Form wird er deswegen nicht stattfinden. Es gab auf dem letzten Berliner Datenjournalismus-Treffen dann die Überlegung, einen selbstorganisierten kostenfreien Fernkurs anhand des Buches Learn Python the hard way zu organisieren. Wesentlich konkreter ist diese Überlegung allerdings bislang nicht gediehen. Die Fragen sind:

  • Wer kümmert sich (mit)?
  • Mittels welcher Lernplattform?
  • Wann geht es los?

Anmerkungen etc. dazu bitte per Kommentar.

— Update-Ende —

Vergangenes Jahr gab es in Berlin einen zweitägigen Workshop rund um die Programmiersprache Python/Django. Obwohl alle Teilnehmenden recht zufrieden waren, wurde auch klar: Hier wurde nur an der Oberfläche gekratzt.

Deswegen jetzt das Angebot (siehe Umfrage unten): Es wird erneut ein Seminar halbwegs kostengünstig organisiert; diesmal aber mit einem anderen Modell. So soll solider und ausführlicher in die Grundlagen der Programmiersprache Python eingeführt werden. Erst zum Abschluss wird das Framework Django vorgestellt.

Der Kurs  richtet sich auch an Einsteiger/innen in eine Programmiersprache; Vorraussetzung ist, nicht allzu sehr mit Rechnern und Web zu fremdeln sowie Englischkenntnisse mitzubringen.

Weiterlesen

DataWrangler Tutorial – Aus gescanntem Dokument wird eine Tabelle

Wrangler Demo Video from Stanford Visualization Group on Vimeo.

Anhand der Rechenschaftsberichte der Parteien für 2009 wird hier gezeigt, wie sich DataWrangler nutzen lässt. Diese Browser-Anwendung der Universität Standford erlaubt eine Echtzeitmanipulation von Datensätzen mittels einer grafischen Benutzeroberfläche. Es ist ein etwas kompliziert anmutendes Tool – aber es lohnt sich damit zu beschäftigen, da es viel Datenarbeit ersparen kann.

Vor zehn Tagen veröffentlichte taz.de zwei Werkzeuge rund um Parteispenden, die wir von OpenDataCity umgesetzt haben. Einmal eine interaktive Karte der Spender für 2009 über 10.000 Euro sowie ein Recherchetool für die 6700 Spenden über 10.000 Euro in den Jahren 1994 bis 2009. Das ist nur die Spitze des Eisberges; bei manchen Parteien machen die undokumentierten Spenden unter 10.000 Euro die Hälfte der gesamten Finanzen aus. Mehr dazu in diesem taz-Kommentar.

Eigentlich hätte das alles schon viel früher erscheinen sollen; die Vorbereitungen dafür liefen schon seit Ende vergangenen Jahres. Doch dann kamen die Umwälzungen in Nordafrika sowie der Tsunami und die GAUs von Japan dazwischen. So rutschte die Geschichte immer weiter nach hinten und das Pech wollte es, dass Spiegel Online ausgerechnet eine Woche früher ebenfalls eine Parteispendenvisualisierung anbot. Die ist recht gelungen und funktional. Glücklicherweise konzentriert sie sich auf Großspenden über 50.000 Euro und bietet nur die Zahlen ab 1998 auf. Auch stellt SPON – entgegen der taz – die grundlegenden Daten nicht zur Weiterverwendung zur Verfügung (hier finden sich die Daten für 1994 bis 2009).

Weiterlesen

Dilemma schema.org

Was der neue semantische Web-Standard der Suchmaschinen für Onlinejournalismus bedeutet

Ausschnitt aus der Liste mit Auszeichnungselementen von schema.org

Zeitungssterben ist mittlerweile ein alter Hut. Was aber auf uns zukommt ist Webseitensterben. Onlinemedien, Nachrichten- und Zeitungswebsites werden es zukünftig noch schwerer haben. Das faktische Ableben von netzeitung.de vor einiger Zeit war davon nur ein Vorbote. Die Zwickmühle, tragfähige Erlösmodelle zu entwickeln, bevor sie Ertrag bringen; die Notwendigkeit, in Vorleistung zu gehen, wird noch größer durch schema.org.

Diese neue Auszeichnungssprache haben Anfang Juni Google, Bing und Yahoo Anfang in ungewohnter Allianz etabliert. Sie besteht bislang aus rund 300 Elementen, mit denen sich im HTML-Code der Seite Informationen wie Orte, Personen, Veranstaltungen, Produkte auszeichnen lassen. Der Besucher der Website selbst sieht das nicht, aber die Suchmaschinen, die in regelmässigen Abständen große Teile des Internets immer wieder indexieren, kartieren, „crawlen“ – sie profitieren davon.

Weiterlesen

Stefan Wehrmeyer – Open Data und Nahverkehr

Stefan Wehrmeyer über Nahverkehrsdaten,
Berliner Gazette (Creative Commons | sa | by | nc)

Stefan Wehrmeyer studiert in Potsdam am Institut für Softwaresystemtechnik. Sein Projekt Mapnificent stellt Fahrpläne zahlreicher Städte weltweit dynamisch auf einer Karte dar; vor kurzem appellierte er an die Berliner und Brandenburger Nahverkehrsbetriebe, ihre Fahrplandaten zu öffnen. In der Simulation TransitPulse gibt Wehrmeyer einen Ausblick darauf, was mit solchen Informationen möglich wäre.

Herr Wehrmeyer, Sie versuchen seit einiger Zeit, Verkehrsunternehmen zu bewegen, ihre Fahrpläne über offene Schnittstellen anzubieten. Wie ist die Resonanz?

Stefan Wehrmeyer: Die Resonanz derjenigen, die am Nahverkehr interessiert sind, war sehr positiv. Die Forderung nach offenen Fahrplandaten leuchtet den meisten ein. Nur die Verkehrsunternehmen selbst reagieren eher reserviert.

Speziell in Berlin scheint es Probleme zu geben. Worum geht es dabei?

Wehrmeyer: Der Verkehrsbund Berlin Brandenburg (VBB) reagierte auf den Appell mit Unverständnis: die Daten seien doch da, man müsse nur fragen. Allerdings gab es keinen Bereich auf der Website der Berliner Verkehrsbetriebe (BVG) oder des VBB, der überhaupt die Herausgabe von Daten an Entwickler erörtert. Der VBB hat nun eine Seite für Entwickler angelegt und das ist ein guter erster Schritt. Die dort veröffentlichten Bedingungen schränken aber leider die Nutzung sehr ein.

Was stört Sie an den Nutzungsbedingungen?

Wehrmeyer: Mich stört einiges. Zum Beispiel, dass die Daten nicht unter einer freien Lizenz veröffentlicht werden. Auch die Verknüpfung mit anderen Daten, ein sogenanntes Mashup, muss explizit erlaubt werden. Die Erhebung statistischer Daten zur Qualität des Nahverkehrsangebots ist gleich ganz verboten. Außerdem ist in den Bedingungen die Rede von Geheimhaltung, von Wirtschaftsprüfung und von Prüfung von Sicherheitssystemen. Da hat es die Rechtsabteilung definitiv zu gut gemeint. Durch solche Bedingungen steigt die Hürde enorm, etwas mit den Daten zu erstellen. Auf Nachfrage beteuerte der VBB, alles nicht so strikt zu meinen, aber leider lesen sich die Nutzungsbedingungen wie ein Knebelvertrag.

Weiterlesen