Das GovData Portal des Bundes ist nun online. Jonas Westphal schrieb über den holprigen Start und die Sicherheitslücken, aber auch über die Kosten:
Das Projekt jedenfalls hat bisher mindestens 155.000 Euro gekostet. Das ist nicht so viel, der Beitrag ist aber mehr als peanuts. Die Gutachten im Vorfeld mal nicht mit gerechnet. Und ich frage mich: Hätte man das nicht auch preiswerter und sicherer haben können? Ginge es nicht auch leichter? Und warum ist ein Open-Data-Portal eigentlich nicht selbst Open-Source-Software? Das wäre doch nur die logische Konsequenz, wenn die Open-Government-Eckpunkte aus dem selben Ministerium mal zu Ende denkt.
So hätte etwa der Code der Software, auf dem das Open Data-Portal in Großbritannien basiert, kostenfrei auf Github zur Verfügung gestanden. Stattdessen wird bei GovData wohl auf eine auf JAVA basierende Software namens Liferay Portal aufgesetzt, die nach einem ziemlichen Enterprise-Monster klingt. Bei GovData heißt es im FAQ:
Die Realisierungskosten für den Prototyp liegen bei 130.000 EUR. Wartung, Pflege und Betrieb im Rechenzentrum von Fraunhofer FOKUS kosten für zwölf Monate insgesamt 22.500 EUR. Wenngleich die technische Entwicklung und der Aufbau des Portals und des Datenkatalogs an sich nur relativ geringen Aufwand bedeutete, fielen wesentliche Kosten dafür an, die übergreifend nutzbare Metadatenstruktur zu entwickeln und mit den Datenbereitstellern abzustimmen. Auch die Entwicklung der „Harvester“ zum automatisierten Importieren von Daten anderer Portale hat hohe Aufwände verursacht.
Die „wesentlichen Kosten,“ die für die „übergreifend nutzbare Metadatenstruktur“ hätte man sich sparen können, wäre auf das etablierte CKAN für Open Data Kataloge gesetzt worden: „Diese Konzentration auf das Wesentliche zusammen mit der großen Flexibilität dürften der Grund für die Verbreitung dieses Metadatenmodells sein“, heißt es bei GovData über CKAN. Die sei aber zu unverbindlich gewesen (man könnte meinen, für deutsche Verhältnisse zu unordentlich) – deswegen habe man eine eigene Struktur weiterentwickelt – siehe hier als HTML und hier bei Github (eine eigene Open Data-Lizenz leistet man sich ja auch).
Aber kostet die Entwicklung dieser Struktur wirklich viele zehntausend Euro (was ich unter wesentlichen Kosten verstehen würde) – also viele hunderte Stunden an Arbeit?
Bei Fraunhofer Fokus offenbar schon; die brauchen auch für die Realisierung des Portals GovApps, das vor einigen Monaten startete, über 260.000 EUR. Ich bin mal gespannt, wie die 48.792 EUR für die „Maßnahmen zum Auf- und Ausbau einer Anbieter- und Entwicklercommunity“ ausgeben werden (oder wurden die schon ausgegeben?)
Zurück zu GovData: Ein „Harvester“, der das „automatisierte Importieren von Daten anderer Portale“ ermöglicht, habe große Aufwände verursacht. Sprich ein Scraper. Das verstehe ich nicht: GovData hält ja keine Daten vor, sondern eben nur Metainformationen über Daten, die woanders liegen. Wahrscheinlich ist das gemeint. Und hätte man für GovData auf CKAN gesetzt, wie etwa die Open Data Portale in Berlin und Hamburg, wären ein Teil der Kosten für den „Harvester“ wahrscheinlich niedriger ausgefallen – mehr zum „Harvester“ hier.
Update:
@lorz vgl. govdata.de/ckan/api/2/sea… — harvesting ist auch CKAN
— Friedrich Lindenberg (@pudo) 21. Februar 2013
Update Ende
Ich habe jedenfalls den Eindruck, dass die Kosten für GovData auch mit Fehlentscheidungen zu tun haben, wie etwa eine seltsame Plattformwahl; der missglückte Start zeugt darüberhinaus, dass es an einer gewissen Kompetenz in Sachen Webtechnologie fehlte. Da könnte man 2013 von staatlicher Seite und halbstaatlichen Einrichtungen wie Fraunhofer mehr erwarten – sie erhalten ja dafür offensichtlich auch eine ordentliche Summe Geld.
Letztlich stellt sich die Frage, warum sich da nicht Leute geholt wurden, die etwas davon verstehen – oder am besten gleich damit beauftragt wurden. Wie etwa die Open Knowlegde Foundation, die CKAN entwickelt hat und schone diverse Regierungen und Portale beim Start begleitet hat.
Was denkt ihr, was ein Portal wie GovData, wie es jetzt läuft, an Entwicklungskosten gebraucht hätte?
Reaktionen:
Liferay ist in der Tat ein Ungetüm von Software, ich hab mir mal angelesen vor einiger Zeit, dass es ab irgendwas rund um 16k Nutzern (ich meine gleichzeitige Nutzer, nicht Nutzerdatenbank, bin mir aber nicht sicher) extrem performant läuft. Ob das ein gutes Argument ist, ist eine andere Frage.
Aber: Liferay ist tatsächlich OpenSource, und zwar ist der Liferay-eigene Code MIT-Lizensiert, viel freier geht es ja kaum.