<img height="1" width="1" src="https://www.facebook.com/tr?id=554778255019340&amp;ev=PageView &amp;noscript=1">

Der Status von Open Data in Deutschland: von verpassten Chancen zum Erfolg

Offene Daten

22/02/2017

6 min. Lesezeit

Team

von

Team

Wenn man dieser Tage eine Konferenz zum Thema open data in Deutschland besucht, mag man sich fragen, ob die Teilnehmer eine neue Spezies entdeckt haben. Eine mysteriöse Spezies, die weiß, was man mit Daten anfängt. Eine intelligente Spezies, die Schätze auf verwirrenden Webseiten findet und sperriges Behördenvokabular versteht. Eine Spezies, die die CSV- und WMS-Dateien nimmt und diese auf wundersame Weise in schöne neue Anwendungen wandelt, von denen alle profitieren.

In Deutschland gibt es über 40 Open-Data-Portale - darunter Gemeinden, Regionen und andere Organisationen. Rund 30 Städte veröffentlichen open data auf einer Form von Portal, was bedeutet, dass es eine spezielle Seite gibt, auf der Verwaltungen strukturierte Daten zum Download bereitstellen. Dies ist sicherlich ein guter Anfang, bis man realisiert, dass dies lediglich 40% aller Städte mit mehr als 100.000 Einwohnern repräsentiert.

Noch besorgniserregender als die Quantität ist die Qualität einiger dieser Portale; ganz zu schweigen von den Daten, welche sie veröffentlichen. Um Missverständnisse vorzubeugen: es gibt großartige Open-Data-Projekte von Städten wie Bonn, Moers und vielen anderen. Zahlreiche engagierte Pioniere leisten einen beachtlichen Job, eine Community aufzubauen und das Open-Data-Thema in Deutschland voranzubringen.

Wenn es jedoch um eine Reihe anderer Portale geht, kann man nicht anders, als sich zu fragen, ob die Bereitsteller das Wort “open data” mit “Open Information” verwechseln. Zur Erinnerung: open data bezieht sich auf maschinenlesbare, strukturierte Daten. Aus diesem Grund handelt es sich bei Informationen, die in PDFs oder Word veröffentlicht werden, NICHT um open data. Aggregierte Daten in Exceldateien mit mehreren Blättern zählen ebenfalls NICHT zu open data. Und zu guter Letzt kann man auch die vielen Geoportale, welche WMS-Dateien ohne die entsprechenden WFS-Dateien mit den dazugehörigen Datenpunkten veröffentlichen, NICHT als open data bezeichnen. Dies ist in etwa so, als würde jemand ein Foto von einer Karte im Atlas seines Großvaters nehmen und dieses irgendwo hochladen. Wie sollen Entwickler auf solch einer Grundlage irgendetwas erstellen?

Stellen wir uns einen typischen Open-Data-Fall vor: Programmiererin Alex möchte eine Verkehrsapp für ihre mittelgroße Heimatstadt in Deutschland erstellen. Heute sieht der Prozess, um die dafür benötigten Daten zu erhalten, in etwa so aus:

  • Als erstes navigiert sie durch endlos sperrige Seiten, um eine herunterladbare Datei zu finden. Diese nennt sich z.B. “Öffentl. Verk. Netzwerk Kat. Bus_AKTUALISIERT_122015” (Deutsche Behörden lieben Abkürzungen).

  • Sie vermutet, dass diese Datei die Buszeitpläne für das Stadtzentrum beinhaltet und freut sich, da kaum ein anderer öffentlicher Verkehrsmittelbetreiber diese Art von Daten als open data veröffentlicht. Als nächstes:

    • Muss sie sich registrieren und den Grund für ihre Anfrage erläutern oder

    • Freut sie sich über ihr Glück und findet eine CSV-Datei - juhuu.

  • Sie lädt die Datei herunter

  • Öffnet sie als Excel

  • Ist verwirrt von merkwürdigen Spaltennamen wie “ID_Str” oder “Abkr._ref”

  • Kehrt zur ursprünglichen Seite zurück, um ein dazugehöriges PDF herunterzuladen, welches die Abkürzungen in der CSV erklärt...

  • ...und realisiert schließlich, dass anstatt der Zeitpläne die Datei lediglich die Standorte der Bushaltestellen enthält (als Adressen; nicht als Geopunkte wohlgemerkt).

  • Noch motiviert?

Selbst wenn sie die gesuchten Informationen findet, muss sie die Daten immer noch erst bereinigen, um sie dann ins benötigte Format bringen zu können. All dies bevor sie sie mit zusätzlichen Daten kombinieren kann.

Angesichts dieses langen Prozesses ist es nicht verwunderlich, dass sich viele Gemeinden fragen: „Wer soll etwas mit unseren Daten anfangen?” Und sie haben recht! Man kann sich kaum vorstellen, dass jemand freiwillig diesen Prozess durchläuft.

Bedauerlicherweise resultiert ein solch komplizierter Open-Data-Ansatz in Frustration auf beiden Seiten: Verwaltungsmitarbeiter sehen nicht die erhofften Ergebnisse und Endnutzer haben weiterhin Schwierigkeiten, die veröffentlichten Daten zu nutzen.

Darüber hinaus bleibt open data etwas “Abstraktes”. Etwas, das schwer vom „normalen Bürger“ begreifbar ist (und dessen Budgetierung deshalb schwer zu rechtfertigen bleibt).

Als ein Land, das lang gezögert hat, eine Open-Data-Strategie ernsthafter zu verfolgen, ist Deutschland repräsentativ für zahlreiche andere Länder mit den gleichen Herausforderungen, Daten zu öffnen. Gleichzeitig haben Länder wie Deutschland die Chance, von den bereits erfolgserprobten Praktiken in weiter fortgeschrittenen Open-Data-Regionen zu profitieren.

Wenn wir wollen, dass open data ein Standardgut wird, müssen wir zunächst den Prozess des Datenveröffentlichens neu denken. Natürlich gibt es eine Reihe von Faktoren, die diesen Prozess beeinflussen (vor allem im Hinblick auf politische und rechtliche Aspekte), doch selbst in Verwaltungen mit einer fortgeschrittenen Open-Data-Einstellung existiert eine Barriere, die völlig auf den Arbeitsfluss selbst zurückzuführen ist. Heutzutage ist es für gewöhnlich die Verantwortung eines einzigen Mitarbeiters, Datensätze hochzuladen, die ihm oder ihr per Email weitergeleitet wurden. Oftmals hat diese Person noch eine Reihe anderer Verantwortlichkeiten und mag allgemein nur einen geringen Überblick darüber haben, welche Daten innerhalb der Organisation zur Verfügung stehen. Dies verlangsamt nicht nur den Prozess erheblich, sondern noch wichtiger: normalerweise ist es der Datensatzersteller, der am besten über die Qualität des Datensatzes urteilen kann. Aus diesem Grund müssen wir Werkzeuge und Prozesse implementieren, die es jedem erlauben - unabhängig von deren technischen Expertise - Daten zu verarbeiten und zu veröffentlichen.

Zweitens sind Daten nur dann wirklich offen, wenn jeder sie nutzen kann. Bis heute adressieren deutsche Open-Data-Portale ausschließlich Entwickler. Dies ist ein sehr kleiner Zirkel. Des Weiteren muss diese spezielle Gruppe eine sehr genaue Vorstellung davon haben, wonach sie sucht. Wenn es jedoch um Innovationen geht, gelingen die größten Durchbrüche durch Zufall. Open-Data-Instrumente müssen daher diese Art des offenen Entdeckens unterstützen. Diagramme und Karten sind nicht nur Funktionen, die “schön zu haben” sind. Visualisierungen bieten Einblicke. Sie sind essentiell für den “normalen Bürger” - und dem Verwaltungsmitarbeiter - um Daten besser zu verarbeiten und zu verstehen. open data sollte jedem ermöglichen, Annahmen auf einfache und intuitive Weise zu testen. Wir sollten nach einer Welt streben, in der wir das innovative Potential eines jeden Einzelnen nutzen, wenn nur die richtigen Werkzeuge gegeben.Schließlich, so unglaublich es klingen mag: in 2017 müssen Entwickler immer noch regelmäßig deutsche Open-Data-Portale nach Updates der veröffentlichten Datensätze checken. open data in Echtzeit bleibt aus diesem Grund ein Traum. Doch auch auf einer grundlegenden Ebene werden es Entwickler schwer haben, außer einigen Katalog-APIs Schnittstellen zu den Datensätzen selbst zu finden. Für Innovationen müssen Daten bereit zur Weiterverwendung sein. Kein extrahieren, transformieren und laden, sondern fertig bereitstehende Daten “to go”, auf denen man die nächste Anwendung bauen kann. Aus diesem Grund müssen Datensätze automatisch in APIs gewandelt werden. Und nicht nur irgendwelche APIs. Diese APIs müssen in der Lage sein, riesige Datensätze mit Millionen an Datenpunkten handzuhaben und innerhalb von Sekunden zu laden. Diese APIs müssen in der Lage sein, auf jeden einzelnen Datenpunkt herunterzufiltern. Und diese APIs müssen skalierbar sein und als Basis für Echtzeitanwendungen dienen.

Selbstverständlich löst die richtige Technologie nicht alle Herausforderungen, mit denen open data in Deutschland konfrontiert ist. Zahlreiche weitere Fragen stehen noch offen, wie zum Beispiel solche, die sich um Lizenzen und Datenschutzrechte drehen. Falls wir jedoch die Vorteile von open data voll ausschöpfen wollen, müssen wir sicherstellen, dass, wenn man in der Zukunft eine Open-Data-Konferenz besucht, alle zur Diskussion beitragen können.

Lesen Sie mehr von diesem Autor

Themen

Offene Daten

Abonnieren Sie
unseren Newsletter