Die Entkoppelung der Bereitstellung und Anwendung von Open Data

This post also available in English.

Die deutsche Open-Data-Szene dreht sich gefühlt um Anwendungsfälle.* Bei Versuchen, den langsamen Fortschritt bei der Umsetzung von Open Data unter deutschen Verwaltungen (auf Bundes-, Landes- und kommunaler Ebene) zu erklären, tendieren Open-Data-Befürworter:innen sowie Verwaltungsmitarbeiter:innen dazu, sich auf Anwendungsfälle – oder das Fehlen davon – zu fokussieren: Wir brauchen einfach mehr sichtbare Beispiele, wie Open Data in der Praxis aussieht, und dann werden Verwaltungen langsam aber sicher verstehen, warum offene Daten so wichtig sind, und warum sie mitmachen sollten!

(* Wahrscheinlich ist das auch in anderen Ländern der Fall, aber ich kann nur aus meinen Erfahrungen in Deutschland berichten)

Diese Argumentation ist nicht komplett falsch. Für viele Verwaltungsmitarbeiter:innen klingt Open Data einfach nach zusätzlicher Arbeit mit unklaren oder minimalen Vorteilen: Ich muss nicht nur meine normalen Arbeitsabläufe mit diesen Daten durchführen, sondern auch einen speziellen Datensatz für die Öffentlichkeit vorbereiten und veröffentlichen, weil irgendjemand irgendwo irgendwas mit den Daten machen könnte?

Angesichts dieser Verwirrung und dieses Misstrauens ist die Präsentation von Open-Data-Anwendungsfällen ein effektives Mittel, um den Sinn hinter Open Data zu erklären: du, Verwaltungsmitarbeiter:in, solltest deine Daten veröffentlichen, weil eine Organisation wie X diese Daten nutzen könnte, um eine App/eine Lösung/ein Produkt wie Y zu entwickeln, die/das offensichtlich einen Mehrwert für die Stadt/für das Land/für eine bestimmte soziale Gruppe schafft. Und die Verwaltung hat doch Interesse daran, solchen Mehrwert zu generieren, oder?

Aber in den letzten Jahren meiner Arbeit in der Welt von Open Data bemerke ich vermehrt Probleme, die aus dieser Anwendungsfall-lastigen Schilderung von Open Data stammen. Einerseits: die Open-Data-Bewegung in Deutschland ist mehr als 8 Jahre alt (das Bundesportal Govdata.de wurde 2013 in Betrieb aufgenommen, aber andere Städte in Deutschland haben schon früher mit Open Data angefangen). In diesen 8+ Jahren gab es zahlreiche Sammlungen von Open-Data-Nutzungen. Mir ist es unklar, was noch weitere Sammlungen schaffen würden.

Außerdem habe ich in meiner Arbeit erlebt, dass viele Verwaltungsmitarbeiter:innen die Verbindung zwischen Open Data und Anwendungsfällen so internalisiert haben, dass die Generierung von Anwendungsfällen allein der Grund für Open Data ist: Wir sollen unsere Daten veröffentlichen, damit wir solche konkreten Use Cases ermöglichen.

Natürlich sind Verwaltungsmitarbeiter:innen nicht eigenständig auf diesen Schluss gekommen: die Ermöglichung von Open-Data-Anwendungsfällen ist eine der Hauptargumente, die immer zitiert wird, wenn Open-Data-Befürworter:innen Verwaltungen das Konzept von Open Data erklären und sie davon überzeugen wollen (andere häufige Argumente sind z.B. die Erhöhung von Vertrauen in Verwaltungen durch Transparenz und der erleichterte Datenaustausch zwischen Verwaltungen durch offene Daten).

Was ist dann aber problematisch mit dem Rechtfertigen von Open Data durch Anwendungsfälle? Ich persönlich habe zwei konkrete Schwierigkeiten identifiziert:

Verwaltungsmitarbeiter:innen nehmen die Denkweise an, dass nur Daten, wofür sie sich selbst eine Nutzung vorstellen können, veröffentlichungswürdig sind
Es werden falsche Erwartungen bei Verwaltungsmitarbeiter:innen bezüglich der potenzieller Nutzung ihrer Daten geweckt, die dann wiederum zu einer Enttäuschung führen können, wenn diese Erwartungen nicht erfüllt werden

Diese zwei Punkte sind nicht unbedingt die einzigen Probleme, die aus der starken Betonung auf Anwendungsfälle stammen, sind aber jedoch die zwei Probleme, die ich persönlich am häufigsten bemerkt habe. Hier sind beide Punkte etwas ausgestaltet:

1) Verwaltungsmitarbeiter:innen nehmen die Denkweise an, dass nur Daten, für die sie sich selbst einen Nutzen vorstellen können, veröffentlichungswürdig sind

Ich habe es so oft in Gesprächen mit Datenverantwortlichen in der Verwaltung erlebt: wir sitzen gemeinsam daran Datensätze zu identifizieren, die veröffentlicht werden sollen, und bei einigen Datensätzen äußern sie Bedenken oder lehnen die Veröffentlichung komplett ab: “Keiner wird sich für diese Daten interessieren, die sind zu speziell”; “Da muss man echtes Fachwissen haben, um mit diesen Daten zu arbeiten – lohnt sich nicht.” Diese Einschätzung zur Veröffentlichungstauglichkeit stammt meistens aus ihrem Verständnis, dass der Sinn hinter Open Data die Entwicklung von Open Data-basierten Anwendungen ist. Und wo sie sich keine solche Anwendung vorstellen können muss es dementsprechend keinen Grund für eine Veröffentlichung geben.*

(* Ich verstehe, dass ein “Open-By-Default”-Ansatz solche Situation theoretisch komplett unmöglich machen würde, denn solche Ansätze schließen die menschliche Einschätzung der Veröffentlichungstauglichkeit aus. Aber in der Realität sind die allermeisten deutschen Verwaltungen von einer echten Umsetzung von Open-By-Default weit entfernt – technisch und kulturell – und das wird sich so schnell nicht ändern)

Diese Denkweise ist problematisch, weil meiner Erfahrung nach die Datenverantwortlichen aus der Verwaltung meistens sehr schlecht vorhersagen oder sich vorstellen können, wie ihre Daten potenziell von anderen genutzt werden können. Sie sind zu sehr dran gewöhnt, ihre Daten nur für ihre spezifischen Arbeitsabläufe in ihren spezifischen Kontexten unter Anwendung ihrer spezifischen Methoden zu nutzen. Den Verwaltungsmitarbeiter:innen fehlt meistens das allgemeine Verständnis für den Wert oder das Potenzial ihrer Daten außerhalb ihres Arbeitskontextes.

Außerdem führt die starke Betonung auf die Präsentation von zugänglichen Open-Data-Anwendungsfällen wie Handy-Apps, interaktive Karten, schicke Datenvisualisierungen, usw. dazu, dass Datenverantwortliche aus der Verwaltung oft eine sehr undifferenzierte Vorstellung der praktischen Nutzung offener Daten haben. Wenn sie sich nicht vorstellen können, dass jemand einen Datensatz für die Erstellung einer Karte oder eine interessante Datenvisualisierung nutzen kann, denken sie möglicherweise, dass es sich gar nicht lohnt, diese Daten als Open Data zu veröffentlichen.

Aber es gibt natürlich viele weitere Möglichkeiten für die Nutzung von offenen Daten: sie können in Datenanalyseprojekten verwendet werden – egal ob aus der Zivilgesellschaft, Privatwirtschaft oder Wissenschaft – wo verschiedene Datenquellen zusammengeführt werden um einen bestimmten Output zu generieren (und es dementsprechend nicht unbedingt nach außen ersichtlich ist, welche Rolle der einzelne Datensatz bei der Generierung dieses Outputs gespielt hat). Oder vielleicht werden die Daten von anderen Verwaltungsbehörden für ihre tägliche Arbeit verwendet, z.B. für die Erstellung eines Berichts zu einem bestimmten Thema, wie die Folgen des Klimawandels für eine Stadt oder die Verfügbarkeit von sozialer Infrastruktur.

Fazit: Das Stützen auf Open-Data-Anwendungen als das primäre Argument für die Veröffentlichung von Open Data durch Verwaltungen kann dazu führen, dass die Veröffentlichungswürdigkeit von Daten ausschließlich aufgrund ihrer subjektiven “Anwendungswürdigkeit” gemessen wird. Wo Datenverantwortliche keine offensichtliche Anwendungsmöglichkeit erkennen, sehen sie auch keine Dringlichkeit zur Veröffentlichung.

2) Datenbereitsteller:innen – insbesondere solche, die zum ersten Mal Daten veröffentlichen – werden eventuell falsche Erwartungen für die Nutzung ihrer Daten haben, also dass ihre Daten kurz nach der Veröffentlichung für eine Anwendung verwendet werden. Wenn das nicht passiert, kommen sie vielleicht schnell zu dem Schluss, dass Open Data den Aufwand nicht wert ist

Diese direkte Linie zwischen Bereitstellung von Open Data und Open Data-Anwendungen weckt bei vielen Verwaltungsmitarbeiter:innen die Erwartung, dass ihre Daten auf jeden Fall eine Nutzung finden werden. Mir wurden schon oft die Fragen gestellt: Wenn wir diese Daten veröffentlichen, wie werden sie benutzt? Hast du schon Kontakt zu potenziellen Nutzer:innen? Können wir uns vorab mit ihnen austauschen, um ihre Pläne für die Daten besser zu verstehen?

Klar, solche Fragen sind überhaupt nicht schlecht. Im Gegenteil, finde ich es wunderschön, wenn Datenbereitsteller:innen besser verstehen wollen, für wen sie eventuell Daten veröffentlichen. Dieses Interesse kann der Einstieg in weitere wichtige Gespräche rund um Datenqualität und die optimierte Datenbereitstellung sein (weil aus meiner Sicht die Anreize für eine Qualitätsverbesserung der Daten größer sind, wenn Datennutzer:innen nicht einfach abstrakte Figuren sind, sondern echte Menschen, mit denen man sich unterhalten kann). Aber wenn die Generierung von Open Data-Anwendungen als ein Hauptargument für die Veröffentlichung von Daten durch Verwaltungen präsentiert wird, schafft das eine Erwartung, dass diese Anwendungen eine natürliche oder unweigerliche Folge der Datenbereitstellung sind.

Ich finde hier das Narrativ rund um Anwendungsfälle mindestens teilweise mitschuldig, weil ein großer Teil dieser Erzählung ist, dass es eine Open Data-Community™ gibt, die einfach immer darauf wartet, dass ein neuer Datensatz veröffentlicht wird. Sobald der Datensatz erscheint, wird er von der Community aufgeschnappt und in eine tolle Anwendung umgewandelt.

Die Realität ist aber natürlich anders: nicht jeder Datensatz wird auf sofortigen Interesse stoßen. Viele Datensätze werden kaum oder sogar nie angeschaut, wie z.B. eine Analyse der Datensätze im Berliner Datenportal gezeigt hat. Das ist kein peinlicher Zustand – offene Daten, die mit aussagekräftigen Metadaten bereitgestellt sind sollten meiner Meinung nach niemals als Fehler angesehen werden. Der Sinn von Open Data ist nicht, dass jeder Datensatz eine Nutzung findet. Der Sinn ist, dass so viele Daten wie möglich in einem strukturierten, organisierten Verfahren öffentlich zugänglich gemacht werden, damit Datennutzer:innen – egal wer sie sind – die Daten finden können, die sie in einem bestimmten Moment brauchen. Vielleicht ergibt sich dieser Bedarf erst nach Wochen, Monaten oder sogar Jahren – oder er kommt gar nicht zu Stande. Oder vielleicht werden die Daten doch benutzt, aber nur für private Projekte und Zwecke, die keine Öffentlichkeit erzeugen. Das kann man alles nicht immer im Voraus sagen, und das sollte man auch gar nicht versuchen.

Wenn die Bereitstellung von offenen Daten primär durch Anwendungen gerechtfertigt wird, aber diese Anwendungen nie kommen, gibt es das Risiko, dass Datenbereitsteller:innen verwirrt sind, warum sie überhaupt Open Data veröffentlicht haben. Es erhöht auch die Wahrscheinlichkeit, dass sie zukünftig die Bereitstellung von Daten niedriger priorisieren. In vielen Verwaltungen ist die Bereitstellung von Open Data noch ein händischer Prozess. Wenn Verwaltungsmitarbeiter:innen nur verstehen, dass die Wirkung von Open Data an Anwendungsfällen gemessen wird und nach der Datenveröffentlichung keine Anwendungen der Daten erkennen, werden sich einige eventuell entscheiden, zukünftig weniger Ressourcen in der Bereitstellung offener Daten zu investieren.

Fazit: Die Betonung auf Open-Data-Anwendungsfälle schafft Erwartungen an Open Data, die nicht erfüllt werden können. Das kann zu einer Desillusionierung für Verwaltungsmitarbeiter:innen führen, weil ihnen ein anderes Narrativ rund um Open Data präsentiert wurde.

Und was machen wir nun? Ich will es klar sagen: ich bin nicht gegen Anwendungsfälle als Komponente im größeren Open Data-Diskurs. Wie schon gesagt, diese Anwendungsfälle helfen dabei, ein abstraktes Konzept für die Zielgruppe (potenzielle Datenbereitsteller) zugänglicher und verständlicher zu machen. Weiterhin ist die Präsentation von aktuellen Anwendungsfällen, statt immer den gleichen Beispielen von vor 5 Jahren, auch wichtig, um zu zeigen, dass die Relevanz von Open Data in den letzten Jahren nicht nachgelassen hat.

Aber ich würde dafür plädieren, nuanciertere Beispiele der Nutzung von Open Data zu präsentieren und hervorzuheben. Statt gefühlt ausschließlich interaktive Karten oder schicke Datenvisualisierungen zu zeigen wäre es wünschenswert, zusätzliche Geschichten der Datennutzung zu erzählen, wo es beispielsweise leichter ist, das Potenzial von verlinkten Daten oder die Kombination von diversen Datensätzen in einem größeren Datenanalyseprojekt aufzuzeigen. Das sind Nutzungen, die weniger offensichtlich oder selbsterklärend sind (und die man dementsprechend nicht so schön in ein Open Data-Schaufenster packen kann wie andere Beispiele), können aber trotzdem einen großen Mehrwert oder Wirkung für die Gesellschaft haben – und sollten deshalb genauso sichtbar sein.

Open Data-Anwendungsfälle sind ein praktischer Weg, um erste Diskussionen rund um Open Data anzustoßen. Wenn wir aber wollen, dass Open Data langfristig und nachhaltig umgesetzt wird, müssen Verwaltungen das große Ganze sehen: dass das Ziel nicht ausschließlich Anwendungsfälle sind, sondern die systematische (und unbedingt auch automatische) Bereitstellung von qualitativ hochwertigen, maschinenlesbaren Daten, die für alle zugänglich sind (sogenannte FAIR Data).

Ja, es ist die Verwendung dieser qualitativ hochwertigen Daten, die tatsächlich einen Mehrwert schafft. Aber die Rolle der Verwaltung ist nicht zu entscheiden, welche Daten diesen Mehrwert generieren werden, oder was genau der Mehrwert sein wird. Die Rolle der Verwaltung ist es, ihre Daten für alle zu öffnen, Punkt.

Zu guter Letzt: die Veröffentlichung von offenen Daten lebt und stirbt mit technischer Infrastruktur und internen Prozessen, die diese Veröffentlichung ermöglichen. Wenn es einer Verwaltung nicht möglich ist, qualitativ hochwertige Daten automatisch und in regelmäßigen Abständen zu veröffentlichen, sind einzelne Anwendungsfälle fast bedeutungslos – sie werden immer nur unrealistische Idealvorstellungen abbilden, die wenig Aussagekraft für eine ganze Verwaltung anbieten. Ja, wir brauchen eine Vision dafür, wo die Reise hingeht – also brauchen wir diese Idealvorstellungen – aber wir müssen auch irgendwann die Reise beginnen, und dafür brauchen wir einen richtigen Plan.

Tori BoeckFebruary 15, 2022