DCAT DataServices

Schon mit DCAT 2 haben DataServices Einzug in das Metadatenmodell gehalten. Doch noch scheinen sie wenig verbreitet zu sein, best practices gibt es nur wenige. Daher habe ich mir bei GovData und im Datenportal der EU angesehen, welche DataServices man dort finden kann. Und dabei gab es große Überraschungen…

Nationales Portal GovData

Zunächst habe ich mir angesehen, welche DataServices es im nationalen Portal GovData gibt. Mit dem SPARQL-Endpunkt lässt sich das schnell herausfinden:

PREFIX dcat: <http://www.w3.org/ns/dcat#>
SELECT ( count(?d) as ?n ) WHERE { ?d a dcat:DataService }

Es sind 2.288 Dienste. Ich weiß, dass wir aus Schleswig-Holstein um die 300 Dienste beitragen, daher scheint die Zahl auf ersten Blick plausibel. Leider haben DataServices (noch) keine dcatde:contributorID. Daher ist es etwas schwierig herauszubekommen, aus welchem Bundesland sie stammen. Ich habe versucht, das über die URI zu ermitteln und bin auf folgende Zahlen gekommen:

Bundesland           Anzahl
Sachsen                1766 
Schleswig-Holstein      346 
Bayern                  155 
Berlin                   17 
sonstige                  4 

Das sieht schon wieder ganz anders (und etwas traurig) aus. Wenigstens lag ich mit meiner Schätzung von 300 Diensten aus Schleswig-Holstein sogar etwas zu niedrig.

Datenportal der EU

Nun habe ich die gleiche Abfrage beim Datenportal der EU data.europa.eu gemacht. Dort kommt man auf sage und schreibe 1.145.288 DataServices! Da sind die gut 2.000 Dienste aus Deutschland ja eher wenig. Also wollte ich herausbekommen, welche Länder hier so viel liefern und wie diese Dienste aussehen. Also habe ich auf der Weboberfläche nachgesehen. Dort gibt es zum Glück direkt einen Filter, mit dem man DataServices auswählen kann. Doch was ist das? Nur 658.515 DataServices? Merkwürdig. Irgendwie stimmt Triplestore und Weboberfläche nicht überein. Das kann ich von außen nicht auflösen. Vielleicht bekomme ich irgendwann mal Insiderinformationen, wie diese gravierende Abweichung zu Stande kommt.

Aber weiter mit der Übersicht der Länder. Das kann man ebenfalls über die Weboberfläche unter Provenance bequem einsehen. Hier wartete die nächste Überraschung:

englischsprachige Liste der Länder: Germany 562166, Malta 30474, Italy 22109, Spain 10319, Poland 9124

Hauptlieferant ist Deutschland mit 562.166 DataServices! Wie kann das sein, wenn GovData doch nur gut 2.000 Dienste kennt. Das nächste Mysterium.

Wenn man nun bei den Katalogen schaut, fällt einem als größter Lieferant die GDI-DE (Geodaten-Infrastruktur Deutschland) ins Auge. Hier werden also offensichtlich hundertausende Dienste an GovData vorbei an das EU-Datenportal gemeldet. Welche Dienste das genau sind, habe ich mir noch nicht angesehen. Das könnte Material für einen nächsten Blogbeitrag sein.