DCAT DataServices
Schon mit DCAT 2 haben DataServices Einzug in das Metadatenmodell gehalten. Doch noch scheinen sie wenig verbreitet zu sein, best practices gibt es nur wenige. Daher habe ich mir bei GovData und im Datenportal der EU angesehen, welche DataServices man dort finden kann. Und dabei gab es große Überraschungen…
Nationales Portal GovData
Zunächst habe ich mir angesehen, welche DataServices es im nationalen Portal GovData gibt. Mit dem SPARQL-Endpunkt lässt sich das schnell herausfinden:
PREFIX dcat: <http://www.w3.org/ns/dcat#>
SELECT ( count(?d) as ?n ) WHERE { ?d a dcat:DataService }
Es sind 2.288 Dienste. Ich weiß, dass wir aus Schleswig-Holstein um die 300 Dienste beitragen,
daher scheint die Zahl auf ersten Blick plausibel. Leider haben DataServices (noch) keine dcatde:contributorID.
Daher ist es etwas schwierig herauszubekommen, aus welchem Bundesland sie stammen.
Ich habe versucht, das über die URI zu ermitteln und bin auf folgende Zahlen gekommen:
| Bundesland | Anzahl |
|---|---|
| Sachsen | 1766 |
| Schleswig-Holstein | 346 |
| Bayern | 155 |
| Berlin | 17 |
| sonstige | 4 |
Das sieht schon wieder ganz anders (und etwas traurig) aus. Wenigstens lag ich mit meiner Schätzung von 300 Diensten aus Schleswig-Holstein sogar etwas zu niedrig.
Datenportal der EU
Nun habe ich die gleiche Abfrage beim Datenportal der EU data.europa.eu gemacht. Dort kommt man auf sage und schreibe 1.145.288 DataServices! Da sind die gut 2.000 Dienste aus Deutschland ja eher wenig. Also wollte ich herausbekommen, welche Länder hier so viel liefern und wie diese Dienste aussehen. Also habe ich auf der Weboberfläche nachgesehen. Dort gibt es zum Glück direkt einen Filter, mit dem man DataServices auswählen kann. Doch was ist das? Nur 658.515 DataServices? Merkwürdig. Irgendwie stimmt Triplestore und Weboberfläche nicht überein. Das kann ich von außen nicht auflösen. Vielleicht bekomme ich irgendwann mal Insiderinformationen, wie diese gravierende Abweichung zu Stande kommt.
Aber weiter mit der Übersicht der Länder. Das kann man ebenfalls über die Weboberfläche unter Provenance bequem einsehen. Hier wartete die nächste Überraschung:
Hauptlieferant ist Deutschland mit 562.166 DataServices! Wie kann das sein, wenn GovData doch nur gut 2.000 Dienste kennt. Das nächste Mysterium.
Wenn man nun bei den Katalogen schaut, fällt einem als größter Lieferant die GDI-DE (Geodaten-Infrastruktur Deutschland) ins Auge. Hier werden also offensichtlich hundertausende Dienste an GovData vorbei an das EU-Datenportal gemeldet. Welche Dienste das genau sind, habe ich mir noch nicht angesehen. Das könnte Material für einen nächsten Blogbeitrag sein.