Lachen oder Weinen

Manchmal findet man im Open-Data-Portal Datensätze, bei denen man nicht weiß, ob man sich freuen oder weinen soll. Man kann sich freuen, dass es diese wirklich tollen Datensätze offen zugänglich gibt. Zugleich kann man weinen, dass sie so lieblos dargeboten werden und damit quasi nicht auffindbar werden. 🥲

Ein (un-)schönes Beispiel dafür ist der Datensatz “Deskriptor 8 - Schadstoffe - Daten”. Jemand eine Idee, was das sein könnte? Ich jedenfalls nicht. Normalerweise würde man jetzt schnell weiterklicken, aber ich schaue mal etwas genauer. Die Beschreibung klingt schon interessanter: “Es handelt sich um überprüfte Schadstoffdaten (Schwermetalle) im Wasser von 2003 bis 2011.” Das war es dann aber schon, mehr Beschreibung gibt es nicht. Die Schlagworte geben noch ein paar Hinweise auf einige Metalle wie Arsen, Blei, Kupfer und Quecksilber.

Ansicht der Metadaten des Datensatzes “Deskriptor 8 - Schadstoffe - Daten” im Open-Data-Portal. Angeben ist der Herausgeber “Landesamt für Umwelt”, die Kategorien “Landwirtschaft, Fischerei, Forstwirtschaft und Nahrungsmittel”, “Regionen und Städte”, “Umwelt und “Verkehr”. Veröffentlichungsdatum ist mit 18.07.2013 angegeben, Datum der letzten Bearbeitung mit 19.09.2023

Da geben sich andere Stellen deutlich mehr Mühe mit der Beschreibung ihrer Datensätze, z.B. die Windkraftanlagen oder auch der Datensatz zum Siedlungsabfallaufkommen nach Bilanznummer und Entsorgungsweg 2021.

Schauen wir trotzdem mal weiter, was der “Deskriptor 8” noch für uns bereithält. Es werden zwei Links auf Web Feature Services (WFS) gegeben. Welchen soll ich nehmen, welcher ist wohl besser? Egal! Es ist nämlich der identische Link, nur die Reihenfolge der Parameter ist vertauscht. Keine Ahnung, was der tiefere Sinn dahinter ist. Es ist auch nicht der übliche GetCapabilities-Link eines WFS, daher ist die Formatangabe eigentlich falsch. Richtig wäre hier GML. Wer sich etwas mit WFS auskennt, kann sich den GetCapabilites-Link leicht erschließen: https://mdi-sh.org/geoserver_llur/MSRL-Daten/wfs?service=WFS&version=1.1.0&request=GetCapabilities und der lohnt sich, wie wir später sehen werden.

Aber zunächst die 5,5 MB große GML-Datei auf den Rechner geladen und QGIS geöffnet. Wie üblich zeige ich mir erstmal eine OpenStreetMap-Karte zur Orientierung an. Dann füge ich die GML-Datei als Vektorlayer hinzu. Das klapp auch soweit gut. Es wird ein Layer mit 2.383 Punkten erkannt und der Layer D08 taucht auch in der Übersicht auf. Auf der Karte ist aber nichts zu sehen. Also “Auf Layer zoomen” wählen und dann etwas rauszoomen… Ich bin im Golf von Guinea im Westen Afrikas gelandet - ein typischer Fall von falschem Koordinatenreferenzsystem. In den Eigenschaften zur Quelle sehe ich unter “Zugewiesenes Koordinatenreferenzsystem (KBS)” auch den Wert “Ungültige Projektion”. Nachdem ich dies auf WGS84 gesetzt habe, landen die Punkte wie gewünscht in schleswig-holsteinischen Gewässern.

Umrisskarte Schleswig-Holsteins. Verzeichnet sind 12 Punkte in der Nordsee: einer nördlich von Sylt, drei südlich von Föhr und Amrum, einer südlich von Nordstrand und 7 vor Dithmarschen. 12 weitere Punkte in der Ostsee: bei Flensburg, einer in der Schlei bei Schleswig, 3 vor der Schleimündung, einer vor Schwansen, zwei in der Kieler Förde, einer in der Kieler Bucht, einer in Lübeck und zwei in der Lübecker Bucht

Man erkennt zwölf Punkte in der Nordsee und zwölf Punkte in der Ostsee. Aber es sollen doch 2.383 Punkte sein. Die Erklärung ist, dass es sich um Messreihen an einer Stelle handelt. So umfasst allein der vermeintlich eine Punkt in der Schlei 108 Messungen.

Um genauer zu sehen, was in den Daten steckt, komme ich nochmal auf den schon erwähnten GetCapabilites-Link zurück. Der verrät uns nämlich, dass der Dienst auch andere Format zurückliefern kann, darunter CSV und GeoJSON. Schade, dass diese Möglichkeiten nicht als Distribution beim Datensatz angeboten werden. Hier sind die beiden Links

Beim Laden der GeoJSON-Datei in QGIS funktioniert übrigens auch die Erkennung des KBS sofort. Auch bei der CSV-Datei ist es eine einfache Einstellung beim Import. Hier muss man allerdings aufpassen, dass es drei Spalten mit der Geometrie in WKT gibt. Bei einer sind Längen- und Breitengrad in anderer Reihenfolge angegeben – hier würden die Daten im Wasser vor Somalia landen. Mit der Spalte EMF_GEOMETRY liegt man richtig.

Hier ein Blick in die GeoJSON-Datei, der schnell zeigt, welche Vielzahl von Informationen in den Daten enthalten ist:

{
   "type": "Feature",
   "id": "D08.fid--54f6f0f6_18aac8a04fe_-24d1",
   "geometry": {
     "type": "Point",
     "coordinates": [ 8.39167, 54.59167 ]
   },
   "geometry_name": "GEOMETRY",
   "properties": {
       "EMF_INSPIREID": "SH-LLUR_DESH0001_emf_220006_1.0",
       "EMF_BIOGEOREGID": "DE-BMU_ANS_1.0",
       "EMF_ADDITIONALDESCRIPTION": "Südl. Amrum",
       "EMF_GEOMETRY": "POINT (8.39167 54.59167)",
       "EMF_NAME": "220006",
       "EMF_LEGALBACKGROUND": "BLMP",
       "EMF_RESPONSIBLEPARTY": "SH-LLUR_DESH0001",
       "EMF_REPORTEDTO": "MSFD",
       "EMF_MEDIAMONITORED": "water",
       "EMF_MEASUREMENTREGIME": " ",
       "EMF_MOBILE": "True",
       "EMF_RESULTACQUISITIONSOURCE": "exSitu",
       "OBSV_ID": "NO130019_01_1173",
       "OBSV_PARAMETERNAME": "NI",
       "OBSV_PARAMETERVALUE": 0.2,
       "OBSV_PARAMETERUNIT": "µg/l",
       "OBSV_PHENOMENONTIME": "2013-08-28T13:03:39Z",
       "OBSV_RESULTQUALITY": "<",
       "OBSV_EMFID": "SH-LLUR_DESH0001_emf_220006_1.0",
       "OBSV_RESULTTIME": " ",
       "OBSV_VALIDTIME": " ",
       "OBSV_MFOIID": "NO130019_01_1173_1",
       "OBSV_PHYSICALTREATMENTCODE": "NF",
       "OBSV_PHYSICALTREATMENT": "not filtered",
       "OBSV_MSRL_PARAMETERGROUP": "NonSynthetic",
       "OBSV_MSRL_PARAMETERCHEMGROUP": "Metallic",
       "OBSV_WRRL_PARAMETERGROUP": "Priority",
       "MFOI_ID": "NO130019_01_1173_1",
       "MFOI_DEPTH": 1,
       "MFOI_MEDIUM": "water",
       "MFOI_GEOMETRY": "POINT (8.39167 54.59167)"
   }
}

Toll, was alles gemessen und als offene Daten veröffentlicht wird. Schade, dass man bei vielen Angaben ohne weitere Erklärung höchstens raten kann, was damit gemeint sein könnte. 🥲

Update 2023-09-20: Über Mastodon habe ich einen Hinweis bekommen, was es mit “Deskriptor 8” auf sich hat. Es ist einer der zwölf sogenannten Deskriptoren der Europäischen Meeresstrategie-Rahmenrichtlinie (MSRL). Informationen zur MSRL gibt es hier: https://meeresschutz.info

Kommentare

Mit einem Konto im Fediverse oder auf Mastodon kannst du auf diesen Beitrag antworten. Da Mastodon dezentral funktioniert, kannst du dein bestehendes Konto auf einem Mastodon-Server oder einer kompatiblen Plattform verwenden.

Nach einem Klick auf "Lade Kommentare" werden nicht-private Antworten vom Server norden.social geladen und unten angezeigt.

Wie das technisch funktioniert, kann man hier erfahren.