GeoParquet-Dateien unter Linux

Eigentlich könnte der Umgang mit GeoParquet-Dateien unter Linux ganz einfach sein. Auch neuere Version von QGIS können GeoParquet-Dateien verarbeiten. Leider sieht es aber nicht bei allen Distributionen gleich gut aus.

GeoParquet ist ein incubator (im Entstehen begriffener) Standard des Open Geospatial Consortium (OGC). GeoParquet basiert auf Apache Parquet und ist eine Erweiterung um Geodatentypen. Apache Parquet ist ein leistungsstarkes spaltenorientiertes Datenformat, das als moderne Alternative zu CSV-Dateien entwickelt wurde.

GeoParquet-Dateien sind deutlich kleiner als z.B. GeoJSON. Neuere Versionen von QGIS (3.28 LTS) sind schon darauf vorbereitet, GeoParquet-Dateien zu verarbeiten.

Wenn alles gut läuft, lässt sich unter Linux eine GeoJSON-Datei (und auch quasi jedes andere Geoformat) ganz einfach in eine GeoParquet-Datei umwandeln:

wget https://opendata.kiel.de/data/stadtteileKiel.geojson
ogr2ogr -f parquet stadtteileKiel.parquet stadtteileKiel.geojson

Vermutlich wird das aber auf viele Linux-Systemen nicht funktionieren, da das GDAL-Plugin (GDAL ist die Bibliothek zum Lesen und Schreiben der verschiedenen Geoformate) für Parquet nicht als Paket verfügbar ist. Dann bekommt man nur diese Fehlermeldung zu sehen:

ERROR 1: Unable to find driver `parquet'.

Erfolgreich getestet habe ich es mit Alpine Linux 3.19.0. Da muss man folgende Pakete installieren:

apk add gdal-driver-Parquet gdal-tools

Unter Ubuntu 23.10 und Debian 12.4 war ich nicht erfolgreich:

apt update && apt install --no-install-recommends -y gdal-plugins gdal-bin ca-certificates wget

Auch mit Fedora 39 hatte ich kein Glück:

dnf install --setopt=install_weak_deps=False gdal parquet-libs wget

Ich selbst habe für mein Ubuntu 22.04.3 LTS die GDAL-Pakete neu kompiliert, so dass dort auch die Parquet-Unterstützung enthalten ist. War nicht kompliziert, dauerte nur relativ lange. Wenn daran Interesse besteht, kann ich hier die Schritte aufschreiben.

Hat jemand einen Tipp, wie man auch unter “normalem” Debian und Ubuntu GeoParquet Dateien verarbeiten kann?

Kommentare

Mit einem Konto im Fediverse oder auf Mastodon kannst du auf diesen Beitrag antworten. Da Mastodon dezentral funktioniert, kannst du dein bestehendes Konto auf einem Mastodon-Server oder einer kompatiblen Plattform verwenden.

Nach einem Klick auf "Lade Kommentare" werden nicht-private Antworten vom Server norden.social geladen und unten angezeigt.

Wie das technisch funktioniert, kann man hier erfahren.