Seite auswählen

Der freie und unbeschränkte Zugang zu Daten ist das zentrale Element des Open Data Gedankens. Dieses Ziel ist durch alleinige Bereitstellung von Daten nicht zu erreichen, denn die bereitgestellten Daten müssen für interessierte Nutzer auch auffindbar sein. Gerade im Kontext des Bundesministeriums für Verkehr und Digitale Infrastruktur ist dies eine zentrale Anforderung in Bezug auf die riesigen Datenschätze des Geschäftsbereiches.

Im Rahmen des Modernitätsfonds mFUND untersucht das Projekt „MetaOpenData“ die Machbarkeit von Maßnahmen zur Verbesserung der Auffindbarkeit von Daten. Im Fokus steht dabei die Erarbeitung von auf Open Source-Software basierenden Lösungsansätzen der Metadatenautomatisierung, die durch Deep Learning Verfahren angereichert zur Verbesserung der Datenauffindbarkeit auch hinsichtlich unterschiedlicher Suchkontexte führen sollen. Für diese Maßnahmen sieht man insgesamt ein sehr großes Einsparpotential hinsichtlich der bisher für Metadatenerstellung und -pflege notwendigen personellen, finanziellen und zeitlichen Aufwände.

Ebenfalls erwarten die Projektbeteiligten von den erarbeiteten Lösungsansätzen, dass sie geeignet sind, die Hürden für die Datenbereitstellung auf der Anbieterseite dadurch zu senken und daraus resultierend die öffentlich zur Verfügung stehende Datenbasis quantitativ wie auch qualitativ aufzuwerten.

Insbesondere der Einsatz von Deep-Learning Verfahren, welcher bislang in den Bereichen Geo-IT und Open Data keine große Bedeutung besitzt, verfügt über das Potential auf disruptive Art und Weise dazu beitragen zu können, bisherige Verfahren der Metadatenbereitstellung auf den Kopf zu stellen und neue Möglichkeiten der Datenrecherche zu ermöglichen.

In diesem Beitrag (siehe eingebettetes Video unten – alternativ hier der Direktlink zur Aufzeichnung) stellt Sebastian Goerke dar, wie durch den Einsatz verschiedener Werkzeuge im OSGeo-Kontext in Kombination mit Ansätzen aus dem Deep-Learning der Automatisierungsgrad bei der Metadatenerzeugung und -pflege maximiert und die entsprechenden Aufwände auf ein Minimum reduziert werden könnten.