Bild: Schlösser und Burgen in der Schweiz: OpenStreetMap bei myswitzerland.com
OpenStreetMap ist das grösste Crowdsourcing-Projekt im Bereich frei nutzbarer «Vektor-Geodaten». Das Prinzip ist einfach: Eine Karte, ähnlich wie Google Maps, verwaltet Strassen, Wege und weitere nützliche Informationen, wie zum Beispiel Shops in der Umgebung. Anders als bei Google Maps werden die Kartendaten von Freiwilligen laufend erweitert und verbessert – ohne die Nutzerinnen und Nutzer zu «tracken». Aus der Perspektive des Datenschutzes und der digitalen Selbststimmung ein enormer Vorteil.
Dadurch, dass sich Freiwillige beteiligen, stellt sich aber unweigerlich die Frage nach der Qualität, insbesondere wie vollständig die Abdeckung der Daten ist. «Dass die Datenqualität bei OpenStreetMap nicht bekannt sei, ist ein oft gehörter Kritikpunkt», sagt Prof. Stefan Keller, der die ausgezeichnete Bachelorarbeit betreute. «In ihrer Bachelorarbeit zeigten die OST-Studierenden Crisafulli und Monzón erstmals einen Ansatz, der die Vollständigkeit der Daten schätzt und visualisiert», so Keller. «Durch den Einsatz von modernem Software Engineering sowie Machine Learning realisierten sie einen Algorithmus, bei dem OpenStreetMap-Daten mit sich selber trainiert und klassiert werden. Damit können erstmals schweizweit Aussagen gemacht werden wie Diese Gegend ist wahrscheinlich komplett bzw. unvollständig mit Shops erfasst», erklärt der Informatik-Professor und Leiter des IFS Institut für Software an der OST.
Zukünftig «Goldene Datensätze» hinzuziehen
«Die Frage nach der Qualität von Daten wurde bisher durch Vergleiche mit sogenannten ‹goldenen› Datensätzen beantwortet», erklärt Keller. Goldene Daten sind «offizielle» Daten von hoher Qualität. «Das hat den Nachteil, dass es kaum solche gibt», erklärt Keller. Zukünftig müsse der in der Bachelorarbeit entwickelte Algorithmus dahingehend verbessert werden «dass Qualitätsangaben nicht nur für Shops sondern für weitere Kartenobjekte gemacht werden und dass auch weitere goldene Datensätze mitverwendet werden können, dort wo sie vorhanden sind», so Stefan Keller.
Die Resultate der Bachelorarbeit wurden als Open-Source und Open-Data zur Verfügung gestellt. Zudem wurde eine Demo-Web-Applikation zur Visualisierung der Datenqualität erstellt.
Zum Abstract der Bachelorarbeit
Der Award
Seit 2017 verleiht CH Open auf der DINAcon die gleichnamigen Awards. Bis dahin wurden die wichtigsten Auszeichnungen für freie Software in der Schweiz unter dem Namen «CH Open Source Awards» vergeben. Die DINAcon 2021 fand am 29. Oktober 2021 hybrid in Basel statt.