Institut für Kartographie und Geoinformatik Forschung Big Data und Machine Learning
Verfahren zur halbautomatischen Konsistenzprüfung der tatsächlichen Nutzung in ALKIS und ATKIS

Verfahren zur halbautomatischen Konsistenzprüfung der tatsächlichen Nutzung in ALKIS und ATKIS

Team:  Lukas Hynek
Jahr:  2015
Laufzeit:  2015
Ist abgeschlossen:  ja

Die Landnutzungsdaten in den beiden amtlichen Informationssystemen ALKIS und ATKIS weisen oft Inkonsistenzen auf, unter anderem aufgrund von unterschiedlicher Erfassung und Fortführung, sowie einem unterschiedlichen Maßstab. Auch besitzen beide Systeme einen unterschiedlichen Objektarten- und Signaturenkatalog, wodurch eine direkte Zuordnung der tatsächlichen Nutzung aus beiden Systemen nicht immer ohne weiteres möglich ist.

Ziel dieser Arbeit war die Erstellung eines Programms, das eine halbautomatische Konsistenzprüfung der Daten aus beiden Systemen ermöglicht. Dazu sollten vom entwickelten Programm zunächst selbstständig einige Verbesserungen vorgenommen werden. Anschließend sollten dem Nutzer die Flächen, bei denen keine sichere Entscheidung getroffen werden konnte, zur Prüfung vorlegt werden. Um eine Zuordnung der Landnutzungsdaten aus ALKIS und ATKIS zu realisieren, wurden einige Algorithmen aus dem Bereich des maschinellen Lernens verwendet und getestet. Auf diese Weise konnten Ableitungsregeln für die tatsächliche Nutzung in ATKIS aus ALKIS erstellt werden.

Die Bewertung der Ergebnisse erfolgte über einen Vergleich der vorhersagten Werte der tatsächlichen Nutzung in ATKIS mit manuell erzeugten Sollwerten. Somit war ein solcher Test ohne eine vorangegangene manuelle Überprüfung des Datensatzes nicht möglich, wodurch nur auf einem Datensatz ausführlich getestet werden konnte. Zumindest für diesen Datensatz zeigen sich jedoch gute Ergebnisse. Der ausgewählte Algorithmus ist sich bei gut 80% seiner Vorhersagen sicher, der Benutzer müsste also nur noch knapp 20% der Flächen überprüfen. Nach der Bearbeitung durch den Nutzer bleiben noch 5% fehlerhafte Flächen übrig. Neben der Anzahl der Abweichungen vom Soll wurde auch noch eine Bewertung der auftretenden Fehler über ein Fehlermaß durchgeführt, da z.B. Abweichungen zwischen den unterschiedlichen landwirtschaftlichen Nutzungsklassen als nicht so kritisch angesehen werden können, wie ein Wohngebiet das als stehendes Gewässer kategorisiert wurde. Die am Ende noch fehlerhaften Flächen weisen dabei erfreulicherweise größtenteils ein sehr geringes Fehlermaß auf.