ForschungBig Data und Machine Learning
Simulation von GPS-Trajektorien als Trainingsdaten für das maschinelle Lernen von Wegeachsen

Simulation von GPS-Trajektorien als Trainingsdaten für das maschinelle Lernen von Wegeachsen

Leitung:  Frank Thiemann, Prof. Sester
Team:  Thorben Freitag
Jahr:  2018
Ist abgeschlossen:  ja

Simulation von GPS-Trajektorien als Trainingsdaten für das maschinelle Lernen von Wegeachsen

In dieser Arbeit wird ein Algorithmus zur Simulation von realitätsnahen GPS-Trajektorien, als Trainingsdaten für ein Convolutional Neural Network, für den Bewegungsmodus Kraftfahrzeug präsentiert. Dazu wird das Straßennetz aus OpenStreetMap für ein Auswahlgebiet zu einem routingfähigen Graphen aufbereitet. Den verschiedenen Straßentypen werden charakteristische Straßenbreiten und Fahrstreifenanzahlen zugewiesen, aufgrund dessen Hilfsgeometrien für Fahrspuren generiert werden. Für eine realistische Auslastung von verschiedenen Straßentypen wird eine regelbasierte Auswahl von Start- und Zielknoten der Routengenerierung zur anschließenden virtuellen Befahrung verwendet. Durch eine dynamische Kostenberechnung für die Kanten des Graphen, welche die Straßen repräsentieren, wird unter Verwendung des Dijkstra-Algorithmus eine homogenere Verteilung von Trajektorien über das Straßennetz erzielt. Der GPS-Fehler wird als normalverteilt angenommen und durch einen systematischen und einen zufälligen Anteil auf die Punkte der Trajektorien modelliert. Die Standardabweichungen werden anhand von Untersuchungen kinematischer Positionierungsgenauigkeit mit kostengünstigen GPS-Empfängern aus der Literatur gewählt. Durch die Erfassung der Befahrung von Straßensegmenten werden Referenzstraßen, unter Anwendung eines Schwellwertes für die jeweilige Befahrung, aus dem Straßennetz selektiert.

Aus den simulierten Trajektorien wird für das Training eines vorgestellten Convolutional Neural Network eine Dichtekarte erzeugt. Diese wird mit den Referenzstraßen als Ground-Truth zum Lernen des Klassifikators verwendet. Der Klassifikator wird mit verschiedenen Datensätzen trainiert und jeweils zum Vergleich auf weitere Datensätze angewendet. Die Klassifikation wird optisch und anhand von Evaluierungsmaßen der binären Klassifikation beurteilt.