In seiner Masterarbeit entwickelte Jonas Wälter aus einer Mischung klassischer Optimierungstechniken und verstärkendem Lernen («Reinforcement Learning»), ein Verfahren für erhöhte Kapazität und Ausfall-Robustheit bei der Zugplanung. Bei der «SBB Flatland Challenge» im Januar 2020 setzte er sich damit gegenüber 500 Konkurrentinnen und Konkurrenten durch und kam auf den 4. Platz als beste eingereichte Arbeit aus der Schweiz. Die ersten drei Ränge wurden von erfahrenen Forscher-Teams belegt, was den 4. Rang für den frisch gebackenen Ingenieur mit relativ wenig Erfahrung auf dem Gebiet umso beeindruckender machte.
Zugplanung mit maschinellem Lernen optimiert
Jetzt veröffentlichte Wälter gemeinsam mit seinem Betreuer Prof. Dr. Farhad D. Mehta und Xiaolu Rao von der SBB einen Artikel zu den Erkenntnissen aus der Master-Arbeit im «International Journal of Transport Development and Integration». «Die Waggon-Disposition stellt zentrale Herausforderungen an die Planung und den Betrieb der Eisenbahn», schreiben die Autoren, «Obwohl dies (…) seit Jahrzehnten Thema der Forschung und Entwicklung ist, verlassen sich Eisenbahn-Betriebe aus gutem Grund am Ende des Tages auf gut ausgebildetes und erfahrenes Personal (…)». Es sei plausibel, dass das «Reinforcement Learning» genutzt werden kann, um aus der Erfahrung der Dispatcher zu lernen und die Zugplanung dadurch automatisiert zu unterstützen.
Wälter stellte sich zwei Herausforderungen: Einerseits dem «multi agent path finding», oder MAPF. Hier soll eine bestimmte Anzahl von Zügen in einem Schienen-Netzwerk in kürzester Zeit von einer Position an einen Zielort geleitet werden, ohne sich in die Quere zu kommen. Im Falle einer Fehlfunktion müssen die Routen neu geplant werden, womit die zweite Herausforderung genannt sei: Das «vehicle rescheduling problem», oder VRSP. Wälter führte die Untersuchung in einem von der SBB zur Verfügung gestellten Modell-Schienennetz durch.
Lesen Sie hier den Fachartikel
Die SBB zeigte bereits Interesse, die Erkenntnisse aus der Arbeit von Jonas Wälter für zukünftige Optimierungen zu nutzen.