National Transport Library Research Database

Maskininlärningsbaserad robust tidtabelläggning för taktisk tåglägsplanering (MAST) (Machine learning-based robust timetabling for tactical train path planning (MAST))

Sponsors, duration, budget: Trafikverket ; 2025-05-22 -- 2026-12-15 ; 1 800 000 kronorRegistration number:
  • Trafikverket 2025/44995
Notes: Branschprogram: KAJT-programmetSummary: Portfölj Planera Branschprogram KAJT-programmet Svensk sammanfattning Artificiell intelligens och maskininlärning väntas kunna optimera och effektivisera framtidens transportsystem. För järnvägen skulle maskininlärning kunna bidra till att skapa mer robusta tidtabeller, vilket i sin tur skulle bidra till att förbättra trafikens punktlighet. Enligt Tang et al. (2022) är användningen av maskininlärning inom kapacitetsplanering fortfarande relativt begränsad, och forskning inom tidtabelläggning med stöd av AI har hittills fokuserat på att skapa konfliktfria tidtabeller. Därför genomfördes under 2023 en förstudie för att utveckla metodik för att generera robusta tåglägen baserat på deep reinforcement learning (djup förstärkningsinlärning). Reinforcement learning (RL) är ett område inom maskininlärning där en agent lär sig en optimal strategi för att lösa ett problem genom att interagera med sin omgivning. Förhoppningen är att RL-metoden ska kunna användas för att i snabbt hitta robusta tåglägen utifrån exempelvis önskat avgångstidsfönster, längsta restid och ansökt uppehållsmönster. Projektet har hittills varit lyckat och metoden genererar tåglägen på med mer än 95 % punktlighet i RailSys-simulering för de scenarier den har tränats på. Forskningen har flera potentiella tillämpningar: den skulle kunna användas för att planera om tåglägen i så väl taktisk som kortsiktig trafikplanering, som stöd för trafikplanerare när de ska lägga in nya tåglägen, eller som en del i ett tåglägesbokningssystem. Inspirerat av de uppmärksammade storskaliga språkmodellerna (tex Chat-GPT) skulle det även vara intressant att kombinera detta med ett chat-gränssnitt. Forskningen befinner sig dock fortfarande i ett tidigt skede och det finns många områden att arbeta med för att höja dess tekniska mognadsgrad (TRL-nivå). Syftet med detta projekt är fortsatt att utveckla RL-baserade metoder för att generera robusta tåglägen med fokus på dubbelspårstrafik. Den övergripande målsättningen med projektet är att utveckla en implementerbar metod som kan användas även på scenarier som agenten inte har tränats på. Metoden anses implementerbar om den kan användas för att planera olika tågtyper, i olika användarfall, och generaliserar till nya scenarier (som den inte specifikt har tränats för). För att adressera detta har projektet därför följande forskningsmål: RO1: Utvidga metoden från Högdahl et al. (unpublished) så att den kan generera robusta tåglägen för scenarier som den inte har tränats på. R02: Utvidga metoden från Högdahl et al. (unpublished) genom att ge agent flera möjliga handlingar (t. ex. att lägga till extra uppehåll, ta bort uppehåll, eller tilldela spår på stationer). R03: Träna metoden på olika tågtyper (t. ex. gods- och persontåg). R04: Utvärdera generaliserbarheten för den framtagna metoden och jämföra detta med metoden från Högdahl et al. (unpublished). RO5: Utvärdera metodens prestanda och jämföra detta med state-of-the-art inom tågplanering. Summary: Artificial intelligence and machine learning are expected to optimize and streamline future transportation systems. For railways, machine learning could help create more robust timetables, which in turn would improve traffic punctuality. According to Tang et al. (2022), the use of machine learning in capacity planning is still relatively limited, and research in AI-supported timetabling has so far focused on creating conflict-free timetables. Therefore, in 2023, a preliminary study was conducted to develop a methodology for generating robust train paths based on deep reinforcement learning. Reinforcement learning (RL) is a field within machine learning where an agent learns an optimal strategy to solve a problem by interacting with its environment. The hope is that the RL method can be used to quickly find robust train paths based on, for example, desired departure time windows, maximum travel time, and requested stop patterns. The project has been successful so far, and the method generates train paths with more than 95% punctuality in RailSys simulations for the scenarios it has been trained on. The research has several potential applications: it could be used to reschedule train paths in both tactical and short-term traffic planning, as support for traffic planners when they need to insert new train paths, or as part of a train path booking system. Inspired by the prominent large-scale language models (e.g., Chat-GPT), it would also be interesting to combine this with a chat interface. However, the research is still in its early stages, and there are many areas to work on to raise the technological readiness level. The purpose of this project is to continue developing RL-based methods to generate robust train schedules with a focus on double-track traffic. The overall goal of the project is to develop an implementable method that can be used even in scenarios that the agent has not been trained on. The method is considered implementable if it can be used to plan different types of trains, in different use cases, and generalizes to new scenarios (which it has not specifically been trained for). To address this, the project has the following research objectives: RO1: Extend the method from Högdahl et al. (unpublished) so that it can generate robust train paths for scenarios it has not been trained on. RO2: Extend the method from Högdahl et al. (unpublished) by giving the agent more possible actions (e.g., adding extra stops, removing stops, or assigning tracks at stations). RO3: Train the method on different types of trains (e.g., freight and passenger trains). RO4: Evaluate the generalizability of the developed method and compare this with the method from Högdahl et al. (unpublished). RO5: Evaluate the performance of the method and compare this with the state-of-the-art in train scheduling.
Item type: