Machine learning voorspelling van vervoersmiddelen in smartphone-onderzoek
Betrouwbare statistieken over reisgedrag zijn belangrijk voor nationale infrastructuurplanning, het opstellen van vervoersbeleid en het begrijpen van mobiliteitspatronen. Recente ontwikkelingen op het gebied van reisonderzoeken via smartphones maken passieve gegevensverzameling mogelijk via GPS-sensoren in smartphones. Deze slimme onderzoeken bieden een alternatief voor traditionele reisdagboekonderzoeken, die doorgaans worden beïnvloed door een hoge responslast. Deze studie onderzoekt de toepassing van supervised machine learning-modellen om automatisch vervoermiddelen te identificeren op basis van GPS-metingen die zijn verzameld via een reisapp die is ontwikkeld door het Centraal Bureau voor de Statistiek. We vergelijken Random Forest- en Extreme Gradient Boosting-classificatiemodellen die zijn getraind op basis van GPS-kenmerken in combinatie met contextuele locatiegebaseerde kenmerken uit OpenStreetMap, alsook temporele kenmerken die zijn afgeleid van tijdgerelateerde informatie en eerder reisgedrag. Het Extreme Gradient Boosting-model, getraind op de volledige set kenmerken, behaalde de hoogste nauwkeurigheid (0.91) en macro-gemiddelde F1-score (0.84), terwijl het ook de beste nauwkeurigheid (0.84) behaalde bij evaluatie op externe validatiedata. Hoewel deze resultaten suggereren dat volledig geautomatiseerde classificatie van vervoerswijzen in de reisapp misschien nog niet haalbaar is, zou een semi-geautomatiseerde aanpak met gerichte prompts kunnen worden gebruikt om een evenwicht te vinden tussen de nauwkeurigheid van de classificatie van vervoerswijzen en de responslast.
Boer, Q., Y. Gootzen, J. Klingwort, D. Remmerswaal, P. Lugtig (2025). Machine‐learning based transport mode prediction in a smartphone‐based travel and mobility survey. Discussion paper, Statistics Netherlands, The Hague/Heerlen.
Downloads
- Discussion Paper - Transport mode prediction ML