Applying Data Science and Machine Learning to Transportation Engineering: Does it improve decision-making in mobility systems?

Bookmark (0)
Please login to bookmark Close

Applying data science and machine learning to transportation engineering is essential for addressing modern urban mobility challenges. This thesis investigates whether these technologies improve decision-making in mobility systems, aiming to create more efficient, sustainable, and cohesive mobility solutions. By leveraging data science and machine learning, the research introduces innovative tools across various urban mobility applications to support organizations, stakeholders, and policymakers in navigating the complexities of urban mobility.
The research follows a comprehensive methodology encompassing domain understanding, data collection, data cleaning, data exploration, feature engineering, predictive modeling, and stakeholder communication. At its core is a compendium of four scientific publications, each providing empirical evidence and insights aligned with the broader research objectives.
The specific objectives focus on: (i) identifying effective data sources and collection techniques for urban mobility analysis; (ii) determining the role of feature engineering in enhancing data quality and relevance; (iii) evaluating the suitability and added value of machine learning techniques for urban mobility challenges; and (iv) assessing model performance while defining policy recommendations for mobility stakeholders.
These objectives are tested through three practical research applications addressing real-world urban mobility challenges: (i) promoting micromobility for urban shopping; (ii) setting prices in ride-hailing services; and (iii) forecasting moped scooter-sharing demand.
The first research application examines factors influencing the adoption of bicycles and scooters (primarily active modes) for urban shopping in cities with low micromobility maturity. Using machine learning models applied to survey data, the study identifies barriers and provides policy recommendations to improve infrastructure and safety for micromobility, emphasizing potential growth post-COVID-19.
The second research application explores pricing dynamics in ride-hailing services. One study analyzes fare patterns before and during the COVID-19 pandemic in Boston and Atlanta, uncovering fare dynamics during crises. Another examines determinants of fares in Madrid, considering factors such as weather conditions and peak hours. Together, these studies provide insights into efficient pricing strategies and policy recommendations for better regulation and integration of ride-hailing services.
The third research application focuses on forecasting demand for moped scooter-sharing services. Using machine learning techniques, the study predicts travel demand based on comprehensive datasets, including sociodemographic characteristics, transportation network attributes, and policy-related variables. The results demonstrate the effectiveness of the random forest model and underscore the significance of neighborhood characteristics and short-distance trip preferences in urban planning and transportation management.
This thesis demonstrates that data science and machine learning significantly enhance decision-making in mobility systems by improving prediction accuracy, optimizing data utilization, and providing actionable recommendations for sustainable urban mobility. Furthermore, it acknowledges persistent challenges such as the need for high-quality data, robust algorithms, and enhanced model interpretability. Addressing these limitations is critical for ensuring successful real-world implementation and maximizing the transformative potential of these technologies.
RESUMEN
La aplicación de la ciencia de datos y el aprendizaje automático a la ingeniería del transporte es esencial para abordar los desafíos modernos de la movilidad urbana. Esta tesis investiga si estas tecnologías mejoran la toma de decisiones en los sistemas de movilidad, con el objetivo de crear soluciones más eficientes, sostenibles y cohesionadas. Al aprovechar estas herramientas, la investigación introduce innovaciones en diversas aplicaciones de movilidad urbana para apoyar a organizaciones, partes interesadas y responsables políticos en la gestión de la movilidad urbana.
La metodología incluye comprensión del dominio, recopilación, limpieza y exploración de datos, ingeniería de características, modelado predictivo y comunicación con partes interesadas. En su núcleo está un compendio de cuatro publicaciones científicas, cada una aportando evidencia empírica y conocimientos alineados con los objetivos generales.
Los objetivos específicos son: (i) identificar fuentes de datos y técnicas de recopilación efectivas para el análisis de movilidad urbana; (ii) determinar el papel de la ingeniería de características en la mejora de la calidad y relevancia de los datos; (iii) evaluar la idoneidad y el valor añadido de las técnicas de aprendizaje automático en desafíos de movilidad urbana; y (iv) analizar el rendimiento de los modelos y definir recomendaciones de políticas para las partes interesadas de la movilidad.
Estos objetivos se prueban a través de tres aplicaciones prácticas: (i) promover la micromovilidad para compras urbanas; (ii) establecer precios en servicios de vehículo de transporte con conductor (VTC); y (iii) predecir la demanda de motos compartidas.
La primera aplicación examina los factores que influyen en la adopción de bicicletas y patinetes (principalmente modos activos) para compras urbanas en ciudades con baja madurez en micromovilidad. Usando modelos de aprendizaje automático aplicados a datos de encuestas, se identifican barreras y se proponen recomendaciones para mejorar infraestructura y seguridad, destacando su potencial de crecimiento post-COVID-19.
La segunda aplicación explora la dinámica de precios en servicios de VTC. Un estudio analiza patrones tarifarios antes y durante la pandemia en Boston y Atlanta, identificando la dinámica de tarifas en tiempos de crisis. Otro examina los determinantes de tarifas en Madrid, considerando clima y horarios pico. Estos estudios ofrecen estrategias de precios y recomendaciones de regulación para integrar mejor los servicios VTC.
La tercera aplicación se centra en predecir la demanda de motos compartidas. Usando técnicas de aprendizaje automático, se predice la demanda basándose en datos sociodemográficos, atributos de la red y variables políticas. Los resultados destacan la efectividad del modelo de random forest y la importancia de las características de los barrios y las preferencias por trayectos de corta distancia en la planificación urbana y gestión del transporte.
Esta tesis demuestra que la ciencia de datos y el aprendizaje automático mejoran la toma de decisiones en sistemas de movilidad al incrementar la precisión de predicciones, optimizar el uso de datos y ofrecer recomendaciones prácticas para la movilidad sostenible. También reconoce desafíos como la necesidad de datos de alta calidad, algoritmos robustos y modelos más interpretables. Abordar estas limitaciones es clave para garantizar implementaciones exitosas y maximizar el impacto de estas tecnologías.

​Applying data science and machine learning to transportation engineering is essential for addressing modern urban mobility challenges. This thesis investigates whether these technologies improve decision-making in mobility systems, aiming to create more efficient, sustainable, and cohesive mobility solutions. By leveraging data science and machine learning, the research introduces innovative tools across various urban mobility applications to support organizations, stakeholders, and policymakers in navigating the complexities of urban mobility.
The research follows a comprehensive methodology encompassing domain understanding, data collection, data cleaning, data exploration, feature engineering, predictive modeling, and stakeholder communication. At its core is a compendium of four scientific publications, each providing empirical evidence and insights aligned with the broader research objectives.
The specific objectives focus on: (i) identifying effective data sources and collection techniques for urban mobility analysis; (ii) determining the role of feature engineering in enhancing data quality and relevance; (iii) evaluating the suitability and added value of machine learning techniques for urban mobility challenges; and (iv) assessing model performance while defining policy recommendations for mobility stakeholders.
These objectives are tested through three practical research applications addressing real-world urban mobility challenges: (i) promoting micromobility for urban shopping; (ii) setting prices in ride-hailing services; and (iii) forecasting moped scooter-sharing demand.
The first research application examines factors influencing the adoption of bicycles and scooters (primarily active modes) for urban shopping in cities with low micromobility maturity. Using machine learning models applied to survey data, the study identifies barriers and provides policy recommendations to improve infrastructure and safety for micromobility, emphasizing potential growth post-COVID-19.
The second research application explores pricing dynamics in ride-hailing services. One study analyzes fare patterns before and during the COVID-19 pandemic in Boston and Atlanta, uncovering fare dynamics during crises. Another examines determinants of fares in Madrid, considering factors such as weather conditions and peak hours. Together, these studies provide insights into efficient pricing strategies and policy recommendations for better regulation and integration of ride-hailing services.
The third research application focuses on forecasting demand for moped scooter-sharing services. Using machine learning techniques, the study predicts travel demand based on comprehensive datasets, including sociodemographic characteristics, transportation network attributes, and policy-related variables. The results demonstrate the effectiveness of the random forest model and underscore the significance of neighborhood characteristics and short-distance trip preferences in urban planning and transportation management.
This thesis demonstrates that data science and machine learning significantly enhance decision-making in mobility systems by improving prediction accuracy, optimizing data utilization, and providing actionable recommendations for sustainable urban mobility. Furthermore, it acknowledges persistent challenges such as the need for high-quality data, robust algorithms, and enhanced model interpretability. Addressing these limitations is critical for ensuring successful real-world implementation and maximizing the transformative potential of these technologies.
RESUMEN
La aplicación de la ciencia de datos y el aprendizaje automático a la ingeniería del transporte es esencial para abordar los desafíos modernos de la movilidad urbana. Esta tesis investiga si estas tecnologías mejoran la toma de decisiones en los sistemas de movilidad, con el objetivo de crear soluciones más eficientes, sostenibles y cohesionadas. Al aprovechar estas herramientas, la investigación introduce innovaciones en diversas aplicaciones de movilidad urbana para apoyar a organizaciones, partes interesadas y responsables políticos en la gestión de la movilidad urbana.
La metodología incluye comprensión del dominio, recopilación, limpieza y exploración de datos, ingeniería de características, modelado predictivo y comunicación con partes interesadas. En su núcleo está un compendio de cuatro publicaciones científicas, cada una aportando evidencia empírica y conocimientos alineados con los objetivos generales.
Los objetivos específicos son: (i) identificar fuentes de datos y técnicas de recopilación efectivas para el análisis de movilidad urbana; (ii) determinar el papel de la ingeniería de características en la mejora de la calidad y relevancia de los datos; (iii) evaluar la idoneidad y el valor añadido de las técnicas de aprendizaje automático en desafíos de movilidad urbana; y (iv) analizar el rendimiento de los modelos y definir recomendaciones de políticas para las partes interesadas de la movilidad.
Estos objetivos se prueban a través de tres aplicaciones prácticas: (i) promover la micromovilidad para compras urbanas; (ii) establecer precios en servicios de vehículo de transporte con conductor (VTC); y (iii) predecir la demanda de motos compartidas.
La primera aplicación examina los factores que influyen en la adopción de bicicletas y patinetes (principalmente modos activos) para compras urbanas en ciudades con baja madurez en micromovilidad. Usando modelos de aprendizaje automático aplicados a datos de encuestas, se identifican barreras y se proponen recomendaciones para mejorar infraestructura y seguridad, destacando su potencial de crecimiento post-COVID-19.
La segunda aplicación explora la dinámica de precios en servicios de VTC. Un estudio analiza patrones tarifarios antes y durante la pandemia en Boston y Atlanta, identificando la dinámica de tarifas en tiempos de crisis. Otro examina los determinantes de tarifas en Madrid, considerando clima y horarios pico. Estos estudios ofrecen estrategias de precios y recomendaciones de regulación para integrar mejor los servicios VTC.
La tercera aplicación se centra en predecir la demanda de motos compartidas. Usando técnicas de aprendizaje automático, se predice la demanda basándose en datos sociodemográficos, atributos de la red y variables políticas. Los resultados destacan la efectividad del modelo de random forest y la importancia de las características de los barrios y las preferencias por trayectos de corta distancia en la planificación urbana y gestión del transporte.
Esta tesis demuestra que la ciencia de datos y el aprendizaje automático mejoran la toma de decisiones en sistemas de movilidad al incrementar la precisión de predicciones, optimizar el uso de datos y ofrecer recomendaciones prácticas para la movilidad sostenible. También reconoce desafíos como la necesidad de datos de alta calidad, algoritmos robustos y modelos más interpretables. Abordar estas limitaciones es clave para garantizar implementaciones exitosas y maximizar el impacto de estas tecnologías. Read More