El aumento del tráfico aéreo en los últimos años ha hecho que su gestión (Air Traffic Management, ATM) sea cada vez más compleja. Esto ha dado lugar a una gran cantidad de datos generados por los vuelos, que incluyen información sobre trayectorias, tiempos y otras variables relacionadas. Estos datos son difíciles de analizar porque están altamente interconectados, son multidimensionales, cambian constantemente, presentan una gran variabilidad y, en muchos casos, contienen errores o están incompletos. Todo esto limita la capacidad de los enfoques tradicionales para analizar esta información y detectar patrones, relaciones o anomalías de forma eficaz.
En este contexto, estudios recientes han propuesto el uso del análisis topológico de datos (Topological Data Analysis, TDA) como una alternativa para abordar la complejidad de la información generada por el tráfico aéreo. Con este objetivo, una de estas investigaciones desarrolló una metodología basada en técnicas topológicas aplicadas al estudio de trayectorias de aeronaves y los retrasos asociados, centrándose en vuelos que despegan y aterrizan en aeropuertos españoles. Según sus autores, el análisis topológico podría ser una técnica prometedora para superar las limitaciones del análisis de datos en el ámbito de la aviación.
Siguiendo este enfoque, este Trabajo de Fin de Máster toma como base dicha propuesta para ampliar y evaluar el uso del TDA en el análisis de datos de vuelos. Para ello, se desarrolla un modelo que combina análisis topológico de datos con técnicas de aprendizaje automático, con el objetivo de clasificar los aeropuertos españoles según el comportamiento de sus vuelos. El análisis tiene en cuenta tanto los retrasos como las diferencias entre las trayectorias planificadas (las rutas previstas del vuelo) y las trayectorias reales (rutas efectivamente voladas), partiendo de la metodología usada en el estudio previo y adaptándola con ajustes propios para mejorar su aplicabilidad.
Finalmente, la validación del modelo se realiza comparando la clasificación obtenida con los resultados de otros estudios.
–ABSTRACT–
The increase in air traffic in recent years has made its management (Air Traffic Management, ATM) increasingly complex. This has led to the generation of a large amount of data from flights, including information about trajectories, timings, and other related variables. These data are difficult to analyze because they are highly interconnected, multidimensional, constantly changing, and exhibit high variability. In many cases, they also contain errors or are incomplete. All of this limits the ability of traditional approaches to effectively analyze this information and detect patterns, relationships, or anomalies.
In this context, recent studies have proposed the use of Topological Data Analysis (TDA) as an alternative to address the complexity of information generated by air traffic. With this objective in mind, one of these studies developed a methodology based on topological techniques applied to the analysis of aircraft trajectories and associated delays, focusing on flights that depart from or arrive at Spanish airports. According to its authors, topological analysis could be a promising technique to overcome the limitations of conventional data analysis in the aviation domain.
Following this approach, this Master’s Thesis builds upon that proposal to expand and evaluate the use of TDA in flight data analysis. To this end, a model is developed that combines topological data analysis with machine learning techniques, aiming to classify Spanish airports based on the behavior of their associated flights. The analysis considers both delays and differences between planned trajectories (the scheduled routes for the flight) and actual trajectories (the routes actually flown), starting from the methodology used in the previous study and adapting it with custom modifications to enhance its applicability.
Finally, the model is validated by comparing the resulting classification with the outcomes of other studies.
El aumento del tráfico aéreo en los últimos años ha hecho que su gestión (Air Traffic Management, ATM) sea cada vez más compleja. Esto ha dado lugar a una gran cantidad de datos generados por los vuelos, que incluyen información sobre trayectorias, tiempos y otras variables relacionadas. Estos datos son difíciles de analizar porque están altamente interconectados, son multidimensionales, cambian constantemente, presentan una gran variabilidad y, en muchos casos, contienen errores o están incompletos. Todo esto limita la capacidad de los enfoques tradicionales para analizar esta información y detectar patrones, relaciones o anomalías de forma eficaz.
En este contexto, estudios recientes han propuesto el uso del análisis topológico de datos (Topological Data Analysis, TDA) como una alternativa para abordar la complejidad de la información generada por el tráfico aéreo. Con este objetivo, una de estas investigaciones desarrolló una metodología basada en técnicas topológicas aplicadas al estudio de trayectorias de aeronaves y los retrasos asociados, centrándose en vuelos que despegan y aterrizan en aeropuertos españoles. Según sus autores, el análisis topológico podría ser una técnica prometedora para superar las limitaciones del análisis de datos en el ámbito de la aviación.
Siguiendo este enfoque, este Trabajo de Fin de Máster toma como base dicha propuesta para ampliar y evaluar el uso del TDA en el análisis de datos de vuelos. Para ello, se desarrolla un modelo que combina análisis topológico de datos con técnicas de aprendizaje automático, con el objetivo de clasificar los aeropuertos españoles según el comportamiento de sus vuelos. El análisis tiene en cuenta tanto los retrasos como las diferencias entre las trayectorias planificadas (las rutas previstas del vuelo) y las trayectorias reales (rutas efectivamente voladas), partiendo de la metodología usada en el estudio previo y adaptándola con ajustes propios para mejorar su aplicabilidad.
Finalmente, la validación del modelo se realiza comparando la clasificación obtenida con los resultados de otros estudios.
–ABSTRACT–
The increase in air traffic in recent years has made its management (Air Traffic Management, ATM) increasingly complex. This has led to the generation of a large amount of data from flights, including information about trajectories, timings, and other related variables. These data are difficult to analyze because they are highly interconnected, multidimensional, constantly changing, and exhibit high variability. In many cases, they also contain errors or are incomplete. All of this limits the ability of traditional approaches to effectively analyze this information and detect patterns, relationships, or anomalies.
In this context, recent studies have proposed the use of Topological Data Analysis (TDA) as an alternative to address the complexity of information generated by air traffic. With this objective in mind, one of these studies developed a methodology based on topological techniques applied to the analysis of aircraft trajectories and associated delays, focusing on flights that depart from or arrive at Spanish airports. According to its authors, topological analysis could be a promising technique to overcome the limitations of conventional data analysis in the aviation domain.
Following this approach, this Master’s Thesis builds upon that proposal to expand and evaluate the use of TDA in flight data analysis. To this end, a model is developed that combines topological data analysis with machine learning techniques, aiming to classify Spanish airports based on the behavior of their associated flights. The analysis considers both delays and differences between planned trajectories (the scheduled routes for the flight) and actual trajectories (the routes actually flown), starting from the methodology used in the previous study and adapting it with custom modifications to enhance its applicability.
Finally, the model is validated by comparing the resulting classification with the outcomes of other studies. Read More


