Diseño e implementación de un sistema basado en aprendizaje automático para la predicción del TDAH mediante datos fisiológicos como la frecuencia cardíaca y el nivel de actividad física

Bookmark (0)
Please login to bookmark Close

Este trabajo se centra en el diseño e implementación de un sistema basado en aprendizaje automático orientado a la predicción del Trastorno por Déficit de Atención e Hiperactividad (TDAH), utilizando dos datos fisiológicos, la actividad motora y la frecuencia cardíaca. El ámbito de la salud mental tiene mucho potencial para investigar métodos complementarios más objetivos a las actuales herramientas de diagnóstico.
Para abordar esta propuesta, se utilizó el conjunto de datos HYPERAKTIV, compuesto por registros de frecuencia cardíaca y actividad motora de 103 participantes, de los cuales 51 fueron diagnosticados con TDAH y 52 actuaron como grupo control. La muestra es 100% adulta, por lo que este trabajo se centrará en el diagnóstico en la edad adulta. Dicho dataset presenta particularidades por lo que se diseñó un proceso de preprocesamiento y procesamiento para ambas señales.
Posteriormente, el modelo se entrenó con dos algoritmos de clasificación supervisada distintos, Random Forest y Perceptrón Multicapa (MLP), para luego elegir el más adecuado. La comparación entre ambos modelos se realizó mediante métricas habituales en el ámbito biomédico, como Accuracy, F1-score, ROC-AUC, PR-AUC, MCC y precisión, complementadas con un análisis de estabilidad estadística mediante bootstrap.
Finalmente, se desarrolló una aplicación web que integra el modelo seleccionado, demostrando que la combinación de señales fisiológicas y técnicas de aprendizaje automático constituye una vía viable para apoyar el proceso diagnóstico del TDAH en adultos.
Abstract:
This work focuses on the design and implementation of a machine learning–based system aimed at predicting Attention Deficit Hyperactivity Disorder (ADHD) using two physiological signals: motor activity and heart rate. The field of mental health holds great potential for exploring more objective complementary methods to current diagnostic tools.
To address this proposal, the HYPERAKTIV dataset was used, consisting of heart rate and motor activity records from 103 participants, of whom 51 were diagnosed with ADHD and 52 served as the control group. The sample is entirely composed of adults; therefore, this work centers specifically on diagnosis in adulthood. Due to the particular characteristics of the dataset, a dedicated preprocessing and processing pipeline was designed for both signals.
Subsequently, the model was trained using two different supervised classification algorithms, Random Forest and Multilayer Perceptron (MLP), in order to select the most suitable one. The comparison between both models was conducted using commonly employed metrics in biomedical research, such as Accuracy, F1-score, ROC-AUC, PR-AUC, MCC, and Precision, complemented by a statistical stability analysis through bootstrapping.
Finally, a web application integrating the selected model was developed, demonstrating that the combination of physiological signals and machine learning techniques constitutes a viable approach to support the diagnostic process of ADHD in adults.

​Este trabajo se centra en el diseño e implementación de un sistema basado en aprendizaje automático orientado a la predicción del Trastorno por Déficit de Atención e Hiperactividad (TDAH), utilizando dos datos fisiológicos, la actividad motora y la frecuencia cardíaca. El ámbito de la salud mental tiene mucho potencial para investigar métodos complementarios más objetivos a las actuales herramientas de diagnóstico.
Para abordar esta propuesta, se utilizó el conjunto de datos HYPERAKTIV, compuesto por registros de frecuencia cardíaca y actividad motora de 103 participantes, de los cuales 51 fueron diagnosticados con TDAH y 52 actuaron como grupo control. La muestra es 100% adulta, por lo que este trabajo se centrará en el diagnóstico en la edad adulta. Dicho dataset presenta particularidades por lo que se diseñó un proceso de preprocesamiento y procesamiento para ambas señales.
Posteriormente, el modelo se entrenó con dos algoritmos de clasificación supervisada distintos, Random Forest y Perceptrón Multicapa (MLP), para luego elegir el más adecuado. La comparación entre ambos modelos se realizó mediante métricas habituales en el ámbito biomédico, como Accuracy, F1-score, ROC-AUC, PR-AUC, MCC y precisión, complementadas con un análisis de estabilidad estadística mediante bootstrap.
Finalmente, se desarrolló una aplicación web que integra el modelo seleccionado, demostrando que la combinación de señales fisiológicas y técnicas de aprendizaje automático constituye una vía viable para apoyar el proceso diagnóstico del TDAH en adultos.
Abstract:
This work focuses on the design and implementation of a machine learning–based system aimed at predicting Attention Deficit Hyperactivity Disorder (ADHD) using two physiological signals: motor activity and heart rate. The field of mental health holds great potential for exploring more objective complementary methods to current diagnostic tools.
To address this proposal, the HYPERAKTIV dataset was used, consisting of heart rate and motor activity records from 103 participants, of whom 51 were diagnosed with ADHD and 52 served as the control group. The sample is entirely composed of adults; therefore, this work centers specifically on diagnosis in adulthood. Due to the particular characteristics of the dataset, a dedicated preprocessing and processing pipeline was designed for both signals.
Subsequently, the model was trained using two different supervised classification algorithms, Random Forest and Multilayer Perceptron (MLP), in order to select the most suitable one. The comparison between both models was conducted using commonly employed metrics in biomedical research, such as Accuracy, F1-score, ROC-AUC, PR-AUC, MCC, and Precision, complemented by a statistical stability analysis through bootstrapping.
Finally, a web application integrating the selected model was developed, demonstrating that the combination of physiological signals and machine learning techniques constitutes a viable approach to support the diagnostic process of ADHD in adults. Read More