Este PFG, con título “Diseño de un analizador de muestras de suero sanguíneo mediante procesado de imagen y aprendizaje profundo en microscopía”, se centra en el estudio y desarrollo de técnicas alternativas y no invasivas de diagnóstico del grado de traumatismo craneoencefálico a través del análisis de muestras de suero sanguíneo secas. El fin de este proyecto es desarrollar un sistema que, a partir de una imagen de una muestra de este tipo, permita evaluar el nivel de lesión cerebral que sufre un paciente, ofreciendo una alternativa a las pruebas de diagnóstico actuales como la Tomografía Axial Computerizada (TAC) o Resonancia Magnética (RM) las cuales presentan algunas desventajas como la exposición a radiación ionizante, el elevado coste que suponen y su difícil acceso en algunas zonas debido a la falta de los recursos necesarios para su realización. Para ello se investigan, desarrollan e implementan distintas técnicas de tratamiento digital de la imagen, visión por ordenador y aprendizaje automático, con el objetivo de caracterizar las propiedades visuales de las muestras que permitan en última instancia el desarrollo de un sistema eficiente de diagnóstico del daño cerebral.
Para la elaboración de este proyecto se hace un estudio del estado del arte actual en áreas relacionadas con el procesado de imagen y aprendizaje automático. De esta forma se escoge Python como lenguaje de programación para el desarrollo del sistema y se investigan diversas bibliotecas y librerías como OpenCV, que implementa módulos y herramientas de procesado de imagen y visión por ordenador, así como Scikit-learn y PyTorch, los cuales implementan un gran número de funcionalidades que facilitan el desarrollo de sistemas de aprendizaje automático y Deep Learning. Los distintos experimentos realizados han sido aplicados sobre una base de datos conformada por imágenes de distintos recortes o tiles de muestras de suero sanguíneo secas de 117 pacientes facilitadas por el Hospital 12 de Octubre, y capturadas a través de un sistema de microscopía óptica y una cámara RGB. Estas muestras pertenecen a distintos pacientes los cuales han sido clasificados previamente en cuatro niveles de daño cerebral: control (sano), leve, moderado y grave.
El desarrollo de este PFG se conforma de cinco etapas. La primera etapa consiste en la captura de las imágenes de las muestras para la creación de la base de datos necesaria para realizar los experimentos. La segunda consiste en la creación de un algoritmo automatizado de extracción y representación de las características visuales pertinentes de las imágenes de la base de datos. Posteriormente, se realizan distintos experimentos con la información extraída con el objetivo de lograr una clasificación de las distintas muestras en los distintos niveles de grado de lesión, utilizando algoritmos de aprendizaje automático como K-Neighbors y máquinas de vectores soporte (SVM). En la cuarta etapa se realiza el entrenamiento de una red neuronal convolucional (CNN) con el mismo objetivo que los experimentos anteriores para, finalmente, en la quinta etapa realizar una evaluación y comparación de los resultados obtenidos mediante los distintos métodos, con el fin de considerar cuál de ellos tiene una efectividad mayor para lograr el objetivo presentado en este proyecto.
Los resultados obtenidos son una tasa de aciertos del 52,8 % en el mejor entrenamiento realizado mediante SVM y un 75,0 % en el caso del entrenamiento de la CNN, ambos para los cuatro niveles de lesión de los pacientes. En el capítulo de descripción de la solución propuesta se detalla cómo se han conseguido estos resultados y, posteriormente en los apartados de resultados y conclusiones se presenta un análisis sobre las causas relacionadas con la obtención de estos valores, su relación con los datos extraídos y por qué puede no ser óptima la metodología que pretende entrenar modelos de aprendizaje automático con los vectores de características extraídos mediante el sistema de extracción de características visuales. A su vez, se presentan ciertas ventajas que ofrecen las redes neuronales convolucionales, las cuales están relacionadas con la obtención de una mayor tasa de aciertos. Por último, se analiza la importancia del tamaño de la base de datos de pacientes para obtener unos mejores rendimientos y generalización de los modelos de aprendizaje automático, así como la necesidad de repetir los experimentos planteados en este proyecto con un tamaño de la base de datos mayor.
Este PFG pretende influir un impacto positivo en términos sociales y sanitarios debido a la investigación realizada sobre el desarrollo de pruebas alternativas no invasivas. Por ello, se considera que está alineado con los Objetivos de Desarrollo Sostenible (ODS) definidos por la Asamblea General de las Naciones Unidas.
Abstract:
This PFG, entitled “Design of a blood serum sample analyser using image processing and deep learning in microscopy”, focuses on the study and development of alternative and non-invasive techniques for diagnosing the degree of traumatic brain injury through the analysis of dry blood serum samples. The aim of this project is to develop a system that, based on an image of a sample of this type, can evaluate the level of brain injury suffered by a patient, offering an alternative to current diagnostic tests such as Computerised Axial Tomography (CAT) or Magnetic Resonance Imaging (MRI), which have certain disadvantages such as exposure to ionising radiation, the high cost involved and their difficult access in some areas due to the lack of the necessary resources to carry them out. To this purpose, different digital image processing, computer vision and machine learning techniques are researched, developed and implemented, with the aim of characterising the visual properties of the samples that will ultimately enable the development of an efficient system for diagnosing brain damage.
For the development of this project, a study of the current state of the art in areas related to image processing and machine learning was carried out. Thus, Python was chosen as the programming language for the development of the system and different frameworks and libraries were used, such as OpenCV, which implements modules and tools for image processing and computer vision tasks, as well as Scikit-learn and PyTorch, which implement a large number of functionalities that facilitate the development of machine learning and deep learning systems. The various experiments conducted were applied to a database consisting of images of different tiles of dried blood serum samples from 117 patients provided by the Hospital 12 de Octubre, and captured through an optical microscopy system and an RGB camera. These samples belong to different patients who have been previously classified into four levels of brain damage: control (healthy), mild, moderate and severe.
The development of this project is divided into five stages. The first stage involves capturing the images of the samples for the creation of the database needed to carry out the experiments. The second stage focuses on the creation of an automated algorithm for the extraction and re-presentation of the relevant visual characteristics of the images in the database. Subsequently, different experiments are carried out with the extracted information with the aim of achieving a classification of the different samples in the different levels of injury, using machine learning algorithms such as K-Neighbors and support vector machines (SVM). In the fourth stage, a con-volutional neural network (CNN) is trained with the same objective as the previous experiments. Finally, in the fifth stage, an evaluation and comparison of the results obtained using the diffe-rent methods is carried out in order to consider which of them is most effective in achieving the objective presented in this project.
The results obtained are an accuracy of 52.8 % in the best training of the SVM model and 75.0 % in the case of the training of the CNN, both for the four levels of injury of the patients. The chapter describing the proposed solution details how these results have been achieved and, subsequently, in the sections results and conclusions, an analysis is presented on the causes related to these obtained values, their relationship with the extracted data and why the methodology that aims to train machine learning models with the feature vectors extracted using the visual feature extraction system may not be optimal. In addition, certain advantages offered by convolutional neural networks, related to obtaining a higher accuracy, are presented. Finally, the importance of the size of the patient database is analysez with regard to obtaining better performance and generalization of the machine learning models, as well as the need to repeat the experiments proposed in this project with a larger database size.
This PFG aims to influence a positive impact in social and health terms due to the research conducted on the development of non-invasive alternative tests. It is therefore considered to be aligned with the Sustainable Development Goals (SDGs) defined by the United Nations General Assembly.
Este PFG, con título “Diseño de un analizador de muestras de suero sanguíneo mediante procesado de imagen y aprendizaje profundo en microscopía”, se centra en el estudio y desarrollo de técnicas alternativas y no invasivas de diagnóstico del grado de traumatismo craneoencefálico a través del análisis de muestras de suero sanguíneo secas. El fin de este proyecto es desarrollar un sistema que, a partir de una imagen de una muestra de este tipo, permita evaluar el nivel de lesión cerebral que sufre un paciente, ofreciendo una alternativa a las pruebas de diagnóstico actuales como la Tomografía Axial Computerizada (TAC) o Resonancia Magnética (RM) las cuales presentan algunas desventajas como la exposición a radiación ionizante, el elevado coste que suponen y su difícil acceso en algunas zonas debido a la falta de los recursos necesarios para su realización. Para ello se investigan, desarrollan e implementan distintas técnicas de tratamiento digital de la imagen, visión por ordenador y aprendizaje automático, con el objetivo de caracterizar las propiedades visuales de las muestras que permitan en última instancia el desarrollo de un sistema eficiente de diagnóstico del daño cerebral.
Para la elaboración de este proyecto se hace un estudio del estado del arte actual en áreas relacionadas con el procesado de imagen y aprendizaje automático. De esta forma se escoge Python como lenguaje de programación para el desarrollo del sistema y se investigan diversas bibliotecas y librerías como OpenCV, que implementa módulos y herramientas de procesado de imagen y visión por ordenador, así como Scikit-learn y PyTorch, los cuales implementan un gran número de funcionalidades que facilitan el desarrollo de sistemas de aprendizaje automático y Deep Learning. Los distintos experimentos realizados han sido aplicados sobre una base de datos conformada por imágenes de distintos recortes o tiles de muestras de suero sanguíneo secas de 117 pacientes facilitadas por el Hospital 12 de Octubre, y capturadas a través de un sistema de microscopía óptica y una cámara RGB. Estas muestras pertenecen a distintos pacientes los cuales han sido clasificados previamente en cuatro niveles de daño cerebral: control (sano), leve, moderado y grave.
El desarrollo de este PFG se conforma de cinco etapas. La primera etapa consiste en la captura de las imágenes de las muestras para la creación de la base de datos necesaria para realizar los experimentos. La segunda consiste en la creación de un algoritmo automatizado de extracción y representación de las características visuales pertinentes de las imágenes de la base de datos. Posteriormente, se realizan distintos experimentos con la información extraída con el objetivo de lograr una clasificación de las distintas muestras en los distintos niveles de grado de lesión, utilizando algoritmos de aprendizaje automático como K-Neighbors y máquinas de vectores soporte (SVM). En la cuarta etapa se realiza el entrenamiento de una red neuronal convolucional (CNN) con el mismo objetivo que los experimentos anteriores para, finalmente, en la quinta etapa realizar una evaluación y comparación de los resultados obtenidos mediante los distintos métodos, con el fin de considerar cuál de ellos tiene una efectividad mayor para lograr el objetivo presentado en este proyecto.
Los resultados obtenidos son una tasa de aciertos del 52,8 % en el mejor entrenamiento realizado mediante SVM y un 75,0 % en el caso del entrenamiento de la CNN, ambos para los cuatro niveles de lesión de los pacientes. En el capítulo de descripción de la solución propuesta se detalla cómo se han conseguido estos resultados y, posteriormente en los apartados de resultados y conclusiones se presenta un análisis sobre las causas relacionadas con la obtención de estos valores, su relación con los datos extraídos y por qué puede no ser óptima la metodología que pretende entrenar modelos de aprendizaje automático con los vectores de características extraídos mediante el sistema de extracción de características visuales. A su vez, se presentan ciertas ventajas que ofrecen las redes neuronales convolucionales, las cuales están relacionadas con la obtención de una mayor tasa de aciertos. Por último, se analiza la importancia del tamaño de la base de datos de pacientes para obtener unos mejores rendimientos y generalización de los modelos de aprendizaje automático, así como la necesidad de repetir los experimentos planteados en este proyecto con un tamaño de la base de datos mayor.
Este PFG pretende influir un impacto positivo en términos sociales y sanitarios debido a la investigación realizada sobre el desarrollo de pruebas alternativas no invasivas. Por ello, se considera que está alineado con los Objetivos de Desarrollo Sostenible (ODS) definidos por la Asamblea General de las Naciones Unidas.
Abstract:
This PFG, entitled “Design of a blood serum sample analyser using image processing and deep learning in microscopy”, focuses on the study and development of alternative and non-invasive techniques for diagnosing the degree of traumatic brain injury through the analysis of dry blood serum samples. The aim of this project is to develop a system that, based on an image of a sample of this type, can evaluate the level of brain injury suffered by a patient, offering an alternative to current diagnostic tests such as Computerised Axial Tomography (CAT) or Magnetic Resonance Imaging (MRI), which have certain disadvantages such as exposure to ionising radiation, the high cost involved and their difficult access in some areas due to the lack of the necessary resources to carry them out. To this purpose, different digital image processing, computer vision and machine learning techniques are researched, developed and implemented, with the aim of characterising the visual properties of the samples that will ultimately enable the development of an efficient system for diagnosing brain damage.
For the development of this project, a study of the current state of the art in areas related to image processing and machine learning was carried out. Thus, Python was chosen as the programming language for the development of the system and different frameworks and libraries were used, such as OpenCV, which implements modules and tools for image processing and computer vision tasks, as well as Scikit-learn and PyTorch, which implement a large number of functionalities that facilitate the development of machine learning and deep learning systems. The various experiments conducted were applied to a database consisting of images of different tiles of dried blood serum samples from 117 patients provided by the Hospital 12 de Octubre, and captured through an optical microscopy system and an RGB camera. These samples belong to different patients who have been previously classified into four levels of brain damage: control (healthy), mild, moderate and severe.
The development of this project is divided into five stages. The first stage involves capturing the images of the samples for the creation of the database needed to carry out the experiments. The second stage focuses on the creation of an automated algorithm for the extraction and re-presentation of the relevant visual characteristics of the images in the database. Subsequently, different experiments are carried out with the extracted information with the aim of achieving a classification of the different samples in the different levels of injury, using machine learning algorithms such as K-Neighbors and support vector machines (SVM). In the fourth stage, a con-volutional neural network (CNN) is trained with the same objective as the previous experiments. Finally, in the fifth stage, an evaluation and comparison of the results obtained using the diffe-rent methods is carried out in order to consider which of them is most effective in achieving the objective presented in this project.
The results obtained are an accuracy of 52.8 % in the best training of the SVM model and 75.0 % in the case of the training of the CNN, both for the four levels of injury of the patients. The chapter describing the proposed solution details how these results have been achieved and, subsequently, in the sections results and conclusions, an analysis is presented on the causes related to these obtained values, their relationship with the extracted data and why the methodology that aims to train machine learning models with the feature vectors extracted using the visual feature extraction system may not be optimal. In addition, certain advantages offered by convolutional neural networks, related to obtaining a higher accuracy, are presented. Finally, the importance of the size of the patient database is analysez with regard to obtaining better performance and generalization of the machine learning models, as well as the need to repeat the experiments proposed in this project with a larger database size.
This PFG aims to influence a positive impact in social and health terms due to the research conducted on the development of non-invasive alternative tests. It is therefore considered to be aligned with the Sustainable Development Goals (SDGs) defined by the United Nations General Assembly. Read More


