Este trabajo consiste en una revisión de tres softwares dedicados al análisis topológico de datos: Topology ToolKit, Kepler Mapper y Perseus. La finalidad del trabajo consiste en dar un contexto del análisis topológico de datos mencionando tres de los métodos aplicados en este campo: clustering basado en densidad, homología persistente y algorimo Mapper con la finalidad de facilitar el entendimiento de los resultados obtenidos en el posterior uso del software. El objetivo principal es mostrar los pasos de instalación, uso y comprensión de los resultados utilizando ejemplos existentes en la documentación oficial de los softwares mencionados, por lo que no se realizará un análisis de datos desde cero, pero permitirá contextualizar y facilitar el posterior uso de los mismos para cualquier usuario. A pesar de esto, se muestran gráficas de cada paso seguido para acompañar la parte técnica con la parte visual, explicando la interpretación de las mismas y facilitando así la lectura. Debido a que es un campo cuyas bases matemáticas son complejas, la intención ha sido permitir una lectura lo más sencilla posible en la descripción de los tres métodos que se explican, sin dejar de lado la importancia que tiene comprender los fundamentos. Se explican detalladamente diferentes estudios que se han llevado a cabo para demostrar con usos reales de los métodos y de esta manera ser capaces de ver la magnitud de este campo y las aplicaciones que tiene en el mundo real, permitiendo a cualquier lector comprender la importancia de este campo que aún está en una etapa muy joven de su desarrollo, sin embargo, ya nos permite ver el potencial real que tiene.
ABSTRACT
This work consists of a review of three software tools dedicated to topological data analysis: Topology ToolKit, Kepler Mapper, and Perseus. The purpose of this work is to provide a context for topological data analysis by mentioning three methods applied in this field: density-based clustering, persistent homology, and the mapper algorithm, with the aim of facilitating the understanding of the results obtained from the subsequent use of the software. The main objective is to demonstrate the steps for installation, usage, and comprehension of the results using examples from the official documentation of the mentioned software. While no data analysis will be performed from scratch, this review will contextualize and facilitate the subsequent use of these tools for any user. Despite this, graphs of each step followed are presented to accompany the technical part with the visual part, explaining their interpretation and thus facilitating reading. Given that this field has complex mathematical foundations, the intention has been to allow for the simplest possible reading in the description of the three explained methods, without neglecting the importance of understanding the fundamentals. Different studies that have been carried out using these methods are explained in detail to demonstrate their real-world applications. In this way, it is possible to appreciate the magnitude of this field and its applications in the real world, allowing any reader to understand the importance of a field that is still in a very early stage of development but already shows its real potential.
Este trabajo consiste en una revisión de tres softwares dedicados al análisis topológico de datos: Topology ToolKit, Kepler Mapper y Perseus. La finalidad del trabajo consiste en dar un contexto del análisis topológico de datos mencionando tres de los métodos aplicados en este campo: clustering basado en densidad, homología persistente y algorimo Mapper con la finalidad de facilitar el entendimiento de los resultados obtenidos en el posterior uso del software. El objetivo principal es mostrar los pasos de instalación, uso y comprensión de los resultados utilizando ejemplos existentes en la documentación oficial de los softwares mencionados, por lo que no se realizará un análisis de datos desde cero, pero permitirá contextualizar y facilitar el posterior uso de los mismos para cualquier usuario. A pesar de esto, se muestran gráficas de cada paso seguido para acompañar la parte técnica con la parte visual, explicando la interpretación de las mismas y facilitando así la lectura. Debido a que es un campo cuyas bases matemáticas son complejas, la intención ha sido permitir una lectura lo más sencilla posible en la descripción de los tres métodos que se explican, sin dejar de lado la importancia que tiene comprender los fundamentos. Se explican detalladamente diferentes estudios que se han llevado a cabo para demostrar con usos reales de los métodos y de esta manera ser capaces de ver la magnitud de este campo y las aplicaciones que tiene en el mundo real, permitiendo a cualquier lector comprender la importancia de este campo que aún está en una etapa muy joven de su desarrollo, sin embargo, ya nos permite ver el potencial real que tiene.
ABSTRACT
This work consists of a review of three software tools dedicated to topological data analysis: Topology ToolKit, Kepler Mapper, and Perseus. The purpose of this work is to provide a context for topological data analysis by mentioning three methods applied in this field: density-based clustering, persistent homology, and the mapper algorithm, with the aim of facilitating the understanding of the results obtained from the subsequent use of the software. The main objective is to demonstrate the steps for installation, usage, and comprehension of the results using examples from the official documentation of the mentioned software. While no data analysis will be performed from scratch, this review will contextualize and facilitate the subsequent use of these tools for any user. Despite this, graphs of each step followed are presented to accompany the technical part with the visual part, explaining their interpretation and thus facilitating reading. Given that this field has complex mathematical foundations, the intention has been to allow for the simplest possible reading in the description of the three explained methods, without neglecting the importance of understanding the fundamentals. Different studies that have been carried out using these methods are explained in detail to demonstrate their real-world applications. In this way, it is possible to appreciate the magnitude of this field and its applications in the real world, allowing any reader to understand the importance of a field that is still in a very early stage of development but already shows its real potential. Read More


