En el panorama actual de los sistemas de alarma inteligentes, los avances en dispositivos IoT han propiciado la integración de la inteligencia artificial para interpretar datos sensoriales en tiempo real. En este contexto, el análisis de audio emerge como una herramienta fundamental y complementaria a los sistemas visuales, permitiendo la detección temprana de sonidos asociados a intrusiones, incluso en condiciones donde otras modalidades sensoriales podrían ser ineficaces. Sin embargo, la implementación de estos sistemas en sensores frontera o dispositivos embebidos presenta desafíos considerables, tales como la variabilidad del entorno acústico, la presencia de ruido, la escasez de datos etiquetados y la necesidad de modelos eficientes, robustos y de bajo consumo que operen en tiempo real con recursos computacionales y energéticos limitados.
Como respuesta a estos retos, el trabajo se propone desarrollar y evaluar un sistema de clasificación de audio optimizado para la detección de intrusiones cumpliendo con las restricciones recién planteadas.
El estudio se ha enfocado en varios componentes clave: la investigación exhaustiva del estado del arte en clasificación de audio, con especial atención a las técnicas adaptadas a sistemas con recursos limitados, el diseño y la implementación de una metodología de evaluación para distintas arquitecturas de aprendizaje profundo, la aplicación de técnicas de optimización de modelos para su despliegue eficiente, y la integración y validación del sistema completo en un microcontrolador real.
En síntesis, este trabajo demuestra que el análisis de audio mediante modelos de deep learning optimizados, constituye una solución eficaz y viable para la detección de intrusiones en sensores frontera.
–ABSTRACT–
In the current landscape of smart alarm systems, advancements in IoT devices have fostered the integration of artificial intelligence for real-time sensory data interpretation. In this context, audio analysis emerges as a fundamental tool, complementary to visual systems, enabling the early detection of sounds associated with intrusions, even in conditions where other sensory modalities might be ineffective. However, implementing these systems in edge sensors or embedded devices presents considerable challenges, such as acoustic environment variability, noise presence, scarcity of labeled data, and the need for efficient, robust, and low-power models that operate in real-time with limited computational and energy resources.
In response to these challenges, this work proposes the development and evaluation of an audio classification system optimized for intrusion detection, adhering to the mentioned constraints.
The study has focused on several key components: exhaustive research into the state of the art in audio classification, with particular attention to techniques adapted for resource-constrained systems, the design and implementation of an evaluation methodology for various deep learning architectures, the application of model optimization techniques for efficient deployment, and the integration and validation of the complete system on a real microcontroller.
In summary, this work demonstrates that audio analysis using optimized deep learning models constitutes an effective and viable solution for intrusion detection in edge sensors.
En el panorama actual de los sistemas de alarma inteligentes, los avances en dispositivos IoT han propiciado la integración de la inteligencia artificial para interpretar datos sensoriales en tiempo real. En este contexto, el análisis de audio emerge como una herramienta fundamental y complementaria a los sistemas visuales, permitiendo la detección temprana de sonidos asociados a intrusiones, incluso en condiciones donde otras modalidades sensoriales podrían ser ineficaces. Sin embargo, la implementación de estos sistemas en sensores frontera o dispositivos embebidos presenta desafíos considerables, tales como la variabilidad del entorno acústico, la presencia de ruido, la escasez de datos etiquetados y la necesidad de modelos eficientes, robustos y de bajo consumo que operen en tiempo real con recursos computacionales y energéticos limitados.
Como respuesta a estos retos, el trabajo se propone desarrollar y evaluar un sistema de clasificación de audio optimizado para la detección de intrusiones cumpliendo con las restricciones recién planteadas.
El estudio se ha enfocado en varios componentes clave: la investigación exhaustiva del estado del arte en clasificación de audio, con especial atención a las técnicas adaptadas a sistemas con recursos limitados, el diseño y la implementación de una metodología de evaluación para distintas arquitecturas de aprendizaje profundo, la aplicación de técnicas de optimización de modelos para su despliegue eficiente, y la integración y validación del sistema completo en un microcontrolador real.
En síntesis, este trabajo demuestra que el análisis de audio mediante modelos de deep learning optimizados, constituye una solución eficaz y viable para la detección de intrusiones en sensores frontera.
–ABSTRACT–
In the current landscape of smart alarm systems, advancements in IoT devices have fostered the integration of artificial intelligence for real-time sensory data interpretation. In this context, audio analysis emerges as a fundamental tool, complementary to visual systems, enabling the early detection of sounds associated with intrusions, even in conditions where other sensory modalities might be ineffective. However, implementing these systems in edge sensors or embedded devices presents considerable challenges, such as acoustic environment variability, noise presence, scarcity of labeled data, and the need for efficient, robust, and low-power models that operate in real-time with limited computational and energy resources.
In response to these challenges, this work proposes the development and evaluation of an audio classification system optimized for intrusion detection, adhering to the mentioned constraints.
The study has focused on several key components: exhaustive research into the state of the art in audio classification, with particular attention to techniques adapted for resource-constrained systems, the design and implementation of an evaluation methodology for various deep learning architectures, the application of model optimization techniques for efficient deployment, and the integration and validation of the complete system on a real microcontroller.
In summary, this work demonstrates that audio analysis using optimized deep learning models constitutes an effective and viable solution for intrusion detection in edge sensors. Read More


