Diseño y Desarrollo de un Sistema de Respuesta a Ciberamenazas Basado en Large Language Models y Retrieval Augmented Generation

Bookmark (0)
Please login to bookmark Close

Hoy en día, la ciberseguridad se ha convertido en un pilar esencial para empresas y organizaciones, impulsada por el aumento constante de ciberataques y su creciente sofisticación. Uno de los principales retos consiste en detectar y responder de forma ágil a estas amenazas, tanto si provienen del exterior como si se manifiestan a través de comportamientos anómalos dentro de los propios sistemas corporativos.
Para examinar y reaccionar eficazmente ante estas amenazas, los sistemas de Gestión de Información y Eventos de Seguridad (SIEM) se han vuelto indispensables. Estos sistemas recopilan y vinculan registros (logs) de distintas fuentes, facilitando una respuesta rápida y eficaz ante posibles incidentes. No obstante, examinar todos estos logs puede ser una tarea que consume una gran cantidad de tiempo y recursos.
En este contexto, la inclusión de modelos de inteligencia artificial generativa, a través de un enfoque de Generación Mejorada por Recuperación de Información (RAG), mejora el proceso de evaluación y análisis. Esta metodología no solo facilita el estudio de los eventos registrados, sino que también potencia el análisis con información externa. De esta forma, se optimiza la exactitud de las sugerencias y se disminuye el tiempo necesario para reaccionar ante los incidentes. Al incluir información adicional que contextualiza los patrones de ataque, los Modelos de Lenguaje Avanzados (LLMs) pueden identificar con más precisión las vulnerabilidades y secuencias de acciones maliciosas, lo que simplifica la puesta en marcha de estrategias de mitigación rápidas y eficaces.
Este proyecto propone la creación de un sistema que utilice la inteligencia artificial generativa y el enfoque RAG para analizar los registros que provienen de un SIEM. Estos logs serán procesados por un modelo de lenguaje que identificará y clasificará las amenazas en función de su nivel de riesgo. A partir de este análisis, el sistema proporcionará al usuario sugerencias útiles y Cursos de Acción (COAs), para ayudar a mitigar las consecuencias de cada amenaza, acelerando la reacción y mejorando la eficiencia de los equipos de ciberseguridad.
El objetivo es validar la efectividad de este enfoque RAG en la detección de intrusiones y en la generación de recomendaciones precisas en un periodo de tiempo reducido. Para ello, se plantean dos escenarios de validación: el primero consistirá en un ataque simulado utilizando la herramienta CALDERA, que generará registros representativos de una amenaza real; el segundo se basará en el análisis de los logs derivados de una práctica de tipo Capture the Flag realizada en el marco de la asignatura SEGU. En ambos casos, se evaluará no solo la capacidad del sistema para identificar las amenazas, sino también la calidad y utilidad del informe generado, incluyendo la relevancia de las recomendaciones propuestas.

​Hoy en día, la ciberseguridad se ha convertido en un pilar esencial para empresas y organizaciones, impulsada por el aumento constante de ciberataques y su creciente sofisticación. Uno de los principales retos consiste en detectar y responder de forma ágil a estas amenazas, tanto si provienen del exterior como si se manifiestan a través de comportamientos anómalos dentro de los propios sistemas corporativos.
Para examinar y reaccionar eficazmente ante estas amenazas, los sistemas de Gestión de Información y Eventos de Seguridad (SIEM) se han vuelto indispensables. Estos sistemas recopilan y vinculan registros (logs) de distintas fuentes, facilitando una respuesta rápida y eficaz ante posibles incidentes. No obstante, examinar todos estos logs puede ser una tarea que consume una gran cantidad de tiempo y recursos.
En este contexto, la inclusión de modelos de inteligencia artificial generativa, a través de un enfoque de Generación Mejorada por Recuperación de Información (RAG), mejora el proceso de evaluación y análisis. Esta metodología no solo facilita el estudio de los eventos registrados, sino que también potencia el análisis con información externa. De esta forma, se optimiza la exactitud de las sugerencias y se disminuye el tiempo necesario para reaccionar ante los incidentes. Al incluir información adicional que contextualiza los patrones de ataque, los Modelos de Lenguaje Avanzados (LLMs) pueden identificar con más precisión las vulnerabilidades y secuencias de acciones maliciosas, lo que simplifica la puesta en marcha de estrategias de mitigación rápidas y eficaces.
Este proyecto propone la creación de un sistema que utilice la inteligencia artificial generativa y el enfoque RAG para analizar los registros que provienen de un SIEM. Estos logs serán procesados por un modelo de lenguaje que identificará y clasificará las amenazas en función de su nivel de riesgo. A partir de este análisis, el sistema proporcionará al usuario sugerencias útiles y Cursos de Acción (COAs), para ayudar a mitigar las consecuencias de cada amenaza, acelerando la reacción y mejorando la eficiencia de los equipos de ciberseguridad.
El objetivo es validar la efectividad de este enfoque RAG en la detección de intrusiones y en la generación de recomendaciones precisas en un periodo de tiempo reducido. Para ello, se plantean dos escenarios de validación: el primero consistirá en un ataque simulado utilizando la herramienta CALDERA, que generará registros representativos de una amenaza real; el segundo se basará en el análisis de los logs derivados de una práctica de tipo Capture the Flag realizada en el marco de la asignatura SEGU. En ambos casos, se evaluará no solo la capacidad del sistema para identificar las amenazas, sino también la calidad y utilidad del informe generado, incluyendo la relevancia de las recomendaciones propuestas. Read More