En la era digital actual, la información ha consolidado su posición como un activo fundamental para las organizaciones de todos los sectores, impulsando la toma de decisiones empresariales y el desarrollo de tecnologías emergentes como la inteligencia artificial. La creciente dependencia de los datos subraya una necesidad crítica de sistemas eficientes para su organización, interpretación y consumo. Este panorama requiere la transformación de grandes volúmenes de datos en conocimiento estructurado y accesible, lo cual es esencial para la innovación y la optimización de procesos mediante la explotación de los datos inherentes contenidos en dichos documentos no estructurados.
Sin embargo, a pesar del gran volumen de información, gran parte del conocimiento valioso permanece implícito o disperso en documentos, a menudo en formatos no estructurados o semiestructurados. Esta naturaleza heterogénea y la falta de formalización dificultan su procesamiento automatizado y su integración efectiva. Las ontologías, definidas como una “especificación explícita de una conceptualización”, junto con los RDF y los grafos de conocimiento surgen como herramientas poderosas para abordar este desafío, ofreciendo un marco formal y estructurado para representar relaciones semánticas complejas, facilitando así la interpretación y el intercambio de información (es decir, permitiendo la interoperabilidad semántica entre las partes que intercambian datos). No obstante, la creación tradicional de ontologías es un proceso inherentemente manual y laborioso, que exige profundos conocimientos del dominio y de ingeniería del conocimiento, lo que constituye un obstáculo significativo para su escalabilidad y adopción generalizada.
En este contexto, la aparición de los Modelos de Lenguajes Grandes (LLM) presenta una oportunidad transformadora para superar estas limitaciones. Estos modelos, con su capacidad sin precedentes para comprender, generar y razonar sobre el lenguaje natural, ofrecen el potencial de automatizar la extracción de conocimiento y la construcción de ontologías a partir de fuentes textuales. Este Trabajo de Fin de Grado explora la viabilidad y la calidad de emplear LLMs para la generación automática de ontologías y grafos de conocimiento directamente a partir de documentos técnicos. Se investigan diferentes enfoques, que van desde la extracción directa hasta la generación guiada mediante esquemas formales, buscando determinar cómo se pueden aprovechar de la mejor manera las capacidades de los LLMs para transformar la información textual en representaciones de conocimiento estructuradas y utilizables.
En la era digital actual, la información ha consolidado su posición como un activo fundamental para las organizaciones de todos los sectores, impulsando la toma de decisiones empresariales y el desarrollo de tecnologías emergentes como la inteligencia artificial. La creciente dependencia de los datos subraya una necesidad crítica de sistemas eficientes para su organización, interpretación y consumo. Este panorama requiere la transformación de grandes volúmenes de datos en conocimiento estructurado y accesible, lo cual es esencial para la innovación y la optimización de procesos mediante la explotación de los datos inherentes contenidos en dichos documentos no estructurados.
Sin embargo, a pesar del gran volumen de información, gran parte del conocimiento valioso permanece implícito o disperso en documentos, a menudo en formatos no estructurados o semiestructurados. Esta naturaleza heterogénea y la falta de formalización dificultan su procesamiento automatizado y su integración efectiva. Las ontologías, definidas como una “especificación explícita de una conceptualización”, junto con los RDF y los grafos de conocimiento surgen como herramientas poderosas para abordar este desafío, ofreciendo un marco formal y estructurado para representar relaciones semánticas complejas, facilitando así la interpretación y el intercambio de información (es decir, permitiendo la interoperabilidad semántica entre las partes que intercambian datos). No obstante, la creación tradicional de ontologías es un proceso inherentemente manual y laborioso, que exige profundos conocimientos del dominio y de ingeniería del conocimiento, lo que constituye un obstáculo significativo para su escalabilidad y adopción generalizada.
En este contexto, la aparición de los Modelos de Lenguajes Grandes (LLM) presenta una oportunidad transformadora para superar estas limitaciones. Estos modelos, con su capacidad sin precedentes para comprender, generar y razonar sobre el lenguaje natural, ofrecen el potencial de automatizar la extracción de conocimiento y la construcción de ontologías a partir de fuentes textuales. Este Trabajo de Fin de Grado explora la viabilidad y la calidad de emplear LLMs para la generación automática de ontologías y grafos de conocimiento directamente a partir de documentos técnicos. Se investigan diferentes enfoques, que van desde la extracción directa hasta la generación guiada mediante esquemas formales, buscando determinar cómo se pueden aprovechar de la mejor manera las capacidades de los LLMs para transformar la información textual en representaciones de conocimiento estructuradas y utilizables. Read More


