Este Proyecto de Fin de Grado (PFG) trata sobre el desarrollo de un chatbot conversacional pensado para ayudar a los estudiantes de la Escuela Técnica Superior de Ingeniería de Sistemas Informáticos (ETSISI) a resolver dudas habituales sobre la universidad, como temas de secretaría, becas, matrículas o localización de servicios. El objetivo principal del proyecto es facilitar el acceso a esa información, que ya está disponible en la web oficial, pero que muchas veces cuesta encontrar.
El funcionamiento del sistema se basa en dos partes. La primera consiste en preparar los documentos cargados, dividiéndolos en fragmentos y convirtiéndolos en un formato que el sistema pueda entender, conocido como embeddings. Con eso se construye una base de datos semántica, que permite hacer búsquedas por su significado, no solo por palabras clave.
La segunda parte se da cuando el usuario hace una pregunta. El sistema busca los fragmentos más relacionados con esa pregunta y los usa como base para que el modelo de lenguaje genere una respuesta clara y coherente. De esta forma, el chatbot no inventa información, sino que responde en base a lo que encuentra en los documentos.
Para probar si el sistema funciona correctamente, se han hecho distintos tipos de preguntas: algunas con respuesta directa, otras sin respuesta, y otras más ambiguas. Esto ha servido para comprobar cómo se comporta el chatbot en distintos casos. Los resultados han sido positivos y se han cumplido los objetivos planteados al inicio del proyecto.
Finalmente, se incorpora funcionalidad específica para los perfiles encargados de realizar pruebas y mantener el sistema operativo. Entre estas funcionalidades se incluye la generación automatizada de documentos que recopilan las respuestas ofrecidas por los distintos modelos de recuperación, con el fin de facilitar su análisis comparativo y la evaluación del rendimiento del sistema.
Abstract:
This Bachelor’s Thesis Project focuses on the development of a conversational chatbot designed to assist ETSISI students in resolving common questions related to the university, such as administrative procedures, scholarships, enrollment, or the location of services. The main objective of the project is to facilitate access to this information, which is already available on the official website but is often difficult to find.
The system operates in two main phases. The first involves processing the uploaded documents by dividing them into fragments and converting them into a machine-readable format known as embeddings. These are used to build a semantic database that allows for searches based on meaning, rather than simple keywords.
The second phase takes place when a user submits a question. The system searches for the most relevant fragments and uses them as context for the language model to generate a clear and coherent response. In this way, the chatbot does not invent information, but instead responds based on the content found in the documents.
To evaluate the system’s effectiveness, different types of questions have been tested: some with direct answers, others with no answer, and some intentionally ambiguous. This approach has helped assess how the chatbot behaves in various scenarios. The results have been positive, and the initial goals of the project have been successfully achieved.
Finally, specific functionalities have been included for those responsible for testing and maintaining the system. These features include the automated generation of documents compiling the responses given by different retrieval models, with the aim of facilitating comparative analysis and evaluating the system’s performance.
Este Proyecto de Fin de Grado (PFG) trata sobre el desarrollo de un chatbot conversacional pensado para ayudar a los estudiantes de la Escuela Técnica Superior de Ingeniería de Sistemas Informáticos (ETSISI) a resolver dudas habituales sobre la universidad, como temas de secretaría, becas, matrículas o localización de servicios. El objetivo principal del proyecto es facilitar el acceso a esa información, que ya está disponible en la web oficial, pero que muchas veces cuesta encontrar.
El funcionamiento del sistema se basa en dos partes. La primera consiste en preparar los documentos cargados, dividiéndolos en fragmentos y convirtiéndolos en un formato que el sistema pueda entender, conocido como embeddings. Con eso se construye una base de datos semántica, que permite hacer búsquedas por su significado, no solo por palabras clave.
La segunda parte se da cuando el usuario hace una pregunta. El sistema busca los fragmentos más relacionados con esa pregunta y los usa como base para que el modelo de lenguaje genere una respuesta clara y coherente. De esta forma, el chatbot no inventa información, sino que responde en base a lo que encuentra en los documentos.
Para probar si el sistema funciona correctamente, se han hecho distintos tipos de preguntas: algunas con respuesta directa, otras sin respuesta, y otras más ambiguas. Esto ha servido para comprobar cómo se comporta el chatbot en distintos casos. Los resultados han sido positivos y se han cumplido los objetivos planteados al inicio del proyecto.
Finalmente, se incorpora funcionalidad específica para los perfiles encargados de realizar pruebas y mantener el sistema operativo. Entre estas funcionalidades se incluye la generación automatizada de documentos que recopilan las respuestas ofrecidas por los distintos modelos de recuperación, con el fin de facilitar su análisis comparativo y la evaluación del rendimiento del sistema.
Abstract:
This Bachelor’s Thesis Project focuses on the development of a conversational chatbot designed to assist ETSISI students in resolving common questions related to the university, such as administrative procedures, scholarships, enrollment, or the location of services. The main objective of the project is to facilitate access to this information, which is already available on the official website but is often difficult to find.
The system operates in two main phases. The first involves processing the uploaded documents by dividing them into fragments and converting them into a machine-readable format known as embeddings. These are used to build a semantic database that allows for searches based on meaning, rather than simple keywords.
The second phase takes place when a user submits a question. The system searches for the most relevant fragments and uses them as context for the language model to generate a clear and coherent response. In this way, the chatbot does not invent information, but instead responds based on the content found in the documents.
To evaluate the system’s effectiveness, different types of questions have been tested: some with direct answers, others with no answer, and some intentionally ambiguous. This approach has helped assess how the chatbot behaves in various scenarios. The results have been positive, and the initial goals of the project have been successfully achieved.
Finally, specific functionalities have been included for those responsible for testing and maintaining the system. These features include the automated generation of documents compiling the responses given by different retrieval models, with the aim of facilitating comparative analysis and evaluating the system’s performance. Read More


