La interacción con datos geoespaciales oficiales en España se ve frecuentemente obstaculizada por motores de búsqueda rígidos e intolerantes a los errores del usuario. Este trabajo presenta un enfoque basado en agentes inteligentes para transformar esta interacción, abordando las limitaciones del buscador de CartoCiudad (CNIG). Se diseñaron y evaluaron cuatro arquitecturas de agentes de complejidad creciente (Base, Intención, Validación y Ensemble) utilizando LangChain/LangGraph, un modelo LLM cuantizado (Qwen3-30b) y una nueva librería (PyCiudad) que interactúa con la API existente. Contrario a la expectativa de que una mayor sofisticación resultaría en un mejor rendimiento, nuestra evaluación sobre un dataset sintético demuestra que la arquitectura más simple (Agente Base) ofrece el balance óptimo entre calidad y eficiencia. La conclusión principal es que las arquitecturas más avanzadas no justificaron su mayor coste en latencia y recursos, estableciendo al Agente Base como la solución óptima en el balance calidad-eficiencia y el punto de partida más sólido para trabajos futuros.
Abstract:
Interaction with official geospatial data in Spain is often hindered by rigid search engines that are intolerant to user errors. This work presents an intelligent agent-based approach to transform this interaction, addressing the limitations of the CartoCiudad (CNIG) search engine. Four agent architectures of increasing complexity (Base, Intent, Validation, and Ensemble) were designed and evaluated using LangChain/LangGraph, a quantized LLM (Qwen3-30b), and a new library (PyCiudad) that interfaces with the existing API. Contrary to the expectation that greater sophistication would result in better performance, our evaluation on a synthetic dataset demonstrates that the simplest architecture (the Base Agent) offers the optimal balance between quality and efficiency. The main conclusion is that the more advanced architectures did not justify their higher cost in terms of latency and resources, establishing the Base Agent as the optimal solution for the quality-efficiency trade-off and the most solid starting point for future work.
La interacción con datos geoespaciales oficiales en España se ve frecuentemente obstaculizada por motores de búsqueda rígidos e intolerantes a los errores del usuario. Este trabajo presenta un enfoque basado en agentes inteligentes para transformar esta interacción, abordando las limitaciones del buscador de CartoCiudad (CNIG). Se diseñaron y evaluaron cuatro arquitecturas de agentes de complejidad creciente (Base, Intención, Validación y Ensemble) utilizando LangChain/LangGraph, un modelo LLM cuantizado (Qwen3-30b) y una nueva librería (PyCiudad) que interactúa con la API existente. Contrario a la expectativa de que una mayor sofisticación resultaría en un mejor rendimiento, nuestra evaluación sobre un dataset sintético demuestra que la arquitectura más simple (Agente Base) ofrece el balance óptimo entre calidad y eficiencia. La conclusión principal es que las arquitecturas más avanzadas no justificaron su mayor coste en latencia y recursos, estableciendo al Agente Base como la solución óptima en el balance calidad-eficiencia y el punto de partida más sólido para trabajos futuros.
Abstract:
Interaction with official geospatial data in Spain is often hindered by rigid search engines that are intolerant to user errors. This work presents an intelligent agent-based approach to transform this interaction, addressing the limitations of the CartoCiudad (CNIG) search engine. Four agent architectures of increasing complexity (Base, Intent, Validation, and Ensemble) were designed and evaluated using LangChain/LangGraph, a quantized LLM (Qwen3-30b), and a new library (PyCiudad) that interfaces with the existing API. Contrary to the expectation that greater sophistication would result in better performance, our evaluation on a synthetic dataset demonstrates that the simplest architecture (the Base Agent) offers the optimal balance between quality and efficiency. The main conclusion is that the more advanced architectures did not justify their higher cost in terms of latency and resources, establishing the Base Agent as the optimal solution for the quality-efficiency trade-off and the most solid starting point for future work. Read More


