Gracias al desarrollo que ha ido teniendo el empleo de los datos en estos últimos años, se han podido desarrollar diversos procesos que ayudan a la extracción, tratamiento y carga de los mismos. En este Trabajo de Fin de Grado me he centrado en el desarrollo de un proceso ETL que permita integrar datos abiertos proporcionados por la FAO (Organización de las Naciones Unidas para la Alimentación y Agricultura) en una base de datos PostgreSQL. Para ello, se ha empleado la herramienta Apache Hop, encargada de la extracción, transformación y carga de los mismos, automatizando la limpieza, formateo e integración de distintas fuentes en una estructura relacional. Una vez cargados los datos en la base de datos, se ha utilizado Power BI como herramienta de análisis y visualización. Gracias a las funcionalidades de las que dispone, ha sido posible representar gráficamente los indicadores clave de emisiones, absorciones y superficie forestal, permitiendo de esta forma un análisis más accesible, visual y orientado a la toma de decisiones. Durante todo el proyecto se ha trabajado con herramientas empleadas en entornos profesionales, abordando retos técnicos relacionados con la calidad del dato, la gestión de errores en procesos ETL y la visualización efectiva. El resultado es una solución integral que facilita el estudio de fenómenos medioambientales a partir de datos abiertos y actualizables.
Gracias al desarrollo que ha ido teniendo el empleo de los datos en estos últimos años, se han podido desarrollar diversos procesos que ayudan a la extracción, tratamiento y carga de los mismos. En este Trabajo de Fin de Grado me he centrado en el desarrollo de un proceso ETL que permita integrar datos abiertos proporcionados por la FAO (Organización de las Naciones Unidas para la Alimentación y Agricultura) en una base de datos PostgreSQL. Para ello, se ha empleado la herramienta Apache Hop, encargada de la extracción, transformación y carga de los mismos, automatizando la limpieza, formateo e integración de distintas fuentes en una estructura relacional. Una vez cargados los datos en la base de datos, se ha utilizado Power BI como herramienta de análisis y visualización. Gracias a las funcionalidades de las que dispone, ha sido posible representar gráficamente los indicadores clave de emisiones, absorciones y superficie forestal, permitiendo de esta forma un análisis más accesible, visual y orientado a la toma de decisiones. Durante todo el proyecto se ha trabajado con herramientas empleadas en entornos profesionales, abordando retos técnicos relacionados con la calidad del dato, la gestión de errores en procesos ETL y la visualización efectiva. El resultado es una solución integral que facilita el estudio de fenómenos medioambientales a partir de datos abiertos y actualizables. Read More


