Las organizaciones modernas enfrentan un volumen de datos masivo que requiere soluciones estratégicas en la nube. Este Trabajo Fin de Grado aborda la implementación de estrategias de gobernanza de datos en Google BigQuery, analizando la organización, seguridad, calidad y costes. El trabajo persigue cuatro objetivos: comprender la gobernanza en la plataforma, optimizar la gestión de cómputo, implementar controles de cumplimiento normativo (GDPR) y desarrollar un caso práctico.
La metodología sigue un enfoque de investigación aplicada en cuatro fases: análisis teórico comparativo, diseño de arquitectura, servicios de GCP, y fi nalmente, un caso práctico donde ver la interacción de las tecnologías propuestas.
El documento se estructura como una guía técnica integral que profundiza en los pilares de la gobernanza del dato, apoyándose en tecnologías clave del ecosistema Google Cloud. Se detallan arquitecturas que emplean Data Universal Catalog para el descubrimiento de activos, Data Lineage API para la trazabilidad y IAM para la implementación de políticas de seguridad granulares. Asimismo, se sistematizan los procesos utilizando Sensitive Data Protection (DLP) para la clasifi cación de información sensible y Dataplex para la monitorización de la calidad, proporcionando un marco de referencia reproducible y automatizable.
Se concluye que la gobernanza efectiva requiere integrar controles técnicos automatizados con procesos organizacionales, equilibrando control y agilidad. El estudio establece los fundamentos para una gobernanza moderna que actúa como habilitador de confi anza y valor, considerando aspectos éticos y sostenibles para una gestión responsable de los datos.
Abstract:
Modern organizations face massive data volumes requiring strategic cloud solutions. This Bachelor’s Thesis addresses the implementation of data governance strategies in Google BigQuery, analyzing organization, security, quality, and costs. The work pursues four objectives: understanding platform governance, optimizing compute management, implementing regulatory compliance controls (GDPR).
The methodology follows an applied research approach in four phases: comparative theoretical analysis, architectural design, GCP services, and fi nally, a practical use case where we can see the interaction of the different proposed technologies.
The document is structured as a comprehensive technical guide delving into the pillars of data governance, leveraging key technologies from the Google Cloud ecosystem. It details architectures employing Data Universal Catalog for asset discovery, Data Lineage API for traceability, and IAM for implementing granular security policies. Furthermore, it systematizes processes using Sensitive Data Protection (DLP) for sensitive information classifi cation and Dataplex for quality monitoring, providing a reproducible and automatable reference framework.
It is concluded that effective governance requires integrating automated technical controls with organizational processes, balancing control and agility. The study establishes foundations for modern governance that acts as an enabler of trust and value, considering ethical and sustainable aspects for responsible data management.
Las organizaciones modernas enfrentan un volumen de datos masivo que requiere soluciones estratégicas en la nube. Este Trabajo Fin de Grado aborda la implementación de estrategias de gobernanza de datos en Google BigQuery, analizando la organización, seguridad, calidad y costes. El trabajo persigue cuatro objetivos: comprender la gobernanza en la plataforma, optimizar la gestión de cómputo, implementar controles de cumplimiento normativo (GDPR) y desarrollar un caso práctico.
La metodología sigue un enfoque de investigación aplicada en cuatro fases: análisis teórico comparativo, diseño de arquitectura, servicios de GCP, y fi nalmente, un caso práctico donde ver la interacción de las tecnologías propuestas.
El documento se estructura como una guía técnica integral que profundiza en los pilares de la gobernanza del dato, apoyándose en tecnologías clave del ecosistema Google Cloud. Se detallan arquitecturas que emplean Data Universal Catalog para el descubrimiento de activos, Data Lineage API para la trazabilidad y IAM para la implementación de políticas de seguridad granulares. Asimismo, se sistematizan los procesos utilizando Sensitive Data Protection (DLP) para la clasifi cación de información sensible y Dataplex para la monitorización de la calidad, proporcionando un marco de referencia reproducible y automatizable.
Se concluye que la gobernanza efectiva requiere integrar controles técnicos automatizados con procesos organizacionales, equilibrando control y agilidad. El estudio establece los fundamentos para una gobernanza moderna que actúa como habilitador de confi anza y valor, considerando aspectos éticos y sostenibles para una gestión responsable de los datos.
Abstract:
Modern organizations face massive data volumes requiring strategic cloud solutions. This Bachelor’s Thesis addresses the implementation of data governance strategies in Google BigQuery, analyzing organization, security, quality, and costs. The work pursues four objectives: understanding platform governance, optimizing compute management, implementing regulatory compliance controls (GDPR).
The methodology follows an applied research approach in four phases: comparative theoretical analysis, architectural design, GCP services, and fi nally, a practical use case where we can see the interaction of the different proposed technologies.
The document is structured as a comprehensive technical guide delving into the pillars of data governance, leveraging key technologies from the Google Cloud ecosystem. It details architectures employing Data Universal Catalog for asset discovery, Data Lineage API for traceability, and IAM for implementing granular security policies. Furthermore, it systematizes processes using Sensitive Data Protection (DLP) for sensitive information classifi cation and Dataplex for quality monitoring, providing a reproducible and automatable reference framework.
It is concluded that effective governance requires integrating automated technical controls with organizational processes, balancing control and agility. The study establishes foundations for modern governance that acts as an enabler of trust and value, considering ethical and sustainable aspects for responsible data management. Read More


