En los últimos años se ha producido un gran proceso de transformación digital y el dato se ha convertido en una de las palancas de esa transformación. Consecuencia de este boom del dato surgen nuevas iniciativas como el gobierno del dato. ¿A qué se debe esta expansión?, ¿por qué está tan de moda?, ¿conocemos realmente qué abarca este mundo del gobierno del dato?

Alberto Serrano, Data Business Development Lead en Paradigma Digital, nos cuenta qué es el gobierno del dato y a qué se debe recientemente la gran demanda de iniciativas del gobierno del dato.

  1. La primera pregunta es fundamental para centrar el tema, ¿qué entendemos por gobierno del dato?

El gobierno del dato es la disciplina central de la gestión de datos, entre cuyos objetivos buscamos conseguir el máximo valor de nuestros activos de datos, así como instrumentar una estrategia de datos alineada con nuestra estrategia corporativa.

Es decir, lograr que el dato nos apoye a todos los niveles posibles, desde en la toma de decisión a la búsqueda de nuevas soluciones y modelos de negocio alineados con nuestros objetivos a nivel corporativo. En definitiva, que el dato nos guíe tanto a nivel individual como a nivel de evolución de nuestra estrategia corporativa.

Y nos gusta hacer tanto hincapié en la estrategia porque, para nosotros, el Data Journey no sólo va de la mano de la estrategia, sino que empieza por ésta, garantizando así que todos los pasos en ese camino hacia ser una organización data-driven, desde la identificación de nuevos casos de uso o productos de datos, para diseminar el conocimiento a lo largo de la organización, automatizar procesos, mejorar la experiencia de nuestros clientes, etc., a la implantación de tecnología como habilitador, van alineados con las necesidades y objetivos de nuestra organización al máximo nivel.

Uno de los objetivos principales del gobierno del dato es lograr un entendimiento común del dato. De forma que cuando nos preguntemos por la interpretación de términos de negocio que nos pueden parecer tan sencillos como “¿qué es un cliente?”, compartamos una única visión.

Para unos un cliente puede ser una persona que ha tenido en algún momento una relación con nuestra organización, mientras que para otros puede ser un lead, o sólo una persona que en estos momentos tenga un contrato o producto activo.

De cara a lograr este entendimiento común es fundamental que, dentro de nuestro marco de gobierno del dato, establezcamos un modelo organizativo en el que tengamos a las personas que nos van a ayudar a definir y caracterizar el dato, y construyamos esa visión consensuada en un glosario de términos de negocio o business glossary.

El gobierno de datos también se encarga de catalogar, categorizar, caracterizar, definir la accesibilidad y facilitar así la búsqueda y autoservicio de nuestros activos de datos, ampliando nuestro conocimiento y visibilidad sobre los mismos.

De nuevo, este conocimiento es clave tanto para la toma de decisiones como para, dentro de esa perspectiva estratégica, acelerar la identificación de nuevos productos de datos e incluso el descubrimiento de nuevos modelos de negocio a partir del dato que antes no habíamos identificado.

Es fundamental contar con una definición consensuada de los distintos términos del negocio.
Es fundamental contar con una definición consensuada de los distintos términos del negocio.

Por otra parte, el gobierno de datos nos permite evitar los problemas clásicos de calidad de datos como, por ejemplo, la falta de calidad en campañas de marketing donde nos dirigimos al público objetivo equivocado o donde incluso generamos el mensaje equivocado a nuestros clientes, con impacto económico directo o indirecto al haber un riesgo a desacreditarnos en algunos casos.

También a cumplir con los cada vez más estrictos controles regulatorios sobre la privacidad de datos personales, cuyo no cumplimiento puede llevarnos a perder hasta el 4% de nuestro volumen de negocio, como ocurre en el caso del Reglamento General de Protección de Datos (RGPD), si no establecemos los mecanismos adecuados de seguridad, privacidad y control de acceso a nuestros datos personales.

Y no solo eso, el RGPD también nos requiere tener identificados todos los datos personales de una persona (o data subject). No hablamos únicamente de aquellos cedidos por la persona en particular, sino datos derivados de los mismos a través del procesamiento de datos, lo que incluye la aplicación de técnicas de analítica avanzada y aprendizaje automático (lo cual puede implicar una pérdida de ventaja competitiva, al vernos obligados eventualmente a ceder estos datos derivados, pero esto es otra historia…).

En este aspecto, una buena implementación del gobierno del dato puede sernos de gran ayuda:

1. La catalogación y el metadatado de datos nos permite tener nuestros datos identificados, asociados a términos de negocio y ampliamente caracterizados.

2. El linaje de datos nos permite identificar automáticamente cuál ha sido el ciclo de vida del dato y por qué procesos ha pasado durante este, desde su generación, adquisición, almacenamiento, procesamiento, explotación e incluso retroalimentación hacia nuestros sistemas operacionales.

3. Un modelo de seguridad nos permite definir quién tiene acceso a qué activos de datos.

4. Las políticas de privacidad de datos nos permiten gestionar la información catalogada y metadatada como sensible, en aspectos como el enmascaramiento de la información, políticas de retención, etc.

En las redes sociales, aunque nosotros seamos el producto, el gobierno del dato es fundamental para garantizar la privacidad y el cumplimiento regulatorio.
En las redes sociales, aunque nosotros seamos el producto, el gobierno del dato es fundamental para garantizar la privacidad y el cumplimiento regulatorio.

Desde una perspectiva tecnológica, el gobierno del dato nos ayuda a definir aspectos funcionales de nuestra arquitectura, especialmente relevantes dada la complejidad de las arquitecturas modernas Big Data.

En particular, es importante definir un ciclo de vida del dato gobernado que nos permita establecer por qué etapas se mueve el dato, qué tipología de procesos tenemos que aplicar en cada una de esas etapas o qué metadata utilizamos para poder entender y automatizar estos procesos.

Es importantísimo también saber qué procesos de calidad tenemos que instrumentar para que podamos tener datos confiables que ofrezcamos a todos los niveles organizativos, así como disponibilizar las herramientas de explotación y visualización para que el dato esté accesible, y a la vez instrumentar los mecanismos que permiten controlar quién puede acceder a dichos datos, tanto a nivel de consumo interno como de exposición de datos a terceros.

En este sentido, podemos considerar que una arquitectura de datos bien alineada con el gobierno de datos es en sí misma gobierno, al estar constituida por elementos bien estructurados y ordenados sobre la que se construyen nuestros productos de datos.

Adicionalmente, la creación de procesos guiados por metadatos en nuestra arquitectura, nos permitirán instrumentar la calidad, seguridad, privacidad, etc., de forma automatizada, guiada por los propios metadatos.

En definitiva, el gobierno de datos nos permite también eficientar nuestra gestión de datos.

  1. ¿A qué se debe la creciente demanda de iniciativas de gobierno del dato o creación de oficinas de datos en los últimos años?

A pesar de que la disciplina de gobierno del dato como tal surge hace años (quizás sobre el 2005, aunque esto es discutible) no es hasta mediados de la pasada década, como consecuencia de la explosión exponencial de datos, cuando surge una creciente demanda de oficinas de datos, y se consolida la figura del Chief Data Officer (un 12% de las grandes organizaciones tenían un CDO en 2012 frente a un 56% de 2017).

Nos estamos enfrentando desde hace unos años a gestionar zettabytes de datos. Hemos visto un crecimiento significativo de soluciones de gestión de datos como los Data Lakes, en los que estamos ingestando datos que a veces ni conocemos, ni hemos catalogado en origen y, en ocasiones, sabemos de dónde vienen pero no sabemos qué quiere decir cada una de esas tablas, atributos, o información semiestructurada.

Esa necesidad de gestionar esta explosión de datos es uno de los motivos que ha propiciado esta necesidad de retomar o acelerar iniciativas del gobierno del dato hasta el punto de incluso crear nuevas unidades organizativas como una oficina de datos.

En definitiva, nos ha costado pasar esa etapa de euforia tecnológica, casi síndrome de Diógenes, de ingestar datos en nuestras plataformas de Big Data, para recuperar los principios y buenas prácticas en la gestión de datos. Si queremos, por ejemplo, mejorar la experiencia de nuestros clientes, no nos vale con tener almacenadas todas sus interacciones en nuestros canales digitales en tiempo real. Necesitamos entender qué significa el dato, qué valor nos puede aportar y cuándo y cómo lo podemos activar para, siguiendo este ejemplo, poder mandar esa oferta hiper-personalizada al cliente adecuado, en el momento adecuado, por el canal adecuado.

Sin gobierno, encontrar un dato útil puede ser complicado.
Sin gobierno, encontrar un dato útil puede ser complicado.

Por otra parte, hemos visto también que en los últimos años ha habido una digitalización del negocio en muchos sectores, y como parte de estos procesos de transformación digital se ha identificado al dato como palanca clave de la transformación, en distintos aspectos:

1. Capitalizando nuestros activos de datos, como el conocimiento de nuestros clientes para poder mejorar la experiencia del cliente, datos sobre nuestros productos, proveedores, procesos, etc. y construyendo una visión 360 del negocio.

2. Identificación de nuevos modelos de negocio, productos y servicios, como parte de marcos de innovación alrededor del dato.

3. Creando una cultura del dato y democratizando el acceso al mismo, evangelizando sobre los distintos casos de uso, capacitando y dotando a la organización de herramientas de autoservicio que les permitan obtener insights y dar apoyo a la toma de decisión, y trasladando la estrategia corporativa a todos los niveles de la organización mediante el uso del dato.

4. Dotando a nuestros sistemas de Data Intelligence, tanto a procesos internos soportados por una solución de backoffice, como a los canales digitales con los que interactúan nuestros clientes u otros actores externos.

Es uniendo estos aspectos como logramos transformarnos en una organización data-driven, donde tanto las personas, como los procesos se apoyan en los datos, y la propia estrategia corporativa se retroalimenta de éstos.

Otra razón fundamental, consecuencia de este auge de oficinas de datos, es el cumplimento de nuevos requisitos regulatorios.

Dentro del perímetro del gobierno del dato queda la definición de modelos de seguridad y privacidad que nos permitan controlar el acceso al dato, tanto a distintos niveles de la organización como por parte de sistemas de información o de mecanismos de exposición de datos o de insights derivados de los mismos a terceros.

Para ello, el gobierno de datos nos permite utilizar soluciones y prácticas de seguridad, linaje, catalogación y metadatado para conocer en todo momento por qué etapas y procesos ha pasado el dato, desde que es generado en nuestros sistemas operacionales o en sistemas de información externos a nuestra organización hasta que es procesado, utilizado para su consumo, para dotar de inteligencia a nuestros procesos o para retroalimentar de nuevo a nuestros sistemas operacionales.

Todo esto implica entender muy bien qué quiere decir cada dato, dónde lo podemos utilizar exactamente y cómo podemos cuidar el acceso por parte de personas y por parte de procesos o de sistemas para que cumplan con la regulación existente.

También es importante recalcar que ahora mismo tenemos una mayor complejidad en nuestras arquitecturas de datos, mucho mayor de la que teníamos hace 10 años, donde ya existían mecanismos de gobierno.

No es suficiente con gobernar un conjunto de bases de datos, o nuestro Data Warehouse corporativo. Ni siquiera vale con nuestra plataforma Big Data. Es necesario extender las capacidades de gobierno clásicas a modelos de analítica avanzada, soluciones de visualización de datos, arquitecturas orientadas a eventos, APIs y otros sistemas de almacenamiento, procesamiento y explotación de datos.

Solo, por poner un ejemplo, una correcta definición semántica y caracterización del dato es fundamental para técnicas de inteligencia aumentada.

Por último, no hay que olvidar el efecto péndulo. Igual que a finales de los 90 pasamos de la explotación analítica departamental a las plataformas de BI corporativo, soluciones de visualización con capas semánticas, para lograr atisbar esa criatura mitológica llamada Single version of the truth y, de ahí, de vuelta a las necesidades de agilidad en la explotación de datos, herramientas de visualización ágiles, infraestructuras analíticas departamentales que casi llegan a constituir un shadow IT.

Ahora, volvemos a buscar esa transversalidad y ese control. Sin duda, el secreto está en un punto intermedio y en lograr combinar un gobierno efectivo con dotar al negocio de la agilidad en la explotación de datos que los tiempos demandan, servirnos de las capacidades tecnológicas para acelerar el prototipado de proyectos de datos y luego poder llevarlos a una arquitectura gobernada, pero esto da para otra charla…

Conclusión

El mundo del gobierno del dato es un tema tan interesante (y amplio) que nos genera numerosas preguntas: ¿cuáles son los retos a los que se enfrenta?, ¿qué factores son claves para para crear una cultura del dato?, ¿qué modelos del gobierno del dato existen?

En próximos posts os responderemos a estas preguntas (y muchas más). Pero, si quieres profundizar aún más en el tema, escucha aquí la conversación con Alberto en el podcast de Paradigma, Apasionados por la tecnología.

Cuéntanos qué te parece.

Los comentarios serán moderados. Serán visibles si aportan un argumento constructivo. Si no estás de acuerdo con algún punto, por favor, muestra tus opiniones de manera educada.

Suscríbete

Estamos comprometidos.

Tecnología, personas e impacto positivo.