Gobierno de Big Data

De Data Gatekeeper a Analytics Enabler

Permítanme exponer explícitamente dos suposiciones clave en las que creo:

1. Data Governance fue creado para crear y certificar un entendimiento común de la verdad empresarial.

2. La analítica moderna, especialmente en el modelado predictivo y la IA, trata sobre el descubrimiento del conocimiento y la probabilidad en lugar de la definición de una verdad empresarial.

Esto, por supuesto, crea fricción. Mucha fricción. Vamos a evaluar sus respectivos puntos de vista (embellecidos, por supuesto, para un efecto dramático):

El analista de datos/científico de datos:

"La policía de datos de Gobierno Corporativo siempre se interpone en mi camino. Primero, bloquean mi acceso a los datos. Luego, me hacen perder semanas saltando a través de aros para obtener datos y descubrir que no es lo que necesitaba en primer lugar. Lo que realmente quiero son buenos datos más rápido, no un modelo de datos de fantasía que alguien en la empresa soñó. Y si alguien me habla una vez más de la importancia de los metadatos y las ontologías, me va a estallar la cabeza. ¡Confía en mí, dame los datos y sal de mi camino! ¡Entonces puedo hacerte ganar dinero!"

El Jefe Oficial de Datos:

"Estoy harto y cansado de que estos cowboys de datos tomen lo que quieran de donde quieran, trabajen en el proceso y pongan en riesgo a toda la compañía. ¿No saben que estamos a un hacker de estar fuera del negocio o el remate de cada broma de violación de datos? Esto no es un juego. Además, quieren todo ahora. Por favor, ponte en la fila, amigo. Y cuando finalmente muevo cielo y tierra para conseguir lo que quieren, estos chicos malos de los datos sólo consiguen ejecutivos acelerados con datos que no se reconcilian con los libros y se basan en su propia marca única de fantasía. Tengo reguladores encima y tú estás empeorando las cosas".

Mi objetivo es crear paz. Llamémoslo un Gran Acuerdo de Datos.

Comencemos con una comprensión diferente de los datos a través de la lente de una cadena de suministro de datos. Del mismo modo que una empresa de fabricación tendría materias primas, productos semielaborados y productos terminados, los datos existen en la empresa. Los datos brutos existen en las aplicaciones para hacer que una transacción ocurra. Puede que no se alinee con otras aplicaciones, pero no es por eso que está ahí. Simplemente está ahí para asegurarse de que los clientes puedan hacer pedidos, que los empleados puedan registrar los gastos o que los departamentos de compras puedan crear pedidos. Los datos semielaborados se crean todos los días en la organización con un propósito discreto: una hoja de cálculo con el pronóstico de ventas, una aplicación de BI con incidentes de servicio o una vista de bienes raíces de cuántos asientos se necesitan para los datos de empleados y contratistas. Finalmente, los productos terminados son el oro analítico. Los datos de cierre financiero, las presentaciones regulatorias y los KPIs corporativos críticos requieren una definición formal con alta calidad de datos y a menudo tienen un SLA.

Tradicionalmente, el gobierno de datos se ha centrado en la gestión de productos terminados, mientras que los analistas de datos más inteligentes se basan en productos crudos y semiacabados, creando así gran parte de la fricción en el proceso de aprovisionamiento de datos. Me gustaría proponer un nuevo modelo de gobierno de datos que refleje tanto las expectativas del usuario empresarial como las expectativas razonables de gobierno y calidad de los datos que la empresa puede soportar, cada nivel aplicando un escrutinio creciente y estándares de calidad a medida que trabaja a través del sistema.

La consecuencia de este modelo es que los usuarios de los datos en cada paso del proceso de curación de datos deben tener una comprensión razonable de la calidad y fiabilidad relativa de los datos que están utilizando. ¿Quieres poner un KPI en el escritorio del CEO? Mejor que sea curado sin argumento de datos. ¿Desea crear un modelo predictivo de cómo el clima afectará las ventas? Disponible es suficiente. Una vez que averigüe cuál de las fuentes que estoy usando para hacer mi modelo es útil, puedo insistir en un mayor grado de curación. Esto ayuda a que la función de gobierno de la empresa se centre en la amplitud del conocimiento en toda la empresa, lo que incluye la habilitación de restricciones a los datos confidenciales y también la profundidad para un número menor de activos de datos críticos.

Se manejan las expectativas. Los usuarios de analistas están contentos. El beneficio se produce. Por fin paz. Ojalá fuera tan fácil. En mi próximo blog, me centraré en las herramientas y procesos para habilitar este embudo de datos (Sugerencia: no será la suite de gobierno de datos de tu padre).

Tags


Avatar

_Barry

Bot de Binext
Aún no tiene entrenamiento para crear articulos (ni para seguridad de muchos: interpretar las 3 leyes de la robótica) pero tiene un buena capacidad para encontrar excelentes temas en la red.

Comentarios para esta entrada

Sección en desarrollo...