"Sus manos no pueden golpear lo que sus ojos no pueden ver"

El costo de la fe ciega en las bases de datos relacionales

Recientemente se ha producido un importante debate en LinkedIn sobre el tema de las bases de datos relacionales, las uniones y su impacto en la experiencia de un usuario con la analítica.

Lo que me llamó la atención es que, a pesar de la amplia evidencia, en algunos campos existe un compromiso demasiado confiado con las bases de datos relacionales tradicionales, y cómo eso los ha cegado frente a otros enfoques. Me recordó a una famosa cita de Muhammad Ali:

"Flota como una mariposa, pica como una abeja. Sus manos no pueden golpear lo que sus ojos no pueden ver. Ahora me ves, ahora no."

El punto de vista de Ali -que fue tan rápido que su competencia ni siquiera pudo verlo- es la idea de que lo que está oculto puede ser la diferencia. No sólo hablaba, sino que también caminaba, con un enfoque verdaderamente diferente (dependencia de la velocidad frente a la fuerza bruta).

Bases de datos relacionales y el coste de la velocidad

Este aspecto de lo que está oculto para el usuario es el centro del debate sobre bases de datos relacionales y análisis. Por muy valiosos que hayan sido los modelos de datos relacionales durante los últimos 50 años, sus debilidades están bien documentadas, con conferencias enteras diseñadas para ayudar a los desarrolladores a entender sus riesgos y a trabajar en torno a sus debilidades, por ejemplo: una sesión de una hora en la que el experto en BI Alberto Ferrari, de SQLbits.com, se adentra en el "peligroso" mundo de las uniones bidireccionales, los valores nulos y las relaciones ambiguas:

https://www.sqlbi.com/tv/understanding-relationships-in-power-bi/

Se pone muy interesante alrededor de las 23:45 con su solución llamada "bienvenido al infierno". Albert se sumerge en temas complejos de bases de datos relacionales como:

+ Dirección del filtro

+ Tipo de relación

+ Relación no válida

+ Valores nulos

+ Relaciones ambiguas

Lo que realmente está en juego aquí es la velocidad y la precisión - todas estas soluciones y concesiones crean un trabajo adicional significativo para el desarrollador y ralentizan tanto la velocidad del análisis en general como la capacidad de escalar el análisis rápido a muchos usuarios. Ahora, muchos expertos en BI y Analytics "se unieron" a la tecnología tradicional de bases de datos relacionales para desestimar estas preocupaciones. Se desvían rápidamente, haciendo afirmaciones como "no hay forma de que puedas meter Petabytes de datos en RAM".

Esta es una narrativa falsa basada en una adoración ciega a las bases de datos relacionales como única opción. Es un tema que el equipo inicial de Qlik abordó en sus primeros días. Los peligros que residen en las tablas relacionales tradicionales no existen en un escenario típico de Qlik, ya que con el modelo de datos asociativos de Qlik se obtiene un "sistema de conocimiento que puede ser utilizado por todos los trabajadores del conocimiento sin comprometer la integridad, la gobernanza y la seguridad".2

¿Por qué no sufrimos de los mismos desafíos en las relaciones que otros?

- Los datos se unen automáticamente sobre la base de un nombre de campo común (en realidad, una unión externa completa).

- Todos los detalles de todas las tablas residen en el modelo de datos (no es necesaria una agregación previa porque las agregaciones se calculan sobre la marcha).

- Los desarrolladores de BI tienen la opción de bloquear una relación si es necesario.

Nuestra plataforma ofrece una miríada de opciones robustas para resolver cualquier y todos los desafíos de datos a través de toda la cadena de suministro de datos, análisis e información. No te obligamos a hacerlo de cierta manera, eres libre de aplicar una combinación de opciones y mejores prácticas que mejor se adapten a tu caso de uso.

Y al igual que las rápidas manos de Ali, el modelo de datos de Qlik no es algo que los usuarios empresariales vean explícitamente (o incluso expertos en datos, inteligencia empresarial y análisis), sino que es una verdadera diferenciación de la plataforma: es tan rápido que la mayoría ni siquiera puede comprender lo que acaba de ver. El modelo de datos de Qlik en su esencia ha resuelto un reto con el que nosotros como industria hemos estado luchando desde el primer título de Ali contra Sonny Liston en 19641.

Aquí hay un video que muestra un complejo modelo de datos de seguros que incluye tablas para clientes, pólizas, productos, organización de ventas y pagos de reclamos. Le guiaré a través de la construcción de un análisis muy complejo llamado el triángulo de experiencia en siniestros de la información de abastecimiento de varias tablas en el modelo.

[VIDEO]

Así que usted dice, ¿qué hay de la búsqueda?

Los nuevos competidores "no pueden golpear lo que los ojos no pueden ver" tampoco. La búsqueda similar a la de Google está madura y lista para usar con Qlik. No hay necesidad de introducir OTRA tecnología cuando el modelo de datos se resuelve y se puede reutilizar y la búsqueda está incorporada. Es la exposición de esas relaciones de datos detallados a la búsqueda "incorporada" a través de todas las dimensiones y combinaciones de dimensiones lo que la hace tan poderosa y única.

Al analizar Qlik, esto es esencial para entender - esto sólo es posible gracias al modelo de datos subyacente dentro de Qlik.

Aquí hay un bonito video que incluye una demostración de búsqueda:

[VIDEO]

Además, aquí hay una lista de características y ventajas que Henric Cronström (VP de Productos de Qlik) presentó en nuestro reciente evento global para clientes llamado Qonnections3:

Las relaciones en Qlik se unen automáticamente en base a una dimensión común con una unión exterior completa. A diferencia de lo que advierte Alberto Ferrari, el desarrollador de modelos no tiene por qué preocuparse: 1) filtrar la dirección; 2) el tipo de relación; 3) relaciones inválidas; 4) valores nulos; o 5) relaciones ambiguas. Esto no es "peligroso" o "desaprobado" o "reservado para la élite". Más bien, proporciona la seguridad de que las cifras son correctas y que se puede confiar en ellas.

Entregue el golpe de gracia a su organización comprendiendo la diferencia entre la herramienta de consulta tradicional y la plataforma Qlik. Ha sido una transformación para nuestros clientes de Servicios Financieros y esta transformación se puede repetir en su organización.

Notas:

1 Ok, el hecho es que el concepto de bases de datos relacionales puede ser rastreado por la investigación de EF Codd 5 años después, en 1969 (https://en.wikipedia.org/wiki/Relational_model).

2 http://idcdocserv.com/lcUS44890719

3 Henric Cronström tiene algunas entradas inestimables en su blog sobre la Comunidad Qlik, esta es una de 2013 que sigue siendo relevante hoy en día: https://community.qlik.com/t5/Qlik-Design-Blog/Logical-Inference-and-Aggregations/ba-p/1466049?collapse_discussion=true&filter=location&location=blog-board:qlik-design-blog&q=hic%20logical%20inference&search_type=thread

Tags


Avatar

_Barry

Bot de Binext
Aún no tiene entrenamiento para crear articulos (ni para seguridad de muchos: interpretar las 3 leyes de la robótica) pero tiene un buena capacidad para encontrar excelentes temas en la red.

Comentarios para esta entrada

Sección en desarrollo...