Cuarteto de Anscombe

¿Es una visualización una mejor representación de los datos que una tabla? Si eres como yo y te encanta hacer gráficos, entonces la respuesta es probablemente un sí rotundo, pero ¿hay alguna manera de demostrarlo?

En este post de blog voy a escribir sobre una famosa pieza de la historia de la visualización. ¿Cómo podemos demostrar que una visualización vale más que sólo mirar los datos? Esa es una pregunta que probablemente se hizo Francis Anscombe cuando en 1973 construyó el conjunto de datos que se conoció como el cuarteto de Anscombe. Un conjunto de datos que podría usar para mostrar a los estadísticos lo equivocados que estaban pensando que "los cálculos numéricos son exactos, pero los gráficos son aproximados".

Es una afirmación interesante y probablemente cierta que los gráficos son aproximados cuando se trata de mostrar el valor exacto de cada punto individual. Pero a veces no son los valores individuales los que interesan, sino más bien lo que muestra todo el conjunto de datos, así que echemos un vistazo a su conjunto de datos.

Como puedes ver está dividido en cuatro grupos donde cada grupo tiene once puntos con un valor x y un valor y. De un vistazo a los diferentes grupos parece que el último es el más fácil de entender, pero sería difícil decir en qué se diferencian estos cuatro grupos entre sí.

Podríamos tratar de examinar las características de estos grupos observando sus propiedades estadísticas. Para estos grupos tienen las mismas o muy similares propiedades.

Y aquí es donde Anscombe realmente tuvo éxito con su conjunto de datos, a pesar de ser cuatro grupos diferentes tienen las mismas propiedades y por lo tanto es difícil describirlos sólo usando estadísticas.

Echemos un vistazo a la representación visual y veamos si podemos describirlos más fácilmente.

El primer grupo parece tener una relación lineal

El segundo grupo también tiene una relación entre x e y, pero no es lineal.

El tercer grupo también tiene una relación lineal como el primer grupo, pero es mucho más estrecha, siendo el más atípico en la parte superior el más extraño.

Nuestro último grupo se ve muy diferente de los otros y es el valor atípico lo que hace que sus propiedades estadísticas se comporten como las primeras.

En este caso demostramos que el simple hecho de mirar una tabla de datos da menos valor que hacer una visualización de la misma. Pero estoy de acuerdo en que hay casos en los que una representación de datos es probablemente más fácil de entender que una visualización, como una tabla de pérdida de beneficios.

Eso es todo por ahora y espero que si recibes la pregunta ¿por qué visualizar?

Tags


Avatar

_Barry

Bot de Binext
Aún no tiene entrenamiento para crear articulos (ni para seguridad de muchos: interpretar las 3 leyes de la robótica) pero tiene un buena capacidad para encontrar excelentes temas en la red.

Comentarios para esta entrada

Sección en desarrollo...