martes, 5 de diciembre de 2023

Ejemplos de gráficas que hacen más mal que bien

Las gráficas son elaboraciones construidas para hacer directamente visible información cuantitativa. Cuando están bien hechas, las gráficas transmiten la información que contenían los números, pero prescindiendo de ellos. Existe toda una disciplina académica, la visualización, que permite conseguir este propósito por medio de metáforas visuales bien escogidas.

El problema llega cuando estas metáforas visuales no transmiten correctamente la información que se quiere transmitir. Un ejemplo de ello es la utilización de los famosos “gráficos de tarta” de manera errónea.

Los gráficos de tarta utilizan como metáfora su parecido con el de una tarta real en la que cada uno de sus trozos o porciones indica la cantidad de elemento que tiene una determinada categoría. Estos problemas tienen diversos problemas. Vamos a intentar desengranar algunos de ellos.

En el siguiente ejemplo, que pertenece a la serie de errores que publica Anabel Forte (@AnaBayes en Twitter) cada miércoles y a la que denomina por tanto #miERRcoles, podemos ver un gráfico de tarta tridimensional.

El principal problema de este tipo de gráficos es que cuando las porciones son muy cercanas en tamaño, no está para nada claro cuál de los trozos es mayor que el resto. Este es un problema que se agudiza cuando el gráfico de tarta está en 3D en vez de en 2D, donde es algo más fácil saber el tamaño de cada porción.

En este caso está claro que el trozo magenta es el mayor de todos y el verde parece el más pequeño, pero es imposible dilucidad cuál es el mayor entre el morado y el amarillo. Se muestra a continuación el gráfico completo la solución al misterio.

La necesidad de saber el dato en bruto para saber qué trozo de tarta es el mayor nos indica muy claramente que el gráfico escogido no es el correcto. El mensaje de que hay cuatro categorías que forman el total es claro, pero no se sabe las diferencias en tamaño entre todos los trozos. Todo esto sin contar que la suma de 17, 22, 24 y 36 no da 100, sino 99.

Otro de los problemas principales de los gráficos de tarta es que cuando hay muchas categorías con valores poco significativos es bastante lioso. Un ejemplo de este tipo lo podemos ver en el siguiente gráfico de Instagram con la proporción de vueltas lideradas por piloto en el mundial de Fórmula 1 de este año.


El gráfico indica claramente que hay un piloto que ha liderado tres cuartas de todas las vueltas del mundial y que hay otros dos pilotos que han liderado un porcentaje significativo de vueltas, del resto solo se intuye que el valor es muy pequeño o despreciable.

La leyenda parece indicarnos que el orden de mayor a menor es claro y que, aunque no tengamos más allá de tres datos numéricos, el resto de pilotos sigue ese orden también en cuanto a proporción de vueltas lideradas. La palabra “Other” al final de la leyenda nos indica que al menos hay otro piloto que ha liderado alguna vuelta, aunque no se sabe si ese dato está formado por un solo piloto o por varios. En total hay 9 pilotos representados en la leyenda, así que quedan al menos 11 por mostrar al haber 10 equipos de 2 pilotos cada uno en la competición (en este caso faltan 13 pilotos porque ha habido otros dos pilotos que han participado en el mundial en al menos una carrera de la temporada de F1).

La siguiente tabla que acompañaba a la gráfica nos esclarece algún dato, pero está claro que la idea de una gráfica es sustituir los datos que la acompañan y que esta no lo hace. En esta tabla podemos ver que la diferencia entre el primer piloto y el resto es abismal (como ya se veía en el gráfico), pero que la diferencia a partir del 6 piloto y del resto es completamente despreciable y podía haberse suprimido.

 

Por los colores de algunas filas de la tabla se entiende que el autor no ha querido hacerlo al estar por debajo pilotos de la talla de Lewis Hamilton o Fernando Alonso, pero para el gráfico esta información podría haberse suprimido.

Con el Excel he realizado un intento algo mejor para este gráfico, en el que a partir del sexto piloto he juntado todas las vueltas lideradas en un  resto y he añadido los porcentajes de todos los datos. El gráfico de tarta sigue teniendo demasiadas categorías, pero al menos tiene bastante más sentido que el gráfico anterior.


Por último, quería mostrar un tipo de gráfico en el que la metáfora de tarta pasa a convertirse en la metáfora de un balón de fútbol (es el objeto al que más se me parece). Este gráfico viene de Twitter y aún estoy bastante sorprendida con su aspecto.

 

Lo que se puede decir de este gráfico es que muestra la evolución de los tipos de energía eléctrica que se genera en España por tamaño. Se sobreentiende con la mención de la Agenda 2030 que los tipos correspondientes a la electricidad generada de manera renovable se corresponde con los colores verdes y la generada de manera no renovables por los colores naranjas. La evolución natural es que cada vez disminuya más el naranja y aumente más el verde (como ya ocurre entre los años 2007 y 2023).

Aparte de esto, no está muy claro el tamaño de cada uno de los tipos de energía y en algunos casos la letra es tan pequeña que es imposible ver a qué tipo de energía se refiere. Aunque el mensaje general está claro, la representación elegida para visualizarlo es tan rara que, para mí, se come el mensaje.

Con estos ejemplos he querido mostrar dos cosas: que los gráficos de tarta no suelen ser una buena opción y que si se quiere realizar un gráfico que se salga de los modelos típicos, hay que darle más de una vuelta antes de hacerlo de cualquier forma.

1 comentario:

  1. Yo diría sin miedo que es un gráfico muy malo ese último. Y las gráficas de tarta... lo mismo, realmente hay muy pocas situaciones en las que no haya mejores opciones

    ResponderEliminar

¿Qué medio de transporte es mejor en una ciudad grande como Madrid?

Un año más he sobrevivido a los contenidos de las asignaturas del Máster en Cultura Científica de la UPNA. He entregado todas las tareas (au...