Ir al contenido principal

Introducción a la visualización de datos de investigación

Esta guía te introducirá en los conceptos relevantes sobre cómo visualizar los datos de investigación. Podrás encontrar una serie de recursos y herramientas útiles.

Comparaciones (ranking y magnitudes)

Se utilizan cuando se quieren comparar diferentes variables entre sí. Hay dos tipos de usos principales:

Por ejemplo:

  • Cuando queramos comparar el valor de una o más categorías entre ellas, sobre todo por la magnitud entre ellas; es decir, para mostrar comparaciones de tamaño.
  • O cuando se quieren comparar valores con el fin de establecer un ranking (cuando se quiere saber qué elemento de un conjunto de datos es el primero, cuál es el segundo y qué diferencia de valor hay entre los unos y los otros).

 

Te mostramos algunos de los más utilizados. Encontrarás información sobre su anatomía, cuándo usarlos, tips para su diseño y enlace a tutoriales con las herramientas más utilizadas. 

Tipos de gráficos para comparaciones

Gráfico de barras 

Un diagrama de barras o gráfico de columnas, es la representación de una variable discreta a través de columnas horizontales o barras. 

 

Anatomía del gráfico

 

Este gráfico está formado por dos ejes:

  • Uno cuantitativo, que muestra la escala de los valores que se representan.
  • Uno textual, que representa la categoría a la cual pertenecen los datos representados. En el eje textual se sitúan un conjunto de barras, cuya longitud codifica el valor de cada categoría.

Fuente: @Economipedia. URL: https://economipedia.com/definiciones/diagrama-de-barras.html`

 

¿Cuándo se debe utilizar?

 

  • Cuando se quiere comparar un conjunto de valores y establecer un ranking.
  • Como el ojo humano es muy bueno comparando distancias de elementos que están situados sobre un mismo eje, el gráfico de barras no solo descubre los valores más altos y los más bajos, sino que también ayuda a tener una intuición bastante acertada de la diferencia existente entre unos valores y otros.

 

#Tips

 

Se recomienda:

  • Ordenar las categorías de mayor a menor, o al revés. Eso facilita la comunicación del ranking de categorías.
  • Cuando se representan datos temporales (y las categorías son horas, días, meses, etc.) conviene ordenar el eje de forma temporal. En este caso, se recomienda la disposición vertical de las barras.
  • El eje cuantitativo debe empezar siempre en el cero, porque, de lo contrario, las diferencias de valores se magnifican y confunden al lector.

           Observa este ejemplo: 

           

Fuente: https://venngage.com/blog/misleading-graphs/

 

Si quieres aprender cómo hacer este tipo de gráfico...

Herramientas para generar este tipo de visualización:

Gráfico de barras apiladas

Este tipo de gráfico representa una extensión del gráfico de barras estándar. A diferencia de un gráfico de barras múltiples este muestra sus barras de lado a lado, en el segmento de las barras apiladas se muestran múltiples conjuntos de datos uno a continuación del otro.

Se utilizan para mostrar cómo una categoría más grande se divide en categorías menores y cuál es la relación que cada parte tiene en la cantidad total.

Existen dos grandes tipos:

  • Los gráficos de barras apiladas simples: cada valor se coloca para el segmento después del anterior. El valor total de la barra es el de todos los valores de los segmentos que se suman. Ideal para la comparación de las cantidades totales en cada grupo o barra segmentada.
  • 100% Pila gráficos de barras: se representan por el total establecido en el 100% y muestran el porcentaje de los elementos que componen cada grupo. Esto hace que sea más fácil ver las diferencias relativas entre las cantidades de cada grupo.

 

Anatomía del gráfico

 

stacked bar graph

Fuente: datavizcatalogue.com

¿Cuándo se debe utilizar?

 

  • Comparar el valor total de la suma de los segmentos que forman cada una de las barras. Al mismo tiempo, ofrece información sobre cómo son de grandes estos segmentos.
  • Un defecto importante de los gráficos de barras apiladas es que los gráficos se vuelven más difíciles de leer cuánto mayor es la cantidad de segmentos que tiene cada barra. También la comparación de cada segmento entre sí puede ser difícil, ya que no están alineados en una base común.

 

#Tips

 

Se recomienda:

  • Si se quiere comparar la composición de las barras entre si, este gráfico no es una buena opción ya que, como se puede apreciar en la siguiente imagen, es difícil comparar el número por subcategorías.

En este caso, se recomienda descomponer el gráfico en diferentes gráficos de barras, como se puede ver en el siguiente ejemplo.

              

 

 

 

Si quieres aprender cómo hacer este tipo de gráfico...

Herramientas y procedimientos para crear la visualización:

 

                                                 Gráfico de intensidad de colores (Heatmap)

Los gráficos de intensidad por colores (heatmap) son una evolución de las tablas. Los mapas de calor sirven para visualizar datos a través de las variaciones de color. En lugar de representar los valores utilizando números, estos se representan mediante la intensidad del color de la celda que ocupan.

 

 

Anatomía del gráfico

 

heatmap

Fuente: datavizcatalogue.com

¿Cuándo se debe utilizar?

 

  • Descubrir la variabilidad de un conjunto de variables.
  • Revelar patrones cuando muestra si diferentes variables se comportan igual e, incluso, puede ayudar a encontrar correlaciones entre ellas.
  • Mostrar los cambios en los datos en el tiempo, si una de las filas o columnas se establecen en intervalos de tiempo.

Un ejemplo de esto sería el uso de un mapa de calor para comparar los cambios de temperatura en todo el año, a través de múltiples ciudades, para ver dónde están los datos más calientes o más fríos en lugares para vivir. Así las filas podrían enumerar las ciudades para comparar, las columnas contendrían cada mes y las células albergarían los valores de temperatura.

 

#Tips 

 

  • Ordenar las filas y las columnas del gráfico de intensidades por colores según un criterio establecido puede ser muy interesante para facilitar el descubrimiento de elementos que tengan datos similares. Siguiendo el ejemplo anterior, habría que ordenar los países por número de infectados y los años, siguiendo un orden temporal.

  • Si el gráfico de intensidades por colores se utiliza para un conjunto de datos donde sus variables tienen escalas diferentes, es aconsejable normalizarlas, de modo que todas pasen a tener el mismo rango de valores.

 

Si quieres aprender cómo hacer este tipo de gráfico...

Herramientas y procedimientos para crear la visualización: 

Competencias digitales

Síguenos en:

Licencia Creative Commons
Biblioteca/CRAI de la Universidad Pablo de Olavide Licencia Creative Commons Atribución-NoComercial-CompartirIgual 4.0 Internacional.