¿Qué es la visualización de datos?

Y por qué ya no nos interesan los gráficos circulares,

La visualización de datos no es solo una mera traducción de puntos de datos en gráficos de barras y gráficos de líneas insignificantes. Es como una inmersión en un océano que esconde tesoros en cada nivel. Al principio, tenemos la delineación directa de datos en figuras de libros de texto a saber. diagramas de dispersión, gráficos de líneas, gráficos circulares y gráficos de barras. Los gráficos de líneas se usan generalmente para representar una tendencia de datos a lo largo del tiempo. En este tema de lo que es la visualización de datos, hemos aclarado todo el concepto con el gráfico y los gráficos circulares dados.

Gráficos circulares

Uno de los gráficos más ubicuos en uso es el gráfico de pizza o el gráfico circular.

Proporción de gases en una mezcla.

Fuente : plotly

Comúnmente utilizado durante las elecciones para mostrar qué partido tiene los leones para compartir los votos, este cuadro, aunque extremadamente popular, tiene algunas desventajas evidentes. Los estadísticos como Edward Tufte, Leland Wilkinson y Gerald van Belle han expresado su falta de inclinación hacia el uso de gráficos circulares. Stephen Few, el fundador de Perceptual Edge, probablemente proporcionó la evidencia más concluyente contra los gráficos circulares. En su artículo, "Save the Pie for the Dessert" publicado en el Visual Business Intelligence Newsletter, Stephen explica por qué, para sorpresa de sus colegas y estudiantes, siente que los gráficos circulares son un medio ineficaz de visualizar datos.

Eche un vistazo al gráfico circular a continuación.

En este gráfico que representa la proporción de alimentos pedidos después de las 9 p. M., Es fácil estimar el porcentaje que pertenece a Ice Cream: 25%. Sin embargo, después de una ligera modificación, ya no es posible determinar fácilmente el porcentaje de pedidos de helados.

Aunque el porcentaje de helados sigue siendo el mismo al 25%. Es difícil de entender del diagrama anterior. En el diagrama anterior, era fácil adivinar el porcentaje porque la sombra para el helado comenzó a las 6 en punto y se extendió hasta la posición de las 9 en punto. Como nuestros ojos están entrenados para ver los relojes a las 12, 3, 6 y 9, un gráfico circular también es más fácil de interpretar si sus regiones se adhieren a las 4 posiciones del reloj. Un entusiasta partidario de los gráficos circulares se presentaría y sugeriría que este problema podría evitarse fácilmente mediante el uso de etiquetas y marcando el porcentaje en cada región.

Gráfico circular con etiquetas de datos

Pero, de nuevo, para mapear el valor con el elemento, nuestros ojos tienen que seguir cambiando el foco de la leyenda en la parte inferior del gráfico a las etiquetas en el gráfico. La solución a eso sería adjuntar también el nombre del elemento, junto con los valores, para obtener algo similar a esto:

Perfecto, dirías. Pero luego le pregunto: ahora que hemos adjuntado los nombres de los elementos junto con los valores, ¿en qué se diferencia el gráfico circular de la tabla a continuación?

Tabla limpia con datos ordenados por porcentaje de orden

¿Esta información no se ve mucho mejor que las etiquetas y leyendas dispersas en el gráfico circular? ¿Para qué sirve un gráfico circular entonces? Se supone que las visualizaciones agregan valor, son agentes de conclusiones, se supone que hacen que los datos expongan sus secretos. Pero en este caso, el gráfico circular no cumple su promesa.

Ingrese el gráfico de barras de visualización de datos

La alternativa más delgada y mucho más elegante al gráfico circular es el gráfico de barras, que es capaz de expresar todo lo que dice el pastel y mucho más, sin hacer un lío de etiquetas y leyendas.

Gráfico de barras que representa lo mismo: fácil de comparar, contrastar y concluir

Esta es la misma información que ahora se presenta suavemente al observador. Además de mostrar los valores individuales, este gráfico nos permite comparar rápidamente la popularidad de cada alimento e incluso comparar la diferencia relativa de valor entre los artículos consecutivos. La misma información habría estado disponible a través de la tabla, pero nuestros cerebros son mejores para procesar imágenes que descifrar el texto. Es por eso que el uso del gráfico circular se ha reducido con el tiempo. Aunque es un visual favorito en la industria de los medios, este ha sido reemplazado por representaciones mejores y más sofisticadas. Además de los gráficos de líneas, pasteles y gráficos de barras, hay una gran cantidad de otros gráficos que son útiles. Un gráfico interesante, pero no tan popular para los no iniciados es el Diagrama de Sankey. Este diagrama se usa para expresar la distribución y el flujo de la materia. El asunto en cuestión podría ser energía, dinero o incluso agua.

Diagrama de Sankey del flujo de energía y distribución de un empleado de TI típico.

Arriba hay un diagrama de Sankey ficticio que expresa cómo y dónde se distribuye la mayor parte de la energía de un empleado de TI.

Herramientas más nuevas

Con la llegada de las redes sociales y las diferentes plataformas donde las personas pueden escribir sus sentimientos, opiniones y opiniones, una herramienta de visualización de datos que se ha vuelto bastante común es la nube de palabras. Las nubes de palabras nos ayudan a descubrir de qué están hablando las personas.

Una representación muy real y en vivo de la nube de palabras de las reseñas de los usuarios de PUBG en Google Play Store

Si miramos la nube de palabras aquí que se ha creado a partir de las 80 reseñas principales del juego PUBG en la tienda de Google Play, vemos que la respuesta general al juego es "buena", algunas personas incluso lo llaman el "mejor" . Sin embargo, parece que hay un problema con algunas "actualizaciones" que las personas están pidiendo a los creadores del juego que rectifiquen. De hecho, cuando revisamos las reseñas de Play Store ese día, vemos reflejado lo mismo.

El problema con las actualizaciones. Además, vea si puede encontrar una aparición de la palabra "por favor" aquí

El futuro

Esto solo está rascando la punta del iceberg. Las bibliotecas como plotly y D3 han llevado la visualización de datos a un nivel diferente. Esto ha sucedido debido a que la demanda también ha cambiado. ¿Cómo visualizarías una ciudad inteligente en un tablero? Una pantalla gigante en la que se pueden mostrar los signos vitales de una ciudad entera. El tráfico, el uso de energía, las condiciones de salud de diferentes áreas, la calidad del aire y una gran cantidad de otros parámetros deben mostrarse en una sola página. Este requisito exige un enfoque diferente para la visualización de datos. Por lo tanto, hemos aprendido que lo que es la visualización de datos con la ayuda de este concepto. Ya no podemos seguir con cuadros y gráficos. Se requiere un enfoque novedoso donde los gráficos se unen con el arte y la imaginación, creando una experiencia visual enriquecedora. Esa discusión plantea un artículo completamente diferente. Hasta la próxima.

Artículos recomendados

Este artículo es una guía útil sobre qué es una visualización de datos. Aquí hemos discutido los conceptos básicos con tablas y gráficos para que pueda comprender fácilmente la visualización de datos. También puede consultar el siguiente artículo para obtener más información:

  1. Carrera en Oracle Database Administrator
  2. 7 diferencia más útil entre minería de datos vs minería web
  3. Preguntas de la entrevista de análisis de datos
  4. Ejemplos de análisis de Big Data

Categoría: