Data Visualization con Google Data Studio

Patricia Carmona
5 min readDec 30, 2020

--

Éste es el primer dashboard que diseñé con Google Data Studio para representar un análisis básico de la conversación de #BlackFriday y #CyberMonday del 22 de Noviembre al ade Diciembre de 2020.

Para este post, hice uso de la API de Twitter para descargar dos datasets de tweets: uno con la búsqueda del hashtag #BlackFriday y otro con el hashtag #CyberMonday.

El objetivo es visualizar la evolución del contenido generado por ambas promociones, conocer cuántos usuarios participan, cuáles son los tipos de tweets que se comparten y cuál es el engagemente generado. Para la descarga de contenido, lancé dos consultas a la API de Twitter y generé dos archivos en formato csv.

Data Exploration con pandas

Una vez descargado el contenido de una semana, aproximadamente, hice una exploración de los datos con pandas, para conocer:

  • Registros duplicados, por el uso de la API con restricciones de consulta
  • Campos en los que había registros nulos
  • El top 5 de tweets con más engagement, en base al número de retweets
  • El top 5 de usuarios con más impacto, según el número de seguidores

Por último, concatené ambos dataframes, ya que tienen las mismas columnas y generé un único archico csv.

💻 En este repositorio de GitHub puedes encontrar el código para la descarga de contenido de Twitter, los archivos csv y la exploración de datos.

Subida de datos a Google Cloud Platform

Para hacer la carga en Data Studio, decidí utilizar las herramientas de Google.

Para la visualización en Data Studio quería hacer uso de consultas en Google BigQuery, por lo que la subida de datos era aconsejable realizarla desde un bucket de Google Cloud Platform, debido al volumen de datos.

Consultas en Google BigQuery

Una vez subido el archivo csv a un bucket de Google Cloud Platform, conecté Google BigQuery a la fuente del bucket y lancé la primera consulta para comprobar que la carga se había desarrollado bien.

select *
from `BF.bfcm`

💡 El objetivo es utilizar Google BigQuery para el tratamiento de datos y los cálculos más avanzados. Aquí puedes ver el desarrollo de queries en SQL que hice para este dataset en Google BigQuery.

Carga de datos en Google Data Studio

Google Data Studio es una herramienta de representación gráfica. Es importante recalcar este concepto, ya que a diferencia de otras herramientas de Business Intelligence, Google Data Studio es una herramienta para visualizar. Google dispone de otras herramientas para el desarrollo de cálculos y análisis específicos, como Google BigQuery.

Desde Google Data Studio es muy fácil hacer la carga de datos, ya que una de las conexiones es con Google BigQuery, donde puedes seleccionar la tabla o vista a representar.

El desarrollo de estas herramientas descentralizadas hace que sean más rápidas y que estén focalizadas en una función que se potencia fácilmente.

Draft del Dashboard

Antes de comenzar a pintar un dashboard, es importante saber de qué datos dispones y qué tipo de visualización quieres dibujar. Dedicar un tiempo a pensar en la disposición, métricas y dimensiones y cómo representarlas, ahorra mucho tiempo y esfuerzo después.

💁🏻‍♀ ️Para comenzar, hice un dibujo a mano alzada del tipo de dashboard que quería dibujar.

Draft del dashboard

Este boceto ayuda a saber cómo representar los datos y en el caso de que el dashboard te lleve varios días de trabajo, saber la idea original que tienes en mente reproducir.

Campos calculados en Google Data Studio

Google Data Studio ofrece la opción de generar cálculos que no están dentro de la fuente de datos, llamados campos calculados. Pero como herramienta de visualización, es más fácil hacer el tratamiento, exploración de datos y cálculos más complejos en Google BigQuery.

Aquí te muestro cómo calculé el número de usuarios diferentes participando en la conversación, con un campo calculado en Google Data Studio, donde utilicé una función COUNT_DISTINCT().

Google Data Studio no permite realizar más que operaciones aritméticas, agrupaciones básicas (como un CASE WHEN), casting de fechas u operaciones básicas con strings. Aquí tienes el listado de todas las operaciones que se pueden desarrollar en Google Data Studio. Por ello, puesto que las posibilidades son limitadas, es conveniente desarrollar todos los cálculos en Google BigQuery.

Cálculos más avanzados

Para cálculos más avanzados como el Engagement Rate o el alcance potencial la recomendación es desarrollar estas consultas en Google BigQuery y guardar los resultados como vistas para importar después como fuente de datos a Google Data Studio.

💡 Aquí puedes encontrar el desarrollo de queries en Google BigQuery que implementé para este proyecto.

Diseñar un dashboard en Google Data Studio

La interfaz de Google Data Studio es una de las más amigables con las que he trabajado. A primera vista tienes el lienzo en blanco, en el que puedes implementar una plantilla o un diseño que ya tengas. También está la opción de confeccionar un dashboard ‘ad hoc’ para tu visualización.

Al añadir un gráfico se abre un panel a la derecha con las métricas y dimensiones procedentes de la fuente de datos seleccionada. También puedes personalizar cada gráfico, dando formato y estilo.

Interfaz de Google Data Studio

Tips para el diseño de un dashboard

Algunas recomendaciones que vienen bien para la visualización:

  • Si tienes diferentes datos, un resumen de KPI’s en la parte superior aporta información visual de forma rápida.
  • Evita visualizaciones y cálculos complejos, la clave está en representar de forma sencilla la información para que se entienda fácilmente.
  • Utiliza una paleta de colores similar para dar uniformidad al dashboard.

📈 Aquí puedes ver el dashboard básico que desarrollé para el análisis de la conversación sobre #BlackFriday y #CyberMonday.

Happy Coding!

--

--