En este artículo haremos una presentación de algunos conceptos básicos acerca de la Visualización de datos, o Data Visualization, y compartiremos también algunas reflexiones que sugieren criterios a la hora de adoptar una metodología de trabajo adecuada para nuestros fines.

La Visualización de datos o Data Visualization es una disciplina que se encuentra comprendida en el maravilloso mundo de la Data Science.

Primero lo primero, ¿qué es Data Science? Es un campo multidisciplinario enfocado en el estudio de los datos, lo que implica una síntesis de métodos y procesos orientados a extraer conocimientos de datos estructurados y no estructurados, con el objetivo de responder las preguntas que se le formulan, con datos y no opiniones. Por consiguiente, la tarea de un data scientist gira en torno a la exploración y el análisis de datos de fuentes múltiples para extraer conclusiones de valor, oportunas para dar soporte a la planificación y orientar la toma de decisiones de quien lo requiera.

Esta misión puede ser relativamente sencilla si tenemos la suerte de trabajar con un volumen manejable de datos, prolijamente estructurados (spoiler alert: casi nunca sucede). Pero, generalmente, implica gestionar grandes volúmenes de datos, por lo que surge así el momento más engorroso, ya que debemos extraer, limpiar, organizar y consolidar nuestro conjunto de datos en una estructura que facilite el trabajo posterior de análisis. Una vez logrado esto, podremos empezar a interiorizarnos en herramientas y técnicas de visualización de tales datos.

Entonces, ¿qué es la visualización de datos?

Dicho esto, podemos definir la visualización de datos, o data visualization, como la representación visual y gráfica de un conjunto de datos o información. Resaltamos la importancia de esta instancia del trabajo con datos, que implica decidir qué mostrar y  cómo hacerlo. Buscamos dar una respuesta a las necesidades del analista y agilizar su trabajo, y para eso es fundamental ofrecer una presentación gráfica que disponga la información organizada, de manera que sea accesible y en ocasiones factible de ser presentada frente a, por ejemplo, el resto de la organización, que puede no contar con el mismo nivel de conocimiento técnico acerca de lo que el informe trata.

Cómo puede ayudar Data Studio

Aquí aparece la herramienta gratuita Google Data Studio (comprendida dentro de Google Marketing Platform) que ofrece un abanico de funcionalidades muy interesantes (¡y prácticas!) para crear un tablero útil, efectivo, claro y atractivo. Solo necesitamos tener una cuenta de Google y podemos acceder a través del siguiente link: https://datastudio.google.com

En resumidas cuentas, lo que Data Studio nos permite es configurar fuentes de datos o data sources a partir de tres tipos de conectores: aquellos desarrollados por Google (que permiten subir un archivo .csv o conectarse con herramientas de Google, tales como Google Analytics, BigQuery, Google Ads, Google Sheets, entre otras), y otros desarrollados por Partners o bien por la comunidad open source de Data Studio; y, una vez configuradas, podemos construir un dashboard a partir de una interfaz de usuario agradable y con funcionalidades muy interesantes y accesibles.

4 consejos de metodología de trabajo

Lo básico para empezar está resuelto: contamos con una herramienta de acceso universal y gratuita y que se conecta con múltiples fuentes de datos. En este sentido, sugerimos adoptar ciertos lineamientos enmarcados en una metodología de trabajo para crear un tablero en Data Studio:

  • Tener bien en claro el objetivo. Es muy importante tener presente desde un comienzo quién es el usuario al que está destinado nuestro trabajo, cuál es su necesidad, y por otro lado tener en claro qué información tenemos que representar. Es una instancia que en ocasiones resulta conflictiva si no se define con certeza de antemano, ya que puede generar pérdidas de tiempo innecesarias. Considerémoslo como un principio universal: sea para una organización, una empresa, un cliente, o bien, para uno mismo.
  • Conectar los datos. Entendiendo que ya tenemos en claro nuestro objetivo, el segundo paso debería estar enfocado en los datos. Es fundamental la accesibilidad y calidad de la información que necesitamos. Para esto, Data Studio nos ofrece conectores con muchas herramientas, como mencionamos anteriormente, que facilitan esta tarea. Con relación a la calidad, vamos a suponer que los datos que utilizaremos para construir nuestro reporte son confiables, ya que se corresponde con instancias anteriores.
  • Modelizar y ordenar los datos. Este paso es quizás el que requiera de mayor rigor: está asociado a la modelización de las variables que nos interesan (que son dimensiones y métricas en Data Studio). Utilizaremos para esto, dimensiones que contienen valores en diversos formatos (texto, fecha, moneda, entre otros) y métricas (numéricas) asociadas a las dimensiones. Podemos utilizar las dimensiones tal como las importamos de nuestro data source (sea cual sea) o bien utilizar campos calculados a partir de relaciones matemáticas sencillas (sumas, divisiones, promedios, recuentos) o funciones un poco más complejas que nos ofrece Data Studio.
  • Tener en cuenta el dashboard y su diseño. Ahora debemos poner el foco en el dashboard (o tablero) propiamente dicho. Aquí influyen algunos criterios estéticos y nociones de disposición de la información. Algunos ejemplos son el tamaño del lienzo (ajustado a la pantalla del usuario), la cantidad de páginas (guarda relación con el principio de no sobrecargar de información una página), las interacciones posibles (pueden ser filtros o un selector de fechas -muy útil para datos dinámicos), o una agradable paleta de colores que resulte acorde a nuestro objetivo. Todas estas consideraciones hacen a un buen dashboard (¡y agradable para la vista!). Para esto podemos servirnos también de algunas herramientas externas entre otras cosas (como Flaticon para encontrar íconos, o Adobe Color para encontrar nuestra paleta de colores), y también de los gráficos que Data Studio ofrece para la representación de datos numéricos.

El mundo de los datos es inmenso y sus límites, infinitos. De todas formas, siempre se empieza por algo más pequeño, y en ese sentido, este artículo pretende ser un aporte introductorio a algunos conceptos preliminares del mundo de los datos y la visualización, y también contribuir con algunas prácticas sugeridas a la hora de pensar nuestro trabajo.

 

Juan Villanueva
Analytics Consultant