Hace pocos días, Google volvió a demostrar que Data Studio (DS) es una de sus herramientas preferidas en términos de mejora, esta vez bajo la forma de una nueva featureBigQuery parameters in Data Studio. En esta nota vamos a explicar para qué sirve y haremos un paso a paso para usarla de la mejor forma en nuestros tableros.

Con esta nueva funcionalidad, los que habitualmente trabajamos con consultas personalizadas (custom querys) en BigQuery (BQ) (¡y los que no, también, ya que es súper sencillo!) vamos a poder realizar consultas parametrizadas como fuente de datos en DS. En otras palabras, podremos fijar a voluntad los valores de las variables que nos interesan. Así, tendremos acceso a la data alojada en Google Cloud de una forma más económica, ya que no necesitaremos correr toda la información del dataset que usemos cada vez que abramos nuestro tablero. Por otro lado, no correremos riesgos de inyección de SQL en nuestras querys, ya que los parámetros los seteamos por fuera del código que generamos.

Paso a paso

1) Para probar la herramienta, generamos una consulta a partir de la tabla users del dataset público llamado “stackoverflow”, cuyo esquema es el siguiente:

 

2) Si bien tenemos un montón de información sobre distintas características relacionadas con los usuarios de Stack Overflow, para nuestra consulta personalizada en DS nos va a interesar tener el nombre de cada uno (display.name) y su ubicación (location) en un período de fechas. En otras palabras, vamos a parametrizar el campo ‘creation_date’:

Empleando la cláusula “WHERE”, que es la función de SQL desde donde condicionamos la data que queremos obtener, vamos a parametrizar la consulta. Para ello, además, vamos a utilizar también la función PARSE, que transformará en formato date a la variable de fecha que seleccionamos, la que, por ser utilizada como parámetro, siempre es tomada por BQ como string.

De esta forma, le estamos diciendo a la query que no nos importa la información de todas las fechas del dataset, sino solamente las que seleccionemos. Aquí aparece un punto de suma importancia: el rango de días que nos interese evaluar en DS no lo vamos a seleccionar desde la query ni desde las opciones de agregación de parámetros, sino directamente desde DS. A simple vista, si sólo somos usuarios del tablero, podría parecer que no hay modificaciones respecto de los que hacíamos antes, lo que se debe a que la feature está operando en segundo planola nueva funcionalidad genera que las únicas fechas a evaluar sean aquellas que seleccionemos en el selector del tablero, por lo que DS no tiene la necesidad de ver toda la información de todas las filas de la tabla que usamos como fuente desde BQ. Esto, en otras palabras, es economizar y acelerar la velocidad de carga del dashboard.

3) Vamos a ver que, debajo del script, aparecen opciones: solamente debemos habilitar los parámetros de fecha. ¡Éxito! ¡Ya podemos crear gráficos en DS que tengan como fuente de datos nuestra custom query! De igual forma, debemos seleccionar un rango de fechas desde el selector o desde el rango personalizado de fechas de cada gráfico; caso contrario, DS nos devolverá “no data” invariablemente.

Entonces, ¿cuáles son los beneficios de esta nueva feature?

Esta nueva funcionalidad nos permite conectar la data obtenida vía BigQuery en Data Studio de una manera más económica, ya que el almacenamiento, las consultas, las cargas y exportaciones de datos de nuestra query parametrizada tendrán que dar cuenta sólo de la data de Cloud restringida por la parametrización. También vamos a tener un funcionamiento más ágil, ya que la información que tiene que procesar el tablero está acotada a los parámetros seleccionados (como es mejor que sobre a que falte, volvemos a aclarar que la selección la haremos desde el tablero directamente). Además de estas ventajas a la hora de abrir y trabajar con el tablero, tenemos también el adicional de que no es necesario reconstruir o modificar la query para seleccionar distintos períodos de tiempo, sino que cualquiera que acceda a DS va a poder modificar las fechas desde el selector y así ver la información que le sea de interés.

 

Lucas Terranova

Analytics Consultant