Ir al contenido
  1. Cursos/
  2. Visualizaci贸n de Informaci贸n/

Buenas Pr谩cticas y Evaluaci贸n

·22 mins

En esta unidad discutiremos dos etapas del proceso de visualizaci贸n que no hemos mencionado hasta ahora: buenas pr谩cticas a la hora de dise帽ar, y evaluaci贸n del trabajo realizado. Primero veremos un listado de buenas pr谩cticas, ideas y gu铆as que suelen llevarnos por el camino correcto. Ahora bien, las buenas pr谩cticas se ejercen en el dise帽o y desarrollo de una visualizaci贸n. En resumen, las pr谩cticas que comentaremos son las siguientes:

  • Funci贸n antes que forma: no pongas la carreta por delante de los bueyes.
  • No todo necesita ser coloreado: un uso adecuado y acotado de colores puede resaltar un mensaje.
  • Un Buen Paradigma de Interacci贸n: la estructura vista general -> zoom y filtrado -> vista detallada es un punto de partida seguro para nuestros proyectos.
  • Es mejor Ver que Recordar.
  • Considera que toda historia se cuenta desde una Perspectiva: no existen los datos duros y tampoco la visualizaci贸n objetiva.
  • Distorsiones y Bases != 0: cuidado con visualizaciones que mienten (sea intencional o no).
  • No usar 3D sin tener una justificaci贸n.
  • No usar 2D sin tener una justificaci贸n.

脡stas pr谩cticas no son reglas que no se puedan romper, pero tenerlas en consideraci贸n nos permitir谩 dise帽ar mejores visualizaciones; podemos romperlas si nos preguntamos antes por qu茅 las estamos rompiendo, de modo que tengamos claro el beneficio de hacerlo. Recordemos que la efectividad de una visualizaci贸n depende no solamente de la codificaci贸n visual, sino tambi茅n del contexto de qui茅n realice la tarea.

Hay otra etapa importante que sucede despu茅s del dise帽o, del desarrollo, y de la puesta en marcha: la evaluaci贸n que nos permitir谩 saber si nuestro trabajo cumpli贸 con los objetivos planteados, es decir, si resolvi贸 las tareas para las que estaba dise帽ado. Es lo que veremos al final de esta unidad.

Funci贸n antes que Forma #

Hemos visto en el curso el proceso de dise帽o de una visualizaci贸n como datos -> tareas -> codificaci贸n visual. El viejo dicho “funci贸n antes de forma” se refiere a que antes de tener la forma (la codificaci贸n visual) debemos tener clara la funci贸n (la tarea). En un proyecto es mejor enfocarse en la funcionalidad que provee la soluci贸n a un problema, antes que pensar en c贸mo se va a resolver. Como dise帽aremos visualizaciones para otras personas, debemos tener claro lo que necesitan, no lo que quieren, como lo muestra este cl谩sico c贸mic utilizado en administraci贸n de proyectos:

Distintas visiones sobre lo que pide un cliente por diferentes roles en un proyecto. Lo que necesitaba el cliente es distinto incluso de la manera en que solicit贸 el proyecto. Fuente: Cartoons Mix.
Distintas visiones sobre lo que pide un cliente por diferentes roles en un proyecto. Lo que necesitaba el cliente es distinto incluso de la manera en que solicit贸 el proyecto. Fuente: Cartoons Mix.

La primera imagen representa lo que pide el cliente, un columpio muy complejo e inusable, la 煤ltima lo que realmente necesitaba, un columpio sencillo con una rueda. Un ejemplo real y familiar sucede cuando alguien pide a su unidad de Data Science un “dashboard” — eso es lo que quiere, pero no necesariamente lo que necesita. Esto implica que necesitamos comunicarnos constantemente con la contraparte que utilizar谩 la visualizaci贸n para lograr entender la tarea a realizar.

No todo necesita ser coloreado #

Pr谩cticamente siempre acudimos al color como un canal para expresar atributos. Sin embargo, no siempre es adecuado utilizar los colores con todas las marcas que dispongamos. Veamos el siguiente ejemplo de line_chart, donde cada l铆nea representa la evoluci贸n de tasa de fertilidad de un pa铆s:

Fuente: The functional art, Alberto Cairo.
Fuente: The functional art, Alberto Cairo.

Por mostrarlo todo terminando viendo nada. Una visualizaci贸n m谩s efectiva se enfoca en las marcas que son relevantes para la tarea que se desea resolver. Por ejemplo, si la tarea es comparar algunos pa铆ses espec铆ficos con el resto y mostrar la tendencia mundial, se pueden utilizar colores para destacar los pa铆ses relevantes, agregar una l铆nea que muestre el promedio mundial, y dejar en el fondo con un color gris el resto de los pa铆ses:

Fuente: The functional art, Alberto Cairo.
Fuente: The functional art, Alberto Cairo.

驴C贸mo lucir铆a esta idea con datos actuales? El siguiente gr谩fico muestra las defunciones en la Regi贸n Metropolitana de Chile en los 煤ltimos a帽os:

Defunciones diarias en la Regi贸n Metropolitana. Fuente: Alonso Silva, con datos de DEIS.
Defunciones diarias en la Regi贸n Metropolitana. Fuente: Alonso Silva, con datos de DEIS.

Este gr谩fico cuenta una historia terrible de manera efectiva. 驴C贸mo se ver铆a con cada a帽o utilizando un color distinto? Debido a la diferencia en la cifra de personas fallecidas, posiblemente podr铆amos realizar la tarea de cuantificar la diferencia y la evoluci贸n de 茅sta, aunque con distractores que nos har铆an menos eficientes.

Entonces, no solamente debemos elegir una paleta de colores que sea accesible y efectiva, tambi茅n debemos decidir cu谩nto colorear. Otra consideraci贸n que debemos tener es que en ocasiones (cada vez menos) nuestra visualizaci贸n ser谩 impresa en blanco y negro, y por tanto, nuestra elecci贸n de colores debiese ser compatible con ese escenario.

Un Buen Paradigma de Interacci贸n #

Quiz谩s una de las problem谩ticas que tenemos a la hora de enfrentar un proyecto es como estructurarlo. Si ya tenemos los datos y las tareas definidas, 驴c贸mo definimos la profundidad de la visualizaci贸n?驴Cu谩l es el orden de las visualizaciones, de las interacciones?

Existe un paradigma influyente en visualizaci贸n llamado Visual Information Seeking Mantra (“el mantra de la b煤squeda visual de informaci贸n”) propuesto por Ben Shneiderman. Consiste en la siguiente secuencia de acciones para sumergirse en los datos y operar con ellos:

Vista global primero -> filtrar y hacer zoom -> detalles a medida que se necesiten

(en ingl茅s: overview first, zoom and filter, then details-on-demand).

La vista general permite identificar patrones globales, comparar, resumir; procedemos a una vista donde los datos se visualizan con m谩s detalle, pero con un criterio que los ha filtrado. En un sistema interactivo, esto permite decidir d贸nde fijarse, qu茅 llama la atenci贸n, d贸nde puede ser necesario profundizar. En una infograf铆a, esto puede determinar qu茅 mostramos primero y c贸mo componemos en una p谩gina las siguientes visualizaciones. Finalmente, la vista detallada permite saber m谩s del 铆tem espec铆fico de los datos que nos interesa. Entre la vista general y la detallada puede haber varios niveles.

En general las visualizaciones que aplican este paradigma son complejas, con m煤ltiples capas de interactividad. Existe un tipo de t茅cnica llamada focus+context que ejemplifica parte de este paradigma interactivo, en la que una visualizaci贸n tiene al menos dos partes: una donde se muestra a grosso modo el dataset (context), y una donde se muestra con mucho detalle el contenido de la parte de inter茅s (focus). Estas t茅cnicas suelen ser interactivas no solamente en t茅rminos de hacer clic, sino en reaccionar a lo que hace la persona que utiliza el sistema. Un ejemplo es la visualizaci贸n Periphery Plots, donde el contexto lo da una l铆nea temporal (que puede tener visualizaciones auxiliares o no) y el detalle contiene series temporales para cada atributo del dataset, cuya extensi贸n se puede modificar a gusto tanto desde el contexto como desde cada una de las visualizaciones detalladas:

Periphery Plots.
Periphery Plots.

El paradigma plantea desaf铆os, particularmente cuando los datos son grandes: 驴c贸mo se define una visi贸n global? Una soluci贸n es mostrar distintas vistas locales, semi-agregadas. 驴C贸mo se traslada este paradigma a interfaces en dispositivos m贸viles, donde el espacio para una vista global es limitado?

Es mejor Ver que Recordar #

Cuando tenemos m煤ltiples datos que queremos comparar, tenemos alternativas como utilizar distintos gr谩ficos para cada dataset, hacer uso de la animaci贸n e interactividad, o desplegar un gr谩fico sobre el otro. Las dos primeras opciones suelen ser necesarias cuando los datos son complejos, en caso contrario, la tercera opci贸n puede ser factible.

Cuando utilizamos distintos gr谩ficos, si 茅stos est谩n cerca, es f谩cil comparar elementos desplazando nuestro foco de atenci贸n entre vistas paralelas. En cambio cuando utilizamos interactividad o animaci贸n, nos daremos cuenta que es dif铆cil comparar elementos si solamente veo uno y tengo que recordar el otro. Aunque una animaci贸n es buena para mostrar la transici贸n entre un dataset y otro, si hay demasiadas transiciones, cada una con varios cambios, es preferible utilizar small multiples, es decir, m煤ltiples visualizaciones peque帽as pero que comparten la codificaci贸n visual de modo que podamos comparar entre ellas. Una manera de hacerlo usar la memoria es destacar visualmente la diferencia relevante para el an谩lisis. Este ejemplo de Martin Krzywinski nos da una gu铆a visual de c贸mo hacerlo:

Hay que hacer expl铆citas las diferencias, no basta con mostrar los datos. Fuente: Martin Krzywinski.
Hay que hacer expl铆citas las diferencias, no basta con mostrar los datos. Fuente: Martin Krzywinski.

Tal como dice el gr谩fico, tenemos que ayudar a quien utiliza la visualizaci贸n a ver lo necesario en ella para llevar a cabo la tarea.

Considera que toda historia se cuenta desde una Perspectiva #

Se dice que los datos son duros y que son objetivos, pero esta visi贸n de los datos es simplista y err贸nea. Por un lado, los datos son capturados por un sistema dise帽ado con un prop贸sito espec铆fico, y por definici贸n no abarcan todo lo posible — son una visi贸n parcial del fen贸meno que estemos estudiando. Es m谩s, cuando hacemos visualizaci贸n, las elecciones que realizamos a la hora de elegir variables y atributos, de definir t铆tulos y nombres, de elegir colores y disposiciones en la pantalla, y otras, est谩n sujetas a nuestra propia ret贸rica. Lo que elegimos incluir en una visualizaci贸n es tan importante como lo que decidimos excluir de ella.

Nick Diakopoulos explica el siguiente caso publicado en el New York Times:

Heatmap de opiniones respecto al gasto p煤blico en los Estados Unidos. Fuente: New York Times.
Heatmap de opiniones respecto al gasto p煤blico en los Estados Unidos. Fuente: New York Times.

Esta visualizaci贸n de tipo heatmap permit铆a a las personas que leen el peri贸dico posicionar su opini贸n respecto al gasto p煤blico e los Estados Unidos entre dos ejes: reducir gasto o no hacerlo, incrementar impuestos o no hacerlo. Sin embargo, la opci贸n de incrementar gasto no est谩 disponible, as铆 como la de reducir impuestos. No es lo mismo decir no reducir gasto que incrementar gasto, y ciertamente la posici贸n en el eje y variar谩 en funci贸n de como sea etiquetado ese eje en el heatmap.

El sitio The Correspondent realiz贸 una exploraci贸n visual sobre c贸mo la codificaci贸n visual y otros elementos gr谩ficos en los mapas cambian la percepci贸n sobre la inmigraci贸n irregular en Europa. El primer mapa, que es el m谩s frecuente, utiliza colores rojos (culturalmente asociados al peligro), flechas (que pueden dar sensaci贸n de invasi贸n, pues es lo utilizado en mapas de guerra) y un t铆tulo que habla de “inmigrantes ilegales”:

Mapa sobre la inmigraci贸n irregular en Europa, versi贸n sesgada hacia una vista negativa del fen贸meno. Fuente: The Correspondent con datos de Frontex.
Mapa sobre la inmigraci贸n irregular en Europa, versi贸n sesgada hacia una vista negativa del fen贸meno. Fuente: The Correspondent con datos de Frontex.

Una versi贸n neutral de este mapa utiliza el t茅rmino “inmigraci贸n irregular” (que es correcto, puesto que las personas no son ilegales), elimina el uso de flechas, pues indica el lugar por el que llegan las personas a Europa, no la direcci贸n, y utiliza un color azul que no es asociado al peligro:

Mapa sobre la inmigraci贸n irregular en Europa, versi贸n neutral. Fuente: The Correspondent con datos de Frontex.
Mapa sobre la inmigraci贸n irregular en Europa, versi贸n neutral. Fuente: The Correspondent con datos de Frontex.

Ambos mapas muestran la misma informaci贸n pero son percibidos de manera distinta. Sin embargo, siguen omitiendo algo: no sabemos cu谩l es la proporci贸n de personas que migran en Europa. Los n煤meros nos parecen grandes, pero, 驴lo son realmente? El siguiente esquema muestra que la inmigraci贸n irregular es peque帽a en comparaci贸n al total de inmigraci贸n en el continente, de hecho, es mucho menor al total de personas que emigran desde Europa:

Migraci贸n irregular en Europa, versi贸n neutral. Fuente: The Correspondent con datos de Frontex y Eurostat.
Migraci贸n irregular en Europa, versi贸n neutral. Fuente: The Correspondent con datos de Frontex y Eurostat.

La exploraci贸n de The Correspondent tambi茅n considera alternativas a no utilizar un mapa. No siempre es necesario utilizar uno cuando hay informaci贸n geogr谩fica.

Por tanto, la ret贸rica detr谩s de una visualizaci贸n es importante, ya que influir谩 en como nuestra visualizaci贸n es comprendida (sea esto lo que se busca de manera consciente o no). Ahora bien, estos sesgos a la hora de mostrar los datos no siempre son evidentes para quienes dise帽an las visualizaciones. Desarrollar la capacidad de dar un paso al costado y ver nuestro trabajo de manera externa no es f谩cil, pero es necesario.

Distorsiones y Bases != 0 #

En el debate de las 煤ltimas elecciones presidenciales de Chile, el entonces candidato y actual presidente Sebasti谩n Pi帽era ense帽贸 el siguiente bar_chart de la victimizaci贸n del pa铆s en tres a帽os distintos:

Un gr谩fico que enga帽a al presentar una configuraci贸n visual que distorsiona nuestra percepci贸n. Fuente: CNN.
Un gr谩fico que enga帽a al presentar una configuraci贸n visual que distorsiona nuestra percepci贸n. Fuente: CNN.

El gr谩fico est谩 hecho de manera que distorsiona los datos. Por un lado, la base de las barras no comienza de 0. Como en un bar_chart utilizamos el canal de largo de cada barra para realizar comparaciones, necesitamos que el largo (altura) de 茅stas sea representativo de los datos que presentan. En este caso, una barra cuyo valor es de 22.8 pareciera ser menor a la mitad de otra cuyo valor es 27.3. Lo primero que vemos son las barras, no los n煤meros. Como comenta Alberto Cairo en su libro How Charts Lie, incluso cuando est谩n los n煤meros presentes tendemos a estimar err贸neamente los valores que vemos en este gr谩fico. Por otro lado, el gr谩fico no contiene todos los a帽os posibles, lo que permitir铆a ver la evoluci贸n de la victimizaci贸n cada a帽o. Un gr谩fico sin distorsiones ser铆a como el propuesto por Daniel Matamala:

Un gr谩fico de barras que no distorsiona nuestra percepci贸n al tener 0 como base. Fuente: CNN.
Un gr谩fico de barras que no distorsiona nuestra percepci贸n al tener 0 como base. Fuente: CNN.

Quiz谩s una mejora que se puede hacer en este 煤ltimo gr谩fico es utilizar el canal de color para expresar el per铆odo presidencial correspondiente.

Es por ello que un bar_chart debiese tener su base en 0. No hacerlo es distorsionar la percepci贸n, por tanto, enga帽ar.

La situaci贸n es diferente cuando hablamos de line_chart, donde no siempre es necesario tener la base del eje y en 0, puesto que la tarea no es comparar largos sino comparar posiciones y tendencias. El siguiente gr谩fico de positividad de ex谩menes PCR presentado por el ministro de salud Enrique Paris caus贸 pol茅mica:

Tasa de positividad de ex谩menes PCR de COVID-19 en Chile el 7 de Julio de 2020. Fuente: @juancriolivares.
Tasa de positividad de ex谩menes PCR de COVID-19 en Chile el 7 de Julio de 2020. Fuente: @juancriolivares.

Se critic贸 al ministro por no comenzar el gr谩fico con base en 0, sin embargo, no es necesario dada la tarea a resolver: medir la tendencia en el cambio de positividad. Ahora bien, eso no implica que el gr谩fico no distorsione los datos, puesto que si se mostrase toda la serie temporal de positividad de ex谩menes PCR, entonces se ver铆a que es cierto que la tendencia hab铆a bajado en los 煤ltimos d铆as, pero que su nivel segu铆a siendo excesivamente alto en comparaci贸n al inicio de la crisis sanitaria. El siguiente gr谩fico (que lamentablemente no incluye las fechas en el eje x) muestra la serie completa, ilustrando la distorsi贸n que presenta el gr谩fico original:

Tasa de positividad de COVID-19 en Chile el 7 de Julio de 2020. Fuente: @juancriolivares.
Tasa de positividad de COVID-19 en Chile el 7 de Julio de 2020. Fuente: @juancriolivares.

Por un lado, el gr谩fico muestra que se omiti贸 una parte sustancial de los datos, parte que influye en la interpretaci贸n de los resultados. Tambi茅n incluye una serie extra que indica que la positividad representada en el gr谩fico original es suavizada, puesto que representa el promedio m贸vil de esa variable.

Entonces, 驴cu谩l es la base adecuada para un line_chart? La respuesta est谩 en la tarea a resolver. Por ejemplo, si existe un umbral de positividad aceptable (dado el contexto), es importante incluir ese umbral en el gr谩fico y destacarlo. El tama帽o de nuestra visualizaci贸n tambi茅n influir谩, por ejemplo, una visualizaci贸n delgada y alta acentuar谩 las tendencias en un line_chart, mientras que una visualizaci贸n m谩s ancha que alta las puede suavizar. Encontrar el balance depender谩 del contexto en el que nos encontremos. 隆Esto implica que tambi茅n la elecci贸n del valor m谩ximo en el eje y puede alterar la percepci贸n!

Recomiendo leer el libro How Charts Lie de Alberto Cairo para ver muchos ejemplos de estas situaciones de distorsi贸n. La siguiente es una gu铆a de casos comunes de distorsi贸n extra铆da del libro:

Distorsiones comunes y sus soluciones. Fuente: How Charts Lie, Alberto Cairo.
Distorsiones comunes y sus soluciones. Fuente: How Charts Lie, Alberto Cairo.

La visualizaci贸n es poderosa. Us茅mosla bien — evitemos distorsiones y fomentemos un an谩lisis adecuado y riguroso de los datos para apoyar la toma de decisiones basada en evidencia.

No usar 3D sin tener una justificaci贸n #

Las visualizaciones en 3D pueden ser atractivas pero el peligro de cometer errores con ellas es alto debido a las siguientes caracter铆sticas:

  • La profundidad altera nuestra percepci贸n del plano cartesiano.
  • La oclusi贸n de los objetos oculta informaci贸n.
  • La distorsi贸n por la perspectiva provoca p茅rdida de informaci贸n.
  • El texto pierde legibilidad.

De acuerdo a los estudios de percepci贸n, la profundidad no es un buen canal para codificar informaci贸n. Aprendimos que la informaci贸n en un plano tiene una mejor codificaci贸n: se corresponde 1 a 1 en la variaci贸n de la informaci贸n, y contiene los canales m谩s eficientes a la hora de trabajar con datos de magnitud. Aunque creamos que por ver y vivir en 3D una visualizaci贸n ser铆a mejor, la verdad es que no vemos en 3D, sino que en 2.5D, porque solamente vemos las superficies proyectadas en nuestro campo de visi贸n:

Vemos en dos dimensiones y media, no tres. Fuente: Visualization Analysis & Design.
Vemos en dos dimensiones y media, no tres. Fuente: Visualization Analysis & Design.

En comparaci贸n, en profundidad debemos desplazarnos, en caso de ser una visualizaci贸n interactiva. El movimiento de la c谩mara (o del cuerpo) es lento e introduce cambios en la escena que podr铆an pasar desapercibidos. En un plano podemos mover los ojos r谩pidamente y as铆 adquirir informaci贸n, sin cambios de c谩mara que oculten informaci贸n.

El siguiente tema en el uso de 3D es la oclusi贸n: los objetos m谩s cercanos a la c谩mara pueden tapar a los que est谩n m谩s lejos. Este fen贸meno oculta informaci贸n, como se ve a continuaci贸n:

Distintas visualizaciones de redes en 3D con oclusi贸n entre nodos. Fuente: Visualization Analysis & Design.
Distintas visualizaciones de redes en 3D con oclusi贸n entre nodos. Fuente: Visualization Analysis & Design.

La oclusi贸n se puede disminuir utilizando t茅cnicas complejas de interacci贸n, sin embargo, el problema persiste porque solo estamos atacando el s铆ntoma, no la enfermedad: la oclusi贸n es inherente a esta codificaci贸n visual.

El uso de perspectiva en 3D tambi茅n provoca p茅rdidas de informaci贸n, ya que interfiere con los canales que utilizan el tama帽o para codificar atributos. En el siguiente ejemplo se visualizan documentos en un espacio 3D:

驴Cu谩les documentos son m谩s grandes que otros? La perspectiva impide responde esto. Fuente: Mukherjea et al, Visualizing the results of multimedia web search engines.
驴Cu谩les documentos son m谩s grandes que otros? La perspectiva impide responde esto. Fuente: Mukherjea et al, Visualizing the results of multimedia web search engines.

Los documentos que est谩n m谩s lejos pueden ser igual de importantes que los que est谩n m谩s cerca, sin embargo, al estar posicionados m谩s lejos de la c谩mara podemos ignorarlos o bien asumir que no son relevantes. Podemos ejemplificar 茅ste y otros de los conceptos vistos hasta ahora en una escena cl谩sica de Jurassic Park, en la que se navegaba por un sistema de archivos en 3D:

Navegando en un espacio de informaci贸n en 3D. Fuente: Steven Spielberg.
Navegando en un espacio de informaci贸n en 3D. Fuente: Steven Spielberg.

Era una interfaz atractiva, y yo (ni帽o en esa 茅poca), un par de a帽os despu茅s cuando tuve un 486, quise explorar mi computador de la misma manera. En efecto es una manera entretenida, pero si la vemos con ojo cr铆tico nos damos cuenta que encontrar informaci贸n en esa interfaz es dif铆cil: se nos oculta gran parte del disco, no vemos los nombres de las carpetas, el movimiento es torpe. Noten que la visualizaci贸n no incluye el nombre de las carpetas de manera prominente. El texto en interfaces 3D es menos legible que en 2D debido a cambios en el tama帽o debido a la profundidad, perspectiva y rotaci贸n. Adem谩s tambi茅n hay problemas de rendering debido a la resoluci贸n. En 3D el texto se ve peor que en un plano 2D.

En resumen, los puntos anteriores nos indican que para datos abstractos se necesita una buena justificaci贸n para usar 3D. No es lo mismo una visualizaci贸n de datos espaciales que de datos abstractos para los que no tenemos una referencia. As铆, se pierde el poder de utilizar un plano para visualizar.

Veamos un ejemplo concreto de c贸mo convertir una visualizaci贸n 3D sin justificaci贸n a una 2D efectiva. En este ejemplo disponemos de una serie temporal de consumo el茅ctrico en un edificio por cada d铆a del a帽o. La tarea a realizar es identificar perfiles (patrones) de consumo el茅ctrico, tanto en su forma como en las fechas en que se encuentra dicho perfil. La visualizaci贸n 3D directa luce as铆:

Visualizaci贸n 3D de series temporales diarias de consumo energ茅tico en un edificio. Fuente: Van Wijk et al, Cluster and calendar based visualization of time series data.
Visualizaci贸n 3D de series temporales diarias de consumo energ茅tico en un edificio. Fuente: Van Wijk et al, Cluster and calendar based visualization of time series data.

La visualizaci贸n en 3D permite mostrar todos los d铆as del a帽o en un solo gr谩fico. Sin embargo, el volumen de cada d铆a hace que la comparaci贸n entre per铆odos de tiempo sea pr谩cticamente imposible debido a la oclusi贸n y a la perspectiva.

Para crear una visualizaci贸n efectiva, el equipo transform贸 los datos y luego utiliz贸 visualizaci贸n en 2D. Primero, determinaron que en el dominio del problema (electricidad) era relevante definir patrones de consumo el茅ctrico. Para identificar estos patrones agruparon las series temporales con una t茅cnica de clustering. De este modo, cada d铆a pertenec铆a a un cluster espec铆fico, es decir, ten铆a un patr贸n 煤nico. Luego visualizaron esos patrones, que tambi茅n son series temporales, superimpuestos en un line_chart. La distribuci贸n de los patrones se visualiz贸 en una visualizaci贸n calendar_view (vista de calendario 2D). La visualizaci贸n final luce as铆:

Visualizaci贸n 2D de series temporales diarias de consumo energ茅tico en un edificio, agrupadas con un algoritmo de clustering, con vista de calendario. Fuente: Van Wijk et al, Cluster and calendar based visualization of time series data.
Visualizaci贸n 2D de series temporales diarias de consumo energ茅tico en un edificio, agrupadas con un algoritmo de clustering, con vista de calendario. Fuente: Van Wijk et al, Cluster and calendar based visualization of time series data.

Como ven, es posible conocer los perfiles de uso energ茅tico y su distribuci贸n durante el a帽o.

Veamos ahora un ejemplo de 3D justificado. Cuando la tarea es estudiar la forma en tres dimensiones, los beneficios de usar 3D superan los costos en la eficiencia de la visualizaci贸n. No siempre es f谩cil, porque visualizar en 3D puede incluir visualizar vol煤menes. El siguiente ejemplo muestra como la visualizaci贸n 3D directa no es 煤til, pero una visualizaci贸n 3D con geometr铆a derivada, en este caso, l铆neas de contorno que caracterizan el volumen que junto con la interacci贸n permiten apreciar la forma de lo visualizado:

Visualizaci贸n 3D directa (a) y con geometr铆a derivada (b). Fuente: Li et al, Image-based streamline generation and rendering.
Visualizaci贸n 3D directa (a) y con geometr铆a derivada (b). Fuente: Li et al, Image-based streamline generation and rendering.

Entonces, el uso de 3D es leg铆timo para datos que son 3D y que requieren manipulaci贸n y comprensi贸n de las formas 3D.

No usar 2D sin tener una justificaci贸n #

Gran parte de las visualizaciones que hagamos ser谩n 2D y est谩 bien, utilizaremos los canales adecuados. Sin embargo, si nos enfocamos en la visualizaci贸n de redes, es necesario que pensemos si necesitamos una organizaci贸n en 2D de los nodos, o si podremos elegir una representaci贸n alternativa. Esto es crucial si leer texto es importante para la tarea a ejecutar. Debido a como funcionan los algoritmos de organizaci贸n de redes (como force_directed_placement), la densidad de la red puede dificultar la lectura de las etiquetas de cada nodo.

Si la tarea es principalmente topol贸gica, entonces el uso de 2D para la red est谩 justificado: los costos son menores a los beneficios. Pero de todos modos debemos tener cuidado con la legibilidad, aunque depender谩 de la cantidad de nodos que tenga la red si esto ser谩 un problema. Un ejemplo de c贸mo visualizar una red de manera efectiva considerando texto es el sistema Cerebral:

Fuente: Barsky et al, VCerebral: Visualizing multiple experimental conditions on a graph with biological context.
Fuente: Barsky et al, VCerebral: Visualizing multiple experimental conditions on a graph with biological context.

En Cerebral se mezclan dos vistas distintas de la red, una de small multiples (sin texto) y otra vista detallada (con texto). La organizaci贸n de los nodos es la misma en cada vista, lo que permite comparar distintas configuraciones de la misma red. Aunque lo parece, la red no se visualiza con un force_directed_placement, sino con un algoritmo que permite guiar la organizaci贸n de acuerdo a la estructura de los datos (el contexto biol贸gico). Hay muchas decisiones de dise帽o detr谩s de un sistema as铆, aunque no lo parece. Por eso, incluso al usar 2D, es importante pensar en qu茅 justifica la codificaci贸n visual que utilizaremos.

Evaluar: Validar la Efectividad de Un Sistema #

El 煤ltimo tema de esta unidad es la evaluaci贸n, que busca validar la efectividad de un sistema de visualizaci贸n. Entonces, lo primero que nos preguntamos es: 驴Qu茅 significa que un sistema est茅 validado? Las respuestas son m煤ltiples:

  • 驴En t茅rminos de software engineering ? Que el sistema funcione adecuadamente, que no presente bugs.
  • 驴En t茅rminos de las tareas a realizar? Que el sistema permita realizar las tareas de manera efectiva (resultados correctos).
  • 驴En t茅rminos de desempe帽o? Que el sistema permita realizar las tareas de manera eficiente en el uso de recursos (menor tiempo posible, menor uso de memoria, etc.).

La 煤nica manera de saber si dise帽ados bien nuestro sistema es realizando una evaluaci贸n que responda 茅sas y otras preguntas. Hay herramientas formales para ello, provenientes de 谩reas como User Research, Interacci贸n Humana-Computador, y otras. No es un proceso simple, puesto que cada persona interpreta una visualizaci贸n de manera diferente y cada sistema puede tener hardware distinto. Sin embargo, en esta unidad no ahondaremos en las t茅cnicas para realizar evaluaci贸n, sino en los qu茅 y por qu茅 de un proceso de ese tipo.

La investigadora Tamara Munzner propone un modelo anidado de visualizaci贸n definido a continuaci贸n:

Modelo Anidado de Evaluaci贸n de Visualizaciones. Fuente: Visualization Analysis & Design.
Modelo Anidado de Evaluaci贸n de Visualizaciones. Fuente: Visualization Analysis & Design.

驴A qu茅 se refiere con anidado? A que la evaluaci贸n no es un proceso que se realiza solamente al finalizar la implementaci贸n del sistema, sino que est谩 presente de manera continua al entender el dominio del problema a resolver y al ejecutar cada etapa del proceso de dise帽o (datos -> tareas -> codificaci贸n visual) e implementaci贸n. Es cr铆tico utilizar un enfoque anidado porque las etapas del proceso que no sean evaluadas pueden generar resultados incorrectos que crean errores de arrastre: si entendimos mal el problema porque no conocemos el dominio, entonces todo lo que hagamos despu茅s ser谩 inefectivo. Aunque entendamos el problema, si nuestros datos no son abstra铆dos y verificados de manera adecuada, las tareas generar谩n resultados incorrectos. Si las tareas est谩n correctamente definidas, pero la codificaci贸n visual no cumple con los principios de efectividad y coherencia, la interpretaci贸n de las personas que utilicen la visualizaci贸n puede ser equivocada. Si realizamos bien todo el proceso, pero el sistema implementado funciona mal (se cae, tiene bugs, etc.) o tiene mal desempe帽o (requiere m谩s memoria de la que dispone el hardware, toma demasiado tiempo en hacer c谩lculos y no se puede interactuar, etc.), entonces no ser谩 adoptado y por tanto el sistema habr谩 fracasado en su prop贸sito.

Al avanzar a trav茅s de estas capas debemos estar constantemente evaluando si lo estamos haciendo bien. De otro modo los errores se propagar谩n y no lo sabremos hasta que sea demasiado tarde, porque no ser谩 evidente su presencia hasta el final del proyecto.

Conclusiones #

En esta unidad tuvimos una vista general de algunas buenas pr谩cticas a la hora de dise帽ar una visualizaci贸n, y de la estructura anidada de un proceso constante de evaluaci贸n. Si consideramos estos contenidos a la hora de trabajar en visualizaci贸n aumentaremos las posibilidades de que nuestro trabajo sea correcto. Tambi茅n las de que tenga impacto en el dominio donde trabajemos, de otro modo, nuestro proyecto corre el riesgo de generar resultados err贸neos, o de no ser adoptado, de ser un 谩rbol que cay贸 en un bosque sin que nadie lo escuchara.

Lecturas Recomendadas #

  • Pautas de Alineamiento (Guidelines) para visualizaci贸n en reportes del Urban Institute.
  • Shneiderman, B. (1996, September). The eyes have it: A task by data type taxonomy for information visualizations. In Proceedings 1996 IEEE symposium on visual languages (pp. 336-343). IEEE.
  • Carpendale, M. S. T., Carpendale, T., Cowperthwaite, D. J., & Fracchia, F. D. (1996, October). Distortion viewing techniques for 3-dimensional data. In Proceedings of the 1996 IEEE Symposium on Information Visualization (INFOVIS'96)(p. 46). IEEE Computer Society.
  • Munzner, T. (2009). A nested model for visualization design and validation. IEEE transactions on visualization and computer graphics, 15(6), 921-928.
  • Segel, Edward, and Jeffrey Heer. Narrative visualization: Telling stories with data. IEEE transactions on visualization and computer graphics 16, no. 6 (2010).
  • Hullman, Jessica, and Nick Diakopoulos. Visualization rhetoric: Framing effects in narrative visualization. IEEE transactions on visualization and computer graphics, 17, no. 12 (2011).
  • Lam, H., Bertini, E., Isenberg, P., Plaisant, C., & Carpendale, S. (2011). Empirical studies in information visualization: Seven scenarios. IEEE transactions on visualization and computer graphics, 18(9), 1520-1536.