Definición y Motivación

Tamara Munzner provee la siguiente definición para Visualización de Información:

Los sistemas computacionales de visualización proveen representaciones visuales de conjuntos de datos diseñadas para ayudar a las personas a efectuar tareas de manera más efectiva.

No es la única definición, pero es la que mejor se adecúa a los propósitos de este curso, ya que está vinculada a data science: queremos resolver tareas (de un dominio específico) en sistemas computacionales.

Videos Motivacionales

Hans Rosling’s 200 Countries, 200 Years, 4 Minutes - The Joy of Stats:

Los mapas españoles que servirán para cambiar el mundo:

Visualización con Impacto Mundial

John Burn-Murdoch (https://twitter.com/jburnmurdoch) diseñó esta visualización en el Financial Times sobre COVID-19.

John Burn-Murdoch (https://twitter.com/jburnmurdoch) diseñó esta visualización en el Financial Times sobre COVID-19.

John Burn-Murdoch (https://twitter.com/jburnmurdoch) diseñó esta visualización en el Financial Times sobre COVID-19.

Las Personas son importantes

¿Por qué hay personas involucradas?

  • No siempre conocemos las preguntas que queremos hacer a los datos.
  • No podemos programar un algoritmo, o usar aprendizaje de máquinas, para responder cada pregunta.
  • Porque algunos casos de uso no pueden ser automatizados.

Análisis, Diseño y Uso

Fuente: Dürsteler & Engelhardt.

Fuente: Dürsteler & Engelhardt.

Fuente: Dürsteler & Engelhardt.

El contexto cultural y social es muy importante. No hay dos personas iguales.

Actividad (3 minutos)

Descubramos algunas diferencias en como interpretamos el mundo. Respondamos lo siguiente:

¿Cómo visualizar los números 37 y 73?

Esta actividad es idea de @moebio.

Enfoque en Tecnología y Computadoras

Visualización como Tecnología

En su libro The Functional Art, Alberto Cairo menciona:

La visualización debe entenderse como una tecnología[…] ¿Qué define a una tecnología?

  1. Es una extensión de nosotros.
  2. Es un medio para alcanzar un objetivo.

Respecto a una visualización, dice:

Un gráfico en sí mismo también es una tecnología, un medio para alcanzar un fin, un dispositivo cuyo propósito es ayudar a una audiencia a completas tareas específicas.

En los 80s

Fuente: Graham Douglas, The Economist.

Fuente: Graham Douglas, The Economist.

Fuente: Graham Douglas, The Economist.

En 1987 hacer una visualización así (link) requería un trabajo manual de principio a fin.

En los 20s

Fuente: Jacques Bertin en http://www.aviz.fr/diyMatrix/.

Fuente: Jacques Bertin en http://www.aviz.fr/diyMatrix/.

Fuente: Jacques Bertin en http://www.aviz.fr/diyMatrix/.

Jacques Bertin, hoy

Fuente: http://www.aviz.fr/diyMatrix/.

Fuente: http://www.aviz.fr/diyMatrix/.

Fuente: http://www.aviz.fr/diyMatrix/.

En la conferencia IEEE VIS hubo una exposición de homenaje para él.

Análisis y Colaboración

Fuente: http://www.aviz.fr/diyMatrix/.

Fuente: http://www.aviz.fr/diyMatrix/.

Fuente: http://www.aviz.fr/diyMatrix/.

Dispositivos como las matrices físicas permiten realizar un análisis colaborativo de los datos.

¿Por qué hay computadoras involucradas?

  • Capacidad de procesamiento de datos.
    • Más rápido, más cantidad.
    • Análisis de variabilidad.
  • Escalabilidad.
    • Las personas pueden realizar ciertas tareas para un dataset pequeño. ¿Son capaces de hacerlas para un dataset mucho más grande?
  • Colaboración.
    • Tanto en el desarrollo como en el uso de un sistema de visualización.

Límites

  • Estamos sujetos a límites del medio.
    • En el caso de las infografías impresas, los límites los pone el papel.
    • Densidad de información: La pantalla tiene una resolución máxima. Un píxel no puede mostrar más que un único color.
  • También se suman los límites humanos.
    • Limitada memoria de corto plazo.
    • Change Blindness: no vemos cambios grandes si estamos atentos a otra cosa.
  • Los datos también pueden presentar limitantes:
    • Suciedad, completitud, errores.
    • Sesgos, presentes tanto en el fenómeno observado como en la recolección e interpretación de éstos.

Wall Displays como Entorno Colaborativo

Investigadores del Instituto de Data Science UDD, INRIA Chile, Metro de Santiago, Secretaría de Transporte, CEDEUS.

Investigadores del Instituto de Data Science UDD, INRIA Chile, Metro de Santiago, Secretaría de Transporte, CEDEUS.

Investigadores del Instituto de Data Science UDD, INRIA Chile, Metro de Santiago, Secretaría de Transporte, CEDEUS.

Pueden ver la historia detrás de esta imagen en el paper Adoption-Driven Data Science for Transportation Planning: Methodology, Case Study, and Lessons Learned.

¿Por qué usar interactividad?

Una imagen vale mil palabras. Una interfaz de usuario vale mil imágenes.

– Ben Shneiderman

  • Una visualización estática permite una única vista de los datos.
  • A medida que nos acercamos a los límites de personas y computadoras, la interactividad permite que lo que se muestra cambie: potencialmente infinitas vistas, cada una adaptada a los límites.
  • “InfoVis Mantra”: Overview first, zoom & filter, details on demand (Ben Shneiderman).

Lo Visual

¿Por qué depender de la visión?

  • Es un sentido perceptualmente eficiente.
    • La comunicación con el cerebro es rápida.
    • El procesamiento es paralelo a nivel preconciente.
  • En contraste, otros sentidos son secuenciales (por ej., sonido).
  • Todavía no tenemos ni el entendimiento ni la tecnología para ser eficientes (por ej., todavía no tenemos interfaces hápticas mainstream como en Ready Player One).
  • Una “representación externa” reemplaza cognición por percepción.

Eficiencia: ¿Dónde está el círculo rojo?

Perception in Visualization, Christopher G. Healey. https://www.csc2.ncsu.edu/faculty/healey/PP/.

Perception in Visualization, Christopher G. Healey. https://www.csc2.ncsu.edu/faculty/healey/PP/.

Perception in Visualization, Christopher G. Healey. https://www.csc2.ncsu.edu/faculty/healey/PP/.

Eficiencia: ¿Dónde está el círculo rojo?

Perception in Visualization, Christopher G. Healey. https://www.csc2.ncsu.edu/faculty/healey/PP/.

Perception in Visualization, Christopher G. Healey. https://www.csc2.ncsu.edu/faculty/healey/PP/.

Perception in Visualization, Christopher G. Healey. https://www.csc2.ncsu.edu/faculty/healey/PP/.

¿Qué nos dicen las artes y la comunicación sobre Percepción?

Scott McCloud, Understanding Comics.

Scott McCloud, Understanding Comics.

Scott McCloud, Understanding Comics.

La visión nos permite movernos en el continuo de información recibida y percibida.

¿Qué es la abstracción?

Scott McCloud, Understanding Comics.

Scott McCloud, Understanding Comics.

Scott McCloud, Understanding Comics.

El mecanismo que permite situarnos en ese espectro es la abstracción. ¡Podríamos cambiar artist por visualization designer en la definición!

¿Cómo se compara con la estadística descriptiva?

Dependiendo de las necesidades del problema, nos podríamos preguntar si es necesario usar visualización, si podemos abstraer los datos utilizando estadística descriptiva.

  • La estadística descriptiva también abstrae los datos.
  • Sin embargo, oculta variabilidad que puede ser importante.
    • Puede inducir a errores de interpretación.
    • Los datos agregados pueden ocultar patrones en los datos.
  • Limita la capacidad de encontrar algo que no esperábamos, porque la agregación usualmente se hace pensando en un fin específico.

El Cuarteto de Anscombe

https://en.wikipedia.org/wiki/Anscombe%27s\_quartet.

https://en.wikipedia.org/wiki/Anscombe%27s_quartet.

https://en.wikipedia.org/wiki/Anscombe%27s\_quartet.

Todos estos data sets tienen el mismo promedio (x=9, y=7.5), varianza (x=11, y=4.125), correlación de r=0.816, y misma regresión lineal y = 3 + 0.5x.

Datasaurus Dozen

AUTODESK Research https://www.autodeskresearch.com/publications/samestats.

AUTODESK Research https://www.autodeskresearch.com/publications/samestats.

AUTODESK Research https://www.autodeskresearch.com/publications/samestats.

Hagamos un Ejercicio (5 minutos)

Stephen Few, Why do we visualize Quantitative Data? https://www.perceptualedge.com/blog/?p=1897.

Stephen Few, Why do we visualize Quantitative Data? https://www.perceptualedge.com/blog/?p=1897.

Stephen Few, Why do we visualize Quantitative Data? https://www.perceptualedge.com/blog/?p=1897.

Tomemos unos minutos para abstraer esta tabla en una visualización. Imaginemos las siguientes preguntas:

  1. ¿Cómo va el negocio de ventas domésticas en relación a las ventas internacionales?
  2. ¿Cuáles son los meses de mejor venta en comparación con sus meses vecinos?
  3. ¿Qué pasó en Agosto con las ventas internacionales?

Un Posible Resultado

Stephen Few, Why do we visualize Quantitative Data? https://www.perceptualedge.com/blog/?p=1897

Stephen Few, Why do we visualize Quantitative Data? https://www.perceptualedge.com/blog/?p=1897

Stephen Few, Why do we visualize Quantitative Data? https://www.perceptualedge.com/blog/?p=1897

  • No vemos la cifra exacta pero podemos realizar operaciones que en la tabla son más difíciles. Comparar, buscar períodos relevantes, medir tendencias locales, etc.
  • Para responder preguntas que no son directas (como máximos o mínimos) no necesitamos memorizar – nuestra percepción visual se encarga del trabajo.

Tareas como Objetivo en la Visualización

¿Por qué enfocarse en las tareas?

  • Hablamos de abstracción – en los cómics, se buscaba un significado. En visualización se busca un resultado. El resultado de hacer una tarea, de utilizar una tecnología con un objetivo.
  • Visualización no es arte (puede llegar a serlo). Nuestro propósito es crear herramientas efectivas.
    • La efectividad depende del contexto. Así, las tareas permiten restringir y enfocar el diseño.
      • ¿lo hacemos más rápido/barato/preciso?
      • ¿descubrimos algo que de otro modo no hubiésemos logrado?
  • Importante: no todas las tareas son relacionadas a necesidades de negocio.
    • A veces la tarea es única y personal: explorar, aprender, divertirse.

¿Cuándo usar visualización? Una Metodología de Diseño

¡No siempre! Diagrama de Tamara Munzner. http://www.cs.ubc.ca/labs/imager/tr/2012/dsm/.

¡No siempre! Diagrama de Tamara Munzner. http://www.cs.ubc.ca/labs/imager/tr/2012/dsm/.

¡No siempre! Diagrama de Tamara Munzner. http://www.cs.ubc.ca/labs/imager/tr/2012/dsm/.

Ejemplo: El verdadero John Snow

Fuente: https://en.wikipedia.org/wiki/1854\_Broad\_Street\_cholera\_outbreak_.

Fuente: https://en.wikipedia.org/wiki/1854_Broad_Street_cholera_outbreak_.

Fuente: https://en.wikipedia.org/wiki/1854\_Broad\_Street\_cholera\_outbreak_.

El John Snow que sí sabe creó la Epidemiología utilizando esta visualización, buscando una solución para el cólera en el Londres victoriano.

Florence Nightingale

Fuente: https://es.wikipedia.org/wiki/Florence\_Nightingale.

Fuente: https://es.wikipedia.org/wiki/Florence_Nightingale.

Fuente: https://es.wikipedia.org/wiki/Florence\_Nightingale.

La enfermera y estadística Florence Nightingale utilizó visualizaciones para identificar las causas de muerte en los hospitales en las colonias inglesas.

Visual Vocabulary

Vocabulario Visual del Financial Times. Para tareas, visualizaciones.

Vocabulario Visual del Financial Times. Para tareas, visualizaciones.

Vocabulario Visual del Financial Times. Para tareas, visualizaciones.

Pueden ver la versión interactiva aquí: https://ft-interactive.github.io/visual-vocabulary/.

No todos los diseños son efectivos para cada tarea

Espacio de Soluciones por Tamara Munzner.

Espacio de Soluciones por Tamara Munzner.

Espacio de Soluciones por Tamara Munzner.

El propósito de este curso es expandir el espacio de soluciones que ustedes conocen, de modo de elegir el mejor diseño para la tarea que debe resolverse.

Trade-Offs

Rueda de Abstracción por Alberto Cairo.

Rueda de Abstracción por Alberto Cairo.

Rueda de Abstracción por Alberto Cairo.

Elección de diseño no siempre es sobre cuál es mejor, sino sobre trade-offs involucrados. Técnicas que son buenas en un contexto no lo son en otro.

Siempre se debe decidir en torno a complejidad/profundidad y comprensibilidad/simpleza.


Conclusiones

En este momento ya tenemos:

  • una imagen global de qué es visualización basados en una definicińo específica.
  • una noción respecto a cuándo utilizarla y por qué.
  • conocimiento de sus beneficios en comparación con otras alternativas de abstracción.