¿Cómo definir problemas y preguntas de investigación?
Tabla de contenido
Donde vayamos habrá problemas a resolver y muchos dolores que curar. ¿Cuál elegir para nuestro proyecto?
La siguiente imagen es un artículo titulado "¿Cómo elegir un buen problema científico?" de Uri Alon y, si bien se refiere a temas de investigación para quienes están haciendo su tesis doctoral o están en la carrera académica, incluye un consejo que es práctico a todo nivel: hay que ponderar el tamaño o dificultad del problema, su potencial impacto, y la etapa de tu propia carrera.
Los problemas se pueden clasificar según facilidad e interés. “Fácil” no significa realmente fácil en términos de ejecución, sino de definición. Un problema fácil tiene objetivos claros y métricas conocidas. Un problema difícil requiere definir qué significa éxito.
La elección del problema también depende de la etapa del investigador. Un estudiante principiante debería elegir problemas más fáciles para desarrollar habilidades, lo que se conoce como low hanging fruit o fruta al alcance de la mano. Un(a) investigador(a) de trayectoria puede abordar problemas más ambiciosos, puesto que posiblemente tiene presupuesto y un equipo que participe.
En otras palabras, es lícito querer salvar al mundo con tu proyecto. Pero, sobre todo si estás leyendo esto como estudiante, es más importante que logres definir uno que sea realizable dadas tus restricciones de tiempo y recursos.
En este post veremos una estrategia para definir problemas. No nos enfocamos directamente en la ponderación propuesta por Alon, eso es algo que debes hacer tú personalmente. Sin embargo, para ponderar, necesitas un problema que esté correcta y claramente definido. Así es posible determinar su impacto.
El problema de definir el problema #
En Data Science resolvemos problemas cuya solución no se conoce. Por eso investigamos. La primera dificultad es saber qué investigar exactamente.
Muchos sugieren empezar con una pregunta de investigación: una frase que determine el área de estudio e identifique los objetivos específicos. Por ejemplo:
¿Cuál es la relación entre elección de modo de transporte y estatus socioeconómico?
Sin embargo, formular una buena pregunta asume que tenemos una imagen clara del contexto del problema. Pocas veces sucede al comienzo de un proyecto. Necesitamos una herramienta que nos ayude a llegar a esa pregunta.
Situación, complicación, propuesta #
Para construir esa claridad uso el esquema SCP (Situation/Complication/Proposal) propuesto por Barbara Minto en su libro The Pyramid Principle. Se parte con la situación y la complicación antes de definir la propuesta. Como se suele decir, no se pone la carreta antes de los bueyes.
Consideremos el proyecto de tesis de Paula Vásquez-Henríquez, que hizo su tesis de Magíster conmigo, y a quien admiro por su capacidad y calidad humana. Ella publicó dos artículos: Tweets on the Go: Gender Differences in Transport Perception and Its Discussion on Social Media en una revista, y Characterizing Transport Perception using Social Media: Differences in Mode and Gender en una conferencia. Tal como dicen los títulos de sus papers, Paula me propuso estudiar las diferencias de género en la percepción de seguridad, porque sabía que para las mujeres era más inseguro que para los hombres. Y yo le conté que eso no se medía en la Encuesta Origen-Destino, porque ya había estudiado esos datos, así que era un desafío importante poder medir ese fenómeno. Entonces decidimos estudiar reportes en Twitter (de ese entonces, hace casi 10 años; hoy la red social tiene otros paradigmas de uso).
Podríamos decir que la propuesta inicial de Paula era: “medir diferencias de género en el transporte utilizando trazas digitales”.
¿Funciona esa definición? A decir verdad, es una buena descripción de lo que se hizo (y, en ese momento, “hará”) en el proyecto. Pero un proyecto es mucho más que su ejecución. Un proyecto, según la RAE, es una “planta y disposición que se forma para la realización de un tratado, o para la ejecución de algo de importancia”. Requiere perspectiva, esquema, plan. Requiere una razón de ser.
Como Paula, quizás ya tienes una noción interna o implícita del problema, pero para poder definir el proyecto necesitamos definir situación y complicación primero. Veamos las definiciones de SCP y cómo se aplicaron en el proyecto de Paula.
Situación #
Se define como el contexto en el cual nos situamos. Es el estado actual de las cosas. Aquí no hay problemas todavía. En el caso de Paula:
Las personas a menudo basan sus decisiones de movilidad en aspectos subjetivos de la experiencia de viaje, como la percepción del tiempo, el uso del espacio y la seguridad.
Esta frase define el contexto del proyecto. Tenerlo claro tiene ventajas. Por ejemplo, en un proyecto requieres conocimiento, saber qué se ha hecho antes, qué ha funcionado (y qué no). Y si vas a comunicar el proyecto en una presentación, comenzar con la situación permite situar a tu audiencia.
Complicación #
Se define como algo que cause problemas en la situación. Puede ser un problema, una disconformidad, una limitante. En el caso de la tesis de Paula:
Diferentes grupos dentro de una población reaccionan de manera diferente al mismo viaje, sin embargo, los métodos actuales de recolección de datos podrían no considerar los aspectos multidimensionales de la percepción del viaje, lo que podría llevar a pasar por alto las necesidades de grandes grupos de población.
En pocas palabras, esta complicación se enfoca en la disponibilidad de datos para medir el problema. Es posible encontrar otras complicaciones dentro de la misma situación, entonces, ¿cómo elegimos una? Además de los criterios de complejidad y tamaño que mencioné al comienzo, podemos preguntarnos: ¿Por qué es importante resolverlo? No basta que sea el problema planteado por el profesor o elegido por nosotros. Tiene que haber un propósito.
También puedes preguntarte: ¿Quién será beneficiado/a con la solución? Le debe importar a alguien: la sociedad, una institución, una comunidad, una persona específica. Incluyéndote.
En el proyecto de Paula, la respuesta era clara: las mujeres que usan transporte público serían beneficiadas si se consideraran sus necesidades específicas en el diseño de políticas de transporte.
Propuesta #
Para responder la pregunta implícita que surge de la complicación, generamos una propuesta que permita resolverla o entenderla. Una propuesta efectiva combina los siguientes factores: acción + objetivo + contexto + insumos. En el caso de Paula:
En este artículo, proponemos medir varios aspectos de la experiencia de viaje desde la plataforma de redes sociales Twitter, con un enfoque en las diferencias con respecto al género […]
Nota que el enfoque está algo desordenado respecto a la estructura porque está traducida del inglés en el paper. Los factores son:
- medir (acción).
- diferencias de género (objetivo).
- experiencia de viaje (contexto).
- plataforma de redes sociales Twitter (insumos).
Con el tiempo, he adquirido un vocabulario para definir proyectos en este tipo de situaciones+complicaciones:
- Acciones: medir, caracterizar, visualizar, predecir, simular, crear dataset, automatizar, prescribir, crear software, diseñar, correlacionar.
- Objetivos: socio-demografía, diferencias de género u otros grupos etáreos, uso del espacio público, oferta de trabajo, uso del tiempo, seguridad, tecnología, bienes raíces, indicadores, puntos de interés, gestión de riesgos.
- Contextos: transporte, movilidad, logística, territorio, servicios, entorno construido, turismo, epidemiología, uso de suelo, áreas verdes, desastres.
- Insumos: datos tradicionales, trazas digitales, datos sintéticos.
Quizás podríamos tener un “generador de proyectos” con estas keywords. De hecho, imagina que lo tienes. ¿Cómo eliges cual propuesta llevar a cabo? Allí es donde entra en juego la ponderación que hemos conversado. Algunas propuestas son más complejas o ambiciosas que otras. En este punto, todas aportarán valor. Eso es lo que importa.
Una vez completado el esquema SCP, podemos formular preguntas de investigación más precisas. En el caso de Paula, la pregunta evolucionó de “¿cómo medir diferencias de género?” a “¿cómo pueden las trazas digitales revelar aspectos subjetivos del transporte que no capturan las encuestas tradicionales, especialmente diferencias de género en percepción de seguridad?”. Esta pregunta es más específica y accionable. Surgió naturalmente del proceso de clarificar situación y complicación. Eso también le permitió comunicarlo mejor y publicarlo. ¡Su dedicación y su enfoque fueron tan efectivos que incluso fuera de la academia le pidieron que hablara del proyecto! La invitaron a presentar los resultados de su investigación al BID (Banco Interamericano de Desarrollo) en Washington, DC (EEUU).
Estrategia de ejecución #
¡Tenemos la propuesta! Ahora es necesario ejecutarla. Para eso debemos hacer un plan. No es necesario que sea perfecto. Con el tiempo lo mejoraremos y, a medida que adquiramos más información y experiencia, podremos tomar mejores decisiones.
Ahora bien, imagina que propusiste llegar desde A hasta B. Pero sucedieron cosas en el camino y al parecer no podrás llegar a B. Esa es una fuente de preocupación, porque prometiste llegar a B. ¿Qué hacer en esos casos? El artículo de Alon propone un enfoque que me gusta, y es es aceptable no llegar a B. Tu objetivo era llegar a B, cierto:
¡Pero los proyectos se desvían! Aparecen problemas en el camino, a veces de índole técnico (se pierden los datos, no funciona un modelo, etc.); otras, personal. Tenemos que adoptar un enfoque formativo que acepta que el camino será serpenteante, desde el cual se abrirán nuevas direcciones. Esto significa que el resultado final puede ser distinto del propuesto inicialmente. Quizás no terminas en B, sino en C.
Y eso está bien.
Puede ser que la distancia hasta B haya sido más grande de lo que logramos dilucidar en un comienzo. Y C nos acercó.
Puede ser, también, que C está en otro lugar. Uno mucho más interesante e incluso con un impacto más grande. Pero, ¿podíamos ver C desde A con lo que sabíamos en el comienzo, o necesitamos recorrer parte del camino para descubrirlo?
A veces esos desvíos nos llevan a lugares mejores, por muy terribles que sean. Paula se encontró con desvíos. Yo también. Lo importante es que ella recorrió el camino, aprendió y aportó. A la sociedad, a sí misma. También a mí. Siempre estaré agradecido de trabajar con gente de quien aprendo. Por eso soy profesor.