Cómo ser Data Scientist y NO Morir en el Intento

Tabla de contenido

En el post anterior definí qué es Data Science (o Ciencia de Datos), y expliqué quién era Data Scientist (prefiero decirlo en inglés, ya que no tiene género asociado). Lo que quedó pendiente es definir el camino para llegar a ser uno(a). Ése es el tema de este post.

Mi camino y por qué el tuyo no tiene por qué ser igual. #

Llegué a ser una mezcla entre investigador, profesor y Data Scientist a través de la educación formal: primero fui ingeniero civil, trabajé como ayudante de investigación, luego hice un máster, trabajé en I+D y como ingeniero en proyectos de investigación. Finalmente hice un doctorado en tecnologías de la información y las comunicaciones en Barcelona. Y, cuando volví, comencé a trabajar en Telefónica I+D (TID), un trabajo que encontré buscando en Google. Tuve suerte: el centro de investigación se había creado hace poco, y aunque no habían publicado que necesitaban investigadores, mi correo llegó justo a tiempo. Después de eso, TID en conjunto con la Universidad del Desarrollo crearon el Instituto de Data Science, al que pertenezco como investigador. Buscaba un trabajo aplicado y académico, y producto de mi trabajo en TID, el traspaso fue sencillo. Hoy no solamente investigo, también hago clases, superviso alumnos de postgrado, y transfiero resultados de mi investigación a TID.

Parte del Instituto de Data Science más amigos: Francisca Varela (IDS), Diego Caro (IDS), Loreto Bravo (IDS), Ricardo Baeza-Yates, yo (IDS) y Leo Ferres (IDS).

Suena como un camino estándar hacia la academia, desde el lado de la ciencia básica hacia la ciencia aplicada utilizando los métodos y procesos descritos en el post anterior.

Sin embargo, he conocido gente que no tiene pre-grado que admiro por la calidad de su trabajo y su capacidad analítica. Amigos y amigas que logran tener trabajos en las empresas de tecnología más grandes, donde no les evalúan por sus cartones sino por su trabajo y por su habilidad para ver y entender a las personas.

No busco describir cada uno de esos caminos — para eso ya hay recursos que los describen a lo largo de la red. Mi propósito es mostrarte que, independiente de cuál decidas seguir, los obstáculos que encontrarás serán similares. Sea cual sea el camino, éste será duro, difícil, y parecerá que nunca termina. Pero también, independientemente de dónde termines llegando, valdrá la pena.

Hunter x Hunter #

En la Parte 1 hice un paralelo entre Data Science y la película Arrival. En la Parte 2 utilizaré la serie de manga/animé Hunter x Hunter como referencia.

Protagonistas de HxH: Kurapika (izq.), Gon (centro), Leorio (der., traje azul), Killua (der.).

Hunter (o HxH) Pertenece al género shonen, caracterizado por historias de personajes que se vuelven más fuertes a medida que van encontrando enemigos cada vez más poderosos. Posiblemente la serie shonen más famosa es Dragon Ball Z. Tal como Hunter no es una serie típica de shonen, Data Science no es una disciplina típica, como vimos en la parte anterior.

Hunters y Data Scientists #

El concepto principal en HxH es el de hunter, o cazador(a). La serie comienza cuando un niño, Gon, decide convertirse en cazador. Su padre, Ging, lo abandonó cuando era un bebé.

Gon descubre que lo abandonó para ser cazador. Y se imaginó que ser cazador debe ser algo por lo que valía la pena abandonar a su hijo. Así que decidió ser uno para descubrir qué era ser cazador y poder conocer a su padre.

¿Qué es ser cazador? Es simple: es ser reconocido como tal por la Asociación de Cazadores:

La Asociación de Cazadores (ハンター協会 Hantā Kyōkai) es responsable por poner a prueba y licenciar a les “Cazadores” (ハンター Hantā) — una persona que ha probado ser valiosa y un miembro de élite de la humanidad a través de una rigurosa examinación, y que se especializa en encontrar criaturas extrañas, tesoros escondidos, y otros individuos. Al aprobar la examinación, un(a) Cazador(a) gana una licencia que le da cuantiosos beneficios establecidos. Esto resulta en masivos registros al examen anual, que tiene una tasa de fallo extremadamente alta. —Wikipedia

Dentro de los tipos de cazadores hay aquellos que “cazan” conocimiento sobre comida y alimentación, arqueología, información, tecnología, tesoros, territorio, criminales, casos sin resolver, entre otras áreas. La variedad es enorme, pero si algo tienen en común estas personas es su voluntad inquebrantable y la pasión con la que buscan encontrar y resguardar sus “presas” u objetivos.

¿Suena similar? Las habilidades y herramientas necesarias son de élite y requieren un entrenamiento riguroso y extenso. Data Scientists buscan extraer valor a partir de los datos y resolver problemas importantes para la sociedad, que no se pueden resolver con las herramientas de una sola disciplina porque van más allá de sus límites. Son como cazadores(as) de datos.

El Examen de Cazador #

Tal como dice la definición, basta con dar el examen para ser hunter.

Suena fácil, pero no lo es- Porque no se sabe dónde se da, ni cómo inscribirse. El primer paso es encontrar dónde y cómo dar el examen es el primer paso (o primer filtro). Afortunadamente hay un punto de partida: un barco para todas las personas que quieran convertirse en cazadoras.

El viaje es turbulento, y muere gente en el camino. Aunque Gon no lo sabe, sucede algo que cambiará su vida para siempre: empieza a conocer amigos que tienen el mismo sueño que él.

Al llegar a puerto, el grupo debe pasar otras pruebas, incluyendo resolver acertijos y sobrevivir a ataques. Por ejemplo, en el camino llegan a un pueblo que parece estar vacío, pero que en realidad estaba habitado por gente misteriosa que, al ser descubierta, los pone a prueba a través del Desafío de Dos Opciones. Consiste en una pregunta a la cual solamente se puede responder uno o dos.

Uno de los sobrevivientes al viaje en barco se adelanta a nuestros protagonistas y trata de pasarse de listo. La pregunta que le hace la líder de la aldea, es la siguiente:

Han raptado a tu esposa y a tu madre. ¿A quién salvas?

El personaje responde “uno,” pensando que eso es lo que ella quiere escuchar, y la señora le dice que ha pasado el test. Lo invita a seguir por un sendero.

Después, un grito. Y otra pregunta. Ahora le toca responder a los amigos de Gon. Nuevamente un dilema.

La respuesta correcta era mantener silencio, lo que es, justamente, lo más difícil. Porque implica darse cuenta que no estamos restringidos por lo que nos digan en el enunciado de la pregunta.

Eventualmente se les abren las puertas que les permiten llegar al lugar oficial del examen. Para lograrlo, debieron ser amables, curiosos, respetuosos, y valientes. El lugar, por el contrario, es intimidante. Un túnel subterráneo.

Nuestro escenario puede ser igual de intimidante. Un punto típico de entrada son las challenges de Kaggle. Se ven como el punto de partida ideal: hay una comunidad detrás, datos, expertise documentada, e incluso soluciones de competencias anteriores.

A mi juicio, entrar a Kaggle se siente tal como entrar al lugar donde se da inicio al examen de cazador. Llegas a un búnker donde se ponen a prueba tus conocimientos, pero no sabes si quien está junto a ti es amigo o enemigo. A fin de cuentas, hay que ganar la competencia, y solamente hay un(a) ganador(a).

Sin embargo, resolver una challenge de Kaggle no es equivalente a dar el examen. Resolver esos problemas te puede dar fama y dinero, pero solamente prueba que puedes mezclar algoritmos de machine learning y mover sus perillas lo suficiente como para cumplir con una métrica. Eso es valioso, pero es una ínfima parte de lo que se hace en Data Science. Kaggle, al igual que la villa a la que llegan les aspirantes a cazador, debe ser explorada con cuidado y reflexión.

Primera Etapa: Incertidumbre #

404 personas lograron llegar al búnker en el que se inicia el examen. Algunas tienen experiencia ya que no rinden el examen por primera vez. Hay personas de todas las edades. Todos esperan ante la tensión de saber cuándo comenzará el examen. Si es que lo es realmente: a esa altura, nada es seguro.

De repente aparece un hombre de aspecto simpático y vestimenta clásica victoriana. Su nombre es Satotz, es un cazador arqueológico, y da la bienvenida a la primera parte del examen. Notamos que, a pesar de dedicarse a la arqueología, tiene habilidades de combate — algunos tienen la mala idea de atacarlo, pensando que su apariencia es la de un ser débil.

El cazador arqueológico Satotz, que nos pide que lo sigamos en un túnel sin luz al final.

La primera instrucción del examen es:

— ¡Síganme!

Comienza a caminar, cada vez más rápido. Todes comienzan a seguirlo, algunos corriendo, otros trotando, y los menos caminando. Pasan los minutos, y el cazador sigue avanzando, al mismo ritmo, sin acelerar ni detenerse.

El avance hace aparecer a los primeros cuestionamientos: ¿dónde vamos?¿por cuánto rato más?

Pero no hay respuesta. Por el contrario, Satotz acelera con el tiempo, dejando atrás a quienes se van rindiendo por el cansancio o por la incertidumbre. Esta sensación tan incómoda nos acompañará en toda la vida de Data Scientists. Estaremos trabajando en problemas para los que no se conoce una solución. Habrá incertidumbre en la calidad y cantidad de datos disponibles, en las hipótesis que definamos, en el diseño del experimento, en los resultados experimentales, en la interpretación de los resultados, en la recepción de estos por la contraparte, e incluso en la adopción de éstos.

En el camino a ser cazador Gon conoce a quien sería su mejor amigo.

No solamente habrá incertidumbre en el quehacer sino también en el contexto. Hay empresas que quieren hacer Data Science pero que no tienen la madurez cultural ni la infraestructura necesaria para llevarla a cabo. Me refiero a la capacidad de aceptar que se cometen errores, que los proyectos pueden fallar, y que las decisiones que toman quienes dirigen la organización pueden estar equivocadas, y que hay que reconocerlo para poder seguir avanzando. Por infraestructura necesaria me refiero a que una empresa puede querer contratar Data Scientists sin tener siquiera automatizada la generación y recolección de datos al interior de la compañía. Hay modelos que hablan de la madurez de las instituciones, que, al igual que las Data Scientists, también deben recorrer un camino a ser Data-Driven.

Al igual que en HxH, los protagonistas solamente saben que la maratón ha terminado cuando estás en el final. Cuando se ve la luz al final del túnel. Que, en el caso de la serie, estaba 80 Kilómetros después del punto de partida. En el caso de un proyecto, puede ser después de un número de iteraciones tal que ya la incertidumbre se haya reducido y estemos seguros del trabajo realizado. En el caso del aprendizaje inicial, llegarás cuando resuelvas un problema para otros utilizando herramientas de Data Science.

Segunda Etapa: Observar y Valorar #

La segunda etapa del examen de cazador es hospedada por Munchi, una cazadora gourmet. Esto quiere decir que ella está en búsqueda de nuevos sabores, texturas, presentaciones, y en general, todo lo que tenga que ver con disfrutar la comida con excelencia.

Munchi, una cazadora <em>gourmet. Ella es la anfitriona de la segunda fase del examen de cazador.</em> — Munchi, una cazadora *gourmet. Ella es la anfitriona de la segunda fase del examen de cazador.*

El año pasado fui a la Marcha por la Ciencia (que este año se llama Marcha por la Ciencia y el Conocimiento) y me encontré con un ex-compañero de Beauchef, que también se está dedicando a la Data Science. La extensión del nombre del evento no es caprichosa, por el contrario: busca incluir a otras áreas que también hacen ciencia, pero que no son parte de las llamadas ciencias básicas o incluso ciencias duras, como las artes y las humanidades. Pues bien, este ingeniero, al ver un cartel de una agrupación de humanidades (que además era de mujeres), comentó:

— Lindas, creen que hacen ciencia.

Cuento esta historia porque lo mismo sucedió en el examen: al ver a Munchi, muchos candidatos se rieron, primero, de ella, por ser mujer, y segundo, por dedicarse a la cocina. Mientras más pronto aprendas que infravalorar lo que hacen los demás es un camino directo a la perdición, mejor. En Data Science trabajarás para otras disciplinas, y serán ellas quienes juzguen tu trabajo en base al impacto que pueda generar. Las áreas relacionadas con la ingeniería no son más importantes que las otras, entre las que se encuentran sociología, administración y comunicación.

Volvamos al examen: Menchi explica que la segunda prueba consiste en preparar un plato de comida en base de cerdo. Si el plato le gusta, pasan a la siguiente etapa. El cerdo deben cazarlo, y justamente en el bosque afuera de la mansión donde se lleva a cabo el examen existe una raza de cerdo que es deliciosa. El patio de la mansión tiene suficientes parrillas para que todos puedan cocinar cuanto sea necesario para dar la prueba.

Lo que no contó es que los cerdos eran los más peligrosos del planeta. Así que incluso esa tarea, inicialmente ridícula y fácil, requería fuerza y perspicacia. Los cerdos, enormes como leones, tenían un único punto débil, que solamente podía ser descubierto corriendo riesgos y luego observando lo que sucedía. El proceso de prueba y error es iterativo y suele entregar resultados, y tal como en la serie, posiblemente obtengamos una respuesta pero no de manera directa, como causal de nuestro diseño experimental, sino a causa de que probamos, medimos, y volvemos a iterar.

Una vez descubierto el punto débil, el conocimiento se expande de manera rápida. Así que todes pueden llegar pronto con un cerdo listo para cocinar a la mansión.

Tener buenos ingredientes no implica que el plato sea bueno, ni que sea simple de hacer, como parecieron creer nuestros protagonistas :)

Aunque los ingredientes sean de la mejor calidad posible, si el proceso de cocinado no aprovecha las interacciones entre ingredientes y su relación con el calor generado en la cocina, entonces el resultado será mediocre. Y así fue en la mayoría de los casos.

Uno de nuestros protagonistas se da cuenta de que la presentación es importante, e intenta hacer algo distinto: cortar el cerdo en lonjas e intercalar verduras, con el fin de realzar el cerdo dado su contraste con los otros ingredientes.

La presentación es importante, pero la cocción fue la misma que para los demás: poner el cerdo en la parrilla, girarlo, y esperar. Munchi explotó de frustración porque se había hecho esperanzas al ver un plato diferente-

¡La apariencia es importante pero solamente si el sabor es bueno!

Los paralelos entre preparar comida y realizar un proyecto de Data Science son interesantes. El output final puede ser sencillo. No tiene por qué ser un modelo utilizando las últimas técnicas en estadística o en machine learning. Sin embargo, aprender cómo se llega a esa regresión, y como garantizamos que cada paso realizado fue estricto y correcto, es parte del proceso.

Cuando entregamos nuestros resultados debemos presentarlos de manera efectiva (que muestren datos que permitan responder una pregunta específica) y eficiente (que se pueda interpretar de manera directa, sin inducir a errores). Es lo que Tamara Munzner llama dos principios esenciales de la visualización de información.

Aunque nadie superó el reto de comida, existió otro desafío para pasar a la siguiente etapa. Esto también nos suceder en el camino: habrá proyectos en los cuales simplemente no lograremos un resultado exitoso. Como la solución no es conocida, no será algo fácil de identificar. Tendremos que aprender a reconocer esa situación y a buscar salidas alternativas.

Tercera Etapa: Verdadero Trabajo en Equipo #

La tercera etapa, hospedada por un cazador de personas en listas negras llamado Lippo, consiste en escapar de una prisión ubicada en lo alto de una montaña en un plazo de 72 horas. En el camino, les aspirantes se encontrarán con laberintos, peligros, y combates con prisioneros.

Trick Tower. Lugar donde se efectúa la tercera etapa del examen.

Los obstáculos siguen requiriendo fuerza mental y física para seguir, y nuestros protagonistas logran avanzar poco a poco. Sin embargo, en esta etapa se avanza en equipo, y el avance de todos depende de cada uno de los miembros — incluyendo personas que fueron incluidas a la fuerza en el grupo. Así, los errores (y también sabotajes) les cuestan tiempo: en una prueba de apuestas pierden 50 horas de recorrido, que deben dejar pasar confinados en una habitación.

Aquí Gon dice “no debemos pelear entre nosotros.” En la imagen falta Tonpa, el quinto miembro del equipo para esta fase, que busca sabotear el avance del equipo.

Al terminar el castigo, el equipo prosigue el camino. Llega a la última puerta del laberinto, que frece dos alternativas: una puerta por la que pueden pasar cinco personas, pero cuya trayectoria dura 30 horas, o una puerta por la que puede pasar solamente una, pero cuya trayectoria dura cinco minutos. Eso implicaba que realmente no había elección respecto a la puerta a utilizar. La elección sería quién iba a entrar en la puerta.

El equipo ya estaba tenso debido a los errores en las horas previas. La sala estaba contaba con un gran número de armas en las paredes, como si la única solución fuese combatir para ganar el derecho a ser el que pasara por la única puerta que servía en ese instante. En una situación así, aunque no todos quieran pelear, basta que uno o dos se vuelvan agresivos para que todos terminen peleando.

A veces las peleas son inevitables.

Tras los primeros golpes, en los que diferentes armas terminaron chocando contra las paredes, Gon observó que las paredes no eran tan duras como parecían, y tuvo una idea.

Así el equipo resolvió el problema:

No siempre podemos encontrar la solución óptima. Pero una cosa es segura: las soluciones que benefician más al grupo que a un individuo(a) específico son mejores que las demás. Identificarlas y llegar a ellas no es fácil.

Las discusiones y desacuerdos son necesarios. Deberemos aprender a lidiar con los desacuerdos y a ser empáticos(as), a intentar comprender por qué otras personas eligieron otras opciones. Trabajar en equipo no es solamente trabajar juntos, significa poner los intereses del equipo por sobre los propios.

Cuarta Etapa: Supervivencia #

Pasaron 25 personas a la cuarta etapa. Consistía en estar dos semanas en una isla deshabitada. Cada aspirante tenía un badge personal, y solamente pasaría a la siguiente etapa si, primero, se mantenía vivo al cabo de las dos semanas, si mantenía su propio badge, y si tenía el del oponente que le correspondía. No había más reglas que esas.

Había que cazar y no ser cazado.

¿Qué diferencia hay entre esta parte y las anteriores? Antes el problema era la incertidumbre. En esta ocasión, hay certeza en la duración de la etapa (dos semanas), el objetivo está definido (hay que quitarle el tag a un aspirante específico y mantener el tuyo), y el lugar es acotado (los límites de la isla). Lo que no sabemos es contra qué tendremos que luchar. Lo que no sabes es quién te cazará a ti, ni cómo lo planea hacer, y tampoco con quiénes puede aliarse. Esta etapa es de resiliencia — las circunstancias cambian constantemente durante las dos semanas, el ambiente es hostil, y hay que lograr adaptarse para seguir viviendo. Y, en caso de perder el tag, hay que buscar una manera de recuperarlo (si es que no te mataron al quitártelo).

Gon perdió su tag a manos de un enemigo, y se recluye dentro de un tronco para definir una estrategia (y lidiar con la frustración).

Un proyecto de Data Science no es tan distinto: son procesos iterativos llenos de amenazas que sabemos que están ahí, pero no sabemos si terminarán atacándonos. Podemos descubrir que los datos están sucios o incorrectos. Que elegimos incorrectamente un modelo (y no tener el conocimiento necesario para darse cuenta de ello). Hay presiones — en problemas aplicados hay un cliente esperando un resultado, que tiene deadlines estrictos. Tendremos que adecuarnos a esa presión, priorizando los aspectos del proyecto que se desarrollarán más que otros y que aportarán más valor al cliente. Hay cuestionamientos, o incluso, hay cambios de prioridades. Y, por momentos, sentiremos que perdimos el rumbo.

De nosotros depende resistir, adaptar, y continuar.

Quinta y Última Etapa: Estrategia #

Nueve aspirantes pasaron a la última etapa del examen, que es hospedada por Netero, el presidente de la Asociación.

Las reglas del torneo son las siguientes: 1) los perdedores siguen peleando, y los ganadores aprueban el examen, 2) quien mata a un oponente queda descalificado (dentro o fuera del área de combate).

Los combatientes tienen diversos niveles de poder y experiencia. Sin embargo, las peleas no siempre son ganadas por los más fuertes. En un combate la estrategia es crucial — gana quien logra hacer perder el control de la pelea al enemigo, y eso se logra imponiendo un estilo de juego, no necesariamente la fuerza.

Gon, por ejemplo, ganó gracias a su testarudez. Su primer enemigo, Hanzo, era tan fuerte y rápido que Gon no era una amenaza en el ring. No contaba con que Gon no se rendiría nunca — el sueño de ser cazador estaba por sobretodo dolor. Como no podía matarlo, Hanzo terminó desesperándose, y se rindió.

No siempre el pipeline que tiene los resultados más fuertes (por ejemplo, mayor precisión en clasificación) es el mejor. Un ejemplo concreto de esto son las cajas negras. Para apoyar la toma de decisiones, un algoritmo de deep learning puede tener precisión impresionante, pero es muy difícil entender por qué funciona. Y la cadena de decisiones incluye a más que Data Scientists. Puede incluir personas de profesiones ortogonales, que, a su vez, trabajan con políticos, comerciantes, abogados, ciudadanos, que deben entender por qué el algoritmo o el modelo toman las decisiones. Es más, lo que haces puede terminar afectando a las personas, y las personas tienen el derecho a saber por qué y cómo un algoritmo o pipeline tomó decisiones sobre ellas.

En nuestro instituto utilizamos algoritmos y modelos que llamamos “open box,” puesto que siempre elegimos técnicas que podamos visualizar y explicar a nuestras contrapartes. Nosotros queremos que lo que hagamos tenga impacto en la sociedad y para ello debemos colaborar con actores y entidades que no necesariamente aceptarían un modelo de caja negra porque sí. A veces no es necesario tener la mejor precisión, sino que basta con entender por qué, cuándo, y dónde funciona (o no) tu propuesta.

¡Ya tienes tu Licencia de Cazador(a)! #

Una vez que se han completado todas las etapas anteriores, quienes sobrevivieron y siguen en carrera han demostrado resistencia, capacidad de soportar la incertidumbre, observación, valoración de la diversidad, colaboración, resiliencia y estrategia. Y se recibe la licencia de cazador(a), o “el cartón.”

El examen de cazador sucede en ambientes controlados. En la vida post-examen las aventuras son más peligrosas y desafiantes.

El Verdadero Examen #

En Hunter aprendemos que el verdadero examen se lleva a cabo tiempo después, donde un(a) cazador(a) consagrada observa a cada aspirante y lo pone a prueba en el aprendizaje de NEN. En términos sencillos, es el uso del aura para distorsionar la realidad (recordemos que estamos hablando de una serie de animé), al controlar el flujo de aura dentro de su cuerpo o fuera de él.

Aunque en Data Science no podemos distorsionar la realidad, sí podemos tener impacto en ella a través de nuestros proyectos.

En muchas series de animé y manga existen técnicas sobrenaturales, sobretodo ligadas a las artes marciales y a lo divino. En Dragon Ball, por ejemplo, los personajes constantemente se vuelven más fuertes, pero últimamente gana quien logra acumular más poder, no quien lo utilizó mejor. En Hunter, el poder es una variable más de las que puede afectar el resultado de un combate. Como comentamos previamente, la victoria se obtiene en base a la estrategia, no al poder.

El sistema me parece atractivo puesto que tiene reglas interesantes. Una de ellas es que cada persona pertenece a una categoría de uso de NEN, que especifican cuál es el mejor uso que puede darle una persona a su aura. El pertenecer a una categoría no implica que no se puedan utilizar técnicas de las otras, pero hay afinidades. Por otro lado, se define que las habilidades provienen tanto de la naturaleza como del aprendizaje y del contexto en el que se crece.

Esas relación de afinidad / antagonismo están definidas en el siguiente gráfico:

El gráfico habla de como cada categoría trabaja con el aura. Se interpreta así: categorías adyacentes son compatibles. Mientras más lejos está una categoría de otra, más opuestas/antagonistas. Por ejemplo, una persona emisora puede ser completamente efectiva en técnicas de emisión, 70% en técnicas potenciadoras, 30% en técnicas transmutadoras, y prácticamente ineficiente en técnicas de conjuración.

Cuando vi este diagrama por primera vez sentí que debía escribir este post, porque vi enseguida un paralelo con Data Science en la categorización de roles y habilidades:

Potenciadores— quienes se especializan en un tipo de problema/área específica/técnica, y pueden ser muy eficientes, pero no tienen visión fuera de ella. Destacan escalando soluciones.
Manipuladores— quienes pueden entender partes específicas del proceso de Data Science desde múltiples perspectivas, y ajustar parámetros, hipótesis, inputs, outputs, etc., en función de avanzar hacia una solución. Destacan en la iteración y definición de problemas.
Transmutadores— quienes logran encontrar nuevas aplicaciones para viejas técnicas, o bien, aplicar técnicas de una disciplina/área en otra, y obtener resultados buenos e interpretables. Destacan en la solución de problemas nuevos o sin soluciones previas, o bien creando soluciones con impacto inesperado.
Emisores— quienes tienen facilidad para comunicarse con otras personas, sean del equipo, o bien de la contraparte. Destacan transfiriendo resultados, código, insights, y también analizando situaciones y problemas desde el punto de vista de la contraparte.
Conjuradores— quienes crean modelos y técnicas. Destacan avanzando el estado del arte en sus áreas de especialidad.
Especialistas— personas cuyas habilidades únicas o capacidades son tales que no caben en las categorías anteriores. Se puede ser especialista por alguna habilidad desarrollada o bien producto de la experiencia y trayectoria. Un(a) especialista no es una persona que domine todo lo anterior, sino más bien alguien con visión cuyas acciones tienen impacto de maneras que no se pueden clasificar en las categorías anteriores. Creo que son buenas personas para líderar equipos y elegir problemas.

A lo largo de mi vida he deambulado por diferentes categorías, buscando entender en cuál me desenvuelvo mejor. Trabajé como asistente de investigación en temas de Information Retrieval, como game designer en un proyecto de videojuegos educativos, como ingeniero de software en el desarrollo de un motor de realidad virtual, y como ingeniero de investigación analizando datos de transporte del Transantiago, entre otros. Después, mi doctorado fue sobre comportamiento humano en la Web y visualización de información. Soy una persona que se aburre de estar encasillada en un único espacio y siempre busco aprender cosas nuevas. Eso me ha entregado una batería de herramientas de distintas áreas y disciplinas que después utilizo en otros lugares. En ese aspecto, soy un transmutador. Y esa categoría principal la ha definido una mezcla de mi historia con mi forma de ser.

Estoy muy interesado en mejorar mis habilidades comunicacionales. Siempre he sido una persona introvertida en general, y en las conferencias o eventos me cuesta conocer gente. No suelo ser quien se acerca a otras personas a romper el hielo. Por eso, lo que hacen les emisores me cuesta muchísimo trabajo (en el diagrama, están prácticamente en posición opuesta).

Te sugiero hacer este ejercicio. Defínete y descubre a qué categorías perteneces. Piensa en las personas con las que trabajas o quisieras trabajar, y define sus categorías. ¿Estás (estarás) en un ambiente diverso en habilidades?

En Hunter el verdadero examen se aprueba cuando se logra utilizar NEN. Luego de eso se hace el test en el cual se conoce la categoría principal de una persona. En Data Science tal test no existe. Es algo que descubriremos con el tiempo a medida que desarrollamos habilidades y encontramos compañeres de aventuras.

Estrategia por sobre Poder #

Lograr utilizar NEN e identificar tu categoría no es el final. Cada persona debe definir su hatsu, es decir, las habilidades que desarrollará. Un potenciador define un hatsu que hace más fuerte algo — sus puños, por ejemplo. Una manipuladora puede tomar control de objetos o personas. En emisor puede lanzar su aura en forma de bola de energía.

Me gusta el hatsu de Hisoka (transmutador), Bungee Gum. Convierte su aura en un material que tiene las propiedades de la goma y del caucho. En síntesis, tiene la consistencia, flexibilidad, y viscosidad necesaria para la situación en la que se encuentre su usuario.

Hisoka convierte su aura en una especie de goma que, en este caso, le permitió evitar el impacto de unos proyectiles lanzados por un enemigo.

En un momento de mi carrera elegí utilizar Python 🐍 como herramienta principal. Es como Bungee Gum: es flexible y puede atacar problemas de todo tamaño, y adaptarse a un sinnúmero de situaciones. Existen otros hatsus que quizás se vean como más poderosos (como R en estadística) o eficientes (como C en desempeño), sin embargo, también requieren condiciones específicas y por tanto a veces son inaplicables.

Por cierto, no quiero iniciar un debate R vs Python 👊. No es fructífero. Simplemente elige la herramienta que más se acomode a tu situación y a quienes te rodean. En mi caso fue Python y por eso baso mis habilidades en él. Uno no hace un contrato con sangre con las herramientas, por ejemplo, hubo un tiempo en el que hice visualizaciones en Javascript. En HxH es interesante ver como los protagonistas van definiendo sus hatsu, ya que aprenden que toda decisión tiene consecuencias, y que no existe la técnica perfecta.

El Final del Camino es el Comienzo de Otro #

Cuando hayas llegado a este punto descubrirás que tienes habilidades y que eres capaz de pasar por todo el proceso de generar valor y resolver problemas utilizando datos y métodos transdisciplinares.

Pero no solamente es importante lograr recorrer ese camino y llegar a un punto de inflexión, o al inicio de un nuevo camino. Lo que importa es que, si partimos solos, lleguemos acompañados. En equipo llegarás más lejos de lo que puedes imaginar. De todas las actividades que he llevado a cabo, he aprendido más de las personas que me han acompañado que del uso de herramientas o disciplinas específicas.

Ahora bien, a diferencia de ser cazador, ¿quién te reconoce como Data Scientist?¿Una empresa o institución que te contrata como tal? Hablaré sobre ello en el siguiente post, donde veremos cómo adquirir y desarrollar las habilidades y actitudes que he mencionado hasta ahora. En la cuarta parte y final condensaré preguntas frecuentes que he recibido sobre Data Science.

Espero que hayas disfrutado este post tanto como yo disfruté escribiéndolo (y viendo Hunter). ¡Nos vemos pronto!