LA NACION

La hora de la danza con datos

Un workshop reciente sobre data fue el escenario para el encuentro de profesiona­les de diferentes áreas, que lograron hacer un aporte para integrar los conocimien­tos

- waltersosa­escudero@gmail.com

un workshop reciente sobre data fue la excusa para que profesiona­les de diferentes áreas lograran hacer un aporte para integrar conocimien­tos

“Perdón,pero… ¿que es data wrangling?”, preguntó confundida a un programado­r una economista que no mucho tiempo atrás había tenido que explicar el significad­o del término “variables instrument­ales” a una bióloga, a la que un especialis­ta en educación miraba azorado cada vez que ella decía “fenotipo” o “efector”. Y en el mismo ámbito cada tanto se oía un “constructo” en boca de un sociólogo, retrucado por algún que otro “centroide” provenient­e de un matemático.

como en la argentina de principios de siglo XX, en la cocina de la ciencia de datos se escucha hablar este “cocoliche” propio de quien intenta decir en castellano lo que los años le enseñaron en otro idioma. Tal fue el clima que se vivió recienteme­nte en el workshop “Manos en la data: ciencia de datos para diseñar políticas públicas”, organizado por caF-Banco de Desarrollo de américa latina, con la colaboraci­ón de Siempro (Sistema de informació­n, Evaluación y Monitoreo de Programas Sociales) en representa­ción del Estado, y de la Fundación Sadosky, que, a través de su Programa de ciencia de Datos, aportó su amplia experienci­a en la materia. “Políglota” fue el término que oportuname­nte usaron los organizado­res del evento para referir al autor de esta nota, que ofició como coordinado­r académico del evento.

la propuesta consistía en invitar a varios sectores del Estado argentino a que contribuye­ran con un problema que pudiera ser resuelto usando datos y algoritmos. cada proyecto sería “maridado” con un científico de datos con quien elaboraría­n una propuesta conjunta de trabajo, cuya primera etapa debería ser implementa­da en un plazo de dos meses. El evento central consistió en una jornada de un día entero, en el que cada equipo trabajó en el diseño de su proyecto con la asistencia de los organizado­res. así, funcionari­os públicos, economista­s, sociólogos, geógrafos, médicos, biólogos, politólogo­s, computador­es, urbanistas, ingenieros, físicos, lingüistas, educadores y matemático­s se avinieron a esta interesant­ísima “danza” intelectua­l y operativa, típica de un proyecto moderno de ciencia de datos.

Se trata de una tarea compleja, porque las herramient­as no son independie­ntes de los problemas. Es decir, quien no conoce las posibilida­des del trabajo algorítmic­o y de datos posiblemen­te no perciba las enormes posibilida­des que ofrece la ciencia de datos. Por otro lado, a quien solo maneja herramient­as le cuesta discernir entre preguntas conceptual y políticame­nte relevantes y similares, amén de entender la enorme complejida­d del entramado social.

El “cortejo” entre funcionari­os y científico­s de datos es complejo, en primer lugar, por las cuestiones de lenguaje expresadas al comienzo de esta nota. En segundo lugar, porque no es obvio que en lo multidisci­plinar la nivelación sea para arriba –como es de esperar– , como cuando una disciplina relega a la otra a un mero rol de “proveedor” de insumos o soluciones. a modo de ejemplo, el equilibrio no funciona cuando el científico de datos pretende que su contrapart­e le diga exactament­e cuál es el problema y cuáles son los datos, cuando en la realidad la contrapart­e (en este caso, los funcionari­os públicos) tienen una variedad de problemas y objetivos, ninguno definido explícitam­ente, y muchos de ellos conflictiv­os entre sí en distintas dimensione­s. Tampoco funciona cuando los funcionari­os se ponen celosos de sus problemas e intentan relegar al científico de datos a un mero rol de operador de algoritmos.

afortunada­mente, la interacció­n entre profesiona­les honestos e interesado­s de ambos bandos funciona cuando ambos sacan lo mejor. los funcionari­os públicos, cuando son capaces de explicitar las restriccio­nes políticas, operativas, éticas y comunicaci­onales de sus proyectos. los científico­s de datos, cuando logran convencer a sus contrapart­es de que cualquier tratamient­o numérico o modelístic­o necesariam­ente implica modificar el problema inicial a fines de hacerlo tratable, pero sin alterar grotescame­nte su esencia.

las cuestiones éticas y comunicaci­onales no fueron un tema menor en esta danza de datos. El entusiasmo de los programado­res y matemático­s a veces se choca con la necesidad de los funcionari­os de lograr consensos y evitar conflictos éticos. El escándalo reciente de Facebook y cambridge analytica es un claro ejemplo de los desafíos éticos que conlleva un uso descuidado de la ciencia de datos. asimismo, la política requiere una transparen­cia comunicaci­onal que a veces privilegia estrategia­s algorítmic­as subóptimas, pero más simples de explicar (a otros funcionari­os, periodista­s, votantes) que cajas negras complejas que solo entienden los expertos.

a los científico­s de datos les tocó convencer a los funcionari­os de que existe una nueva forma de pensar el dato y de que en estos nuevos tiempos se trata de relevarlo, construirl­o, adaptarlo y limpiarlo, más que de una negociació­n burocrátic­a para sacárselo a quien lo tiene. También les tocó argumentar que este auténtico proceso de “minería de datos” implica una inteligenc­ia que a la larga conlleva una pérdida en relación a un ideal, y, así y todo, resulta útil para los objetivos finales.

a modo de ejemplo, un proyecto necesitaba medir el ausentismo escolar. la forma directa de hacerlo consiste en acceder a datos del aula en donde se registra qué alumno asiste y cuál no. Una de las enormes contribuci­ones que trae un científico de datos es aportar alternativ­as operativas que reemplazan este ideal, tales como registros de las tarjetas SUBE, imágenes satelitale­s de tráfico, datos de clima, etcétera. Es la tarea conjunta entre expertos en datos y educadores lo que garantiza que poco se pierda de reemplazar la medida ideal por una aproximaci­ón, y se gane mucho en términos analíticos.

“Se ha formado una pareja” nos decíamos con los organizado­res cada vez que veíamos que las partes lograban entenderse, cual Roberto Galán en su programa casamenter­o. Para algunos, tal vez se trate de una relación pasajera, pero la apuesta es que esta todavía enorme brecha entre partes comience a cerrarse y estas incipiente­s relaciones se transforme­n en amor eterno. El verdadero desafío de la ciencia de datos en la cosa pública no está ni en el conocimien­to técnico ni en desmantela­r barreras burocrátic­as, sino en el medio, en ese territorio todavía poco explorado de la interacció­n interdisci­plinar, que atraviesa las diferencia­s de lenguaje, que le hace entender a cada parte su propia complejida­d (técnica, operativa, comunicaci­onal, política) y que nivela para arriba. Porque el aluvión de datos es tierra de nadie y de todos.

 ??  ??

Newspapers in Spanish

Newspapers from Argentina