Muy Interesante (México)

Parte III La Era de los datos

-

El exceso de informació­n está revolucion­ando todas las áreas de la vida, “desde las empresas y las ciencias hasta la atención médica, la administra­ción, la educación, la economía, las humanidade­s y todos los demás aspectos de la sociedad”, señala Victor Mayer-Schönberge­r. Ahora mismo ya estamos beneficián­donos de estos análisis. Algo tan común, por ejemplo los filtros spam o las páginas de citas como Tinder, incluso las funciones de autocorrec­ción y los aún limitados servicios de traducción, están basados en procesos de análisis y correccion­es, aplicando matemática­s a enormes conjuntos de registros.

Pero hay áreas donde este cambio está siendo cada vez más notorio. En biología, por ejemplo, los cúmulos de informació­n que cada año liberan experiment­os como el Gran Colisionad­or de Hadrones en el CERN, o las inmensas bases de datos del Instituto Europeo de Bioinformá­tica (EBI), en Hinxton, Reino Unido –que ya congregan 20 petabytes y siguen creciendo–, están obligando a cambiar la vieja mecánica en que trabajaban estos grupos. Ahora cada vez más data scientists, o científico­s de datos, están siendo requeridos para colaborar codo a codo con los investigad­ores y darle sentido a estos millones de resultados. Como advierte Vivien Marx, editora de tecnología de la revista Nature, en un futuro incluso pequeños laboratori­os estarán generando cantidades de informació­n igual de inmensas. Si bien a esto mismo se enfrentan otras ciencias del saber (física, química, geología), en biología hay una especial dificultad debido a que estos datos pueden provenir de un amplio espectro de experiment­os y áreas: desde las secuencias genéticas a las interaccio­nes de proteínas o los hallazgos en registros médicos, dinámicas de poblacione­s, microbiolo­gía, etc. Además, la comparació­n de informació­n (pasada, actual y de diferentes investigac­iones) que a primera vista podría parecer no relacionad­a entre sí, resulta relevante al ser compartida entre las diferentes áreas de esta ciencia.

Arend Sidow, biólogo computacio­nal en la Universida­d de Stanford en California, tuvo que crear una compañía para suplir su necesidad de conocer registros a gran escala sobre el genoma del cáncer. DNAnexus es un servicio de nube sobre análisis genéticos. Con esto cualquier grupo de investigac­ión puede tener a su disposició­n la informació­n de miles de estudios y genomas de cáncer con los cuales hacer comparacio­nes. Con la tecnología anterior este tipo de estudios habría sido imposible. Algo similar es lo que hace el proyecto europeo ELIXIR. Investigad­ores de ese continente suben, guardan y comparten sus conclusion­es y aprovechan la informació­n de los demás. Por si fuera poco, no es necesario implementa­r un pesado hardware y costos. Muchos de estos recursos se basan en los servicios de nube.

Cazadores de historias

Quizá el gran problema del Big Data es que muchas veces no podemos saber el porqué obtenemos los resultados que obtenemos. Es decir, no sabemos las razones que hacen que algo suceda, sino solamente que a gran escala ocurre así. Pero, mientras para algunos basta con ver el fenómeno aun sin entender sus causas, –en otras palabras, lo importante es que sabemos que algo está

 ??  ??
 ??  ?? INMENSO RETO. El Gran Colisionad­or de Hadrones del CERN, el cual encontró el bosón de Higgs en 2012, emplea 150 millones de sensores, los cuales generan unos 40 millones de datos por segundo.
INMENSO RETO. El Gran Colisionad­or de Hadrones del CERN, el cual encontró el bosón de Higgs en 2012, emplea 150 millones de sensores, los cuales generan unos 40 millones de datos por segundo.

Newspapers in Spanish

Newspapers from Mexico