Parte II Y todo esto, ¿para qué?
Se tiende a decir que la información es poder, sin embargo cuando rebasa cierto tamaño deja de ser útil pues su examen a detalle resulta imposible con los mecanismos convencionales. Así, los millones de datos que cada día acumulamos se vuelven información que tarde o temprano podría terminar en la papelera de reciclaje. Puede que haya algo valioso en ellos –después de todo se forman a partir de los millones de datos por la navegación en Internet, el uso de aplicaciones, los clics de las personas y su localización, sus gustos de consumo y sus opiniones–, pero sin métodos de análisis apropiados no sirven de nada. Quizá una forma de aprovecharlos sería distinguir entre lo que es realmente basura y lo que podría ser útil. Para ello, un nuevo campo de conocimiento ha emergido y desde hace algunos años se posiciona como un aliado imprescindible de áreas de lo más diversas: hablamos de la minería de datos o Big Data, como se denomina a los inmensos volúmenes de datos.
Los primeros en hacer frente a los Big Data fueron los grupos de investigación de iniciativas como el famoso Proyecto Genoma Humano –que reveló la secuencia de pares de bases químicas que componen el ADN– y el Sloan Digital Sky Survey o SDSS –cuyo objetivo es cartografiar el cielo visible–. Mientras en el primero los genetistas tuvieron que ingeniárselas para descodificar los alrededor de 20,000 a 25,000 genes que componen nuestro genoma, los expertos involucrados en el SDSS quedaron boquiabiertos cuando, apenas unas semanas después de haber iniciado las observaciones con su telescopio instalado en Nuevo México, habían recopilado más información de la generada en toda la historia de la astronomía (sus datos llegarían a alcanzar más de 140 terabytes). Desde entonces diversas tecnologías de procesamiento de grandes bases de datos han surgido, ampliando el uso de los Big Data a un sinnúmero de áreas y negocios. No obstante, como advierte Viktor MayerSchönberger, uno de los primeros en estudiar este fenómeno en su libro Big Data. La revolución de los datos masivos, “esta vez la revolución no se cifra en las máquinas que calculan datos, sino en los datos mismos y en cómo los usamos”.
Números espía
Aun antes de que se acuñara el término Big Data, empresas como Walmart, la mayor cadena de minoristas del mundo, ya se habían dado cuenta de la importancia de los datos masivos y de la ‘datificación’ de todo. Desde hace más de 25 años implementó en cada producto un código que le permite rastrearlo desde su línea de proveedores. Si bien este método le sirve para ahorrar dinero en el almacenaje, viene con un extra: incluye información sobre el tipo de producto, su proveedor, fecha de empaque, fecha de venta, lugar, hora, junto a qué productos se vendió, cuánto gastó