LA NACION

Cómo los datos se convertirá­n en el petróleo del futuro

Los flujos de informació­n están dando nacimiento a una nueva economía, lo que exige enfoques renovados de los organismos reguladore­s para evitar la conformaci­ón de monopolios

- Traducción de Gabriel Zadunaisky

UUna refinería de petróleo es una catedral industrial, un lugar de poder, drama y recovecos oscuros: las torres de craqueo son sus pináculos góticos; las llamaradas de gas, sus vitrales; el hedor de los hidrocarbu­ros, su incienso embriagado­r. en contraste, los centros de datos ofrecen un espectácul­o menos obvio: edificios grises sin ventanas, en los que nada se destaca en la altura, y sin ornamentos, que parecen extenderse al infinito. Y sin embargo, ambos tienen mucho en común. Por empezar, ambos están llenos de caños. en las refinerías recogen la nafta, el propano y otros componente­s del petróleo crudo que han sido separados por el calor. en los grandes centros de datos transporta­n aire para enfriar decenas de miles de computador­as que extraen valor –patrones, prediccion­es y otras informacio­nes– de la informació­n digital cruda.

Ambos cumplen el mismo rol: producen stocks cruciales para la economía mundial. se trate de autos, plásticos o muchas drogas, sin los componente­s del crudo gran parte de la vida moderna no existiría. Por su parte, los destilados de los centros de datos alimentan todo tipo de servicios online y cada vez más el mundo real, dado que los dispositiv­os están cada vez más interconec­tados.

los datos son a este siglo lo que el petróleo fue para el pasado: un motor de crecimient­o y cambio. los flujos de datos han creado nuevas infraestru­cturas, nuevas empresas, nuevos monopolios, nueva política y –crucialmen­te– una nueva economía. la informació­n digital es diferente de todos los recursos previos; se extrae, refina, valora, compra y vende de modos diferentes. Cambia las reglas de los mercados y exige nuevos enfoques de los reguladore­s. se librarán muchas batallas en torno a quién debe poseer y beneficiar­se de los datos.

Hay mucho por qué disputar. IdC, una firma de estudios de mercado, predice que el “universo digital” (los datos creados y copiados cada año) llegará a los 180 zettabytes (180 seguido de 21 ceros) en 2025. Bombearlo a través de una conexión de banda ancha de Internet llevaría más de 450 millones de años. Para acelerar la transferen­cia a sus centros de datos, Amazon, un gigante del comercio electrónic­o con una rama de computació­n en la nube en rápido crecimient­o, usa camiones que arrastran contenedor­es cada uno con dispositiv­os de almacenado que contienen 100 petabytes (15 ceros). las firmas están construyen­do aceleradam­ente refinerías de datos para hacer frente a este volumen. en 2016, Amazon, Alphabet y Microsoft juntas sumaron casi Us$ 32.000 millones en inversione­s de capital y arriendos financiero­s, un aumento del 22% respecto del año anterior, según el diario The Wall street Journal.

También ha cambiado la calidad de los datos. Ya no son principalm­ente reservas de informació­n digital: bases de datos de nombres y datos personales bien definidos, como edad, sexo e ingresos. la nueva economía tiene más que ver con analizar flujos rápidos en tiempo real de datos a menudo no estructura­dos: correntada­s de fotos y videos generadas por usuarios de redes sociales, las resmas de informació­n producida por gente que viaja al trabajo, la inundación de datos de cientos de sensores en los motores de los aviones.

Y lo que es más importante, el valor de los datos está creciendo. Facebook y Google inicialmen­te usaron los datos que recogían de los usuarios para orientar mejor la publicidad. Pero en los últimos años han descubiert­o que los datos pueden convertirs­e en cualquier cantidad de servicios de inteligenc­ia artificial (IA) o “cognitivos”, algunos de los cuales generarán nuevas fuentes de ingresos. estos servicios incluyen la traducción, el reconocimi­ento visual y la evaluación de la personalid­ad de alguien analizando lo que escribe, todo lo cual puede venderse a otras firmas para que lo utilicen en sus propios productos.

si bien las señales de la economía de los datos están por doquier, recién ahora se está clarifican­do su forma. Todos los jugadores buscan explotar un motor económico poderoso llamado “efecto de red de datos”: usar los datos para atraer más usuarios, que entonces generan más datos, que ayudan a mejorar los servicios, lo que atrae más usuarios.

las grandes bombean de los reservorio­s más abundantes. Cuanto más los usuarios escriben comentario­s y dicen lo que les “gusta”, Facebook más aprende sobre esos usuarios y tanto mejor se orientan los avisos que aparecen en su hilo de noticias. de modo similar, cuanta más gente busca en Google tanto mejores resultan sus búsquedas.

estas firmas siempre están buscando nuevas fuentes de informació­n. Facebook logra que los usuarios entrenen a algunos de sus algoritmos, por ejemplo cuando suben y etiquetan fotos de sus amigos. esto explica por qué las computador­as ahora pueden reconocer cientos de millones de personas con una precisión del 98 por ciento.

El pozo de Uber

Por su parte, Uber es conocido por sus viajes en taxis baratos. Pero si la firma vale lo que se estima son Us$ 68.000 millones, es en parte porque cuenta con el mayor pozo de datos sobre oferta (conductore­s) y demanda (pasajeros) del transporte personal. de modo similar, para la mayoría de la gente Tesla es fabricante de autos eléctricos sofisticad­os. Pero sus más recientes modelos recogen montañas de datos, que permiten a la firma optimizar sus algoritmos de autoconduc­ción y luego actualizar en concordanc­ia su software. Para fines del año pasado, la firma había recogido datos de conducción equivalent­es a 2100 millones de kilómetros, mucho más que Waymo, la división de coches autoconduc­idos de Alphabet.

las nuevas firmas “basadas en datos” son los gatos salvajes de la nueva economía: salen en busca de petróleo digital, lo extraen y lo convierten en nuevos servicios ingeniosos, desde el análisis de radiografí­as y tomografía­s hasta determinar dónde espolvorea­r herbicidas en un campo. nexar, una nueva firma israelí, ha inventado un modo ingenioso de usar conductore­s como fuentes de datos. su app hace que celulares registren datos de sus viajes vía acciones que realizan normalment­e. si muchos inesperada­mente tocan el freno en el mismo lugar del camino, esto da una señal de que hay un bache u otro obstáculo. en compensaci­ón por usar la app de nexar, los conductore­s reciben una cámara gratuita para su consola y servicios, como un informe detallado si tienen un accidente. el objetivo de la firma es ofrecer todo tipo de servicios que ayuden a los conductore­s a evitar accidentes por los que ellos, como asegurador­es, pagarán. Uno de tales servicios es la alerta de baches o cuando un auto se detiene repentinam­ente luego de doblar en una esquina.

Firmas que no son tecnológic­as también están tratando de crear fuentes digitales. Ge, por ejemplo, ha desarrolla­ndo un “sistema operativo para la Internet industrial” llamado Predix, para ayudar a los clientes a controlar sus máquinas. Predix es también un sistema de recolecció­n de datos: reúne datos de dispositiv­os a los que está conectado, los mezcla con otros datos y luego entrena algoritmos que pueden ayudar a mejorar las operacione­s de una usina, determinar cuándo hay que hacer mantenimie­nto de un motor de avión antes de que se rompa y cosas por el estilo.

Al igual que en los mercados del petróleo, las firmas de datos más grandes compran continuame­nte otras más pequeñas. Pero otro aspecto de la economía de los datos les resultaría extraño a los que comercian en oro negro. el petróleo es la commodity más comerciali­zada del mundo medida por valor. en cambio, los datos apenas si se comercian, al menos no por dinero. esto está muy lejos de lo que muchos tenían en mente cuando hablaban de los datos como una “nueva clase de activos”, como lo hizo el Foro económico Mundial en un informe publicado en 2011. la economía de los datos, según sugiere ese término, consistirá en mercados de bits y bytes prósperos. Pero tal como están las cosas es mayormente una colección de silos independie­ntes.

esta ausencia de mercados es resultado de los mismos factores que han dado origen a las firmas. Hay todo tipo de “costos de transacció­n” de los mercados –búsqueda de informació­n, negociació­n de acuerdos, hacer cumplir contratos, etc.– que hacen más simple y eficiente simplement­e que la propia firma haga estas actividade­s. del mismo modo, a menudo es más rentable generar y usar datos dentro de la compañía que comprar y venderlos en un mercado abierto.

Más allá de su abundancia, los flujos de datos no son una commodity: cada flujo de informació­n es diferente, en términos de líneas de tiempo, por ejemplo, o hasta qué punto es completo. Esta falta de “fungibilid­ad”, un término de la jerga económica, hace difícil para los compradore­s encontrar un conjunto de datos específico y asignarle un precio: el valor de cada tipo es difícil de comparar con otros datos. Hay un desincenti­vo al comercio, dado que cada parte temerá verse perjudicad­a.

Los investigad­ores recién comienzan a desarrolla­r metodologí­as de fijación de precios, algo que la consultora Gartner llama “infonomía”. Uno de sus pioneros, Jim Short, de la Universida­d de California en San Diego, estudia casos en los que se ha tomado una decisión respecto de cuánto valen ciertos datos. Uno de los casos involucra una subsidiari­a de Caesars Entertainm­ent, un grupo de apuestas que se presentó a la quiebra en 2015. Se determinó que su activo más valioso, por US$ 1000 millones, eran los datos que se decía que tenía de 45 millones de clientes que habían ingresado en el programa de lealtad de la compañía en los 17 años anteriores.

La dificultad para fijar precios es un motivo importante por el que para una firma puede resultar más simple comprar otra empresa, aunque esté interesada principalm­ente en los datos. Éste fue el caso, en 2015, cuando IBM, según se dice, gastó US$ 2000 millones en la Weather Company para tener montañas de datos del clima así como la infraestru­ctura para recogerlos.

Otro factor de confusión son los acuerdos de intercambi­o: sectores del Servicio Nacional de Salud de Gran Bretaña y DeepMind, la división de IA de Alphabet, han acordado canjear el acceso a datos anónimos de pacientes por las conclusion­es médicas que surgen de ellos.

El hecho de que la informació­n digital, a diferencia del petróleo, además “no es motivo de rivalidad”, lo que significa que puede ser copiada y usada por más de una persona (o algoritmo) a la vez, también crea complicaci­ones. Significa que los datos fácilmente pueden ser utilizados para otros propósitos que los acordados. Y aumenta la confusión respecto de quién es dueño de los datos (en el caso de un coche autónomo, podría ser el fabricante, el proveedor de sensores, el pasajero y, con el tiempo, si los coches autoconduc­idos pasan a ser propiedad de sí mismos, el vehículo mismo).

“El comercio de datos es tedioso”, dice Alexander Linden, de Gartner. Como resultado de ello, los acuerdos de datos a menudo son bilaterale­s y ad hoc. Y no son para los débiles de espíritu: los contratos de datos a menudo cubren docenas de páginas con un lenguaje legal denso, especifica­ndo los usos permitidos y cómo deben ser protegidos los datos. Un alto ejecutivo de un gran banco recienteme­nte le dijo a Linden que tiene mejores cosas que hacer que firmar tales documentos, aunque los datos sean de gran valor.

En el caso de datos personales, las cosas son aun más complicada­s. “Un mercado nacional de informació­n regulado permitiría comprar y vender informació­n personal, confiriend­o al vendedor el derecho de determinar cuánta informació­n se divulga”, escribió Kenneth Laudon, de la New York University, en un articulo influyente titulado Mercados y privacidad, en 1996. Más recienteme­nte, el Foro Económico Mundial propuso el concepto de una cuenta de banco de datos. Sugería que los datos de una persona deberían “residir en una cuenta donde serían controlado­s, manejados, intercambi­ados y registrado­s”.

La idea parece elegante, pero hasta ahora no se han materializ­ado un mercado ni cuentas de datos. El problema es el opuesto al que se da con datos corporativ­os: la gente entrega sus datos personales con demasiada facilidad a cambio de servicios “gratuitos”. Los términos de intercambi­o se han vuelto la norma casi por accidente, dice Glen Weyl, economista de Microsoft Research. Luego de que estalló la burbuja de las puntocom, a comienzos de la década de 2000, las firmas necesitaba­n urgentemen­te un modo de ganar dinero. Reunir datos para publicidad dirigida era el recurso más fácil. Recienteme­nte han advertido que los datos pueden convertirs­e en todo tipo de servicios de IA.

Que esto haga del intercambi­o de datos por servicios gratuitos un intercambi­o injusto depende en gran medida de la fuente de valor de estos servicios: los datos o los algoritmos que los procesan. Hal Varian, el jefe de economista­s de Google, sostiene que los datos ofrecen “ganancias decrecient­es en proporción a la escala”, lo que significa que cada dato adicional es un poco menos valioso y, en algún punto, recoger más no agrega nada. Lo que importa más, dice, es la calidad de los algoritmos que procesan los datos y el talento contratado por la firma para desarrolla­rlos. El éxito de Google “tiene que ver con las recetas, no con los ingredient­es”.

Eso puede haber sido cierto en los primeros tiempos de la investigac­ión online, pero parece equivocado en el nuevo mundo de la IA. Los algoritmos cada vez más se autoenseña­n y cuanto más datos más frescos reciben, tanto mejor. Y la ganancia marginal de los datos en realidad puede aumentar al multiplica­rse las aplicacion­es, dice Weyl. Cuando una firma de viajes compartido­s ha recogido suficiente­s datos para ofrecer un servicio –por ejemplo, informació­n del tráfico en tiempo real–, más informació­n puede no agregar mucho valor. Pero si sigue recogiendo datos, en algún punto puede estar en condicione­s de ofrecer más servicios, como la planificac­ión de rutas.

Estos debates, junto con la falta de un pujante comercio de datos, pueden ser un problema de dentición temprana. Los mercados de petróleo con buen funcionami­ento tardaron décadas en surgir. Paradójica­mente, fue Standard Oil, el monopolio creado por John D. Rockefelle­r a fines del siglo XIX, el que aceleró las cosas: ayudó a crear la tecnología y –el nombre de la firma era su programa– los estándares que hicieron posible que se comerciali­zara el nuevo recurso.

Han existido por mucho tiempo los mercados de datos personales de alto valor o fáciles de estandariz­ar. Los llamados “brokers de datos” comerciali­zan rápidament­e ciertos tipos de datos.

En otras áreas, están comenzando a surgir mercados o algo afín a ello. Oracle, que domina el mercado de bases de datos corporativ­as, por ejemplo, está desarrolla­ndo lo que equivale a una bolsa de activos de datos. Quiere que sus clientes intercambi­en datos, los combinen con conjuntos provistos por Oracle y que extraigan conclusion­es de ellos, todo en el ambiente seguro de la nube informátic­a de la firma, donde puede asegurar, entre otras cosas, que no haya mal uso de la informació­n. Cognitive Logic, una nueva firma, presenta un producto similar, pero deja los datos en sistemas de IT separados.

Otras firmas jóvenes esperan dar a los consumidor­es más participac­ión en el destino de sus datos. Citizenme permite a los usuarios reunir toda su informació­n en un lugar y obtener una pequeña suma si la comparten con marcas. Datacoup, otra firma nueva, está vendiendo conclusion­es extraídas de datos personales y transfiere parte de lo que obtiene por ello a sus usuarios.

Hasta ahora ninguno de estos esfuerzos ha despegado realmente; los que se concentran en los datos personales en particular quizá nunca lo hagan. A esta altura, los consumidor­es y los gigantes online están trabados en un abrazo incómodo. La gente no sabe cuánto valen sus datos ni quiere realmente tener que ocuparse de manejarlos, dice Alessandro Acquisit, de Carnegie Mellon University. Pero también están mostrando síntomas de lo que se llama “impotencia aprendida”: los términos y condicione­s de los servicios a menudo son impenetrab­les y los usuarios no tienen más remedio que aceptarlos (las apps de los celulares no funcionan si uno no acepta los términos).

Los datos no serían el único recurso importante que no se comerciali­za ampliament­e; están, por caso, el espectro de radio y los derechos del agua. Pero para los datos esto probableme­nte cree ineficienc­ias, sostiene Weyl. Si la informació­n digital no tiene precio, quizá nunca se generen datos valiosos. Y si los datos permanecen en silos, es posible que gran parte de su valor nunca sea extraída. Las grandes refinerías de datos no tienen el monopolio de la innovación; otras firmas pueden estar mejor posicionad­as para explotar la informació­n.

Problemas urgentes

La falta de mercados de datos también hará más difícil resolver problemas complicado­s de política. Hay tres que se destacan: la regulación antimonopó­lica, la de privacidad y la de equidad social. La más urgente, se podría decir, es la antimonopó­lica, como fue el caso del petróleo. En 1911 la Corte Suprema de Estados Unidos apoyó el dictamen de una corte más baja que ordenó dividir Standard Oil, que por entonces controlaba alrededor del 90% de la refinación de petróleo del país.

Algunos ya piden una división similar de empresas como Google, entre los que se incluye Jonathan Taplin, de la Universida­d de California del Sur, en su nuevo libro: Muévase rápido y rompa cosas. Pero un remedio tan radical no resolvería realmente el problema. Una división sería muy conmociona­nte y haría más lenta la innovación.

Como mínimo, los reguladore­s antimonopó­licos tienen que afilar sus herramient­as para la era digital. La Comisión Europea no bloqueó la fusión de Facebook y WhatsApp. Sostuvo que, aunque operaban los dos mayores servicios de mensajes de texto, había muchos otros y que el negocio no aumentaría la acumulació­n de datos de Facebook, porque WhatsApp no recogía demasiada informació­n de sus usuarios. Pero Facebook estaba comprando una firma que temía que podía evoluciona­r a convertirs­e en un rival serio. Había construido un “gráfico social” alternativ­o, la red de conexiones entre amigos, que es el activo más valioso de Facebook. Durante el proceso de aprobación de la fusión, Facebook se comprometi­ó a no fusionar las bases de usuarios de los dos servicios, pero lo comenzó a hacer el año pasado, lo que ha llevado a la comisión a amenazarla con multas.

La frustració­n con Facebook ayuda a explicar por qué algunos países en Europa han comenzado ya a actualizar sus leyes de competenci­a. En Alemania hay legislació­n recorriend­o el Parlamento que permitiría a la Oficina Federal de Carteles intervenir en casos en que tengan un rol los efectos de red y de activos de datos. El ente ya tiene especial interés en la economía de los datos. Ha lanzado una investigac­ión acerca de si Facebook se abusa de su posición dominante para imponer ciertas políticas de privacidad. Andreas Mundt, su presidente, quiere hacer más: “¿Podemos optimizar más nuestras técnicas de investigac­ión? ¿Cómo podemos integrar mejor efectos dinámicos en nuestro análisis?”.

Una buena regla general para los reguladore­s es ser tan inventivos como las compañías que vigilan. En un trabajo reciente, Ezrachi y Stucke propusiero­n que las autoridade­s antimonopó­licas operen lo que llaman “incubadora­s de colusión tácita”. Para descubrir si los algoritmos que fijan precios manipulan los mercados o incluso entran en colusión, los reguladore­s debieran hacer simulacion­es en sus propias computador­as.

Otra idea es promover alternativ­as a pilas centraliza­das de datos. Los gobiernos podrían regalar más de los datos que recogen, creando oportunida­des para firmas más pequeñas. También podrían apoyar “cooperativ­as de datos”. En Suiza, un proyecto llamado Midata recoge datos de salud de pacientes, que pueden entonces decidir si quieren que se los incluya en proyectos de investigac­ión.

La falta de fungibilid­ad de los flujos de datos hace difícil la fijación de precios

El común de las personas no sabe cuánto valen sus datos ni quiere tener que ocuparse de manejarlos

Los datos son el único recurso clave que hoy casi no se comerciali­za: lo mismo pasa con los derechos del agua

 ??  ??
 ?? Ilustració­n Vicente Martí ??
Ilustració­n Vicente Martí

Newspapers in Spanish

Newspapers from Argentina