Cómo los datos se convertirán en el petróleo del futuro

Los flujos de información están dando nacimiento a una nueva economía, lo que exige enfoques renovados de los organismos reguladores para evitar la conformación de monopolios

2017-05-08 - Traducción de Gabriel Zadunaisky

UUna refinería de petróleo es una catedral industrial, un lugar de poder, drama y recovecos oscuros: las torres de craqueo son sus pináculos góticos; las llamaradas de gas, sus vitrales; el hedor de los hidrocarburos, su incienso embriagador. en contraste, los centros de datos ofrecen un espectáculo menos obvio: edificios grises sin ventanas, en los que nada se destaca en la altura, y sin ornamentos, que parecen extenderse al infinito. Y sin embargo, ambos tienen mucho en común. Por empezar, ambos están llenos de caños. en las refinerías recogen la nafta, el propano y otros componentes del petróleo crudo que han sido separados por el calor. en los grandes centros de datos transportan aire para enfriar decenas de miles de computadoras que extraen valor –patrones, predicciones y otras informaciones– de la información digital cruda.

Ambos cumplen el mismo rol: producen stocks cruciales para la economía mundial. se trate de autos, plásticos o muchas drogas, sin los componentes del crudo gran parte de la vida moderna no existiría. Por su parte, los destilados de los centros de datos alimentan todo tipo de servicios online y cada vez más el mundo real, dado que los dispositivos están cada vez más interconectados.

los datos son a este siglo lo que el petróleo fue para el pasado: un motor de crecimiento y cambio. los flujos de datos han creado nuevas infraestructuras, nuevas empresas, nuevos monopolios, nueva política y –crucialmente– una nueva economía. la información digital es diferente de todos los recursos previos; se extrae, refina, valora, compra y vende de modos diferentes. Cambia las reglas de los mercados y exige nuevos enfoques de los reguladores. se librarán muchas batallas en torno a quién debe poseer y beneficiarse de los datos.

Hay mucho por qué disputar. IdC, una firma de estudios de mercado, predice que el “universo digital” (los datos creados y copiados cada año) llegará a los 180 zettabytes (180 seguido de 21 ceros) en 2025. Bombearlo a través de una conexión de banda ancha de Internet llevaría más de 450 millones de años. Para acelerar la transferencia a sus centros de datos, Amazon, un gigante del comercio electrónico con una rama de computación en la nube en rápido crecimiento, usa camiones que arrastran contenedores cada uno con dispositivos de almacenado que contienen 100 petabytes (15 ceros). las firmas están construyendo aceleradamente refinerías de datos para hacer frente a este volumen. en 2016, Amazon, Alphabet y Microsoft juntas sumaron casi Us$ 32.000 millones en inversiones de capital y arriendos financieros, un aumento del 22% respecto del año anterior, según el diario The Wall street Journal.

También ha cambiado la calidad de los datos. Ya no son principalmente reservas de información digital: bases de datos de nombres y datos personales bien definidos, como edad, sexo e ingresos. la nueva economía tiene más que ver con analizar flujos rápidos en tiempo real de datos a menudo no estructurados: correntadas de fotos y videos generadas por usuarios de redes sociales, las resmas de información producida por gente que viaja al trabajo, la inundación de datos de cientos de sensores en los motores de los aviones.

Y lo que es más importante, el valor de los datos está creciendo. Facebook y Google inicialmente usaron los datos que recogían de los usuarios para orientar mejor la publicidad. Pero en los últimos años han descubierto que los datos pueden convertirse en cualquier cantidad de servicios de inteligencia artificial (IA) o “cognitivos”, algunos de los cuales generarán nuevas fuentes de ingresos. estos servicios incluyen la traducción, el reconocimiento visual y la evaluación de la personalidad de alguien analizando lo que escribe, todo lo cual puede venderse a otras firmas para que lo utilicen en sus propios productos.

si bien las señales de la economía de los datos están por doquier, recién ahora se está clarificando su forma. Todos los jugadores buscan explotar un motor económico poderoso llamado “efecto de red de datos”: usar los datos para atraer más usuarios, que entonces generan más datos, que ayudan a mejorar los servicios, lo que atrae más usuarios.

las grandes bombean de los reservorios más abundantes. Cuanto más los usuarios escriben comentarios y dicen lo que les “gusta”, Facebook más aprende sobre esos usuarios y tanto mejor se orientan los avisos que aparecen en su hilo de noticias. de modo similar, cuanta más gente busca en Google tanto mejores resultan sus búsquedas.

estas firmas siempre están buscando nuevas fuentes de información. Facebook logra que los usuarios entrenen a algunos de sus algoritmos, por ejemplo cuando suben y etiquetan fotos de sus amigos. esto explica por qué las computadoras ahora pueden reconocer cientos de millones de personas con una precisión del 98 por ciento.

El pozo de Uber

Por su parte, Uber es conocido por sus viajes en taxis baratos. Pero si la firma vale lo que se estima son Us$ 68.000 millones, es en parte porque cuenta con el mayor pozo de datos sobre oferta (conductores) y demanda (pasajeros) del transporte personal. de modo similar, para la mayoría de la gente Tesla es fabricante de autos eléctricos sofisticados. Pero sus más recientes modelos recogen montañas de datos, que permiten a la firma optimizar sus algoritmos de autoconducción y luego actualizar en concordancia su software. Para fines del año pasado, la firma había recogido datos de conducción equivalentes a 2100 millones de kilómetros, mucho más que Waymo, la división de coches autoconducidos de Alphabet.

las nuevas firmas “basadas en datos” son los gatos salvajes de la nueva economía: salen en busca de petróleo digital, lo extraen y lo convierten en nuevos servicios ingeniosos, desde el análisis de radiografías y tomografías hasta determinar dónde espolvorear herbicidas en un campo. nexar, una nueva firma israelí, ha inventado un modo ingenioso de usar conductores como fuentes de datos. su app hace que celulares registren datos de sus viajes vía acciones que realizan normalmente. si muchos inesperadamente tocan el freno en el mismo lugar del camino, esto da una señal de que hay un bache u otro obstáculo. en compensación por usar la app de nexar, los conductores reciben una cámara gratuita para su consola y servicios, como un informe detallado si tienen un accidente. el objetivo de la firma es ofrecer todo tipo de servicios que ayuden a los conductores a evitar accidentes por los que ellos, como aseguradores, pagarán. Uno de tales servicios es la alerta de baches o cuando un auto se detiene repentinamente luego de doblar en una esquina.

Firmas que no son tecnológicas también están tratando de crear fuentes digitales. Ge, por ejemplo, ha desarrollando un “sistema operativo para la Internet industrial” llamado Predix, para ayudar a los clientes a controlar sus máquinas. Predix es también un sistema de recolección de datos: reúne datos de dispositivos a los que está conectado, los mezcla con otros datos y luego entrena algoritmos que pueden ayudar a mejorar las operaciones de una usina, determinar cuándo hay que hacer mantenimiento de un motor de avión antes de que se rompa y cosas por el estilo.

Al igual que en los mercados del petróleo, las firmas de datos más grandes compran continuamente otras más pequeñas. Pero otro aspecto de la economía de los datos les resultaría extraño a los que comercian en oro negro. el petróleo es la commodity más comercializada del mundo medida por valor. en cambio, los datos apenas si se comercian, al menos no por dinero. esto está muy lejos de lo que muchos tenían en mente cuando hablaban de los datos como una “nueva clase de activos”, como lo hizo el Foro económico Mundial en un informe publicado en 2011. la economía de los datos, según sugiere ese término, consistirá en mercados de bits y bytes prósperos. Pero tal como están las cosas es mayormente una colección de silos independientes.

esta ausencia de mercados es resultado de los mismos factores que han dado origen a las firmas. Hay todo tipo de “costos de transacción” de los mercados –búsqueda de información, negociación de acuerdos, hacer cumplir contratos, etc.– que hacen más simple y eficiente simplemente que la propia firma haga estas actividades. del mismo modo, a menudo es más rentable generar y usar datos dentro de la compañía que comprar y venderlos en un mercado abierto.

Más allá de su abundancia, los flujos de datos no son una commodity: cada flujo de información es diferente, en términos de líneas de tiempo, por ejemplo, o hasta qué punto es completo. Esta falta de “fungibilidad”, un término de la jerga económica, hace difícil para los compradores encontrar un conjunto de datos específico y asignarle un precio: el valor de cada tipo es difícil de comparar con otros datos. Hay un desincentivo al comercio, dado que cada parte temerá verse perjudicada.

Los investigadores recién comienzan a desarrollar metodologías de fijación de precios, algo que la consultora Gartner llama “infonomía”. Uno de sus pioneros, Jim Short, de la Universidad de California en San Diego, estudia casos en los que se ha tomado una decisión respecto de cuánto valen ciertos datos. Uno de los casos involucra una subsidiaria de Caesars Entertainment, un grupo de apuestas que se presentó a la quiebra en 2015. Se determinó que su activo más valioso, por US$ 1000 millones, eran los datos que se decía que tenía de 45 millones de clientes que habían ingresado en el programa de lealtad de la compañía en los 17 años anteriores.

La dificultad para fijar precios es un motivo importante por el que para una firma puede resultar más simple comprar otra empresa, aunque esté interesada principalmente en los datos. Éste fue el caso, en 2015, cuando IBM, según se dice, gastó US$ 2000 millones en la Weather Company para tener montañas de datos del clima así como la infraestructura para recogerlos.

Otro factor de confusión son los acuerdos de intercambio: sectores del Servicio Nacional de Salud de Gran Bretaña y DeepMind, la división de IA de Alphabet, han acordado canjear el acceso a datos anónimos de pacientes por las conclusiones médicas que surgen de ellos.

El hecho de que la información digital, a diferencia del petróleo, además “no es motivo de rivalidad”, lo que significa que puede ser copiada y usada por más de una persona (o algoritmo) a la vez, también crea complicaciones. Significa que los datos fácilmente pueden ser utilizados para otros propósitos que los acordados. Y aumenta la confusión respecto de quién es dueño de los datos (en el caso de un coche autónomo, podría ser el fabricante, el proveedor de sensores, el pasajero y, con el tiempo, si los coches autoconducidos pasan a ser propiedad de sí mismos, el vehículo mismo).

“El comercio de datos es tedioso”, dice Alexander Linden, de Gartner. Como resultado de ello, los acuerdos de datos a menudo son bilaterales y ad hoc. Y no son para los débiles de espíritu: los contratos de datos a menudo cubren docenas de páginas con un lenguaje legal denso, especificando los usos permitidos y cómo deben ser protegidos los datos. Un alto ejecutivo de un gran banco recientemente le dijo a Linden que tiene mejores cosas que hacer que firmar tales documentos, aunque los datos sean de gran valor.

En el caso de datos personales, las cosas son aun más complicadas. “Un mercado nacional de información regulado permitiría comprar y vender información personal, confiriendo al vendedor el derecho de determinar cuánta información se divulga”, escribió Kenneth Laudon, de la New York University, en un articulo influyente titulado Mercados y privacidad, en 1996. Más recientemente, el Foro Económico Mundial propuso el concepto de una cuenta de banco de datos. Sugería que los datos de una persona deberían “residir en una cuenta donde serían controlados, manejados, intercambiados y registrados”.

La idea parece elegante, pero hasta ahora no se han materializado un mercado ni cuentas de datos. El problema es el opuesto al que se da con datos corporativos: la gente entrega sus datos personales con demasiada facilidad a cambio de servicios “gratuitos”. Los términos de intercambio se han vuelto la norma casi por accidente, dice Glen Weyl, economista de Microsoft Research. Luego de que estalló la burbuja de las puntocom, a comienzos de la década de 2000, las firmas necesitaban urgentemente un modo de ganar dinero. Reunir datos para publicidad dirigida era el recurso más fácil. Recientemente han advertido que los datos pueden convertirse en todo tipo de servicios de IA.

Que esto haga del intercambio de datos por servicios gratuitos un intercambio injusto depende en gran medida de la fuente de valor de estos servicios: los datos o los algoritmos que los procesan. Hal Varian, el jefe de economistas de Google, sostiene que los datos ofrecen “ganancias decrecientes en proporción a la escala”, lo que significa que cada dato adicional es un poco menos valioso y, en algún punto, recoger más no agrega nada. Lo que importa más, dice, es la calidad de los algoritmos que procesan los datos y el talento contratado por la firma para desarrollarlos. El éxito de Google “tiene que ver con las recetas, no con los ingredientes”.

Eso puede haber sido cierto en los primeros tiempos de la investigación online, pero parece equivocado en el nuevo mundo de la IA. Los algoritmos cada vez más se autoenseñan y cuanto más datos más frescos reciben, tanto mejor. Y la ganancia marginal de los datos en realidad puede aumentar al multiplicarse las aplicaciones, dice Weyl. Cuando una firma de viajes compartidos ha recogido suficientes datos para ofrecer un servicio –por ejemplo, información del tráfico en tiempo real–, más información puede no agregar mucho valor. Pero si sigue recogiendo datos, en algún punto puede estar en condiciones de ofrecer más servicios, como la planificación de rutas.

Estos debates, junto con la falta de un pujante comercio de datos, pueden ser un problema de dentición temprana. Los mercados de petróleo con buen funcionamiento tardaron décadas en surgir. Paradójicamente, fue Standard Oil, el monopolio creado por John D. Rockefeller a fines del siglo XIX, el que aceleró las cosas: ayudó a crear la tecnología y –el nombre de la firma era su programa– los estándares que hicieron posible que se comercializara el nuevo recurso.

Han existido por mucho tiempo los mercados de datos personales de alto valor o fáciles de estandarizar. Los llamados “brokers de datos” comercializan rápidamente ciertos tipos de datos.

En otras áreas, están comenzando a surgir mercados o algo afín a ello. Oracle, que domina el mercado de bases de datos corporativas, por ejemplo, está desarrollando lo que equivale a una bolsa de activos de datos. Quiere que sus clientes intercambien datos, los combinen con conjuntos provistos por Oracle y que extraigan conclusiones de ellos, todo en el ambiente seguro de la nube informática de la firma, donde puede asegurar, entre otras cosas, que no haya mal uso de la información. Cognitive Logic, una nueva firma, presenta un producto similar, pero deja los datos en sistemas de IT separados.

Otras firmas jóvenes esperan dar a los consumidores más participación en el destino de sus datos. Citizenme permite a los usuarios reunir toda su información en un lugar y obtener una pequeña suma si la comparten con marcas. Datacoup, otra firma nueva, está vendiendo conclusiones extraídas de datos personales y transfiere parte de lo que obtiene por ello a sus usuarios.

Hasta ahora ninguno de estos esfuerzos ha despegado realmente; los que se concentran en los datos personales en particular quizá nunca lo hagan. A esta altura, los consumidores y los gigantes online están trabados en un abrazo incómodo. La gente no sabe cuánto valen sus datos ni quiere realmente tener que ocuparse de manejarlos, dice Alessandro Acquisit, de Carnegie Mellon University. Pero también están mostrando síntomas de lo que se llama “impotencia aprendida”: los términos y condiciones de los servicios a menudo son impenetrables y los usuarios no tienen más remedio que aceptarlos (las apps de los celulares no funcionan si uno no acepta los términos).

Los datos no serían el único recurso importante que no se comercializa ampliamente; están, por caso, el espectro de radio y los derechos del agua. Pero para los datos esto probablemente cree ineficiencias, sostiene Weyl. Si la información digital no tiene precio, quizá nunca se generen datos valiosos. Y si los datos permanecen en silos, es posible que gran parte de su valor nunca sea extraída. Las grandes refinerías de datos no tienen el monopolio de la innovación; otras firmas pueden estar mejor posicionadas para explotar la información.

Problemas urgentes

La falta de mercados de datos también hará más difícil resolver problemas complicados de política. Hay tres que se destacan: la regulación antimonopólica, la de privacidad y la de equidad social. La más urgente, se podría decir, es la antimonopólica, como fue el caso del petróleo. En 1911 la Corte Suprema de Estados Unidos apoyó el dictamen de una corte más baja que ordenó dividir Standard Oil, que por entonces controlaba alrededor del 90% de la refinación de petróleo del país.

Algunos ya piden una división similar de empresas como Google, entre los que se incluye Jonathan Taplin, de la Universidad de California del Sur, en su nuevo libro: Muévase rápido y rompa cosas. Pero un remedio tan radical no resolvería realmente el problema. Una división sería muy conmocionante y haría más lenta la innovación.

Como mínimo, los reguladores antimonopólicos tienen que afilar sus herramientas para la era digital. La Comisión Europea no bloqueó la fusión de Facebook y WhatsApp. Sostuvo que, aunque operaban los dos mayores servicios de mensajes de texto, había muchos otros y que el negocio no aumentaría la acumulación de datos de Facebook, porque WhatsApp no recogía demasiada información de sus usuarios. Pero Facebook estaba comprando una firma que temía que podía evolucionar a convertirse en un rival serio. Había construido un “gráfico social” alternativo, la red de conexiones entre amigos, que es el activo más valioso de Facebook. Durante el proceso de aprobación de la fusión, Facebook se comprometió a no fusionar las bases de usuarios de los dos servicios, pero lo comenzó a hacer el año pasado, lo que ha llevado a la comisión a amenazarla con multas.

La frustración con Facebook ayuda a explicar por qué algunos países en Europa han comenzado ya a actualizar sus leyes de competencia. En Alemania hay legislación recorriendo el Parlamento que permitiría a la Oficina Federal de Carteles intervenir en casos en que tengan un rol los efectos de red y de activos de datos. El ente ya tiene especial interés en la economía de los datos. Ha lanzado una investigación acerca de si Facebook se abusa de su posición dominante para imponer ciertas políticas de privacidad. Andreas Mundt, su presidente, quiere hacer más: “¿Podemos optimizar más nuestras técnicas de investigación? ¿Cómo podemos integrar mejor efectos dinámicos en nuestro análisis?”.

Una buena regla general para los reguladores es ser tan inventivos como las compañías que vigilan. En un trabajo reciente, Ezrachi y Stucke propusieron que las autoridades antimonopólicas operen lo que llaman “incubadoras de colusión tácita”. Para descubrir si los algoritmos que fijan precios manipulan los mercados o incluso entran en colusión, los reguladores debieran hacer simulaciones en sus propias computadoras.

Otra idea es promover alternativas a pilas centralizadas de datos. Los gobiernos podrían regalar más de los datos que recogen, creando oportunidades para firmas más pequeñas. También podrían apoyar “cooperativas de datos”. En Suiza, un proyecto llamado Midata recoge datos de salud de pacientes, que pueden entonces decidir si quieren que se los incluya en proyectos de investigación.

La falta de fungibilidad de los flujos de datos hace difícil la fijación de precios

El común de las personas no sabe cuánto valen sus datos ni quiere tener que ocuparse de manejarlos

Los datos son el único recurso clave que hoy casi no se comercializa: lo mismo pasa con los derechos del agua

?? Ilustración Vicente Martí ?? — Ilustración Vicente Martí

Cómo los datos se convertirán en el petróleo del futuro

Los flujos de información están dando nacimiento a una nueva economía, lo que exige enfoques renovados de los organismos reguladores para evitar la conformación de monopolios

Newspapers in Spanish

Newspapers from Argentina

Cómo los datos se convertirá­n en el petróleo del futuro

Los flujos de informació­n están dando nacimiento a una nueva economía, lo que exige enfoques renovados de los organismos reguladore­s para evitar la conformaci­ón de monopolios

Newspapers in Spanish

Newspapers from Argentina

Cómo los datos se convertirán en el petróleo del futuro

Los flujos de información están dando nacimiento a una nueva economía, lo que exige enfoques renovados de los organismos reguladores para evitar la conformación de monopolios