Los números hablan
El big data está revolucionando la manera de hacer políticas públicas y el margen de error es cada vez menor.
Cuando Alberto Cavallo era un niño en Argentina, a finales de la década de 1980, el país latinoamericano pasaba por una de sus ocasionales crisis. La inflación era desenfrenada, por lo que, incluso, una tarea sencilla como ir de compras, se convertía en una acción frenética diaria.
Cavallo y su madre iban todos los días al banco y retiraban una cantidad suficiente de pesos para las compras, y conservaban el resto de sus ahorros en dólares. Entonces iban a la tienda local y tomaban lo que necesitaban lo más rápido posible, esperando llegar a la caja antes de que el precio de venta se actualizara una vez más.
“Si no llegábamos a la caja a tiempo teníamos que regresar al banco y comenzar de nuevo”, recuerda con tristeza.
Pero la experiencia plantó las semillas de lo que se convirtió en uno de los experimentos más interesantes en el número normalmente rígido de las estadísticas económicas: un intento por aprovechar la explosión del big data (inteligencia de datos) para mejorar, complementar y, tal vez, al final, reemplazar las formas tradicionales de datos que todavía informan y le dan forma a las opiniones de innumerables responsables de políticas, de políticos, de académicos y que son la pauta de inversiones con valor de miles de millones de dólares.
Cavallo es profesor de economía aplicada del Instituto Tecnológico de Massachusetts ( MIT, por sus siglas en inglés), donde dirige “Billion Prices Project” con Roberto Rigobon, otro profesor de la misma institución. El proyecto comenzó en 2006, durante un periodo en el que acusaron al gobierno argentino de manipular los datos de la inflación. Los profesores Cavallo y Rigobon se dieron cuenta que al recopilar los precios en línea de los minoristas argentinos construían una medida más precisa y contemporánea de la tasa de inflación real. Desde el cambio de gobierno, a finales de 2015, Argentina publica un indicador de inflación más preciso.
La división comercial del proyecto, PriceStats, ahora recopila suficientes datos para proporcionar actualizaciones diarias de inflación a 22 economías. “Fue una especie de accidente. Pero con rapidez nos dimos cuenta de que tenía aplicaciones en otras partes”, dice el profesor Cavallo.
El proyecto es tan sólo un ejemplo de una tendencia más general por rastrear el creciente mar de datos para tener pistas sobre cuál es el desempeño de empresas, industrias o economías completas. Algunos números ya demostraron su utilidad, aunque aún imperfecta. Pero algunos expertos pronostican que los rastros digitales que dejamos de nuestra vida en línea al final pueden convertirse en un mapa de tendencias económicas en tiempo real.
Se estima que la generación anual de datos en el mundo se duplicará cada año, y que el tamaño total alcanzará 44 zettabytes (billones de gigabytes) para 2020, de acuerdo con un estudio de International Data Corporation. Si toda esta información se colocara en las tabletas de gama alta, la columna viajaría de la Tierra a la luna más de seis veces.
“Todo lo que se quiera saber sobre la economía se puede conocer en este momento, si puedes tener acceso al conjunto de datos correcto”, dice Tammer Kamel, director de Quandl, un proveedor de datos.
“Reunir todos los datos y ponerlos en la forma correcta no es un desafío insignificante”, dice Jonathan Shaw, director de un nuevo programa en el Instituto Alan Turing, en Londres, sobre el aprovechamiento de información alternativa en la investigación económica. “Pero dentro de 10 años, imagino que estaremos mucho más cerca de un mapa de la economía en tiempo real. Si no lo logramos en una década, eso me decepcionaría”.
El potencial aturde. Los feeds en las redes sociales se pueden utilizar para generar indicadores de sentimiento en tiempo real. Los satélites en el espacio ven en dónde y cuándo atracan los barcos, si los buques tanque están llenos o vacíos, la calidad de un cultivo o, incluso, la productividad de un alto horno. Las compras con tarjetas de crédito y los recibos de correo electrónico muestran el gasto minorista. Las listas de empleos de cientos de miles de sitios de carreras o sitios web corporativos pueden revelar patrones del empleo. Y los smartphones envían datos de ubicación que muestran en dónde estamos en un momento determinado. Con el tiempo, el “Internet de las cosas” podría revelar nuestros hábitos alimenticios diarios a través de refrigeradores conectados a la red.
La extracción de estos nuevos conjuntos de datos alguna vez estaba reservada para los sofisticados fondos de cobertura “cuantitativos”. Algunos ministerios de finanzas, banqueros centrales y agencias de estadísticas ahora comienzan a incursionar en el campo para comprender mejor y con mayor rapidez las mareas económicas, un desarrollo que podría tener importantes implicaciones para las políticas públicas.
Datos obsoletos
Las diferencias en las cifras oficiales fueron puestas en duda cuando estalló la crisis financiera. El comité de análisis del ciclo empresarial del National Bureau of Economic Research, que es el árbitro semioficial de las contracciones económicas de Estados Unidos ( EU), tardó hasta diciembre de 2008 — casi tres meses después de la quiebra de Lehman Brothers— en declarar que la economía estadounidense había entrado en recesión el año anterior. Mientras que muchos economistas concluyeron lo mismo durante algún tiempo a partir de los datos mensuales y trimestrales que se deterioraban con rapidez, las estadísticas no capturaron adecuadamente el ritmo al que la economía se estaba hundiendo, recuerda Diana Farrell, exsubdirectora del Consejo Económico Nacional de la administración Obama. “La economía estaba funcionando mucho peor de lo que creíamos, y nuestra respuesta política se basó en una recesión mucho más débil”, admite.
SpaceKnow construye el índice de fabricación de satélites chinos al tomar millones de imágenes de más de 6,000 sitios industriales en China, y utiliza la inteligencia artificial para convertir los patrones de ac- tividad en una medida numérica sobre lo bien que funciona el sector de fabricación del país.
Farrell ahora dirige el JPMorgan Chase Institute, un grupo de expertos que creó el banco para convertir los datos de sus propios clientes en valiosa información económica y política. Farrell dice que el big data podría tener un impacto “enorme” en las políticas, especialmente en torno a las recesiones. “Hay muchas cosas que los datos tradicionales no pueden responder en momentos extremos”, dice.
Las imágenes numéricas de China
El país asiático se convirtió en terreno fértil para los científicos de datos que buscan desarrollar medidas alternativas de la salud económica, en parte debido a las dudas que hay sobre la calidad de sus estadísticas oficiales.
Los datos económicos en occidente suelen ser lentos pero bastante precisos, incluso los funcionarios chinos admiten que sus cifras pueden ser moldeadas en palabras del primer ministro Li Keqiang. Eso llevó a que una serie de medidas alternativas basadas en la producción de electricidad, los volúmenes de los préstamos o los envíos de carga por ferrocarril, se convierta en un índice informal que incluso lleva el nombre de Li.
Los proveedores de datos alternativos llevaron esto a un nuevo nivel. El Índice de Fabricación de Satélites de China de SpaceKnow, que se basa en 2,200 millones de imágenes individuales de 500,000 kilómetros cuadrados y más de 6,000 sitios industriales en todo el país, es uno de los mejores ejemplos. Este indicador ofrece a los inversores una medida más rápida y posiblemente más precisa sobre la fabricación china. En 2015- 2016, arrojó una desaceleración mucho más aguda de lo que mostraban las encuestas oficiales y lo más probable es que capture mejor la recesión.