El verdadero panóptico
El Dataops es una tendencia que pisa fuerte dentro del mundo del análisis de datos en empresas, gobiernos y organizaciones. Saber aprovecharla es central.
Conocer todo, de eso se trata, algo central dentro de esta era digital en la que el viejo panóptico carcelario imaginado por Jeremy Bentham a finales del siglo 18 ya quedo algo obsoleto. Hoy, en la era de las redes sociales y la vida en línea, cada persona se transformó en panóptico de si mismo, tal como lo plantea el filósofo Byung-chul Han en su obra Psicopolítica. Pero lo que él dice en un tono que va de la resignación al susto, desde el punto de vista del negocio resulta más importante. Y es en este contexto que nace el Dataops, una metodología automatizada orientada a procesos que coloca a los datos en el centro de la escena. Es casi una nueva filosofía organizativa, de hecho. Los números hablan por sí solos: desde 2012, los grandes datos crearon más de ocho millones de puestos de trabajo sólo en los Estados Unidos y otros seis millones más en todo el mundo, de acuerdo con datos dados a conocer por la publicación Disruptordaily. El nuevo paraguas, Dataops, viene a intentar subsanar el lío de etiquetas y procesos —Business Intelligence, Big Data, Machine Learning, Data Analytics — y, a su vez, servir como una suerte de esqueleto conceptual donde ubicar todos los procesos, la infraestructura y la materia prima (los datos). “En un ambiente de crecimiento tan veloz, las distintas comunidades de investigación crean sus propios nombres, y eso explica parcialmente el actual caos en la terminología”, dice, con una cuota de pragmatismo, Ruben Bulluomo, gerente Comercial de Infor Cono Sur, una empresa global de software que vende ERPS. Dataops, que comparte una afinidad identitaria con Dev Ops, no es un producto, un servicio o una solución sino una metodología. “Es un cambio tecnológico y cultural para mejorar el uso de los datos dentro de una organización a través de una mejor colaboración y automatización. Esto significa una mayor confianza y protección de los datos, un ciclo de tiempo más corto para la entrega de los conocimientos y una gestión de datos más rentable”, explica Marcelo Sales, director de Productos y Soluciones de Hitachi Vantara Latam, una subsidiaria de la conocida firma japonesa con la que comparte la mitad de su nombre, dedicada al desarrollo de infraestructura para el almacenamiento y el análisis de datos. La palabra Dataops surge del inglés “Data Operations” u “Operaciones de Datos” en español, y se denomina así a los equipos de exploración y análisis de datos que trabajan en la elaboración de modelos que permiten nutrir a las plataformas de software de información clave para brindar una mejor experiencia y cubrir las necesidades de los clientes en cada momento, resumen Hernán Morello, director de la Diplomatura en Ciencia de Datos de la Universidad Argentina de la Empresa (UADE). Esta nueva etiqueta nació en 2014 pero recién comenzó a popularizarse a partir de 2017, en la medida en que se desarrolló el ecosistema y aumentó la cobertura e interés por parte de los analistas de datos, los analistas de negocio y de las empresas. Esta nueva terminología devenida en metodología y ariete de un cambio cultural dentro del mundo del análisis de datos nace de las dificultades que tenían las áreas de IT de las empresas para proveer información en tiempo y forma de acuerdo a las necesidades de las unidades de negocio. “Las áreas de Business Intelligence, por lo general, corren detrás de la demanda convirtiéndose en cuellos de botellas con demoras que, en muchos
casos, resultan inaceptables para el negocio y atentan contra una dinámica competitiva basada en información confiable y oportuna”, puntualiza Alejandro Bianchi, presidente de Liveware, una compañía argentina dedicada a la ingeniería de software, la gestión de calidad y la mejora de procesos. Para Belluomo, Dataops surgió porque “hacía falta una nueva manera de referirse a la ciencia de datos, ingeniería de datos, gestión de los datos, Business Intelligence y similares debido a la importancia que ha cobrado el análisis de datos en la actualidad”.
Dataops promete, en suma, resolver los problemas de la gestión de datos para darle una mejor dinámica a la generación de informes y analítica que demanda el negocio. En la mayoría de las empresas, los datos recorren un flujo complejo desde los sistemas fuente hasta los usuarios finales. “Detrás de escena, los profesionales de datos pasan por diversos pasos para extraer, ingestar, mover, limpiar, formatear, integrar, transformar, calcular y agregar datos antes de entregarlos a la comunidad empresarial”, marca Bianchi. Estos “canales de datos” son ineficientes y propensos a errores: los datos saltan a través de múltiples sistemas y son procesados por varios programas de software. Los humanos intervienen para aplicar soluciones manuales para corregir datos de transacciones que nunca fueron diseñadas para combinarlos, hacer agregaciones o prepararlos para hacer análisis por parte de los interesados y usuarios. La reutilización y la automatización prácticamente no existen y los usuarios comerciales esperan meses para obtener información para la toma de decisiones tanto estratégicas como tácticas. Adicionalmente a los problemas de calidad y oportunidad, se deben sumar los costos ocultos de tanta ineficiencia. Dataops promete agilizar el proceso de construcción, cambio y gestión del pipeline de datos. Su objetivo principal es maximizar el valor comercial de los datos y mejorar la satisfacción del usuario y también del cliente final. Para lograr estos objetivos la meta de Dataops es acelerar la entrega de datos y resultados analíticos, al tiempo que reduce los defectos de datos, esencialmente cumpliendo el mantra “mejor, más rápido, más barato”. Dataops enfatiza la colaboración, la reutilización y la automatización, junto con una gran
Las áreas de Business Intelligence corren detrás de la demanda y por eso tienen cuellos de botella y demoras.”
— Alejandro Bianchi, presidente de Liveware.
dosis de pruebas y monitoreo y para lograrlo emplea herramientas de desarrollo basadas en equipos para crear, implementar y administrar el pipeline de datos.
Darle lugar
A pesar de ser una tendencia que ya disfruta de un nombre propio dentro del ecosistema tecnológico corporativo, las empresas locales aún no terminan de adoptarlo. En palabras de Morello, de la UADE: “en la Argentina todavía no alcanzó un protagonismo muy destacado, pero impulsados por la necesidad y conveniencia, su uso se está acelerando sobre todo en las empresas con mayor volumen de datos”. El driver central para la adopción de esta metodología, según las fuentes consultadas, es el grado de madurez que haya alcanzado la organización en cuanto a la gestión de los datos. Las áreas de inteligencia de negocios deben mejorar para atender las demandas del negocio y por sobre todo prepararse para la transición hacia una visión de la empresa gestionada por datos, sostiene Bianchi, de Liveware.
Para implementar una estrategia centrada en el Dataops se requiere, en primera instancia, el apoyo por parte de la dirección de la compañía para fomentar el cambio cultural e impulsarla de forma orgánica. En cuanto a los recursos humanos, el perfil necesario varía. Se buscan perfiles acostumbrados a trabajar en entornos ágiles, que cuenten con conocimientos de programación (principalmente Python y R), conocimientos de estadística aplicada (para el análisis de datos y para la elaboración de modelos), manipulación y almacenamiento de grandes volúmenes de datos (datos estructurados y no estructurados), conocimiento de herramientas de software para la visualización de información, y fundamentalmente contar con una adecuada comprensión y visión del negocio. “No es necesario que una sola persona reúna todos”, aclara. “Lo fundamental es la habilidad de interactuar con todas estas áreas de conocimiento”, enumera Morello. ¿Cómo llegar a buen puerto? Es necesario implantar una serie de buenas prácticas que, ayudadas con automatización, facilitan el cambio. Estas, según Bianchi, incluyen comenzar con proyectos pequeños en un ciclo iterativo e incremental, reconvertir el área de Business Intelligence para estar a la altura, entrenar a los equipos en Dataops, diseñar y desarrollar soluciones de datos para soportar la automatización y el reúso, implementar herramientas para el desarrollo y el gobierno de los datos, implantar controles de aseguramiento de calidad de los datos y, finalmente, crear una plataforma integrada y corporativa de datos. “El dato en sí mismo es el objeto de estudio”, apunta, como un mantra, Daniel Scarafia, gerente general de Hitachi Vantara en Sudamérica de habla hispana. Se trata de recorrer “la escalera de valor de los datos; básicamente, es un recorrido que tienen que hacer los datos dentro de la organización para que al final dé un resultado.” Sobre el proceso de Dataops en sí, y un poco siguiendo la línea de Bianchi, Scarafia lo divide en cuatro etapas: la primera es el almacenamiento y la segurización de los datos. “No solo tenemos datos estructurados de ERP y bases de datos, sino también toda la actividad que tiene la compañía en internet”, señala. La segunda etapa es enriquecer esos datos, generar metadata sobre ellos, ponerles un contexto (lugar y fecha, por mencionar lo más simple); la tercera se trata de generar analítica que dé un resultado. “Si tuviera datos de facturación de un comercio y mezclarlo con los datos de las cámaras y las redes sociales, puedo decidir que los viernes, por ejemplo, no se trabaja más”, dice Scarafia. La cuarta y última etapa es sencilla: hay que monetizar ese dato para que genere más revenue. “La explotación de los datos ya dejó de ser un diferencial o ventaja competitiva para las empresas y pasó a ser una necesidad para mantenerse relevante en el mercado”, marca Morello. “Pero con este aumento exponencial en la información con la que interactúa la empresa nace la necesidad de ser muy disciplinado para tener gobierno de los datos y mantener la calidad en todo su ciclo de vida”, completa. En suma, la ecuación cierra mejor cuando mi empresa sabe más que el resto, cuando ese panóptico digital en el que vivimos puede ser medido, analizado y customizado para sacarle el mayor provecho posible. De eso se trata el capitalismo.
La explotación de los datos ya dejó de ser un diferencial y hoy es una necesidad.”
—Hernán Morello, director de la Diplomatura de Ciencia de Datos en la UADE.