Hadoop es la plataforma sobre la que se apoyan las aplicaciones de ‘big data’
No es preciso un curso de inglés para captar la intención del manido concepto big data, que disputa al de computación en la nube la primera plaza entre las expresiones de uso corriente cuando se habla o escribe sobre aquello que se ignora pero resulta familiar. Puede ser arduo explicar qué es Hadoop, extraña palabra que la Wikipedia define (en su versión española) como “un framework de software que permite a las aplicaciones trabajar con miles de nodos y petabytes de datos”.
Hadoop es una plataforma que soporta almacenamiento y computación de datos a gran escala residentes en uno o más conjuntos (clúster) de ordenadores conectados entre sí, para que se puedan analizar con gran rapidez, como exigen los paradigmas en boga. Es, para decirlo de una vez, la plataforma sobre la que se apoyan las aplicaciones que se predican como big data. Para completar la definición sólo falta añadir que Hadoop se llama Hadoop porque este era el nombre que la hija de Doug Cutting, uno de sus inspiradores de primera hora, daba a su osito de peluche.
Se trata de un software de código abierto [ open source], de naturaleza comunitaria, lo que implica que cualquier empresa podría desarrollar una distribución a condición de ponerla a disposición de la comunidad sin que ello excluya la posibilidad de un modelo de negocio basado en licenciarla para que otras empresas la incorporen a sus productos. Cloudera, que pasa por ser líder de la plataforma Hadoop, recibe de IBM, HP, Oracle, Dell y otras empresas una cuantía a cambio de que estas integren su distribución de Hadoop en sus ofertas de data analytics.
Cloudera presenta una característica singular: no sufre los problemas de financiación de otras compañías jóvenes ni tiene apremio alguno por captar recursos saliendo a bolsa. Por la sencilla razón de que tiene poderosos padrinos: Intel ha invertido 740 millones de dólares [equivalente al 18% de su valor presunto] y otros inversores –como Google Ventures– han sumado 160 millones al balance.
En un diálogo reciente con Dinero, Tom Reilly, CEO de Cloudera, presumía de que “a menos que nos interese hacer alguna adquisición significativa, no volveremos a necesitar financiación nunca más”. Por otro lado, salir a bolsa le haría perder la flexibilidad de que goza ahora, y viviría (como tantas empresas de software) pendiente de responder a las presiones a corto plazo de los accionistas.
Según Reilly, la relación de dos años con Intel es excelente y fructífera. “Lo que Intel espera de Cloudera es coherente con su visión del futuro del centro de datos y de la nube; ellos anticipan una tendencia y trazan la hoja de ruta de sus chips con su visión del futu- que sin renunciar a su espíritu fundacional –Hadoop nació dentro de Google y sus inventores pasaron por Yahoo antes de soltar amarras– enriquece su plataforma con funciones adyacentes, comerciales, que le permiten presentarse como “empresa de software empresarial”. Gracias a ello, se ha hecho indispensable para sus conspicuos aliados.
Pese al ruido que convocan las soluciones analíticas, el mercado del big data exige paciencia. Las bases de datos instaladas desde hace décadas mantienen su vigencia, gracias a las herramientas y aplicaciones en su órbita, por lo que los nuevos paradigmas van a coexistir con los existentes, advierte Reilly.