El ‘big da­ta’ es el fu­tu­ro

La Vanguardia - Dinero - - EN PORTADA -

“El ne­go­cio de Über no son los via­jes, ni el de Airbnb el alo­ja­mien­to, sino que es el big da­ta. Yel de Twit­ter, Fa­ce­book y Ni­ke”. Lo han oí­do en la úl­ti­ma con­fe­ren­cia del úl­ti­mo gu­rú de mo­da de in­ter­net, jus­to an­tes de: “Si hoy en día tu em­pre­sa no ba­sa su ne­go­cio en el big da­ta, no tie­ne fu­tu­ro por­que el big da­ta es el fu­tu­ro”. ¿Pe­ro sa­be­mos qué es el big da­ta? ¿Yqué quie­re de­cir que el big da­ta sea el fu­tu­ro?

Pa­ra em­pe­zar ten­dría­mos que lla­mar­lo por su nom­bre y acla­rar que aun­que le po­ne­mos un ar­tícu­lo sin­gu­lar, la pa­la­bra da­ta es un plu­ral en in­glés y que la tra­duc­ción de big da­ta se­ría da­tos ma­si­vos. A con­ti­nua­ción ten­dría­mos que acla­rar si es­ta­mos ha­blan­do de da­tos es­truc­tu­ra­dos –or­de­na­dos en fi­las y co­lum­nas, si­mi­la­res a una ho­ja de cálcu­lo– o bien de da­tos deses­truc­tu­ra­dos –un tuit o los pa­pe­les de Pa­na­má– y qué en­ten­de­mos por ma­si­vo. Nos pon­dría­mos de acuer­do en­se­gui­da en que los 11,5 mi­llo­nes de do­cu­men­tos de los pa­pe­les de Pa­na­má –la ma­yor fil­tra­ción de la his­to­ria– son da­tos ma­si­vos; im­pri­mir­los im­pli­ca­ría de­fo­res­tar un bos­que de 80.000 ár­bo­les y pa­ra ba­jar­nos los 2,6 te­raby­tes en ca­sa ne­ce­si­ta­ría­mos más de 16 me­ses. Pe­ro otros ca­sos no se­rían tan cla­ros. ¿Lo son los 1,7 Gb de Wi­kileaks? ¿Y si no de­pen­de só­lo del vo­lu­men de da­tos?

La de­fi­ni­ción más acep­ta­da de da­tos ma­si­vos es la que pro­pu­so el ana­lis­ta de da­tos Doug La­ney en el 2001: “Son gran­des vo­lú­me­nes, gran ve­lo­ci­dad y gran va­rie­dad de ac­ti­vos de in­for­ma­ción que ne­ce­si­tan de efi­cien­tes e in­no­va­do­ras ma­ne­ras de pro­ce­sa­mien­to pa­ra su com­pren­sión y pa­ra la to­ma de de­ci­sio­nes”. Lo que se co­no­ce co­mo la de­fi­ni­ción de las tres v: vo­lu­men, ve­lo­ci­dad y va­rie­dad, en las que pos­te­rior­men­te se aña­die­ron ve­ra­ci­dad y va­lor. Así pues, nos en­con­tra­mos an­te un con­cep­to mul­ti­di­men­sio­nal don­de apar­te del vo­lu­men cuen­ta la ve­lo­ci­dad en la que es­tos da­tos se ge­ne­ran, se al­ma­ce­nan y se pro­ce­san, y la va­rie­dad en los for­ma­tos de ad­qui­si­ción: da­tos es­truc­tu­ra­dos y no es­truc­tu­ra­dos, que in­clu­yen tex­to, da­tos de sen­so­res, clics, imá­ge­nes, au­dio, ví­deo.

¿Y de dón­de sa­len es­tas gran­des can­ti­da­des de da­tos? Pues de us­ted, de mí, de los otros 3.000 mi­llo­nes de per­so­nas co­nec­ta­das y de los 6,4 mi­llo­nes de apa­ra­tos co­nec­ta­dos a la red: de cuan­do bus­ca­mos en Google, com­pra­mos en Ama­zon, col­ga­mos una fo­to en Fa­ce­book, mi­ra­mos un ví­deo en YouTu­be, cam­bia­mos de ca­nal en Mo­vis­tar+ o pul­sa­mos el bo­tón del as­cen­sor.

To­me­mos el ca­so de los 140 ca­rac­te­res de un tuit. Re­sul­ta que só­lo son 140 pa­ra los su­fri­dos hu­ma­nos, pe­ro son mu­chos más pa­ra las má­qui­nas. Apar­te de la in­for­ma­ción vi­si­ble –nom­bre de usua­rio, tex­to del tuit, fe­cha, lo­ca­li­za­ción, apli­ca­ción des­de don­de se ha emi­ti­do– con ca­da tuit viaja: la bio­gra­fía del au­tor, la fe­cha de crea­ción de la cuen­ta, el idio­ma pre­fe­ri­do del au­tor, el nú­me­ro de se­gui­do­res, se­ries y fa­vo­ri­tos en el mo­men­to de ha­cer el tuit, e in­for­ma­ción geo­grá­fi­ca am­plia­da, en­tre mu­cha otra in­for­ma­ción. Mul­ti­pli­qué­mos­lo por los 350.000 tuits que es­cri­bi­mos ca­da mi­nu­to y su­me­mos los 2,4 mi­llo­nes de bús­que­das en Google, los 2,8 mi­llo­nes de ví­deos vis­tos en YouTu­be, las 70.000 ho­ras de ví­deo vis­tas en Net­flix que ha­ce­mos en el mis­mo mi­nu­to, ex­ten­dá­mos­lo al res­to de ser­vi­cios en lí­nea, sen­so­res y apa­ra­tos co­nec­ta­dos y ya ten­dre­mos el vo­lu­men, la ve­lo­ci­dad y la va­rie­dad de los da­tos ma­si­vos en una es­ca­la que so­bre­pa­sa nues­tra ca­pa­ci­dad de com­pren­sión.

En un día en­tre to­dos –hu­ma­nos y sen­so­res– ge­ne­ra­mos más de 2,5 tri­llo­nes de by­tes, el equi­va­len­te a 10 mi­llo­nes de dis­cos Blu-ray que pues­tos los unos en­ci­ma de otros equi­va­len a cua­tro to­rres Eif­fel. El 90% de los da­tos ge­ne­ra­dos por la hu­ma­ni- dad se ha crea­do en los úl­ti­mos dos años.

Yno ha­ce fal­ta que nos co­nec­te­mos a la red pa­ra con­tri­buir al vo­lu­men de da­tos ma­si­vos. Des­de que nos des­per­ta­mos has­ta que va­mos a dor­mir –mien­tras dor­mi­mos tam­bién– es­ta­mos ge­ne­ran­do da­tos con­ti­nua­men­te: la ho­ra de la du­cha y la du­ra­ción, la ho­ra que se en­cien­de la ca­le­fac­ción, el con­su­mo eléc­tri­co, el bo­tón del as­cen­sor, el arran­que del mo­tor del co­che, la ho­ra de sa­li­da del par­king, las cá­ma­ras de trá­fi­co, el pa­so por el pea­je, las co­ne­xio­nes del mó­vil en las an­te­nas. Nues­tro es­ta­do na­tu­ral es el de ge­ne­rar da­tos y los da­tos son el sub­pro­duc­to de nues­tra exis­ten­cia.

Has­ta ha­ce po­co es­tos da­tos só­lo ser­vían pa­ra mul­ti­pli­car­los por pe­se­tas y fac­tu­rar el re­sul­ta­do, el agre­ga­do se que­da­ba co­mo mu­cho en un dia­gra­ma de ba­rras en la me­mo­ria anual de la com­pa­ñía. Aho­ra, el agre­ga­do de to­dos es­tos da­tos es una fo­to­gra­fía per­fec­ta de nues­tro es­ti­lo de vi­da con un va­lor pa­ra las or­ga­ni­za­cio­nes igual o su­pe­rior al del pro­pio ser­vi­cio pro­vis­to.

Los ca­da vez más pre­sen­tes mo­ni­to­res de ac­ti­vi­dad –re­lo­jes, pul­se­ras, sen­so­res de rit­mo car­dia­co– lo ha­cen to­da­vía más evi­den­te: ca­da pa­so, ca­da pi­so subido y ca­da ki­ló­me­tro re­co­rri­do que­da re­gis­tra­do. In­clu­so cam­bios tan pe­que­ños co­mo el la­ti­do del co­ra­zón se con­vier­ten en da­tos.

Las or­ga­ni­za­cio­nes uti­li­zan los da­tos ma­si­vos en la ges­tión efi­cien­te de las ciu­da­des –ciu­da­des in­te­li­gen­tes–, la pre­ven­ción de epi­de­mias de acuer­do con las bús­que­das de sín­to­mas en Google, la pre­ven­ción de crí­me­nes y pa­ra ope­ra­cio­nes ma­si­vas de vi­gi­lan­cia. El doc­tor Ba­sel­ga afir­ma­ba en el úl­ti­mo en­cuen­tro del Fo­ro Eco­nó­mi­co Mun­dial en Da­vos que la cu­ra del cáncer pa­sa por nues­tra ca­pa­ci­dad de compu­tación en la re­co­gi­da y el aná­li­sis de da­tos ma­si­vos de mi­llo­nes de his­to­ria­les clí­ni­co de to­do el pla­ne­ta.

Ysi los pe­que­ños cam­bios son po­de­ro­sos –có­mo de­cía el Ca­pi­tà En­ciam–, los gran­des vo­lú­me­nes de pe­que­ños cam­bios son su­per­po­de­ro­sos, y es pre­ci­sa­men­te eso lo que son los da­tos ma­si­vos: un gran vo­lu­men de da­tos va­ria­bles a una gran ve­lo­ci­dad ge­ne­ra­dos por pe­que­ños cam­bios. El co­no­ci­mien­to de los da­tos ma­si­vos del pre­sen­te nos otor­ga el su­per­po­der de co­no­cer el fu­tu­ro, y es só­lo cues­tión de tiem­po que ten­ga­mos la ca­pa­ci­dad de compu­tación y aná­li­sis ne­ce­sa­rios pa­ra ex­traer in­for­ma­ción re­le­van­te pa­ra pre­de­cir­lo efec­ti­va­men­te. La cues­tión fun­da­men­tal ra­di­ca en có­mo or­ga­ni­za­cio­nes e in­di­vi­duos uti­li­za­re­mos es­te su­per­po­der. La res­pues­ta es­tá en los da­tos ma­si­vos.

JMG El co­no­ci­mien­to de los da­tos

ma­si­vos (‘big da­ta’) del pre­sen­te nos otor­ga el su­per­po­der de co­no­cer

el fu­tu­ro

Newspapers in Spanish

Newspapers from Spain

© PressReader. All rights reserved.