3 cla­ves pa­ra evi­tar que su la­go de da­tos se con­vier­ta en un pan­tano

Los la­gos de da­tos pue­den al­ma­ce­nar to­dos sus da­tos co­mer­cia­les con fa­ci­li­dad, pe­ro ten­ga cui­da­do: ese re­po­si­to­rio ma­si­vo pue­de atas­car­se, aho­gan­do a sus usua­rios.

IT Now Rep. Dominicana - - KNOW HOW -

Du­ran­te años, im­pul­sa­do por tec­no­lo­gías co­mo Apa­che Ha­doop, las or­ga­ni­za­cio­nes han tra­ta­do de cons­truir la­gos de da­tos, las pla­ta­for­mas de ges­tión de las em­pre­sas que les per­mi­ten al­ma­ce­nar to­dos sus da­tos en su for­ma­to na­ti­vo. Es­tos la­gos pro­me­ten rom­per el ais­la­mien­to de la in­for­ma­ción, al pro­por­cio­nar un úni­co re­po­si­to­rio que la or­ga­ni­za­ción pue­de uti­li­zar pa­ra to­do, des­de el aná­li­sis del ne­go­cio has­ta la ex­trac­ción de da­tos. Cru­dos y sin con­trol, se han pro­mo­cio­na­do co­mo los cap­tu­ra-to­do y cu­ra-to­do de los gran­des da­tos. Avi Pé­rez, CTO de in­te­li­gen­cia em­pre­sa­rial en Py­ra­mid Analytics di­jo que ve mu­chos clien­tes cu­yos la­gos se es­tán con­vir­tien­do en pan­ta­nos de da­tos; de­pó­si­tos ma­si­vos com­ple­ta­men­te inac­ce­si­bles pa­ra los usua­rios finales. Mien­tras que al­gu­nas de las com­pa­ñías más exi­to­sas del mun­do han cons­trui­do sus ne­go­cios al­re­de­dor de sus la­gos de da­tos, (Goo­gle es un buen ejem­plo), pe­ro mu­chas los es­tán re­co­gien­do sin te­ner cla­ra la manera de ge­ne­rar va­lor con ellos. Eso no quie­re de­cir que la idea de­trás de los la­gos de da­tos sea ma­la. Pé­rez es­tá con- ven­ci­do de que to­das las em­pre­sas ne­ce­si­ta­rán uno. Pe­ro la crea­ción de un la­go de da­tos de los cua­les sus usua­rios finales pue­dan be­ne­fi­ciar­se re­quie­re pru­den­cia. Pa­ra que evi­te aho­gar­se en su pro­pio la­go de da­tos, Pé­rez re­co­mien­da adop­tar tres prin­ci­pios.

1 RE­CO­GER ME­NOS DA­TOS AL PRIN­CI­PIO

Pé­rez men­cio­nó que uno de los erro­res más gran­des de las or­ga­ni­za­cio­nes es re­co­lec­tar de­ma­sia­dos da­tos, sim­ple­men­te por­que pue­den ha­cer­lo. Con­si­de­re su te­lé­fono in­te­li­gen­te. Si us­ted es due­ño de uno, es pro­ba­ble que ha­ya cien­tos o más imá­ge­nes al­ma­ce­na­das en él. “Se ter­mi­na con mil mi­llo­nes de imá­ge­nes en el te­lé­fono, de las cua­les el 99% son pro­ba­ble­men­te ba­su­ra de la que se des­ha­ría sin pen­sar­lo”, di­jo. Lo mis­mo ocu­rre con los la­gos de da­tos. Al­ma­ce­nar­los en Ha­doop es lo su­fi­cien­te­men­te ba­ra­to co­mo pa­ra con­si­de­rar­lo gra­tui­to. Sin em­bar­go, el gran vo­lu­men que se acu­mu­la di­fi­cul­ta el ac­ce­so efec­ti­vo a los que po­drían pro­por­cio­nar una in­for­ma­ción va­lio­sa. “No re­co­ja in­for­ma­ción de to­das par­tes, to­do el tiem­po. Haz­lo con un plan es­pe­cí­fi­co de có­mo va a ex­plo­tar­los”, apun­tó Pé­rez.

2 ADOP­TAR UNA ES­TRA­TE­GIA DE APREN­DI­ZA­JE AU­TO­MÁ­TI­CO

In­clu­so con un con­jun­to de da­tos cen­tra­do, la pe­ne­tra­ción a es­ca­la re­quie­re au­to­ma­ti­za­ción. Se ne­ce­si­ta un sis­te­ma au­to­ma­ti­za­do pa­ra lim­piar­los. “IA, apren­di­za­je au­to­má­ti­co,; cual­quier tér­mino que desees uti­li­zar es la so­lu­ción má­gi­ca pa­ra va­dear el ca­mino a tra­vés de su in­for­ma­ción. Sos­ten­go que la manera más fá­cil de ob­te­ner el va­lor de tu enor­me la­go de da­tos de 5PB es con una téc­ni­ca que te per­mi­ta apren­der de ellos”, re­cal­có Pé­rez. Pa­ra co­men­zar, se­ña­ló, eli­ja un con­jun­to de da­tos que co­noz­ca y se­lec­cio­ne una téc­ni­ca de apren­di­za­je au­to­má­ti­co pa­ra atra­ve­sar­los. Es pro­ba­ble que, pa­ra ha­cer­lo con efi­ca­cia, ten­ga que ad­qui­rir nue­vas ha­bi­li­da­des.

3 DE­TER­MI­NA EL PRO­BLE­MA EM­PRE­SA­RIAL QUE IN­TEN­TA SO­LU­CIO­NAR

Aquí es don­de el círcu­lo cie­rra: ne­ce­si­ta co­men­zar con una vi­sión cla­ra del pro­ble­ma em­pre­sa­rial que es­tás in­ten­tan­do so­lu­cio­nar. Con un ob­je­ti­vo en mente, debe ser re­la­ti­va­men­te fá­cil se­lec­cio­nar los da­tos que debe re­co­pi­lar y la me­jor téc­ni­ca de apren­di­za­je au­to­má­ti­co pa­ra re­co­ger la in­for­ma­ción de ellos.

Avi Pé­rez, Py­ra­mid Analytics. “No re­co­ja in­for­ma­ción de to­das par­tes, to­do el tiem­po. Haz­lo con un plan es­pe­cí­fi­co de có­mo va a ex­plo­tar­los”. Mien­tras que al­gu­nas de las com­pa­ñías más exi­to­sas del mun­do han cons­trui­do sus ne­go­cios al­re­de­dor de sus la­gos de da­tos, (Goo­gle es un buen ejem­plo), pe­ro mu­chas los es­tán re­co­gien­do sin te­ner cla­ra la manera de ge­ne­rar va­lor con ellos.

Newspapers in Spanish

Newspapers from Dominican Republic

© PressReader. All rights reserved.