UN DA­TA WA­REHOU­SE MÁS ANA­LÍ­TI­CO

Aho­ra no so­lo se de­be te­ner en cuen­ta pro­ce­sar los da­tos in­ter­nos de la em­pre­sa, sino se de­be con­tar con la ca­pa­ci­dad de com­bi­nar­los con da­tos pro­ve­nien­tes de apli­ca­cio­nes y la web. Pa­ra eso le en­se­ña­mos có­mo ge­ne­rar una es­tra­te­gia de DWH exi­to­sa.

IT Now Guatemala - - IT PRO - Bo­ris Ríos

Aho­ra no so­lo se de­be te­ner en cuen­ta pro­ce­sar los da­tos in­ter­nos de la em­pre­sa, sino se de­be con­tar con la ca­pa­ci­dad de com­bi­nar­los con da­tos pro­ve­nien­tes de apli­ca­cio­nes y la web. Pa­ra eso le en­se­ña­mos có­mo ge­ne­rar una es­tra­te­gia de DWH exi­to­sa.

Ac­tual­men­te, hay nue­vas de­man­das pa­ra el da­ta wa­rehou­se de­ben ser ca­pa­ces de ma­ne­jar y pro­ce­sar da­tos ex­ter­nos, en com­bi­na­ción con sus fuen­tes internas co­ti­dia­nas y a su vez in­cluir in­for­ma­ción de las apli­ca­cio­nes de la em­pre­sa y la web. Es­to sig­ni­fi­ca que se de­be con­tar con so­lu­cio­nes de ad­mi­nis­tra­ción de da­tos pa­ra ana­lí­ti­ca más efi­cien­tes, con fun­cio­na­li­da­des que re­pre­sen­tan un au­men­to sig­ni­fi­ca­ti­vo de las es­tra­te­gias de da­ta wa­rehou­se cor­po­ra­ti­vas.

¿Có­mo li­diar con es­to?

Pa­ra ello exis­te un tér­mino, al cual Gart­ner ha de­no­mi­na­do el Lo­gi­cal Da­ta­wa­rehou­se. Sin em­bar­go, no es un tér­mino nue­vo, ya que se ha ha­bla­do de es­te te­ma ha­ce años, pe­ro la tec­no­lo­gía dis­po­ni­ble en los años an­te­rio­res no ha fa­ci­li­ta­do la im­ple­men­ta­ción de es­te con­cep­to en el que hay di­fe­ren­tes la­gos de da­tos con es­pe­cia­li­za­ción de ne­go­cio y to­dos tra­ba­jan con­jun­ta­men­te en la crea­ción de una vis­ta con­so­li­da­da y uni­fi­ca­da del ne­go­cio en lí­nea.

Es im­por­tan­te que los da­ta wa­rehou­se es­tén con­for­ma­dos por to­dos los da­tos de la or­ga­ni­za­ción, tan­to ac­tua­les co­mo his­tó­ri­cos, re­gis­tros de­ta­lla­dos y re­su­mi­dos; con la fi­na­li­dad de que sean uti­li­za­dos pa­ra fi­nes de aná­li­sis.

Las apli­ca­cio­nes y si­tios web que es­tán tra­ba­jan­do en con­jun­to con el da­ta wa­rehou­se en tiem­po real, lo ha­cen a tra­vés de li­bre­rías de co­ne­xión al mo­tor de la ba­se de da­tos en un ser­vi­dor de la em­pre­sa o en la nu­be don­de es­tá el da­ta wa­rehou­se, de ese mo­do se rea­li­zan las con­sul­tas per­ti­nen­tes, por ejem­plo aná­li­sis de ten­den­cias de ven­tas, cos­tos de los úl­ti­mos me­ses, pro­yec­ción pa­ra los pró­xi­mos me­ses y fil­tra­do por di­men­sio­nes co­mo

tiem­po, re­gión, país, de­par­ta­men­to, mu­ni­ci­pio, ciu­dad, tien­da, pro­duc­to, ven­de­dor, etc.

“Pa­ra po­der su­plir las ne­ce­si­da­des ac­tua­les del da­ta wa­rehou­se, las em­pre­sas han adop­ta­do una ten­den­cia ac­tual que se ba­sa en en­tor­nos de big da­ta, que a su vez se ba­san en la in­fra­es­truc­tu­ra Ha­doop. De­be es­tar con­fi­gu­ra­do acor­de a las ne­ce­si­da­des se­gún el área de la em­pre­sa y la in­for­ma­ción re­que­ri­da pa­ra los aná­li­sis que ca­da de­par­ta­men­to desee rea­li­zar con las he­rra­mien­tas ana­lí­ti­cas que po­sean”, men­cio­nó Ju­lio Ra­mí­rez, pro­ject ma­na­ger/ pre­dic­ti­ve analy­tics pro­ducts and So­lu­tions Im­ple­men­tor de SPSS Da­ta­ba­se Cen­tral Ame­ri­ca.

Fren­te a las ne­ce­si­da­des ac­tua­les de los da­tos de apps y la web, los sis­te­mas re­po­si­to­rios de in­for­ma­ción pue­den te­ner dos con­fi­gu­ra­cio­nes.

La pri­me­ra que es un gran de­pó­si­to de in­for­ma­ción, don­de so­lo se ven las ba­ses de da­tos pro­duc­ti­vas co­pia­das de ma­ne­ra in­dis­tin­ta. Sin im­por­tar que es­tas sean apps de la web o del back end de la or­ga­ni­za­ción. Con es­te ti­po de con­fi­gu­ra­ción so­la­men­te se po­drían ob­te­ner re­por­tes de las apli­ca­cio­nes, ya que su prin­ci­pal ob­je­ti­vo es el de qui­tar car­ga a los sis­te­mas pro­duc­ti­vos.

De acuer­do con Da­ruin So­lano y Cel­so Ra­mí­rez, in­ge­nie­ros de So­lu­cio­nes Glo­ba­les, Re­pú­bli­ca Do­mi­ni­ca­na, en es­te mo­de­lo el pro­ce­so de con­ver­sión de da­tos en in­for­ma­ción es muy de­man­dan­te de re­cur­sos y es muy com­pli­ca­do la crea­ción de di­men­sio­nes pa­ra pre­sen­tar­las a los usua­rios fi­na­les. Nin­gu­na de las ta­blas de apps tie­nen re­la­ción en­tre sí, sino que es­ta re­la­ción de­be­rá ser es­ta­ble­ci­da a tra­vés de pro­ce­sos in­ter­nos del mis­mo da­ta wa­rehou­se (DWH). A es­to po­de­mos lla­mar­le DWH Ope­ra­ti­vo o más bien ODS (Ope­ra­tio­nal Da­ta Sto­re) que al mis­mo tiem­po le po­drá ser­vir co­mo área de en­sa­yo si así lo de­ci­de.

El se­gun­do mo­de­lo, es un gran con­te­ne­dor de da­tos, don­de la in­for­ma­ción es agru­pa­da y se su­ma pa­ra pos­te­rior­men­te ser co­lo­ca­da en mo­de­los de da­tos di­se­ña­dos de ma­ne­ra es­pe­cí­fi­ca pa­ra las ne­ce­si­da­des de la em­pre­sa.

Los ex­per­tos ad­vier­ten que el pri­mer ni­vel de es­te DWH de­be es­tar en 3NF (ter­ce­ra for­ma nor­mal), al cual DWH se le pue­de lla­mar EDWH o Mo­de­lo de Da­tos Cor­po­ra­ti­vo. Las ta­blas en 3NF pue­den ser lle­va­das a di­men­sio­nes en mo­de­los es­tre­lla (Star Sche­mas) o co­pos de nie­ves (Snow Fla­kes). A par­tir de es­tos, la ob­ten­ción de re­por­tes se ha­ce más li­ge­ra pa­ra los sis­te­mas, re­dun­dan­do en ba­jos tiem­pos de res­pues­ta pa­ra el usua­rio fi­nal.

Ca­be des­ta­car que en al­gu­nas oca­sio­nes, to­do el sis­te­ma de EDWH (En­ter­pri­se DWH) es cons­trui­do ba­jo una ar­qui­tec­tu­ra com­bi­na­da que po­dría te­ner to­dos los ele­men­tos de un ODS y ade­más un DWH bien es­truc­tu­ra­do co­mo se plan­teó.

En un am­bien­te lleno de da­tos he­te­ro­gé­neos, la com­bi­na­ción de am­bas ar­qui­tec­tu­ras, se­gún los es­pe­cia­lis­tas, es la me­jor vía a to­mar pa­ra gran­des em­pre­sas. Así, un Ods/sta­ging Area, pue­de dar el re­sul­ta­do ne­ce­sa­rio en una em­pre­sa pe­que­ña y un EDWH po­dría ser la res­pues­ta pa­ra una em­pre­sa me­dia­na.

A es­te pun­to, la me­di­da y las fron­te­ras las fi­ja­rán los pre­su­pues­tos de TI y la im­por­tan­cia es­tra­té­gi­ca de la da­ta den­tro de la or­ga­ni­za­ción.

“Por eso se de­be ha­cer un me­jor uso de los re­cur­sos y del di­ne­ro. Las tec­no­lo­gías de big da­ta son mu­cho más fle­xi­bles y eco­nó­mi­cas. En el mo­de­lo tra­di­cio­nal de DWH el cos­to de sto­ra­ge y pro­ce­sa­mien­to por gi­gaby­te anual­men­te es­tá por el or­den de los US$23 mien­tras que en el mun­do de Ha­doop el sto­ra­ge y pro­ce­sa­mien­to es­tá apro­xi­ma­da­men­te en 19 cen­ta­vos de dó­lar”, di­jo Ale­jan­dro Cho­co­lat, Di­rec­tor La­tin Ame­ri­can Sa­les en Hor­ton­works Inc, desa­rro­lla­dor de soft­wa­re y dis­tri­bui­dor de Ha­doop.

Con es­to se de­be pen­sar en una es­tra­te­gia que brin­de se­gu­ri­dad y go­ber­nan­za de da­tos, que per­mi­te ser más efi­cien­te al to­mar me­jo­res de­ci­sio­nes.

La nue­va es­tra­te­gia del DWH

Al mo­men­to de desa­rro­llar una es­tra­te­gia de da­ta wa­rehou­se más ana­lí­ti­co se de­be te­ner co­no­ci­mien­to de la in­for­ma­ción que ma­ne­ja la or­ga­ni­za­ción. La ma­yo­ría de em­pre­sas tie­nen gran­des da­tos

pe­ro no sa­ben qué ha­cer con ellos, por ello se de­ben to­mar co­mo una ar­ma pa­ra ha­cer más po­de­ro­sa a la em­pre­sa.

Mu­chas or­ga­ni­za­cio­nes uti­li­zan sus sis­te­mas ope­ra­cio­na­les co­mo pla­ta­for­ma pa­ra ser­vir de lis­ta­dos y re­por­tes a los usua­rios fi­na­les. Con el tiem­po, es­to pro­vo­ca el co­lap­so de sus sis­te­mas cen­tra­les de­bi­do a que es el úni­co me­dio que tie­nen los usua­rios pa­ra vi­sua­li­zar la da­ta his­tó­ri­ca y, sin un mo­de­lo de da­tos pro­pia­men­te de­fi­ni­do, ten­drán ca­da vez más de­fi­cien­tes e in­ter­mi­na­bles re­por­tes.

“El prin­ci­pal ele­men­to que se de­be te­ner en cuen­ta es cuál es la ne­ce­si­dad más apre­mian­te de ne­go­cio y qué quie­re lo­grar­se con el aná­li­sis de to­do su uni­ver­so de in­for­ma­ción”, di­jo Da­vid Ro­zo, se­nior Pre­sa­les Spe­cia­list de SAP.

Con es­ta in­for­ma­ción cla­ra, lue­go se de­be ir a las fuen­tes de in­for­ma­ción a par­tir de la cual se van a crear es­tas nue­vas bo­de­gas de da­tos que so­por­ta­rán es­ta es­tra­te­gia de aná­li­sis y eje­cu­ción de ne­go­cio. Con­si­de­ran­do que la in­for­ma­ción pro­vie­ne aho­ra de fuen­tes di­fe­ren­tes a lo que eran en el pa­sa­do. Una vez se ha­yan iden­ti­fi­ca­do to­das las fuen­tes de da­tos, se de­be de­fi­nir una es­tra­te­gia de pro­ce­sa­mien­to y al­ma­ce­na­mien­to pa­ra su ana­lí­ti­ca.

“Una bo­de­ga de da­tos sin un plan­tea­mien­to pa­ra su aná­li­sis es co­mo un tex­to con pa­la­bras pe­ro sin nin­gún men­sa­je”, re­cal­có Ro­zo.

Pa­ra Va­len­tín Vi­ra­so­ro, re­gio­nal sa­les ma­na­ger en Te­ra­da­ta, la cla­ve es­tá en en­ten­der que exis­te una di­ver­si­dad de ti­pos de da­tos y hay que dar­le el tra­ta­mien­to co­rres­pon­dien­te a ca­da uno de ellos.

“Se de­be as­pi­rar a te­ner una ar­qui­tec­tu­ra uni­fi­ca­da la cual pue­da cru­zar los da­tos de ma­ne­ra efi­cien­te y rá­pi­da pa­ra po­der con­se­guir va­lor.

Por otro la­do, es im­por­tan­te te­ner un eco­sis­te­ma de ca­pi­tal hu­mano que es­té ap­to de ha­bi­li­da­des su­fi­cien­tes pa­ra apo­yar a es­ta ar­qui­tec­tu­ra uni­fi­ca­da. Pa­sa a te­ner mu­cha im­por­tan­cia la fi­gu­ra de los cien­tí­fi­cos de da­tos que son un bien pre­cia­do y no fá­cil de for­mar, por­que su­gie­re la con­jun­ción de ha­bi­li­da­des tec­no­ló­gi­cas con co­no­ci­mien­tos de in­dus­tria”, di­jo Vi­ra­so­ro.

Pa­ra ello, an­tes de desa­rro­llar una es­tra­te­gia for­mal de sis­te­mas ge­ren­cia­les con da­ta wa­rehou­se, con bu­si­ness analy­tics y pre­dic­ti­ve analy­tics, de­be­rá con­tes­tar­se las si­guien­tes pre­gun­tas: ¿Có­mo se tie­ne la ca­li­dad de da­tos en los sis­te­mas fuen­tes que ali­men­ta­rán al re­po­si­to­rio de da­tos em­pre­sa­rial, da­ta­marts y mo­de­los ge­ren­cia­les? Y ¿cuá­les son los áreas de de­ci­sión que ur­ge te­ner in­for­ma­ción y que al ob­te­ner­la de los sis­te­mas transac­cio­na­les có­mo el de­par­ta­men­to de TI da­rá un re­por­te ge­ren­cial y con­fia­ble?

Cuan­do us­ted re­suel­va las pre­gun­tas ay b, pue­de ini­ciar una es­tra­te­gia de sis­te­mas ge­ren­cia­les en su em­pre­sa.

“Es re­co­men­da­ble uti­li­zar me­jo­res prác­ti­cas co­mo lo es CPM (Cor­po­ra­te Per­for­man­ce Ma­na­ge­ment), el cual sir­ve co­mo un mar­co de tra­ba­jo referencial pa­ra desa­rro­llar una ini­cia­ti­va for­mal de sis­te­mas ge­ren­cia­les pa­ra el año ac­tual, el año si­guien­te, los pró­xi­mos 4 o 5 años”, de­ta­lló Jo­sé Luis Iri­zarry, ma­na­ge­ment in­for­ma­tion Sys­tems Pro­ject Ma­na­ger en Mi­cro­da­ta de El Sal­va­dor, S.A. de C.V.

Por otro la­do, en el desa­rro­llo de la es­tra­te­gia tam­bién se pue­de con­si­de­rar la im­ple­men­ta­ción de ILM (In­for­ma­tion Li­fecy­cle Ma­na­ge­ment) don­de por me­dio de po­lí­ti­cas de uti­li­za­ción y añe­ja­mien­to de la in­for­ma­ción se lo­gra ha­cer una me­jor dis­tri­bu­ción del al­ma­ce­na­mien­to. Un se­gun­do pa­so y que le qui­ta­rá mu­chos do­lo­res de ca­be­za al per­so­nal de TI, es la im­ple­men­ta­ción de un ODS (Ope­ra­tio­nal Da­ta Sto­re) don­de prác­ti­ca­men­te se co­lo­ca AS-IS las ba­ses de da­tos de los sis­te­mas OLTP. En al­gu­nos ca­sos se po­drán ha­cer trans­for­ma­cio­nes y con­trol de ca­li­dad de la da­ta.

“De­fi­ni­da la es­tra­te­gia de ILM y con me­nos pro­ble­mas ope­ra­cio­na­les, en­ton­ces el si­guien­te pa­so es el ini­cio del pro­yec­to de cons­truc­ción for­mal de un DWH de for­ma mo­du­lar pa­ra ir sa­tis­fa­cien­do blo­ques fun­cio­na­les de la or­ga­ni­za­ción. Es­te es un pro­yec­to pa­ra la em­pre­sa, mas no pa­ra el de­par­ta­men­to de IT”, di­jo Da­ruin So­lano, de So­lu­cio­nes Glo­ba­les.

¿Có­mo li­diar con big da­ta?

No es un se­cre­to que las fuen­tes de in­for­ma­ción han cam­bia­do y no se li­mi­tan a fuen­tes de da­tos es­truc­tu­ra­das co­mo en el pa­sa­do. Aho­ra, con big da­ta, la nu­be y el

In­ter­net de las co­sas, exis­ten nue­vos re­que­ri­mien­tos de al­ma­ce­na­mien­to y pro­ce­sa­mien­to de can­ti­da­des gi­gan­tes­cas de in­for­ma­ción en uni­da­des li­mi­ta­das de tiem­po (da­ta strea­ming).

Por tal ra­zón, es vi­tal que una es­tra­te­gia de DWH ten­ga en cuen­ta es­tos nue­vos re­que­ri­mien­tos pa­ra de­ter­mi­nar el pa­pel que ju­ga­rá big da­ta en el al­ma­ce­na­mien­to y pro­ce­sa­mien­to de to­da es­ta in­for­ma­ción.

Sin em­bar­go, big da­ta no es la re­gla de oro. Por ello no se de­be to­mar co­mo dog­ma que un sis­te­ma de in­for­ma­ción ge­ren­cial for­zo­sa­men­te de­be uti­li­zar es­te con­cep­to. Es de­cir, pa­ra im­ple­men­tar téc­ni­ca­men­te es­te ti­po de he­rra­mien­tas, de­be iden­ti­fi­car­se el re­que­ri­mien­to de in­for­ma­ción que ne­ce­si­ta de big da­ta. Por ejem­plo aná­li­sis de bi­llo­nes de transac­cio­nes en ca­da su­per­mer­ca­do (con ope­ra­cio­nes en to­do el mun­do) uti­li­zan­do aná­li­sis de tex­to, mi­ne­ría de si­nó­ni­mos y apren­di­za­je de má­qui­na ba­sa­do en mo­vi­mien­tos fa­cia­les, con el ob­je­ti­vo de que los clien­tes reali­cen la ma­yor can­ti­dad de com­pras po­si­bles ca­da vez que vi­si­tan un su­per­mer­ca­do.

De acuer­do con Va­len­tín Vi­ra­so­ro, re­gio­nal sa­les ma­na­ger en Te­ra­da­ta, es vi­tal con­si­de­rar en una ar­qui­tec­tu­ra uni­fi­ca­da de da­tos, las he­rra­mien­tas que per­mi­tan in­cor­po­rar in­for­ma­ción no es­truc­tu­ra­dos o mul­ti-es­truc­tu­ra­dos pro­ve­nien­tes de nue­vas fuen­tes de in­for­ma­ción da la opor­tu­ni­dad de re­co­rrer ana­lí­ti­cos más com­ple­jos y ri­cos de da­ta.

“Las com­pa­ñías sa­ben que no so­lo de­ben pen­sar en una so­la so­lu­ción má­gi­ca pa­ra desa­rro­llar es­tos am­bien­tes sino que se re­quie­re la cons­truc­ción, de atrás ha­cia de­lan­te, de am­bien­tes ana­lí­ti­cos ro­bus­tos, em­pe­zan­do pri­me­ro por te­ner la in­for­ma­ción bien es­truc­tu­ra­da, la re­por­te­ría tra­di­cio­nal, y lue­go ir pa­so a pa­so in­cor­po­ran­do nue­vas par­tes a la ar­qui­tec­tu­ra pa­ra que se pue­dan ha­cer cru­ces de in­for­ma­ción más va­lio­sos”, di­jo Va­len­tín Vi­ra­so­ro.

De es­te mo­do es co­mo big da­ta re­quie­ren del ma­ne­jo y ges­tión, don­de la in­fluen­cia del IOT (In­ter­net of Things) pre­sen­ta una nue­va opor­tu­ni­dad de aná­li­sis de da­tos e in­for­ma­cio­nes a la que an­tes no se te­nía ac­ce­so en lí­nea.

“So­la­men­te si es­tas ma­du­ro en el pro­ce­so de ges­tión de da­tos, en­ton­ces pien­sa en big da­ta. Es com­ple­jo, cos­to­so y re­quie­re de tiem­po y co­no­ci­mien­to es­pe­cia­li­za­do”, re­co­men­da­ron los es­pe­cia­lis­tas de So­lu­cio­nes Glo­ba­les.

¿Có­mo ga­ran­ti­zar la in­ter­ope­ra­bi­li­dad?

Cuan­do nos re­fe­ri­mos a las nue­vas y vie­jas tec­no­lo­gías, re­gu­lar­men­te ha­bla­mos de los sis­te­mas ope­ra­cio­na­les y las pla­ta­for­mas del DWH. Y es que a me­di­da que cre­cen los da­tos y la em­pre­sa, ma­yor ra­pi­dez en la en­tre­ga de la in­for­ma­ción es re­que­ri­da.

La in­ter­faz más im­por­tan­te en una pla­ta­for­ma de DWH es la he­rra­mien­ta ETL (Ex­tract, Trans­form and Load) y el di­se­ño de la ex­trac­ción. Así que mien­tras más es­tan­da­ri­za­do y mo­du­lar es el pro­ce­so de ETL, ma­yor opor­tu­ni­dad de ha­cer in­te­gra­cio­nes trans­pa­ren­tes se ten­drán.

El ETL ha­ce po­si­ble lle­var la in­for­ma­ción de sis­te­mas ope­ra­cio­na­les al Sta­ge Area y de ahí to­do con­ti­nua su cur­so. En pro­yec­tos de sus­ti­tu­ción de sis­te­mas cen­tra­les co­mo SAP, Co­re Ban­ca­rios, Ora­cle, etc, se de­ben ha­cer pro­ce­sos de ETL pa­ra­le­los, de for­ma tal que se pue­dan ir com­pa­ran­do los mo­de­los de da­tos e ir rea­li­zan­do ade­cua­cio­nes cuan­do se ne­ce­si­ten.

Iri­zarry de Mi­cro­da­ta, agre­gó que pa­ra ga­ran­ti­zar la in­ter­ope­ra­bi­li­dad se uti­li­zan li­bre­rías de co­ne­xión (y en ca­so ex­tre­mo ba­jar in­for­ma­ción de los le­gacy ha­cia ar­chi­vos pla­nos y car­gar­la

“El prin­ci­pal ele­men­to que se de­be te­ner en cuen­ta es cuál es la ne­ce­si­dad más apre­mian­te del ne­go­cio y qué quie­re lo­grar­se con el aná­li­sis de to­do su uni­ver­so de in­for­ma­ción”.

en los sis­te­mas mo­der­nos, y vi­ce­ver­sa) en­tre las nue­vas tec­no­lo­gías con los le­gacy sys­tems pa­ra rea­li­zar transac­cio­nes. La ga­ran­tía de in­ter­ope­ra­bi­li­dad de­be con­si­de­rar co­mo mí­ni­mo: ex­per­ti­se téc­ni­co pa­ra uti­li­zar co­rrec­ta­men­te las li­bre­rías de co­ne­xión en­tre los le­gacy sys­tems y los sis­te­mas mo­der­nos, ni­ve­les de se­gu­ri­dad im­ple­men­ta­dos con­si­de­ran­do el trian­gu­lo de la se­gu­ri­dad de la in­for­ma­ción: con­fi­den­cia­li­dad, in­te­gri­dad y dis­po­ni­bi­li­dad.

Co­mo he­mos in­di­ca­do, en un pro­yec­to de EDWH el ETL es el ac­tor prin­ci­pal en es­ta obra. Y es que las he­rra­mien­tas de ETL jue­gan un pa­pel im­por­tan­te en cuan­to a co­nec­ti­vi­dad a fuen­tes de da­tos, en tras­la­do de in­for­ma­ción ca­si en lí­nea y pro­ce­sos batch de in­yec­ción de da­tos.

“Cuan­do tie­nes que cre­cer en da­ta wa­rehou­se por ra­zo­nes de ca­pa­ci­dad de pro­ce­sa­mien­to o es­pa­cio, te das cuen­ta que 60 o 70% apro­xi­ma­da­men­te del uso del DWH es­tá re­la­cio­na­do a ac­ti­vi­da­des de ETL pu­ro. Mien­tras que si vez que 50% de la ca­pa­ci­dad de pro­ce­sa­mien­to es­tá re­la­cio­na­do a ac­ti­vi­da­des de ETL pu­ro lo que pue­des ha­cer es traer las tec­no­lo­gías co­mo big da­ta o Ha­doop, que son muy eco­nó­mi­cas en com­pa­ra­ción al cos­to por gi­gaby­te del da­ta wa­rehou­se tra­di­cio­nal”, ex­pli­có Ale­jan­dro Cho­co­lat, Di­rec­tor La­tin Ame­ri­can Sa­les en Hor­ton­works Inc.

Co­mo to­dos los com­po­nen­tes de es­ta ar­qui­tec­tu­ra ló­gi­ca, el ETL ofre­ce ca­pa­ci­da­des de trans­for­ma­ción au­to­má­ti­ca de da­tos, lo que pue­de apli­car a te­mas de ca­li­dad y con­so­li­da­ción de in­for­ma­ción, y de es­ta ma­ne­ra qui­tar­le es­tas ta­reas de trans­for­ma­ción y ca­li­dad de da­tos a la bo­de­ga co­mo tal. Así la bo­de­ga ló­gi­ca se en­fo­ca­rá no so­lo a al­ma­ce­nar la in­for­ma­ción sino adi­cio­nal­men­te a rea­li­zar cálcu­los en si­tio en don­de la ar­qui­tec­tu­ra lo crea con­ve­nien­te pa­ra su má­xi­ma efi­cien­cia.

“La re­co­men­da­ción es co­no­cer bien la fuen­te de da­tos y lo que va­mos a trans­for­mar son da­tos re­su­mi­dos pa­ra te­ner fle­xi­bi­li­dad que las con­sul­tas sean rá­pi­das que no se tie­nen en las ba­ses de da­tos transac­cio­na­les por­que son más gran­des pa­ra ex­plo­tar bu­si­ness in­te­lli­gen­ce”, opi­nó Edin Ló­pez, ge­ren­te de SAP Bu­si­ness Analy­tics & Da­ta­ba­se, In­ge­sis El Sal­va­dor.

Pre­de­cir el fu­tu­ro

¿Desea sa­ber cuá­les de sus top 10 de clien­tes que le ge­ne­ran el 80% de sus ven­tas anua­les va a de­ser­tar en 7 me­ses y así po­der de­fi­nir con an­te­la­ción un plan de re­ten­ción pa­ra que no se le va­yan esos clien­tes? Un da­ta wa­rehou­se más ana­lí­ti­co se lo pue­de de­cir al uti­li­zar so­lu­cio­nes de Pre­dic­ti­ve Analy­tics pa­ra pre­de­cir com­por­ta­mien­tos de clien­tes, ven­tas, cos­tos y así to­mar ac­ción con un en­fo­que pre­ven­ti­vo.

En es­te sen­ti­do, ade­más de, con­tar con he­rra­mien­tas de mo­de­la­mien­to de da­tos y/o mo­de­los es­ta­dís­ti­cos per­mi­te que los equi­pos fun­cio­na­les pue­dan lan­zar pro­nós­ti­cos que ayu­dan a vi­sua­li­zar es­ce­na­rios del ne­go­cio en el fu­tu­ro.

He­rra­mien­tas co­mo SAS y SPSS ayu­dan a la cons­truc­ción y eje­cu­ción de mo­de­los que per­mi­ten rea­li­zar pro­nós­ti­cos di­ri­gi­dos a in­dus­trias en es­pe­cí­fi­co.

“En­tre las fun­cio­na­li­da­des ex­tras que pue­de te­ner el da­ta wa­rehou­se pa­ra que sea más ana­lí­ti­co es­tán los Pi­vot Ta­ble, ya que se pue­den vi­sua­li­zar re­sul­ta­dos des­de dis­tin­tas di­men­sio­nes”, des­ta­có Sandy Ra­fael Gar­cía, desa­rro­lla­dor de soft­wa­re en Sac Soft­wa­re.

De es­ta ma­ne­ra el DWH le brin­da­rá al ne­go­cio la po­si­bi­li­dad de ana­li­zar da­tos que an­tes era im­po­si­ble ana­li­zar por su can­ti­dad y mag­ni­tud (re­des so­cia­les, sen­so­res, IOT, etc). Es­tos da­tos aho­ra po­drán ser ana­li­za­dos en un úni­co en­torno ana­lí­ti­co, en lí­nea, con po­si­bi­li­dad de aná­li­sis his­tó­ri­co, com­bi­nan­do una pla­ta­for­ma ágil y de muy al­to desem­pe­ño.

Newspapers in Spanish

Newspapers from Guatemala

© PressReader. All rights reserved.