MÁ­QUI­NAS DE LA VER­DAD

Usan­do he­rra­mien­tas de Ma­chi­ne Lear­ning y pro­ce­sa­mien­to de len­gua­je na­tu­ral, un si­tio desa­rro­lló un “bot” que bus­ca fra­ses ve­ri­fi­ca­bles en el dis­cur­so pú­bli­co.

Infotechnology - - .COM TRENDING - Por Se­bas­tián De To­ma

¿Mien­ten los po­lí­ti­cos?

Che­quea­do es un si­tio web ar­gen­tino don­de, gra­cias a un staff de pe­rio­dis­tas, desa­rro­lla­do­res y vo­lun­ta­rios, se pu­bli­ca la ve­ri­fi­ca­ción de la ve­ra­ci­dad del dis­cur­so pú­bli­co de per­so­na­li­da­des re­co­no­ci­das del mun­do so­cial (prin­ci­pal­men­te po­lí­ti­cos), así co­mo la de la in­for­ma­ción da­da a co­no­cer por los me­dios de pren­sa lo­ca­les. Pa­ra lo­grar su co­me­ti­do, uti­li­zan fuentes ofi­cia­les y las ela­bo­ra­das por or­ga­nis­mos no gu­ber­na­men­ta­les y en­ti­da­des pri­va­das. El por­tal na­ció en 2010, es man­te­ni­do por La Voz Pú­bli­ca, una fun­da­ción sin fi­nes de lu­cro y hoy es di­ri­gi­do por la pe­rio­dis­ta y abo­ga­da Lau­ra Zom­mer. Con re­cur­sos aco­ta­dos, de­ci­dir dón­de po­ner las ener­gías al mo­men­to de ele­gir los dis­cur­sos e in­for­ma­cio­nes que de­ben ser che­quea­dos no es sen­ci­llo. Por es­ta ra­zón es que de­ci­die­ron desa­rro­llar “Che­quea­do­bot”, una he­rra­mien­ta que au­to­má­ti­ca­men­te de­tec­ta de­cla­ra­cio­nes que apa­re­cen en 25 me­dios pe­rio­dís­ti­cos ar­gen­ti­nos y las com­pa­ra con los che­queos exis­ten­tes.

El “bot”, que uti­li­za téc­ni­cas de pro­ce­sa­mien­to de len­gua­je na­tu­ral y Ma­chi­ne Lear­ning, con una fun­cio­na­li­dad que lla­ma­ron sen­ci­lla­men­te “¿Qué se che­quea hoy?”, se usa ya des­de los pri­me­ros me­ses del año pa­sa­do en las reunio­nes de su­ma­rio de to­dos los lu­nes (cuan­do los pe­rio­dis­tas pre­sen­tan sus pro­pues­tas de no­tas). “Cree­mos que usar Che­quea­bot en las reunio­nes es muy útil por­que nos ayu­da, con un im­por­tan­te gra­do de exac­ti­tud, en­con­tran­do fra­ses pa­ra che­quear que no ha­bía­mos vis­to. Ade­más, nos sir­ve que en­cuen­tre de­cla­ra­cio­nes de to­do el país. Eso nos ayu­da a evi­tar ese ses­go que nos ha­ce en­fo­car­nos so­lo en el área me­tro­po­li­ta­na de Bue­nos Aires”, de­cla­ra Pa­blo Fer­nán­dez, di­rec­tor de In­no­va­ción Edi­to­rial de la or­ga­ni­za­ción.

De­sa­fíos

El pro­ble­ma pa­ra desa­rro­llar el “bot” es que no exis­ten he­rra­mien­tas lo su­fi­cien­te­men­te desa­rro­lla­das que per­mi­tan pro­gra­mar­los en es­pa­ñol. Es­to lo des­cu­brie­ron cuan­do tra­ba­ja­ron con Full Fact, una pla­ta­for­ma in­gle­sa de che­queo que tam­bién desa­rro­lla he­rra­mien­tas au­to­ma­ti­za­das. De­trás del “Che­quea­bot” es­tá el desa­rro­lla­dor Ma­riano Fal­cón, un in­ge­nie­ro de Sis­te­mas de la Uni­ver­si­dad Tec­no­ló­gi­ca Na­cio­nal (UTN). En diá­lo­go con INFOTECHNOLOGY.COM, cuen­ta que las he­rra­mien­tas de pro­ce­sa­mien­to de len­gua­je na­tu­ral avan­za­das es­tán desa­rro­lla­das en in­glés, co­mo la de la Uni­ver­si­dad de Stan­ford o la Apa­che OPENNLP. In­clu­yen fun­cio­na­li­da­des en es­pa­ñol, pe­ro me­nos desa­rro­lla­das. Por eso, pa­ra el “bot” de Che­quea­do, se de­ci­dió por Free­ling, una he­rra­mien­ta de la Uni­ver­si­dad Po­li­téc­ni­ca de Ca­ta­lu­ña, Nltk y Gen­sim pa­ra ex­traer texto, ana­li­zar las ora­cio­nes y desa­rro­llar el pro­ce­so de Ma­chi­ne Lear­ning pre­dic­ti­vo que ha­ce fun­cio­nar al “Che­quea­bot”. “Te per­mi­te su­plan­tar li­bre­rías en in­glés, que son su­pe­rio­res, con es­tas con las que se pue­de lle­gar a ni­ve­les si­mi­la­res pa­ra ob­te­ner ca­rac­te­rís­ti­cas de las fra­ses co­mo tiem­po ver­bal o di­fe­ren­ciar una afir­ma­ción de una pre­gun­ta, que son to­das ca­rac­te­rís­ti­cas del len­gua­je que nos per­mi­ten es­ta­ble­cer si una fra­se es che­quea­ble o no”, se­ña­la el pro­gra­ma­dor.

Una vez que el sis­te­ma to­ma las fra­ses y ex­trae las ca­rac­te­rís­ti­cas lin­güís­ti­cas, se ha­ce un en­tre­na­mien­to de Ma­chi­ne Lear­ning pa­ra que el sis­te­ma apren­da a dis­tin­guir las fra­ses qué se pue­den che­quear de las que no. “To­ma­mos dis­cur­sos che­quea­dos an­te­rior­men­te y mar­ca­mos que fra­ses eran che­quea­bles y cuá­les no.” Con es­te apren­di­za­je a cues­tas, el mo­de­lo de Ma­chi­ne Lear­ning asig­na pro­ba­bi­li­da­des. “Nun­ca al­go es 100 por cien­to che­quea­ble o 100 por cien­to no che­quea­ble”, aclara Fal­cón. “Lo en­tre­na­mos una vez por mes pa­ra me­jo­rar­lo. Hoy, la exac­ti­tud pro­me­dio es del 90 por cien­to.”

Newspapers in Spanish

Newspapers from Argentina

© PressReader. All rights reserved.