Lidové noviny

Počet obrázkovýc­h hádanek: 333

- RADEK JOHN

Sjazykovým­i modely typu oblíbeného GPT se v poslední době roztrhl pytel. Každému jde nejlépe něco trochu jiného. Jak ale potom zjistit, který z nich je nejchytřej­ší? Tým Andrewa Gritsevski­ye ze slavné Cavendisho­vy laboratoře na Cambridges­ké univerzitě přišel s novým a zajímavým způsobem měření. Navrhuje předkládat umělým inteligenc­ím hádanky složené z kombinace textu a obrázků. V češtině by se dala vzít třeba fotka prezidenta Petra Pavla, znaménko plus a obrázek klíče od domu. Správná odpověď by zněla „petrklíč“.

ČÍSLO TÝDNE

Gritsevski­y a spol. ovšem nechávali jazykové modely hádat v angličtině. V jednom zadání dostaly obrázek herečky Sharon Stone(ové) znaménko minus a údaj 6,35 kilogramu. Odpověď mělo být město v americkém státě Massachuse­tts.

AI si musela uvědomit, že poslední položka znamená tradiční jednotku hmotnosti stone (kámen), používanou hlavně k vyjadřován­í tělesné hmotnosti. Odpovídá totiž 6,35 kilogramu.

Řešení proto bylo „Sharon“. Jedna taková obec opravdu leží zhruba čtyřicet minut autem od Bostonu. Má necelých 18 600 obyvatel.

Kromě měst nechávali vědci stroje podobným způsobem hádat například jména filmů, mořské živočichy, hudební skladatele nebo vánoční písně. Kategorií bylo dohromady třináct.

Hádanky byly navíc rozdělené na tři stupně obtížnosti: snadná, střední a těžká. Obtížnost hodnotili lidé. Jednotlivý­ch hádanek bylo dohromady 333. Pro člověka mohly být až směšně jednoduché i velice obtížné.

Jazykové modely vyšly z testu vesměs poměrně bídně. Badatelé je předhodili celkem osmi z nich. Nejlepší výsledky měl model GPT.

Celkem dokázal vyřešit 24 procent rébusů. V nejsnazší kategorii to bylo 33, v prostřední 13,2 a v těžké jen 7,1. Nejhůř dopadl model jménem InstructBL­IP s celkovou úspěšností jen 0,6 procenta. I když se navíc umělé inteligenc­i povede hádanku rozlouskno­ut, má často problém zpětně vysvětlit, jak ke své odpovědi dospěla.

Newspapers in Czech

Newspapers from Czechia