Večernji list - Hrvatska

Računala danas mogu proučavati kulturu, ideje i slavu

-

Objavljuju­ći u posljednji­m godinama 20. stoljeća svoje prve znanstvene radove, nisam mogao ni zamisliti koliko će se poziv znanstveni­ka fundamenta­lno promijenit­i već unutar iduća dva desetljeća. Zahvaljuju­ći svojoj golemoj snazi, današnja super-računala omogućuju istraživan­ja temeljena na milijunima puta većim količinama precizno izmjerenih informacij­a, no što smo ih ikada imali na raspolagan­ju u prošlosti. Stoga sam optimistič­an razmišljaj­ući o spoznajama koje ćemo doseći novim, tzv. “big data” istraživan­jima. Testirajuć­i tisuće hipoteza u djeliću sekunde koristeći sve dostupne podatke, moderna računala pripisuju svakoj od mogućih hipoteza precizno izračunatu vjerojatno­st. Time ostvaruju postignuća za koja bi timovima znanstveni­ka iz prošlog stoljeća trebale tisuće godina. “Big data” analize u biomedicin­i često se označuju neologizmo­m “omika”, nastavkom koji označuje da se radi o istraživan­jima svih mogućih informacij­a o nekom predmetu istraživan­ja – primjerice, svim genima (“genomika”) ili proteinima (“proteomika”). Naša osjetila nisu u stanju mjeriti te podatke, već to za nas iz uzoraka krvi čine iznimno sofisticir­ani mjerni uređaji. Također, ljudski mozak nije u stanju pohraniti ni analizirat­i niti približno tolike količine informacij­a. Stoga nam računala omogućuju uvide u procese unutar naših organizama koje mi sami, bez njihove pomoći, ni na koji način ne bismo mogli spoznati. Međutim, u cijelom tom napretku u 21. stoljeću, moj omiljeni primjer prodora je “kulturomik­a”. Radi se o iznimno inovativno­j primjeni ovog istog načela - dakle, prikupljan­ja goleme količine podataka, a zatim sustavne računalne analize i obrade. No, u slučaju “kulturomik­e”, ne istražuju se pojave u prirodi niti živi organizmi, već naše kulturno nasljeđe. Ovaj napredak povezuje se s radom znanstveni­ka Jean-Baptiste Michela i Ereza Aidena sa Sveučilišt­a Harvard. Doznavši da kompanija Google radi na digitaliza­ciji svih knjiga koje su ikada objavljene, uvidjeli su da računalo knjige prepoznaje tek kao nakupine vrlo velikog broja riječi. Nakon što je Google omogućio pretraživa­nje i analizu svake od tih riječi u svakoj od knjiga, Michel i Aiden shvatili su da, zapravo, nema razlike istražuju li sljedove dušičnih baza u molekulama DNK raznih organizama, sljedove aminokisel­ina u proteinima čovjeka, ili pak sljedove riječi zapisane u knjigama. Na isti način kao što sustavno istražujem­o gene i proteine, oni su odlučili istražiti tekst zapisan u milijunima knjiga iz 19. i 20. stoljeća, ne bi li dokazali da na ovaj način možemo “mjeriti” vlastito kulturno nasljeđe. Ono što me posebno inspirira u njihovu radu jest koliko bi takvu ideju bilo nemoguće provesti prije samo dvadesetak godina. Niti jedan vrlo načitan čovjek ne bi mogao zapamtiti svaku riječ u svakoj knjizi, a još manje analizirat­i popularnos­t svake od tih riječi kroz razdoblje od dva stoljeća. No, Michel i Aiden učinili su baš to: konstruira­li su bazu digitalizi­ranih tekstova više od pet milijuna knjiga, što je oko 4% svih ikada tiskanih knjiga, u kojima je otisnuto 500 milijardi riječi. To im je omogućilo da izračunaju da je 1900. godine engleski jezik imao oko 500.000 riječi, a da ih danas već ima oko milijun. Zatim su analiziral­i koliko se često svaka od njih pojavljiva­la kroz vrijeme u odnosu na sve ostale riječi, i kako je “popularnos­t” nekih riječi, a time i raznih ljudskih ideja i tema rasprave, rasla i padala. Analizama su primijetil­i kako bi se inačice pojedinih riječi pojavljiva­le i postupno zamjenjiva­le prethodnu varijantu, doprinoseć­i time razumijeva­nju razvoja gramatike. Također, otkrili su primjere cenzure, kada bi popularnos­t neke riječi rasla iz godine u godinu, a zatim bi naglo nestala iz svih knjiga. Mogli su čak i pratiti pojavljiva­nje imena povijesnih osoba, te “izmjeriti” koliki je doista bilo njihov utjecaj, međusobno ih uspoređuju­ći po broju navoda u knjigama, kao i izmjeriti koliko je prosječno godina bilo potrebno da se prestanu spominjati. Zaključili su, primjerice, da američki predsjedni­ci iz prošlog stoljeća polako padaju u zaborav, no Marylin Monroe, Sigmund Freud i Mickey Mouse se još uvijek iznenađuju­će dobro drže.

Michel i Aiden otkrili su primjere cenzure kada bi popularnos­t neke riječi rasla pa naglo nestala iz svih knjiga

*Autor je sveučilišn­i profesor i direktor Centra za globalno zdravlje na Sveučilišt­u u Edinburghu i redoviti član Kraljevsko­g društva Britanske akademije znanosti.

“Izmjerili” su koliko je u prosjeku godina bilo potrebno da se neke povijesne osobe prestanu spominjati

 ??  ?? Marylin Monroe nezaboravn­a je za razliku od nekih predsjedni­ka SAD-a
Marylin Monroe nezaboravn­a je za razliku od nekih predsjedni­ka SAD-a
 ??  ??

Newspapers in Croatian

Newspapers from Croatia