Dr. Aleš Bošnjak, direktor Izuma
Dr. Aleš Bošnjak Direktor Izuma, ki upravlja superračunalnik Vega, veliko ve tudi o digitalnih zbirkah podatkov
»Superračunalnik Vega bo primeren za analize na področjih, kot so teoretska izika in izika delcev, astroizika, vremenoslovje, biomedicina, genska tehnologija in nevroznanost, predvsem pa bi poudaril umetno inteligenco.«
»Temeljnih in prebojnih raziskav si danes brez uporabe superračunalnika ne moremo več predstavljati,« pravi dr. Aleš Bošnjak, direktor Instituta informacijskih znanosti Izum v Mariboru, kjer so pred dvema mesecema uradno zagnali superračunalnik Vega. Ta uvršča Slovenijo po računalniški moči med prvih 15 držav na svetu.
Mojca Vizjak Pavšič
Superračunalnik, ki je dobil ime po slovenskem matematiku Juriju Vegi, lahko izvede več kot 6,9 petaflopov oziroma 6,9 milijona milijard izračunov na sekundo, kar je približno toliko, kot če bi 40 tisoč osebnih računalnikov hkrati izvajalo isto računsko operacijo, omogoča pa tudi izredno hiter prenos podatkov do drugih superračunalniških centrov in njihovo trajno hrambo. Projekt Vega soinancirata Skupno podjetje za evropsko visokozmogljivostno računalništvo EuroHPC iz evropskih sredstev in ministrstvo za izobraževanje, znanost in šport, skupna vrednost investicije znaša 17,2 milijona evrov.
S tem ko je podjetje EuroHPC prepoznalo potencial Izuma v tesnem sodelovanju s Slovenskim superračunalniškim omrežjem (SLING), je Slovenija postala del vseevropske iniciative za izgradnjo evropskega superračunalniškega ekosistema World Class Supercomputing Ecosystem in Europe.
Dr. Bošnjak, kakšen je po vašem mnenju pomen superračunalnika Vega za Slovenijo in kaj bo omogočal?
Superračunalnik Vega postavlja Slovenijo po računski moči na sam vrh evropskih držav, hkrati pa odpira za Izum povsem novo področje delovanja, s čimer bomo dodali še en izjemno pomemben gradnik k podpori slovenskim raziskovalcem, kajti omogočal bo izvajanje najzahtevnejših raziskav v vedah, ki delajo z velikimi količinami podatkov in zahtevnimi računskimi operacijami. Primeren bo torej za analize na področjih, kot so teoretska izika in izika delcev, astroizika, vremenoslovje, biomedicina, genska tehnologija in nevroznanost, predvsem pa bi poudaril umetno inteligenco. Za ponazoritev zahtevnosti tovrstnih analiz lahko navedem odmevno odkritje Higgsovega bozona kot enega najbolj znanih raziskovalnih projektov zadnjega časa, pri izvajanju katerega so uporabljali okoli 100 različnih superračunalnikov, povezanih v omrežje.
Doslej Slovenija ni imela dobrega dostopa do superračunalnikov. Slovenski raziskovalci so morali na zahtevne obdelave podatkov čakati v dolgih vrstah v tujini, Vega pa omogoča, da bodo svoje raziskave lahko izvajali tekoče in brez zastojev ter enakopravno sodelovali v velikih mednarodnih raziskovalnih projektih. Poleg tega bo sistem omogočal prenos znanja v gospodarstvo, kajti okoli 20 odstotkov računalniške moči bomo namenjali slovenski industriji. Ker je podjetje EuroHPC soinanciralo naš superračunalnik v vrednosti šest milijonov evrov, smo v zameno obvezani zagotoviti okoli 35 odstotkov računalniške moči tudi evropskim raziskovalcem.
Ob začetku delovanja sistema Vega, ki je nastal z vizijo, da bomo v prihodnosti razvili nacionalni superračunalniški center, moram omeniti tudi sodelovanje s slovensko akademsko in raziskovalno mrežo Arnes, kjer bo na voljo center za hrambo večjih količin podatkov. Tudi sicer je Arnes s svojim računskimi kapacitetami in znanjem pomemben partner v slovenskem superračunalništvu.
Katere raziskave na superračunalniku Vega že potekajo?
Zdaj izvajamo projekt za švedsko podjetje NorthVolt, ki želi z razvojem baterij zmanjšati emisije CO2 v prometu. Za optimizacijo kemičnih procesov, ki potekajo v baterijah, so namreč potrebni zelo zahtevni izračuni. Sodelovali smo tudi pri iskanju zdravila za covid-19. Ob tem moram poudariti, da je superračunalnik Vega šele v t. i. testnem pogonu, kar pomeni, da je francosko podjetje Atos, ki ga je zgradilo, izpolnilo vse predpisane pogoje, zdaj pa bomo v okviru superračunalniškega združenja Sling in z ministrstvom kot osnovnim inancerjem določili pravila glede dostopa, in šele ko bodo ta pravila znana, bo mogoč pravi dostop. Za zdaj torej lahko govorimo le o testnem dostopu, kar je za nas tudi dobro, saj pri izvajanju testnih projektov pridobivamo izkušnje. Superračunalnik Vega bomo uporabljali tudi v izobraževalne namene v okviru projekta Herkules, pri katerem bo pri izvajanju evropskega magistrskega študija superračunalništva sodelovala Univerza v Ljubljani, mi pa bomo dali študentom na voljo naš superračunalnik.
Ste za upravljanje zaposlili nove inženirje?
Naša ekipa je zelo močna. Dodatno smo zaposlili šest odličnih računalničarjev, ki jim pomagajo naši dosedanji sistemski inženirji, ki so zelo izkušeni na tem področju, saj je Izum že 30 let infrastrukturni zavod, ki skrbi za programsko podporo in računalniško opremo knjižnic. Kot predvidevamo, bomo svoje dejavnosti kmalu razširili in bomo potrebovali dodatne strokovnjake.
Slovenija še vedno nima enotne platforme za iskanje in dostop do celotnih besedil elektronskih informacijskih virov. Kakšni so vaši načrti glede reševanja tega problema?
Že na začetku leta 2018 smo podpisali deklaracijo o akademski digitalni zbirki kot enotnem nacionalnem viru podatkov za najširši krog uporabnikov slovenskega raziskovalnega prostora, saj je postalo digitalno okolje z različnimi viri in oblikami vsebin prevladujoči vir informacij za akademsko sfero. Najprej smo začeli integracijo tujih elektronskih virov. Do takrat so imeli namreč tuje informacijske vire naročene na vsaki univerzi posebej in na raziskovalnih institutih posebej, za kar so te ustanove namenjale veliko denarja za licenčnine in nabavo informacijskih virov. Z najsodobnejšimi tehnologijami nam je uspelo narediti iskalno orodje, s katerim lahko najdemo prav vse elektronske vire, ki so bili kjerkoli v Sloveniji kupljeni oziroma indeksirani. Z drugimi besedami to pomeni, da na primer, če je raziskovalec v Mariboru želel videti določen vir, ki ga je naročila ljubljanska univerza, mariborska pa ne, na svojem portalu ni mogel do njega. Pravzaprav bi moral iti skozi šest portalov, kar je bilo praktično neizvedljivo.
Država je naša prizadevanja močno podprla z nakupom skupnega orodja za odkrivanje podatkov, t. i. discovery tool, mi pa smo morali nato vse sprogramirati, kar je bilo tudi za ponudnika tega orodja nekaj novega, saj običajno prodajo cel paket, ne samo tehnologijo indeksiranja. S pomočjo njihovega indeksa smo potem lahko nadgradili iskalnik Cobiss+. To je velika prednost, saj bomo v prihodnje v ta sistem vključili tudi vsa dela slovenskih raziskovalcev.
Bo to Sloveniji omogočilo tudi, da bo postala aktivna članica evropskih sistemov za odprti dostop? Slovenija je že aktivna članica teh iniciativ. Naš naslednji strateški cilj je podpora odprtemu dostopu do znanstvenih informacij, kar vključuje odprti dostop tako do recenziranih znanstvenih objav kot do raziskovalnih podatkov, če so bile objave in raziskave inancirane z javnimi sredstvi. Trenutno obstaja v Sloveniji osem različnih lokalnih repozitorijev, ki pa med seboj niso sinhronizirani, saj se zapisi za gradivo in celotno besedilo vanje vnašajo na različne načine. Zapisi so zato deloma tudi dvojniki, nekateri pa sploh niso povezani s sistemom Cobiss, ki bi zanje edini lahko zagotavljal ustrezne metapodatke. Zato lahko rečemo, da so ti sistemi zdaj ne samo lokacijsko distribuirani, ampak so tudi heterogeni, saj se vanje vnaša po različnih pravilih. In ko bomo še to povezali, bodo uporabniki zapise našli v eni referenčni bazi.
Kdaj bo nacionalni referenčni repozitorij odprte znanosti začel delovati?
Repozitorija ljubljanske in mariborske univerze smo že povezali, zdaj nadaljujemo z drugimi, kar pomeni, da je nacionalni referenčni repozitorij že zgrajen. Predvidevamo, da bo začel delovati v letu dni.
Slovenski znanstveniki, ki so zaposleni na univerzah in raziskovalnih ustanovah v tujini, opozarjajo, da praviloma ne morejo kandidirati na razpisana delovna mesta na univerzah in inštitutih v Sloveniji, ker svojih objavljenih del nimajo vpisanih v Cobiss oziroma Sicris. Kakšno je vaše mnenje?
To je problem, ki izhaja iz uzakonjenih pravil. Država je namreč predpisala sistem evidentiranja izvajalcev raziskovalne dejavnosti, katerega javno dostopni podaljšek je Informacijski sistem Sicris.
Raziskovalci iz raziskovalnih organizacij, ki želijo kandidirati za proračunska sredstva, namenjena raziskovalnim projektom in programom, morajo biti vpisani vanj; podobno velja za habilitirane visokošolske predavatelje. Med njihovimi raziskovalnimi dosežki so na pomembnem mestu tudi njihova objavljena dela, kot so članki, monograije in drugo, za katera izvemo v nacionalnem vzajemnem bibliografskem sistemu Cobiss.
Za raziskovalce, ki so zaposleni zunaj slovenskega javnega raziskovalnega sveta ali v tujini, je to precej velika težava, saj je med pogoji za prijavo na delovno mesto visokošolskega predavatelja habilitacija za določeno področje, podobno kot tudi za izvolitev v ustrezen znanstveni oziroma raziskovalni naziv. In če kandidat želi biti habilitiran ali uvrščen v posvečeni krog raziskovalne smetane, mora podati svojo v Sicrisu ovrednoteno bibliograijo, te pa tuji raziskovalci – lahko so tudi nobelovci – praviloma nimajo, ker jih nobena slovenska raziskovalna institucija ni prijavila ministrstvu oz. niso imeli knjižnice, kot jo ima recimo Lek, ki bi jih k nam vpisala. Zato menim, da bi te raziskovalce morali obravnavati posebej, ne zgolj s klasičnimi postopki, ampak vsebinsko. Tudi v tujini delajo tako. Na večjih univerzah – sam dobro poznam švicarsko ETH, kjer sem nekaj časa delal – je glavna oseba, ki sprejema kadrovske odločitve, rektor, ki mu kandidat predloži šest svojih najboljših objav, ne glede na to, ali je kjerkoli vpisan. Potem strokovna komisija oceni njihovo kakovost in na podlagi te ocene rektor sprejme končno odločitev. Skratka, šest del je v tujini dovolj, naši raziskovalci pa morajo objaviti čim več, da pridobijo dovolj točk za habilitacijo v višji naziv ali dobijo projekt na ARRS, in so bolj zavezani količini – vsaj da prestopijo prvi prag. Če bi naše univerze svojo samostojnost izkoriščale tako, kot bi jo lahko, bi po mojem mnenju lahko tudi te najboljše ljudi zaposlile, saj je v Sicrisu ovrednotena bibliograija samo eden od pogojev. In naj ne bodo to samo številke, naj bo za njimi vedno kakovost. Če bi bilo tako pri nas, bi se odličnost lahko dokaj dvignila. Pomembno je, da dajemo kakovosti prednost pred količino.
Po drugi strani je sicer razumljivo, da ustanove, kot je ARRS, ki dobijo na razpisu za projekte tudi po tisoč prijav, potrebujejo mehanizem, ki prijave vsaj v osnovi preiltrira in oceni. Menim, da so bibliometrične metode zagotovo pomembne in uporabne še zlasti v primerih, ko je treba oceniti veliko število ljudi. Vsekakor pa je treba te metode uporabljati na pravi način.
Cobiss.net, ki povezuje že več kot 1400 knjižnic in se postopoma širi, je sodobno zasnovana informacijska mreža, ki v državah jugovzhodne Evrope deluje kot infrastruktura za izmenjavo informacij, s tem pa spodbuja tudi medkulturni dialog v regiji. Cobiss.net je bil oblikovan po slovenskem vzoru v državah na območju nekdanje Jugoslavije iz zgodovinskih razlogov. Projekt sistema katalogizacije je namreč na začetku inanciralo jugoslovansko ministrstvo in vanj so bile vključene nacionalne knjižnice vseh republik, razen Hrvaške, ki je vedno hotela imeti svoj sistem in tako je še danes. Po razpadu Jugoslavije smo vsaki od teh držav ponudili svoj sistem, pozneje so se pridružili še Bolgarija, Kosovo in Albanija.
Sistem deluje tako, da imamo v vsaki državi oziroma sistemu centralno bazo katalogizacij oziroma bibliografskih zapisov, iz katere črpajo podatke vse pridružene knjižnice. Če dobi katerakoli od knjižnic novo gradivo, ga vnese v vzajemno bazo, kar je prineslo veliko racionalizacijo in izjemne prihranke, saj se zapisi več ne podvajajo. Zasluga za to gre soustanovitelju in dolgoletnemu direktorju Izuma mag. Tomažu Seljaku, ki je s svojimi takratnimi sodelavci sistem Cobiss.net razvil. Naš cilj je, da bi v prihodnje naše storitve v vzhodni regiji Evrope še bolj razširili in s tem povečali informacijsko mrežo Cobiss.net.
Digitalne tehnologije se zelo hitro razvijajo. V strateškem načrtu Izuma za obdobje 2019–2024 omenjate med drugim nove paradigme semantičnega spleta. Kakšna so vaša predvidevanja na tem področju?
To je moje ožje študijsko področje. Semantični splet se je začel razvijati že pred več kot 15 leti, ampak v zadnjem času dobiva vse večji pomen, saj vsi sodobni iskalniki uporabljajo semantične tehnologije. Najbolj znan uporabnik semantičnega spleta je seveda Google, ki vključuje vse baze ontologij. Semantični splet pomeni, da je za vsako vsebinsko področje narejena posebna ontologija oziroma baza, v katero se na točno določen način zapisujejo pojmi, njihovi ožji in širši pomeni ter omejitve in pravila sklepanja. V Izumu želimo poleg ontologij, ki na spletu že obstajajo, in iskalnika, ki smo ga izdelali na zelo speciičen način, v prihodnje uporabljati tudi našo lastno ontologijo, ki jo imenujemo Splošni geslovnik Cobiss. Razvijamo ga že 20 let s pomočjo nacionalne in drugih slovenskih knjižnic, vsebuje pa okoli 60.000 pojmov. Nekaj knjižnic ga že uporablja, načrtujemo pa, da bodo v kratkem vse slovenske knjižnice katalogizirale gradivo s pomočjo našega splošnega semantičnega geslovnika. To bo omogočilo bistveno hitrejše in bolj učinkovito iskanje, s čimer bomo svoje uporabnike podprli na podoben način, kot jih podpira Google.
»Izum je zelo pomemben instrument pospeševanja izgradnje informacijske in digitalne družbe oziroma sodobne družbe znanja,« poudarjate v strateškem načrtu vaše ustanove. Vam je v sistem Cobiss uspelo vključiti tudi vse slovenske šolske knjižnice?
To je bila že več let ena naših glavnih nalog, vendar smo bili dolgo neuspešni, ker spadajo šolske knjižnice pod ministrstvo za izobraževanje, znanost in šport, javne pa pod ministrstvo za kulturo, a v zadnjem obdobju smo imeli srečo, da so pri tem projektu na ministrstvu sodelovali zelo dobri strokovnjaki. Dr. Vesna Čopič, ki projekt vodi in je odlična poznavalka te problematike, je znala učinkovito povezati vse deležnike in tako nam je uspelo v Cobiss vključiti vseh 600 šolskih knjižnic, ki so prej delale zunaj nacionalnega vzajemnega sistema z drugimi orodji. Prehod z enega računalniškega paketa na drugega je bil za mnoge knjižnice zelo zahteven, ker je marsikje podpora vodstva šolskemu knjižničarju razmeroma slaba. Mislim, da bo to treba spremeniti, saj so v uspešnih državah prav šolski knjižničarji osrednje osebe na šoli in tudi vedno sodelujejo na ravnateljevih posvetih. Poleg tega da znajo otrokom pokazati, kako naj poiščejo in uporabljajo informacije, lahko učiteljem in vodstvu šole posredujejo ogromno informacij iz podatkovne zakladnice vseh šol, pomembno poslanstvo šolskih knjižničarjev pa je tudi, da šolarje in dijake spodbujajo k branju, kar menim, da je ena glavnih kvalitet odlične družbe.
Z najsodobnejšimi tehnologijami nam je uspelo narediti iskalno orodje, s katerim lahko najdemo prav vse elektronske vire, ki so bili kjerkoli v Sloveniji kupljeni oziroma indeksirani.
Superračunalnik Vega bo primeren za analize na področjih, kot so teoretska izika in izika delcev, astroizika, vremenoslovje, biomedicina, genska tehnologija in nevroznanost, predvsem pa bi poudaril umetno inteligenco.
Šest del je v tujini dovolj, naši raziskovalci pa jih morajo objaviti čim več, da pridobijo dovolj točk za habilitacijo v višji naziv ali dobijo projekt na ARRS, in so bolj zavezani količini.