Neue Al­go­rith­men be­wäl­ti­gen Da­ten­flut viel schnel­ler

Jung­wis­sen­schaf­ter der Uni­ver­si­tät Salz­burg kön­nen mit jüngs­ten For­schungs­er­geb­nis­sen auch in­ter­na­tio­nal auf­zei­gen.

Salzburger Nachrichten - - FORSCHUNG UND INNOVATION - SN, Uni Salz­burg

Den bei­den Jung­wis­sen­schaf­tern Tho­mas Hüt­ter und Da­ni­el Ko­cher vom Fach­be­reich Com­pu­ter­wis­sen­schaf­ten an der Uni Salz­burg ist ein Durch­bruch in der Da­ten­bank­for­schung ge­lun­gen. Die bei­den Dok­to­ran­den der For­schungs­grup­pe „Da­ta­ba­se Re­se­arch Group“von Pro­fes­sor Ni­ko­laus Augs­ten be­fass­ten sich mit dem Auf­fin­den und Ver­knüp­fen von hier­ar­chisch or­ga­ni­sier­ten Da­ten, wie sie in di­ver­sen An­wen­dun­gen vor­kom­men. Sie ent­wi­ckel­ten Al­go­rith­men für zwei un­ter­schied­li­che Pro­ble­me, die in man­chen Fäl­len bis zu 1000 Mal schnel­ler sind als bis­her exis­tie­ren­de Lö­sungs­an­sät­ze.

Die Da­ten­bank­for­schung be­schäf­tigt sich mit der tech­ni­schen Be­wäl­ti­gung der Da­ten­flut, die in vie­len Le­bens­be­rei­chen ge­ne­riert und ver­wal­tet wer­den muss. So geht bei­spiels­wei­se ei­ner On­line-Buch­be­stel­lung

das Durch­su­chen ei­ner um­fang­rei­chen Buch­da­ten­bank vor­aus. Re­le­van­te In­for­ma­tio­nen, wie Au­tor, Ti­tel, Gen­re, Da­tum der Ver­öf­fent­li­chung, Be­wer­tun­gen und vie­les mehr, wer­den da­bei in ei­ner Da­ten­bank auf­be­wahrt.

Wenn nun je­mand die­se Da­ten­bank durch­su­chen will, er­ge­ben sich zwei Sze­na­ri­os, bei de­nen die Al­go­rith­men der Jung­for­scher ein­ge­setzt wer­den. Im ers­ten Sze­na­rio müs­sen al­le Paa­re von Bü­chern ge­fun­den wer­den, die ei­ne ge­wis­se Ähn­lich­keit ha­ben, bei­spiels­wei­se um Du­pli­ka­te zu iden­ti­fi­zie­ren. Um je­doch al­le Paa­re in ei­ner Da­ten­bank zu eva­lu­ie­ren, wer­den nor­ma­ler­wei­se meh­re­re Ta­ge be­nö­tigt. Tho­mas Hüt­ter hat da­für ei­ne ef­fi­zi­en­te­re Lö­sung ge­fun­den, die nur Paa­re in Be­tracht zieht, die vie­le Ge­mein­sam­kei­ten auf­wei­sen. So­mit wer­den im bes­ten Fall nur noch ei­ni­ge Se­kun­den be­nö­tigt. Hüt­ters Al­go­rith­mus wur­de auf der „IEEE In­ter­na­tio­nal Con­fe­rence on Da­ta En­gi­nee­ring“, ei­ner der Top­ta­gun­gen der Da­ten­bank­for­schung, ver­öf­fent­licht und kürz­lich in Ma­cau (Chi­na) prä­sen­tiert. Au­ßer­dem er­hielt Hüt­ter für sei­ne her­aus­ra­gen­de Ar­beit den Young In­ves­ti­ga­tor Award 2019 der Uni­ver­si­tät Salz­burg. Ko­be­treu­er der Ar­beit von Tho­mas Hüt­ter ist Ma­teusz Paw­lik vom Fach­be­reich Com­pu­ter­wis­sen­schaf­ten. Im zwei­ten Sze­na­rio steht nur ei­ne Aus­wahl an Da­ten­at­tri­bu­ten zur Ver­fü­gung, bei­spiels­wei­se der Vor­na­me des Au­tors, das Gen­re und die Be­wer­tung. Es sol­len nun je­ne fünf Bü­cher ge­fun­den wer­den, die zu die­sen At­tri­bu­ten am bes­ten pas­sen. Hier­zu hat Da­ni­el Ko­cher ei­nen Al­go­rith­mus ent­wi­ckelt, der in vie­len Fäl­len nicht al­le Bü­cher durch­sucht, son­dern nur fünf be­trach­ten muss, um das ge­wünsch­te Er­geb­nis zu lie­fern.

Da­durch ist Ko­chers Lö­sung op­ti­mal. Sei­ne Ar­beit wur­de auf der pres­ti­ge­träch­ti­gen Da­ten­bank­kon­fe­renz „ACM In­ter­na­tio­nal Con­fe­rence on Ma­nage­ment of Da­ta“ver­öf­fent­licht und vor Kur­zem in Ams­ter­dam (Nie­der­lan­de) prä­sen­tiert.

Die For­schung im Be­reich der Ähn­lich­keits­su­che der „Da­ta­ba­se Re­se­arch Group“wird teil­wei­se durch den FWF (Fonds zur För­de­rung der wis­sen­schaft­li­chen For­schung) fi­nan­ziert.

BILD: SN/UNI­VER­SI­TÄT SALZ­BURG/ANDRE­AS KO­LA­RIK

Neu­en Al­go­rith­men auf der Spur, v. l.: Tho­mas Hüt­ter, Da­ni­el Ko­cher, Ma­teusz Paw­lik und Ni­ko­laus Augs­ten.

Newspapers in German

Newspapers from Austria

© PressReader. All rights reserved.