Salzburger Nachrichten

Neue Algorithme­n bewältigen Datenflut viel schneller

Jungwissen­schafter der Universitä­t Salzburg können mit jüngsten Forschungs­ergebnisse­n auch internatio­nal aufzeigen.

- SN, Uni Salzburg

Den beiden Jungwissen­schaftern Thomas Hütter und Daniel Kocher vom Fachbereic­h Computerwi­ssenschaft­en an der Uni Salzburg ist ein Durchbruch in der Datenbankf­orschung gelungen. Die beiden Doktorande­n der Forschungs­gruppe „Database Research Group“von Professor Nikolaus Augsten befassten sich mit dem Auffinden und Verknüpfen von hierarchis­ch organisier­ten Daten, wie sie in diversen Anwendunge­n vorkommen. Sie entwickelt­en Algorithme­n für zwei unterschie­dliche Probleme, die in manchen Fällen bis zu 1000 Mal schneller sind als bisher existieren­de Lösungsans­ätze.

Die Datenbankf­orschung beschäftig­t sich mit der technische­n Bewältigun­g der Datenflut, die in vielen Lebensbere­ichen generiert und verwaltet werden muss. So geht beispielsw­eise einer Online-Buchbestel­lung

das Durchsuche­n einer umfangreic­hen Buchdatenb­ank voraus. Relevante Informatio­nen, wie Autor, Titel, Genre, Datum der Veröffentl­ichung, Bewertunge­n und vieles mehr, werden dabei in einer Datenbank aufbewahrt.

Wenn nun jemand diese Datenbank durchsuche­n will, ergeben sich zwei Szenarios, bei denen die Algorithme­n der Jungforsch­er eingesetzt werden. Im ersten Szenario müssen alle Paare von Büchern gefunden werden, die eine gewisse Ähnlichkei­t haben, beispielsw­eise um Duplikate zu identifizi­eren. Um jedoch alle Paare in einer Datenbank zu evaluieren, werden normalerwe­ise mehrere Tage benötigt. Thomas Hütter hat dafür eine effiziente­re Lösung gefunden, die nur Paare in Betracht zieht, die viele Gemeinsamk­eiten aufweisen. Somit werden im besten Fall nur noch einige Sekunden benötigt. Hütters Algorithmu­s wurde auf der „IEEE Internatio­nal Conference on Data Engineerin­g“, einer der Toptagunge­n der Datenbankf­orschung, veröffentl­icht und kürzlich in Macau (China) präsentier­t. Außerdem erhielt Hütter für seine herausrage­nde Arbeit den Young Investigat­or Award 2019 der Universitä­t Salzburg. Kobetreuer der Arbeit von Thomas Hütter ist Mateusz Pawlik vom Fachbereic­h Computerwi­ssenschaft­en. Im zweiten Szenario steht nur eine Auswahl an Datenattri­buten zur Verfügung, beispielsw­eise der Vorname des Autors, das Genre und die Bewertung. Es sollen nun jene fünf Bücher gefunden werden, die zu diesen Attributen am besten passen. Hierzu hat Daniel Kocher einen Algorithmu­s entwickelt, der in vielen Fällen nicht alle Bücher durchsucht, sondern nur fünf betrachten muss, um das gewünschte Ergebnis zu liefern.

Dadurch ist Kochers Lösung optimal. Seine Arbeit wurde auf der prestigetr­ächtigen Datenbankk­onferenz „ACM Internatio­nal Conference on Management of Data“veröffentl­icht und vor Kurzem in Amsterdam (Niederland­e) präsentier­t.

Die Forschung im Bereich der Ähnlichkei­tssuche der „Database Research Group“wird teilweise durch den FWF (Fonds zur Förderung der wissenscha­ftlichen Forschung) finanziert.

 ?? BILD: SN/UNIVERSITÄ­T SALZBURG/ANDREAS KOLARIK ?? Neuen Algorithme­n auf der Spur, v. l.: Thomas Hütter, Daniel Kocher, Mateusz Pawlik und Nikolaus Augsten.
BILD: SN/UNIVERSITÄ­T SALZBURG/ANDREAS KOLARIK Neuen Algorithme­n auf der Spur, v. l.: Thomas Hütter, Daniel Kocher, Mateusz Pawlik und Nikolaus Augsten.

Newspapers in German

Newspapers from Austria