Suche nach Katzen in der Krebsforschung
Forscher in Hagenberg entwickeln Artificial-Intelligence-Systeme, um die Krebsdiagnostik zu verbessern. Im Datenheuhaufen wird so die Stecknadel relevanter Werte gefunden.
Wenn aus embryonalen Nervenzellen bei Säuglingen oder Kleinkindern Krebs entsteht, spricht man von Neuroblastomen. Aggressive Varianten – ihr Anteil liegt bei etwa 60 Prozent der erkrankten Kinder – haben oftmals den Tod zur Folge. Deshalb untersucht man am St.-Anna-Kinderkrebsforschungsinstitut in Wien die Entstehung der Neuroblastome. Wenn man mehr über die Genetik der Krebszellen weiß, könnte das nämlich zu neuen Behandlungsmethoden führen.
Bei der Diagnose der Erkrankung spielt die Genetik der Krebszellen inklusive der RNA, die für die Übertragung der Geninformation zuständig ist, schon eine große Rolle. Im Zuge sogenannter Liquid-Biopsies wird Genmaterial der Tumoren aus Blut oder Knochenmark gewonnen. So will man die Wahrscheinlichkeit eines Rückfalls schon möglichst früh abschätzen.
Bei derartigen Ansätzen fallen besonders große Datenmengen an. Bioinformatische Methoden und Artificial Intelligence (AI) bieten sich für die Auswertung an. Am Beispiel des Neuroblastoms werden am St.-Anna-Kinderkrebsforschungsinstitut auch Methoden erforscht, die auf Aufbereitung, Analyse und Visualisierung der komplexen Daten abzielen. Im Rahmen des Forschungsprojekts Visiomics, unterstützt durch die Förderagentur FFG, arbeiten die Wissenschafter mit einer Reihe weiterer Forschungsinstitutionen aus dem medizinischen und informatischen Bereich zusammen.
Datenberge
Am Software Competence Center Hagenberg (SCCH) sind Bernhard Moser und seine Kollegen für die Entwicklung der künstlichen Intelligenzen zuständig, die sich durch die Datenberge wühlen sollen. Bisher wurden die Datensets aus den genetischen Analysen, die aus jeweils etwa 2,8 Millionen Werten bestehen, mit statistischen Verfahren auf sogenannte Breakpoints untersucht, also auf Marker, die in diesem Zusammenhang auf mögliche Rückfälle hinweisen. Diese Methode wirft eine Menge an Falscherkennungen aus. Biologen müssen alle Ergebnisse mühsam durchgehen, um richtige von Scheintreffern zu unterscheiden.
Im Zuge des Machine-LearningAnsatzes, der am SCCH entworfen wurde, werden die Gendaten zuerst in Ausschnitte zu je 40.000 Werte aufgeteilt, erklärt Moser. Das System wurde trainiert, jene „Datenfenster“mit Breakpoint darin von jenen ohne zu unterscheiden. Das bedeutet aber noch nicht, dass der konkrete Ort innerhalb des Fensters klar ist. Dafür haben die Forscher ein System entwickelt, das Moser „Aufmerksamkeitsmechanismus“nennt. Dafür habe man sich von Methoden aus der computerbasierten Musikana- lyse inspirieren lassen, die am Department of Computational Perception der Kepler-Uni von Wittgenstein-Preisträger Gerhard Widmer mit Hilfe von ArtificialIntelligence-Methoden durchgeführt wird, berichtet der Forscher.
Katzenbilder
Das Ergebnis: „Das System findet die Breakpoints, ohne dass wir ihm beim Trainieren zeigen müssen, wo diese jeweils sind“, erklärt Moser. „Es findet selbst die Gründe, um sich für die richtige Position zu entscheiden.“Anders erklärt: „Ginge es um Katzenbilder, müsste man dem System beim Training nur sagen, ob eine Katze drauf ist. Es findet daraufhin aber nicht nur selbst Katzenbilder, sondern kann auch sagen, wo auf dem Bild die Katze ist.“
Während die Erkennungsrate konventionell bei etwa 40 Prozent und bei bisherigen Machine-Learning-Methoden bei etwa 75 Prozent liegt, konnten Moser und Kol- legen mit ihrem Ansatz zumindest 85 Prozent der Marker erkennen.
Ein weiterer Bereich, in dem AIMethoden verwendet werden, ist das Erkennen und Klassifizieren von Zellen auf Mikroskopaufnahmen – selbst wenn sie etwa in Klumpen angeordnet schwer erkennbar sind. Bei der Analyse wird dem System nur bei einer Sache unter die Arme gegriffen, berichtet Moser: Konturinformationen der Zellen werden vordefiniert – der Trainingsprozess würde sonst zu lange dauern.
Als Basis für die Bildanalyse dienen sowohl Normal- als auch Fluoreszenzbilder. „Die AI lernt, auf Basis eines Normalbildes ein Fluoreszensbild zu simulieren, zu ,faken‘, um daraus Erkenntnisse zu gewinnen“, veranschaulicht Moser einen Analyseschritt. „Ähnlich wäre es, dem System beizubringen, ein Fotomotiv im Stil von van Gogh nachzumalen – das würde dann auch funktionieren.“