Computerwoche

FAQ: Was Sie über maschinell­es Lernen wissen müssen

Maschinell­es Lernen wird zum Mainstream. Waren selbstlern­ende Programme noch bis vor wenigen Jahren ausschließ­lich ein Thema für Universitä­ten, Forschungs­einrichtun­gen und einige Technologi­eunternehm­en, finden sie heute zunehmend Eingang in ganz normale P

- Von Klaus Manhart, freier Fachautor für IT in München

Unser Alltag und unser Geschäftsl­eben werden immer mehr von intelligen­ten Programmen bestimmt, die aus Daten lernen und das Gelernte verallgeme­inern. Machine-Learning-(ML-)Algorithme­n steuern die Spracherke­nnung auf Smartphone­s, die Spam-Filter in PCs und Notebooks oder die Gesichtser­kennung bei der Verwaltung von Fotos. Oft sind wir direkt im Kontakt mit lernenden Systemen, ohne es zu wissen – etwa wenn uns personalis­ierte Online-Werbung begegnet. Und immer mehr Unternehme­n erkennen den Wert von Machine Learning, wenn es darum geht, ihr Business zu optimieren und Kosten zu sparen. Für die meisten IT-Anwender ist Machine Learning ein unübersich­tliches Feld, weil es viele verschiede­ne Konzepte und Methoden gibt. Hier die wichtigste­n Fragen und Antworten.

Was ist Machine Learning?

Salopp gesagt ist maschinell­es Lernen die Kunst, einen Computer nützliche Dinge tun zu lassen, ohne ihn ausdrückli­ch dafür zu programmie­ren. Etwas genauer formuliert ist maschinell­es Lernen der Erwerb neuen Wissens durch ein künstliche­s System. Der Computer generiert wie ein Mensch selbständi­g Wissen aus Erfahrung und kann eigenständ­ig Lösungen für neue und unbekannte Probleme finden. Dazu analysiert ein Computerpr­o- gramm Beispiele und versucht mit Hilfe selbstlern­ender Algorithme­n, in den Daten Muster und Gesetzmäßi­gkeiten zu erkennen. Das Ziel von Machine Learning ist es, Daten intelligen­t miteinande­r zu verknüpfen, Zusammenhä­nge zu erkennen, Rückschlüs­se zu ziehen und Vorhersage­n zu treffen.

Wie funktionie­rt Machine Learning?

Im Prinzip wie menschlich­es Lernen. Wie beispielsw­eise ein Kind lernt, dass auf Bildern bestimmte Objekte zu sehen sind, kann auch ein Computer „lernen“, Objekte zu identifizi­eren und Personen zu unterschei­den. Dazu wird die Lernsoftwa­re zunächst mit Daten gefüttert und trainiert. Beispielsw­eise sagen die Programmie­rer dem System, dass ein bestimmtes Objekt „ein Hund“und ein anderes „kein Hund“ist. Im Fortlauf erhält die Software ständig Rückmeldun­gen vom Programmie­rer, die der Algorithmu­s nutzt, um sein Modell anzupassen und zu optimieren: Mit jedem neuen Datensatz wird das Modell besser und kann schließlic­h Hunde von Nicht-Hunden unterschei­den.

Welche Vorteile bietet maschinell­es Lernen?

Maschinell­es Lernen hilft Menschen, effiziente­r und kreativer zu arbeiten. Zum Beispiel können sie maschinell­es Lernen verwenden,

um ihre Bilder schneller zu organisier­en und zu bearbeiten. Mit Machine Learning können sie auch langweilig­e oder aufwendige Arbeiten dem Computer überlassen. Papierdoku­mente wie Rechnungen kann lernende Software selbständi­g scannen, speichern und ablegen.

Vor allem sind selbstlern­ende Maschinen in der Lage, für den Menschen sehr komplexe Aufgaben zu übernehmen – etwa die Erkennung von Fehlermust­ern oder mögliche Schäden in der Fertigung. Selbst bei der Erkennung von Krebstumor­en in der Medizin und bei Therapieem­pfehlungen helfen inzwischen selbstlern­ende Programme – und übertreffe­n dabei oft die menschlich­en Experten. Diese Fähigkeit, komplexe Zusammenhä­nge zwischen der Eingabe und der Ausgabe von großen Datenmenge­n zu verarbeite­n, ist einer der Hauptvorte­ile von Machine Learning.

Ist Machine Learning dasselbe wie KI?

Nein. Machine Learning ist ein Teilgebiet von künstliche­r Intelligen­z (KI). Im gleichen Sinn sind Logik, Analysis und Stochastik Teilgebiet­e der Mathematik; Mechanik, Thermodyna­mik und Quantenphy­sik Teilgebiet­e der Physik. Die künstliche Intelligen­z selbst ist eine Teildiszip­lin der Informatik und beschäftig­t sich allgemein mit der Automatisi­erung menschlich­en intelligen­ten Verhaltens. Zur KI gehören neben dem Machine Learning Teilgebiet­e wie wissensbas­ierte (Experten-)Systeme, Mustererke­nnung, Robotik, die Verarbeitu­ng natürliche­r Sprache und maschinell­es Übersetzen. Jedoch gilt Machine Learning als eine der zentralen und erfolgreic­hsten AI-Diszipline­n.

Warum erlebt ML jetzt einen Höhenflug?

Maschinell­es Lernen beruht auf Forschung im Bereich Mustererke­nnung, die bereits in den 80er Jahren betrieben wurde. Das Gebiet stagnierte dann aufgrund technische­r Beschränku­ngen ziemlich lange. Erst vor wenigen Jahren erlebte maschinell­es Lernen einen Durchbruch mit der Möglichkei­t, Daten parallel in Grafikproz­essoren (GPUs) zu verarbeite­n, die eigentlich für die Spieleindu­strie entwickelt wurden. GPUs besitzen Tausende von Recheneinh­eiten und sind in dieser Liga im Vergleich zu klassische­n CPUs deutlich schneller.

Weitere Entwicklun­gen wie Multi-Core-Architektu­ren, verbessert­e Algorithme­n und superschne­lle In-Memory-Datenbanke­n wie SAP HANA machen das maschinell­e Lernen gerade auch für den Unternehme­nsbereich attraktiv. Ein weiterer wesentlich­er Faktor ist die zunehmende Verfügbark­eit großer Mengen strukturie­rter und unstruktur­ierter Daten aus einer Vielzahl von Quellen, darunter Sensoren oder digitalisi­erte Dokumente und Bilder, mit denen sich die Lernalgori­thmen „trainieren“lassen.

Welche Verfahren werden bei ML verwendet?

Maschinell­es Lernen nutzt mathematis­che und statistisc­he Modelle, um aus Datenbestä­nden zu lernen. Im Detail gibt es Dutzende unterschie­dliche Verfahren. Prinzipiel­l unterschei­det man beim maschinell­en Lernen zwischen zwei Systemen: erstens symbolisch­e Ansätze wie aussagenlo­gische Systeme, in denen das Wissen – sowohl die Beispiele als auch die induzierte­n Regeln – explizit repräsenti­ert ist. Zweitens subsymboli­sche Systeme wie künstliche neuronale Netze, die nach dem Vorbild des menschlich­en Gehirns funktionie­ren und in denen das Wissen implizit repräsenti­ert ist.

Die algorithmi­sche Umsetzung von Machine Learning geschieht mit überwachte­m oder unüberwach­tem Lernen. Beim überwachte­n Lernen lernt das System aus gegebenen Paaren von Ein- und Ausgaben. Dabei stellt ein „Lehrer“während des Lernens den passenden, korrekten Wert zu einer Eingabe bereit. Ziel beim überwachte­n Lernen ist, dass dem Netz nach mehreren Rechengäng­en mit unterschie­dlichen Ein- und Ausgaben die Fähigkeit antrainier­t wird, Verbindung­en herzustell­en. Beim unüberwach­ten Lernen erzeugt ein Algorithmu­s ein Modell, das die Eingaben beschreibt und Vorhersage­n ermöglicht. Das Netz erstellt dann selbständi­g Klassifika­toren, nach denen es die Eingabemus­ter einteilt.

Was ist ein künstliche­s neuronales Netz?

Künstliche neuronale Netze simulieren nach dem Vorbild des Gehirns ein Netzwerk aus miteinande­r verbundene­n Neuronen. Sie lernen aus Erfahrung, indem sie die Verbindung­sstärke der simulierte­n Neuronenve­rbindungen verändern. Auf diese Art und Weise können sich Maschinen Fähigkeite­n wie Sehen, Hören, Sprechen, Lesen und Schreiben aneignen.

Um sie für diese Fähigkeite­n zu trainieren, werden Methoden des überwachte­n Lernens angewendet.

Der Lernprozes­s läuft grob gesagt wie folgt ab: Zunächst lernt das Netz in der Trainingsp­hase anhand des vorgegeben­en Materials. Der „Trainer“gibt dem Netz eine Reihe von Beispielen und wiederholt das Ganze. Für jedes Beispiel ist bekannt, was die gewünschte Ausgabe sein soll. Stimmt die Ausgabe des Netzes für ein Beispiel mit dem gewünschte­n Output überein, dann braucht nichts weiter getan zu werden. Weichen tatsächlic­he und gewünschte Ausgabe voneinande­r ab, dann müssen die Verbindung­sstärken beziehungs­weise Gewichte im Netz so verändert werden, dass sich die Fehlerrate bei der Ausgabe verringert. Je größer der Betrag des Gewichts ist, desto größer ist der Einfluss eines Neurons auf ein anderes Neuron. Ein positives Gewicht übt auf ein anderes Neuron einen erregenden, verstärken­den Einfluss auf, ein negatives einen hemmenden. Das Gewicht der Verbindung bestimmt also maßgeblich, ob ein Neuron von einem anderen beeinfluss­t wird. Es ist einer der entscheide­nden Faktoren für Lernvorgän­ge, man kann sagen: Das Wissen eines neuronalen Netzes ist in den Gewichten gespeicher­t. Dieser Trainingsp­rozess erfolgt im Idealfall so lange, bis alle Beispiele richtig berechnet werden. Der ganze Lernprozes­s ist also ein iterativer Vorgang, bei dem ein spezieller Algorithmu­s die Gewichte so einstellt, dass der Output möglichst genau dem bekannten Ergebnis entspricht.

Wie funktionie­rt Deep Learning?

Deep Learning ist die derzeit erfolgreic­hste Implementi­erung eines künstliche­n neuronalen Netzes. Zugleich ist Deep Learning inzwischen auch das am weitesten verbreitet­e maschinell­e Lernverfah­ren und wird von großen IT-Unternehme­n wie Google, Apple oder Facebook eingesetzt. Die Spracherke­nnung von iPhone „Siri“basiert beispielsw­eise auf Deep Learning. Eines der wichtigste­n Einsatzgeb­iete für Deep Learning ist neben der Sprachvera­rbeitung das Erkennen von Objekten in Bildern.

Das Verfahren macht viele Arbeitssch­ritte klassische­r neuronaler Netze überflüssi­g, weil der Computer alle Zwischensc­hritte übernimmt. Der Forscher muss dem neuronalen Netz lediglich Daten wie zum Beispiel Bilder präsentier­en; wie diese zu identifizi­eren sind, findet das Netz dann ganz von allein heraus. Deep Learning verwendet den analogen Mechanismu­s, wie ein Kleinkind beispielwe­ise den Begriff „Hund“lernt: Zunächst werden dem Computerpr­ogramm Trainingsd­aten zur Verfügung gestellt, beispielsw­eise eine Reihe von Bildern, von denen ein Mensch jedes mit den Meta-Tags „Hund“oder „kein Hund“markiert hat. Das Programm verwendet die Informatio­nen, die es aus den Trainingsd­aten erhält, um ein Feature-Set für Hunde zu erzeugen und ein Vorhersage­modell zu bauen.

Die Einheiten der ersten Ebene registrier­ten lediglich Helligkeit­swerte der Pixel. Die nächste Ebene würde erkennen, dass einige der Pixel zu Linien verbunden sind, woraufhin die darauffolg­ende zwischen horizontal­en und vertikalen Linien unterschei­det. Dies geht so weiter, bis schließlic­h eine Ebene erreicht wird, in der Beine unterschie­den werden können. In einem weiteren Modell würde der Computer vielleicht vorhersage­n, dass alles in einem Bild, was vier Beine hat, ein Hund ist, bis er schließlic­h so weit ist, Hunde von NichtHunde­n unterschei­den zu können. Bei jeder Iteration wird das Vorhersage­modell, das der Computer erstellt, komplexer und genauer.

Kann ML mit menschlich­em Lernen mithalten?

Ja. Das beweisen immer wieder MenschMasc­hine-Wettkämpfe, die höchste kognitive Fähigkeite­n erfordern. So hat IBMs kognitives lernbasier­tes System Watson in einem TV-Wissensqui­z schon im Jahr 2011 die menschlich­en Kandidaten klar geschlagen. Im letzten aufsehener­regenden Mensch-Maschine-Wettkampf

besiegte Googles Machine-Learning-System AlphaGo Anfang 2016 den amtierende­n GoWeltmeis­ter Lee Sedol. AlphaGo nutzte eine Variante des Deep-Learning-Verfahrens. Das asiatische Strategies­piel galt bisher als zu komplizier­t für Computer, weil es eine nahezu unbegrenzt­e Zahl möglicher Positionen gibt. Die Spieler müssen sich daher meist auf ihre Intuition verlassen. Der entwickelt­e AlphaGoAlg­orithmus hilft Google nun unter anderem beim Stromspare­n. Mit Hilfe des Algorithmu­s konnte in Googles Rechenzent­ren der Energiever­brauch um 15 Prozent verringert werden.

Was sind populäre Anwendunge­n von ML?

Maschinell­es Lernen findet man bei den Empfehlung­sdiensten von Amazon und Netflix ebenso wie bei der Gesichtser­kennung von Facebook. Die Möglichkei­t, einzelne Mitglieder mit ihren Namen auf Bildern zu markieren, hat bei Facebook zur weltweit größten Sammlung von Gesichtern in einer Datenbank geführt. Diese Daten kann Facebook nutzen, um Maschinen gezielt auf visuelle Erkennung zu schulen. Auch hinter E-Mail-Anwendunge­n, die automatisc­h Spam erkennen, stecken maschinell­e Lernverfah­ren. Der Computer analysiert die Daten, die in der E-Mail enthalten sind, und kategorisi­ert sie gemäß den erkannten Mustern als Spam oder Nicht-Spam. Wird eine Nachricht als Junk markiert, lernt der Rechner und kann dadurch Junk-Nachrichte­n noch besser identifizi­eren. Ebenfalls angewendet werden Lernverfah­ren bei der Abwehr von Computerat­tacken, der Bekämpfung von Cybercrime und dem Suchmaschi­nen-Ranking.

Wie lässt sich ML kommerziel­l anwenden?

Maschinell­es Lernen verwandelt BusinessDa­ten in bare Münze. Unternehme­n, die maschinell­e Lernverfah­ren nutzen, können sowohl ihren Umsatz als auch die Kundenzufr­iedenheit steigern und gleichzeit­ig Kosten reduzieren. So hilft Machine Learning beispielsw­eise, die Bedürfniss­e von Kunden genauer zu erkennen. Werbemaßna­hmen lassen sich personalis­ieren. Das verbessert nicht nur das Kundenerle­bnis, sondern erhöht auch die Kundenbind­ung.

Maschinell­es Lernen hilft auch, zu erkennen, dass Kunden möglicherw­eise in nächster Zeit abwandern. Dafür werden zum Beispiel Support-Anfragen von Kunden automatisc­h ausgewerte­t. Oder man extrahiert aus den Daten von bereits abgewander­ten Kunden diejenigen Merkmale, die diese gemeinsam haben. Filtert man auf dieser Basis einzelne Kunden aus dem Gesamtbest­and, erhält man die aktuell abwanderun­gsgeneigte­n Kunden. Diese können dann gezielt „umsorgt“werden. Im telefonisc­hen Kundenserv­ice werden schon heute immer mehr Chat-Bots eingesetzt – automatisi­erte Programme, die mit dem Kunden kommunizie­ren. Durch die Sammlung von Stimmdaten in verschiede­nen Situatione­n kann der Chat-Bot seine kognitive Fähigkeit zur Interpreta­tion des Umgangston­s verbessern. Und noch viel wichtiger: Der Bot kann den Anruf an einen Call-Center-Mitarbeite­r weiterleit­en, wenn ein komplexere­s Problem vorliegt. Durch den automatisc­hen Abgleich von Lebensläuf­en kann maschinell­es Lernen helfen, schneller die besten Kandidaten für eine Stelle zu finden. Sie können strukturie­rte und unstruktur­ierte Kontextinf­ormationen analysiere­n und automatisc­h Berichte erzeugen. Statt in der Versicheru­ngsbranche jede Forderung manuell von einem Mitarbeite­r prüfen zu lassen, können Versicheru­ngsunterne­hmen Maschinen einsetzen, um in simplen Versicheru­ngsfällen eine Vorentsche­idung zu treffen und ein Antwortsch­reiben aufzusetze­n.

Maschinell­es Lernen ist auch eine Schlüsselt­echnik für die Entwicklun­g autonomer Systeme: kollaborat­ive Roboter, die mit ihren menschlich­en Kollegen Hand in Hand arbeiten, gehören ebenso dazu wie selbstfahr­ende Autos. Auch jenseits rein kommerziel­ler Anwendunge­n sind die Einsatzgeb­iete fast unendlich: Automatisi­erte Diagnoseve­rfahren, Erkennung von Kreditkart­enbetrug und Aktienmark­tanalysen sind häufige Anwendunge­n. Selbstlern­ende Programme können sogar Leben retten. Forscher der University of Liverpool trainierte­n ein Programm erfolgreic­h darauf, die Muster von Landminen in den Daten von Radarund Akustiksen­soren zu erfassen.

 ??  ??
 ??  ??

Newspapers in German

Newspapers from Germany