FAQ: Was Sie über maschinelles Lernen wissen müssen
Maschinelles Lernen wird zum Mainstream. Waren selbstlernende Programme noch bis vor wenigen Jahren ausschließlich ein Thema für Universitäten, Forschungseinrichtungen und einige Technologieunternehmen, finden sie heute zunehmend Eingang in ganz normale P
Unser Alltag und unser Geschäftsleben werden immer mehr von intelligenten Programmen bestimmt, die aus Daten lernen und das Gelernte verallgemeinern. Machine-Learning-(ML-)Algorithmen steuern die Spracherkennung auf Smartphones, die Spam-Filter in PCs und Notebooks oder die Gesichtserkennung bei der Verwaltung von Fotos. Oft sind wir direkt im Kontakt mit lernenden Systemen, ohne es zu wissen – etwa wenn uns personalisierte Online-Werbung begegnet. Und immer mehr Unternehmen erkennen den Wert von Machine Learning, wenn es darum geht, ihr Business zu optimieren und Kosten zu sparen. Für die meisten IT-Anwender ist Machine Learning ein unübersichtliches Feld, weil es viele verschiedene Konzepte und Methoden gibt. Hier die wichtigsten Fragen und Antworten.
Was ist Machine Learning?
Salopp gesagt ist maschinelles Lernen die Kunst, einen Computer nützliche Dinge tun zu lassen, ohne ihn ausdrücklich dafür zu programmieren. Etwas genauer formuliert ist maschinelles Lernen der Erwerb neuen Wissens durch ein künstliches System. Der Computer generiert wie ein Mensch selbständig Wissen aus Erfahrung und kann eigenständig Lösungen für neue und unbekannte Probleme finden. Dazu analysiert ein Computerpro- gramm Beispiele und versucht mit Hilfe selbstlernender Algorithmen, in den Daten Muster und Gesetzmäßigkeiten zu erkennen. Das Ziel von Machine Learning ist es, Daten intelligent miteinander zu verknüpfen, Zusammenhänge zu erkennen, Rückschlüsse zu ziehen und Vorhersagen zu treffen.
Wie funktioniert Machine Learning?
Im Prinzip wie menschliches Lernen. Wie beispielsweise ein Kind lernt, dass auf Bildern bestimmte Objekte zu sehen sind, kann auch ein Computer „lernen“, Objekte zu identifizieren und Personen zu unterscheiden. Dazu wird die Lernsoftware zunächst mit Daten gefüttert und trainiert. Beispielsweise sagen die Programmierer dem System, dass ein bestimmtes Objekt „ein Hund“und ein anderes „kein Hund“ist. Im Fortlauf erhält die Software ständig Rückmeldungen vom Programmierer, die der Algorithmus nutzt, um sein Modell anzupassen und zu optimieren: Mit jedem neuen Datensatz wird das Modell besser und kann schließlich Hunde von Nicht-Hunden unterscheiden.
Welche Vorteile bietet maschinelles Lernen?
Maschinelles Lernen hilft Menschen, effizienter und kreativer zu arbeiten. Zum Beispiel können sie maschinelles Lernen verwenden,
um ihre Bilder schneller zu organisieren und zu bearbeiten. Mit Machine Learning können sie auch langweilige oder aufwendige Arbeiten dem Computer überlassen. Papierdokumente wie Rechnungen kann lernende Software selbständig scannen, speichern und ablegen.
Vor allem sind selbstlernende Maschinen in der Lage, für den Menschen sehr komplexe Aufgaben zu übernehmen – etwa die Erkennung von Fehlermustern oder mögliche Schäden in der Fertigung. Selbst bei der Erkennung von Krebstumoren in der Medizin und bei Therapieempfehlungen helfen inzwischen selbstlernende Programme – und übertreffen dabei oft die menschlichen Experten. Diese Fähigkeit, komplexe Zusammenhänge zwischen der Eingabe und der Ausgabe von großen Datenmengen zu verarbeiten, ist einer der Hauptvorteile von Machine Learning.
Ist Machine Learning dasselbe wie KI?
Nein. Machine Learning ist ein Teilgebiet von künstlicher Intelligenz (KI). Im gleichen Sinn sind Logik, Analysis und Stochastik Teilgebiete der Mathematik; Mechanik, Thermodynamik und Quantenphysik Teilgebiete der Physik. Die künstliche Intelligenz selbst ist eine Teildisziplin der Informatik und beschäftigt sich allgemein mit der Automatisierung menschlichen intelligenten Verhaltens. Zur KI gehören neben dem Machine Learning Teilgebiete wie wissensbasierte (Experten-)Systeme, Mustererkennung, Robotik, die Verarbeitung natürlicher Sprache und maschinelles Übersetzen. Jedoch gilt Machine Learning als eine der zentralen und erfolgreichsten AI-Disziplinen.
Warum erlebt ML jetzt einen Höhenflug?
Maschinelles Lernen beruht auf Forschung im Bereich Mustererkennung, die bereits in den 80er Jahren betrieben wurde. Das Gebiet stagnierte dann aufgrund technischer Beschränkungen ziemlich lange. Erst vor wenigen Jahren erlebte maschinelles Lernen einen Durchbruch mit der Möglichkeit, Daten parallel in Grafikprozessoren (GPUs) zu verarbeiten, die eigentlich für die Spieleindustrie entwickelt wurden. GPUs besitzen Tausende von Recheneinheiten und sind in dieser Liga im Vergleich zu klassischen CPUs deutlich schneller.
Weitere Entwicklungen wie Multi-Core-Architekturen, verbesserte Algorithmen und superschnelle In-Memory-Datenbanken wie SAP HANA machen das maschinelle Lernen gerade auch für den Unternehmensbereich attraktiv. Ein weiterer wesentlicher Faktor ist die zunehmende Verfügbarkeit großer Mengen strukturierter und unstrukturierter Daten aus einer Vielzahl von Quellen, darunter Sensoren oder digitalisierte Dokumente und Bilder, mit denen sich die Lernalgorithmen „trainieren“lassen.
Welche Verfahren werden bei ML verwendet?
Maschinelles Lernen nutzt mathematische und statistische Modelle, um aus Datenbeständen zu lernen. Im Detail gibt es Dutzende unterschiedliche Verfahren. Prinzipiell unterscheidet man beim maschinellen Lernen zwischen zwei Systemen: erstens symbolische Ansätze wie aussagenlogische Systeme, in denen das Wissen – sowohl die Beispiele als auch die induzierten Regeln – explizit repräsentiert ist. Zweitens subsymbolische Systeme wie künstliche neuronale Netze, die nach dem Vorbild des menschlichen Gehirns funktionieren und in denen das Wissen implizit repräsentiert ist.
Die algorithmische Umsetzung von Machine Learning geschieht mit überwachtem oder unüberwachtem Lernen. Beim überwachten Lernen lernt das System aus gegebenen Paaren von Ein- und Ausgaben. Dabei stellt ein „Lehrer“während des Lernens den passenden, korrekten Wert zu einer Eingabe bereit. Ziel beim überwachten Lernen ist, dass dem Netz nach mehreren Rechengängen mit unterschiedlichen Ein- und Ausgaben die Fähigkeit antrainiert wird, Verbindungen herzustellen. Beim unüberwachten Lernen erzeugt ein Algorithmus ein Modell, das die Eingaben beschreibt und Vorhersagen ermöglicht. Das Netz erstellt dann selbständig Klassifikatoren, nach denen es die Eingabemuster einteilt.
Was ist ein künstliches neuronales Netz?
Künstliche neuronale Netze simulieren nach dem Vorbild des Gehirns ein Netzwerk aus miteinander verbundenen Neuronen. Sie lernen aus Erfahrung, indem sie die Verbindungsstärke der simulierten Neuronenverbindungen verändern. Auf diese Art und Weise können sich Maschinen Fähigkeiten wie Sehen, Hören, Sprechen, Lesen und Schreiben aneignen.
Um sie für diese Fähigkeiten zu trainieren, werden Methoden des überwachten Lernens angewendet.
Der Lernprozess läuft grob gesagt wie folgt ab: Zunächst lernt das Netz in der Trainingsphase anhand des vorgegebenen Materials. Der „Trainer“gibt dem Netz eine Reihe von Beispielen und wiederholt das Ganze. Für jedes Beispiel ist bekannt, was die gewünschte Ausgabe sein soll. Stimmt die Ausgabe des Netzes für ein Beispiel mit dem gewünschten Output überein, dann braucht nichts weiter getan zu werden. Weichen tatsächliche und gewünschte Ausgabe voneinander ab, dann müssen die Verbindungsstärken beziehungsweise Gewichte im Netz so verändert werden, dass sich die Fehlerrate bei der Ausgabe verringert. Je größer der Betrag des Gewichts ist, desto größer ist der Einfluss eines Neurons auf ein anderes Neuron. Ein positives Gewicht übt auf ein anderes Neuron einen erregenden, verstärkenden Einfluss auf, ein negatives einen hemmenden. Das Gewicht der Verbindung bestimmt also maßgeblich, ob ein Neuron von einem anderen beeinflusst wird. Es ist einer der entscheidenden Faktoren für Lernvorgänge, man kann sagen: Das Wissen eines neuronalen Netzes ist in den Gewichten gespeichert. Dieser Trainingsprozess erfolgt im Idealfall so lange, bis alle Beispiele richtig berechnet werden. Der ganze Lernprozess ist also ein iterativer Vorgang, bei dem ein spezieller Algorithmus die Gewichte so einstellt, dass der Output möglichst genau dem bekannten Ergebnis entspricht.
Wie funktioniert Deep Learning?
Deep Learning ist die derzeit erfolgreichste Implementierung eines künstlichen neuronalen Netzes. Zugleich ist Deep Learning inzwischen auch das am weitesten verbreitete maschinelle Lernverfahren und wird von großen IT-Unternehmen wie Google, Apple oder Facebook eingesetzt. Die Spracherkennung von iPhone „Siri“basiert beispielsweise auf Deep Learning. Eines der wichtigsten Einsatzgebiete für Deep Learning ist neben der Sprachverarbeitung das Erkennen von Objekten in Bildern.
Das Verfahren macht viele Arbeitsschritte klassischer neuronaler Netze überflüssig, weil der Computer alle Zwischenschritte übernimmt. Der Forscher muss dem neuronalen Netz lediglich Daten wie zum Beispiel Bilder präsentieren; wie diese zu identifizieren sind, findet das Netz dann ganz von allein heraus. Deep Learning verwendet den analogen Mechanismus, wie ein Kleinkind beispielweise den Begriff „Hund“lernt: Zunächst werden dem Computerprogramm Trainingsdaten zur Verfügung gestellt, beispielsweise eine Reihe von Bildern, von denen ein Mensch jedes mit den Meta-Tags „Hund“oder „kein Hund“markiert hat. Das Programm verwendet die Informationen, die es aus den Trainingsdaten erhält, um ein Feature-Set für Hunde zu erzeugen und ein Vorhersagemodell zu bauen.
Die Einheiten der ersten Ebene registrierten lediglich Helligkeitswerte der Pixel. Die nächste Ebene würde erkennen, dass einige der Pixel zu Linien verbunden sind, woraufhin die darauffolgende zwischen horizontalen und vertikalen Linien unterscheidet. Dies geht so weiter, bis schließlich eine Ebene erreicht wird, in der Beine unterschieden werden können. In einem weiteren Modell würde der Computer vielleicht vorhersagen, dass alles in einem Bild, was vier Beine hat, ein Hund ist, bis er schließlich so weit ist, Hunde von NichtHunden unterscheiden zu können. Bei jeder Iteration wird das Vorhersagemodell, das der Computer erstellt, komplexer und genauer.
Kann ML mit menschlichem Lernen mithalten?
Ja. Das beweisen immer wieder MenschMaschine-Wettkämpfe, die höchste kognitive Fähigkeiten erfordern. So hat IBMs kognitives lernbasiertes System Watson in einem TV-Wissensquiz schon im Jahr 2011 die menschlichen Kandidaten klar geschlagen. Im letzten aufsehenerregenden Mensch-Maschine-Wettkampf
besiegte Googles Machine-Learning-System AlphaGo Anfang 2016 den amtierenden GoWeltmeister Lee Sedol. AlphaGo nutzte eine Variante des Deep-Learning-Verfahrens. Das asiatische Strategiespiel galt bisher als zu kompliziert für Computer, weil es eine nahezu unbegrenzte Zahl möglicher Positionen gibt. Die Spieler müssen sich daher meist auf ihre Intuition verlassen. Der entwickelte AlphaGoAlgorithmus hilft Google nun unter anderem beim Stromsparen. Mit Hilfe des Algorithmus konnte in Googles Rechenzentren der Energieverbrauch um 15 Prozent verringert werden.
Was sind populäre Anwendungen von ML?
Maschinelles Lernen findet man bei den Empfehlungsdiensten von Amazon und Netflix ebenso wie bei der Gesichtserkennung von Facebook. Die Möglichkeit, einzelne Mitglieder mit ihren Namen auf Bildern zu markieren, hat bei Facebook zur weltweit größten Sammlung von Gesichtern in einer Datenbank geführt. Diese Daten kann Facebook nutzen, um Maschinen gezielt auf visuelle Erkennung zu schulen. Auch hinter E-Mail-Anwendungen, die automatisch Spam erkennen, stecken maschinelle Lernverfahren. Der Computer analysiert die Daten, die in der E-Mail enthalten sind, und kategorisiert sie gemäß den erkannten Mustern als Spam oder Nicht-Spam. Wird eine Nachricht als Junk markiert, lernt der Rechner und kann dadurch Junk-Nachrichten noch besser identifizieren. Ebenfalls angewendet werden Lernverfahren bei der Abwehr von Computerattacken, der Bekämpfung von Cybercrime und dem Suchmaschinen-Ranking.
Wie lässt sich ML kommerziell anwenden?
Maschinelles Lernen verwandelt BusinessDaten in bare Münze. Unternehmen, die maschinelle Lernverfahren nutzen, können sowohl ihren Umsatz als auch die Kundenzufriedenheit steigern und gleichzeitig Kosten reduzieren. So hilft Machine Learning beispielsweise, die Bedürfnisse von Kunden genauer zu erkennen. Werbemaßnahmen lassen sich personalisieren. Das verbessert nicht nur das Kundenerlebnis, sondern erhöht auch die Kundenbindung.
Maschinelles Lernen hilft auch, zu erkennen, dass Kunden möglicherweise in nächster Zeit abwandern. Dafür werden zum Beispiel Support-Anfragen von Kunden automatisch ausgewertet. Oder man extrahiert aus den Daten von bereits abgewanderten Kunden diejenigen Merkmale, die diese gemeinsam haben. Filtert man auf dieser Basis einzelne Kunden aus dem Gesamtbestand, erhält man die aktuell abwanderungsgeneigten Kunden. Diese können dann gezielt „umsorgt“werden. Im telefonischen Kundenservice werden schon heute immer mehr Chat-Bots eingesetzt – automatisierte Programme, die mit dem Kunden kommunizieren. Durch die Sammlung von Stimmdaten in verschiedenen Situationen kann der Chat-Bot seine kognitive Fähigkeit zur Interpretation des Umgangstons verbessern. Und noch viel wichtiger: Der Bot kann den Anruf an einen Call-Center-Mitarbeiter weiterleiten, wenn ein komplexeres Problem vorliegt. Durch den automatischen Abgleich von Lebensläufen kann maschinelles Lernen helfen, schneller die besten Kandidaten für eine Stelle zu finden. Sie können strukturierte und unstrukturierte Kontextinformationen analysieren und automatisch Berichte erzeugen. Statt in der Versicherungsbranche jede Forderung manuell von einem Mitarbeiter prüfen zu lassen, können Versicherungsunternehmen Maschinen einsetzen, um in simplen Versicherungsfällen eine Vorentscheidung zu treffen und ein Antwortschreiben aufzusetzen.
Maschinelles Lernen ist auch eine Schlüsseltechnik für die Entwicklung autonomer Systeme: kollaborative Roboter, die mit ihren menschlichen Kollegen Hand in Hand arbeiten, gehören ebenso dazu wie selbstfahrende Autos. Auch jenseits rein kommerzieller Anwendungen sind die Einsatzgebiete fast unendlich: Automatisierte Diagnoseverfahren, Erkennung von Kreditkartenbetrug und Aktienmarktanalysen sind häufige Anwendungen. Selbstlernende Programme können sogar Leben retten. Forscher der University of Liverpool trainierten ein Programm erfolgreich darauf, die Muster von Landminen in den Daten von Radarund Akustiksensoren zu erfassen.