Digitale Kultur: Künstliche Intelligenz
Das Wechselspiel zwischen künstlicher Intelligenz (AI) und Musik ist faszinierend und unheimlich zugleich. Für sein Album „Blossoms“hat Emptyset ein eigenes neurales Netzwerk trainiert. Rory Kenny, Geschäftsführer von Musicmaker JAM, will mit einer neuen AI-Plattform die
„Ära des AI-Komponisten einläuten“.
Für sein neues Album „Blossoms“hat das englische Duo Emptyset ein eigenes neurales Netzwerk trainiert. Das Endergebnis klingt immer noch nach Emptyset, aber interpretiert durch die Sicht einer nichtmenschlichen Intelligenz. Die Konsequenzen sind faszinierend und unheimlich zugleich.
Beat / Mit was für Erwartungen seid ihr an das Projekt herangetreten?
Emptyset / Ganz zu Anfang war es fast unmöglich, überhaupt irgendwelche Erwartungen zu haben - die Ergebnisse, die uns das neuronale Netzwerk geliefert hat, waren über das gesamte erste Jahr hinweg so schlecht, dass wir erst erkunden mussten, ob sich die Idee überhaupt realisieren ließ. Erst im März hatten wir einen Durchbruch. Da stellten sich zum ersten Mal Ergebnisse ein, mit denen man arbeiten konnte.
Beat / Wie seid ihr konkret vorgegangen?
Emptyset / Wir haben das System zunächst mit unserem gesamten Back-Catalogue gefüttert. Danach haben wir drei komplette Tage lang auf Holz und Metall Schlagzeugimprovisationen aufgenommen, die wir mit den passenden Metadaten versehen haben, um jeden Ausschnitt nach Komplexität, Lautstärke, Frequenz oder auch Helligkeit zu charakterisieren. Das Ziel war, dem System ein Grundverständnis dieser Eigenschaften zu vermitteln, mit dem es dann wiederum neues Material generieren konnte.
Beat / Ein Beobachter hat die Lernkurve der AI so beschrieben, als habe sie ein „Selbstbewusstsein“entwickelt. Hat sich das tatsächlich so angefühlt?
Emptyset / Wir würden eher sagen, dass die AI gelernt hat, die klangliche Sprache immer besser zu beherrschen. Allmählich wurde aus reiner Wiederholung Nachahmung und schließlich entstanden gezieltere Loops. Schließlich erreichte es eine Phase mit eigenen Ideen und Ausdrucksformen.
Beat / Ein Wachstumsprozess, wie bei einem Kind.
Emptyset / Wir haben ganz bewusst versucht, in der Musik nicht nach solchen Vermenschlichungen zu suchen, sondern einen klaren Kopf zu bewahren. Aber ja, die ganze Sache hat auf jeden Fall etwas von einer sich entwickelnden Lebensform.
Beat / Wie viel Material hat das Netzwerk generiert?
Emptyset / Über 100 Stunden. Das klingt zunächst einmal nach sehr viel. Aber das System bewegt sich langsam. Es sind wie Spiralen zunehmender Komplexität und in jeder Runde gewinnen die Konzepte an Genauigkeit. Innerhalb jeder dieser Spiralen entdeckst du bestimmte Phrasen, die sich wiederholen. Manchmal erscheinen die Wiederholungen nur alle zehn Minuten. Dann aber verbinden sie sich mit anderen Motiven, auf das sich das System, aus welchen Gründen auch immer, fixiert. Das bedeutet, dass es in diesen 100 Stunden Material nur wenige eigenständige thematische Cluster gab. In gewisser Weise wollten wir auch keine fertige Musik, sondern das Netzwerk derart provozieren, dass aus den Ergebnissen seine Gedankengänge ersichtlich werden. Es war viel interessanter, ihm beim Entwickeln seiner Gedanken zuzuhören, zu verstehen, wie es seine Ideen organisiert und schließlich einen Sinn für Musikalität gewinnt. Da, wo es der AI eben nicht gelang, unsere eigene Musik zu imitieren, war es für uns am spannendsten. Denn dort wurde es unheimlich.
Beat / Wieso unheimlich?
Emptyset / Weil die Ergebnisse unsere Erwartungen dessen, was eine AI erreichen konnte, überstiegen haben. In der ersten Juniwoche, als unser neurales Netzwerk bereits einige Zeit gelernt hatte, gab es plötzlich einen großen Sprung in der Qualität und Komplexität des Outputs. Wir waren zuerst natürlich total aufgeregt, derart klanglich spannende Ergebnisse zu hören. Diese Musik hatte eine eigene Logik, die anders war als die Musik, mit der wir sie gefüttert hatten. Aber dann wurde uns klar: Jeder kann ein System mit den Daten anderer Musiker füttern und dann neues Material erzeugen.
Beat / Also: Jemand anders produziert über seine eigene AI neue Emptyset-Stücke, die aber nicht mehr euch gehören. Oder er komponiert das neue Madonna-Album, nur eben nicht mit ihr, sondern einer Software.
Emptyset / Genau. All das stellt sehr komplizierte Fragen zur Urheberschaft und dazu, wie Komponieren in Zukunft aussehen könnte.
Beat / Was meint ihr selbst dazu, wie sie aussehen könnte?
Emptyset / Es scheint, als könnten solche Systeme bereits in wenigen Jahren ohne menschliche Hilfe neue Musik erzeugen. Für „Blossoms“mussten wir das Material immer noch arrangieren. Aber gegen Ende des Projekts hat das System bereits längere Passagen erzeugt, die eine gewisse musikalische Struktur besitzen. Stell dir vor, man öffnet Spotify als eine Art Trainingsbibliothek für solche Netzwerke. Dann könntest du sie gezielt mit der Musik von Künstlern füttern, die du magst und daraus Hybride erzeugen. Und dann Hybride aus den Hybriden. Einerseits faszinierend. Andererseits bedeutet es eine Entmenschlichung der Produktion von Kulturgütern.
Beat / Was bedeutet Komponieren dann noch?
Emptyset / Es bedeutet, die Potenziale dieser Systeme zu nutzen. Du gibst ihm gewisse musikalische Referenzpunkte und dann erzeugst du daraus Hybride. Als Komponist ist deine Aufgabe nun eine andere: Die Systeme zu trainieren und die besten Ergebnisse auszuwählen.
Wir wollten überhaupt keine fertige Musik. Wir wollten das Netzwerk provozieren.
Als AI-Komponist kannst du mit einer nahezu unendlichen Zahl an Variablen spielen. Damit erhöhst sich die Chance auf Originalität und einen echten Durchbruch.
Rory Kenny ist Geschäftsführer von Musicmaker JAM, der weltweit größten Musik-App. Mit einer neuen AI-Plattform will das Unternehmen nun die „Ära des AI-Komponisten einläuten“. Das Netzwerk soll neue Kompositionen in weniger als zehn Sekunden erstellen können. Für Kenny ist klar: Die nächste Revolution steht kurz bevor.
Beat / Worin siehst du den Hauptnutzen eurer Plattform?
Rory Kenny / Eines der Probleme, denen Kreative heute ausgesetzt sind, ist die riesige Menge an Tracks, Loops, Samples und Metadaten. Die passenden auszusuchen ist zu einer gewaltigen Aufgabe geworden. AI kann dabei behilflich sein, diese Big-Content-Probleme zu lösen. Wir sehen das als eine Erweiterung der menschlichen Kreativität – nicht als einen Ersatz.
Beat / Wie sieht das in der Praxis aus?
Rory Kenny / Zunächst wird die künstliche Intelligenz vor allem Variationen von menschlichen Kompositionen erstellen. Das kann für unsere Nutzer eine Quelle der Inspiration sein. Indem wir ihr Feedback einholen, wird die AI zu lernen anfangen.
Beat / Bald schon wird eure AI dann auch komponieren. Wie sah der Weg zu diesem Punkt bisher aus?
Rory Kenny / Es gibt zwei grundlegende Herausforderungen: Die Auswahl der Audio-Loops und die zeitliche Dimension des Komponierens. Was die Auswahl angeht, muss die AI in der Lage sein, Loops auszusuchen, die zu dem Genre, der Instrumentierung und Stimmung eines Tracks passen. Wir mussten dazu ein umfangreiches Tagging-System entwickeln. Es enthält unglaubliche eine Million Datenpunkte, mit denen die Software die Datenbank ausliest.
Beat / Was hat es mit der zeitlichen Dimension auf sich?
Rory Kenny / Das ist schon ein wenig kryptischer. Aus menschlicher Sicht steckt hinter Musik ein Element des Geschichtenerzählens. Sie hat einen Anfang, einen Mittelteil und ein Ende und wir reagieren mit unserem Nervensystem auf Elemente wie Höhepunkte, Dissonanzen, Crescendos, Drops. All das hat eine zeitliche Dimension, die wir auch in unserem Alltag erleben. Eine AI wird das niemals so erfahren und kann deswegen ein grundlegendes Element von Musik nicht verstehen. Wir müssen sie also so, trainieren, dass sie Ergebnisse liefert, die diese emotionale Komponente nachahmen. Dazu nutzt sie unsere Datenbank mit 3,5 Millionen Songs um zu lernen, wie Menschen Musik produzieren.
Beat / Funktioniert das deiner Meinung nach auch für nicht-loop-basierte Musik oder sogar für Lyrics?
Rory Kenny / Es gibt Ansätze, aber meiner Meinung nach sind die Probleme, die sich dabei ergeben, aktuell noch zu groß, als dass wir in den nächsten Jahren mit tollen Ergebnissen rechnen sollten. Auch was Texte angeht, gibt es bereits erste AI-Konzepte. Aber die Ergebnisse hängen sehr von deinen Ansprüchen ab. Wenn du zufällig generierte, copyright-freie Textabfolgen mit geringem kontextueller Bedeutung brauchst, dann kannst du das bekommen. Wenn du das Niveau von Kanye West oder Leonard Cohen brauchst, dann bin ich eher skeptisch.
Beat / All das hinterfragt unsere Vorstellung von Kreativität. Wie würdest du den Begriff definieren?
Rory Kenny / Ich will der Frage nicht ausweichen. Aber ich glaube, es liegt in der Natur von Kreativität, dass sie sich nicht wirklich fassen lässt. Es gibt keine Formel. Es gibt aber sehr wohl verschiedene Ebenen der Kreativität, die sich aus deinem Talent, deiner Originalität, Fähigkeit zu provozieren, Geschichten zu erzählen und deiner emotionalen Ausdrucksfähigkeit ergeben. Jetzt, wo AI zu einer Realität wird, müssen wir menschliche und maschinelle Kreativität voneinander trennen – und dann schauen, was passiert, wenn sie sich miteinander verbinden. Seit den 90ern haben mehr Menschen dank DAWs Zugang zu Produktionsmitteln bekommen. Das hat zu dem Aufstieg von EDM, Techno, House, Hip-Hop und Trap geführt. Wenn künstliche Intelligenz sich nun ebenfalls hinzugesellt, steht ein weiterer großer Umbruch bevor.
Beat / Was genau bedeutet Komponieren noch, wenn wir alle über komponierende AIs verfügen?
Rory Kenny / Als Komponist wirst du mit einer AI arbeiten und kollaborieren, um neue Stücke zu schreiben. Du suchst die Musik aus, die in die Software wandert und du redigierst und arrangierst, was herauskommt. Im Idealfall kannst du mit einer nahezu unendlichen Zahl an Variablen spielen. Denn damit erhöhst sich die Chance auf Originalität und einen echten Durchbruch. Genau das ist die spannende Vision, auf die wir aktiv hinarbeiten!