Test: Xtrax Stems
Tracks in Stems zerlegen
Mit Xtrax Stems präsentieren Audionamix ihr neustes Produkt, das sich mit keinem geringeren Thema als der Separation fertigen Audiomaterials in drei Einzel-Stems widmet. Funktioniert so etwas überhaupt?
Ein bis dato eher unberührter Audio-Sektor ist die Separation fertig abgemischter Audio-Files, was bislang als äußerst schwierig angesehen wird. Audionamix beschäftigt sich damit bereits seit 2003 und hat zuletzt 2017 Xtrax Stems als Kompakt-Variante zur automatischen Aufteilung in Vocals, Musik und Drums herausgebracht. Um herauszufinden, ob und wie gut das funktioniert, haben wir zum Testen einen Hit der 1990er Jahre herausgekramt, der sich besonders gut dazu anbietet. Es handelt sich um – Trommelwirbel – „Everybody (Backstreet´s Back)“von den Backstreet Boys. Mag dieser Titel noch so trashig sein, hält er jedoch gerade in puntco Gesang jede Menge Performance-Content bereit, um den Xtrax-Algorithmen ordentlich auf den Zahn zu fühlen.
Berechnung in der Cloud
Als Erstes ziehen wir unser Test-File (WAV, 16 Bit, 44.1 kHz) ins Spurfenster, um es anschließend mithilfe der vier Berechnungs-Modi Automatic, Automatic HQ, Generic und Generic HQ in seine Einzelteile zu zerlegen. Zunächst klicken wir auf Automatic-Modus, worauf wir uns erst einmal mit unseren Registrierungsdaten anmelden müssen. Nach dem Login werden die Daten zwecks externer Berechnung auf einen eigenen Cloud-Server hochgeladen und anschließend wieder rückübertragen. Anschließend liegen uns drei Einzelspuren alias Drums, Musik und Vocals vor. Danach wiederholen wir den Vorgang mit den restlichen drei Modi, sodass wir am Ende alle Ergebnisse ad hoc miteinander vergleichen können.
Acapellas …
Nachdem alles fertig ist, starten wir das Durchhören beim Gesangs-Stem, was uns zunächst im Automatic-Modus ein gemischtes Bild bietet. Zwar erklingt der Gesang tatsächlich acapella. Jedoch sind hin und wieder Artefakte der restlichen Instrumente im Spiel, ab und zu mit abgeschnittenen Phrasenenden. Zudem klingt es stellenweise wie bei einem MP3-File mit niedriger Bitrate.
Auch bei Automatic HQ, der mit alternativem Algorithmus arbeitet, deckt sich das Ergebnis mit dem für unsere Ohren einzigen Unterschied, dass etwas mehr Höhen im Spiel sind. Mit Generic sieht die Sache nochmals anders aus. In diesem Modus werden die Vocals laut Handbuch aus dem melodischen Content des Signals herausgerechnet. Davon ist in erster Linie zwischen den einzelnen Gesangsphrasen stets ein gewisser Spill-Teppich vorhanden, ähnlich einem Übersprechen, was zuvor nicht der Fall war. Allerdings sind die verschluckten Phrasenenden nun voll da.
Bei Generic HQ verhält es sich dann wie im Vergleich von Automatic und dessen HQ-Variante. Bis auf etwas mehr Höhen ist kein merklicher Unterschied hörbar. Erstes Fazit : Um eine überhaupt halbwegs brauchbare Acapella-Spur zu
… und Instrumentals
Nach dem Acapella-Erstcheck drehen wir den Spieß um und muten im Generic HQ-Modus den Gesang, sodass wir ein Instrumental erhalten. Zwar klingen Drums und Musik einzeln noch etwas krisseliger, als die Vox. Beide zusammen klingen jedoch im Gegensatz zur Einzelseparation des Gesangs ungemein besser, ja sogar überaus gut. Überhaupt bieten sich so nicht nur Einsatzmöglichkeiten für Remixe & Co., sondern auch fürs Mastering an. Das beweisen uns ein erneutes Hinzuschalten der Vocals und anschließendes Anheben, bzw. Absenken des Laustärkepegels, was in der Summe ebenfalls klanglich völlig in Ordnung geht. Zwar hat auch dies seine Grenzen, da ab einem gewissen Pegelunterschied auch der im Acapella vorhandene Spill mit angehoben, bzw. abgesenkt wird. Fürs Mastering eröffnet das jedoch in einem gewissen Rahmen mitunter wertvolle Zusatzoptionen, wenn aufgrund fehlender Original-Stems nur ein Stereo-Master möglich ist.
Fazit
erhalten, empfiehlt es sich, Automatic HQ und Generic HQ einzeln zu exportieren und zwecks Zusammenschnitt in eine DAW zu laden. So lassen sich die besten Stellen herauspicken und die im einen Modus abgeschnittene Phrasenenden durch die im anderen Modus vorhandenen ersetzen. Es ist schon erstaunlich, dass die Separierung eines Stereo-Mixes in Einzel-Stems überhaupt ansatzweise möglich ist. Zwar sind die Ergebnisse noch alles andere als lupenrein. Doch etwas anfangen lässt sich mit den Ergebnissen auf jeden Fall. Zumal sich die Qualität mit einigem Bastelaufwand etwas steigern lässt.