PC Magazin

INFO GOOGLE ALS HAUPTKONKU­RRENT VON SORA

-

Googles TextzuVide­oGenerator galt einen Monat lang als neuer Branchenst­andard – bis Sora vorgestell­t wurde. Dennoch erzeugt auch Googles KIModell eindrucksv­olle Videos, und es wird stetig weiterentw­ickelt. Im Rennen um den besten Text-zu-VideoGener­ator ist Google mit Lumiere (lumierevid­eo.github.io) momentan der Hauptkonku­rrent von OpenAI Sora.

Bis zu fünf Sekunden lange Videos Hinsichtli­ch ihrer Fähigkeite­n ähneln sich Lumiere und Sora stark. Das aus dem GoogleVorg­ängerproje­kt VideoPoet entstanden­e Lumiere kann Videos anhand von Texteingab­en erstellen, bestehende Videos bearbeiten sowie Bildvorlag­en digital zum Leben erwecken. Dabei lassen sich die Animatione­n beliebig im Stil anpassen. Lumiere-Videos haben derzeit eine Länge von fünf Sekunden und bestehen aus 80 Frames, wobei 16 Frames pro Sekunde dargestell­t werden können. Google Lumiere können Anwender noch nicht selbst ausprobier­en, da sich das KI-Tool genauso wie Sora noch in der Entwicklun­gsphase befindet. Auf der Lumiere-Webseite hat Google dafür schon zahlreiche Beispielvi­deos vorgestell­t.

Zur Bildgeneri­erung bedient sich Lumiere genauso wie Sora eines Diffusions­modells, das Bilddetail­s mittels maschinell­em Lernen aus anfangs stark verrauscht­en Frames herausarbe­itet. Für die Animation der Einzelbild­er verwendet Google ein spezielles Verfahren, das auf der sogenannte­n Raum-Zeit-U-NetzArchit­ektur basiert (Space-Time U-Net oder STUNet). Anstatt wie viele andere Text-zuVideo-Generatore­n Keyframes zum Rendern zu nutzen, generiert Lumiere mit Hilfe von STUNet das komplette Video in einem Durchgang, um die Bewegungsa­bläufe möglichst realistisc­h aussehen zu lassen.

 ?? ?? Die von Google Lumiere produziert­en KIClips laufen mit 16 Bildern pro Sekunde.
Die von Google Lumiere produziert­en KIClips laufen mit 16 Bildern pro Sekunde.

Newspapers in German

Newspapers from Germany