ByteDance bringt OmniHuman-1 AI-Videogenerator auf den Markt, der aus jedem Foto ultrarealistische Videos erstellt

Das chinesische Unternehmen ByteDance, die Muttergesellschaft von TikTok, hat ein neues Framework für künstliche Intelligenz namens OmniHuman-1 angekündigt. Dieses Tool kann ein einzelnes Bild und eine Audioaufnahme in ein realistisches Video mit genauen Gesichts- und Körperbewegungen umwandeln.
Was bekannt ist
OmniHuman-1 verwendet eine Technologie zur Datenmischung, mit der es im Vergleich zu anderen Modellen realistischere Videos erstellen kann. Die Forscher von ByteDance gaben an, dass bei der Entwicklung von OmniHuman-1 19.000 Stunden Filmmaterial ausgewertet wurden, wodurch die Qualität der erzeugten Videos erheblich verbessert werden konnte.
Das Tool unterstützt Bilder mit beliebigem Seitenverhältnis, seien es Porträts oder Bilder in voller Länge. OmniHuman-1 kann realistische Handbewegungen, Gesichtsausdrücke und Körpergesten erzeugen und eignet sich daher ideal für die Erstellung von Virtual-Reality-Bildern, Lehrvideos und andere Zwecke. Ein Beispiel für eine solche Generierung mit einem Foto von Albert Einstein ist unten zu sehen.
OmniHuman-1 befindet sich noch in der Forschungsphase, aber sein Potenzial stößt bereits auf großes Interesse. Sobald es für die breite Öffentlichkeit verfügbar ist, wird es mit anderen Tools wie Sora und Veo von OpenAI bzw. Google konkurrieren.
Quelle: omnihuman