YouTube Instagram Vimeo RSS VIDEOAKTIV

KI in der Videoproduktion: passende Tools und wichtige Tipps - Ton-KI, Fazit und Ausblick

Beitragsseiten

KI FĂśR DEN TON
Sowohl in „Daniel Ahrens sein Bein“ als auch in „Hille Feiken“ kommen Sprecherstimmen vor – natürlich KI-generiert. Für die Wahl der Sprechstimme nutze ich ElevenLabs. Die Anwendung erlaubt es mir, aus einer umfangreichen Bibliothek die passende Stimme zu wählen oder bei Bedarf meine eigene zu klonen. Das ist im Besonderen dann interessant, wenn man von Nervosität nicht fehlerfrei lesen kann oder aber eine andere Sprache für den Film haben möchte. Das zuvor erstelle Video Skript oder die Übersetzung wird dort dann einfach einkopiert und die entsprechende Stimme ausgewählt. Das Ergebnis ist eine Stimme, die im Vergleich zu „echten“ Sprechern vielleicht nicht die gleiche Emotionen rüberbringt, aber dennoch eine saubere Stimme mit inzwischen korrekter Aussprache und Betonungen bietet.

KI Praxisbericht Elevenlabs

Elevenlabs: Die KI-Plattform bietet eine Bibliothek an Stimmen und bietet die Möglichkeit die eigene Stimme zu klonen. Damit eignet sie sich, um Skripte zu vertonen und so den Videos eine passende akustische Ebene zu geben.

Mittlerweile kann man auch Musik mit Hilfe von KI machen. Mein erstes KI-Video in dieser Art ist „Heilung“, bei dem alles – von den Bildern bis hin zu den Instrumenten und der Gesangsstimme – KI-generiert ist, basierend auf einem Gedicht, das eine Bekannte geschrieben hat. Für die Musik nutze ich suno.ai, eine KI, die es ermöglicht, komplexe Musikstücke und Gesang zu erzeugen. Bei der klassischen Musik der beiden Filme griff ich jedoch auf "menschliche" Werke zurück.

KI Praxisbericht suno ai

Suno.ai: Die KI ist auf die Erzeugung von Musik und Gesang spezialisiert. Sie ermöglicht es, komplexe Musikstücke basierend auf Vorgaben oder Themen zu komponieren, und kann sogar Gesangsstimmen generieren, die zu den musikalischen Kompositionen passen.

FAZIT UND AUSBLICK
Noch vor etwa anderthalb Jahren erzeugten Bildgenerierungs-KIs oft Ergebnisse, die zwar kreativ und unterhaltsam waren, aber in vielen Anwendungsfällen nicht wirklich brauchbar. Die Bilder waren häufig durch offensichtliche Artefakte oder Unstimmigkeiten gekennzeichnet, die sie klar als Produkte einer KI erkennbar machten – man denke nur an Hände mit zu vielen oder zu wenig Fingern. Die Entwicklung ist jedoch so rasant, dass wir heute an einem Punkt stehen, an dem künstlich generierte Bilder oft kaum noch von echten Fotografien zu unterscheiden sind. Diese Verbesserung in der Bildqualität hat die Tür für weitere Anwendungen geöffnet, von der Erstellung realistischer Grafiken für die Unterhaltungsindustrie bis hin zur Generierung von Bildmaterial für Bildungszwecke. Ähnliche Fortschritte zeichnen sich auch im Bereich der Video-KIs ab. Die Entwicklung von KI-generierten Videos hat in den letzten Monaten erhebliche Fortschritte gemacht. Die letzten Entwicklungen zeigen einen weiteren, deutlichen Qualitätssprung im Vergleich zu den früheren Versionen – man denke nur an Sora von OpenAI, eine Video-KI, welche die ganze Videoproduktion nochmal auf ein ganz anders Level heben kann, wenn sie den gezeigten Teasern und Versprechungen gerecht wird.

Trotz der Unterstützung durch KI und jahrzehntelanger Erfahrung im traditionellen Videoschnitt, erfordert die Produktion eines KI-gestützten Videos weiterhin seine Zeit. So beanspruchte das Projekt „Heilung“ beispielsweise 40 Stunden Produktionszeit. Dies lässt sich unter anderem auf die gelegentlichen Unstimmigkeiten in den generierten Fotos und Videos zurückführen, die noch nicht immer den Erwartungen entsprechen. Wie lange KI braucht, um auch diese letzten Fehler zu beheben, ist jedoch wohl nur noch eine Frage der Zeit.

Von Musikvideos bis hin zur kreativen Darstellung historischer Ereignisse und Geschichten – die vielfältigen KI-Technologien eröffnen revolutionäre Wege, Inhalte visuell eindrucksvoll zu gestalten. Doch nicht jedes Element muss zwangsläufig aus dem Bereich der KI stammen. Mein nächstes Vorhaben ist ein Musikvideo, inspiriert von den Werken eines bereits verstorbenen Dichters aus meiner alten Heimat, dem Sauerland. Während Instrumente und Gesang mithilfe künstlicher Intelligenz kreiert werden, setze ich für die visuelle Umsetzung auf die bewährte Qualität meiner Sony A7R V Kamera.

ĂśBER DEN AUTOR

Michael Schmidt AutorenbildGeboren und aufgewachsen im Herzen des Sauerlands, entdeckte Michael Schmidt bereits in jungen Jahren seine Leidenschaft in der Welt der visuellen Künste, angestoßen durch eine geschenkte Agfamatic 4000 Pocketkamera. Michael erlernte zunächst den Beruf des Druckers. Ein Umzug ins Münsterland markierte den Beginn eines neuen Kapitels: eine Weiterbildung zum Webdesigner.

Bei NaturaGart, einem Vorreiter in der Konzeption von Garten- und Teichlandschaften, fand Michael nicht nur eine berufliche Heimat, sondern auch eine unerschöpfliche Quelle der Inspiration. Der Park in Ibbenbüren, mit Europa größtem Unterwasserpark, einer Vielfalt an Musterteichen und einem eindrucksvollen Kaltwasseraquarium, wurde zur Bühne für Michaels leidenschaftliche Unterwasseraufnahmen, die er geschickt mit einem modifizierten U-Boot einfängt und auf seinem YouTube-Kanal zusammen mit den KI-Projekten präsentiert.

Michael Schmidts Bestreben, die Welt aus neuartigen Blickwinkeln zu erfassen, zeigt sich in seiner fortwährenden Auseinandersetzung mit den neuesten Entwicklungen in der Kameratechnologie und der kreativen Integration von Technologien aus angrenzenden Bereichen, wie beispielsweise dem RC-Modellbau und KI-Technologie.

Michael Schmidt auf YouTube
Michael Schmidt auf Instagram
Michael Schmidt auf Facebook

 

 

 

Autor: Michael Schmidt / Redaktion: Joachim Sauer, Jonas Schupp / Bilder: Michael Schmidt, Jonas Schupp

Viele weitere spannende Themen, Tests und Ratgeber gibt´s hier: