YouTube Instagram Vimeo RSS VIDEOAKTIV

Editorial: K├╝nstliche Intelligenz und immer mehr Cloud - KI f├╝r Bild und Video

Beitragsseiten

Doch (zumindest derzeit) greifen die verschiedenen KI-Ans├Ątze auf Wissen zur├╝ck, das von Menschen erarbeitet wurde und noch m├╝ssen wir die passenden Fragen stellen, damit am Ende sinnvolle Texte, Bilder und Videos entstehen. F├╝r die Bildauswahl dieses Editorials haben wir ca. 30 Anfragen an Hypotenuse AI geschickt. Erst als wir gelernt hatten, wie die Fragestellung aussehen muss und was die jeweilige KI ben├Âtigt, haben wir brauchbare Bilder und Texte erhalten.

HypothenuseAI Bildbeispiele

Etwas ├ťbung ben├Âtigt man derzeit noch um dem Rechner eine Anforderung zu stellen, aus der er ordentliche Bilder generieren kann.

Beim bewegten Bild ist das noch anders: Hier muss man neben der Idee zum Bild auch noch den passenden Text liefern. Vollautomatisch auf eine Fragestellung ein Video aus Text und passendem Bild erstellen ÔÇô soweit ist die Technik derzeit noch nicht. Es gibt verschiedene Ans├Ątze, wobei Synthesia bereits mit einer praxisgerechten Anwendung ├╝berzeugt: Aus vorgefertigten Moderatoren w├Ąhlt man das passende ÔÇ×ModellÔÇť f├╝gt die passenden Schlagworte f├╝r die im Hintergrund ablaufende Pr├Ąsentation hinzu und liefert den zu moderierenden Text.

synthesia videoaktiv

In der kostenfreien Testversion bekommt man nach dem Zufallsprinzip beziehungsweise dem ausgew├Ąhlten Themen-Preset eine Moderatorin oder Moderator vorgesetzt und die L├Ąnge des Moderationstexts ist sehr begrenzt.

Die KI von Synthesia sorgt daf├╝r, dass nun alles zusammenl├Ąuft und sich der Mund der wahlweise weiblichen oder m├Ąnnlichen Moderatoren bewegt. Lippen-Synchronit├Ąt ist dabei nur ansatzweise gegeben ÔÇô doch durch die vielen schlecht ├╝bersetzten Spielfilme f├Ąllt das wahrscheinlich vielen gar nicht auf. Und genau deshalb ist es durchaus denkbar, dass einige Firmen dieses Werkzeug f├╝r kurze firmeninterne Schulungen durchaus attraktiv finden. Immerhin hat der Mitarbeiter so einen pers├Ânlichen Bezug ÔÇô zumal man sich vorstellen kann, dass hier k├╝nftig bekannte Pers├Ânlichkeiten oder der eigene Firmenchef Pate f├╝r das entsprechende Avatar steht.

 

Die deutsche Sprache setzt die KI besser um als die meisten Navigationssysteme, die zwar auch eine automatisierte Sprachausgabe haben, aber eher auf Textschnipsel zur├╝ckgreifen. Die Machart ist zumindest f├╝r kurze Anleitungen durchaus eine Option.