KI-Update: 12 KI-Tools im Fokus

In Zeiten von Künstlicher Intelligenz und fortschreitender Digitalisierung wird es immer wichtiger, am Puls der Zeit – und der neuesten technologischen Entwicklungen – zu bleiben. KI-Tools gibt es mittlerweile wie Sand am Meer. Genau deshalb möchten wir euch unsere Top 12 KI-Tools und ihre Features vorstellen, die im Kreativprozess zum Einsatz kommen.

ELEVENLABS

Online-Tool für Text-to-Speech
Sehr vielseitig und bietet verschiedene Tonlagen, Stimmen etc. an
Funktioniert nur für kürzere Texte – das Vorlesen von längeren Texten, wie z.B. einem Audiobook, ist bisher noch zu wenig ausgereift
Zahlen sollten im Prompt ausgeschrieben werden, da sie andernfalls oft auf Englisch wiedergegeben werden

Folgende Audiospur wurde mit Elevenlabs generiert:

D_ID

Online-Tool zur Erstellung digitaler Avatare
Nach dem Hochladen der Audiodatei und der Auswahl der Sprache überträgt das Tool die Einstellungen auf den Avatar, welcher seinen Mund beim Sprechen entsprechend bewegt
Man kann zwischen vorgefertigten Avataren wählen oder ein eigenes Bild verwenden

Mit d_id hat unsere Stimme auch ein Gesicht bekommen:

LOUDLY

Online-Tool zur Musikgenerierung
Bestimmte Parameter können vorab definiert werden, wie z.B. Genre, BPM, Instrumente etc.
Funktioniert ohne das Einfügen von Texten
Erzeugt auch Gesang
Generiert Musik in einer Länge von ca. 30 Sekunden

Mit Loudly haben wir die Musik für unser Social Media Reel kreiert:

SUNO

Online-Tool für Text-to-Music
Funktioniert über die Eingabe von Texten, z.B.: „hochenergetischer Pop-Track mit EDM-Einflüssen zum Thema Female Empowerment“
Generiert Musik in einer Länge von bis zu einer Minute
Funktioniert auch mit anderen Sprachen
Technisch gesehen könnte man damit einen ganzen Song generieren und ggfs. eigene Texte hinzufügen

Dieses Stück haben wir mithilfe von Suno komponiert:

GENIE 3D

Online-Tool für Text-to-3D
Konzipiert für die Erstellung von einfachen Prompts
3D-Dateien können heruntergeladen und in das bevorzugte 3D-Programm importiert werden
Eher niedrige Qualität des Outputs: Der Look erinnert an Videospiele aus den frühen 2000er-Jahren und für ein brauchbares Ergebnis sind manuelle Korrekturen notwendig
Während man für die Nutzung von Genie3D bis vor Kurzem noch einen Discord-Account benötigt hat, kann man mittlerweile auch über die Website einsteigen

Das sind die Ergebnisse von Genie 3D:

GENMO

Online-Tool für Text-to-Image, Image-to-Video/Animation und Text-to-Video/Animation
Bietet eine Chatversion zur Generierung
Benutzerfreundlichkeit und gute Bildqualität
Konzipiert für einfache Prompts

Diese Animationen kamen bei unserer Recherche zu Genmo heraus:

MIDJOURNEY

Online-Tool für Text-to-Image
Eines der leistungsstärksten Tools, wenn es darum geht, neue Bildwelten zu generieren
Auch komplexere Prompts sind möglich
Wir bei upart nutzen das Tool hauptsächlich zur Erstellung von Mood-Bildern, die in weiterer Folge fotografiert werden.

Mithilfe von Midjourney haben wir unsere Geschäftsführer Daniel und Jörg in Szene gesetzt:

FIREFLY

Online-Tool für Text-to-Image von Adobe
Sehr benutzerfreundlich, bietet viele Stile als Voreinstellungen und Bilder können auch als Stilreferenzen verwendet werden
Mögliche Prompts sind sorgfältiger ausgewählt als bei anderen Tools
Wird mit Bildern aus der eigenen Adobe Stock-Website trainiert, was eventuelle Urheberrechtsprobleme ausschließt
Nicht möglich sind direkte Verweise auf Künstler, z.B. „in Stil von Frida Kahlo“, direkte Verweise auf öffentliche Persönlichkeiten, z.B. Papst in einer Daunenjacke oder potenziell schädliche Inhalte, z.B. Pornografie, Waffen etc.

Die Ergebnisse von Firefly können sich sehen lassen:

PIKA LABS

Online-Tool für Text-to-Video und Image-to-Video
Nicht für komplexere Prompts konzipiert
Ändert Gesichter bei realistischen Fotos sehr stark
Stilisierte Videos, wie z.B. 3D-Animationen (z.B. von Pixar oder Disney) sowie Animes funktionieren besser als realistische Videos
Es können bestehende Videos erweitert sowie verschiedene Größen generiert werden, z.B. 16:9, 9:16 etc.
Mit der Pro-Version können sogar Soundeffekte zu den Videos generiert werden
Seit Neuem gibt es auch ein Lip-Sync Feature

So sieht das Ergebnis unserer Recherche zu Pika Labs aus:

RUNWAY

Online-Tool für Text-to-Video und Image-to-Video
War und ist nach wie vor der Experte hinter der Text-to-Video-Technologie
Konzipiert für einfache Prompts
Bestes Tool, wenn es darum geht, Bilder so zu erhalten, wie sie eingegeben wurden (viele andere Tools verändern Gesichter, Szenerie etc. sehr stark)
Bietet eine Vielzahl von KI-Video- und Bild-Tools auf der Website an

Seht selbst, was Runway im Video-Bereich leistet:

STABLE DIFFUSION

Open-Source-Tool für Text-to-Image und Text-to-Video
Ist kostenlos und uneingeschränkt nutzbar, wird daher von vielen Menschen genutzt und lernt infolgedessen konstant und sehr schnell
Etwas komplexer in der Bedienung als andere Tools

Im Vergleich zum vorigen Beispiel sehen die Videos, die mit Stable Diffusion generiert wurden, so aus:

SORA

Online-Tool für Text-to-Video
Derzeit nur für Early Adopters und nicht für die breite Öffentlichkeit zugänglich (daher gibt's hier von unserer Seite noch keine Best Practice Beispiele 😉)
Sora ist ein Tool von OpenAI

Während wir diesen Beitrag schreiben, gibt es bestimmt schon wieder neue Entwicklungen in der Welt der KI und deren Tools. Wir bleiben dran und halten euch auf dem Laufenden, wenn es Neuigkeiten gibt!

Mit KI durchstarten?

Jetzt beraten lassen!

Jörg

Neuhauser

Ich freue mich über
Ihre Nachricht!

Mitdenken – ist nicht nur Teil unserer Materie in Sachen Werbung, sondern auch in Bezug auf den Lesefluss. Wir verzichten in unseren Beiträgen auf die differenzierte Ansprache der Geschlechter, damit die Texte besser lesbar sind. Wir möchten trotzdem festhalten, dass wir alle gleichermaßen ansprechen wollen und dies ohne Diskriminierungsabsicht geschieht.