KI-Update: 12 KI-Tools im Fokus

In Zeiten von Künstlicher Intelligenz und fortschreitender Digitalisierung wird es immer wichtiger, am Puls der Zeit – und der neuesten technologischen Entwicklungen – zu bleiben. KI-Tools gibt es mittlerweile wie Sand am Meer. Genau deshalb möchten wir euch unsere Top 12 KI-Tools und ihre Features vorstellen, die im Kreativprozess zum Einsatz kommen.

 

ELEVENLABS

  • Online-Tool für Text-to-Speech
  • Sehr vielseitig und bietet verschiedene Tonlagen, Stimmen etc. an
  • Funktioniert nur für kürzere Texte – das Vorlesen von längeren Texten, wie z.B. einem Audiobook, ist bisher noch zu wenig ausgereift
  • Zahlen sollten im Prompt ausgeschrieben werden, da sie andernfalls oft auf Englisch wiedergegeben werden

Folgende Audiospur wurde mit Elevenlabs generiert:

D_ID

  • Online-Tool zur Erstellung digitaler Avatare
  • Nach dem Hochladen der Audiodatei und der Auswahl der Sprache überträgt das Tool die Einstellungen auf den Avatar, welcher seinen Mund beim Sprechen entsprechend bewegt
  • Man kann zwischen vorgefertigten Avataren wählen oder ein eigenes Bild verwenden

Mit d_id hat unsere Stimme auch ein Gesicht bekommen:

LOUDLY

  • Online-Tool zur Musikgenerierung
  • Bestimmte Parameter können vorab definiert werden, wie z.B. Genre, BPM, Instrumente etc.
  • Funktioniert ohne das Einfügen von Texten
  • Erzeugt auch Gesang
  • Generiert Musik in einer Länge von ca. 30 Sekunden

Mit Loudly haben wir die Musik für unser Social Media Reel kreiert:

SUNO

  • Online-Tool für Text-to-Music
  • Funktioniert über die Eingabe von Texten, z.B.: „hochenergetischer Pop-Track mit EDM-Einflüssen zum Thema Female Empowerment“
  • Generiert Musik in einer Länge von bis zu einer Minute
  • Funktioniert auch mit anderen Sprachen
  • Technisch gesehen könnte man damit einen ganzen Song generieren und ggfs. eigene Texte hinzufügen

Dieses Stück haben wir mithilfe von Suno komponiert:

GENIE 3D

  • Online-Tool für Text-to-3D
  • Konzipiert für die Erstellung von einfachen Prompts
  • 3D-Dateien können heruntergeladen und in das bevorzugte 3D-Programm importiert werden
  • Eher niedrige Qualität des Outputs: Der Look erinnert an Videospiele aus den frühen 2000er-Jahren und für ein brauchbares Ergebnis sind manuelle Korrekturen notwendig
  • Während man für die Nutzung von Genie3D bis vor Kurzem noch einen Discord-Account benötigt hat, kann man mittlerweile auch über die Website einsteigen

Das sind die Ergebnisse von Genie 3D:

GENMO

  • Online-Tool für Text-to-Image, Image-to-Video/Animation und Text-to-Video/Animation
  • Bietet eine Chatversion zur Generierung
  • Benutzerfreundlichkeit und gute Bildqualität
  • Konzipiert für einfache Prompts

Diese Animationen kamen bei unserer Recherche zu Genmo heraus:

MIDJOURNEY

  • Online-Tool für Text-to-Image
  • Eines der leistungsstärksten Tools, wenn es darum geht, neue Bildwelten zu generieren
  • Auch komplexere Prompts sind möglich
  • Wir bei upart nutzen das Tool hauptsächlich zur Erstellung von Mood-Bildern, die in weiterer Folge fotografiert werden.

Mithilfe von Midjourney haben wir unsere Geschäftsführer Daniel und Jörg in Szene gesetzt:

FIREFLY

  • Online-Tool für Text-to-Image von Adobe
  • Sehr benutzerfreundlich, bietet viele Stile als Voreinstellungen und Bilder können auch als Stilreferenzen verwendet werden
  • Mögliche Prompts sind sorgfältiger ausgewählt als bei anderen Tools
  • Wird mit Bildern aus der eigenen Adobe Stock-Website trainiert, was eventuelle Urheberrechtsprobleme ausschließt
  • Nicht möglich sind direkte Verweise auf Künstler, z.B. „in Stil von Frida Kahlo“, direkte Verweise auf öffentliche Persönlichkeiten, z.B. Papst in einer Daunenjacke oder potenziell schädliche Inhalte, z.B. Pornografie, Waffen etc.

Die Ergebnisse von Firefly können sich sehen lassen:

PIKA LABS

  • Online-Tool für Text-to-Video und Image-to-Video
  • Nicht für komplexere Prompts konzipiert
  • Ändert Gesichter bei realistischen Fotos sehr stark
  • Stilisierte Videos, wie z.B. 3D-Animationen (z.B. von Pixar oder Disney) sowie Animes funktionieren besser als realistische Videos
  • Es können bestehende Videos erweitert sowie verschiedene Größen generiert werden, z.B. 16:9, 9:16 etc.
  • Mit der Pro-Version können sogar Soundeffekte zu den Videos generiert werden
  • Seit Neuem gibt es auch ein Lip-Sync Feature

So sieht das Ergebnis unserer Recherche zu Pika Labs aus:

RUNWAY

  • Online-Tool für Text-to-Video und Image-to-Video
  • War und ist nach wie vor der Experte hinter der Text-to-Video-Technologie
  • Konzipiert für einfache Prompts
  • Bestes Tool, wenn es darum geht, Bilder so zu erhalten, wie sie eingegeben wurden (viele andere Tools verändern Gesichter, Szenerie etc. sehr stark)
  • Bietet eine Vielzahl von KI-Video- und Bild-Tools auf der Website an

Seht selbst, was Runway im Video-Bereich leistet:

STABLE DIFFUSION

  • Open-Source-Tool für Text-to-Image und Text-to-Video
  • Ist kostenlos und uneingeschränkt nutzbar, wird daher von vielen Menschen genutzt und lernt infolgedessen konstant und sehr schnell
  • Etwas komplexer in der Bedienung als andere Tools

Im Vergleich zum vorigen Beispiel sehen die Videos, die mit Stable Diffusion generiert wurden, so aus:

 

SORA

  • Online-Tool für Text-to-Video
  • Derzeit nur für Early Adopters und nicht für die breite Öffentlichkeit zugänglich (daher gibt's hier von unserer Seite noch keine Best Practice Beispiele 😉)
  • Sora ist ein Tool von OpenAI

Während wir diesen Beitrag schreiben, gibt es bestimmt schon wieder neue Entwicklungen in der Welt der KI und deren Tools. Wir bleiben dran und halten euch auf dem Laufenden, wenn es Neuigkeiten gibt!

Mit KI durchstarten?

Jetzt beraten lassen!
Jörg
Neuhauser

Ich freue mich über
Ihre Nachricht!

 

Mitdenken – ist nicht nur Teil unserer Materie in Sachen Werbung, sondern auch in Bezug auf den Lesefluss. Wir verzichten in unseren Beiträgen auf die differenzierte Ansprache der Geschlechter, damit die Texte besser lesbar sind. Wir möchten trotzdem festhalten, dass wir alle gleichermaßen ansprechen wollen und dies ohne Diskriminierungsabsicht geschieht.