Schnappt euch gerne wieder einen Espresso oder Kaffee☕️. In unserem heutigen „großen ChatGPT-Einmaleins“ möchten wir noch ausführlicher auf die zwei Projekte Whisper und DALL·E 2 von OpenAI eingehen.
Whisper
Whisper ist ein automatisches Spracherkennungssystem (ASR), das auf 680.000 Stunden multilingualen und multitaskalen Daten trainiert wurde. Es wandelt gesprochene Sprache in geschriebenen Text um, mit einer Präzision, die es von vielen anderen ASR-Systemen unterscheidet. Man kann Whisper für verschiedenste Anwendungen nutzen, wie Transkriptionsservices, Voice Assistants, Untertitelung und vieles mehr. Ein großer Vorteil von Whisper ist, dass es lokal auf einem Computer ausgeführt werden kann.
Für Whisper gibt es keine offizielle App von OpenAI, das Spracherkennungssystem ist vor allem für Entwickler gedacht. Dennoch kommt es zum Beispiel schon in der neuen ChatGPT-App zum Einsatz: https://openai.com/research/whisper 🚀🔤
Hier könnt ihr euch einen Eindruck von Whisper und den verschiedenen Funktionen machen: https://replicate.com/openai/whisper
DALL.E
DALL·E 2 ist ein neuronales Netzwerk, das darauf trainiert wurde, einzigartige Bilder aus Textbeschreibungen zu erstellen. Das ist die Fortsetzung des DALL·E-Projekts. Diese neue Version hebt die KI-generierte Kunst und das Design auf eine höhere Ebene, da sie komplexere und präzisere visuelle Inhalte generieren kann. Ihr könnt hier selbst zum Künstler werden und eure eigenen Ideen in Fotographien und Kunstwerke verwandeln.
Ihr könnt DALLE über folgenden Link ausprobieren: https://labs.openai.com/
Dabei bietet DALL·E 2 drei Funktionen:
-
„Prompt to Image“: Gebt einfach eine Bildbesschreibung ein, und DALL·E 2 wird ein passendes Bild dazu liefern. Beispiel „Ein futuristischer Zug, der durch eine Wüstenlandschaft fährt“ oder „Ein fantasievolles Schloss im Stil von Van Gogh“. Beachtet, dass ein Prompt bei DALL·E 2 verschiedene Parameter enthalten kann, wie Stil, Thema, Künstler usw. Je präziser die Anweisungen sind, desto zufriedenstellender wird das Ergebnis sein!
-
Hochladen und Verändern eigener Bilder: Ihr könnt auch ein vorhandenes Bild hochladen und DALL·E 2 bitten, es nach euren Wünschen zu modifizieren.
-
Editieren von Bildern: DALL·E 2 bietet in einer Beta-Version mittlerweile (wie auch Adobe Firefly) auch die Möglichkeit, generierte Bilder zu bearbeiten. Stellt euch vor, ihr habt eine AI-generierte Darstellung eines ruhigen Sees im Mondschein, aber ihr möchtet das Bild mit einer Silhouette eines Bootes beleben. Mit DALL·E 2 könnt ihr nun den Prompt entsprechend an einer von euch ausgewählten Stelle anpassen, z.B. „mein Bild, aber mit einem kleinen Boot auf dem See“. DALL·E 2 wird dann euer ursprüngliches Bild nehmen und darauf basierend das gewünschte Element hinzufügen.
Bei den Prompts können übrigens mehrere Parameter angegeben werden, um das Ergebnis zu beeinflussen.
Einige wichtige Parameter sind:
-
Thema: Das Thema ist die Hauptidee oder das Hauptobjekt im Bild. Wenn Ihr zum Beispiel „Ein Elefant, der auf einem Strandball balanciert“ eingebt, ist das Thema „Elefant“ und „Strandball“.
-
Stil: Ihr könnt den Stil des Bildes bestimmen. So kann das Bild im „Stil von Picasso“, „im Surrealismus-Stil“ oder „wie ein Anime“ erstellt werden. Dies bietet eine Fülle von Möglichkeiten für künstlerische Ausdrucksformen.
-
Künstler: Mit der Angabe eines bestimmten Künstlers kann DALL·E 2 versuchen, dessen einzigartige Technik oder Stil zu emulieren. Zum Beispiel: „Ein Landschaftsbild im Stil von Monet“.
-
Zeit: Ihr könnt auch eine bestimmte Zeitperiode angeben, z. B. „Ein neugotisches Schloss bei Nacht“.
-
Emotionen/Farben: Parameter wie „glücklich“, „traurig“, „lebhaft“, „düster“ oder Farben wie „rot“, „blau“ usw. können verwendet werden, um die Stimmung des Bildes zu beeinflussen. Z.B.: „Ein fröhlicher Hund in einer lebendigen grünen Wiese“.
-
Art der Fotografie oder des Malstils: Sollen die Bilder einem bestimmten Malstil entsprechen oder mit einer bestimmten Maltechnik gemalt werden, könnt ihr auch dies näher definieren. Beispielsweise könnt ihr Prompts wie „Ein Porträt von einem Elefanten in Ölmalerei“, „Eine Straßenszene in Aquarell“ oder „Ein Stillleben mit Früchten im Stil des Kubismus“ verwenden. Für Fotografie gilt das Gleiche. Ihr könnt Aspekte wie Perspektive, Kameraeinstellungen und das verwendete Objektiv berücksichtigen.
-
Umwandlung: Eine sehr interessante Funktion von DALL·E 2 ist die Möglichkeit, ein bereits existierendes Bild zu modifizieren. Ihr könnt zum Beispiel ein Bild von einer Brücke hochladen und DALL·E 2 bitten, sie „in eine Brücke aus Büchern zu verwandeln“.
Beispiel-Prompts:
-
„Eine surrealistische Darstellung eines Apfelbaums im Stil von Salvador Dali“
-
„a lovely orange cat, macro portrait, Canon EOS Rebel SL2, EF100mm, f/2. 8L, Macro IS USM ƒ/2. 8, 100. 0 mm, 1/1000 100
-
„Eine köstliche Eiskugel in einer halbrunden Waffel mit frischen Erdbeeren und köstlichen Toppings“
Zusammen bieten Whisper und DALL·E 2 unglaubliche Möglichkeiten, um unser tägliches Leben und unsere Arbeit zu verbessern. Sie sind gute Beispiele dafür, wie weit wir in so kurzer Zeit mit KI gekommen sind und welche spannenden Entwicklungen noch vor uns liegen.
DALL.E 2 und Whisper: zwei neue potentielle Mitglieder beim Team zaubern von DuffnerPR
Abonnieren Sie
unseren Newsletter
für Updates zur Kommunikation und ChatGPT!