top of page

Sprich mit mir, ChatGPT! Die brandneue Sprachausgabe im Fokus.

Hallo liebe Community! 

In unserem heutigen ChatGPT-Einmaleins wollen wir noch ausführlicher auf die brandneue Sprachausgabe von ChatGPT schauen.

Mit dieser hat ChatGPT nicht nur ein nützliches Gimmick geschaffen, sondern einen absoluten Gamechanger, der künstliche Assistenten wie Alexa und Siri in vielerlei Hinsicht obsolet macht. Auch der kürzlich wieder freigeschaltete Internetzugang für ChatGPT ist dabei kein Zufall, sondern sicher eine bewusste Entscheidung von OpenAI. Die Kombination aus der hochentwickelten Sprachausgabe und der Internetfunktion revolutioniert einen revolutionären Schritt im Bereich der künstlichen Intelligenz, der Apple und Amazon bisher verwehrt geblieben ist.

 

Doch wie können wir dieses neue Feature optimal nutzen? Welche Einstellungsmöglichkeiten stehen uns zur Verfügung, und wie schlagen sich die fünf verfügbaren Stimmen in der Praxis? 

Also schnappt euch erst einmal einen Kaffee oder Espresso, denn wir haben einiges zu besprechen!

Wo finde ich die Sprachausgabe für ChatGPT?

 

Zunächst einmal ist die Sprachausgabe wieder einmal nur zahlenden Kunden (ChatGPT Plus) vorbehalten und dazu nur auf der ChatGPT-App auf Android oder IOS verfügbar. Während die Funktion in den USA bereits erhältlich ist, wird sie in Deutschland nach und nach ausgerollt. Ein kleiner Umweg über ein VPN mit US-IP kann den Zugang erleichtern. Bei mir war sie auf auf meinem Android-Smartphone zu finden, aber aus unerfindlichen Gründen noch nicht auf meinem IPad.

     

a) Der erste Schritt zur Nutzung der neuen Sprachausgabe-Funktion ist der Besuch im Einstellungsmenü der ChatGPT-App. Hier finden sich die „neuen Funktionen“, vorausgesetzt, man ist für dieses Feature freigeschaltet. Eventuell müsst ihr diese auch im Unterpunkt „Beta-Features“ erst aktivieren.

   

b) Bei der Option „Speech“ kann sowohl die Stimme („Voice“) als auch die bevorzugte Sprache („Main Language“) ausgewählt werden. 

Auswahl und Anpassung der Stimmen

 

Es gibt fünf verschiedene Stimmen zur Auswahl, die sich für verschiedene Anwendungen und Stimmungen eignen. Jede Stimme hat außerdem ihre eigenen Merkmale bzgl. Tonhöhe, Aussprache und Akzent:

Stimmenauswahl und Anwendungsgebiete:

a) Sky:

  • Weibliche Stimme

  • Warm und neutral 

  • Moderater Tonlage 

  • Langsame Aussprache 

  • Monotone Betonung 

  • Starker Akzent 

  • Perfekte Pausen in der Aussprache 

 

Geeignet für sachliche Texte, Beschreibungen, News, Zusammenfassungen oder sachliche Artikel.

b) Ember:

  • Männliche Stimme

  • Junge und lebhafte Tonalität 

  • Schnelle Aussprache 

  • Lebendige und betonte Aussprache 

Ideal für Werbung, unterhaltsame Artikel, lebendiges Storytelling, motivierende oder inspirierende Texte.

c) Breeze:

  • Männliche Stimme

  • Quirlig und jugendlich 

  • Hohe Tonlage 

  • Schnelle Aussprache 

  • Junge Podcast-ähnliche Stimme 

Perfekt für Social-Media, Podcasts und Werbung.

 

d) Juniper:

  • Weibliche Stimme

  • Jung und lebhaft 

  • Hohe Tonlage 

  • Schnelle Aussprache 

  • Verbesserte Betonung im Vergleich zu Sky 

Optimal für Hörbücher geeignet.

 

e) Cove:

  • Männliche Stimme

  • Neutral und warm 

  • Mäßige bis niedrige Tonlage 

  • Langsame Aussprache 

  • Aufreißerische Betonung 

Passend für eine breite Palette von Anwendungen.

 

Neben der Standard-Sprache Englisch unterstützt ChatGPT übrigens auch andere Sprachen wie Deutsch, Französisch, Polnisch, Japanisch und Spanisch, obwohl die Stimmen einen leichten amerikanischen Akzent aufweisen können.

Screenshot der Einstellungen in der ChatGPT App mit Speech-Mode.

c) Ist alles eingestellt, führt ein Klick auf das Kopfhörer-Icon in die spezielle Benutzeroberfläche, wo der Dialog mit dem großen Sprachmodell beginnen kann.

Screenshot der ChatGPT App mit Kopfhörersymbol.

 

Die 5 verschiedenen Stimmen, die ChatGPT aktuell verkörpern kann.

Stärken und Schwächen

Stärken: 

  • Außergewöhnlich natürlich wirkende Sprachwiedergabe mit natürlichen Pausen, Betonung je nach Kontext und einem guten Verständnis von langen und kurzen Sätzen, Satzzeichen und Absätzen. Manchmal werden sogar bewusst einzelne „Äh“ eingestreut.

  • Die Stimmen sind vielfältig mit unterschiedlichen Charaktermerkmalen und eignen sich jeweils für unterschiedliche Themenbereiche. 

  • Der amerikanische Akzent klingt eigentlich sogar sehr sympathisch und die Sprachenvielfalt ist wirklich beeindruckend. 

  • Auch die Spracherkennung funktioniert in der Regel hervorragend. 

  • Die Texte werden nicht nur vorgelesen, sondern auch wie gewohnt in einem Chatfenster generiert. Es wird jedoch immer nur der Text vorgelesen (aber z. B. keine Emojis, Links oder Quellenangaben). 

Schwächen: 

  • Keine Stimme kann ernsthafte oder traurige Inhalte angemessen betonen. Auch ein Artikel über hungernde Kinder in Afrika klingt hier wie eine Werbereklame für einen Schokoriegel. 

  • Hohe Auslastung: Immer wieder gibt es eine derart hohe Auslastung, was zu Artefakten oder sogar Ausfällen in der Sprachausgabe führen kann. 

  • Schwierigkeiten bei unklarer Aussprache: Die Spracherkennung kann Schwierigkeiten haben, unklare Aussprache zu verstehen, was zu kuriosen Interpretationen wie „Chatchipiti“ statt ChatGPT führen kann. In der Regel erkennt ChatGPT trotzdem, was gemeint ist. 

  • Versehentliches Beenden des Gesprächs: Ein versehentliches Tippen auf den Bildschirm kann das Gespräch beenden. Es ist außerdem nicht möglich, die Sprachausgabe verbal zu stoppen. Kein flüssiges Gespräch. 

  • Amerikanischer Akzent: Die verfügbaren Stimmen haben noch einen merklichen amerikanischen Akzent, da sie noch nicht perfekt auf die deutsche Sprache angepasst sind.

In unserem heutigen ChatGPT-Einmaleins möchten wir die Möglichkeiten der "Custom Instructions" von ChatGPT erkunden. Seit ein paar Monaten sind diese endlich auch in Deutschland verfügbar und stehen allen Nutzern und Nutzerinnen zur Verfügung.

 

CIs sind individuelle Anweisungen. Diese können spezifische Ziele, Präferenzen oder Themen enthalten, und das Beste daran ist, dass du sie nicht bei jedem neuen Chat erneut eingeben musst. Ein echter Zeit- und Nervensparfaktor! ⏱️💆‍♂️

Ganz konkret haben Nutzer die Möglichkeit, bis zu zwei Fragen mit einem Umfang von bis zu 1500 Zeichen zu beantworten. Diese Fragen können sich auf unterschiedliche Aspekte konzentrieren, wie die Rollenbestimmung, die gewünschte Tonalität oder das angestrebte Format der Antworten. 

 

Ausführliche Infos unter www.duffner-pr.de im Blog oder nächste Woche im Artikel bei LinkedIn.

#OpenAI #ChatGPT #AI #ChatGPT-Einmaleins #DuffnerPR #Thomas Schwetschke

 

 

 

 

 

Wir möchten uns herzlich beim Suchtpräventions-Programm "b.free" für...

Weihnachtskampagne mit Humor: b.free sensibilisiert für Jugendschutz im Umgang mit Alkohol

NEWS

12.2022

In unserem heutigen ChatGPT-Einmaleins möchten wir gemeinsam die Möglichkeiten...

ChatGPT wird individuell: Custom Instructions erklärt

05.2022

NEWS

Im September hatte Duffner PR die Gelegenheit, an einer der Konferenzen teilzunehmen...

Google treibt Innovation in Künstlicher Intelligenz in München voran

NEWS

05.2022

Endlich haben wir es geschafft, gleich mehrere Anlässe zu feiern!

Housewarming Party

NEWS

05.2022

Endlich haben wir es geschafft, gleich mehrere Anlässe zu feiern!

Housewarming Party

NEWS

05.2022

Endlich haben wir es geschafft, gleich mehrere Anlässe zu feiern!

Housewarming Party

NEWS

05.2022

bottom of page