Warum die Spracherkennung von ChatGPT die beste ist, die ich je verwendet habe

Kernpunkte

  • Die Spracherkennungsfunktion von ChatGPT übertrifft die von Google und eliminiert die Notwendigkeit, Satzzeichen explizit zu nennen.
  • Das neuronale Netzwerk WhisperAI bildet das Fundament von ChatGPT und ermöglicht makellose Transkriptionen, auch ohne Integration in herkömmliche Tastaturanwendungen.
  • ChatGPT ist problemlos auf Android, iPhone, macOS und in Kürze auch auf Windows verfügbar, was effizientes Notieren und Transkribieren ermöglicht.

Um es wirklich zu begreifen, muss man es selbst ausprobieren – die bemerkenswerte Sprach-zu-Text-Funktion von ChatGPT. Sie hat sich als deutlich reibungsloser und akkurater erwiesen als viele etablierte Spracherkennungs-Anwendungen.

ChatGPT übertrifft Googles Spracherkennung

Ich habe die Spracherkennung von Google über Jahre hinweg immer wieder mal genutzt. Sie ist Teil der SwiftKey-Tastatur-App und Googles eigener Gboard-Tastatur für Mobilgeräte. Eine Weile war sie recht gut – tatsächlich überdurchschnittlich –, aber das hat sich mittlerweile geändert. ChatGPT hat die Konkurrenz überholt, und die Ergebnisse sind beeindruckend.

Wer die Spracherkennung von Google kennt, weiß, wie mühsam es ist, jedes Mal „Komma“ oder „Punkt“ aussprechen zu müssen, um Satzzeichen einzufügen. Bei ChatGPT ist das nicht erforderlich. Man kann sich ganz natürlich ausdrücken, als würde man sich mit einem Freund unterhalten, und die Satzzeichen werden nahtlos an den richtigen Stellen gesetzt.

Das macht einen großen Unterschied. Nehmen wir diesen Satz als Beispiel: „Ich möchte zum Supermarkt gehen und Äpfel, Orangen, Wassermelonen, Birnen und Kirschen kaufen.“ Um dies mit der Google-Spracherkennung zu diktieren, müsste man sagen: „…Äpfel Komma Orangen Komma Wassermelonen Komma Birnen Komma und Kirschen.“ Fünfmal das Wort „Komma“ zu wiederholen, wirkt umständlich und unnatürlich.

Was macht die Sprach-zu-Text-Funktion von ChatGPT so leistungsfähig?

ChatGPT meistert die Umwandlung von Sprache in Text mit Bravour, dank WhisperAI, einem hochentwickelten neuronalen Netzwerk. OpenAI hat es als Open-Source-Modell freigegeben, um diejenigen zu fördern, die diese Technologie in praktischen Anwendungen weiterentwickeln möchten. Das bringt uns zu einem wichtigen Punkt: Die Sprach-zu-Text-Funktion von ChatGPT ist noch nicht in etwas wie eine Spracherkennungstastatur integriert.

Dennoch nutze ich es bereits regelmäßig in meinem Arbeitsalltag. Obwohl Googles Spracherkennung einfach über meine Tastatur zu erreichen ist, verschwende ich letztendlich viel Zeit damit, ihre Fehler zu korrigieren. Irgendwann begann ich, in kurzen Phrasen zu sprechen – ähnlich wie bei automatisierten Anrufen und computergenerierten Sprachausgaben –, um ihr zu helfen, meine Sprache besser zu erfassen.

Aus diesem Grund nutze ich die Sprach-zu-Text-Funktion von ChatGPT mit einer kleinen Umgehungslösung mit großer Freude. Letztendlich wird mir das viel Zeit und Mühe ersparen und mir erlauben, natürlicher zu sprechen.

ChatGPT ist verfügbar für Android, iPhone und macOS (M1 und neuer).

Eine Desktop-Anwendung für Windows ist für Ende 2024 angekündigt.

Notizen erstellen mit ChatGPT auf meinem Smartphone

Meine Notizen für Artikel schreibe ich gewöhnlich mit Stift und Papier. Ironischerweise ist das eine sehr analoge Vorgehensweise für jemanden, der über Technik schreibt! Obwohl ich das genieße, müssen diese Worte irgendwann in ein digitales Format umgewandelt werden, um wirklich nützlich zu sein.

Am liebsten übertrage ich meine Ideen in eine Notizen-App. Google Keep ist zum Beispiel gut, da es Notizen automatisch online und geräteübergreifend synchronisiert. Oder es gibt Obsidian, meine bevorzugte neue Methode, um meine Gedanken langfristig zu ordnen. Langfristig ist es am besten, eine Notizen-App zu wählen, die auf jedem Gerät funktioniert, um zusätzlichen Komfort zu erhalten.

Mein Vorgehen ist einfach: ChatGPT öffnen, den Mikrofon-Button aktivieren und mit dem Sprechen beginnen. Anschließend auf „Stopp“ drücken, um das Gesprochene in Text umzuwandeln. Zuletzt den Text kopieren und in eine Notizen-App einfügen.

Spracherkennung mit ChatGPT auf meinem Rechner

Auf meinem Desktop gehe ich genauso vor. Die Anwendung sieht fast identisch mit der mobilen Version aus. Man klickt auf den Mikrofon-Button, um die Aufnahme zu starten, und dann auf das Häkchen, wenn man fertig ist. Anschließend lässt sich der Text an den gewünschten Ort kopieren, beispielsweise in ein Word-Dokument oder eine E-Mail.

Manchmal ist es von Vorteil, die Transkriptionen direkt in ChatGPT zu speichern. In diesem Fall kann man die Zeile „Bitte nicht kommentieren:“ direkt vor dem transkribierten Text hinzufügen und die Eingabetaste drücken, um sie in den Konversationsverlauf von ChatGPT einzufügen. Dies verhindert, dass ChatGPT mit einer ausführlichen Antwort reagiert, und man hat gleichzeitig eine Aufzeichnung der Transkriptionen.

Neben der Umwandlung von Sprache in Text gibt es viele weitere Anwendungsmöglichkeiten für ChatGPT. Das macht es zu einer praktischen Allzweck-Anwendung, die man zur Hand haben sollte.

Es wird wohl nicht mehr lange dauern, bis dieses KI-Modell für die Sprach-zu-Text-Umwandlung in Spracherkennungs-Apps oder Transkriptionswerkzeugen eingesetzt wird. Bis dahin kann man ChatGPT nutzen, um präzise und saubere Transkriptionen für Notizen, Brainstorming oder Diktate zu erstellen.

Fazit

Insgesamt zeigt die Sprach-zu-Text-Funktion von ChatGPT erhebliche Vorteile gegenüber herkömmlichen Spracherkennungstools. Mit seiner innovativen Technologie und Benutzerfreundlichkeit wird es sicherlich eine wertvolle Bereicherung für jeden sein, der Notizen machen oder Texte diktieren möchte. Nutzen Sie die Möglichkeiten, die ChatGPT Ihnen bietet, um Ihren kreativen Prozess zu unterstützen und effizienter zu arbeiten.