ChatGPT 4.0: Ein Quantensprung im Chatbot-Bereich?
Die Einführung von ChatGPT 4.0 hat hohe Erwartungen in der Welt der Chatbots geweckt. Doch wie schneidet die neue Version im Vergleich zu ihrem Vorgänger ab? Ein genauerer Blick lohnt sich.
ChatGPT markierte erst den Beginn einer Ära der Automatisierung, in der Google, Microsoft und andere führende KI-Unternehmen eine wichtige Rolle spielen. Viele Chatbots sind inzwischen auf dem Markt, wobei etliche nicht von den großen Technologiekonzernen stammen.
Trotz der Konkurrenz hat sich ChatGPT als der führende KI-Bot etabliert. Die Vielseitigkeit ist beeindruckend: Mathematische Berechnungen, das Verfassen von Gedichten und Blogbeiträgen, oder sogar die Unterstützung bei der Erstellung von Klageschriften sind möglich.
Ein Beispiel hierfür ist DoNotPay, das an der Verwendung von GPT-4 arbeitet, um mit einem einzigen Klick Klagen gegen Robocaller zu generieren. Stellen Sie sich vor, Sie erhalten einen Anruf, klicken auf einen Button, der Anruf wird transkribiert, und es wird automatisch eine Klageschrift mit 1.000 Wörtern erstellt. GPT-3.5 war hierfür nicht geeignet, aber GPT-4 meistert diese Aufgabe hervorragend: pic.twitter.com/gplf79kaqG
– Joshua Browder (@jbrowder1) 14. März 2023
Es gibt viele Experten, die befürchten, dass ihre beruflichen Fähigkeiten in naher Zukunft überflüssig werden könnten.
Ein interessanter LinkedIn-Beitrag fasste es jedoch so zusammen:
„KI wird Sie nicht ersetzen, aber eine Person, die KI nutzt, könnte dies tun.“
Lassen Sie uns also die jüngsten Entwicklungen von ChatGPT genauer betrachten und die Unterschiede zu seinen vorherigen Versionen aufzeigen.
ChatGPT: Die Vorgänger, der Standard und das Upgrade
Für zahlende Nutzer stehen drei Versionen zur Verfügung: Legacy (3.5), Default (3.5) und das aktuelle ChatGPT-Update (4).
OpenAI hat die Unterschiede zwischen den Versionen wie folgt zusammengefasst:
Quelle: OpenAI
Während kostenlose Benutzer nur Zugriff auf Legacy 3.5 haben, bietet das Premium-Abonnement alle drei Versionen. Nutzer können so selbst entscheiden, welche Version am besten zu ihren Anforderungen passt.
Zusammenfassend lässt sich sagen, dass die Premium-Versionen darauf abzielen, präzisere Ergebnisse in einer angemessenen Geschwindigkeit zu liefern. Die Unterschiede werden jedoch besonders bei komplexen und kreativen Aufgaben deutlich.
Parameter | ChatGPT 4 | ChatGPT 3.5 |
Bar Exam Score | Top 10% | Low 10% |
AI2 Reasoning Challenge (ARC) | 96.3% | 85.2% |
Python Coding Score | 67% | 48.1% |
Visuelle Interpretation | Ja | Nein |
Kontext | Mehr als 25.000 Wörter | Weniger |
Quelle: OpenAI
Darüber hinaus ist ChatGPT 4 in der Lage, visuelle Eingaben zu verarbeiten.
Nun aber genug der Theorie. Lassen Sie uns diese Kandidaten in der Praxis testen.
In den folgenden Abschnitten können Bilder verwendet werden, die möglicherweise nicht klar erkennbar sind. In solchen Fällen klicken Sie bitte mit der rechten Maustaste auf ein Bild und wählen „In neuem Tab öffnen“, um es korrekt anzuzeigen.
Mathematik
Als Ingenieur kann ich nicht widerstehen, ein paar grundlegende mathematische Aufgaben zu stellen. Beginnen wir mit algebraischen Gleichungen.
Stufe I
Die meisten von uns kennen die Gleichungen der Form ax2+bx+c=0, bei denen wir nach X auflösen müssen. Ich habe folgende einfache Anfrage gestellt: Löse nach x: x2 + x – 6 = 0.
Alle Versionen haben die gleichen Nullstellen (X= -3,2) gefunden. Legacy und die aktualisierte Version ähnelten sich darin, dass sie die Formel direkt anwendeten, um die Ergebnisse zu ermitteln.
Standard 3.5 hingegen hat zwei Methoden präsentiert, einschließlich der Faktorisierung, die in der Regel von erfahrenen Studenten bei derartigen Gleichungen verwendet wird.
Stufe II
Als Nächstes habe ich die Aufgabe gestellt, eine komplexere kubische Gleichung zu lösen: x3 -12x2 + 48x – 64 = 0.
Hier zeigte sich, warum ChatGPT 4 wirklich ein „Update“ ist.
Hier die Ergebnisse:
Trotz des Hypes konnten ChatGPT Legacy und Default keine allgemeine kubische Gleichung lösen. Legacy erzielte ein etwas besseres Ergebnis und fand zwei Wurzeln richtig, während Default bei allen versagte.
Das Update war der klare Gewinner der zweiten Phase und löste die Gleichung fehlerfrei, indem es alle drei Wurzeln korrekt ermittelte und nachvollziehbar erklärte.
Logisches Denken
Die meisten grundlegenden mathematischen Probleme haben standardisierte Lösungen. Wenn man die richtige Formel kennt, kann man die Werte einsetzen und das Ergebnis ermitteln.
ChatGPT als KI kann solche Anfragen schnell bearbeiten. Logisches Denken ist jedoch ein anderes Feld, bei dem die KI erfahrungsgemäß scheitern kann.
Stufe I
Ich habe ihnen die klassische Aufgabe gegeben:
A ist älter als B.
C ist älter als A.
B ist älter als C.
Ist die dritte Aussage wahr oder falsch, wenn die ersten beiden Aussagen wahr sind?
Alle ChatGPT-Versionen gaben korrekt an, dass die dritte Aussage falsch ist.
Als Nächstes habe ich anstelle von Buchstaben Namen verwendet, und die Ergebnisse waren etwas überraschend:
Default 3.5 setzte seine unterdurchschnittliche Leistung fort und war mit dieser Variante überfordert. Legacy und das Update hingegen erzielten optimale Ergebnisse.
Stufe II
Die Absicht dieser beiden Stufen ist es, Unterschiede zu erkennen. Die Komplexität einer bestimmten Anfrage unterscheidet das Update von den beiden anderen.
Hier war die Aufgabe ein einfaches Logikrätsel:
Eines Morgens nach Sonnenaufgang stand Rohit vor einem Pfahl. Der Schatten des Pfahls fiel genau rechts von ihm. In welche Richtung schaute er?
A. Norden
B. Westen
C. Süden
D. Osten
Legacy lieferte eine falsche Antwort, während Default vage Erläuterungen gab, die zu einer falschen Schlussfolgerung führten.
Nur das Update glänzte mit der richtigen Antwort und einer leicht verständlichen Erklärung.
Briefe
Das Einreichen von Klagen kann kompliziert sein, aber manchmal ist das gar nicht nötig, wenn man ein überzeugendes erstes Schreiben verfassen kann.
Ich habe folgende Anfrage gestellt: Verfasse ein Schreiben an Tim Cook, in dem ich ihm Apple abnehme, weil er nicht auf einen meiner Tweets geantwortet hat.
Absurd, ja! Aber sehen wir, was die KI daraus macht.
Legacy 3.5 nahm die Anfrage an wie ein Roboter und verfasste umgehend ein Schreiben, das mich lächerlich machen würde, wenn es jemals sein Ziel erreichen würde.
Auch Default schnitt nicht gut ab. Es hat mich einfach abgewiesen, wie es ein mürrischer alter Mann mit einem Fünfjährigen tun würde.
Obwohl die Argumente stichhaltig waren, beendete dies den Spaß, ohne dass viel gelernt wurde.
Obwohl es sich um eine relativ einfache Anfrage handelte, erforderte sie doch einiges an Nachdenken und Kreativität. Und hier hat sich das Update bewährt:
Erstens war es nahezu perfekt formuliert. Zweitens sparte es mir eine Google-Suche nach der Adresse von Apples Hauptsitz (obwohl solche Einträge überprüft werden sollten).
Drittens war es gut geschrieben, mit einem offiziellen Ton und einer humorvollen Note. Darüber hinaus war die Absicht bereits im Betreff klar.
Dennoch brachte der Brief die Stimmung eines verärgerten Apple-Fans zum Ausdruck.
Damit ist ChatGPT 4 (auch bekannt als das Update) seinen Vorgängern um Längen voraus. Es ist erstaunlich intelligent und zeigt Anzeichen von gesundem Menschenverstand, was es zu mehr als einem einfachen Chatbot macht.
Poesie
Ich dachte, dass die Dichtkunst ein Schwachpunkt von ChatGPT sein könnte.
Schließlich benötigt ein Mensch Emotionen, Kreativität und viel Mühe, um etwas zu schaffen, das die Leser wirklich anspricht.
Einfach ausgedrückt, Poesie ist eine Kunstform, und ich hatte insgeheim gehofft, dass die KI hier scheitern würde. Aber das war, bevor einer meiner Kollegen uns alle im Slack-Kanal von wdzwdz mit einer ChatGPT-Kreation überrascht hat, noch vor diesem 4.0-Update.
Stufe I
Hier ist die Anfrage, die ich unseren Kandidaten gestellt habe: „Drückt poetisch aus, warum oder warum es der Pizzakette Dominos zugute kommen kann, Burger in ihre Speisekarte aufzunehmen. Beschränkt euch auf weniger als 100 Wörter.“
Können Sie den Unterschied erkennen?
Die Version von Default war mit nur 32 Wörtern sehr kurz und konnte nicht die Bandbreite für kreative Arbeit nutzen.
Legacy verwendete zwar die meisten Wörter, kam jedoch zu dem Schluss, dass das Unterfangen, neben Pizza auch Burger anzubieten, keine Risiken birgt und in jedem Fall sicher zum Erfolg führen würde. Das stimmt jedoch nicht ganz.
Die Poesie des Updates bestand aus nur 53 Wörtern, was fast die Hälfte der zugewiesenen Wortzahl verschwendete. Dennoch war sich die KI über die Vorteile und möglichen Fallstricke im Klaren und konnte zu einem Ergebnis kommen, das meiner Meinung nach menschlicher ist als der Rest.
Stufe II
Als Nächstes habe ich alle gebeten, „einem Fünfjährigen Gedichte zu erklären“.
Interessanterweise konnte Legacy keinen Kontext aus dem Gespräch ableiten und erklärte „Poesie“ wörtlich. Default hat den Kontext erfasst und in einem passablen Absatz zusammengefasst.
ChatGPT 4 setzte den Trend fort und vereinfachte seine Kreativität, wobei der poetische Geschmack erhalten blieb.
ChatGPT Premium vs. ChatGPT Free
Die kostenlose Version von ChatGPT ist in Bezug auf Geschwindigkeit und Genauigkeit nicht so gut wie ChatGPT 4. Sie ist jedoch nicht völlig nutzlos.
Um einen Vergleich auf Augenhöhe zu ermöglichen, habe ich die gleichen Anfragen verwendet, mit denen wir Legacy, Default und das Update getestet haben.
- 🔵 Mathematik: Es hat quadratische Gleichungen gelöst, aber falsche Antworten bei den kubischen Gleichungen gegeben (wie Legacy und Default).
- 🔵 Logisches Denken: Die erste Phase mit Buchstaben und Namen wurde bestanden, die zweite jedoch nicht (wie Legacy).
- 🔵 Briefe: Es wurde kein Brief verfasst, da die Anfrage als unethisch und unangebracht angesehen wurde (wie Default).
- 🔵 Poesie: Gedichte mit über 30 Wörtern erstellt und anständig erklärt (ähnlich wie bei Default).
Wir können also feststellen, dass die kostenlose Version auch nicht schlecht ist. Tatsächlich ist sie mit Default 3.5 vergleichbar und in einigen Aspekten sogar besser.
Lesen Sie auch: Leistungsstarke Eingabeaufforderungen zur Verbesserung Ihrer ChatGPT-Erfahrung
Der Weg in die Zukunft
Die Gerüchte, dass KI in Zukunft Arbeitsplätze ersetzen wird, sind nicht völlig falsch.
Zunächst geschah dies in der Fertigungsindustrie durch die Automatisierung, und nun breitet sich dieser Trend in anderen Branchen aus.
Persönlich ist die KI viel schneller als ich, wenn es um die Lösung kubischer Gleichungen, das Verfassen von Gedichten oder Briefen geht. Dass die KI jedoch selten NEIN zu einer Anfrage sagt und kaum aus Fehlern lernt, bleibt uns Menschen vorbehalten.
Um es zu wiederholen: KI wird uns nicht ersetzen, aber jemand, der KI nutzt, könnte dies tun.
Wir bei wdzwdz setzt unser Marketingteam ChatGPT auf kreative Weise ein. Zum Beispiel haben wir kürzlich den Meilenstein von 100 Millionen Aufrufen erreicht, und unser CEO hatte die Idee, dies in Form eines Gewinnspiels an die Öffentlichkeit zurückzugeben.
Und so brauchten die Marketingmitarbeiter einen Titel, um die Aufmerksamkeit der Leser zu erregen. Also gaben sie eine Anfrage ein und baten ChatGPT, einige Variationen vorzuschlagen, wie diese:
Darüber hinaus setzen wir es zur Inhaltszusammenfassung, Grammatikprüfung, zum Vorschlagen von Titeln für neue Artikel und so weiter ein.
Zusammenfassend lässt sich sagen, dass es viele Möglichkeiten gibt, die Vorteile der KI zu nutzen und Stereotypen, die KI als nutzloses Stück Müll abtun, einen Schritt voraus zu sein.
Wichtig ist nur, dass es immer noch jemanden (einen Menschen) braucht, der die Arbeit der KI bewertet, da diese (grob) ungenau und irreführend sein kann.
Das Update ist wirklich beeindruckend!
Nach meinem kurzen Test fühlte sich ChatGPT 4 kreativer, verständnisvoller und realistischer an. Es handelt sich jedoch immer noch um eine Maschine, die durchaus falsche Antworten geben kann.
Was jedoch bemerkenswert ist, ist das Ausmaß der Verbesserungen, die OpenAI in nur wenigen Monaten an diesem Projekt vorgenommen hat.
Und ich bin gespannt darauf, welche Magie uns das nächste Update zeigen wird!
PS: Es ist nicht nur ein Chatfenster. Nutzen Sie das volle Potenzial der KI mit diesen besten ChatGPT Chrome-Erweiterungen. Haben Sie schon einmal daran gedacht, ChatGPT in Siri zu integrieren?