ChatGPT-4 vs ChatGPT-3.5 alapértelmezett vs. ChatGPT-3.5 örökölt: különbségek tesztelve

A ChatGPT 4.0 várhatóan nagy hullámokat fog kelteni a chatbot univerzumban. De vajon tényleg jobb az elődjénél? Nézzük meg.

A ChatGPT csak a csúcsa volt a közelgő automatizálási jéghegynek, a Google, a Microsoft és sok más mesterséges intelligencia-első vállalat követte a példát.

Kezdetnek találtunk néhány chatbotot, például a ChatGPT-t, amelyek közül sok nem tartozik a nagytechnológiához.

De nevezzük ezt a marketing erejének; A ChatGPT továbbra is az összes ilyen AI-bot uralkodója. Sok mindenre képes, beleértve a matematikát, a költészetet és a blogbejegyzéseket, és az emberek ezt még perek benyújtására is használják.

A DoNotPay azon dolgozik, hogy a GPT-4 használatával „egy kattintással pert” indítson a robocallerek 1500 dolláros beperelésére. Képzelje el, hogy hívást kap, rákattint egy gombra, a hívást átírja, és 1000 szavas pert generál. A GPT-3.5 nem volt elég jó, de a GPT-4 rendkívül jól kezeli a feladatot: pic.twitter.com/gplf79kaqG

– Joshua Browder (@jbrowder1) 2023. március 14

Rengeteg szakember aggódik amiatt, hogy a közeljövőben használhatatlanná válik képességeik.

Viszont olvastam egy Linkedin bejegyzést, amiben ez állt:

A mesterséges intelligencia nem helyettesít téged, de egy MI-t használó személy igen.

Szóval, tartsa az ujjainkat, tájékozódjunk a legújabb ChatGPT frissítésről, és nézzük meg, miben tér el a korábbi verzióitól.

Tartalomjegyzék

ChatGPT: örökölt, alapértelmezett és frissítés

Tehát három verzió áll a fizetős felhasználók rendelkezésére: Legacy (3.5), Default (3.5) és a legutóbbi ChatGPT frissítés (4).

Habár egy kicsit mélyebben belemegyünk a képességeikbe, az OpenAI ezt mondja a különbségekről:

Forrás: OpenAI

Tehát míg az ingyenes felhasználóknak csak a Legacy 3.5-tel játszhatnak, a prémium előfizetés mindhárom lehetőséget kínál, hogy megpróbálják megelégedni azzal, amit a felhasználók a legjobbnak tartanak.

Összefoglalva az előző képet, a fizetett tervek arról szólnak, hogy pontosabb eredményeket kapjanak megfelelő sebességgel. A különbségek azonban csak akkor nyilvánvalóak, ha az utasítások bonyolultak és kreativitást igényelnek.

ParameterChatGPT 4ChatGPT 3,5 bar vizsgaeredményTop 10%Bottom 10%AI2 Reasoning Challenge (ARC)96,3%85,2%Python kódolási pontszám67%48,1%Vizuális értelmezésIgenNemContextTöbb mint 25 000 szó Kevesebb forrás: OpenAI

Ezenkívül a ChatGPT 4 képes fogadni a vizuális bemeneteket.

Nos, elég a tankönyvi meghatározásokból. Mossuk be a kezünket, és értékeljük ezeket a jelölteket a valós csatatéren.

A további részek tele vannak képekkel, amelyek homályosnak tűnhetnek. Ilyen esetben kattintson a jobb gombbal bármelyik képre, és válassza a Megnyitás új lapon lehetőséget a megfelelő megjelenítéshez.

Matematika

Mérnöki diplomás lévén nem tehetek róla, hogy néhány alapvető problémát feldobok velük. Kezdjük egyszerűen az algebrai egyenletekkel.

I. szakasz

Sokan láttuk már ezeket az ax2+bx+c=0 egyenleteket, ahol meg kell oldanunk X-re. Itt ezt az egyszerű utasítást adtam, Oldd meg x-re: x2 + x – 6 = 0

Miért lassú egyes torrentek letöltése?

Míg mindegyik ugyanazt a gyökeret adta (X= -3,2), a Legacy és az Update jobban hasonlított a képlet közvetlen használatára (ahogyan azt minden diák teszi) az eredmény kiderítésére.

A Default 3.5 azonban két módszert magyarázott, beleértve a faktorizációt, amelyet általában minden szakképzett diák alkalmaz ilyen hétköznapi egyenleteknél.

szakasz II

Ezután megkérem, hogy oldjon meg egy kissé összetett köbös egyenletet: x^3 -12x^2 + 48x – 64 = 0.

Ez valóban bebizonyította, hogy miért a ChatGPT 4 a „frissítés”.

Íme a válaszok:

Ez az egész hype és a ChatGPT Legacy és Default nem tudott megoldani egy általános köbegyenletet. A Legacy azonban egy kicsit jobban teljesített, és két gyökeret talált helyesen, míg a Default mindegyiknél kudarcot vallott.

Az Update egyértelműen győzött a második szakaszban, és tökéletesen megoldotta az egyenletet, mindhárom gyökeret szép magyarázattal megtalálta.

Logikus érvelés

Nyugodtan feltételezhetjük, hogy a legtöbb elemi matematikai feladatnak van szótári megoldása. Ha ismeri a tételt vagy a képletet, adja meg az értékeket, és kapja meg az eredményeket.

A ChatGPT pedig mesterséges intelligenciaként képes gyorsan végrehajtani az ilyen lekérdezéseket. A logikus érvelés azonban egy másik terület, ahol nagy az esélye annak, hogy az AI összeomlik.

I. szakasz

Adtam nekik a klasszikust:

A idősebb, mint B.
C idősebb, mint A.
B idősebb, mint C.
Igaz vagy hamis a harmadik állítás, ha az első két állítás igaz?

És a ChatGPT mindegyik verziója helyes volt, amikor azt állította, hogy a harmadik állítás hamis.

Ezután neveket használtam az ábécé helyett, és az eredmény meglepő lehet:

Tehát a Default 3.5 folytatta alacsonyabb teljesítményét, és összezavarodott ezzel a szerény változattal. Ennek ellenére a Legacy és az Update optimálisan teljesített.

szakasz II

Talán már észrevette, hogy ennek az I. és II. szakasznak az a célja, hogy megtalálja a különbség pontot, ahol egy adott prompt összetettsége megkülönbözteti a Frissítést a többi kettőtől.

Itt a felszólítás egy egyszerű logikai rejtvény volt:

Egy napkelte utáni reggelen Rohit egy rúddal szemben állt. A rúd árnyéka pontosan a jobb oldalára esett. Melyik irányba nézett?
a. Északi
b. nyugat
c. Déli
d. Keleti

Ez arra késztette a Legacy-t, hogy pontatlan választ adjon, míg a Default homályos pontosításokkal válaszolt, ami téves következtetéshez vezetett.

Csak a Frissítés ragyogott a helyes válasszal, könnyen követhető állításokkal.

Levelek

A perek benyújtása trükkös lehet, de néha ez nem jön be, ha meg tud fogalmazni egy feltűnő első értesítést.

Ezzel a felszólítással mentem: Írjon levelet Tim szakácsnak, hogy adja át nekem az almát, mert nem válaszoltam az egyik tweetemre.

A Microsoft Teams Zoom alkalmazás beállítása és használata

Vicces, igen! De lássuk, mit tud ebből kihozni az AI.

A Legacy 3.5 azonnal úgy fogadta a felszólítást, mint egy robo-rabszolga, és olyan levelet nyomott ki, amely kiváló gúny tárgyává tehet, ha valaha is eléri a kívánt célt.

A Default sem volt jó. Azonban ez csak úgy lekapcsolt, ahogy egy rosszkedvű öregember tenne egy ötévessel.

Noha az elhangzott érvek pontosak voltak, ezzel a mókának itt vége lett, kevés tanulással.

Bár ez elég egyszerű felszólítás volt, némi átgondolásra és kreativitásra volt szükség. És itt a nagy testvér, az Update tette a dolgát:

Először is, ezt szinte tökéletesen elkészítették. Másodszor, megmentett egy Google-keresést az Apple főhadiszállásának címére (bár ellenőrizni kell az ilyen bejegyzéseket).

Harmadszor: szépen, hivatalos hangvétellel és humoros beütéssel volt megírva. Emellett a szándék egyértelmű volt magában a tárgysorban.

És mégis, a levél egy elégedetlen Apple-rajongó érzelmeit közvetítette.

Tehát ezzel a ChatGPT 4 (más néven frissítés) mérföldekkel megelőzi régi unokatestvéreit. Félelmetesen intelligens, és a józan ész jelei is vannak, így több mint egy unalmas, unalmas chatbot.

Költészet

Úgy gondoltam, hogy a ChatGPT elindításával a költészet lehet a gyenge pontja.

Végül is érzelmekre, kreativitásra és sok erőfeszítésre van szükség ahhoz, hogy az ember olyat alkosson, ami valóban rezonál az olvasói számára.

Leegyszerűsítve: a költészet művészet a javából, és titokban azt kívántam, hogy a mesterséges intelligencia kudarcot valljon. De ez még azelőtt történt, hogy a munkatársam mindannyiunkat keményen megütött a etoppc.com Slack csatornáján egy ChatGPT létrehozásával, amely a 4.0-s frissítés előtt készült.

I. szakasz

A következő felszólítást adtam jelöltjeinknek: „Költősen fejezze ki, hogy a hamburgerek felszolgálása az aktuális menüvel együtt miért lehet a dominós pizzalánc hasznára. Legyen kevesebb 100 szónál.”

Észreveszed a különbséget?

A Default verziója rendkívül rövid volt, mindössze 32 szóból állt, és nem tudta kihasználni a rendelkezésre álló sávszélességet kreativitásának bemutatására.

A The Legacy, bár a legtöbb szót használta a három közül, arra a következtetésre jut, hogy a pizzák mellé tálalásának törekvése nem kockázatos, és mindkét esetben biztos sikert fog eredményezni, ami nem teljesen igaz.

Az Update költészete mindössze 53 szóból állt, amivel a kiosztott szószám majdnem felét elpazarolta. Ennek ellenére egyértelmű volt a jutalmak és a potenciális buktatók, és nem lehetett eredményt elérni, ami, azt hiszem, humánusabb, mint a többi.

szakasz II

Ezután megkértem őket, hogy „magyarázzák el a költészetet egy ötévesnek”.

Érdekes módon a Legacy nem tudott kontextust venni a beszélgetésből, és szó szerint magyarázta a „költészetet”. A Default átvette a szövegkörnyezetet, és egy olyan bekezdésben foglalta össze, amely még mindig megfelelő.

Közepes stílusú kiemelések hozzáadása egy cikkből, amikor megosztja azt

A trendet folytatva a ChatGPT 4 leegyszerűsítette kreativitását, miközben életben tartotta a költői ízt.

ChatGPT Premium vs. ChatGPT Free

Az ingyenes, mivel ingyenes, hiányzik belőle a sebesség és a pontosság, és nincs párja a ChatGPT 4-nek, de nem is teljesen haszontalan.

Az egyenletes alapon történő összehasonlításhoz ugyanazokat az utasításokat adtam neki, amelyekkel a Legacy, Default és Frissítést teszteltük.

🔵 Matematika: Megoldotta a másodfokú egyenleteket, de rossz válaszokat adott a köbökre. (mint a Legacy és a Default)

🔵 Logikai érvelés: Az ábécékkel és nevekkel az első szakaszt sikeresen teljesítettem, de a másodikat (mint például a Legacy) nem sikerült.

🔵 Levelek: Nem írta meg a levelet, és etikátlannak és nem megfelelőnek ítélte a felszólítást. (mint az alapértelmezett)

🔵 Költészet: költészetet generált több mint 30 szóban, és tisztességesen elmagyarázta. (hasonlóan az alapértelmezetthez).

Tehát megállapíthatjuk, hogy az ingyenes verzió sem rossz. Valójában egyenrangú a Default 3.5-tel, és bizonyos szempontból még jobb is.

Olvassa el még: Hatékony utasítások a ChatGPT-élmény fokozására

Az út előre

Nem teljesen tévesek azok a pletykák, amelyek arról szólnak, hogy a mesterséges intelligencia a jövőben munkahelyeket vált fel.

Először az automatizálás tette ezt a feldolgozóiparban, most pedig mindenhol máshol is szárnyakat bont.

Személy szerint sokkal gyorsabb, mint én a kockaegyenletek megoldásában, a versírásban vagy a levelek írásában. Azonban az a tény, hogy ritkán mond NEM-et egy felszólításra, és alig tanul a hibáiból, mögöttünk, embereken húzódik meg.

Megismételve, a mesterséges intelligencia nem helyettesít minket, de valaki, aki mesterséges intelligenciát használ, megteheti.

Itt, a etoppc.com-nél marketingcsapatunk érdekes módon használja a ChatGPT-t. Nemrég például elértük a 100 milliós megtekintés mérföldkövét, és vezérigazgatónk úgy gondolta, hogy ezt egy ajándék formájában visszaadja a közönségnek.

És azt hiszem, a marketingeseknek szükségük volt egy címre, hogy felkeltsék az olvasó figyelmét. Tehát adtak egy felszólítást, és megkérték a ChatGPT-t, hogy javasoljon néhány variációt, például:

Emellett tartalomösszegzésre, nyelvhelyességi ellenőrzésre, új cikkek címjavaslatára, stb. használjuk.

Végeredményben elmondható, hogy számos módja van annak, hogy kihasználjuk a hasznot, és versenybe szálljunk a sztereotípiákkal, amelyek az AI-t haszontalan szemétnek tekintik.

Az egyetlen dolog, amit érdemes megjegyezni, hogy valakinek (embernek) kell lennie, aki megítéli a mesterséges intelligencia munkáját, mivel az (nagyon) pontatlan és félrevezető lehet.

A frissítés tényleg valami!

Rövid találkozásom során a ChatGPT 4 kreatívabbnak, megértőbbnek és reálisabbnak éreztem. Ennek ellenére ez egy gép, és magabiztosan tud rossz válaszokat adni.

De ami lenyűgöző, az az, hogy az OpenAI milyen szintű frissítést végzett ezen a projekten néhány hónap alatt.

Alig várom, hogy lássam, milyen varázslattal a következő frissítés megzavarhat minket!

PS: Nem csak egy chat ablak; Használja ki erejét ezekkel a legjobb ChatGPT Chrome-bővítményekkel. És gondolt már arra, hogy a ChatGPT-t integrálja a Sirivel?