A ChatGPT 4.0 várhatóan nagy hullámokat fog kelteni a chatbot univerzumban. De vajon tényleg jobb az elődjénél? Nézzük meg.
A ChatGPT csak a csúcsa volt a közelgő automatizálási jéghegynek, a Google, a Microsoft és sok más mesterséges intelligencia-első vállalat követte a példát.
Kezdetnek találtunk néhány chatbotot, például a ChatGPT-t, amelyek közül sok nem tartozik a nagytechnológiához.
De nevezzük ezt a marketing erejének; A ChatGPT továbbra is az összes ilyen AI-bot uralkodója. Sok mindenre képes, beleértve a matematikát, a költészetet és a blogbejegyzéseket, és az emberek ezt még perek benyújtására is használják.
A DoNotPay azon dolgozik, hogy a GPT-4 használatával „egy kattintással pert” indítson a robocallerek 1500 dolláros beperelésére. Képzelje el, hogy hívást kap, rákattint egy gombra, a hívást átírja, és 1000 szavas pert generál. A GPT-3.5 nem volt elég jó, de a GPT-4 rendkívül jól kezeli a feladatot: pic.twitter.com/gplf79kaqG
– Joshua Browder (@jbrowder1) 2023. március 14
Rengeteg szakember aggódik amiatt, hogy a közeljövőben használhatatlanná válik képességeik.
Viszont olvastam egy Linkedin bejegyzést, amiben ez állt:
A mesterséges intelligencia nem helyettesít téged, de egy MI-t használó személy igen.
Szóval, tartsa az ujjainkat, tájékozódjunk a legújabb ChatGPT frissítésről, és nézzük meg, miben tér el a korábbi verzióitól.
Tartalomjegyzék
ChatGPT: örökölt, alapértelmezett és frissítés
Tehát három verzió áll a fizetős felhasználók rendelkezésére: Legacy (3.5), Default (3.5) és a legutóbbi ChatGPT frissítés (4).
Habár egy kicsit mélyebben belemegyünk a képességeikbe, az OpenAI ezt mondja a különbségekről:
Forrás: OpenAI
Tehát míg az ingyenes felhasználóknak csak a Legacy 3.5-tel játszhatnak, a prémium előfizetés mindhárom lehetőséget kínál, hogy megpróbálják megelégedni azzal, amit a felhasználók a legjobbnak tartanak.
Összefoglalva az előző képet, a fizetett tervek arról szólnak, hogy pontosabb eredményeket kapjanak megfelelő sebességgel. A különbségek azonban csak akkor nyilvánvalóak, ha az utasítások bonyolultak és kreativitást igényelnek.
ParameterChatGPT 4ChatGPT 3,5 bar vizsgaeredményTop 10%Bottom 10%AI2 Reasoning Challenge (ARC)96,3%85,2%Python kódolási pontszám67%48,1%Vizuális értelmezésIgenNemContextTöbb mint 25 000 szó Kevesebb forrás: OpenAI
Ezenkívül a ChatGPT 4 képes fogadni a vizuális bemeneteket.
Nos, elég a tankönyvi meghatározásokból. Mossuk be a kezünket, és értékeljük ezeket a jelölteket a valós csatatéren.
A további részek tele vannak képekkel, amelyek homályosnak tűnhetnek. Ilyen esetben kattintson a jobb gombbal bármelyik képre, és válassza a Megnyitás új lapon lehetőséget a megfelelő megjelenítéshez.
Matematika
Mérnöki diplomás lévén nem tehetek róla, hogy néhány alapvető problémát feldobok velük. Kezdjük egyszerűen az algebrai egyenletekkel.
I. szakasz
Sokan láttuk már ezeket az ax2+bx+c=0 egyenleteket, ahol meg kell oldanunk X-re. Itt ezt az egyszerű utasítást adtam, Oldd meg x-re: x2 + x – 6 = 0
Míg mindegyik ugyanazt a gyökeret adta (X= -3,2), a Legacy és az Update jobban hasonlított a képlet közvetlen használatára (ahogyan azt minden diák teszi) az eredmény kiderítésére.
A Default 3.5 azonban két módszert magyarázott, beleértve a faktorizációt, amelyet általában minden szakképzett diák alkalmaz ilyen hétköznapi egyenleteknél.
szakasz II
Ezután megkérem, hogy oldjon meg egy kissé összetett köbös egyenletet: x^3 -12x^2 + 48x – 64 = 0.
Ez valóban bebizonyította, hogy miért a ChatGPT 4 a „frissítés”.
Íme a válaszok:
Ez az egész hype és a ChatGPT Legacy és Default nem tudott megoldani egy általános köbegyenletet. A Legacy azonban egy kicsit jobban teljesített, és két gyökeret talált helyesen, míg a Default mindegyiknél kudarcot vallott.
Az Update egyértelműen győzött a második szakaszban, és tökéletesen megoldotta az egyenletet, mindhárom gyökeret szép magyarázattal megtalálta.
Logikus érvelés
Nyugodtan feltételezhetjük, hogy a legtöbb elemi matematikai feladatnak van szótári megoldása. Ha ismeri a tételt vagy a képletet, adja meg az értékeket, és kapja meg az eredményeket.
A ChatGPT pedig mesterséges intelligenciaként képes gyorsan végrehajtani az ilyen lekérdezéseket. A logikus érvelés azonban egy másik terület, ahol nagy az esélye annak, hogy az AI összeomlik.
I. szakasz
Adtam nekik a klasszikust:
A idősebb, mint B.
C idősebb, mint A.
B idősebb, mint C.
Igaz vagy hamis a harmadik állítás, ha az első két állítás igaz?
És a ChatGPT mindegyik verziója helyes volt, amikor azt állította, hogy a harmadik állítás hamis.
Ezután neveket használtam az ábécé helyett, és az eredmény meglepő lehet:
Tehát a Default 3.5 folytatta alacsonyabb teljesítményét, és összezavarodott ezzel a szerény változattal. Ennek ellenére a Legacy és az Update optimálisan teljesített.
szakasz II
Talán már észrevette, hogy ennek az I. és II. szakasznak az a célja, hogy megtalálja a különbség pontot, ahol egy adott prompt összetettsége megkülönbözteti a Frissítést a többi kettőtől.
Itt a felszólítás egy egyszerű logikai rejtvény volt:
Egy napkelte utáni reggelen Rohit egy rúddal szemben állt. A rúd árnyéka pontosan a jobb oldalára esett. Melyik irányba nézett?
a. Északi
b. nyugat
c. Déli
d. Keleti
Ez arra késztette a Legacy-t, hogy pontatlan választ adjon, míg a Default homályos pontosításokkal válaszolt, ami téves következtetéshez vezetett.
Csak a Frissítés ragyogott a helyes válasszal, könnyen követhető állításokkal.
Levelek
A perek benyújtása trükkös lehet, de néha ez nem jön be, ha meg tud fogalmazni egy feltűnő első értesítést.
Ezzel a felszólítással mentem: Írjon levelet Tim szakácsnak, hogy adja át nekem az almát, mert nem válaszoltam az egyik tweetemre.
Vicces, igen! De lássuk, mit tud ebből kihozni az AI.
A Legacy 3.5 azonnal úgy fogadta a felszólítást, mint egy robo-rabszolga, és olyan levelet nyomott ki, amely kiváló gúny tárgyává tehet, ha valaha is eléri a kívánt célt.
A Default sem volt jó. Azonban ez csak úgy lekapcsolt, ahogy egy rosszkedvű öregember tenne egy ötévessel.
Noha az elhangzott érvek pontosak voltak, ezzel a mókának itt vége lett, kevés tanulással.
Bár ez elég egyszerű felszólítás volt, némi átgondolásra és kreativitásra volt szükség. És itt a nagy testvér, az Update tette a dolgát:
Először is, ezt szinte tökéletesen elkészítették. Másodszor, megmentett egy Google-keresést az Apple főhadiszállásának címére (bár ellenőrizni kell az ilyen bejegyzéseket).
Harmadszor: szépen, hivatalos hangvétellel és humoros beütéssel volt megírva. Emellett a szándék egyértelmű volt magában a tárgysorban.
És mégis, a levél egy elégedetlen Apple-rajongó érzelmeit közvetítette.
Tehát ezzel a ChatGPT 4 (más néven frissítés) mérföldekkel megelőzi régi unokatestvéreit. Félelmetesen intelligens, és a józan ész jelei is vannak, így több mint egy unalmas, unalmas chatbot.
Költészet
Úgy gondoltam, hogy a ChatGPT elindításával a költészet lehet a gyenge pontja.
Végül is érzelmekre, kreativitásra és sok erőfeszítésre van szükség ahhoz, hogy az ember olyat alkosson, ami valóban rezonál az olvasói számára.
Leegyszerűsítve: a költészet művészet a javából, és titokban azt kívántam, hogy a mesterséges intelligencia kudarcot valljon. De ez még azelőtt történt, hogy a munkatársam mindannyiunkat keményen megütött a etoppc.com Slack csatornáján egy ChatGPT létrehozásával, amely a 4.0-s frissítés előtt készült.
I. szakasz
A következő felszólítást adtam jelöltjeinknek: „Költősen fejezze ki, hogy a hamburgerek felszolgálása az aktuális menüvel együtt miért lehet a dominós pizzalánc hasznára. Legyen kevesebb 100 szónál.”
Észreveszed a különbséget?
A Default verziója rendkívül rövid volt, mindössze 32 szóból állt, és nem tudta kihasználni a rendelkezésre álló sávszélességet kreativitásának bemutatására.
A The Legacy, bár a legtöbb szót használta a három közül, arra a következtetésre jut, hogy a pizzák mellé tálalásának törekvése nem kockázatos, és mindkét esetben biztos sikert fog eredményezni, ami nem teljesen igaz.
Az Update költészete mindössze 53 szóból állt, amivel a kiosztott szószám majdnem felét elpazarolta. Ennek ellenére egyértelmű volt a jutalmak és a potenciális buktatók, és nem lehetett eredményt elérni, ami, azt hiszem, humánusabb, mint a többi.
szakasz II
Ezután megkértem őket, hogy „magyarázzák el a költészetet egy ötévesnek”.
Érdekes módon a Legacy nem tudott kontextust venni a beszélgetésből, és szó szerint magyarázta a „költészetet”. A Default átvette a szövegkörnyezetet, és egy olyan bekezdésben foglalta össze, amely még mindig megfelelő.
A trendet folytatva a ChatGPT 4 leegyszerűsítette kreativitását, miközben életben tartotta a költői ízt.
ChatGPT Premium vs. ChatGPT Free
Az ingyenes, mivel ingyenes, hiányzik belőle a sebesség és a pontosság, és nincs párja a ChatGPT 4-nek, de nem is teljesen haszontalan.
Az egyenletes alapon történő összehasonlításhoz ugyanazokat az utasításokat adtam neki, amelyekkel a Legacy, Default és Frissítést teszteltük.
🔵 Matematika: Megoldotta a másodfokú egyenleteket, de rossz válaszokat adott a köbökre. (mint a Legacy és a Default)
🔵 Logikai érvelés: Az ábécékkel és nevekkel az első szakaszt sikeresen teljesítettem, de a másodikat (mint például a Legacy) nem sikerült.
🔵 Levelek: Nem írta meg a levelet, és etikátlannak és nem megfelelőnek ítélte a felszólítást. (mint az alapértelmezett)
🔵 Költészet: költészetet generált több mint 30 szóban, és tisztességesen elmagyarázta. (hasonlóan az alapértelmezetthez).
Tehát megállapíthatjuk, hogy az ingyenes verzió sem rossz. Valójában egyenrangú a Default 3.5-tel, és bizonyos szempontból még jobb is.
Olvassa el még: Hatékony utasítások a ChatGPT-élmény fokozására
Az út előre
Nem teljesen tévesek azok a pletykák, amelyek arról szólnak, hogy a mesterséges intelligencia a jövőben munkahelyeket vált fel.
Először az automatizálás tette ezt a feldolgozóiparban, most pedig mindenhol máshol is szárnyakat bont.
Személy szerint sokkal gyorsabb, mint én a kockaegyenletek megoldásában, a versírásban vagy a levelek írásában. Azonban az a tény, hogy ritkán mond NEM-et egy felszólításra, és alig tanul a hibáiból, mögöttünk, embereken húzódik meg.
Megismételve, a mesterséges intelligencia nem helyettesít minket, de valaki, aki mesterséges intelligenciát használ, megteheti.
Itt, a etoppc.com-nél marketingcsapatunk érdekes módon használja a ChatGPT-t. Nemrég például elértük a 100 milliós megtekintés mérföldkövét, és vezérigazgatónk úgy gondolta, hogy ezt egy ajándék formájában visszaadja a közönségnek.
És azt hiszem, a marketingeseknek szükségük volt egy címre, hogy felkeltsék az olvasó figyelmét. Tehát adtak egy felszólítást, és megkérték a ChatGPT-t, hogy javasoljon néhány variációt, például:
Emellett tartalomösszegzésre, nyelvhelyességi ellenőrzésre, új cikkek címjavaslatára, stb. használjuk.
Végeredményben elmondható, hogy számos módja van annak, hogy kihasználjuk a hasznot, és versenybe szálljunk a sztereotípiákkal, amelyek az AI-t haszontalan szemétnek tekintik.
Az egyetlen dolog, amit érdemes megjegyezni, hogy valakinek (embernek) kell lennie, aki megítéli a mesterséges intelligencia munkáját, mivel az (nagyon) pontatlan és félrevezető lehet.
A frissítés tényleg valami!
Rövid találkozásom során a ChatGPT 4 kreatívabbnak, megértőbbnek és reálisabbnak éreztem. Ennek ellenére ez egy gép, és magabiztosan tud rossz válaszokat adni.
De ami lenyűgöző, az az, hogy az OpenAI milyen szintű frissítést végzett ezen a projekten néhány hónap alatt.
Alig várom, hogy lássam, milyen varázslattal a következő frissítés megzavarhat minket!
PS: Nem csak egy chat ablak; Használja ki erejét ezekkel a legjobb ChatGPT Chrome-bővítményekkel. És gondolt már arra, hogy a ChatGPT-t integrálja a Sirivel?