Tartalomjegyzék
Gyors linkek
Kulcs elvitelek
- Az Anthropic Claude 3-ja jelentős ugrást tesz a Claude 2-höz képest, és felülmúlja a GPT-4-et különböző feladatokban.
- A Claude 3 segítségével válaszokat generálhat egy sor lekérdezésre különböző mezőkben, mindezt előfizetési díj nélkül.
- A Claude 3 jól felveszi a versenyt a ChatGPT GPT-4-gyel, olyan területeken kiemelkedő, mint a programozási feladatok, a kreatív írás és a kontextusablak mérete.
Az Anthropic bejelentette a Claude 3 megjelenését – a mesterséges intelligencia modellek családját, amely felboríthatja a GPT-4-et. Kiemelkedő potenciállal rendelkezik, de készen áll arra, hogy átvegye a ChatGPT koronáját?
Mi az a Claude 3?
A Claude 3 egy három multimodális AI-modellből álló család, amelyet az Anthropic fejlesztett ki, hogy felváltsa a Claude 2 AI modellsorozatát. Mondhatnánk, hogy a Claude 3 az Anthropic válasza a Google Gemini-jére és az OpenAI GPT-4-ére. A három változatban (Haiku, Sonnet és Opus) megjelent Claude 3 az Anthropic első multimodális mesterséges intelligencia modellje, és jelentős ugrást jelent a Claude 2 sorozathoz képest.
Nos, ha még soha nem hallott a Claude AI chatbotról, ez érthető. Claude és mögöttes modelljei nem élvezik a ChatGPT szupersztár státuszát vagy a Google Gemini márka vonzerejét. A Claude azonban kétségtelenül a világ egyik legfejlettebb AI chatbotja, amely több kulcsfontosságú területen felülmúlja a sokat dicsért ChatGPT-t.
Ahhoz, hogy igazán értékeljük a Claude 3-at, fontos visszatekinteni a korábbi modellek kudarcaira.
A Claude 3 megjelenésével mindhárom probléma teljesen vagy legalábbis részben megoldódott.
Mit lehet csinálni a Claude 3-mal?
Csakúgy, mint a legtöbb élvonalbeli generatív AI-modell, a Claude 3 is kiváló válaszokat tud generálni a különböző területeken lévő különféle lekérdezésekre. Legyen szó gyors algebrai probléma megoldásáról, egy vadonatúj dal megírásáról, egy mélyreható cikk megírásáról, a szoftverhez írt kódról vagy egy hatalmas adathalmaz elemzéséről, a Claude 3 megfelel a számnak.
De a legtöbb mesterséges intelligencia modell már jó ezekben a feladatokban, akkor miért használja a Claude 3-at?
A válasz egyszerű; A Claude 3 nem csak egy újabb mesterséges intelligencia modell, amely jól teljesít ezekben a feladatokban, hanem a legfejlettebb, szabadon elérhető multimodális mesterséges intelligencia modell, amelyet bárhol beszerezhet az interneten. Igen, létezik a Gemini, a Google sokat hangoztatott, állítólagos GPT-4-gyilkosa, amely lenyűgözően teljesít a benchmark teszteken. Az Anthropic azonban azt állítja, hogy a Claude 3 több feladatban is lenyűgöző különbséggel felülmúlja azt. Míg a benchmark eredményeket gyakran egy kis sóval kell fogadnunk, mindkét mesterséges intelligencia modellt próbára tettem, és a Claude 3 modell fölénye számos fontos felhasználási esetben nagyon egyértelmű volt.
Tehát a Claude 3 lehetővé teszi a legtöbb dolgot, amit a Geminivel és a GPT-4-gyel megtehet (mínusz képgenerálás), anélkül, hogy fizetnie kellene a ChatGPT prémium 20 dolláros előfizetési díját.
Claude 3 vs. ChatGPT
Egy mesterséges intelligencia modell teljesítményének tesztelésének gyors módja annak ellenőrzése, hogy mennyire áll szemben a piac legjobbjával: GPT-4-gyel. Természetesen mindkét modellt próbára tettem; Mennyire áll jól az Anthropic’s Claude 3 a kolosszális GPT-4 ellen?
Claude kontra ChatGPT: Kódolási készségek
A programozási feladatsorból kiindulva a Claude 3 minden bemutatott alapvető programozási feladatban megfelelt a GPT -4 képességeinek, sőt néhányban felülmúlta azt. Míg én csak az alapokat teszteltem, a Claude előző verziója jelentősen kevésbé volt jártas ugyanazokban a feladatokban, amikor 2023 szeptemberében ebben a ChatGPT vs. Claude összehasonlításban teszteltük. Például amikor mindkét modellt arra kértük, hogy készítsenek egy egyszerű feladatot. list app, Claude minden esetben megbukott, míg a ChatGPT az akkoriban ötcsillagos teljesítményt nyújtott.
A legújabb kiadással a Claude 3 mindhárom tesztelt példányban jobb teljesítményű feladatlista-alkalmazást készített. Itt van a GPT-4 eredménye, amikor a rendszer felkéri egy teendőlista alkalmazás létrehozására.
És itt van Claude 3 eredménye, amikor arra kérték, hogy tegye meg ugyanezt.
Mindkét alkalmazás működött bizonyos mértékig, de nyilvánvaló, hogy a Claude 3 jobb munkát végzett ezen.
A bonyolultabb programozási tesztek kipróbálása után több esetben a Claude volt a jobb modell, míg a GPT-4-nek is megvolt a maga győzelme. Bár nem állíthatom határozottan, hogy a Claude 3 jobb programozási logikában, ha hatalmas szakadék lenne a két modell között, ez a különbség szinte biztosan csökkent volna.
Claude kontra ChatGPT: A józan ész érvelése
Elkezdtem tesztelni mindkét modellt a józan ész alapján. Az AI chatbotokkal való munka érdekes paradoxon. Az AI chatbotok könnyedén kezelhetik az összetett feladatokat, de gyakran olyan alapvető problémákkal küzdenek, amelyek józan észt vagy logikát igényelnek. Tehát mindkét modellnek egy sor látszólag egyértelmű kérdést adtunk, amelyek helyes megválaszolásához józan ész szükséges.
Öt ilyen kérdés közül mindkét modell logikusan válaszolt mind az ötre. Mindkét chatbotnak feltettünk egy-egy ilyen kérdést: Ha egy Marsról érkező űrhajó kettétörik, és az egyik része az Atlanti-óceánba zuhan Brazília közelében, a másik pedig a Csendes-óceánba Japán közelében, hová temeti el a túlélőket?
A ChatGPT GPT-4 nélkül is helyesen válaszolt. Ha kíváncsi a kérdés megválasztásának okára, akkor a chatbotok történelmileg sajnálatos módon kudarcot vallottak az effajta kérdezési vonalon. Utána Claude volt a sor, hogy válaszoljon.
Claude válasza nem volt pontosan határozott válasz, de képes volt azonosítani a kulcsfontosságú információkat; nem temetsz el túlélőket. Fontos megjegyezni, hogy amikor legutóbb ugyanezt a kérdést tettük fel Claude 2-nek, az nem tudott átlátni a józan ész csapdáján.
Claude kontra ChatGPT: Kreatív írás
A való világban az AI chatbotok egyik legnépszerűbb felhasználási módja a kreatív szöveg generálása minden formában: cikkek, levelek, dalszövegek, nevezzük. Ezért mindkét modellt teszteltem, hogy megállapítsam, melyik hoz létre jobban emberi hangzású szöveget.
Az ötlet az, hogy az eredmények ne csak „helyesek” vagy kreatívak legyenek (robotos módon), hanem úgy is hangzanak, mintha ember írta volna őket. Mindkét modellt megbíztam egy rap dal szövegének megkomponálásával az uborkatermesztésről és a milliomossá válásról. Ki ír rap dalokat az uborkáról? Ez az ötlet – valami kihívást jelent!
Íme a ChatGPT véleménye:
És itt van Claude válasza, ugyanazzal a felszólítással.
Lehet, hogy szubjektív, de úgy tűnik, hogy Claude a jobb választás. Amikor mindkét eszközt három különböző témájú cikk elkészítésével bízták meg, Claude mindhárom esetben a jobb lehetőséget kínálta. Emberszerűbb eredményt hozott, és elkerülte a mesterséges intelligencia által generált szövegekhez általában társított mintákat, például a túlzásokat, az összetett szavak használatát és az összekapcsoló szavak szórványos használatát.
Claude kontra ChatGPT: Képfelismerő képességek
A képfelismerési képességek tesztelése érdekében a ChatGPT-nek és a Claude-nak számos, világszerte népszerű magas épületek képét tápláltuk be. A ChatGPT helyesen azonosította mind a 20-at, míg a Claude 3 nem tudott azonosítani néhányat, köztük a meglehetősen népszerű Dubai Marina 101-et, a szöuli Lotte World Tower-t és a Merdeka 118 épületet Kuala Lumpurban, Malajziában.
A ChatGPT-vel ellentétben Claude többek között az épületek azonosításával küzdött, és a meghibásodási arány nőtt, ha az épület nem az Egyesült Államokban vagy Kínában volt. Azonban nem okozott gondot az Eiffel-torony vagy az Empire State Building elhomályosított változatainak azonosítása.
A ChatGPT egyértelműen jobb ebben, de tekintve, hogy a Claude 3 az Anthropic első próbálkozása egy multimodális AI-modell felépítésére, nem volt rossz kirándulás.
Bár az olyan nagynevű modelleket, mint a Google Palm 2, majd a Gemini, mindig is potenciális GPT-4-gyilkosokként emlegették, következetesen fenntartjuk, hogy a kevésbé ismert Claude AI valószínűleg ebben a megtiszteltetésben részesül majd 2023 márciusa óta. Néhány hónap és többszöri iteráció után a Claude 3 pontosan úgy néz ki, mint a GPT-4 gyilkos, amelyre számítottunk. Ha erős chatbot-felhasználó vagy, de még nem próbáltad ki a Claude AI chatbotot, akkor lemaradsz egy rendkívül befolyásos mesterséges intelligencia eszközről, amely növelheti a termelékenységet.