Teljes útmutató az AI Chatbot-plágium észleléséhez

Az AI Chatbotok, mint például a ChatGPT, nem korlátozódnak a kérdések megválaszolására. Írhatnak emberszerű e-maileket, kísérőleveleket, esszéket, verseket, blogbejegyzéseket és még sok mást.

A mesterséges intelligencia írása olyan, mint egy kaméleon – olyan jól tud beleolvadni bármely más írástípusba, hogy nehéz lenne különbséget tenni.

Sajnos ez hihetetlenül megnehezíti számunkra, hogy észleljük, ha egy mesterséges intelligencia írt valamit az ember helyett. Persze mindannyian megfogadhatnánk Sherlock Holmes tanácsát, és „kiküszöbölhetnénk a lehetetlent”, de kinek van erre ideje?

Mi van, ha azt mondom, hogy a fenti bekezdést egy mesterséges intelligencia írta? Igen, megkértem a YouWrite-ot, hogy írjon egy gyors bevezetőt ehhez a poszthoz, ez jött ki belőle. Elég meggyőző igaz? Ez a probléma, túl meggyőző, hogy bárki saját munkájaként tudja bemutatni, hogy hasznot húzzon belőle.

A mesterséges intelligencia nem csak átfogalmazza a tartalmat; megtanulják a témát és természetes nyelven RLHF segítségével mutatják be. Ez azt jelenti, hogy a létrehozott tartalmat nem lesz robotolva olvasni, és nem is lehet összehasonlítani az online elérhető adatokkal a plágium észlelése érdekében.

A mesterséges intelligencia által generált tartalom elkapása nem egyszerű, és nem fogok hamis reményt kelteni, hogy 100%-os pontossággal elkaphatja. Egy kis nyomozói munkával és a mesterséges intelligencia írásészlelési eszközeinek segítségével azonban a legtöbb mesterséges intelligencia művét elkaphatja.

Az alábbiakban kézi módszereket talál az AI-plágium észlelésére, és néhány automatikus eszközt is talál.

Tartalomjegyzék

Manuálisan észlelje a mesterséges intelligencia plágiumát 🕵️

A ChatGPT még csak nem is nagy probléma, ha mesterséges intelligencia plágiumról van szó. Számos alternatív eszköz létezik, amelyek ugyanazon a GPT-3 technológián alapulnak, és írásra készültek. Ezek nagyon fejlettek, és kifejezetten nehezen megfogható, emberszerű tartalom létrehozására készültek.

Az automatikus észlelési eszközök a tartalom típusától, hosszától és összetettségétől függően kissé eltaláltak vagy hiányoznak. Így legalábbis jelenleg a legjobb módszer a pontok manuális összekapcsolása annak kiderítésére, hogy az írás mesterséges intelligencia által generált-e vagy sem.

Az alábbiakban felsoroltam néhány gyakori támpontot, amelyeket kereshet az AI által generált tartalom elkapásához.

Mi az Ultra Wideband, és miért van az iPhone 11-ben?

#1. Elavult információ

A ChatGPT és más GPT-3 alapú mesterséges intelligencia tudását 2021 végén csökkentették. Annak ellenére, hogy egyes mesterséges intelligenciarobotok beépített keresőmotorral rendelkeznek a legfrissebb információk keresésére, továbbra is a régi adatokra támaszkodnak hosszú formátumú tartalmak, például esszék vagy blogbejegyzések.

Ha észreveszi, hogy az írások folyamatosan elavult adatokról beszélnek, különösen 2021 előtt, akkor az AI által generált lehet.

Az alábbi képernyőképen megkértem a YouWrite-ot, hogy meséljen a közelmúltbeli FIFA-világbajnokságról, és ez jött ki.

A legutóbbi 2022-es világbajnokság helyett a 2018-as világbajnokságról beszél. Annak ellenére, hogy az eszközt frissítik, hogy a közelmúltbeli eseményekről, például a 2022-es világbajnokságról beszéljen, a hosszú bejegyzések írásához továbbra is az elavult adatokat használja, amelyekre épül.

#2. Ugyanazt a mondatszerkezetet használja a leírásokhoz

Több termék/alkalmazás leírásának írásakor az AI általában ugyanazt a mondatszerkezetet használja, amelyet a termék leírásának megfelelően szerkeszt. A leírások általában ugyanazzal a szóval kezdődnek, mint a The, It, A vagy a termék neve. A leírásoknak is van egy dedikált fókusza, amelyet megismétel.

Az alábbiakban például megkértem a ChatGPT-t, hogy meséljen az „adatbeviteli munkák webhelyeiről”. Láthatja, hogy minden leírás „A”-val kezdődik, és szigorúan összpontosít.

Ugyanezt a kérdést tettem fel a YouChat-nek is, és az is ugyanazt tette, és az elején megismételte az egyes webhelyek nevét, és maguk a leírások úgy néznek ki, mint mindegyik átfogalmazott változata.

Ha az Ön által elemzett írás hasonló jellegű leírást tartalmaz, ez nagyszerű módja annak, hogy elkapja az AI-írást.

#3. Rövid mondatokat használ

A legtöbb írásnál az AI egysoros mondatokat használ legfeljebb egyetlen vesszővel. Talán megpróbálják minimalizálni a hiba lehetőségét, de kerülik az olyan hosszú mondatok írását, amelyek kettőspontot, pontosvesszőt vagy vastag vízszintes vonalakat igényelhetnek.

Tudom, hogy nem ez a legjobb nyom a mesterséges intelligencia írásának elkapására, de érdemes megfontolni, hogy tovább bizonyíthassuk a gyanút.

#4. Helytelen információkat adhat

Összetett kérdések esetén, amelyek általában valamilyen utasítást tartalmaznak, az MI nem érti a szándékot, és helytelen információkat szolgáltat. Itt nem idejétmúlt információkról beszélek, csak magabiztosan mondják el a rossz információkat, ha nem értik a témát.

Például megkértem a YouWrite-ot, hogy mondja meg nekem, „hogyan rootolhatok egy Android telefont PC nélkül”. Még mindig megmutatta nekem azokat a módszereket, amelyek az oktatás egy pontján PC használatát foglalják magukban.

#5. Nem ad hozzá személyes véleményt

Amikor valamiről beszélünk, az AI csak ismert tényekről beszél. Az emberekkel ellentétben nem beszél a vele kapcsolatos személyes tapasztalatairól. Bár az AI-k utasíthatók gyakorlati leírás létrehozására, alapértelmezés szerint általában elkerülik ezt.

14 kipróbálható csapatépítő tevékenység a távmunka során

Ha észreveszi, hogy az írás csak jól ismert tényekről szól, jó eséllyel mesterséges intelligencia írta. Például, amikor egy alkalmazásról beszél, annak funkcióiról fog beszélni, ahelyett, hogy a navigáció sima, vagy hogyan kell ténylegesen használni az alkalmazást.

#6. Rövid magyarázatok

Mivel az MI-ket korlátozza a jelenleg rendelkezésre álló tudás, hajlamosak rövid magyarázatokat és leírásokat írni. Tapasztalataim szerint, ha egy adott témáról beszélnek – például Android rootolás -, akkor legfeljebb 2-3 bekezdésen belül tartják a magyarázatot. Az alkalmazások vagy termékek leírása általában nem haladja meg az 1 bekezdést.

Az emberek mélyrehatóan tudnak írni valamiről, beleértve a jellemzőket, korlátokat, személyes tapasztalatokat, árakat stb. Másrészt az AI általában a főbb jellemzőkre vagy kiemelésekre összpontosít, így az írás is rövid. Ha az oktató további részleteket kér, jelentősen megnő a téves tájékoztatás esélye.

#7. Ellenőrizze az író történetét

Tanárként vagy webmesterként, ha hozzáfér az író korábbi munkájához vagy feladataihoz, érdemes lehet összehasonlítani azzal az írással, amelyről gyanús. Nagyon valószínűtlen, hogy az írónak egy mesterséges intelligenciához hasonló írási stílusa lenne. Bár a mesterséges intelligencia módosíthatja az írás hangjait, az általa választott stílusok meglehetősen általánosak, és nem tudják lemásolni az Ön hangját.

Az AI által generált bekezdés példáját véve a bejegyzés bevezetőjében. Aki olvasta a korábbi bejegyzéseimet, könnyen láthatja, hogy az írásstílusom merőben eltér hozzá képest.

Elolvashatod az író 2-3 korábbi művét, és megnézheted, egyezik-e a gyanús írás stílusával.

Eszközök a mesterséges intelligencia plágium észleléséhez

Számos eszköz áll rendelkezésre, amelyek képesek észlelni az AI által írt tartalmat. Pontosságuk azonban különbözik egymástól, és a tartalom típusától és hosszától függően meghiúsulhat.

Ezeket az eszközöket a ChatGPT, a GPT-3 Playground, a WriteSonic, a Rytr és a YouWrite által generált különböző típusú tartalommal teszteltem. A ChatGPT és a GPT-3 Playground által generált minden típusú tartalmat sikerült észlelniük.

Bár vegyes eredményeket értek el a dedikált íróeszközökkel, érdekes módon mindegyiküknek nem sikerült kimutatnia a YouWrite-ot, gondolom azért, mert a YouWrite emberszerű hibákat követ el az észlelés elkerülése érdekében.

Azt javaslom, hogy használja ezeket az eszközöket a tartalom kézi ellenőrzése mellett. Először is elemezze a tartalmat ezen eszközök egyikével, majd manuálisan ellenőrizze, hogy vannak-e nyomok a gyanú további megerősítéséhez.

Az Ubuntu streamelése Windowsra a Splashtop segítségével

Az alábbiakban felsorolom azokat, amelyek a legjobb eredményeket kínálták és a legkönnyebben használhatók:

Megjegyzés: A demonstrációhoz a WriteSonic által generált szöveget fogom használni a „Benefits of Mangoes” c.

#1. Tartalom méretben

A legtöbb általam futtatott teszthez a Content At Scale által készített mesterséges intelligencia-tartalomérzékelőt találtam a legpontosabbnak. Lehetővé teszi akár 2500 karakter beolvasását beolvasásonként, és százalékos előrejelzést ad a valós vagy hamis tartalom sűrűségéről.

Feltételezhető, hogy a 60%-nál több hamis tartalmat mesterséges intelligencia tartalom írta, legalábbis a legtöbbet. Az alábbi képernyőképen látható, hogy a tartalom 96%-a hamis, amit teljes mértékben mesterséges intelligencia segítségével generáltam.

#2. GPTZero

Ha szeretné látni, hogy pontosan milyen tartalmat generál az AI, akkor a GPTZero jó választás. A GPTZero nem pontoz tartalmat. Ehelyett azt a pontos tartalmat emeli ki, amelyet valószínűleg az AI generál.

Bár zavarossági és törtségi pontszámokat mutat, hogy képet kapjon a szöveg véletlenszerűségéről, de ami még fontosabb, támogatja az 5000 karaktert szkennelésenként, és fájlok feltöltésére is képes. A nagy tartalom beolvasása nagyban segít a pontosság javításában.

#3. GPT-2 kimeneti érzékelő

A ChatGPT készítői egy botot is kínálnak saját munkáik észlelésére. Mivel a GPT-2 és a GPT-3 csak a betanításhoz használt összes adatban különbözik, ez a GPT-2 detektor jól működik a GPT-3 alapú AI-k esetében is.

Nincs korlátozva, hogy mennyi tartalmat képes beolvasni, így tökéletes a nagyon hosszú mesterséges intelligencia által generált tartalom észlelésére. A pontosságát is jónak találtam, különösen a ChatGPT által generált tartalmak esetében. Azonban ez egy kicsit vesztes az előrejelzésekben, ezért csak akkor vegye figyelembe az eredményt, ha a tartalom több mint 50%-a hamisnak tűnik.

#4. Writer AI tartalomdetektor

A Writer AI Content Detector eredményei megkérdőjelezhetők az AI íróeszközökből származó tartalom észlelésekor, de kiválóan működik a ChatGPT által generált tartalom esetén. Beolvasásonként 1500 karaktert szkennelhet, és még a tartalom URL-jét is hozzáadhatja, ha az már megjelent.

A teszt mesterséges intelligencia által generált szövegemnél azt írta, hogy a tartalom 94%-a ember által generált, ami más eszközökhöz képest meglehetősen rossz. Ennek ellenére érdemes használni a ChatGPT-tartalom észlelésére, különösen, ha az már megjelent.

#5. Vázlat és cél

Egy egyszerű, de hatékony AI írásészlelő eszköz. Tapasztalataim szerint a Draft & Goal hasonló eredményeket kínált, mint a Content At Scale, de nincs szószámkorlátja, így hosszú írásokat is beolvashat. A szkennelési idő azonban növekszik a beolvasott tartalomtól függően.

A példaszövegnél azt írja, hogy a szöveg 94%-a mesterséges intelligencia által generált.

Gondolataim 💭

Személy szerint úgy gondolom, hogy az AI-súgó egy nagyszerű módja annak, hogy eltávolítsuk az írói tiltást, minden információt egy helyen szerezzünk be, és inspirációt találjunk. Azonban soha nem helyettesítheti az emberi írást, mivel az AI a már ismert tudásra korlátozódik.

A másolás megakadályozása érdekében felfedezhet néhány legjobb plágium-ellenőrző eszközt is.