Ki észleli jobban a mélyhamisításokat: ember vagy gép?

Kulcs elvitelek

  • A mélyhamisítások jelentős fenyegetést jelentenek a társadalomra, ideértve a dezinformáció terjesztését, a megszemélyesítés révén a jó hírnév megsértését és a nemzetbiztonsági konfliktusok szítását.
  • Bár a mesterséges intelligencia technológia eszközöket kínál a mélyhamisítás észlelésére, ezek nem tökéletesek, és az emberi mérlegelés továbbra is kulcsfontosságú a mélyhamisítások azonosításában.
  • Az embereknek és a mesterséges intelligencia-felderítő eszközöknek különböző erősségei és gyengeségei vannak a mélyhamisítások azonosításában, és képességeik kombinálása javíthatja a mélyhamisítási technológia észlelésének és veszélyeinek csökkentését.

A mélyhamisítások a társadalom minden területét fenyegetik. A hamis tartalmak azonosításának képessége döntő fontosságú a dezinformáció semmissé tételéhez, de a mesterséges intelligencia technológia fejlődésével kiben bízhatunk a mélyhamisítások észlelésében: emberben vagy gépben?

A mélyhamisítás veszélyei

A mesterséges intelligencia technológia fejlődésével a mélyhamisítások veszélyei mindannyiunk számára egyre nagyobb fenyegetést jelentenek. Íme egy gyors összefoglaló a mélyhamisítások legégetőbb problémáiról:

  • Félretájékoztatás: A hamisított videók és hangfelvételek dezinformációt, például álhíreket terjeszthetnek.
  • Megszemélyesítés: Személyek megszemélyesítésével a mélyhamisítások ronthatják az emberek hírnevét, vagy megtéveszthetnek bárkit, akit ismernek.
  • Nemzetbiztonság: A nyilvánvaló világvége forgatókönyve mélyhamisításokkal egy koholt felvétel vagy hanganyag, amely egy globális vezető konfliktust szít.
  • Polgári zavargások: A felek megtévesztő felvételeket és hanganyagokat is felhasználhatnak bizonyos csoportok haragjának és polgári zavargásának szítására.
  • Kiberbiztonság: A kiberbűnözők már most is mesterséges intelligencia hangklónozó eszközöket használnak, hogy az egyéneket az általuk ismert emberektől származó meggyőző üzenetekkel célozzák meg.
  • Adatvédelem és beleegyezés: A mélyhamisítások rosszindulatú használata az egyénekhez hasonlóságot kölcsönöz a beleegyezésük nélkül.
  • Bizalom és bizalom: Ha nem tud különbséget tenni az igazság és a megtévesztés között, a pontos információ ugyanolyan megbízhatatlanná válik.

A mélyhamisítások csak még meggyőzőbbek lesznek, ezért robusztus eszközökre és folyamatokra van szükségünk az észlelésükhöz. Az AI egy ilyen eszközt kínál mélyhamisítás-észlelési modellek formájában. Az AI által generált írás azonosítására tervezett algoritmusokhoz hasonlóan azonban a mélyhamisítás-észlelő eszközök sem tökéletesek.

Jelenleg az emberi diszkréció az egyetlen eszköz, amelyre támaszkodhatunk. Tehát jobbak vagyunk-e az algoritmusoknál a mélyhamisítások azonosításában?

Az algoritmusok jobban felismerik a mélyhamisításokat, mint az emberek?

A mélyhamisítások elég komoly veszélyt jelentenek ahhoz, hogy a technológiai óriáscégek és kutatócsoportok hatalmas erőforrásokat fordítsanak a kutatásra és fejlesztésre. 2019-ben a Meta, a Microsoft és az Amazon 1 000 000 dollárnyi nyereményt ajánlottak fel egy Deepfake Detection Challenge a legpontosabb észlelési modell érdekében.

A legjobban teljesítő modell 82,56%-os pontosságú volt a nyilvánosan elérhető videók adatkészletéhez képest. Amikor azonban ugyanazokat a modelleket egy 10 000 nem látott videóból álló „fekete doboz adatkészlet” alapján tesztelték, a legjobban teljesítő modell csak 65,18%-os volt.

Rengeteg tanulmányunk van továbbá a mesterséges intelligencia mélyhamisítás-érzékelő eszközeinek emberi lényekkel szembeni teljesítményét elemzi. Természetesen az eredmények tanulmányonként változnak, de általában az emberek megegyeznek a mélyhamisítás-észlelő eszközök sikerarányával, vagy felülmúlják azt.

Egy 2021-es tanulmány, amely a következő napon jelent meg PNAS azt találták, hogy a „hétköznapi emberi megfigyelők” valamivel nagyobb pontosságot értek el, mint a vezető mélyhamisítás-érzékelő eszközök. A tanulmány azonban azt is megállapította, hogy az emberi résztvevők és az AI-modellek különböző típusú hibákra voltak érzékenyek.

Érdekes módon az általa végzett kutatás A Sydney-i Egyetem azt találta, hogy az emberi agy öntudatlanul hatékonyabban észleli a mélyhamisításokat, mint a tudatos erőfeszítéseink.

Vizuális nyomok észlelése a mélyhamisításokban

A mélyhamisítás-észlelés tudománya összetett, és a szükséges elemzés a felvétel természetétől függően változik. Például Kim Dzsong Un észak-koreai vezető hírhedt mélyhamis videója 2020-ból alapvetően egy beszélő fej videó. Ebben az esetben a leghatékonyabb mélyhamisítás-észlelési módszer a visémák (szájmozgások) és fonémák (fonetikus hangok) elemzése lehet következetlenségek szempontjából.

Emberi szakértők, hétköznapi nézők és algoritmusok mind elvégezhetik ezt a fajta elemzést, még akkor is, ha az eredmények eltérőek. A MIT nyolc kérdést határoz meg, amelyek segítenek azonosítani a mélyhamisított videókat:

  • Ügyeljen az arcra. A csúcskategóriás DeepFake manipulációk szinte mindig az arc átalakítását jelentik.
  • Ügyeljen az arcra és a homlokra. A bőr túl sima vagy túl ráncosnak tűnik? A bőr öregsége hasonló a haj és a szemek öregedéséhez? A DeepFakes egyes dimenziókban inkongruensek lehetnek.
  • Ügyeljen a szemekre és a szemöldökökre. Megjelennek az árnyékok olyan helyeken, amelyekre számítanál? Előfordulhat, hogy a DeepFakes nem képviseli teljes mértékben egy jelenet természetes fizikáját.
  • Ügyeljen a szemüvegre. Van valami csillogás? Túl sok a tükröződés? Változik-e a tükröződés szöge, amikor az ember mozog? Előfordulhat, hogy a DeepFakes ismét nem képviseli teljes mértékben a világítás természetes fizikáját.
  • Ügyeljen az arcszőrzetre vagy annak hiányára. Valódinak tűnik ez az arcszőrzet? A DeepFakes hozzáadhat vagy eltávolíthat bajuszt, pajeszt vagy szakállt. Előfordulhat azonban, hogy a DeepFakes nem tudja teljesen természetessé tenni az arcszőrzet átalakulását.
  • Ügyeljen az arc anyajegyeire. Valóságosnak tűnik a vakond?
  • Ügyeljen a pislogásra. Az illető eleget vagy túl sokat pislog?
  • Ügyeljen az ajak mozgására. Egyes mélyhamisítások ajakszinkronizáláson alapulnak. Természetesnek tűnnek az ajakmozgások?

A legújabb mesterséges intelligencia mélyhamisítás-érzékelő eszközei ugyanazokat a tényezőket képesek elemezni, változó sikerrel. Az adatkutatók folyamatosan új módszereket is fejlesztenek, például a természetes véráramlás kimutatását a képernyőn megjelenő hangszórók arcán. Az új megközelítések és a meglévők fejlesztései azt eredményezhetik, hogy a mesterséges intelligencia mélyhamisítás-érzékelő eszközei a jövőben folyamatosan felülmúlják az emberek teljesítményét.

Hangnyomok észlelése a mélyhamisításokban

A mélyhamisított hang észlelése teljesen más kihívás. A videó vizuális jelzései és az audiovizuális inkonzisztenciák azonosításának lehetősége nélkül a mélyhamisítás-észlelés nagymértékben támaszkodik a hangelemzésre (egyes esetekben más módszerek, például a metaadat-ellenőrzés is segíthetnek).

által közzétett tanulmány University College London 2023-ban azt találták, hogy az emberek az esetek 73%-ában képesek felismerni a hamis beszédet (angol és mandarin). A mélyhamisított videókhoz hasonlóan az emberi hallgatók gyakran intuitív módon észlelik a természetellenes beszédmintákat a mesterséges intelligencia által generált beszédben, még akkor is, ha nem tudják meghatározni, hogy mi tűnik rosszul.

A gyakori jelek a következők:

  • Zaklatott
  • A kifejezés hiánya
  • Háttér- vagy interferenciazaj
  • Hang vagy beszéd következetlenségei
  • A „teljesség” hiánya a hangokban
  • Túlságosan forgatókönyvezett kézbesítés
  • Tökéletlenségek hiánya (téves indítások, javítások, toroktisztítás stb.)

Az algoritmusok ismét képesek elemezni a beszédet ugyanazokra a mélyhamisítási jelekre, de az új módszerek hatékonyabbá teszik az eszközöket. Kutatása USENIX azonosított mintákat az AI hangtraktus-rekonstrukcióban, amelyek nem emulálják a természetes beszédet. Összefoglalja, hogy a mesterséges intelligencia hanggenerátorai keskeny (nagyjából egy szívószál méretű) hangsávhoz illeszkedő hangot állítanak elő az emberi beszéd természetes mozgása nélkül.

Korábbi kutatások a Horst Görtz Intézet elemezte az eredeti és mélyhamisított hangot angol és japán nyelven, feltárva finom különbségeket a valódi beszéd és a mélyhamisítás magasabb frekvenciái között.

Mind a hangrendszer, mind a magas frekvenciájú inkonzisztenciák érzékelhetők az emberi hallgatók és az AI észlelési modellek számára. A nagyfrekvenciás eltérések esetén az AI-modellek elméletileg egyre pontosabbá válhatnak – bár ugyanez elmondható az AI mélyhamisításokról is.

Az embereket és az algoritmusokat is becsapják a mélyhamisítások, de más-más módon

A tanulmányok azt sugallják, hogy az emberek és a legújabb mesterséges intelligencia-felderítő eszközök hasonlóképpen képesek a mélyhamisítások azonosítására. A sikerességi arány a teszt paramétereitől függően 50% és 90+% között változhat.

Tágabb értelemben az embereket és a gépeket is hasonló mértékben megtévesztik a mélyhamisítások. Lényeges azonban, hogy különböző módokon vagyunk érzékenyek, és ez lehet a legnagyobb eszközünk a mélyhamisítási technológia veszélyeinek leküzdésében. Az emberi erősségek és a mélyhamisítás-észlelő eszközök kombinálása csökkenti mindegyik gyenge pontját, és javítja a sikerek arányát.

Például, MIT A kutatások szerint az emberek jobban képesek azonosítani a világ vezetőinek és híres embereknek a hamisítványait, mint az AI-modellek. Azt is feltárta, hogy az AI-modellek több emberrel küzdöttek a felvételekkel, bár azt feltételezték, hogy ez abból adódhat, hogy az algoritmusokat egyetlen hangszórót tartalmazó felvételeken tanítják.

Ezzel szemben ugyanez a tanulmány azt találta, hogy az AI-modellek felülmúlják az embereket az alacsony minőségű (homályos, szemcsés, sötét stb.) felvételekkel, amelyeket szándékosan lehetett felhasználni az emberi nézők megtévesztésére. Hasonlóképpen, a legújabb mesterséges intelligencia-észlelési módszerek, mint például a véráramlás monitorozása bizonyos arcterületeken, olyan elemzést tartalmaznak, amelyre az emberek nem képesek.

Ahogy egyre több módszert fejlesztenek ki, a mesterséges intelligencia azon képessége, hogy észleli azokat a jeleket, amelyeket nem tudunk, csak javulni fog, hanem a megtévesztési képessége is. A nagy kérdés az, hogy a mélyhamisítás-észlelési technológia továbbra is felülmúlja-e magukat a mélyhamisításokat.

Másképp látni a dolgokat a mélyhamisítások korában

Az AI mélyhamisítás-észlelő eszközei tovább javulnak, csakúgy, mint magának a mélyhamisításnak a minősége. Ha a mesterséges intelligencia megtévesztési képessége meghaladja az észlelési képességét (mint az AI által generált szövegeknél), akkor az emberi belátásunk lehet az egyetlen eszközünk a mélyhamisítások elleni küzdelemben.

Mindenkinek felelőssége, hogy megtanulja a mélyhamisítások jeleit, és hogyan észlelje őket. Azon túl, hogy megvédjük magunkat a csalásoktól és a biztonsági fenyegetésektől, minden, amit online megbeszélünk és megosztunk, ki van téve a dezinformációnak, ha elveszítjük a valóság megértését.