Tartalomjegyzék
Kulcs elvitelek
- A mélyhamisítások jelentős fenyegetést jelentenek a társadalomra, ideértve a dezinformáció terjesztését, a megszemélyesítés révén a jó hírnév megsértését és a nemzetbiztonsági konfliktusok szítását.
- Bár a mesterséges intelligencia technológia eszközöket kínál a mélyhamisítás észlelésére, ezek nem tökéletesek, és az emberi mérlegelés továbbra is kulcsfontosságú a mélyhamisítások azonosításában.
- Az embereknek és a mesterséges intelligencia-felderítő eszközöknek különböző erősségei és gyengeségei vannak a mélyhamisítások azonosításában, és képességeik kombinálása javíthatja a mélyhamisítási technológia észlelésének és veszélyeinek csökkentését.
A mélyhamisítások a társadalom minden területét fenyegetik. A hamis tartalmak azonosításának képessége döntő fontosságú a dezinformáció semmissé tételéhez, de a mesterséges intelligencia technológia fejlődésével kiben bízhatunk a mélyhamisítások észlelésében: emberben vagy gépben?
A mélyhamisítás veszélyei
A mesterséges intelligencia technológia fejlődésével a mélyhamisítások veszélyei mindannyiunk számára egyre nagyobb fenyegetést jelentenek. Íme egy gyors összefoglaló a mélyhamisítások legégetőbb problémáiról:
- Félretájékoztatás: A hamisított videók és hangfelvételek dezinformációt, például álhíreket terjeszthetnek.
- Megszemélyesítés: Személyek megszemélyesítésével a mélyhamisítások ronthatják az emberek hírnevét, vagy megtéveszthetnek bárkit, akit ismernek.
- Nemzetbiztonság: A nyilvánvaló világvége forgatókönyve mélyhamisításokkal egy koholt felvétel vagy hanganyag, amely egy globális vezető konfliktust szít.
- Polgári zavargások: A felek megtévesztő felvételeket és hanganyagokat is felhasználhatnak bizonyos csoportok haragjának és polgári zavargásának szítására.
- Kiberbiztonság: A kiberbűnözők már most is mesterséges intelligencia hangklónozó eszközöket használnak, hogy az egyéneket az általuk ismert emberektől származó meggyőző üzenetekkel célozzák meg.
- Adatvédelem és beleegyezés: A mélyhamisítások rosszindulatú használata az egyénekhez hasonlóságot kölcsönöz a beleegyezésük nélkül.
- Bizalom és bizalom: Ha nem tud különbséget tenni az igazság és a megtévesztés között, a pontos információ ugyanolyan megbízhatatlanná válik.
A mélyhamisítások csak még meggyőzőbbek lesznek, ezért robusztus eszközökre és folyamatokra van szükségünk az észlelésükhöz. Az AI egy ilyen eszközt kínál mélyhamisítás-észlelési modellek formájában. Az AI által generált írás azonosítására tervezett algoritmusokhoz hasonlóan azonban a mélyhamisítás-észlelő eszközök sem tökéletesek.
Jelenleg az emberi diszkréció az egyetlen eszköz, amelyre támaszkodhatunk. Tehát jobbak vagyunk-e az algoritmusoknál a mélyhamisítások azonosításában?
Az algoritmusok jobban felismerik a mélyhamisításokat, mint az emberek?
A mélyhamisítások elég komoly veszélyt jelentenek ahhoz, hogy a technológiai óriáscégek és kutatócsoportok hatalmas erőforrásokat fordítsanak a kutatásra és fejlesztésre. 2019-ben a Meta, a Microsoft és az Amazon 1 000 000 dollárnyi nyereményt ajánlottak fel egy Deepfake Detection Challenge a legpontosabb észlelési modell érdekében.
A legjobban teljesítő modell 82,56%-os pontosságú volt a nyilvánosan elérhető videók adatkészletéhez képest. Amikor azonban ugyanazokat a modelleket egy 10 000 nem látott videóból álló „fekete doboz adatkészlet” alapján tesztelték, a legjobban teljesítő modell csak 65,18%-os volt.
Rengeteg tanulmányunk van továbbá a mesterséges intelligencia mélyhamisítás-érzékelő eszközeinek emberi lényekkel szembeni teljesítményét elemzi. Természetesen az eredmények tanulmányonként változnak, de általában az emberek megegyeznek a mélyhamisítás-észlelő eszközök sikerarányával, vagy felülmúlják azt.
Egy 2021-es tanulmány, amely a következő napon jelent meg PNAS azt találták, hogy a „hétköznapi emberi megfigyelők” valamivel nagyobb pontosságot értek el, mint a vezető mélyhamisítás-érzékelő eszközök. A tanulmány azonban azt is megállapította, hogy az emberi résztvevők és az AI-modellek különböző típusú hibákra voltak érzékenyek.
Érdekes módon az általa végzett kutatás A Sydney-i Egyetem azt találta, hogy az emberi agy öntudatlanul hatékonyabban észleli a mélyhamisításokat, mint a tudatos erőfeszítéseink.
Vizuális nyomok észlelése a mélyhamisításokban
A mélyhamisítás-észlelés tudománya összetett, és a szükséges elemzés a felvétel természetétől függően változik. Például Kim Dzsong Un észak-koreai vezető hírhedt mélyhamis videója 2020-ból alapvetően egy beszélő fej videó. Ebben az esetben a leghatékonyabb mélyhamisítás-észlelési módszer a visémák (szájmozgások) és fonémák (fonetikus hangok) elemzése lehet következetlenségek szempontjából.
Emberi szakértők, hétköznapi nézők és algoritmusok mind elvégezhetik ezt a fajta elemzést, még akkor is, ha az eredmények eltérőek. A MIT nyolc kérdést határoz meg, amelyek segítenek azonosítani a mélyhamisított videókat:
- Ügyeljen az arcra. A csúcskategóriás DeepFake manipulációk szinte mindig az arc átalakítását jelentik.
- Ügyeljen az arcra és a homlokra. A bőr túl sima vagy túl ráncosnak tűnik? A bőr öregsége hasonló a haj és a szemek öregedéséhez? A DeepFakes egyes dimenziókban inkongruensek lehetnek.
- Ügyeljen a szemekre és a szemöldökökre. Megjelennek az árnyékok olyan helyeken, amelyekre számítanál? Előfordulhat, hogy a DeepFakes nem képviseli teljes mértékben egy jelenet természetes fizikáját.
- Ügyeljen a szemüvegre. Van valami csillogás? Túl sok a tükröződés? Változik-e a tükröződés szöge, amikor az ember mozog? Előfordulhat, hogy a DeepFakes ismét nem képviseli teljes mértékben a világítás természetes fizikáját.
- Ügyeljen az arcszőrzetre vagy annak hiányára. Valódinak tűnik ez az arcszőrzet? A DeepFakes hozzáadhat vagy eltávolíthat bajuszt, pajeszt vagy szakállt. Előfordulhat azonban, hogy a DeepFakes nem tudja teljesen természetessé tenni az arcszőrzet átalakulását.
- Ügyeljen az arc anyajegyeire. Valóságosnak tűnik a vakond?
- Ügyeljen a pislogásra. Az illető eleget vagy túl sokat pislog?
- Ügyeljen az ajak mozgására. Egyes mélyhamisítások ajakszinkronizáláson alapulnak. Természetesnek tűnnek az ajakmozgások?
A legújabb mesterséges intelligencia mélyhamisítás-érzékelő eszközei ugyanazokat a tényezőket képesek elemezni, változó sikerrel. Az adatkutatók folyamatosan új módszereket is fejlesztenek, például a természetes véráramlás kimutatását a képernyőn megjelenő hangszórók arcán. Az új megközelítések és a meglévők fejlesztései azt eredményezhetik, hogy a mesterséges intelligencia mélyhamisítás-érzékelő eszközei a jövőben folyamatosan felülmúlják az emberek teljesítményét.
Hangnyomok észlelése a mélyhamisításokban
A mélyhamisított hang észlelése teljesen más kihívás. A videó vizuális jelzései és az audiovizuális inkonzisztenciák azonosításának lehetősége nélkül a mélyhamisítás-észlelés nagymértékben támaszkodik a hangelemzésre (egyes esetekben más módszerek, például a metaadat-ellenőrzés is segíthetnek).
által közzétett tanulmány University College London 2023-ban azt találták, hogy az emberek az esetek 73%-ában képesek felismerni a hamis beszédet (angol és mandarin). A mélyhamisított videókhoz hasonlóan az emberi hallgatók gyakran intuitív módon észlelik a természetellenes beszédmintákat a mesterséges intelligencia által generált beszédben, még akkor is, ha nem tudják meghatározni, hogy mi tűnik rosszul.
A gyakori jelek a következők:
- Zaklatott
- A kifejezés hiánya
- Háttér- vagy interferenciazaj
- Hang vagy beszéd következetlenségei
- A „teljesség” hiánya a hangokban
- Túlságosan forgatókönyvezett kézbesítés
- Tökéletlenségek hiánya (téves indítások, javítások, toroktisztítás stb.)
Az algoritmusok ismét képesek elemezni a beszédet ugyanazokra a mélyhamisítási jelekre, de az új módszerek hatékonyabbá teszik az eszközöket. Kutatása USENIX azonosított mintákat az AI hangtraktus-rekonstrukcióban, amelyek nem emulálják a természetes beszédet. Összefoglalja, hogy a mesterséges intelligencia hanggenerátorai keskeny (nagyjából egy szívószál méretű) hangsávhoz illeszkedő hangot állítanak elő az emberi beszéd természetes mozgása nélkül.
Korábbi kutatások a Horst Görtz Intézet elemezte az eredeti és mélyhamisított hangot angol és japán nyelven, feltárva finom különbségeket a valódi beszéd és a mélyhamisítás magasabb frekvenciái között.
Mind a hangrendszer, mind a magas frekvenciájú inkonzisztenciák érzékelhetők az emberi hallgatók és az AI észlelési modellek számára. A nagyfrekvenciás eltérések esetén az AI-modellek elméletileg egyre pontosabbá válhatnak – bár ugyanez elmondható az AI mélyhamisításokról is.
Az embereket és az algoritmusokat is becsapják a mélyhamisítások, de más-más módon
A tanulmányok azt sugallják, hogy az emberek és a legújabb mesterséges intelligencia-felderítő eszközök hasonlóképpen képesek a mélyhamisítások azonosítására. A sikerességi arány a teszt paramétereitől függően 50% és 90+% között változhat.
Tágabb értelemben az embereket és a gépeket is hasonló mértékben megtévesztik a mélyhamisítások. Lényeges azonban, hogy különböző módokon vagyunk érzékenyek, és ez lehet a legnagyobb eszközünk a mélyhamisítási technológia veszélyeinek leküzdésében. Az emberi erősségek és a mélyhamisítás-észlelő eszközök kombinálása csökkenti mindegyik gyenge pontját, és javítja a sikerek arányát.
Például, MIT A kutatások szerint az emberek jobban képesek azonosítani a világ vezetőinek és híres embereknek a hamisítványait, mint az AI-modellek. Azt is feltárta, hogy az AI-modellek több emberrel küzdöttek a felvételekkel, bár azt feltételezték, hogy ez abból adódhat, hogy az algoritmusokat egyetlen hangszórót tartalmazó felvételeken tanítják.
Ezzel szemben ugyanez a tanulmány azt találta, hogy az AI-modellek felülmúlják az embereket az alacsony minőségű (homályos, szemcsés, sötét stb.) felvételekkel, amelyeket szándékosan lehetett felhasználni az emberi nézők megtévesztésére. Hasonlóképpen, a legújabb mesterséges intelligencia-észlelési módszerek, mint például a véráramlás monitorozása bizonyos arcterületeken, olyan elemzést tartalmaznak, amelyre az emberek nem képesek.
Ahogy egyre több módszert fejlesztenek ki, a mesterséges intelligencia azon képessége, hogy észleli azokat a jeleket, amelyeket nem tudunk, csak javulni fog, hanem a megtévesztési képessége is. A nagy kérdés az, hogy a mélyhamisítás-észlelési technológia továbbra is felülmúlja-e magukat a mélyhamisításokat.
Másképp látni a dolgokat a mélyhamisítások korában
Az AI mélyhamisítás-észlelő eszközei tovább javulnak, csakúgy, mint magának a mélyhamisításnak a minősége. Ha a mesterséges intelligencia megtévesztési képessége meghaladja az észlelési képességét (mint az AI által generált szövegeknél), akkor az emberi belátásunk lehet az egyetlen eszközünk a mélyhamisítások elleni küzdelemben.
Mindenkinek felelőssége, hogy megtanulja a mélyhamisítások jeleit, és hogyan észlelje őket. Azon túl, hogy megvédjük magunkat a csalásoktól és a biztonsági fenyegetésektől, minden, amit online megbeszélünk és megosztunk, ki van téve a dezinformációnak, ha elveszítjük a valóság megértését.