Hogyan működik az arcfelismerés?

A legtöbb ember elégedett az arcfelismeréssel az Instagram-szűrőkben és a Face ID-ben való használat miatt. De ez a viszonylag új technológia kissé hátborzongató. Az arcod olyan, mint egy ujjlenyomat, és az arcfelismerés mögötti technológia összetett.

Mint minden új technológiának, az arcfelismerésnek is vannak árnyoldalai. Ezek a hátrányok egyre nyilvánvalóbbá válnak, ahogy a katonaság, a rendőrség, hirdetők, és a mélyhamisítás készítői, találjanak újszerű módszereket az arcfelismerő szoftver előnyeinek kihasználására.

Most minden eddiginél fontosabb, hogy az emberek megértsék az arcfelismerés működését. Az is fontos, hogy ismerjük az arcfelismerés korlátait és azt, hogy hogyan fog fejlődni a jövőben.

Az arcfelismerés meglepően egyszerű

Mielőtt belevágna az arcfelismerés különféle médiumaiba, fontos megérteni, hogyan működik az arcfelismerés. Íme három alkalmazás az arcfelismerő szoftverhez, valamint egy egyszerű magyarázat az arcok felismerésére vagy azonosítására:

Alapvető arcfelismerés: Az Animoji és Instagram szűrők esetében a telefon kamerája „keresi” az arc meghatározó vonásait, különösen a szempárt, az orrot és a szájat. Ezután algoritmusok segítségével rögzíti az arcot, és meghatározza, hogy melyik irányba néz, nyitva van-e a szája stb. Érdemes megemlíteni, hogy ez nem arc azonosítás, hanem csak egy szoftver, amely arcokat keres.
Face ID és hasonló programok: Amikor beállítja a Face ID-t (vagy hasonló programokat) a telefonon, fényképet készít az arcáról, és megméri az arcvonásai közötti távolságot. Ezután minden alkalommal, amikor feloldja telefonját, az „átnéz” a kamerán, hogy megmérje és megerősítse személyazonosságát.
Idegen azonosítása: Ha egy szervezet biztonsági, reklámozási vagy rendészeti célból azonosítani akar egy arcot, akkor algoritmusokat használ az arc összehasonlítására egy kiterjedt arcadatbázissal. Ez a folyamat majdnem megegyezik az Apple Face ID-jével, de nagyobb léptékben. Elméletileg bármilyen adatbázis használható (személyi igazolványok, Facebook-profilok), de ideális egy tiszta, előre azonosított fotók adatbázisa.

  Miért van szüksége számítógépének UEFI firmware-ének biztonsági frissítésekre?

Rendben, térjünk át a szarvasra. Mivel az Instagram-szűrőkhöz használt „alapvető arcfelismerés” olyan egyszerű és ártalmatlan folyamat, teljes mértékben az arc azonosítására és az arc azonosítására használható különféle technológiákra fogunk összpontosítani.

A legtöbb arcfelismerés 2D képeken alapul

Ahogy az várható volt, a legtöbb arcfelismerő szoftver teljes mértékben a 2D képekre támaszkodik. De ez nem történik meg, mert a 2D arcképalkotás szuperpontos, hanem a kényelem érdekében. A fényképezőgépek túlnyomó többsége mélység nélkül készít fényképeket, az arcfelismerő adatbázisokhoz használható nyilvános fotók (például Facebook-profilképek) pedig mind 2D-sek.

Miért nem szuperpontos a 2D arcképalkotás? Nos, mert az arc lapos képéből hiányoznak az azonosítási jellemzők, például a mélység. Lapos kép esetén a számítógép más változók mellett meg tudja mérni a pupilla távolságát és a száj szélességét. De nem tudja megmondani az orrod hosszát vagy a homlokod kiemelkedését.

Ezenkívül a 2D arcképalkotás a látható fény spektrumára támaszkodik. Ez azt jelenti, hogy a 2D arcképalkotás nem működik sötétben, és megbízhatatlan lehet furcsa vagy árnyékos fényviszonyok között.

Egyértelmű, hogy e hiányosságok némelyikét a 3D arcképalkotás segítségével lehet megkerülni. De hogyan lehetséges ez? Speciális felszerelésre van szüksége egy arc 3D-s megjelenítéséhez?

Az infravörös kamerák mélyebbé teszik személyazonosságát

Míg egyes arcfelismerő alkalmazások kizárólag 2D képekre támaszkodnak, nem ritka, hogy az arcfelismerés a 3D képalkotásra is támaszkodik. Valójában az arcfelismeréssel kapcsolatos tapasztalatai valószínűleg egy csipet 3D-t tartalmaznak.

Ezt a lidar nevű technikával érik el, amely hasonló a szonárhoz. Lényegében az arcszkennelő eszközök, mint például az iPhone, ártalmatlan infravörös mátrixot sugároznak az arcra. Ez a mátrix (lézerek fala) azután visszaverődik az arcáról, és a telefon infravörös kamerája (vagy ToF-kamera) felveszi.

Hol történik a 3D varázslat? Telefonja infravörös kamerája méri, hogy mennyi időbe telik, amíg minden egyes infravörös fény visszaverődik az arcáról, és visszatér a telefonhoz. Természetesen az orráról visszaverődő fény rövidebb utat tesz meg, mint a füléről visszaverődő fény, és az infravörös kamera ezeket az információkat használja fel az arc egyedi mélységi térképének elkészítéséhez. Az alapvető 2D képalkotás mellett a 3D képalkotás jelentősen növelheti az arcfelismerő szoftverek pontosságát.

  A biztonsági kamera ablakon keresztüli éjszakai látása

A Lidar képalkotás egy furcsa koncepció, amelyet nehéz körüljárni. Ha segít, próbálja meg elképzelni, hogy a telefon (vagy bármely arcfelismerő eszköz) infravörös hálója a tűtáblás játék. Mint egy tűtáblás játék, az arcod egy bemélyedést hagy az infravörös hálóban, ahol az orrod észrevehetően mélyebb, mint például a szeme.

A hőképalkotás lehetővé teszi az arcfelismerés éjszakai működését

A 2D arcfelismerés egyik hiányossága, hogy a fény látható spektrumára támaszkodik. Laikus kifejezéssel élve az alapvető arcfelismerés sötétben nem működik. De ez megkerülhető hőkamerával (igen, mint például a Tom Clancynél).

„Várj egy percet” – mondhatnád –, a hőképalkotás nem támaszkodik az infravörös fényre? Dehogynem. De a hőkamerák nem bocsátanak ki infravörös fényt; egyszerűen érzékelik a tárgyakból kibocsátott infravörös fényt. A meleg tárgyak tonna infravörös fényt bocsátanak ki, míg a hideg tárgyak elhanyagolható mennyiségű infravörös fényt bocsátanak ki. A drága hőkamerák még a felületen tapasztalható finom hőmérséklet-különbségeket is érzékelik, így a technológia ideális az arcfelismeréshez.

Egy látható fényspektrum kép, egy hőkép és egy kompozit hőkép.

Vannak a maroknyi különböző módon hogy hőképalkotással azonosítsa az arcot. Mindezek a technikák hihetetlenül bonyolultak, de van néhány alapvető hasonlóságuk, ezért megpróbáljuk egyszerűvé tenni a dolgokat egy listával:

Több fényképre van szükség: A hőkamera több képet is készít egy alany arcáról. Minden fotó az infravörös fény más spektrumára fókuszál (hosszú, rövid és közepes hullámokra). Általában a hosszú hullámspektrum biztosítja a legtöbb arcrészletet.
A véredénytérképek hasznosak: Ezek az infravörös képek arra is használhatók, hogy kivonják az erek képződését az ember arcából. Hátborzongató, de az értérképek egyedi arc ujjlenyomatként használhatók. Használhatók az arcszervek közötti távolság meghatározására is (ha a tipikus hőképalkotás silány képeket eredményez), vagy zúzódások és hegek azonosítására.
Az alany azonosítható: Egy összetett kép (vagy adatkészlet) több infravörös kép felhasználásával jön létre. Ezt az összetett képet azután össze lehet hasonlítani egy arcadatbázissal az alany azonosításához.

Természetesen a termikus arcfelismerést általában a katonaság használja, ez nem olyasvalami, amit a Kholsban talál, és nem az, amit a következő mobiltelefonjával együtt fog kapni. Ráadásul a hőképalkotás nem működik jól nappal (vagy általában jól megvilágított környezetben), így nincs sok potenciális alkalmazása a hadseregen kívül.

  Hogyan szerezz iPhone-szerű AirPods élményt Macen

Az arcfelismerés korlátai

Sok időt töltöttünk azzal, hogy az arcfelismerés hiányosságairól beszéljünk. Amint azt az infravörös és a hőképalkotásból láthattuk, ezen korlátok némelyike ​​leküzdhető. De még mindig van néhány probléma, amelyet még nem sikerült kitalálni:

Akadályok: Ahogy az várható is, a napszemüvegek és egyéb kiegészítők megzavarhatják az arcfelismerő szoftvert.
Pózok: Az arcfelismerés semleges, előre néző kép esetén működik a legjobban. A fej megdöntése vagy elfordítása megnehezítheti az arcfelismerést, még az infravörös alapú felismerő szoftverek esetében is. Ezenkívül a mosoly, a puffadt arcok vagy bármilyen más póz megváltoztathatja azt, ahogy a számítógép méri az arcát.
Fény: Az arcfelismerés minden formája a fényre támaszkodik, legyen az látható spektrum vagy infravörös fény. Ennek eredményeként a furcsa fényviszonyok csökkenthetik az arc azonosításának pontosságát. Ez változhat, mivel a tudósok jelenleg dolgoznak szonár alapú arcfelismerő technológia.
Az adatbázis: Jó adatbázis nélkül az arcfelismerés nem működik. Ugyanezen irányvonal mentén lehetetlen azonosítani egy olyan arcot, amelyet a múltban nem azonosítottak megfelelően.
Adatfeldolgozás: Az adatbázis méretétől és formátumától függően eltarthat egy ideig, amíg a számítógépek helyesen azonosítják az arcokat. Egyes helyzetekben, például a rendőrségnél, az adatfeldolgozás korlátai korlátozzák az arcazonosító használatát a mindennapi alkalmazásokhoz (ami valószínűleg jó dolog).

Jelenleg ezeket a korlátozásokat a legjobb módja az azonosítás más formáinak használata az arcfelismeréssel együtt. Telefonja jelszót vagy ujjlenyomatot kér, ha nem tudja azonosítani az arcát, és a kínai kormány személyazonosító kártyákat és nyomkövető technológiát használ az arcfelismerő hálózatában meglévő hibahatár bezárására.

A jövőben a tudósok biztosan megtalálják a módját, hogy megkerüljék ezeket a kérdéseket. A szonártechnológiát a lidar mellett használhatják 3D arctérképek létrehozására bármilyen környezetben, és módot találhatnak az arcadatok feldolgozására (és az idegenek azonosítására) hihetetlenül rövid időn belül. Akárhogy is, ez a technológia sok visszaélési lehetőséget rejt magában, ezért érdemes lépést tartani vele.

Források: A Rijekai Egyetem, Az Electronic Frontier Foundation