Die meisten Menschen kennen die Gesichtserkennung von Instagram-Filtern und der Face ID-Funktion. Diese vergleichsweise neue Technologie kann jedoch ein etwas beunruhigendes Gefühl hervorrufen. Ihr Gesicht ist wie ein einzigartiger Fingerabdruck, und die Technologie dahinter ist komplex.
Wie bei jeder neuen Technologie gibt es auch bei der Gesichtserkennung gewisse Schattenseiten. Diese werden immer deutlicher, da das Militär, die Polizei, Werbetreibende und Deepfake-Ersteller immer raffiniertere Wege finden, die Vorteile der Gesichtserkennungssoftware für ihre Zwecke zu nutzen.
Es ist heute wichtiger denn je, dass die Menschen verstehen, wie die Gesichtserkennung funktioniert. Es ist auch wichtig, die Grenzen dieser Technologie zu kennen und zu verstehen, wie sie sich in Zukunft entwickeln könnte.
Die Grundlagen der Gesichtserkennung
Bevor wir uns mit den verschiedenen Facetten der Gesichtserkennung befassen, ist es wichtig zu verstehen, wie der Prozess funktioniert. Hier sind drei Anwendungsfälle für Gesichtserkennungssoftware und eine einfache Erklärung, wie Gesichter erkannt oder identifiziert werden:
Grundlegende Gesichtserkennung: Bei Animojis und Instagram-Filtern sucht die Kamera Ihres Telefons nach bestimmten Merkmalen eines Gesichts, vor allem nach Augen, Nase und Mund. Mit Hilfe von Algorithmen wird dann ein Gesicht erkannt und festgestellt, in welche Richtung es blickt, ob der Mund geöffnet ist usw. Es ist wichtig zu betonen, dass dies keine echte Gesichtserkennung ist, sondern nur eine Software, die nach Gesichtern sucht.
Face ID und ähnliche Programme: Wenn Sie Face ID (oder ähnliche Programme) auf Ihrem Telefon einrichten, wird ein Foto Ihres Gesichts aufgenommen und der Abstand zwischen Ihren Gesichtszügen gemessen. Jedes Mal, wenn Sie Ihr Telefon entsperren, „schaut“ es durch die Kamera, um Ihre Identität zu überprüfen.
Identifizierung einer unbekannten Person: Wenn ein Unternehmen ein Gesicht für Sicherheits-, Werbe- oder Strafverfolgungszwecke identifizieren möchte, werden Algorithmen verwendet, um dieses Gesicht mit einer umfangreichen Datenbank von Gesichtern abzugleichen. Dieser Vorgang ist fast identisch mit der Face ID von Apple, jedoch in einem größeren Maßstab. Theoretisch kann jede Datenbank verwendet werden (z. B. Ausweise, Facebook-Profile), aber eine Datenbank mit klaren, bereits identifizierten Fotos ist ideal.
Nachdem wir die Grundlagen geklärt haben, wollen wir uns eingehender mit der Gesichtserkennung befassen und die verschiedenen Technologien untersuchen, die zur Identifizierung von Gesichtern eingesetzt werden.
2D-Bilder als Basis der meisten Gesichtserkennungssysteme
Wie zu erwarten, basiert der Großteil der Gesichtserkennungssoftware auf 2D-Bildern. Dies geschieht jedoch nicht, weil 2D-Gesichtsbilder besonders genau sind, sondern aus praktischen Gründen. Die überwiegende Mehrheit der Kameras macht Fotos ohne Tiefeninformationen, und öffentliche Fotos, die für Gesichtserkennungsdatenbanken verwendet werden können (z. B. Facebook-Profilbilder), sind alle in 2D.
Warum ist die 2D-Gesichtsbildgebung nicht so genau? Weil einem flachen Bild Ihres Gesichts die Tiefeninformationen fehlen, die für eine zuverlässige Erkennung erforderlich sind. Ein Computer kann mit einem flachen Bild unter anderem Ihren Pupillenabstand und die Breite Ihres Mundes messen. Aber es kann beispielsweise nicht die Länge Ihrer Nase oder die Wölbung Ihrer Stirn bestimmen.
Darüber hinaus basiert die 2D-Gesichtsbildgebung auf dem sichtbaren Lichtspektrum. Das bedeutet, dass 2D-Gesichtsaufnahmen im Dunkeln nicht funktionieren und bei unkonventionellen oder schattigen Lichtverhältnissen unzuverlässig sein können.
Einige dieser Mängel können durch die Verwendung von 3D-Gesichtsbildern behoben werden. Aber wie funktioniert das? Benötigen wir spezielle Geräte, um ein Gesicht in 3D zu sehen?
IR-Kameras für mehr Tiefe
Obwohl einige Gesichtserkennungsanwendungen ausschließlich auf 2D-Bildern basieren, ist es nicht ungewöhnlich, dass 3D-Bilder zur Gesichtserkennung verwendet werden. Tatsächlich ist es wahrscheinlich, dass Ihre Erfahrung mit der Gesichtserkennung eine 3D-Komponente enthält.
Dies wird durch eine Technik namens Lidar erreicht, die dem Sonar ähnelt. Im Wesentlichen senden Gesichtsscanner wie Ihr iPhone ein harmloses Infrarotmuster in Ihr Gesicht. Dieses Muster (eine Reihe von Lasern) wird dann von Ihrem Gesicht reflektiert und von einer IR-Kamera (oder ToF-Kamera) Ihres Telefons erfasst.
Wie funktioniert das 3D-Verfahren? Die IR-Kamera Ihres Telefons misst, wie lange es dauert, bis jedes IR-Licht von Ihrem Gesicht reflektiert und zum Telefon zurückkehrt. Das Licht, das von Ihrer Nase reflektiert wird, hat natürlich einen kürzeren Weg zurückgelegt als das Licht, das von Ihren Ohren reflektiert wird. Diese Informationen werden von der IR-Kamera verwendet, um eine einzigartige Tiefenkarte Ihres Gesichts zu erstellen. In Kombination mit der einfachen 2D-Bildgebung kann die 3D-Bildgebung die Genauigkeit der Gesichtserkennungssoftware erheblich erhöhen.
Die Lidar-Bildgebung ist ein etwas abstraktes Konzept, das schwer zu verstehen sein kann. Zur Veranschaulichung können Sie sich vorstellen, dass das IR-Muster Ihres Telefons (oder eines anderen Gesichtserkennungsgeräts) wie ein Stecknadelbrett ist. Wie bei einem Stecknadelbrett hinterlässt Ihr Gesicht eine Vertiefung im IR-Netz, wobei Ihre Nase deutlich tiefer liegt als beispielsweise Ihre Augen.
Wärmebildtechnik zur Gesichtserkennung bei Dunkelheit
Ein Nachteil der 2D-Gesichtserkennung ist, dass sie auf dem sichtbaren Lichtspektrum basiert. Einfach ausgedrückt, funktioniert die grundlegende Gesichtserkennung im Dunkeln nicht. Dies kann jedoch mit einer Wärmebildkamera umgangen werden.
„Moment mal“, werden Sie vielleicht sagen, „verwendet die Wärmebildtechnik nicht auch Infrarotlicht?“ Ja, das tut sie. Aber Wärmebildkameras senden keine IR-Strahlen aus, sondern nehmen das von Objekten emittierte IR-Licht auf. Warme Objekte senden viel IR-Licht aus, während kalte Objekte nur wenig emittieren. Teure Wärmebildkameras können sogar feine Temperaturunterschiede auf einer Oberfläche erkennen, daher ist diese Technik ideal für die Gesichtserkennung.
Ein Bild im sichtbaren Lichtspektrum, ein Wärmebild und ein kombiniertes Wärmebild.
Es gibt verschiedene Möglichkeiten, ein Gesicht mit Wärmebildtechnik zu identifizieren. All diese Methoden sind sehr komplex, haben aber auch einige Gemeinsamkeiten. Daher versuchen wir, die Dinge mit einer Liste zu vereinfachen:
Mehrere Aufnahmen sind erforderlich: Eine Wärmebildkamera nimmt mehrere Aufnahmen des Gesichts einer Person auf. Jedes Foto konzentriert sich auf einen anderen Bereich des IR-Lichts (lange, kurze und mittlere Wellen). In der Regel liefert der Langwellenbereich die meisten Details des Gesichts.
Blutgefäßkarten sind nützlich: Die IR-Aufnahmen können auch verwendet werden, um die Struktur der Blutgefäße im Gesicht einer Person zu extrahieren. Das klingt etwas gruselig, aber Blutgefäßkarten können wie einzigartige Gesichtsfingerabdrücke verwendet werden. Sie können auch verwendet werden, um den Abstand zwischen Gesichtsorganen zu bestimmen (wenn eine typische Wärmebildaufnahme minderwertige Bilder liefert) oder um Blutergüsse und Narben zu erkennen.
Das Subjekt kann identifiziert werden: Ein kombiniertes Bild (oder ein Datensatz) wird aus mehreren IR-Bildern erstellt. Dieses kombinierte Bild kann dann mit einer Gesichtsdatenbank verglichen werden, um das Subjekt zu identifizieren.
Die Wärmebild-Gesichtserkennung wird normalerweise vom Militär verwendet und ist weder in Kaufhäusern noch auf Ihrem nächsten Smartphone zu finden. Zudem funktioniert eine Wärmebildkamera bei Tageslicht oder in gut beleuchteten Umgebungen nicht gut, weshalb sie außerhalb des Militärs nicht viele Anwendungsmöglichkeiten hat.
Einschränkungen der Gesichtserkennung
Wir haben bereits einige Zeit damit verbracht, über die Mängel der Gesichtserkennung zu sprechen. Wie wir gesehen haben, können einige dieser Einschränkungen durch IR- und Wärmebildtechnik überwunden werden. Es gibt jedoch noch ein paar Probleme, die noch nicht gelöst sind:
Verdeckung: Es ist zu erwarten, dass Sonnenbrillen und andere Accessoires die Gesichtserkennungssoftware verwirren können.
Posen: Die Gesichtserkennung funktioniert am besten mit einem neutralen, frontal aufgenommenen Bild. Eine Neigung oder Drehung des Kopfes kann die Gesichtserkennung erschweren, selbst bei IR-basierter Erkennungssoftware. Darüber hinaus können ein Lächeln, geschwollene Wangen oder jede andere Pose die Art und Weise verändern, wie ein Computer Ihr Gesicht misst.
Licht: Alle Formen der Gesichtserkennung basieren auf Licht, egal ob es sich um das sichtbare Spektrum oder Infrarotlicht handelt. Daher können ungewöhnliche Lichtverhältnisse die Genauigkeit der Gesichtserkennung beeinträchtigen. Dies könnte sich jedoch ändern, da Wissenschaftler derzeit eine sonarbasierte Gesichtserkennungstechnologie entwickeln.
Die Datenbank: Ohne eine gute Datenbank kann die Gesichtserkennung nicht funktionieren. Daher ist es unmöglich, ein Gesicht zu identifizieren, das in der Vergangenheit nicht richtig erfasst wurde.
Datenverarbeitung: Je nach Größe und Format einer Datenbank kann es einige Zeit dauern, bis Computer Gesichter korrekt erkennen. In bestimmten Situationen, z. B. bei der Polizei, schränken die Einschränkungen bei der Datenverarbeitung die Verwendung der Gesichtserkennung für alltägliche Anwendungen ein (was wahrscheinlich eine gute Sache ist).
Derzeit können diese Einschränkungen am besten durch andere Formen der Identifizierung in Verbindung mit der Gesichtserkennung umgangen werden. Ihr Telefon fragt nach einem Passwort oder einem Fingerabdruck, wenn Ihr Gesicht nicht erkannt wird, und die chinesische Regierung verwendet Ausweise und Tracking-Technologien, um Fehler in ihrem Gesichtserkennungsnetzwerk zu minimieren.
In Zukunft werden Wissenschaftler sicherlich Wege finden, diese Probleme zu lösen. Sie könnten Sonartechnologie in Kombination mit Lidar verwenden, um 3D-Gesichtskarten in jeder Umgebung zu erstellen, und sie könnten Wege finden, Gesichtsdaten in kürzester Zeit zu verarbeiten (und Unbekannte zu identifizieren). In jedem Fall birgt diese Technologie ein hohes Missbrauchspotenzial, daher ist es wichtig, auf dem Laufenden zu bleiben.