Gesichtserkennung: Die Theorie

In Zusammenarbeit mit SIGMA
In dieser ausführlichen Artikelreihe widme ich mich der Gesichtserkennung, die in vielen neuen Programmen, Apps und Webseiten anzutreffen ist. In dieser Reihe geht es aber nicht nur um die Leistung, sondern auch um die Gefahren dieser Technologie. Ich werde Dir zeigen, dass es sich nicht nur um ein nettes Gimmick handelt, sondern es sich in den falschen Händen um ein gefährliches Überwachungstool handeln kann. Aber auch der Nutzen für Dich und ein paar Softwaretipps sind natürlich mit in dieser Reihe vertreten.

Das erwartet Dich in dieser Artikelreihe

Die Theorie

  • Gesichtserkennung?
  • Was ist die generelle Gesichtserkennung?
  • Was ist die differenzierte Gesichtserkennung?
    • Wie funktioniert die Technologie?
    • Was ist die Objekterkennung?
    • 2D/3D/Eigengesicht?
  • Welche Programme/Apps bieten dies an?
  • Welche Webseiten bieten Gesichtserkennung?

Die Praxis

  • Gesichtserkennung am Beispiel Lightroom
  • Gesichtserkennung am Beispiel Apples „Fotos“
  • Optionen und Optimierungen

Datenschutz und Nutzen

  • Wozu nutzt es Dir?
  • Wozu nutzt es anderen?
  • Rechenbeispiel
  • Selbstversuch
  • Datenschutz
  • Risiken und Fallstricke
  • Konstruierte Fallbeispiele
  • Kommentar/Persönliche Meinung

Beginnen wir mit dem ersten Teil:

Gesichtserkennung?

Das Wort sagt Dir ja bereits um was es geht. Es handelt sich um die Fähigkeit Gesichter von anderen Objekten, Formen und Mustern zu trennen und diese dann zu fokussieren (mental) und ihnen eine größere Bedeutung zu geben.

Dieses permanente visuelle „Scannen“ des Sichtfeldes nach Gesichtern erlernt der Mensch bereits in den ersten Tagen seines visuellen Lebens und verfeinert es über die Jahre. Durch diese Fähigkeit entdeckt jeder auch gerne mal Gesichter in Wolken und in anderen unregelmäßigen Mustern. Diese Fähigkeit hat Vorteile für uns alle, sei es in der heutigen Zeit oder aber in der Urzeit.

Gesichtern kannst Du im Normalfall einem Körper zuordnen. Siehst Du einen Bekannten hinter einer Hecke, ist es wahrscheinlich, dass er dort mit einem kompletten Körper steht. Was sich banal anhört, ist aber ein gutes Beispiel für die Extrapolation von Teilinformationen. Wir benötigen also in diesem Beispiel kein komplettes Bild der Person, Du kannst einfach davon ausgehen, dass er einen vollständigen Körper hat, sonst stünde er dort nicht.

Was ist die generelle Gesichtserkennung?

In der generellen Gesichtserkennung geht es um die Erkennung eines x-beliebigen Gesichtes. Hier spielt es keine Rolle, welches Geschlecht oder Alter der Träger des Gesichtes hat. Die Daten werden „Just-in-time“ ermittelt und meist auch direkt nach Gebrauch verworfen. Ausnahmen bilden „Motiontracker“.

Diese halten die ermittelten Daten kurzfristig im Speicher, um sofort auf das Geschehen reagieren zu können. Bei Film- oder Fotokameras ist dies zum Beispiel so, wenn ein erkanntes Gesicht kurzfristig von einem Element verdeckt wird. Die Kameralogik geht dann davon aus, dass das erkannte Gesicht und die dazu gehörende Person sich immer noch irgendwo im Suchbereich befindet. Nur eben kurzfristig nicht erkannt wird oder durch ein Hindernis jeglicher Art nicht sichtbar ist. Die Software sucht dann eine gewisse Zeit nach diesem gespeicherten Muster (Gesicht). Dies funktioniert auch bei bestimmten Kameras mit anderen Objekten und Mustern. Einmal als anvisiertes Muster definiert, kann die Software dem Objekt/Muster in begrenztem Maße folgen (tracken).

Gesichtserkennung im Einsatz

Diese Art der simplen Gesichts- und Objekterkennung wird zum Beispiel genutzt, um bei Kameras auf Gesichter, und da speziell auf die Augen scharf zu stellen. Bereits jedes neuere Smartphone hat dies ab Werk eingebaut.

Aber auch neuere Fahrzeugtechnik mit Notbremsassistenz greifen auf solche Techniken zurück. Sie erkennen Personen am Straßenrand und verfolgen (tracken) ihrer Bewegungen. Ist ein Gesicht erfasst, wird diesem ein Bewegungsvektor zugeordnet. Bewegt sich dieses Objekt (Mensch) zum Beispiel in die geplante Fahrstrecke, wird eine Bremsmanöver ausgelöst oder ein Warnsignal ausgegeben.

Eine weitreichendere Gesichtserkennung, aber immer noch harmlos in Dingen der Privatsphäre, findest Du bereits in vielen Kameras und Smartphones mit speziellen Porträt- und Gesichtsprogrammen. Sie „erkennen“ anhand von einfachen Schemata eine simple Mimik.

Diese Funktion wird gerne von Kamera- und Smartphone Herstellern genutzt, um bei Porträtaufnahmen nur dann auszulösen, wenn das Modell im Sucher auch freundlich dreinschaut.

Hier sind verschieden Bildschirmfotos zu sehen, in der die Software erkannte Gesichter markiert und auf diese fokussiert, gegebenenfalls die Belichtung anpasst und ihnen in der Bewegung folgt, sofern das Gesicht im Erfassungsbereich des Autofokus bleibt.

Gesichtserkennung Kameradisplay 1

Gesichtserkennung Kameradisplay 2

Gesichtserkennung Kameradisplay 3

Gesichtserkennung Kameradisplay 4

Was ist die differenzierte Gesichtserkennung?

Jetzt wird es etwas schwieriger für die Soft- und Hardware. Eine spezialisierte Software erkennt hier nicht nur irgendein Gesicht, sondern kann dem Gesicht ein spezielles Muster zuordnen. Diese Algorithmen und Erkennungsmuster sind natürlich streng geheim und jeder Hersteller kocht da sein eigenes Süppchen. Doch im Grunde kann man sich an die eigene Nase fassen und sich im Spiegel mal „abmessen“. Wie viele Augenbreiten ergeben zum Beispiel den Abstand von Ohransatz zu Ohransatz.

Wie funktioniert eine differenzierte Gesichtserkennung?

Eindeutig sind folgende Parameter, die in ihrer Kombination eben auf ein einzelnes Gesicht hindeuten:

  • Augenabstand
  • Pupillenabstand
  • Dreieck von Pupillen zur Nasenspitze
  • Ohrenabstand bezogen auf den Augenabstand
  • Ohrenposition bezogen auf Nasenspitze
  • Durchschnittliche Lippenstärke
  • Durchschnittlicher Abstand Mitte Mund zu Augen und Ohren

Die Parameter sind miteinander verknüpft und ergeben dadurch ein eindeutiges Muster und können schnell zugeordnet werden. Da es sich dabei nicht um Pixeldaten handelt, sondern um Vektordaten (numerische Beschreibung von Linien und Größen) ist die Speicherung nicht sehr datenintensiv. Parameterverknüpfungen können auch „just-in-time“ gemacht werden. Das spart nochmals Speicher. Heutige Prozessoren sind viel schneller, als gemeinhin angenommen wird. Ich gehe in einen späteren Teil auf diese enorme Geschwindigkeit noch genauer ein.

Diese Art der Speicherung erlaubt es auch kleinen Rechnern, wie zum Beispiel dem Prozessor in einem Smartphone, in Sekundenbruchteilen ein Gesicht eindeutig zu erkennen.

Nicht eineindeutig hingegen sind:

  • Mundform
  • Mundbreite
  • Frisur
  • Hautfarbe/Hautfärbung
  • Mimik in seiner Gesamtheit
  • Brille
  • Mützen/Tücher/Hüte

Die Software ermittelt anhand einfacher Zusammenhänge ein Gesicht im Foto. Danach legt es eine Art Gitter über das Gesicht und ermittelt dann Abstände und Zuordnungen.

Ist das Gesicht in mehreren Bildern vorhanden, kann die Software auch Tiefeninformationen extrapolieren und so die Gesichtserkennung auch auf Teilansichten anwenden.

Sind diese Informationen einmal erfasst, kann eine Software dieses Gesicht in großen Datenbeständen ablegen und gegebenenfalls identische Gesichtszüge herauslesen. Ist das System optimiert für diese Art der Erkennung, ist auch eine Gesichtserkennung in Echtzeit und in HD Videos möglich.

Aus den oben genannten Gründen sind auch die neuen Ausweise mit biometrischen Fotos bestückt. Ein Computer fällt es dann ziemlich leicht ein gespeichertes und vielleicht auch gesuchtes Gesicht zu erkennen.

Google hat mit ihrem Google Glases bereits die möglichen Fähigkeiten demonstriert, aber wegen eigener Bedenken und Protesten nicht aktiviert. In dieser computergesteuerten Brille „könnten“ Informationen von Personen aus dem Internet ermittelt werden – wenn das Gesicht differenziert erkannt wurde – im Vorbeigehen! Die eingescannte Person erfährt davon nichts. Hat die Person Facebook oder andere öffentlich zugängliche Informationen im Netz, kann Google diese auch anzeigen. Wenn Dich jemand Fremdes auf der Straße in Zukunft mit Namen begrüßt, kann es an solchen Technologien liegen. „Big Brother“ ist dagegen ein blinder und tauber Greis.

Objektverfolgung

Die Objekterkennung und ihre Verfolgung sind dagegen um ein Vielfaches schwieriger und komplexer. Ein Ball ist zwar häufig rund, aber das sind auch einige Verkehrsschilder. Hier forschen noch einige Firmen nach Algorithmen, die Erkenntnisse und Zuweisungen vernünftig auf andere Objekte extrapolieren können. Auch hier ist ein Datenabgleich mit dem Internet hilfreich. Tippst Du zum Beispiel den Suchbegriff „Baum“ in die Google-Bildersuche, so bekommst Du eine große und gute Auswahl an Treffern für die Typisierung eines Baumes. Ein Abgleich mit mathematischen Mustern und möglichen Pixelvergleichen sind hier der Weg zum Erfolg.

Irgendwann wird ein solcher Algorithmus auch ein Bonsai von einer Tanne unterscheiden können und zwar völlig ohne Hilfe von menschlichem Eingriff in die Struktur der Daten.

An diesem Beispiel erkennst Du, dass die Logik der Kamera das erkannte Muster verfolgen kann.

Objekterkennung

Adobe bietet seit kurzem eine neue Technologie als Preview zum Testen an. Hier geht es scheinbar um die generelle Objekterkennung, also tatsächlich um die Identifizierung eines fotografierten Objektes. Um es testen zu können, musst Du aber wieder etwas „online“ stellen. Wer es versuchen möchte, kann sich ja die Preview anschauen und uns hier berichten.

2D/3D/Eigengesicht?

In Wikipedia kannst Du viel zu diesen Technologien erfahren. So werden dort verschiedene Verfahren und mathematische Ansätze aufgezeigt und erklärt wie zum Beispiel das Theorem „Eigengesicht“.

Konzerne, Regierung und Andere nutzen sicher alle möglichen Verfahren und unterscheiden je nach Einsatzgebiet und der Zeit, die nötig ist, einem Gesicht eine Person zuzuordnen. Die aufgezeigten Verfahren lassen sich meist sehr gut kombinieren und ineinander verschachteln.

Welche Programme bieten Gesichtserkennung?

Die bekanntesten Programme sind sicher „Fotos“ von Apple und Lightroom von Adobe. Ich werde diese zwei Programme in den kommenden Artikeln noch etwas näher unter die Lupe nehmen. Nach meinen aktuellen Recherchen bin ich selbst überrascht, wie viele Programme Gesichtserkennung bereits anbieten. Daher nenne ich nur die bekanntesten:

  • Adobe Lightroom
  • Apple Fotos
  • Picasa (Abgelöst durch Google Fotos)
  • Google Fotos
  • Apple Aperture (Entwicklung eingestellt)
  • Corel Paintshop Pro X

Artverwandt sind noch die vielen Login-Programme. Diese bieten zum Beispiel das Anmelden in Computersystemen per Gesichtserkennung an oder das Öffnen von Türen.

Welche Webseiten bieten diese Funktion?

Allen vorweg sollte man Facebook nennen. Diese Plattform ist mit seiner Gesichtserkennung schon häufiger in den Medien genannt worden. Besonders das „Taggen“ fremder Fotos mit erkannten Gesichtern anderer ist ein Aufreger gewesen. Dieser Kritik wurde dann durch Konfigurationsmöglichkeiten und „Abschwächung“ seitens Facebook entgegengetreten. Die Funktion den gesamten Fotobestand mit allen privat getaggten Gesichtern zu durchleuchten, ist beängstigend.

Auch andere soziale Netzwerke springen auf den Zug auf. Nicht nur um dem User einen gewissen Komfort zu bieten, sondern eben auch, um ihren eigenen Datenstamm zu vergrößern, verbessern und verfeinern. Was mit all diesen Daten passiert, kann niemand wissen. Schon die Gegenwart zeigt: Vorhandene Daten schaffen Begehrlichkeiten bei Firmen und Behörden nach dem Motto: Die Daten sind vorhanden, auch wenn sie aus anderen Gründen erstellt wurden, wollen wir sie nutzen. Skrupel werden da schnell über Bord geworfen.

Alle großen Suchmaschinen bieten im Grunde eine rudimentäre Gesichtserkennung. Meist versteckt sich diese Funktion in den Optionen oder wird nur intern für bestimmte Operationen genutzt. Ob es sich dabei auch um personenbezogene Gesichtserkennung handelt, ist ein Geheimnis. Es ist aber wahrscheinlich, dass sie Personen mit Gesichtern verbinden.

Bei Googles Fotosuche ist es zum Beispiel durch das Hinzufügen von „&imgtype=face“ am Ende einer Foto-Suchanfrage möglich, sich nur Fotos mit Gesichtern anzeigen zu lassen.

Weiterlesen

In diesem Artikel gebe ich Dir Tipps zu den bekanntesten Programmen Lightroom und Apples „Fotos“ und mögliche Optimierungen der Erkennung. Und ich zeige Dir anhand eines Selbstversuches die Tücken dieser Technologie.

Du möchtest Dein Fotowissen vertiefen?

Lerne jetzt unser neues Kursangebot kennen!



Wie hat Dir dieser Artikel gefallen?

7 Kommentare

  1. Reiner
      April 7, 2016 at 9:03 PM
    Kommentar bewerten

    Bodycam ist jetzt keine Überraschung mehr.

  2.   April 6, 2016 at 9:56 PM
    Kommentar bewerten

    auf Facebook poste ich prinzipiell keine familien-bzw. kinderfotos, auch nicht auf meiner freundesseite. die freunde potenzieren sich und ich kenn nur eine Handvoll persönlich

  3.   April 6, 2016 at 9:53 PM
    Kommentar bewerten

    auf Facebook poste ich prinzipiell keine privatfotos meiner Familie (so warnt auch die Polizei ausdrücklich, kinderfotos ins netz zu stellen); AUCH NICHT auf meiner „Freundesseite“, die freunde potenzieren sich zu hunderten, leute, die ich nicht mal kenne..

  4. Oilhillpitter
      April 6, 2016 at 10:21 AM
    Kommentar bewerten

    Wenn ich mir anschaue, was die Menschen heute ungefragt von sich geben, auf Fratzenbuch o.ä. da hätte sich der Stasi aber gefreut. Logisch, wenn ich als Unternehmer die Möglichkeit habe mich bei Bewerbern über deren Lebenswandel zu informieren, tue ich das. Warum soll ich ein „faules Ei“ einstellen. Wer wann, wo gewesen ist. Wer sich wann wo regelmäßig aufhält, kann man auch anhand der Smartphone-Daten (einwählen bei Funkmasten) feststellen. Aber warum, wenn die Leute denken dass es für all die Anderen von großem Interesse ist, zu wissen wo sie sich gerade aufhalten. Diese Entwicklung wird keiner aufhalten, weil sich keiner über die negativen Folgen Gedanken macht.

  5. Angelika Gaschler
      April 6, 2016 at 7:23 AM
    Kommentar bewerten

    Wow, wo führt das noch hin. Bin beeindruckt, geschockt und ich weiß nicht was alles noch. Bisher bin ich immer recht „leichtfertig“ mit Facebook und co. umgegangen. Hab mir immer gedacht ICH bin für meine Umwelt nicht so interessant. Jetzt überlege ich mir 2x ob und was ich noch ins www stelle.

    Danke für diesen tollen Bericht.

  6. MIchael
      April 5, 2016 at 10:48 PM
    Kommentar bewerten

    Vielen Dank für den sehr interessanten Artikel.

    Ich denke gerade an die vielen Verkehrskameras, die auf unseren Straßen stehen. Sicherlich kann damit auch der Fußweg angesehen werden. Und wahrscheinlich arbeiten diese Kameras bereits digital … Die Daten könnten dann auch an die Privatwirtschaft verkauft werden.

    Oder die Idee von privaten Straßen, die für jeden mautpflichtig wären. Dabei noch eine Kameraüberwachung, Gesichterkennung …

    Ach ja, neulich war ich tanken – Videoüberwachung „zu Ihrer eigenen Sicherheit“. Jetzt gruselt’s mich.

  7. Thomas
      April 5, 2016 at 6:04 PM
    Kommentar bewerten

    Das ist echt beängstigend!
    Wirst Du bei der Job-Suche nur noch abgelehnt, so solltest Du mal das Netz durchsuchen, welche Fotos von dir existieren und dir per Gesichtserkennung zugeordnet werden.
    – Bist Du mal durch ein Rotlicht-Viertel gelaufen?
    – Hast Du mal einen Kaugummi auf den Boden gespuckt?
    – Bist Du vielleicht mal bei einer Demo geknipst worden (auch wenn Du nicht mitgemacht hast, aber das weiß ja keiner)?…

Wie gefällt Dir dieser Lerninhalt?

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert.

Teile diesen Link mit einem Freund