Bildverstehen - Visuelle Analyse von menschlichen Gesichtern
Themen und Termine
Die folgenden Themen stehen zur Verfügung. Zu Themen, die bereits vergeben sind, wird zusätzlich der Vortragstermin vermerkt.
Gesichtslokalisierung (dd.mm.yyyy)
Gesichter oder andere Objekte werden häufig von dem von Viola und Jones entworfenen Algorithmus detektiert. Diese Algorithmus liefert ein umgebendes Rechteck des gesuchten Objektes im Bild. Dazu werden eine Vielzahl von Hypothesen im gesammten Bild geprüft, um das Gesicht zu detektieren.
Active Shape Models (ASM) (dd.mm.yyyy)
Modelle stellen a priori Wissen über Objekte der echten Welt dar. Active Shape Models modellieren die Veränderung der Form eines Objektes im Bild. Sie werden erstellt, indem eine große Menge statistischer Daten von einer Sammlung manuel annotierter Bilder extrahiert wird. Modelle von Menschlichen Gesichtern ziehen die Kontur des Gesichts, Mund, Nase, Augen und Augenbrauen in Betracht.
Active Appearance Models (AAM) (dd.mm.yyyy)
Active Appearance Modelle erweitern Active Shape Modelle, indem sie zusätzlich die Textur in Betracht ziehen. Daher spiegeln sie auch Aspekte wie Beleuchtung und Farbe des Objektes wieder. Active Appearance Modelle werden benutzt, um Eigenschaften von Personen wie Geschlecht oder Alter fest zu stellen.
3D Morphable Models (dd.mm.yyyy)
Sowohl Active Appearance Modelle als Active Shape Modelle beziehen sich auf die Erscheinung des Objekts im Bild, nicht auf die tatsächliche Raumstruktur. Im Gegensatz dazu modelieren 3D Morphable Models die Objekstruktur im dreidimensionalen Raum und werden mittels perspektivischer Projektion in das Bild projeziert.
Modelleinpassung (dd.mm.yyyy)
Modeleinpassung beschreibt den Vorgang, für ein gegebenes Bild eine möglichst gute Modelparameterisierung zu finden. Diese herausfordernde Aufgabe wird mit Hilfe von Bewertungsfunktionen gelöst, die messen, wie gut eine Modelparameterisierung zum Bild passt. Dies jedoch wirft die Frage auf, wie man eine gute Bewertungsfunktion erhält.
Objektverfolgung (dd.mm.yyyy)
Im Gegensatz zur Modeleinpassung setzt die Objektverfolgung eine gute, bekannte Modelparameterisierung für ein oder mehrere Referenzbilder voraus. Darauf aufbauend werden Modelparameterisierungen für Folgebilder ermittelt. Diese zusätzlichen Informationen erlauben eine grundlegend andere Herangehensweise beider Verfolgung von Objekten als beim initialen Einpassen des Models.
Bild Repräsentationen (dd.mm.yyyy)
Bilder können auf sehr unterschiedliche Art und Weise repräsentiert werden. Es gibt verschiedene Farbräume, so wie den RGB-Raum oder den HSV-Raum. Zusätlich werden komplexere Bilderepräsentation benutzt, um Beispielsweise die Ausdehnung von Hautfarbe anzugeben. Solche Informationen sind sehr nützlich bei der Interpretation menschlicher Gesichter.
Mimikerkennung (dd.mm.yyyy)
Ein Beispiel zur Anwendung der Analyse menschlicher Gesichter ist die Erkennung menschlicher Mimik. Aus Modellparametern und Bildeigenschaften werden Rückschlüsse auf eine von sechs Hauptmimiken gezogen. In diesem Bereich Treffen sich direkt psychologische und informatische Forschung.
Bildsynthese mit 3DMMs (dd.mm.yyyy)
In den letzten drei Jahrzehnten wurden viele Ansätze zur automatisierten Identifikation von Personen in Kamerabildern vorgeschlagen. Dennoch stellt diese Aufgabe bis heute eine Herausforderung dar, da Umgebungsbedingungen wie Lichteinfall oder gedrehte Köpfe starke Variationen im Bildmaterial hervorrufen. Ein Ansatz um dies zu lösen ist die Verwendung von 3DMMs. Diese erlauben die generierung realistischer Bilder von menschlichen Gesichtern, die dann mit den realen Bildern verglichen werden können.
Personenidentifikation mit Eigenfaces, Elastic Matching, und neuronalen Netzen (dd.mm.yyyy)
Klassifikatoren werden in der Informatik häufig eingesetzt, um komplexe Strukturen und Abhängigkeiten in Daten zu lernen, die ein Mensch nicht mehr überblicken kann. Auch die Identifikation von Personen ist ein solches Klassifikationsproblem. In diesem Vortrag sollen drei berühmte Klassifikationstechniken, Eigenfaces, elastic matching und neuronale Netze, vorgestellt und miteinander verglichen werden.
* Auf deutsch oder englisch
* Die angegebenen Artikel sind als Startpunkt gedacht. Eigenständige Literaturrecherche ist erforderlich.
* Umfang der Ausarbeitung: ca.15 Seiten
* Für die Ausarbeitung muss folgender Latex-Rahmen verwendet werden. Die Ausarbeitung wird dann als PDF hier online gestellt werden.
* Vortragsdauer: ca. 40 Minuten
* Die Folien können in PowerPoint, HTML oder PDF-Format abgegeben werden.
* Hilfreiche Internetseiten
o Latex Cookbook
o Latex - Fortgeschrittene Anwendungen
o Computer Science Student Resource Site
o How To Present a Paper in Theoretical Computer Science
o The Computer Vision Homepage
o CiteSeer
o Google Scholar
* Die Vergabe der Plätze und Themen erfolgt bei der Vorbesprechung am Do. 29.01.09 um 11 Uhr in Raum 02.09.023
* 4 Wochen vor dem Vortragstermin muss dem Betreuer eine Gliederung vorgelegt werden.
* Die Präsentation muss spätestens am Montag vor dem eigentlichen Vortragstermin dem Betreuer gezeigt werden.
* Die Ausarbeitung muss mindestens 10 Tage vor dem Vortragstermin abgegeben werden.
* Es wird eine Anwesenheitsliste geführt.
