News 28.08.2013, 08:05 Uhr

Schau mir in die Augen beim Skypen

Dienste wie Skype sind beliebt. Aber wer kennt nicht die leise Frustration, dass das Gegenüber einen bei der Videokonferenz nicht direkt anschaut? Abhilfe schaffen könnte ein Software-Prototyp aus dem Labor für Computergraphik der ETH Zürich.
«Wir möchten Videokonferenzen einem realen Treffen so ähnlich wie möglich machen», erklärt Claudia Kuster, Doktorandin am Labor für Computergraphik der ETH Zürich. Ein grosses Hindernis für das «echte» Gesprächs-Feeling sei der fehlende Blickkontakt. Das Problem entsteht dadurch, dass die Gesprächspartner meist das Bild ihres Gegenübers auf dem Bildschirm anschauen, anstatt sich an die Kamera zu richten. Kuster und ihre Kollegen bieten nun eine alltagstaugliche Lösung für das Problem: Eine Software, die das Gesicht im Video erkennt und es so dreht, dass die Person in die Kamera zu blicken scheint.
Bisher konnten sich nur grössere Unternehmen den Luxus leisten, bei Videokonferenzen den Blickkontakt künstlich herzustellen. Dazu benötigte man nämlich komplexe Spiegelsysteme oder gleich mehrere Kameras sowie spezielle Software. Für den privaten Gebrauch gab es keine zufriedenstellende Lösung des Problems.

Mit Tiefenkarte und Gesichtserkennung

Dies ändert sich nun dank der neuen Software, die Kuster unter der Leitung von Markus Gross, Professor für Informatik an der ETH Zürich, entwickelt hat. Möglich wird das System für den Hausgebrauch dank Kinect, einer neuen Kamerageneration, die gleichzeitig Farb- und Tiefeninformationen sammeln. Die von Kuster entwickelte Software nutzt die aus den Bildinformationen errechnete Tiefenkarte und ein Programm, das in Echtzeit Gesichter in Videos erkennt.
Im Gegensatz zu bisherigen Lösungsansätzen, verzichteten Kuster und ihre Kollegen darauf, das gesamte Videobild, inklusive Hintergrund, zu drehen. Damit umgehen sie das Problem, dass Informationen zu im Originalbild verdeckten Bildbereichen fehlen und sich beim gedrehten Bild somit Löcher ergäben. Stattdessen dreht ihr Algorithmus nur das Gesicht und fügt es nahtlos in das Originalbild ein. Dabei sucht die Software einen Umriss um das Gesicht, bei dem jeder Randpixel im Original und der entsprechende Pixel im gedrehten Bild möglichst ähnliche Farbwerte aufweisen.

Robust unter widrigen Bedingungen

«Die Software lässt sich in wenigen Schritten auf den Benutzer einstellen und läuft sehr robust», sagt Kuster. Verliert das Programm das Gesicht zeitweilig aus den Augen, zum Beispiel wenn die Person den Kopf dreht oder hinter einem Objekt wie einer Tasse verschwindet, belässt die Software das Bild im Original. Mit sich ändernden Lichtverhältnissen und sogar mit zwei Gesichtern gleichzeitig kann die Software mühelos umgehen, wie die Forschenden in einem Video demonstrieren. Allerdings behindert eine Brille die Gesichtserkennung in der aktuellen Version der Software, sodass Brillenträger die Sehhilfe bei Videokonferenzen beiseitelegen müssten.
Obwohl die neue Kamerageneration mit Tiefensensor erschwinglich sind, liegen sie preislich doch über dem Durchschnitt herkömmlicher Webcams. Ausserdem sind aktuelle Laptops, Tablets oder Smartphones noch nicht mit dieser Technologie ausgestattet. Auch deshalb planen Kuster und ihre Kollegen, die Software für mobile Geräte mit herkömmlichen Webcams weiterzuentwickeln und möglichst für die Nutzer weiter zu vereinfachen. Schliesslich möchten die Forschenden auch ein Skype-Plug-In entwickeln, das die Benutzer einfach installieren können, um künftig mit Blickkontakt zu skypen. (www.ethlife.ethz.ch)



Kommentare
Es sind keine Kommentare vorhanden.