Kategorien
Forschung und Wissenschaft

Bildverstehen und Mustererkennung

Präsentationdirekt

Wow, ausgerechnet Microsoft zeigt Google gerade, wo in Sachen Bildverstehen und Mustererkennung der Hammer hängt. Denn, das was Microsoft-Forscher Blaise Aguera y Arcas da beim TED in knackigen 7 Minuten lässig präsentierte, ist ziemlich sensationell.

In den ersten Minuten präsentiert er Seadragon, eine beindruckende neue Methode innerhalb extrem hochaufgelöster Bilder zu navigieren. Der Clou dabei scheint zu sein, dass die Bilder auf einem Server liegen und die Performance abhängig ist vom Verhältnis der Bildschirmauflösung zu der zu Verfügung stehenden Bandbreite.

Zugegeben: Vermutlich steht hinter der Bühne der Server mit den Bildern und sein kleines Notebook hängt an einem Gigabit-Netz. Aber immerhin.

Der Hauptteil seiner Präsentation beschäftigt sich jedoch mit Photosynth, einer wirklich spektakulären Software. Bilder werden auf ihren Inhalt hin analysiert, in einen semantischen Zusammenhang gebracht und zu Grosskollagen umgerechnet. In der Demo zeigt Aguera y Arcas das am Beispiel der Pariser Notre Dame, auf Grundlage vieler hundert Flickr-Fotos.

Scheinbar hat Microsoft einige Fortschritte gemacht, was Bildverstehen und Mustererkennung betrifft. Für die Zukunft eröffnen sich damit grandiose Chancen. Zum Beispiel können kollaborativ entstandene Bildarchive intelligent genutzt werden, um komplexe Visualisierungen von Orten zu erstellen.

[Nerdcore]