22.6.09

GOOGLE planche sur la reconnaissance visuelle automatique des éléments du patrimoine mondial

Si la Tour Eiffel et l’Arc de Triomphe sont des monuments universellement reconnus, de nombreuses destinations ont un patrimoine largement ignoré des guides touristiques traditionnels faute de les avoir référencés. Je ne sais si, cette approche fait partie des desseins que les chercheurs de l’Université de Singapour et de Google, mais ils se sont donnés pour objectif d’essayer de produire un inventaire des centres d’intérêts touristiques sur la Terre. Pour cela, ils ont utilisés plus de 21 millions d’images stockées dans la base de Picasa et de Panoramio qu’ils ont comparés avec un échantillon d’images géo-taggées issues. L’équipe de Google vient de démontrer dans un papier de recherche présenté lors d’une conférence sur la reconnaissance visuelle à Miami (Floride) qu’ils pouvaient obtenir un taux de reconnaissance supérieur à 80%. Ceci suppose qu’ils disposent d’un nombre suffisant de clichés qu’ils regroupent en clusters, les clichés étant sélectionnés en fonction de leurs similitudes visuelles. Un des clusters présentés est celui de l’Acropole d’Athènes qui est l’un des monuments les plus photographiés en Europe sachant qu’ils ont effectué leur étude en utilisant l’anglais comme langue de travail. Car en plus de la reconnaissance visuelle, ils utilisent largement les fonctions d’indexation du moteur de recherche de Google qui utilise aussi les tags attachés aux images ainsi que les descriptions enregistrées par les internautes. L’une des limites actuelles de la recherche, qui se veut sans objectif commercial pour l’instant, est celle des différences linguistiques. Par exemple, ils n’identifient que 101 centres d’intérêt en Chine pour 5312 sur la Planète dans 1259 centres urbains de 144 pays.

Les chercheurs évoquent la possibilité d’injecter les données issues de ces clusters d’images dans des systèmes de modélisation 3D sans en préciser la nature. Je suis certain que les producteurs de logiciel de Personal Navigation Devices (PND) trouveront là une possibilité d’enrichir leurs bases de données et surtout les moyens de produire des images de synthèse beaucoup plus rapidement tout en associant la masse d’information attachée à toute les images prise par les millions de touriste qui visitent ces centres d’intérêts.

Pour en savoir plus sur cette recherche, téléchargez le papier présenté ici

L'image est issue d'un billet sur le blog de Google posté par Jay Yagnik, Head of Computer Vision Research

 

Jean-Claude MORAND

Aucun commentaire:

(C) Jean-Claude MORAND - 2004-2011 - Cyberstrat (tm) est une marque déposée par Jean-Claude Morand