Tuesday, March 20, 2012

Evolution de google : recherche plus intelligente



«Pour l'instant, notre compréhension des données est très limitée.» La confession vient d'Amit Singhal en personne, l'un des gourous de la recherche chez Google. Il l'explique jeudi dans un billet sur Google+, «si vous nous demandez les dix lacs les plus profonds aux Etats-Unis, nous vous donnerons des résultats assez précis basés sur ces mots clés, mais cela ne veut pas dire que nous comprenons ce qu'est la profondeur ou ce qu'est un lac.»

Cela pourrait changer. Selon le Wall Street Journal, Google prépare la mise-à-jour la plus ambitieuse de ses algorithmes, avec davantage de résultats directs (et plus uniquement des simples liens), ainsi qu'une meilleure compréhension des données via l'analyse sémantique.

Une évolution progressive

L'article du WSJ adopte un ton sensationnaliste. Malgré tout, on devrait plus assister à une évolution progressive qu'à une révolution brutale. «Nous avançons à pas de bébé (…) la route sera longue», précise Singhal.

De fait, Google s'est déjà engagé sur ce chemin depuis de nombreuses années. Quand on tape le nom d'une salle de cinéma, le moteur retourne en tête les prochaines séances. Avec le mot clé «Montpellier» ou «Lakers», on a droit au résultat de la dernière rencontre et au calendrier des prochains matches. Il existe de nombreux exemples de résultats directs (heure, cours de Bourse etc). «Quand es né Alfred Hitchcock?» (requête en anglais). «Meilleure estimation, 13 août 1899, cité par huit sources», répond Google.

En face, Microsoft a fait des résultats directs le cœur de sa campagne marketing, baptisant Bing «un moteur de décision» et pas «un moteur de recherche» et expliquant que les utilisateurs ne voulaient pas que «dix liens bleus». Siri et le moteur Wolfram Alpha décortiquent également le langage et analysent le rapport entre les mots pour tenter de comprendre les questions et offrir des réponses factuelles, tout comme le fait –à un autre niveau– le superordinateur Watson d'IBM.

Base de connaissance

Pour véritablement progresser, il faut basculer d'une base de données faite de simple chaîne de caractères à une base de connaissance organisée, avec des types bien définis et des liens logiques entre chaque (un peu à l'image de la classification des espèces animales et végétales).

Pour cela, Google a notamment acheté l'entreprise Metaweb Technologies, en 2010. De 12 millions d'entrées, la base a été étendue à plus de 200 millions (films, chansons, célébrités etc.). Des standards sémantiques ont été mis en place par la W3C et l'organisation qui fait autorité sur le Web dit travailler «étroitement» avec Google, Microsoft et Yahoo.

Source : 20minutes

No comments: