Microsoft probablement un peu désappointé par son échec face à Yahoo continue toutefois à avancer afin de faire progresser son moteur de recherche, pour l’instant plutôt petit dernier du triptique GYM (Google, Yahoo, Microsoft).
Aux dernières nouvelles, Microsoft se pencherait sur le rachat de Powerset, une jeune pousse californienne dont la technologie repose sur de solides bases sémantiques. Créée en 2005, Powerset n’avait jusqu’à présent pas montré sa technologie au grand public, préférant en réserver la primeur aux investisseurs desquels elle a obtenu le soutien (Foundation Capital, Founders Fund et Paperboy Ventures).
Il y a 2 mois à peu près, Powerset a mis en ligne la première démo de sa technologie. Il s’agit d’un moteur de recherche sémantique donc, permettant d’interroger l’intégralité des articles Wikipedia.
La technologie est vraiment impressionnante et si vous voulez vous en faire une idée je vous conseille de regarder la vidéo ci-après.
Par exemple si vous tapez " Nicolas Sarkozy", vous trouverez au tout début des résultats une fiche récapitulative avec sa photo, un bref extrait biographique, date et lieu de naissance, épouse, nationalité, etc. Chacun des items étant relié à la fiche Powerset de réponse correspondant (Carla Bruni par exemple…)
Ce type de rendu de premier niveau représente déjà un gros gain pour celui qui veut avoir accès à l’essentiel de l’information. Ce n’est d’ailleurs pas sans me rappeler le type de service que pouvait proposer à l’époque un moteur de recherche qui n’avait pas fait long feu, Tuna Search et qui proposait une fiche synthétique de résultat, image, actualité et synthèse.
Petite parenthèse
Cette partie s’appuie sur une base de données collaborative que je découvre par la même occasion…Freebase pour l’instant en version alpha.
Freebase qui m’a fait une très bonne impression concernant en tout cas la mise en forme des pages et la structuration du contenu. L’approche de Freebase étant a priori moins rédactionnelle et plus opérationnelle / structurée que Wikipedia ne peut l’être.
En savoir un peu plus sur Freebase
Fin de la parenthèse
Deuxième point : les factz
Ils permettent de lier objet de la recherche / action et items.
Par exemple vous saurez que Sarkozy / led / UMP ou bien encore que Sarkozy / won / election. Et à chaque fois que vous cliquez sur une des liens vous accèderez à plus de détails avec les mots pertinents surlignés.
La partie Factz s’appuie sur Wikipedia.
La dernière partie de la page propose la liste des liens vers les pages Wikipédia correspondant au sujet de recherche.
Mais dans cette liste de résultats, le travail de Powerset ne se limite pas à vous lister les résultats. En cliquant sur l’article en question vous ne serez pas redirigé vers la page originale de Wikipedia mais vers une page de l’article Wikipedia sur laquelle Powerset colle sa couche applicative.
Vous pourrez ainsi explorer les faiz (<- Ce n’est pas une faute d’orthographe…) (Explore factz) : en gros un nuage de tags interactif, ou encore voir à droite les thématiques / faits principaux dégagés (show factz), ou naviguer à l’intérieur de l’article (show outline)
Powerset fait donc preuve de qualités sémantiques intéressantes à ce jour (même si je serais curieux de le voir tourner sur un corpus plus déstructuré que Wikipedia / Freebase) et d’une logique de navigation et de restitution des résultats attractive même si des fois cela est un peu trop riche justement…
Source : Net Eco – 27 Juin 2008
Voir aussi Techcrunch