De nombreux moteurs de recherche ont commencé à intégrer l’intelligence artificielle pour améliorer la pertinence de leurs résultats. Un moteur de recherche d’un nouveau genre baptisé Exa Websets, suit également cette tendance. À la différence de ses concurrents cependant, ce dernier exploite l’IA d’une manière bien différente pour des résultats plus précis que jamais.
Le paysage numérique s’enrichit chaque jour de nouveaux sites, atteignant début 2024 près de 1,98 milliard d’adresses en ligne. Cette richesse, si vertigineuse qu’elle en devient chaotique, rend l’accès à des informations spécifiques souvent laborieux. C’est ce défi qu’entend relever Exa, une entreprise technologique qui promet de transformer l’Internet en une base de données structurée et accessible, grâce à son moteur de recherche innovant Exa Websets, officiellement dévoilé la semaine dernière.
Déjà expérimenté par certaines entreprises, Exa Websets vise à optimiser l’accès aux données complexes pour les professionnels en quête de résultats précis. Selon Will Bryk, PDG d’Exa, interviewé par le MIT Technology Review, cet outil surpasse les moteurs conventionnels en répondant à des requêtes d’une complexité inédite. Il ne se contente pas de trouver des mots-clés, mais livre des réponses taillées sur mesure pour les besoins des utilisateurs.
Quelles différences avec Google ?
Le processus de recherche de Google repose sur un système de classement basé principalement sur des mots-clés. L’outil associe, entre autres, les requêtes des utilisateurs aux termes présents dans les pages web. Cependant, ce mécanisme peut parfois rediriger vers des informations peu pertinentes. Par exemple, en réponse à une recherche, Google peut afficher des pages contenant simplement les mots-clés recherchés.
À l’inverse, Websets vise à fournir des résultats plus précis et directs. Comme l’explique le PDG d’Exa, si un utilisateur recherche par exemple des magasins de matériel technologique, le moteur présente directement une liste de ces boutiques. En comparaison, Google pourrait afficher une variété de contenus moins spécifiques, tels que des articles de blog ou des pages de vente — des liens dont l’utilisateur n’a pas forcément besoin.
En outre, Bryk précise également que Websets est capable de gérer des requêtes extrêmement longues et détaillées. Dans une vidéo de démonstration, il a saisi : « tous les doctorants qui ont travaillé sur des produits pour développeurs, diplômés d’une université de premier plan, et qui tiennent un blog ». En réponse, l’outil a produit une longue liste de noms, avec des liens menant principalement vers des profils LinkedIn.
Des embeddings…
Pour développer cette capacité, l’entreprise a mis en œuvre une technique basée sur l’IA qui structure les contenus du web. « Nous avons entraîné un système d’IA pour organiser tout le web par sens », explique Will Bryk dans la vidéo de démonstration. La méthode est appelée « embeddings », et c’est la première fois qu’elle est utilisée à une échelle aussi vaste, compte tenu de l’immensité des informations à traiter.
Les embeddings, pour simplifier, sont une technique permettant de rassembler des données dans différentes catégories. La méthode consiste à encoder les informations des pages web dans un format numérique qui reflète le sens des mots et des phrases. Les termes aux significations proches sont transformés en valeurs proches les uns des autres. Cela permet au moteur de recherche de puiser dans des données organisées pour afficher des résultats contextuellement pertinents, bien au-delà de la simple correspondance de mots-clés.
Cependant, Exa Websets n’est pas encore disponible au grand public. Les intéressés doivent s’inscrire sur une liste d’attente, car le système est toujours en développement. Par ailleurs, selon un CEO d’une entreprise technologique également interviewé par le MIT Technology Review, les embeddings pourraient entraîner une perte d’informations. Néanmoins, Bryk assure que son équipe a fait en sorte de combler ces lacunes, afin que la méthode atteigne son plein potentiel.
Vidéo de présentation d’Exa Websets (© YouTube/Exa) :