Quoi de plus fastidieux que se sentir obligé de lire les longues et ennuyeuses « conditions générales » (CG) avant de faire un achat, ou pour tout autre contrat électronique d’un site web ou d’une application ? Dans ces moments, notre cerveau nous dit d’une part de les lire rigoureusement afin de ne pas risquer de nous faire duper, et d’une autre, de « scroller » rapidement jusqu’à voir apparaître le bouton « Accepter ». Résultat : on finit souvent par les lire en diagonale, ce qui n’est pas très utile… Mais des chercheurs pensent enfin avoir la solution : une intelligence artificielle capable de les déchiffrer et résumer rapidement, afin que vous puissiez rapidement prendre connaissance des points importants.
Les textes en question sont réputés pour leur complexité et la difficulté d’en faire rapidement un résumé, sans compter que certains groupes d’utilisateurs ne disposent pas de toutes les connaissances juridiques pour comprendre précisément l’étendue de certains passages.
Pour remédier à cela, une équipe de chercheurs de l’université Carnegie Mellon en Pennsylvanie, dirigée par Jason Hong, a créé un modèle d’apprentissage automatique pour mettre en évidence les clauses importantes auxquelles les utilisateurs pourraient vouloir prêter attention. Les détails sont disponibles sur le serveur de préimpression arXiv.
Définir les clauses importantes
Pour commencer, les scientifiques ont basé leur modèle sur 1551 déclarations de CGV provenant de 27 sites d’achat, puis ont divisé les documents en plus de 200 000 paires de phrases. Ils ont alors demandé à des personnes d’étudier une paire de phrases et de classer celle qui leur semblait la plus importante. Ils ont ensuite utilisé les résultats pour classer les déclarations dans l’ensemble du document par ordre d’importance.
Les personnes interrogées ont jugé importants les termes définissant les droits des consommateurs en matière de retour, de réparation ou de remplacement des articles, ainsi que la possibilité d’obtenir des remboursements ou d’acheter des articles à crédit. Les frais éventuels ont également été jugés utiles.
Les chercheurs ont ensuite soumis cette liste à leur modèle d’apprentissage automatique, l’entraînant à rechercher les clauses importantes. L’IA a réussi à mettre en évidence les déclarations importantes dans les nouveaux textes de CG qui lui ont été remis avec une précision de 92% (par rapport aux humains), bien qu’elle ait trébuché sur les phrases contenant des négations, telles que le mot « pas ».
Vers une application capable de relever les points clés des CG à notre place ?
L’étude présente un modèle d’IA qui fait ce que beaucoup de systèmes automatisés ont essayé de faire au fil des ans, à savoir ‘clarifier’ les choses pour les humains en matière de CG, mais rendre ces textes plus lisibles ne résout pas le problème principal, selon certains experts. En effet, les textes de CG sont tellement « dictatoriaux » que le consentement significatif en ligne dans le contexte du consommateur n’existe pas vraiment…
« Nous prévoyons d’utiliser notre flux de travail et notre modèle pour mettre en évidence, de manière efficace et fiable, les CG importantes sur les sites web à grande échelle, afin d’améliorer la sensibilisation des consommateurs », concluent les chercheurs dans leur document. À l’avenir, il est donc possible que cette étude donne naissance à une extension pour navigateur ou une application permettant de résumer rapidement les CG rencontrées sur le web.