Nous évoquions hier le fait que nous sommes surveillés en permanence, par divers canaux. L’un de ces canaux repose sur les objets connectés intelligents qui ont envahi la vie domestique. Les aspirateurs autonomes d’iRobot n’ont a priori pas vocation à collecter autre chose que la poussière de votre logement. Et pourtant : plusieurs images capturées par des versions de développement d’un nouveau modèle d’aspirateur se sont retrouvées sur Internet, ce qui suscite de nombreuses interrogations quant à la façon dont iRobot gère ses données.

Les images en question ont été prises par des versions de développement de l’aspirateur robot Roomba J7 d’iRobot. Elles ont été envoyées à Scale AI, une startup qui engage des travailleurs dans le monde entier pour étiqueter des données audio, photo et vidéo, qui sont ensuite utilisées pour entraîner l’intelligence artificielle intégrée aux robots de la société. En 2020, certains de ces travailleurs indépendants ont partagé quelques images sur des groupes privés en ligne (Facebook, Discord et autres).

Bien que le stockage et les contrôles d’accès à ces données soient généralement plus stricts, les journalistes de MIT Technology Review ont réussi à obtenir une quinzaine de captures d’écran de ces photos privées, qui avaient été publiées sur des groupes de réseaux sociaux restreints. Si la plupart ne montrent que des scènes domestiques banales, prises depuis le sol, certaines sont plutôt intimes (l’une montre tout de même une femme assise sur les toilettes…). On y voit également un enfant allongé au sol, fixant l’aspirateur, et de nombreux détails des logements concernés (meubles, objets, décoration, etc.). Certaines de ces images sont étiquetées (placard, chaise, étagère, lampe, table, etc.).

Toute une chaîne d’approvisionnement en données

iRobot — en cours d’acquisition par Amazon pour 1,7 milliard de dollars — a confirmé que ces images avaient été capturées par ses aspirateurs Roomba en 2020. Elles ont été transmises aux employés chargés de les annoter, qui avaient pour consigne de « supprimer tout ce qu’ils jugeaient sensible de tout espace dans lequel le robot opère, y compris les enfants », ajoute la société.

Toutes les images provenaient de modèles en développement, dont les améliorations matérielles et logicielles n’ont jamais été intégrées aux robots disponibles à l’achat, selon les dires de la société. Les appareils concernés étaient étiquetés avec un autocollant vert vif indiquant « enregistrement vidéo en cours ». En d’autres termes, le fabricant affirme que les personnes qui apparaissent sur les photos et vidéos (les « collecteurs de données », qui sont rémunérés en échange de leur contribution) avaient nécessairement accepté que leur robot Roomba les surveille.

James Baussmann, porte-parole d’iRobot, a déclaré dans un courriel que la société avait « pris toutes les précautions nécessaires pour s’assurer que les données personnelles sont traitées en toute sécurité et conformément à la loi applicable » et que les captures d’écran obtenues par MIT Technology Review sont une « violation d’un accord de non-divulgation écrit entre iRobot et un fournisseur de services d’annotation d’images ».

MIT Technology Review souligne toutefois qu’iRobot a refusé de les laisser consulter les accords de consentement des collecteurs de données et n’a pas souhaité les mettre en relation avec les employés, avec lesquels les journalistes auraient souhaité discuter de la compréhension des conditions. Depuis, iRobot aurait mis fin à sa relation avec le fournisseur de services qui a divulgué ces images et aurait pris des mesures pour empêcher d’autres fuites de données similaires à l’avenir, précise le magazine.

Ces images « témoignent de la pratique répandue et croissante du partage de données potentiellement sensibles pour l’entraînement d’algorithmes » et « révèlent toute une chaîne d’approvisionnement en données — et de nouveaux points desquels des informations personnelles pourraient fuiter — dont peu de consommateurs ont conscience », souligne le magazine du MIT.

Comme le souligne Justin Brookman — directeur de la politique technologique chez Consumer Reports et ancien directeur de l’Office of Technology Research and Investigation de la Federal Trade Commission — les collecteurs de données ne s’imaginaient sûrement pas que de vrais humains passeraient en revue les photos pour les annoter. Selon iRobot, le formulaire de consentement indiquait que des « fournisseurs de services » le feraient.

Collecter un maximum de données pour modéliser un environnement complexe

Dès lors qu’un objet utilise l’intelligence artificielle, son développement nécessite énormément de données. L’apprentissage automatique via lequel est formée cette intelligence requiert le plus de données possible, pour entraîner l’algorithme à reconnaître des modèles. Et plus ces données sont proches de la réalité, mieux sera formée l’IA. Les données provenant d’environnement réels — comme ici, l’intérieur de logements — sont donc très précieuses. Et bien souvent, nous donnons notre accord — plus ou moins éclairé — pour que nos données soient collectées depuis nos appareils connectés, puis analysées.

Les aspirateurs robots sont aujourd’hui dotés de capteurs puissants. Les robots de la série Roomba J7, en particulier, sont équipés de caméras avancées et d’intelligence artificielle, qui assurent une navigation et un nettoyage optimaux. Nous sommes désormais bien loin du tout premier modèle d’aspirateur robot — le Trilobite d’Electrolux, commercialisé en 2001 — qui n’intégrait que des capteurs à ultrasons, des capteurs de chocs et des capteurs de falaise.

Les appareils haut de gamme sont en outre dotés de la vision par ordinateur. Dès 2015, le Roomba 980, était capable de cartographier une maison, d’adapter sa stratégie de nettoyage en fonction de la taille de la pièce et d’identifier les obstacles de base à éviter. Mais pour que cette vision fonctionne au mieux, les fabricants doivent l’entraîner sur des ensembles de données de haute qualité et diversifiés. Or, l’environnement domestique est particulièrement complexe ; l’intérieur de chaque maison est très différent, rien n’est standardisé, de surcroît d’un pays à l’autre.

C’est pourquoi iRobot, comme les autres fabricants, a besoin d’un maximum d’images et de vidéos provenant de l’intérieur des foyers. Outre les employés d’iRobot eux-mêmes, et des volontaires recrutés par des fournisseurs de données tiers, la société a également commencé à offrir aux consommateurs la possibilité de contribuer aux données d’entraînement via son application, qui permet d’envoyer des images spécifiques d’obstacles aux serveurs de l’entreprise afin d’améliorer ses algorithmes. Un représentant de la société a cependant déclaré au MIT Technology Review que ces images n’ont pas encore été utilisées pour former des algorithmes.

Les appareils et les applications collectent de plus en plus d’informations personnelles. Et les entreprises qui vendent ces produits rédigent leurs politiques de confidentialité dans des termes parfois vagues et ambigus. « Lorsqu’une entreprise dit qu’elle ne vendra jamais vos données, cela ne signifie pas qu’elle ne les utilisera pas ou ne les partagera pas avec d’autres pour analyse », note MIT Technology Review. Les 12 fabricants de robots aspirateurs considérés dans cette enquête permettent tous l’utilisation des données dans le but « d’améliorer les produits et services » — une formulation qui ouvre finalement la voie à beaucoup de choses.

