Le deepfake, ou hypertrucage, est une technique qui consiste à superposer des fichiers audio et vidéo sur d’autres fichiers (de manière à changer le visage d’une personne par exemple, ou lui faire prononcer un autre texte). Cette méthode, qui repose sur l’intelligence artificielle, est généralement utilisée pour créer des vidéos comiques ou malveillantes. Ici, il s’agit d’utiliser le visage d’une personne avec son consentement, pour réaliser des vidéos promotionnelles ou éducatives pour le compte d’organisations du monde entier.
La société Hour One propose à ses clients du contenu vidéo réalisé entièrement par une IA, sur la base d’images d’une personne réelle — qui aura donc au préalable cédé les droits d’utilisation de son image. C’est ce qu’a fait Liri, une jeune israélienne de 23 ans : « C’est vraiment un peu étrange de penser que mon visage peut apparaître dans des vidéos ou des publicités pour différentes entreprises », dit-elle.
Pour créer un « personnage », Hour One filme une personne parlant et affichant diverses expressions faciales, avec une caméra 4K haute résolution, devant un écran vert. C’est tout ce qui est demandé au candidat ; une IA se charge ensuite de générer une quantité infinie de séquences de cette même personne, disant toute sorte de texte, dans n’importe quelle langue. La société promet ainsi des vidéos « plus personnelles, plus engagées et plus efficaces ».
Une large variété de profils pour tous les usages
Pas besoin d’être un acteur professionnel pour proposer son image, tout le monde peut postuler ! Hour One filtre cependant les candidats de manière à avoir un catalogue aussi varié que possible ; la société vise un large échantillon de personnages qui reflètent l’âge, le sexe et l’origine raciale des personnes du monde réel, explique Natalie Monbiot, responsable de la stratégie de l’entreprise. La société dispose actuellement d’une centaine de profils — environ 80% ont moins de 50 ans, 70% sont des femmes et 25% sont blancs.
Et le catalogue grossit chaque semaine, car ce « rôle » atypique fait a priori beaucoup d’envieux : « Nous avons une file d’attente de personnes qui meurent d’envie de devenir ces personnages », confirme Natalie Monbiot. Et pour cause, cela peut être un complément de revenus intéressant : chaque personne ayant cédé ses droits à l’image reçoit un micropaiement chaque fois qu’un client choisit son visage pour créer une vidéo. Monbiot n’a pas communiqué la rémunération exacte, si ce n’est qu’il s’agit d’un chiffre en dollars et non en cents.
Côté client, rien de plus simple : il suffit de sélectionner le personnage de son choix dans le catalogue, de choisir une voix et une langue, un décor, d’ajouter son logo, d’uploader le texte, puis de récupérer la vidéo résultante, générée automatiquement par intelligence artificielle. Deux niveaux de qualité sont proposés : le service le plus rapide utilise un logiciel de synthèse vocale pour générer des voix synthétiques, qui sont synchronisées avec les mouvements de la bouche et les expressions faciales des personnages. Le service premium offre quant à lui un flux audio enregistré par des comédiens professionnels (bien entendu, ces voix sont également adaptées aux mouvements du personnage).
Qui sont les clients de Hour One ? Le site officiel de la société évoque « un grand nombre de secteurs verticaux », parmi lesquels l’immobilier, l’e-learning, les ressources humaines, le commerce électronique, etc. C’est ainsi que sont générées des annonces immobilières agrémentées d’un agent immobilier virtuel, divers cours en ligne dirigés par des enseignants virtuels, des publicités pour des produits commentés par de faux présentateurs, etc. Pas de location de studio ni de matériel, pas d’acteurs ni d’équipe de tournage à rémunérer… Pour les entreprises, c’est surtout l’occasion de générer de nombreux contenus vidéos à moindres frais.
« Pas besoin de perdre son temps à filmer »
L’un des principaux clients de Hour One est Berlitz, une école de langues internationale, qui propose des cours en vidéo dirigés par des enseignants dans des dizaines de langues. Berlitz souhaitait augmenter le nombre de ses vidéos, avec de vrais acteurs, ce qui impliquait de créer la même configuration de tournage, avec le même acteur, autant de fois que nécessaire — une tâche quelque peu laborieuse lorsqu’il s’agit de milliers de vidéos. Hour One lui permet désormais de générer des centaines de vidéos en quelques minutes. « Un être humain n’a pas besoin de perdre son temps à filmer », souligne Montbiot.
Mais, comme à chaque fois qu’une IA remplace le travail d’un être humain, se pose la question des implications à long terme sur le travail en question. « L’automatisation n’élimine pas toujours entièrement les rôles humains, mais elle modifie ces rôles d’une manière qui affecte la capacité des gens à gagner un salaire équitable ou à transformer un emploi en une carrière à long terme », explique Jessie Hammerling du Center for Labor Research and Education de l’Université de Californie à Berkeley, qui étudie l’impact des nouvelles technologies sur le travail.
Selon SAG-AFTRA, un syndicat d’artistes américains du cinéma, de la télévision et de la radio, de nombreux acteurs font aujourd’hui du travail de promotion et de marketing pour des clients comme ceux qui travaillent actuellement avec Hour One. Ainsi, chaque vidéo générée automatiquement par Hour One est une opportunité de travail en moins pour les vrais acteurs. Le syndicat souligne par ailleurs le risque que le visage d’une personne soit utilisé pour un contenu auquel elle n’adhère pas du tout, ou qui peut entrer en conflit avec d’autres missions professionnelles.
Sur ce point, Hour One dispose en effet de tous les droits, mais précise qu’elle fait preuve de transparence (chaque vidéo est estampillée d’une mention précisant qu’elle a été générée par ordinateur) et que l’utilisation de l’image d’une personne se limite « à un contenu légal et sûr ». « Nous sommes assez conservateurs quant aux types d’entreprises avec lesquelles nous travaillons », conclut Monbiot.