ChatGPT, Dall-E, Midjourney, Gemini (anciennement Google Bard), … toutes ces IA génératives n’auraient pas existé sans avoir été formées avec des données textuelles, visuelles, ou sonores. Mais ces données ont-elles été utilisées légalement ? Afin de réglementer la pratique, un projet de loi a récemment été proposé en Californie visant à contraindre les sociétés derrière ces modèles de révéler les données exactes utilisées, en particulier celles protégées par le droit d’auteur.
En parallèle de leur montée en puissance, les entreprises d’IA sont confrontées à des problèmes d’éthique. Depuis leurs débuts, elles sont accusées d’avoir exploité des données protégées par le droit d’auteur pour l’entraînement de leurs modèles sans autorisation. À défaut de règles strictes régissant ces nouvelles technologies d’IA, ces sociétés n’ont pas toujours travaillé en toute transparence.
Cela a été une véritable source de tensions entre les entreprises et de nombreux créateurs et artistes professionnels (dessinateurs, écrivains, chanteurs, etc.). Lors du Congrès américain de ce mardi, un nouveau projet de loi a donc été présenté. Si elle est adoptée, cette nouvelle réglementation imposera aux entreprises de divulguer toutes les œuvres protégées par le droit d’auteur qu’elles utilisent pour entraîner leurs modèles. Cette proposition de loi cherche à réglementer la manière dont ces œuvres sont utilisées dans le développement de l’IA générative.
Une loi sur la divulgation des droits d’auteur en matière d’IA générative
C’est Adam Schiff, membre du Congrès américain et président du Comité du renseignement de la Chambre des représentants, qui a introduit ce projet de loi, portant le nom de « Generative AI Copyright Disclosure Act » (ou Loi sur la divulgation des droits d’auteur en matière d’IA générative). Elle vise à contraindre les entreprises d’IA de soumettre une liste de toutes les œuvres protégées par le droit d’auteur qu’elles ont utilisées pour l’entraînement de leurs modèles au registre des droits d’auteur. Cette soumission devrait être faite au moins 30 jours avant le lancement public de l’outil. Le non-respect de la règle est passible d’amende.
Le projet de loi a bénéficié du soutien de différentes organisations de l’industrie du divertissement. Ces entités estiment que la protection de la propriété intellectuelle est essentielle à la prospérité et à la survie de l’industrie de la création. Le directeur général national et négociateur en chef de SAG-AFTRA (un syndicat professionnel américain représentant plus de 160 000 acteurs, figurants, et professionnels des médias du monde entier), Duncan Crabtree-Ireland, a affirmé dans un communiqué : « Tout ce qui est généré par l’IA provient en fin de compte d’une source créative humaine, … La propriété intellectuelle doit être protégée ».
La réaction des entreprises d’IA
Il est à savoir que le projet de loi est proposé à un moment où certaines entreprises d’IA font face à des actions en justice. La grande majorité des plaintes proviennent de créateurs qui réclament leur dû à ces sociétés, qui prospèrent en partie grâce à leurs œuvres. À travers des lettres ouvertes, dont une ayant récolté plus de 10 000 signatures, ces professionnels s’unissent pour se dresser contre un nouvel ennemi commun.
De leur côté, les entreprises ne peuvent qu’affronter la situation en se préparant à faire face aux procès, qui auront lieu bientôt. Ces enseignes, dont OpenAI et Midjourney, contestent les allégations en affirmant que leur démarche est couverte par « l’utilisation équitable ». Cette doctrine permet juridiquement d’utiliser, dans certaines conditions, les œuvres protégées par le droit d’auteur sans besoin de licence ou de permission.