Ces derniers temps, les intelligences artificielles capables de générer des images à partir de requêtes textuelles font beaucoup parler d’elles. Cette fois, c’est à un tout autre domaine artistique auquel s’attaque le géant Google. L’entreprise travaille sur une IA qui compose de la musique à partir de descriptions : MusicLM. Elle n’a toutefois pas l’intention de la rendre accessible pour le moment.
« La bande sonore principale d’un jeu d’arcade. Elle est rythmée et entraînante, avec un riff de guitare électrique accrocheur. La musique est répétitive et facile à mémoriser, mais avec des sons inattendus, comme des coups de cymbale ou des roulements de tambour » : c’est à partir de ce type de description que MusicLM, l’intelligence artificielle développée par Google, compose des musiques.
Quelques résultats de ces requêtes, publiés sur une page dédiée, laissent songeurs… Malgré le degré de subjectivité que supposent les descriptions, elles semblent assez bien prises en compte par MusicLM. Les musiques créées vont jusqu’à 5 minutes, tout en gardant une certaine cohérence au fil du temps. « Transformer une simple description textuelle en une séquence audio riche, dotée d’une structure à long terme (…), reste un défi », souligne l’entreprise dans l’article rédigé par ses scientifiques, publié sur arXiv dans l’attente d’une relecture par des pairs.
Un défi qu’auraient eu du mal à relever certaines IA du même type qui ont précédé MusicLM. Au-delà de la description par texte, il est possible d’ajouter une mélodie : sifflotée, par exemple, qui s’ajoute aux données prises en compte par l’IA. Bien entendu, l’IA présente tout de même quelques points faibles : certains échantillons montrent des distorsions. De manière générale, MusicLM n’est pas non plus une experte de la voix : les mélodies chantées le sont d’ailleurs dans un simili de langage qui ne présente pas de sens particulier.
Pour parvenir à ce résultat, Google a nourri son IA de données. De fait, la plupart des « intelligences artificielles » existantes à ce jour sont en réalité ce qu’on devrait appeler plus justement des programmes « d’apprentissage automatique ». Le principe est d’entraîner ces programmes à accomplir leur tâche en leur fournissant un grand nombre de données pertinentes. Les IA les analysent alors, et en extraient des connexions logiques.
Elles deviennent de plus en plus précises à mesure qu’elles s’entraînent sur de la donnée. En l’occurrence, MusicLM a été entraînée à partir de 280 000 heures de musique, soit 5 millions de clips audio. Les scientifiques de Google ont également utilisé un set de 5500 musiques associées à des descriptions textuelles réalisées par des musiciens professionnels. Une base de données intitulée MusicCaps, que l’entreprise a décidé de laisser en libre accès pour de futures recherches sur des sujets similaires.
Des questionnements éthiques
Les scientifiques de Google ne s’en cachent pas : leurs travaux soulèvent des questionnements éthiques : « Nous reconnaissons les risques associés à la génération de musique, en particulier le détournement potentiel du contenu créatif. Nous insistons fortement sur la nécessité de poursuivre les travaux futurs pour aborder ces risques associés à la génération de musique – nous n’avons pas l’intention de publier des modèles à ce stade », rassurent-ils.
Il faut dire que récemment, les intelligences artificielles capables de créer des œuvres artistiques à partir de simples requêtes écrites font des vagues dans la communauté artistique. Une plainte collective a même été déposée contre plusieurs entreprises qui avaient utilisé StableDiffusion, une IA entraînée à partir d’œuvres récupérées sur internet sans le consentement de leurs créateurs. Les chercheurs de Google semblent s’être montrés plus prudents. La base de données utilisée pour entraîner MusicLM est Free Music Archive, une base de données en accès libre, composée de musique accessible sous licence Creative Commons. Il faut noter que même si cette licence permet un partage et une utilisation plus libre des œuvres, elle protège tout de même juridiquement les droits d’auteur.
Or, les scientifiques de Google ont pu constater que quelque 1% des créations de leur IA n’étaient autres que des copies des données utilisées pour l’entraînement. Sans doute est-ce là l’une des raisons pour lesquelles l’IA ne sera pas lâchée telle quelle dans la nature.