Bien qu’elle réalise désormais des prouesses en tout genre, l’IA est souvent critiquée pour son incapacité à produire du contenu authentique. La technologie, même si elle peut se montrer créative, tend à surjouer, rendant le caractère « artificiel » des textes, images ou musiques qu’elle produit parfois trop évident. Parfois, il arrive par contre que l’IA générative dévie ou produise des résultats hors contexte. Dans une chanson générée par IA récemment partagée sur Reddit par exemple, d’effrayants pleurs ont été intégrés alors qu’ils n’avaient pas été demandés par l’utilisateur. Les utilisateurs se demandent donc s’il s’agit d’une faille ou d’une tentative très maladroite de l’IA d’exprimer des émotions.
L’intelligence artificielle rend peu à peu la production musicale à la portée de tous. De plus en plus accessible et facile d’utilisation, cette technologie voit son nombre d’utilisateurs croître rapidement. Cependant, malgré cette popularité grandissante, les outils de production musicale par IA restent très imparfaits. Bien qu’ils tentent d’imiter les créations humaines, certaines imperfections permettent facilement de distinguer nettement les productions IA de celles réalisées de manière traditionnelle.
Ces différences peuvent se manifester dans la voix du chanteur, l’arrangement musical ou des paroles incohérentes. Certains détails peuvent cependant être difficiles à détecter sans une certaine familiarité avec le monde de la musique. Pourtant, dans une publication récente sur Reddit, un utilisateur a partagé une erreur flagrante : des sanglots très distincts ont mystérieusement été intégrés à un morceau. C’est pour le moins surprenant étant donné que le prompt utilisé (requête de l’utilisateur) ne spécifiait aucunement une telle intégration, ni même quelque chose s’en rapprochant.
Des sons étranges dans les chansons générées par IA
Le générateur musical en question est Suno AI, un outil d’IA générative produisant de la musique de toute pièce par le biais de simples invites textuelles et intégrant plusieurs modèles. « La chanson s’est arrêtée, puis il n’y a eu que des sanglots », a précisé l’utilisateur Reddit, accompagnant son message d’une capture d’écran vidéo de 23 secondes révélant les étranges sanglots. « Quelqu’un d’autre a-t-il eu des créations bizarres ? », ajoute-t-il, une question à laquelle de nombreux autres utilisateurs de l’outil ont répondu par l’affirmative.
En effet, plusieurs utilisateurs ont partagé des expériences similaires dans les commentaires, mentionnant des résultats incluant des cris d’horreur, des rires d’enfants ou des voix instables. Bien que les témoignages varient, ils convergent tous vers un même problème : la présence de sons étranges et inattendus, parfois terrifiants.
Une mauvaise interprétation des prompts ?
Les utilisateurs suggèrent que ces bruits pourraient résulter d’une mauvaise interprétation des invites par l’IA. Par exemple, si un prompt contient des termes liés aux émotions, le logiciel pourrait les prendre au pied de la lettre et insérer des passages de « surexpression ». Dans le cas présent, l’utilisateur affirme avoir utilisé le terme « psyché » dans son invite, ce qui pourrait expliquer les sanglots inattendus.
Une autre hypothèse est que le logiciel ajoute automatiquement des « outros » vocaux, des éléments qui concluent une piste (à l’inverse des « intros » qui l’introduisent). Quoi qu’il en soit, l’entreprise derrière l’outil aurait été informée de ce problème et aurait déjà supprimé certaines chansons suite aux signalements de ses clients.
Un bouleversement majeur auquel l’industrie musicale ne s’était pas préparée est sans doute l’arrivée en force de l’IA. Malgré ses imperfections, la technologie est sur le point d’envahir et de transformer le secteur. De plus, avec l’évolution ultrarapide des outils, les utilisateurs peuvent s’attendre à des résultats de plus en plus aboutis.
Concernant Suno AI, le logiciel semble prometteur, au point d’être surnommé par certains le « ChatGPT de la musique ». La correction des défauts actuels pourrait solidifier sa position sur le marché. Pour notre part, nous l’avons testé afin de mieux comprendre cet engouement.
Nous avons ainsi créé une chanson avec l’invite « Une chanson en français qui parle du webzine de vulgarisation scientifique « Trust My Science », chanté par une voix féminine très douce. Il faut mettre en avant que c’est un journal 100 % indépendant ». Les deux résultats proposés (ci-dessous), bien que les paroles soient un peu étranges par moments, et que le goût global soit un peu artificiel, restent absolument bluffants.
Résultat 1 (calme) :
Résultat 2 (plus mouvementé) :