À quoi ressemble réellement l’avenir de l’intelligence artificielle dans la musique ?

À la fin du mois d’avril 2020, une société nommée OpenAI a téléchargé des dizaines de nouveaux morceaux sur SoundCloud, tous intitulés de manière factuelle comme « Hip-hop, dans le style de Nas » ou « Pop, dans le style de Katy Perry ». On vous pardonnera de penser au départ qu’il s’agit de reprises moyennes sur YouTube. Quelques secondes passées à écouter la production gargarisée, les paroles bizarres et les voix sinistres vous feraient définitivement changer d’avis.

Les chansons ont toutes été réalisées à l’aide d’un logiciel d’intelligence artificielle appelé Jukebox, conçu par OpenAI, une organisation de recherche milliardaire à la pointe de la recherche en IA. Jukebox n’est pas votre imitateur d’Elvis standard : Après avoir été entraîné sur 1,2 million de chansons et d’autres données sur les genres et les artistes, le réseau neuronal a appris à produire de la musique originale dans le style étrangement reconnaissable d’artistes célèbres comme Elton John et Rihanna. Il s’agit d’une technologie nouvelle et impressionnante, un modèle informatique qui a compris comment générer de véritables chansons, y compris les voix, en audio brut.

Lorsque la plupart des gens pensent à la musique générée par l’IA, quelque chose comme Jukebox leur vient probablement à l’esprit – une architecture tentaculaire de code qui maîtrise l’art de l’imitation, créant de la musique qui pourrait relancer les carrières d’artistes morts depuis longtemps ou en créer de nouvelles à partir de zéros et de uns. Cette imagerie pourrait expliquer pourquoi, lorsqu’OpenAI a officiellement annoncé l’outil fin avril, les réactions sur Twitter allaient de « C’est un travail incroyable ! » à « C’est à la fois incroyablement cool et profondément maudit », en passant par le pressentiment « Le remplacement de l’intellect humain &la créativité arrive sûrement, brique après brique. »

« Je trouve l' »intelligence artificielle »… un peu obfusquée », déclare Holly Herndon lors d’une récente discussion vidéo depuis son appartement berlinois. Holly Herndon n’est pas étrangère à l’IA (le dernier album de la musicienne électronique et avant-pop, PROTO, a été réalisé avec une IA naissante qu’elle a nommée Spawn), mais elle pense que les implications lourdes du terme – robots dominateurs et obsolescence de l’homme – rendent sa fonction réelle dans la musique mystérieuse. La plupart des créations musicales automatisées passent par l’apprentissage automatique : il s’agit d’entraîner un modèle à analyser des chansons existantes, à identifier des modèles à partir des données et à utiliser ces connaissances pour générer sa propre musique. C’est un processus désormais courant qui n’évoque guère le même drame de science-fiction que l' »IA ».

« L’apprentissage automatique n’a pas l’air aussi sexy , » dit Herndon, « mais il décrit ce qui se passe. Une machine est en train d’apprendre. Et elle apprend de l’intelligence humaine. »

Comme il est actuellement utilisé dans les gros titres et les imaginations dystopiques, « AI » porte en lui un sensationnalisme qui suggère que chaque nouveau développement dans la musique nous rapproche d’un avenir de pop stars robotisées. Mais la réalité de la musique IA est à la fois moins glamour et moins dystopique que cela. D’une part, elle existe déjà, sous diverses formes, supervisée par des personnes aux objectifs variés et, comme le souligne Herndon, elle apprend tranquillement d’elles comment se comporter. Alors que les résultats finaux pourraient être techno-dystopiques, Herndon souligne que rien n’est gravé dans la pierre ; l’avenir de l’IA dans la musique est encore en train de se dessiner, un chemin modelé par la collaboration et les conflits entre un certain nombre de parties prenantes. « Je pense que ce que les gens craignent avec l’IA n’est pas nécessairement la technologie », songe Herndon, mais plutôt « la société infernale que les êtres humains construiraient avec cette technologie. »

Lorsqu’elle est utilisée comme un véhicule pour étendre la créativité humaine, l’IA n’est pas nécessairement une menace. Sur PROTO, un album qui palpite d’expérimentation tout en restant résolument centré sur l’humain, Herndon tisse la production synthétique de Spawn avec un ensemble choral de grande envergure pour créer des moments de profonde émotion. Mélangeant le distinctement humain et le distinctement robotique en un seul, Herndon est à la fois curateur et directeur de l’IA aux côtés des autres membres du groupe ; Spawn fournit des moments de créativité et de musicalité innovante, mais Herndon est celui qui contrôle.

Les musiciens qui expérimentent avec l’IA sont parfois rejetés comme gadgets, malgré les raisons artistiques légitimes de collaborer avec la technologie. Lorsque le groupe DADABOTS, issu d’un hackathon, s’est classé deuxième au concours de chansons d’IA qui a remplacé l’Eurovision cette année, il a utilisé une IA entraînée à partir d’une étude sur l’acapella, la pop et le métal des années 1950, entre autres. D’autres équipes ont produit des chansons avec des machines entraînées sur des sons de la faune australienne et des textes tirés de fils de discussion Reddit. CJ Carr, membre de DADABOTS, explique que l’apprentissage automatique leur permet de transformer des concepts fantastiques et des inspirations farfelues en musique réelle. Avec l’IA, « notre capacité à collecter, produire de la musique et collaborer avec des dizaines ou des centaines d’artistes s’élargit », explique Carr.

Mais cela ne signifie pas que la technologie est loin de créer de la (bonne) musique par elle-même. Zack Zukowski, le compagnon de groupe de Carr, souligne à quel point l’intervention humaine a été essentielle à leur succès à l’Eurovision de l’IA, en disant : « Nous avons traité l’IA comme si elle était un interprète de plus dans notre studio. » Incidemment, l’équipe qui a laissé l’IA prendre les devants a obtenu la dernière place. Même s’il s’agit de la plus grande avancée récente en matière de génération automatique de musique, Jukebox a encore des limites évidentes. Il est clair, dans les premiers échantillons, que l’outil n’a pas encore compris les structures de refrain et qu’il s’oriente souvent vers des cris déformés. Pour l’instant, il n’y a aucune comparaison possible entre la musique produite par l’homme et celle générée par l’IA. Même s’il y en avait une, notre attachement émotionnel aux éléments humains de la musique suggère qu’il est peu probable que nous abandonnions de sitôt la musique faite par des personnes réelles.

« Je pense que ce que les gens craignent avec l’IA n’est pas nécessairement la technologie, mais la société infernale que les êtres humains construiraient avec cette technologie. »

Alors, pourquoi s’embêter avec la musique d’IA si on ne fait que déverser des heures interminables et des milliards de dollars dans une machine qui ne peut que mal imiter ce que les humains ont déjà compris ? La réponse dépend de qui vous demandez. Pour les musiciens expérimentaux, l’IA est un moyen de produire des sons comme on n’en a jamais entendu auparavant. Alors que certaines parties prenantes pourraient être intéressées par le fait de produire des chansons en appuyant sur un bouton, évitant ainsi le coût des redevances des artistes. D’autres sont purement motivés par l’innovation pour l’innovation, incarnant le mantra de Facebook « move fast and break things ». Beaucoup d’autres encore ne sont pas convaincus que l’IA apporte quoi que ce soit de bon à ce qui est largement considéré comme une forme d’art intrinsèquement humaine.

Pour les optimistes, l’IA a le potentiel de s’inscrire dans un récit de démocratisation de la musique. Stephen Phillips, PDG de Popgun, une startup dont les produits comprennent une application que les enfants peuvent utiliser pour créer des chansons avec l’IA, est convaincu que le fait que davantage de personnes puissent expérimenter avec le son ne peut que bénéficier à la musique sur le long terme. « Notre thèse est devenue que la plus grande application de l’IA dans la musique ne sera pas de remplacer les musiciens, mais de faire en sorte que tout le monde se sente musicien », dit Phillips.

Les technologies qui aident plus de gens à se sentir musiciens, peut-être même à changer l’idée de qui compte comme musicien, ont longtemps fait avancer la musique, facilitant la naissance de genres entiers, du hip-hop à la techno. Il convient de noter que ces technologies, largement saluées aujourd’hui comme d’énormes contributions à l’industrie, ont été confrontées à leurs propres réactions à l’époque de leur introduction. Les vocodeurs ont été accusés de corrompre l’intégrité musicale, les boîtes à rythmes ont été déplorées comme un remplacement des batteurs humains, et les synthés ont été dénigrés comme étant sans âme.

Peut-être qu’une partie de la résistance similaire à la musique de l’IA s’estompera à mesure qu’elle fera place à la compréhension des nouvelles possibilités musicales. Même une technologie ancienne comme le piano, souligne Zukowski, « a donné à Mozart la capacité d’avoir des notes calmes et fortes », élargissant notre compréhension de ce que la musique pourrait être.

Pour autant, il serait profondément naïf de suggérer que les humains servent uniquement à bénéficier de cette technologie. Même en tant que personne enthousiaste à l’égard de la musique de l’IA, Herndon est sur la corde raide quant au potentiel sérieux de l’IA de nuire aux artistes mêmes dont elle entraîne les discographies, les musiciens qui ont effectivement fait de la machine ce qu’elle est. Elle a trouvé l’accent mis par Jukebox sur l’imitation alarmant, au point qu’elle a contacté l’équipe d’OpenAI pour lui faire part de ses inquiétudes.  » C’est une approche très autorisée de la personnalité et des données d’autrui « , me dit Herndon,  » de prendre la ressemblance d’un artiste, de s’entraîner là-dessus, puis de publier des choses à l’image de quelqu’un d’autre sans sa permission. « 

Le problème de Herndon avec Jukebox implique une question délicate de propriété intellectuelle qui a empoisonné la musique de l’IA depuis le tout début (ainsi que le sampling avant elle). Bien que le droit à l’utilisation équitable ne soit pas à restreindre à la légère, Herndon souligne que le domaine évolutif du droit de la musique de l’IA devra tenir compte des failles systémiques qui influencent à la fois nos algorithmes et les humains qui les contrôlent. Compte tenu des problèmes de préjugés raciaux dont on a beaucoup parlé dans le domaine de la technologie et de l’histoire bien documentée de l’industrie musicale en matière de sous-paiement des musiciens noirs, la probabilité d’un effet racialisé de la musique d’IA n’est pas négligeable. Herndon craint que la musique d’IA ne produise un effet de « punching down » plutôt que de « punching up », où les grandes entreprises récoltent les bénéfices des lois laxistes sur la propriété intellectuelle tandis que les musiciens indépendants ne sont pas payés et ne sont pas reconnus.

« Toute technologie donne du pouvoir aux gens… et ce pouvoir peut être donné aux artistes. Je prends cette technologie et je la mets dans les mains des producteurs qui ont quelque chose à exprimer. »

Quelque chose de ce genre est peut-être en train de se produire dans les domaines que l’IA a déjà pénétrés. Michael Donaldson, qui possède une société de licences musicales, me dit que dans son secteur, la musique de production – les chansons d’ambiance que les créateurs de contenu utilisent sous licence pour les vidéos, les podcasts et autres médias – est de plus en plus un terrain propice au développement de l’IA. Comme la plupart des musiques de production sont déjà adaptées à des métriques favorables aux créateurs, telles que « happy » ou « corporate », le produit humain est déjà réalisé de manière algorithmique. « Tout ce qui peut être fait selon les spécifications peut éventuellement être fait par un ordinateur », dit Donaldson.

Bien que la musique de production ait tendance à être considérée comme un travail générique et peu créatif, il s’agit néanmoins d’un domaine lucratif qui fournit du travail à de nombreux musiciens professionnels. Mais étant donné la façon dont l’IA génère de la musique de production beaucoup plus rapidement que les humains, et peut apparemment le faire aussi bien, une éventuelle prise de contrôle n’est pas insondable. « Cette industrie est morte », prédit M. Phillips, si l’IA poursuit son emprise. Il n’est pas exagéré d’imaginer que la technologie finisse par s’étendre à d’autres domaines de la création musicale : les musiques de films et les hit-parades.

Mais s’il existe un argument réfutant la possibilité d’une prise de contrôle par l’IA, son principe le plus convaincant pourrait être le suivant : Les humains aiment la musique parce que d’autres humains en font. Notre capacité à entrer en relation les uns avec les autres, à savoir ce qui nous parle dans la musique, est quelque chose que l’IA est loin d’avoir compris. « Elle ne sait pas comment, vous savez, une chanson peut toucher un été donné », explique M. Herndon. « Cela nécessite un cerveau humain et des oreilles. »

Pour l’instant, les artistes qui travaillent avec l’apprentissage automatique choisissent de se concentrer sur la façon dont ils peuvent utiliser cette technologie pour augmenter plutôt que de remplacer leurs propres projets créatifs. Le prochain projet de Herndon implique une sérieuse mise à niveau de Spawn. DADABOTS lance une initiative contre la brutalité policière en utilisant le Jukebox pour générer des centaines de versions de la chanson  » tha Police  » de N.W.A. dans différents genres. Ils sélectionneront les 100 meilleures pour les diffuser gratuitement et organiseront un concours de remix, une protestation musicale destinée à aider ceux qui ont quelque chose à dire à trouver de nouvelles façons de le dire.

« Toute technologie donne du pouvoir aux gens … et ce pouvoir peut être donné aux artistes », dit Carr. « Donc nous le prenons. Je prends cette technologie et je la mets dans les mains de producteurs qui ont quelque chose à exprimer. » Utilisée de cette façon, l’IA permet de nouvelles collaborations et amplifie de nouvelles voix, les choses mêmes qui rendent la musique formidable. Et l’idée de faire une telle chose, d’envoyer un tel message, en premier lieu ? C’est un effort entièrement humain.