Miltä tekoälyn tulevaisuus musiikissa oikeastaan näyttää?

Huhtikuun 2020 lopulla OpenAI-niminen yritys latasi SoundCloudiin kymmeniä uusia kappaleita, jotka kaikki olivat asiallisesti otsikoitu kuten ”Hip-hop, tyyliin Nas” tai ”Pop, tyyliin Katy Perry”. Voisi antaa anteeksi, jos olisi aluksi luullut kappaleita tavallisiksi YouTube-covereiksi. Muutaman sekunnin kuuntelu kurlailevaa tuotantoa, outoja sanoituksia ja aavemaista laulua kuunnellessa muuttaisi varmasti mielesi.

Kappaleet on kaikki tehty Jukebox-nimisellä tekoälyohjelmistolla, jonka on suunnitellut OpenAI, miljardin dollarin tutkimusorganisaatio, joka on johtava tekoälytutkimuksen alalla. Jukebox ei ole tavallinen Elvis-imitaattori: Kun neuroverkko on koulutettu 1,2 miljoonalla kappaleella ja muulla genrejä ja artisteja koskevalla datalla, se on oppinut tuottamaan omaperäistä musiikkia Elton Johnin ja Rihannan kaltaisten tunnettujen artistien tunnistamattomalla tyylillä. Kyseessä on uudenlainen ja vaikuttava teknologia, tietokonemalli, joka on keksinyt, miten tuottaa raakana äänitiedostona todellisia kappaleita, lauluäänet mukaan lukien.

Kun useimmat ihmiset ajattelevat tekoälyn tuottamaa musiikkia, heille tulee luultavasti mieleen jotain Jukeboxin kaltaista – laajalle levittäytynyt koodin arkkitehtuuri, joka hallitsee jäljittelyn taiteen ja luo musiikkia, joka voi elvyttää kauan sitten kuolleiden artistien uran tai luoda nollat ja ykköset uusiksi kappaleiksi. Tämä mielikuva saattaa selittää, miksi kun OpenAI julkisti työkalun virallisesti huhtikuun lopulla, Twitter-reaktiot vaihtelivat ”Tämä on uskomatonta työtä!” ja ”Tämä on sekä uskomattoman siistiä että syvästi kirottua” välillä aina ennakoivaan ”Ihmisälyn korvaaminen & luovuudella on varmasti tulossa, tiili tiilen perään.”

”Minusta ’tekoäly’… on hieman hämäävä ilmaus”, Holly Herndon sanoo hiljattain käymässämme videokeskustelun aikana berliiniläisestä asunnostaan. Tekoäly ei ole vieras (elektronisen ja avant-pop-muusikon viimeisin albumi PROTO on tehty hänen Spawniksi nimeämänsä orastavan tekoälyn kanssa), mutta Herndonin mielestä termin latautuneet implikaatiot – robottiherroista ja ihmisen vanhentumisesta – mystifioivat sen todellisen tehtävän musiikissa. Suurin osa automatisoidusta musiikin luomisesta tapahtuu koneoppimisen avulla: malli koulutetaan analysoimaan olemassa olevia kappaleita, tunnistamaan datasta kuvioita ja käyttämään tätä tietoa oman musiikin luomiseen. Se on nykyään yleinen prosessi, joka tuskin herättää samanlaista scifi-draamaa kuin ”tekoäly”.”

”Koneoppiminen ei kuulosta yhtä seksikkäältä”, Herndon sanoo, ”mutta se kuvaa sitä, mitä tapahtuu”. Kone oppii. Ja se oppii ihmisälyltä.”

Kuten sitä tällä hetkellä käytetään otsikoissa ja dystooppisissa kuvitelmissa, ”tekoäly” kantaa mukanaan sensaatiohakuisuutta, joka antaa ymmärtää, että jokainen uusi musiikin kehitys vie meidät lähemmäs robottipoptähtien tulevaisuutta. Tekoälymusiikin todellisuus ei kuitenkaan ole yhtä hohdokas kuin dystooppinen. Ensinnäkin se on jo täällä – se on olemassa eri tavoin, sitä valvovat ihmiset, joilla on erilaisia päämääriä, ja kuten Herndon huomauttaa, se oppii hiljaa heiltä, miten käyttäytyä. Vaikka lopputulos voisi olla teknodystooppinen, Herndon huomauttaa, että mikään ei ole kiveen hakattua; tekoälyn tulevaisuus musiikissa on vasta hahmottumassa, ja polku muotoutuu useiden eri sidosryhmien välisen yhteistyön ja ristiriitojen kautta. ”Luulen, että ihmiset eivät välttämättä pelkää tekoälyä”, Herndon pohtii, ”vaan pikemminkin sitä helvetillistä yhteiskuntaa, jonka ihmiset rakentaisivat tuon teknologian avulla.”

Kun tekoälyä käytetään ihmisen luovuuden laajentamisen välineenä, se ei välttämättä ole uhka. PROTO-albumilla, joka sykkii kokeiluja mutta pysyy silti vakaasti ihmiskeskeisenä, Herndon punoo Spawnin synteettisen tuotoksen lavean kuorokokoonpanon kanssa luodakseen syvien tunteiden hetkiä. Sekoittamalla selkeästi inhimillisen ja selkeästi robottimaisen yhteen Herndon sekä kuratoi että ohjaa tekoälyä muiden bänditovereiden rinnalla; Spawn tarjoaa luovuuden ja innovatiivisen musikaalisuuden hetkiä, mutta Herndon on se, joka hallitsee.

Tekoälyä kokeilevia muusikoita pidetään toisinaan pelkistettyinä kikkailijoina huolimatta siitä, että tekniikan kanssa tehtävään yhteistyöhön on oikeutetut taiteelliset syyt. Kun hackathon-tiimiksi muuttunut yhtye DADABOTS sijoittui toiseksi tekoälylaulukilpailussa, joka korvasi Euroviisut tänä vuonna, he käyttivät tekoälyä, joka oli koulutettu 1950-luvun acapellaa, poppia, metallia ja muuta sisältävällä kyselyllä. Muut tiimit tuottivat kappaleita koneilla, jotka oli koulutettu Australian villieläinten ääniin ja Reddit-ketjuista poimittuihin teksteihin. DADABOTSin jäsen CJ Carr sanoo, että koneoppimisen avulla he pystyvät pyörittämään fantastisia käsitteitä ja kaukaa haettua inspiraatiota todelliseksi musiikiksi. Tekoälyn avulla ”kykymme kerätä, tuottaa musiikkia ja tehdä yhteistyötä kymmenien tai satojen artistien kanssa laajenee”, Carr sanoo.

Mutta se ei tarkoita, että teknologia olisi lähelläkään (hyvän) musiikin luomista yksinään. Carrin bänditoveri Zack Zukowski korostaa, kuinka ihmisen väliintulo oli ratkaisevaa heidän menestykselleen tekoäly-Euroviisuissa: ”Kohtelimme tekoälyä kuin se olisi vain yksi esiintyjä studiossamme.” Muuten joukkue, joka antoi tekoälyn johtaa, sai viimeisen sijan. Vaikka Jukebox on viime aikojen suurin läpimurto automaattisessa musiikin tuottamisessa, sillä on edelleen selviä rajoituksia. Varhaisissa näytteissä on selvää, että työkalu ei ole vielä selvittänyt kertosäerakenteita ja ajautuu usein vääristyneeseen huutoon. Toistaiseksi ihmisen tekemää musiikkia ja sen tekoälyn luomaa vastinetta ei voi verrata toisiinsa. Vaikka olisikin, emotionaalinen kiintymyksemme musiikin inhimillisiin elementteihin viittaa siihen, ettemme todennäköisesti luopuisi lähiaikoina oikeiden ihmisten tekemästä musiikista.

”Luulen, että tekoälyn kohdalla ihmiset eivät välttämättä pelkää teknologiaa, vaan helvetinmoista yhteiskuntaa, jonka ihmiset rakentaisivat tämän teknologian avulla.”

Miksi siis vaivautua tekoälymusiikin pariin, jos kaadamme loputtomasti tunteja ja miljardeja dollareita koneeseen, joka pystyy vain huonosti matkimaan sitä, minkä ihmiset ovat jo keksineet? No, vastaus riippuu siitä keneltä kysyy. Kokeileville muusikoille tekoäly on keino tehdä ääniä, joita ei ole ennen kuultu. Joitakin sidosryhmiä saattaa kiinnostaa kappaleiden tuottaminen napin painalluksella, jolloin vältytään taiteilijoiden rojalteista aiheutuvilta kustannuksilta. Toisia taas ajaa pelkkä innovointi innovoinnin vuoksi, ja he noudattavat Facebookin mantraa ”move fast and break things”. Monet eivät vieläkään ole vakuuttuneita siitä, että tekoäly tuo mitään hyvää siihen, mitä suurelta osin pidetään synnynnäisesti inhimillisenä taidemuotona.

Optimistien mielestä tekoälyllä on potentiaalia sopia musiikin demokratisoitumisen tarinaan. Stephen Phillips, toimitusjohtaja Popgunissa, startup-yrityksessä, jonka tuotteisiin kuuluu muun muassa sovellus, jolla lapset voivat luoda kappaleita tekoälyn avulla, on vakuuttunut siitä, että se, että yhä useammat ihmiset pystyvät kokeilemaan ääntä, hyödyttää musiikkia pitkällä aikavälillä. ”Teeseistämme on tullut, että tekoälyn suurin sovellus musiikissa ei ole muusikoiden korvaaminen, vaan se saa kaikki tuntemaan itsensä muusikoiksi”, Phillips sanoo.

Teknologiat, jotka auttavat yhä useampia tuntemaan itsensä muusikoiksi ja ehkä jopa muuttavat käsitystä siitä, kuka lasketaan muusikoksi, ovat jo pitkään vieneet musiikkia eteenpäin ja mahdollistaneet kokonaisten genrejen syntymisen hiphopista teknoon. On syytä huomata, että nämä tekniikat, joita nykyään ylistetään suurena panoksena alalle, kohtasivat omat vastareaktionsa käyttöönoton aikaan. Vocodereita syytettiin musiikillisen eheyden turmelemisesta, rumpukoneita paheksuttiin ihmisrumpalien korvaajina ja syntetisaattoreita haukuttiin sieluttomiksi.

Ehkä osa samanlaisesta tekoälymusiikkiin kohdistuvasta vastustuksesta hälvenee, kun se väistyy uusien musiikillisten mahdollisuuksien ymmärtämisen tieltä. Zukowski huomauttaa, että jo varhainen teknologia, kuten piano, ”antoi Mozartille mahdollisuuden hiljaisiin ja koviin nuotteihin”, mikä laajensi käsitystämme siitä, mitä musiikki voi olla.

Olisikin syvästi naiivia väittää, että ihmiset vain hyötyvät tästä teknologiasta. Jopa tekoälymusiikista innostuneena Herndon on hermostunut tekoälyn vakavasta potentiaalista vahingoittaa juuri niitä taiteilijoita, joiden diskografioita se harjoittelee, muusikoita, jotka tekivät koneesta käytännössä sen, mikä se on. Hän piti Jukeboxin keskittymistä imitointiin hälyttävänä siinä määrin, että hän otti yhteyttä OpenAI-tiimiin ja kertoi huolensa. ”Se on hyvin oikeutettu lähestymistapa toisten ihmisten persoonallisuuteen ja tietoihin”, Herndon kertoo minulle, ”ottaa taiteilijan kuva, harjoitella sen pohjalta ja sitten julkaista asioita jonkun toisen kuvana ilman tämän lupaa.”

Herndonin ongelma Jukeboxin kanssa liittyy hankalaan immateriaalioikeuskysymykseen, joka on vaivannut tekoälymusiikkia alusta alkaen (kuten myös samplausta ennen sitä). Vaikka oikeutta oikeudenmukaiseen käyttöön ei pidä rajoittaa kevyesti, Herndon korostaa, että kehittyvän tekoälymusiikkilainsäädännön alalla on otettava huomioon systeemiset puutteet, jotka vaikuttavat sekä algoritmeihimme että niitä ohjaaviin ihmisiin. Kun otetaan huomioon tekniikan paljon keskustelua herättäneet rodulliseen ennakkoluuloon liittyvät ongelmat ja musiikkiteollisuuden hyvin dokumentoitu historia mustien muusikoiden alipalkkauksesta, tekoälymusiikin rodullisen vaikutuksen todennäköisyys ei ole merkityksetön. Herndon pelkää, että tekoälymusiikki voi tuottaa pikemminkin ”alaspäin lyövän” kuin ”ylöspäin lyövän” vaikutuksen, jossa suuryritykset hyötyvät löyhästä immateriaalioikeuslainsäädännöstä, kun taas riippumattomat muusikot jäävät ilman palkkaa ja tunnustusta.

”Kaikki teknologia antaa ihmisille valtaa … ja tätä valtaa voidaan antaa taiteilijoille. Otan tämän teknologian ja annan sen sellaisten tuottajien käsiin, joilla on jotain ilmaistavaa.”

Jotain vastaavaa saattaa tapahtua aloilla, joille tekoäly on jo tunkeutunut. Musiikin lisensointiyrityksen omistava Michael Donaldson kertoo, että hänen toimialallaan tuotantomusiikki – taustakappaleet, joita sisällöntuottajat lisensoivat videoita, podcasteja ja muuta mediaa varten – on yhä useammin tekoälyn kehityksen kasvualusta. Koska suurin osa tuotantomusiikista on jo räätälöity luojaystävällisiin mittareihin, kuten ”happy” tai ”corporate”, inhimillinen tuote on jo tehty algoritmisesti. ”Tietokone voi lopulta tehdä mitä tahansa, mikä voidaan tehdä speksin mukaan”, Donaldson sanoo.

Vaikka tuotantomusiikkia pidetään yleensä geneerisenä, ei-luovana työnä, se on kuitenkin tuottoisa ala, joka tarjoaa työtä monille ammattimuusikoille. Mutta kun otetaan huomioon, että tekoäly tuottaa tuotantomusiikkia paljon nopeammin kuin ihminen ja osaa näennäisesti tehdä sitä yhtä hyvin, mahdollinen vallankaappaus ei ole mahdoton ajatus. ”Tämä ala on kuollut”, Phillips ennustaa, jos tekoäly jatkaa valtaansa. Ei ole kaukaa haettua kuvitella, että tekniikka leviää lopulta muille musiikin luomisen aloille: elokuvamusiikkiin ja listaykkösiin.

Mutta jos on olemassa argumentti, joka kumoaa tekoälyn vallankaappauksen mahdollisuuden, sen vakuuttavin väite on ehkä tämä: Ihmiset pitävät musiikista, koska toiset ihmiset tekevät sitä. Kykymme suhtautua toisiimme ja tietää, mikä musiikissa puhuttelee toisiamme, on jotain, mitä tekoäly ei ole lähelläkään keksimässä. ”Se ei tiedä, miten se yksi kappale osuu siihen kesään”, Herndon sanoo. ”Siihen tarvitaan ihmisen aivot ja korvat.”

Toistaiseksi taiteilijat, jotka työskentelevät koneoppimisen parissa, keskittyvät siihen, miten he voivat käyttää tätä teknologiaa pikemminkin täydentämään kuin korvaamaan omia luovia projektejaan. Herndonin seuraava projekti sisältää vakavan Spawn-päivityksen. DADABOTS on käynnistämässä aloitetta poliisiväkivaltaa vastaan käyttäen Jukeboxia tuottamaan satoja versioita N.W.A.:n ” tha Police” -kappaleesta eri genreissä. He kuratoivat 100 parasta julkaistavaksi ilmaiseksi ja järjestävät remix-kilpailun, musiikillisen protestin, jonka tarkoituksena on auttaa niitä, joilla on jotain sanottavaa, löytämään uusia tapoja sanoa se.

”Kaikki teknologia antaa ihmisille valtaa … ja tämä valta voidaan antaa taiteilijoille”, Carr sanoo. ”Joten me otamme sen. Otan tämän teknologian ja annan sen sellaisten tuottajien käsiin, joilla on jotain ilmaistavaa.” Näin käytettynä tekoäly mahdollistaa uudenlaista yhteistyötä ja vahvistaa uusia ääniä, juuri niitä asioita, jotka tekevät musiikista hienoa. Entä ajatus tällaisen asian tekemisestä, tällaisen viestin lähettämisestä, ylipäätään? Se on täysin inhimillinen pyrkimys.