Hudba s umělou inteligencí už je tady. Co bude dál?

13 ledna, 2022

Na konci dubna 2020 nahrála společnost OpenAI na SoundCloud desítky nových skladeb s věcnými názvy jako „Hip-hop ve stylu Nase“ nebo „Pop ve stylu Katy Perry“. Zpočátku by vám bylo odpuštěno, kdybyste si mysleli, že jde o průměrné covery z YouTube. Pár vteřin strávených poslechem klokotavé produkce, bizarních textů a děsivých vokálů by váš názor rozhodně změnilo.

Všechny písně byly vytvořeny pomocí softwaru umělé inteligence nazvaného Jukebox, který navrhla OpenAI, výzkumná organizace s miliardovým obratem v oblasti výzkumu umělé inteligence. Jukebox není standardní imitátor Elvise: Po vyškolení na 1,2 milionu písní a dalších údajích o žánrech a umělcích se neuronová síť naučila vytvářet originální hudbu v neuvěřitelně rozpoznatelném stylu slavných umělců, jako jsou Elton John a Rihanna. Je to nová a působivá technologie, počítačový model, který přišel na to, jak v surovém zvuku generovat skutečné písně včetně vokálů.

Když si většina lidí představí hudbu generovanou umělou inteligencí, pravděpodobně se jim vybaví něco jako Jukebox – rozsáhlá architektura kódu, která ovládá umění imitace a vytváří hudbu, která by mohla oživit kariéry dávno mrtvých umělců nebo vytvořit nové z nul a jedniček. Tato představa možná vysvětluje, proč když společnost OpenAI koncem dubna tento nástroj oficiálně oznámila, reakce na Twitteru se pohybovaly od „To je úžasná práce!“ přes „To je neuvěřitelně cool a zároveň hluboce prokleté“ až po předtuchu „Náhrada lidského intelektu & kreativity jistě přichází, cihlu po cihle.“

„Považuji ‚umělou inteligenci’… za trochu zastírací,“ říká Holly Herndonová během nedávného videochatu ze svého berlínského bytu. Herndonová, které není umělá inteligence cizí (poslední album PROTO této elektronické a avant-popové hudebnice vzniklo s pomocí vznikající umělé inteligence, kterou pojmenovala Spawn), si myslí, že zatížené implikace tohoto termínu – robotí nadvláda a zastaralost člověka – mystifikují jeho skutečnou funkci v hudbě. Většina automatizované tvorby hudby probíhá prostřednictvím strojového učení: trénování modelu, který analyzuje existující skladby, identifikuje vzorce z dat a využívá tyto znalosti k vytváření vlastní hudby. Je to dnes běžný proces, který sotva vyvolává stejné sci-fi drama jako „umělá inteligence“.

„Strojové učení nezní tak sexy ,“ říká Herndon, „ale popisuje to, co se děje. Stroj se učí. A učí se z lidské inteligence.“

Jak se v současnosti používá v titulcích novin a dystopických představách, „AI“ s sebou nese senzacechtivost, která naznačuje, že každý nový vývoj v hudbě nás přibližuje k budoucnosti robotických popových hvězd. Skutečnost hudby s umělou inteligencí je však méně okouzlující i méně dystopická. Jednak už tu je – existuje v různých podobách, dohlíží na ni lidé s různými cíli, a jak Herndon zdůrazňuje, tiše se od nich učí, jak se chovat. I když by konečné výsledky mohly být tech-dystopické, Herndon zdůrazňuje, že nic není vytesáno do kamene; budoucnost umělé inteligence v hudbě se teprve rýsuje, cesta se formuje na základě spolupráce a konfliktů mezi libovolným počtem zúčastněných stran. „Myslím, že to, čeho se lidé v souvislosti s umělou inteligencí obávají, nemusí být nutně technologie,“ uvažuje Herndon, ale spíše „pekelná společnost, kterou by lidé s touto technologií vybudovali.“

Pokud je umělá inteligence využívána jako prostředek k rozšíření lidské kreativity, nemusí nutně představovat hrozbu. Na albu PROTO, které pulzuje experimentem, a přesto zůstává pevně zaměřené na člověka, Herndon proplétá syntetické výstupy Spawnu s rozmáchlým sborovým ansámblem a vytváří momenty hlubokých emocí. Spojením výrazně lidského a výrazně robotického v jedno je Herndon kurátorem i režisérem umělé inteligence spolu s ostatními členy kapely; Spawn poskytuje momenty kreativity a inovativní hudebnosti, ale Herndon je tím, kdo má vše pod kontrolou.

Muzikanti, kteří experimentují s umělou inteligencí, jsou někdy odmítáni jako trikaři, přestože ke spolupráci s technikou mají legitimní umělecké důvody. Když se skupina DADABOTS, která se stala hackerským týmem, letos umístila na druhém místě v soutěži AI Song Contest, která nahradila Eurovizi, použila umělou inteligenci vycvičenou na základě průzkumu acapelly, popu, metalu a dalších skladeb z 50. let. Další týmy vytvořily písně se stroji vycvičenými na zvucích australské přírody a textech převzatých z vláken na Redditu. Člen skupiny DADABOTS CJ Carr říká, že strojové učení jim umožňuje přetavit fantastické koncepty a dalekosáhlé inspirace ve skutečnou hudbu. S umělou inteligencí se „rozšiřuje naše schopnost shromažďovat, produkovat hudbu a spolupracovat s desítkami nebo stovkami umělců,“ říká Carr.

To ale neznamená, že by tato technologie sama o sobě dokázala vytvořit (dobrou) hudbu. Carrův spoluhráč Zack Zukowski zdůrazňuje, že pro jejich úspěch na Eurovizi AI byl rozhodující lidský zásah: „Chovali jsme se k AI, jako by to byl jen další umělec v našem studiu“. Mimochodem, tým, který nechal AI převzít vedení, získal poslední místo. I když je Jukebox největším průlomem v automatickém generování hudby v poslední době, má stále zjevná omezení. Na prvních ukázkách je zřejmé, že nástroj ještě nepřišel na strukturu refrénů a často sklouzává ke zkreslenému ječení. Prozatím nelze srovnávat hudbu vytvořenou člověkem a její protějšek generovaný umělou inteligencí. I kdyby existovalo, naše citové pouto k lidským prvkům hudby naznačuje, že bychom se pravděpodobně v dohledné době nevzdali hudby vytvořené skutečnými lidmi.

„Myslím, že to, čeho se lidé v souvislosti s umělou inteligencí obávají, nemusí být nutně technologie, ale pekelná společnost, kterou by lidé s touto technologií vybudovali.“

Takže proč se zabývat hudbou s umělou inteligencí, když jen vrazíme nekonečné hodiny a miliardy dolarů do stroje, který dokáže jen chabě napodobit to, na co už lidé přišli? Odpověď záleží na tom, koho se ptáte. Pro experimentální hudebníky je umělá inteligence způsob, jak vytvářet zvuky, jaké ještě nikdo neslyšel. Zatímco některé zainteresované strany by mohly mít zájem na tom, aby chrlily písně stisknutím tlačítka a následně se vyhnuly nákladům na autorské honoráře umělců. Jiní se řídí čistě inovacemi pro inovace a ztělesňují mantru Facebooku „pohybuj se rychle a rozbíjej věci“. Mnozí další stále nejsou přesvědčeni, že umělá inteligence přispívá něčím dobrým k tomu, co je do značné míry považováno za vrozeně lidskou formu umění.

Pro optimisty má umělá inteligence potenciál zapadnout do příběhu o demokratizaci hudby. Stephen Phillips, generální ředitel startupu Popgun, jehož produkty zahrnují aplikaci, pomocí níž mohou děti vytvářet písně s pomocí AI, je přesvědčen, že to, že více lidí bude moci experimentovat se zvukem, hudbě v dlouhodobém horizontu jen prospěje. „Naší tezí se stalo, že největším uplatněním umělé inteligence v hudbě nebude nahrazení hudebníků, ale to, že se každý bude cítit jako hudebník,“ říká Phillips.

Technologie, které pomáhají více lidem cítit se jako hudebníci, možná dokonce mění představu o tom, kdo se počítá za hudebníka, už dlouho posouvají hudbu kupředu a umožňují vznik celých žánrů, od hip-hopu po techno. Stojí za zmínku, že tyto technologie, které jsou dnes převážně chváleny jako obrovský přínos pro hudební průmysl, čelily v době svého zavedení vlastním negativním reakcím. Vokodéry byly obviňovány z narušení hudební integrity, bicí automaty byly odsuzovány jako náhrada lidských bubeníků a syntezátory byly haněny jako bezduché.

Možná část podobného odporu vůči hudbě s umělou inteligencí pomine, jakmile ustoupí pochopení nových hudebních možností. Dokonce i raná technologie, jako je klavír, zdůrazňuje Zukowski, „dala Mozartovi možnost tichých a hlasitých tónů“, čímž rozšířila naše chápání toho, co může být hudba.

Bylo by však hluboce naivní domnívat se, že lidé slouží pouze k tomu, aby měli z této technologie prospěch. Dokonce i jako člověk, který je hudbou s umělou inteligencí nadšený, je Herndon na vážkách, pokud jde o vážný potenciál umělé inteligence poškodit právě ty umělce, jejichž diskografie trénuje, hudebníky, kteří z tohoto stroje fakticky udělali to, čím je. Zaměření Jukeboxu na napodobování ji znepokojuje do té míry, že se svými obavami kontaktovala tým OpenAI. „Je to velmi oprávněný přístup k osobnosti a datům jiných lidí,“ říká mi Herndonová, „vzít podobiznu umělce, trénovat na ní a pak vydávat věci s podobou někoho jiného bez jeho svolení.“

Herndonové problém s Jukeboxem zahrnuje ošemetnou otázku duševního vlastnictví, která trápí umělou inteligenci v hudbě od samého počátku (stejně jako předtím samplování). Ačkoli právo na spravedlivé užití nemá být omezováno na lehkou váhu, Herndon zdůrazňuje, že rozvíjející se oblast hudebního práva AI bude muset zohlednit systémové nedostatky, které ovlivňují jak naše algoritmy, tak lidi, kteří je ovládají. Vzhledem k tolik diskutovaným problémům s rasovou předpojatostí v oblasti technologií a dobře zdokumentované historii hudebního průmyslu, který nedostatečně platí černošské hudebníky, není pravděpodobnost rasového dopadu hudby AI zanedbatelná. Herndon se obává, že AI music by mohla vyvolat spíše efekt „punching down“ než „punching up“, kdy velké společnosti budou těžit z výhod uvolněných zákonů o duševním vlastnictví, zatímco nezávislí hudebníci zůstanou nezaplaceni a neuznáni.

„Všechny technologie dávají lidem moc … a tato moc může být dána umělcům. Beru tuto technologii a dávám ji do rukou producentům, kteří mají co vyjádřit.“

Něco podobného se možná děje v oborech, do kterých již umělá inteligence pronikla. Michael Donaldson, který vlastní společnost zabývající se licencováním hudby, mi řekl, že v jeho oboru je produkční hudba – písně na pozadí, které si tvůrci obsahu licencují pro videa, podcasty a další média – stále více živnou půdou pro vývoj AI. Vzhledem k tomu, že většina produkční hudby je již přizpůsobena metrikám přívětivým pro tvůrce, jako je „happy“ nebo „corporate“, je lidský produkt již hotový algoritmicky. „Cokoli, co lze vytvořit podle specifikace, může nakonec udělat počítač,“ říká Donaldson.

Ačkoli má produkční hudba tendenci být odepisována jako obecná, nekreativní práce, přesto je to lukrativní obor, který poskytuje práci mnoha profesionálním hudebníkům. Ale vzhledem k tomu, že umělá inteligence vytváří produkční hudbu mnohem rychleji než lidé a zřejmě ji dokáže dělat stejně dobře, není případné převzetí nevyzpytatelné. „Toto odvětví je mrtvé,“ předpovídá Phillips, pokud se umělá inteligence bude i nadále prosazovat. Není od věci si představit, že se tato technologie nakonec rozšíří i do dalších oblastí hudební tvorby: filmové hudby a hitparád.“

Jestliže však existuje nějaký argument vyvracející možnost převzetí AI, jeho nejpřesvědčivějším principem může být tento: Lidé mají rádi hudbu, protože ji tvoří jiní lidé. Naše schopnost navazovat vzájemné vztahy, vědět, co k nám v hudbě promlouvá, je něco, na co umělá inteligence ani zdaleka nepřišla. „Neví, jak, víte, ta jedna písnička prostě zasáhne to léto,“ říká Herndon. „Na to je potřeba lidský mozek a uši.“

Umělci, kteří pracují se strojovým učením, se zatím rozhodli zaměřit na to, jak mohou tuto technologii využít k rozšíření, nikoliv k nahrazení svých vlastních tvůrčích projektů. Herndonův další projekt zahrnuje pořádný upgrade Spawna. DADABOTS zahajuje iniciativu proti policejní brutalitě s využitím Jukeboxu, který generuje stovky verzí písně “ tha Police“ od N.W.A. v různých žánrech. Vybere 100 nejlepších a zdarma je zveřejní a uspořádá soutěž remixů, hudební protest, který má pomoci těm, kteří mají co říct, najít nové způsoby, jak to říct.

„Všechny technologie dávají lidem moc … a tuto moc lze dát umělcům,“ říká Carr. „Takže si ji bereme. Beru tuto technologii a dávám ji do rukou producentům, kteří mají co vyjádřit.“ Takto použitá umělá inteligence umožňuje novou spolupráci a posiluje nové hlasy, což jsou právě ty věci, které dělají hudbu skvělou. A nápad něco takového udělat, vyslat takové poselství, vůbec? To je zcela lidská záležitost.

Savage Rose

Jak vlastně vypadá budoucnost umělé inteligence v hudbě?“

Napsat komentář Zrušit odpověď na komentář