AI Will Survive: muziek tussen mens en machine
© nina vandeweghe
Een nieuwe noot in de muziekgeschiedenis
Artificiële Intelligentie of AI is in elke industrie prominent aanwezig, en de muzieksector vormt daarop geen uitzondering. Vooral sinds de explosieve groei van generatieve AI – ChatGPT kwam iets meer dan drie jaar geleden uit, Suno en Udio volgden een goed jaar later – lijkt er geen dag voorbij te gaan zonder een groot GenAI-nieuwsitem. In creatieve sectoren liggen de voornaamste bezorgdheden nog iets anders dan bij pakweg gezondheidszorg of luchtvaart: het trainen op gecopyrighte data zonder compensatie of toestemming, het effect op inkomsten uit auteursrechten, en de existentiële vraag of kunst (met grote of kleine k) altijd menselijk moet zijn.
Wie even terugblikt in de muziekgeschiedenis ziet een vertrouwd patroon. Elke industriële revolutie heeft technologie met zich meegebracht die de samenleving op haar grondvesten deed daveren, en zo onder meer veranderde hoe we muziek maken en beleven. Elektriciteit maakte nieuwe opnametechnieken en de elektrische gitaar mogelijk. Computers gaven aanleiding tot nieuwe soorten elektronische muziek en brachten de opnamestudio naar de slaapkamer. Het internet verbond de wereld letterlijk en zette distributie op z'n kop. AI is in die zin gewoon de volgende fase: een (niet-zo-)nieuwe familie technologieën die nieuwe muziek en nieuwe muziekbeleving creëren.
Elke industriële revolutie heeft technologie met zich meegebracht die de samenleving op haar grondvesten deed daveren, en zo onder meer veranderde hoe we muziek maken en beleven. [...] AI is in die zin gewoon de volgende fase: een (niet-zo-)nieuwe familie technologieën die nieuwe muziek en nieuwe muziekbeleving creëren
Toch voelt het anders nu. AI is geen instrument dat je in je zak steekt – het is een gigantisch systeem, vaak ergens in Amerika, dat energie verslindt en getraind wordt op enorme hoeveelheden data. Het is een oplossing voor een probleem dat misschien niet bestaat, voorgesteld door technologiebedrijven. De regels rond het gebruik van die data, de impact op broodwinning binnen een al precair businessmodel, en de vraag wie nog de spreekwoordelijke pen vasthoudt: dat zijn de kwesties die vandaag nog op tafel liggen.
Democratisering of eenheidsworst?
Net als bij vorige (r)evoluties – denk aan de minachtende opmerkingen over bedroom producers – wordt AI verweten te zorgen voor een zee van inferieure muziek. De keerzijde is dat meer mensen dan ooit muziek kunnen maken. Gebrek aan tijd, budget, scholing, talent, of zelfs zin om te componeren en musiceren op een traditionele manier hoeven muziekcreatie niet langer in de weg te staan. Muziek moet bovendien niet per se op een streamingplatform eindigen, maar heeft ook waarde als activiteit, in plaats van als commodity. AI kan muziek maken voor therapeutische doeleinden, educatie of simpelweg het plezier van creëren naar een groter publiek brengen.
Ook professionals kunnen technologie gebruiken om meer zelf te doen, zoals zichzelf opnemen en zo verschillende partijen voor hun rekening nemen. Gelijkaardig hieraan kan AI helpen met inspiratie en efficiëntie: ideeën uitwerken, variaties proberen, demo’s maken. Een producer kan een AI-gegenereerde kladversie voorleggen aan een klant, en dan het echte werk met menselijke muzikanten doen als de richting klaar is. Zo wordt AI geen vervanger maar eerder een versneller en communicatietool.
Belgisch producer en dj Jay Dunham gebruikt het bijvoorbeeld als inspiratiebron. “Vooral de recentere versies van Suno zijn hiervoor erg geschikt. Wanneer ik even met een writer's block zit, kan het mij ideeën geven” Dat kan gaan over een hardnekkig wit blad, of het bedenken van een overgang tussen twee reeds afgewerkte refreinen.
Toch blijft de vraag: hoe scheiden we het kaf van het koren als iedereen plots componist wordt? De angst voor een ongeïnspireerde massa is reëel, maar ook niet nieuw. Elke technologische vooruitgang die muziekproductie toegankelijker maakte – van betaalbare synthesizers tot digital audio workstations (DAWs) – kwam met vergelijkbare waarschuwingen. En telkens ontstond er een nieuw ecosysteem waarin kwaliteit zich toch een weg naar boven baande. Ironisch genoeg heeft AI zelf het potentieel iedere individuele luisteraar naar de best gesmaakte muziek te leiden via steeds slimmere aanbevelingsalgoritmen.
Ironisch genoeg heeft AI zelf het potentieel iedere individuele luisteraar naar de best gesmaakte muziek te leiden via steeds slimmere aanbevelingsalgoritmen.
De reden voor het generisch klinken van AI-muziek zit hem in de werking van de large language models (LLMs, zoals ChatGPT en Gemini) en stable diffusion systemen. Die zijn steeds op zoek naar de meest plausibele volgende woorden, pixels, en geluidssamples. “AI dus zal een veilige interpolatie maken binnen de dataset, en geen extrapolatie die letterlijk outside-the-box denkt, zoals een innovatieve artiest zou doen.” zegt Geraint Wiggins. Hij is professor Computational Creativity aan Vrije Universiteit Brussel, een discipline waar hij de grondlegger van is sinds meer dan 30 jaar, en waar generatieve AI centraal staat. Het zal nog even duren vooraleer een machine zelfstandig kan beoordelen welke “fouten” en creatieve beslissingen gesmaakt zullen worden.
Er bestaat een spanning tussen democratisering en devaluatie. AI maakt het mogelijk dat iemand zonder muzikale training toch muziek kan maken voor een eigen YouTube-video of podcast. Dat is mooi, maar het drukt ook de prijs die professionals kunnen vragen voor dergelijk werk, of doet de vraag afnemen. Ter illustratie: vroeger huurde een lokale ondernemer misschien een muzikant in om een jingle te maken voor €500. Nu kan diezelfde ondernemer sneller en veel goedkoper met Suno iets genereren wat voor diens doeleinden voldoende is. De muzikant verliest die opdracht niet aan een andere muzikant, maar aan een technologiegigant. Dit treft een groot en divers segment van de muzieksector, aldus Wiggins: “Naast een legitieme carrière vormen dit soort jobs ook een belangrijke broodwinning voor artiesten die hiermee een minder lucratieve artistieke activiteit ondersteunen. Studiomuzikanten zagen hun toekomst zo al grotendeels verdampen.”
De vraag is of de markt groot genoeg blijft voor alle muzikanten, dan wel of er een verschuiving plaatsvindt waarbij minder mensen meer kunnen doen. Historisch gezien is het antwoord meestal: beide. Er verdwijnen banen, er komen banen bij, en de sector vindt een nieuw evenwicht. Maar voor individuen die in die transitie zitten, biedt dat weinig troost.
De vraag is of de markt groot genoeg blijft voor alle muzikanten, dan wel of er een verschuiving plaatsvindt waarbij minder mensen meer kunnen doen. Historisch gezien is het antwoord meestal: beide. Er verdwijnen banen, er komen banen bij, en de sector vindt een nieuw evenwicht. Maar voor individuen die in die transitie zitten, biedt dat weinig troost.
De uncanny valley als creatief instrument
Écht interessant wordt het wanneer een tool die bedoeld is voor praktische taken creatief wordt gebruikt – of misbruikt. Auto-Tune is hier een bekend voorbeeld van: oorspronkelijk ontworpen om subtiel valse noten recht te zetten, maar door artiesten als Cher en T-Pain extreem ingezet om een robot-effect te creëren. Dat effect definieerde hele genres en is inmiddels een gangbaar onderdeel van muziekproductie.
Net zoals imperfecties in oude analoge of vroeg-digitale toestellen creatief werden benut en uitvergroot, zou je hetzelfde kunnen verwachten van AI. De uncanny valley sound, die vreemde, dromerige, griezelige en net-niet-menselijke sfeer van vroege AI-muziek, wordt misschien het laatste nieuwe defect dat muzikanten creatief willen uitbuiten. Dat kan gaan over bizarre timbres, onverwachte melodische en harmonische keuzes, en opzettelijk onmenselijke stemmen. Het zal misschien niet lang duren vooraleer dit hoorbaar verschil met menselijke muziek verdwijnt, tenzij het “AI-genre” de mensgemaakte muziek toch erg beïnvloedt, of trainingsdata wordt en zichzelf zo in stand houdt.
Wolfgang Gartner gebruikte voice cloning software voor zijn track “Automatic”, niet om menselijkheid te simuleren maar juist om de gesynthetiseerde kwaliteit te omarmen. Het motief hier is geenszins om tijd of geld te besparen – het werd zelfs een extreem lang en arbeidsintensief proces. Dit zijn met andere woorden geen vervangingen van menselijke muzikanten maar uitbreidingen van het palet.
Scharrelmuziek
Tegelijk ontstaat er een tegenreactie. Net zoals er consumenten zijn die specifiek op zoek gaan naar biologische groenten of handgemaakte kleding, zijn er luisteraars die juist vanwege de AI-golf extra de zuiver mensgemaakte muziek opzoeken. Labels als “100% human-made” of “organic music” duiken op, vergelijkbaar met Fair Trade-certificaten of biologische keurmerken. Voor sommigen is het een principekwestie, zelfs wanneer het niet duidelijk zou zijn of een nummer door mens of machine gemaakt werd.
Die omgekeerde beweging is de muziekgeschiedenis niet vreemd. Toen popproductie steeds gepolijster werd, ontstond lo-fi als reactie. Toen disco te commercieel werd, kwam punk. Toen alles digitaal ging, herontdekten mensen vinyl en analoge synthesizers. AI dwingt creators en fans opnieuw na te denken over wat ze waarderen in muziek, en voor velen is dat juist de menselijke imperfectie.
Als men weet dat een nummer met AI gemaakt is, ervaart men het als minder goed, blijkt uit recent onderzoek. Dat is problematisch voor AI-muziek die zich als menselijk wil voordoen, maar kan ook een boost zijn voor de transparantie die vele stakeholders essentieel achten. Of het nu gaat om trainingsdata, labelingvoorschriften, compensatiemodellen of artistieke credits: zonder openheid is er geen vertrouwen, en zonder vertrouwen is er geen houdbaar ecosysteem.
Als men weet dat een nummer met AI gemaakt is, ervaart men het als minder goed, blijkt uit recent onderzoek. Dat is problematisch voor AI-muziek die zich als menselijk wil voordoen, maar kan ook een boost zijn voor de transparantie die vele stakeholders essentieel achten.
Die transparantie is niet alleen moreel juist maar ook commercieel verstandig. Consumenten waarderen authenticiteit – ook als die authenticiteit betekent toegeven dat je met AI werkt. Een artiest die open is over diens gebruik van AI-tools en uitlegt hoe die in het creatieve proces passen, bouwt meer vertrouwen dan iemand die doet alsof alles met de hand gemaakt is terwijl luisteraars het verschil horen. Informatie over hoe een track tot stand kwam zou als metadata vastgelegd kunnen worden in de bestanden zelf, vergelijkbaar met hoe fotocamera's dat doen. Maar de vraag stelt zich vanaf wanneer iets als AI moet bestempeld worden, bijvoorbeeld wanneer slechts een deel van het stuk gecomponeerd werd door een Suno of Udio en dan aangepast, en hoe men dit kan afdwingen of controleren. Is een zanglijn die door Melodyne werd gecorrigeerd AI-geassisteerd? Geldt een mastering-plugin die automatisch optimale levels instelt als AI? Wie een grens wil trekken, moet definiëren wat precies AI is – en dat is lastig.
Het vermaarde IRCAM belooft met haar AI Music Detector zelfs een voor 99% accurate analyse van of een audiobestand artificieel gegenereerd werd. Ook met het blote oor halen we de AI-producties er meestal nog uit. “Een paar maten gegenereerde pop komt al erg in de buurt van het menselijke equivalent,” vindt Wiggins. “Maar bij langere songstructuren stuikt het geheel toch nog vaak in elkaar.” Andere weggevers zijn een vreselijk generische sound en cliché titels “zoals Midnight Sky of Neon Light.” aldus Dunham. Ten slotte klinkt vooral de stem meestal erg bewerkt, en heeft het geheel een lage kwaliteit zoals een MP3-bestand heeft. Dat is niet verrassend, want veel trainingsdata zal gecomprimeerd zijn, en het kost ook meer rekenkracht om te trainen en genereren op hoge kwaliteit. Maar nu al bestaan er AI-tools die audio en video kunnen opschalen naar hogere resolutie, zoals de ooit ongeloofwaardige “enhance”-knop uit detectieveseries.
Het is niet ondenkbaar dat muziek uit een AI-legbatterij heel moeilijk te onderscheiden wordt van "scharrelmuziek", of zelfs dat een alsmaar groter publiek er geen moeite mee heeft. Maar hoe verandert de ervaring van de muzikant? Dunham is categoriek: “Als GenAI de toekomst van muziek maken is, dan stop ik er op z'n minst mee artiest te zijn. Het plezier, de struggle, het zwoegen, de flow state – dat alles ontbreekt volledig in dit proces. Zelfs al krijg ik er een straffe song uit, de ziel ontbreekt volledig.”
In tegenstelling tot zelfrijdende auto‘s en tumordetectie is het geen zaak van leven of dood, maar belangrijk is het wel. “Ik geloof dat generieke muziek een kwalijk effect heeft, zoals goede klassieke muziek een positief effect heeft op de cognitieve en emotionele ontwikkeling. De muziek waarnaar je luistert beïnvloed je als persoon,” zegt Dunham nog. “Ik hoop dat we als maatschappij gevoelig blijven aan kwaliteit van muziek, en om de menselijke factor geven.”
Gooi hoe dan ook die traditionele instrumenten nog niet weg, want in kunst en entertainment is er altijd een plaats voor het originele, het oude, het nostalgische. De creatieve sectoren verschillen daarin sterk van andere, waar oude technologie enkel een historische waarde heeft en de nieuwe bijna altijd de voorkeur geniet om tot het snelste, sterkste, goedkoopste, en meest kwalitatieve resultaat te komen. Als artiest is het echter perfect verdedigbaar om je te beperken tot instrumenten van pakweg de jaren zeventig, al zijn er ook die bij de cutting edge zweren, en weer anderen die een hybride vorm opzoeken.
En wat met de impact op inkomsten van muzikanten en auteurs? Dat belichten we in deel twee van deze serie, binnen twee weken op onze site.
Reclame