Onze voice-over ai-tool 

NIEUW! HET SOUNDCIRCUS
INTELLIGENT SPEECH SYSTEM

Koken met stemmen

Wat bij Soundcircus een jaar geleden begon met “een hoop spielerei en experiment” met wat AI te bieden heeft, is uitgegroeid tot een AI-tool die gesynthetiseerde spraak naar een hoger level brengt. Hoe kwam het Soundcircus Intelligent Speech System tot leven? Wat kun je er nu al mee en waar gaat het naartoe? Michiel, AI-specialist bij Soundcircus, en Circusdirecteur Kees vertellen over de volgende stap in stemontwerp: “Wij zijn hier al dertig jaar bezig om iedere klant zijn eigen geluid te geven. En nu kunnen we die compleet unieke stem zelf maken.”

Door Sanne Houwing, foto Martijn van de Griendt (en ai)
English Version 

Michiel3

Michiel: “We wilden onderzoeken of we AI konden trainen om Nederlands te praten, met alle nuances van menselijke spraak.”

EN WE NOEMEN HAAR ALLIEGO DINGEL  Bij Soundcircus worden de bekende stemmen voor bijvoorbeeld de commercials van Hema en Kruidvat bedacht, gezocht en opgenomen. Maar in samenwerking met Joe Public, werd de nieuwe stem voor ALDI niet gezocht, maar gemáákt. Michiel legt uit: “Het komt neer op het ontwerp van een stem en die wordt tot leven gebracht door een stemacteur. Ons systeem legt een stem, waarvan wij de klank zelf in huis hebben ontworpen, over de stem van de stemacteur heen.” En in het geval van de nieuwe ALDI-stem, is die nieuwe stem samengesteld uit die van ALDI-medewerkers zelf. Tien stemmen van medewerkers uit de winkels distributiecentrum en het kantoor van de winkel, werden als ingrediënten gebruikt voor de AI-stem. Kees: “Uit alle gegenereerde stemgeluiden uit ons Soundcircus Intelligent Speech System hebben we de stem gekozen die het beste paste bij het merk ALDI. En dat was de stem die we Alliego Dingel noemden.”

HOE HET ALLEMAAL BEGON  Hun experimenten met gesynthetiseerde spraak begonnen toen de eerste text-to-speech-software uit Amerika kwam. Kees vertelt: “We wilden weten welke range je eruit kon halen, hoeveel emotie. En dat was nog niet veel. Ja, als je hoofdletters gebruikte, dan las hij luider en als je een komma gebruikte dan las ’ie omhoog. Best goed, maar lang niet goed genoeg om een stemacteur en stemregie te vervangen. En jarenlang bleef dat zo. Tot AI ineens een vlucht nam en het klonen van stemmen een peulenschil werd. Dat wierp voor ons de vraag op: kan AI voor ons een stuk gereedschap worden, of is het iets dat alles overneemt? We zijn toen serieus gaan kijken wat we er bij Soundcircus nou echt mee kunnen.”

“Met het Soundcircus Intelligent Speech System kun je precies de stem maken die je wil. En daar kun je vervolgens alles mee.”

AI ALS GEREEDSCHAP  Michiel was degene die op de technologie dook. “Dat was eerst vooral een hoop spielerei. Maar al snel gingen er wat kwartjes vallen hoe we AI als gereedschap kunnen inzetten. Om geluid mee te repareren bijvoorbeeld. Als iets slecht klonk, konden we het met AI heel gemakkelijk oppoetsen.”  Kees: “Voorheen kon je ook wel een beetje ruisonderdrukking en een beetje filtering toepassen, maar het werd nooit zo goed. En was de ruis te groot, dan moest je dubben. Met AI is het gewoon weg, je houdt sec de stem over en niks anders. Voor ons natuurlijk al een mooie tool. Maar we wilden ook onderzoeken of we AI konden trainen om Nederlands te praten, met alle nuances van menselijke spraak.”

Dé stem zelf maken  Waar text-to-speech vooral is bedacht voor functionaliteit en efficiëntie, gaat Michiel op zoek naar een echt menselijk geluid: “Het doel van veel spraaksoftware is zo snel mogelijk een tekst in gesproken woord om te zetten, met altijd hetzelfde resultaat. En voor ons is dat niet interessant. Als we een tekst opnemen bij Soundcircus, dan zijn we juist op zoek naar toevalligheden. We willen iets breekbaars horen, iets bijzonders. Met speech-to-speech kan dat.” Kees: “We zijn bij Soundcircus al dertig jaar bezig om iedere klant zijn eigen geluid te geven. Om dé stem te vinden gingen we vroeger scouten in theaters. Maar dat hebben we nu helemaal zelf in de hand. Met het Soundcircus Intelligent Speech System kun je precies de stem maken die je wil. En daar kun je vervolgens alles mee.”

Realtime AI-stem   “Het Soudcircus Intelligent Speech System faciliteert een samenwerking tussen een fysieke stem en een artificiële stem die daaroverheen gelegd wordt. Voor de muzikanten onder ons: je zou het kunnen vergelijken met een vocoder. Er gaat een stem in, met alle karakteristieken van die stem, en die worden omgezet in een andere, door ons gemaakte stem. Wat je meeneemt is het karakter: warmte, breekbaarheid, menselijkheid. Maar van het stemgeluid kun je alles maken wat je wil. En dat kunnen we realtime in de studio doen. Dus een stemacteur spreekt iets in, en we horen het direct in de artificiële stem.”

SANNEKEESENMICHIEL

Sanne “Wacht even. Je hebt een schaap laten praten?” Kees: “Ja, door het geluid van een schaap toe te voegen in de mix. Dan krijg je meer dat blatende geluid.” Michiel: “Ik heb zelfs een cello laten praten!”

EEN STEM KOKEN  In het Soundcircus Intelligent Speech System zit nu tweehonderd uur aan stemmen, om AI Nederlands te kunnen laten praten. Een vrouwenstem blijkt het beste te werken als guide voor een vrouwenstem, maar van een vrouwenstem kun je ook een mannenstem maken. Kees: “En mix je in het systeem een vrouwenstem en een mannenstem, dan komt daar ook een androgeen stemgeluid uit. Maar we hebben er bijvoorbeeld ook het geluid van een schaap in geladen om te horen hoe dat klinkt.” Michiel: “En ik heb een cello laten praten. Je moet dan als guide wel heel goed articuleren, wil je het verstaanbaar maken. Maar een vleugje cello toevoegen aan een mix van stemmen, maakt de nieuwe stem ook net een beetje heser. En zo kun je op heel specifieke kwaliteiten gaan zoeken naar de stem die je wil. Een beetje heser, helderder of ouder bijvoorbeeld. Het is wat dat betreft net koken.”

“Dat is wat we wilden: een model waarin we juist ook voor stemacteurs en stemregie een belangrijke plek reserveren.”

DE TOEKOMST VAN DE AI-STEM  Hoe belangrijk is de guide nog? Hebben we straks nog wel stemacteurs nodig? Kees: “Ik heb altijd gezegd: een mooie stem is nét niet de helft en dat blijft zo. Het is de stemacteur die de vertolking doet en die het geloofwaardig maakt. De stem die wij genereren met ons systeem is een instrument waar leven in geblazen wordt door de stemacteur. Die bepaalt de range, de klank.” Michiel: “Soms merken we ook dat onze AI-stem niet mee kan met de stemacteur, omdat het niet getraind is in bepaalde klanken. Een bulderende lach bijvoorbeeld, of een uithaal, of fluisteren. We zijn dan ook regelmatig teruggegaan in het systeem om daarin weer nieuwe klanken in te laden.”

EEN STEM VOOR OVERAL EN ALTIJD Kun je straks dan een stem voor de eeuwigheid afkopen? Dat ligt genuanceerd, vertelt Kees: “Het Soundcircus Intelligent Speech System is helemaal stand-alone en iedereen die hun stem leent aan ons systeem, tekent een quitclaim waarmee is geregeld dat hun stem voor altijd gebruikt mag worden bínnen ons systeem. Zij worden ook financieel gecompenseerd als hun stem straks wordt gebruikt in een gesynthetiseerde stem. Dat is ook wat we wilden: een model waarin we juist ook voor stemacteurs en stemregie een belangrijke plek reserveren. Niet alleen omdat dat ons bestaansrecht is, maar omdat uit die synergie gewoon het beste resultaat komt. Maar de met AI gemaakte stem blijft van Soundcircus en die kan dus blijvend worden ingezet voor een bepaald merk.” Michiel: “En bedenk dan ook dat je die stem niet alleen voor het Nederlands taalgebied hebt. Want dezelfde stem kun je ook laten aansturen door een Franse stemacteur, of een Amerikaanse, of een Chinese. Dan heb je dus dezelfde merkstem voor heel de wereld. Hoe mooi is dat?”

Meer informatie, mail ons
frontdesk@soundcircus.nl