Den norske oppstarten Capsule.fm lager robot-personligheter til å småprate mellom låter. Målet er å utkonkurrere de menneskelige radiopraterne og tradisjonelle radiokanalene.
Oppstarten Capsule.fm utvikler en app (kun iOS) som lager en personlig lytteropplevelse satt sammen av ulike musikk- og nyhetskilder.
– Lønn til radioverter begrenser radioen som må spille et minste felles multiplum for målgruppen. Robotstemmer endrer dette. Du kan få det beste fra radio – som småprat og musikkintroer – og samtidig få personlig tilpasset innhold, sier Espen Systad i Capsule.fm.
Systads kongstanke er at det finnes en bedre måte å høre på radio og Spotify. Der Facebook i sin tid utviklet en algoritmestyrt nyhetsstrøm av venner, nyheter, og kattevideoer; har Capsule.fm planer om å gjøre noe lignende for lyd.

Siden det er umulig å spille inn nok unike introduksjoner for ulike låter, værmeldinger, og nyhetsopplesninger har de tatt i bruk kunstig tale, ofte kalt talesyntese.
Målet er altså å dytte radiopraterne ut i kulden. De er ikke alene om den målsetningen.
Amazon har for eksempel mer enn 5 000 ansatte som jobber med deres digitale assistent Alexa, og de gjennomførte nylig en konkurranse mellom 15 universitetslag om å lage den beste digitale samtalepartneren.
Det beste laget klarte å holde en samtale i nesten 20 minutter før dommerne mente samtalen sporet av.
I tillegg har Google og Apple lansert smarthøytalere med målsetningen om å gi deg en mer personalisert lytteropplevelse.
Hils på radio-robotene
Det finnes en rekke forsøk på å utvikle kunstige stemmer vi mennesker oppfatter som komfortable å høre på.
Capsule.fm benytter seg av en database av stemmeinnleste setninger som deretter mikses og settes sammen for å lese opp tekstinnslag. Disse tekstinnslagene er delvis autogenererte etter en rekke regler.
– Vi bruker blant annet geolokasjonen din, været, hvem du følger i appen, og hva som skal avspilles til å avgjøre hvilke introduksjoner vi lager, sier teknisk sjef Tor Langballe i Capsule.fm.
Deretter vil appen prøve å variere hvilke type innhold du får ved å vekte hvor ofte de skal inntreffe. Slik unngår man at været gjentas to ganger i timen, og at for lik musikk spilles rett etter hverandre.
Har egne personligheter
For å gjøre introduksjonene interessante å høre på har de utviklet personaer, kunstige personligheter med særtrekk vi kan kjenne oss igjen i og underholdes av.
Blant annet er personaen «Carl» i Capsule.fm foret på 70-talls slang fra New York. Stemmen er raspete, noe sakte, og dyp.
Noen ganger kan han bli litt filosofisk:
Sound can travel through materials, let’s get materialistic
«Carl» introduserer sangen Ready av PWNDTIAC
– For å menneskeliggjøre personaene har vi lagt inn stemmeartefakter, uvaner, stamming, og spesiell uttale på enkeltord. Noen ganger sier de også feil, og må gjenta seg selv, sier Tor Langballe.
«Miranda», den andre engelske stemmen, er en britisk overklassestemme som foretrekker å flørte mellom låtene. I tillegg har de seks andre personaer, blant annet to norske.
Vil bli «ansiktet utad»
Capsule.fm bruker stemmeteknologien til et annet selskap, og metoden deres er foreløpig basert på skjøtesyntese, en måte å sette sammen lydklipp opplest av mennesker.
– Vi ser at utviklingen går mot å bruke maskinlæring der man genererer stemmer som høres like bra ut som de beste delene av skjøtesyntese, sier Langballe, og forteller at de etterhvert vil se på å gå over til nyere metoder innen talesyntese enn de bruker i dag.

Han tror det framover vil være mulig å velge biblioteker av talesyntese som det skulle være skrifttyper som for eksempel Times New Roman eller Arial. Da kan deres radioverter være ansiktet utad, men basert på andres underliggende teknologi.
Konkurransen om hjemmene våre, og eksklusiv tilgang til ørene våre, er bare i startgropa. Akkurat på hvilken måte vi ønsker å kommunisere muntlig med en maskin er ennå uavklart.
Kanskje, bare kanskje, kan et norsk selskap med base i Berlin lykkes med å bli sentral i neste generasjons lytteropplevelse.
Her kan du få et dypdykk i hvordan maskiner snakker til oss, men om du er travel kan denne figuren gi deg en liten forsmak:
Dette er ikke den første gangen NRKbeta skriver om digitale assistenter og utviklingen på stemmefronten. Sjekk ut våre tidligere saker:
Har hatt den glede å kommunisere med Jakob Arvola som så flott hver dag leder oss i gjennom morgentimene i NRK Klassisk og jeg vil ikke unnvære å ha levende personer som leder programmene. Tviler på at jeg kan føre samme samtale med de syntetiske radiovertene. Uansett Jakob og de andre i NRK Klassisk er så flotte og flinke og gir meg tro på livet og lys i livet hver dag så jeg er bitter motstander mot at de skal miste jobbene og erstattes av tekno-syntetiske stemmer. Emosjoner kan ikke programmeres inn, ikke ekte i alle fall. Hilsen Øyvind Michelsen, Oslo, Microsoft Certified Systems Engineer og IT-konsulent og vokal tenor. (OBS jeg er ikke i slekt med eller nær venn til noen i NRK Klassisk, men har lært dem å kjenne via radiosendinger og på Facebook).
Kjekt å høre at du har funnet et radioprogram som treffer deg!
Flere av mine kompiser har det samme til Radioresepsjonen 🙂
Det er mange av DAB+ kanalene som kunne blitt bedre av slike funksjoner. F.eks Radio Rock burde vurdert en slik funksjon istedet for å bare spille av helt tilfeldig ferdiginnspilt tale mellom sangene.
Radio Rock har ikke hatt ferdiginnspilte kommentarer på flere år. Det er ekte programledere på alle flatene.
Skjønner ikke helt målsettingen om å forsøksvis erstatte levende programverter med såkalte roboter. Kan tenkes at det kunne fungere som et tillegg eller alternativ, men ikke som en erstatning.
Til sammenligning kan man ta syntetiske tonegeneratorer – da disse ble tilgjengelige på det brede markedet for 30-40 år siden, fryktet mange tradisjonelle musikere at «ekte» instrumenter ville bli utklassert av synthesizere. Det skjedde som kjent ikke. Det er fortsatt et marked for fiolin, klarinett og samtlige andre orkesterinstrumenter.
Latterlig. Mennesker har bruk for ekte menneske prat!
Støttes 😃
Ekte menneskeprat har vi hørt i alle år! La oss prøve noe nytt.
Du mener hjernedødt tomprat 🙂
Gleder meg! Ramlet tilfeldigvis innom Radio 1 lørdag kveld, hvor radioverten serverte følgende kloke ord etter å ha spilt ei låt:
– Og det var Kygo som ga deg en skikkelig dose insulin denne lørdagen!
Vel, denne kommer ikke til å erstatte RadioResepsjonen på en god stund 🙂
Men, til korte nyhetsreplikker, litt lett prat om været / trafikkhendelser…
Ble skvisa ut som radiolytter for noen måneder siden, så derfor merker jeg ikke forskjell på hvem som prater i radio.
Da er spørsmålet, hva hører du på i dag? (Podkast, kun musikk?)
For en utrolig latterlig og unødvendig ting å bruke en smart hjerne på å lage
Hva er latterlig med å prøve ut nye måter å levere lydinnhold?
Jeg kan forstå smått innputt fra »robotstemmer» til å introdusere en sang, eller for en rask nyhet/vær-varsling. Men jeg ville aldri trekket det så langt som å si at dette er en erstatning for radiovertene, type radioresepsjonen og andre lignende programmer.
Du vil aldri få den samme typen personlighet fra et kunstig intelligens som du vil få fra et menneske.
Jeg tror du har et godt poeng her. Det er nok lenge til intervju- og samtaleprogrammer vil få konkurranse av disse stemmene, men det blir spennende å se hvordan de kan integreres i hverdagen.
Støtter det ekte.
Er gått veldig lei av alt mulig skal bli erstattet av kunstig og maskinelt!
Eg gler meg til alle menneskje har blitt erstatta av robotar og ingen jobbar lenger eller har kontakt med andre menneskjer, då blir det paradis på jord!
Oi, her gjekk de glipp av ein sjanse. Kvifor ikkje intervjue Ronny Brede Aase til denne artikkelen?
Jøss. Hvorfor i alle dager er det noen som ønsker seg tullprat mellom låter? Det er vel kanskje en grunn til at jeg kun hører på skiver og ikke på radio 🙂
Jeg kan ikke seg for meg at kunstig tullprat blir noe bedre enn ekte tullprat
Har prøvd appen litt nå, og synes konseptet er spennende. Tanken er jo at jeg selv skal kunne styre hvilken type musikk jeg ønsker skal spilles (logger inn på egen spotify-konto), samt at jeg selv velger hvor mye av tiden som skal brukes på musikk og hvor mye som skal være nyheter/podcaster ol. Nyhetsopplesingen har ikke gått helt som jeg hadde ønsket – går litt i stå, men jeg savner ikke generelt tomprat fra en radiovert. Du kan også sette den opp til å spille podcasts, så da er det kanskje muligheter for de som vil å få de dosene en ønsker av radioresepsjonen også. Lurer imidlertid på hvordan det funker med rettigheter – å lese opp nyheter fra vg, db, bbc ol?
Enig, har også testet appen og må innrømme at jeg har begynt å bruke den litt. Stemmeteknologien må forbedres mye, men konseptet fungerer veldig bra. Har blitt glad i vekkerklokka som forteller meg mye god info når jeg våkner.
Når/hvis stemmeteknologien blir på et bra nivå så er jeg ganske sikker på at mange vil benytte dette. Personaliseringen er veldig spennende.