Møt den norske oppstarten som ønsker å utkonkurrere radiopraterne

Den norske oppstarten Capsule.fm lager robot-personligheter til å småprate mellom låter. Målet er å utkonkurrere de menneskelige radiopraterne og tradisjonelle radiokanalene.

Oppstarten Capsule.fm utvikler en app (kun iOS) som lager en personlig lytteropplevelse satt sammen av ulike musikk- og nyhetskilder.

– Lønn til radioverter begrenser radioen som må spille et minste felles multiplum for målgruppen. Robotstemmer endrer dette. Du kan få det beste fra radio – som småprat og musikkintroer – og samtidig få personlig tilpasset innhold, sier Espen Systad i Capsule.fm.

Systads kongstanke er at det finnes en bedre måte å høre på radio og Spotify. Der Facebook i sin tid utviklet en algoritmestyrt nyhetsstrøm av venner, nyheter, og kattevideoer; har Capsule.fm planer om å gjøre noe lignende for lyd.

Espen Systad tar en selfie i Capsule.fm-appen. Basert på bildet vil appen tilpasse en introduksjon og finne passende musikk. Foto: Martin Gundersen CC 2018

Siden det er umulig å spille inn nok unike introduksjoner for ulike låter, værmeldinger, og nyhetsopplesninger har de tatt i bruk kunstig tale, ofte kalt talesyntese.

Målet er altså å dytte radiopraterne ut i kulden. De er ikke alene om den målsetningen.

Amazon har for eksempel mer enn 5 000 ansatte som jobber med deres digitale assistent Alexa, og de gjennomførte nylig en konkurranse mellom 15 universitetslag om å lage den beste digitale samtalepartneren.

Det beste laget klarte å holde en samtale i nesten 20 minutter før dommerne mente samtalen sporet av.

I tillegg har Google og Apple lansert smarthøytalere med målsetningen om å gi deg en mer personalisert lytteropplevelse.

Hils på radio-robotene

Det finnes en rekke forsøk på å utvikle kunstige stemmer vi mennesker oppfatter som komfortable å høre på.

Capsule.fm benytter seg av en database av stemmeinnleste setninger som deretter mikses og settes sammen for å lese opp tekstinnslag. Disse tekstinnslagene er delvis autogenererte etter en rekke regler.

– Vi bruker blant annet geolokasjonen din, været, hvem du følger i appen, og hva som skal avspilles til å avgjøre hvilke introduksjoner vi lager, sier teknisk sjef Tor Langballe i Capsule.fm.

Deretter vil appen prøve å variere hvilke type innhold du får ved å vekte hvor ofte de skal inntreffe. Slik unngår man at været gjentas to ganger i timen, og at for lik musikk spilles rett etter hverandre.

Har egne personligheter

For å gjøre introduksjonene interessante å høre på har de utviklet personaer, kunstige personligheter med særtrekk vi kan kjenne oss igjen i og underholdes av.

Blant annet er personaen «Carl» i Capsule.fm foret på 70-talls slang fra New York. Stemmen er raspete, noe sakte, og dyp.

Noen ganger kan han bli litt filosofisk:

Sound can travel through materials, let’s get materialistic
«Carl» introduserer sangen Ready av PWNDTIAC

– For å menneskeliggjøre personaene har vi lagt inn stemmeartefakter, uvaner, stamming, og spesiell uttale på enkeltord. Noen ganger sier de også feil, og må gjenta seg selv, sier Tor Langballe.

«Miranda», den andre engelske stemmen, er en britisk overklassestemme som foretrekker å flørte mellom låtene. I tillegg har de seks andre personaer, blant annet to norske.

Vil bli «ansiktet utad»

Capsule.fm bruker stemmeteknologien til et annet selskap, og metoden deres er foreløpig basert på skjøtesyntese, en måte å sette sammen lydklipp opplest av mennesker.

– Vi ser at utviklingen går mot å bruke maskinlæring der man genererer stemmer som høres like bra ut som de beste delene av skjøtesyntese, sier Langballe, og forteller at de etterhvert vil se på å gå over til nyere metoder innen talesyntese enn de bruker i dag.

Tor Langballe er teknisk ansvarlig i Capsule.fm. Foto: Martin Gundersen CC 2018

Han tror det framover vil være mulig å velge biblioteker av talesyntese som det skulle være skrifttyper som for eksempel Times New Roman eller Arial. Da kan deres radioverter være ansiktet utad, men basert på andres underliggende teknologi.

Konkurransen om hjemmene våre, og eksklusiv tilgang til ørene våre, er bare i startgropa. Akkurat på hvilken måte vi ønsker å kommunisere muntlig med en maskin er ennå uavklart.

Kanskje, bare kanskje, kan et norsk selskap med base i Berlin lykkes med å bli sentral i neste generasjons lytteropplevelse.

Her kan du få et dypdykk i hvordan maskiner snakker til oss, men om du er travel kan denne figuren gi deg en liten forsmak:

Dette er ikke den første gangen NRKbeta skriver om digitale assistenter og utviklingen på stemmefronten. Sjekk ut våre tidligere saker:

23 kommentarer

Øyvind Michelsen, Oslo

4. mars 2018 at 19:46

Har hatt den glede å kommunisere med Jakob Arvola som så flott hver dag leder oss i gjennom morgentimene i NRK Klassisk og jeg vil ikke unnvære å ha levende personer som leder programmene. Tviler på at jeg kan føre samme samtale med de syntetiske radiovertene. Uansett Jakob og de andre i NRK Klassisk er så flotte og flinke og gir meg tro på livet og lys i livet hver dag så jeg er bitter motstander mot at de skal miste jobbene og erstattes av tekno-syntetiske stemmer. Emosjoner kan ikke programmeres inn, ikke ekte i alle fall. Hilsen Øyvind Michelsen, Oslo, Microsoft Certified Systems Engineer og IT-konsulent og vokal tenor. (OBS jeg er ikke i slekt med eller nær venn til noen i NRK Klassisk, men har lært dem å kjenne via radiosendinger og på Facebook).

Svar på denne kommentaren

Martin Gundersen (NRK) (svar til Øyvind Michelsen, Oslo)
4. mars 2018 at 19:57

Kjekt å høre at du har funnet et radioprogram som treffer deg!
Flere av mine kompiser har det samme til Radioresepsjonen 🙂

Thorbjørn

4. mars 2018 at 19:48

Det er mange av DAB+ kanalene som kunne blitt bedre av slike funksjoner. F.eks Radio Rock burde vurdert en slik funksjon istedet for å bare spille av helt tilfeldig ferdiginnspilt tale mellom sangene.

Svar på denne kommentaren

Helle (svar til Thorbjørn)
5. mars 2018 at 10:14

Radio Rock har ikke hatt ferdiginnspilte kommentarer på flere år. Det er ekte programledere på alle flatene.

BT

4. mars 2018 at 20:27

Skjønner ikke helt målsettingen om å forsøksvis erstatte levende programverter med såkalte roboter. Kan tenkes at det kunne fungere som et tillegg eller alternativ, men ikke som en erstatning.

Til sammenligning kan man ta syntetiske tonegeneratorer – da disse ble tilgjengelige på det brede markedet for 30-40 år siden, fryktet mange tradisjonelle musikere at «ekte» instrumenter ville bli utklassert av synthesizere. Det skjedde som kjent ikke. Det er fortsatt et marked for fiolin, klarinett og samtlige andre orkesterinstrumenter.

Svar på denne kommentaren

Stian Johansen

4. mars 2018 at 20:43

Latterlig. Mennesker har bruk for ekte menneske prat!

Svar på denne kommentaren

Christina Palmesen (svar til Stian Johansen)
4. mars 2018 at 21:16

Støttes 😃
Inge Wallumrød (svar til Stian Johansen)
4. mars 2018 at 21:22

Ekte menneskeprat har vi hørt i alle år! La oss prøve noe nytt.
Terje (svar til Stian Johansen)
6. mars 2018 at 15:27

Du mener hjernedødt tomprat 🙂

Spock

4. mars 2018 at 21:19

Gleder meg! Ramlet tilfeldigvis innom Radio 1 lørdag kveld, hvor radioverten serverte følgende kloke ord etter å ha spilt ei låt:

– Og det var Kygo som ga deg en skikkelig dose insulin denne lørdagen!

Svar på denne kommentaren

Emil

5. mars 2018 at 00:00

Vel, denne kommer ikke til å erstatte RadioResepsjonen på en god stund 🙂

Men, til korte nyhetsreplikker, litt lett prat om været / trafikkhendelser…

Svar på denne kommentaren

Rune

5. mars 2018 at 03:48

Ble skvisa ut som radiolytter for noen måneder siden, så derfor merker jeg ikke forskjell på hvem som prater i radio.

Svar på denne kommentaren

Martin Gundersen (NRK) (svar til Rune)
5. mars 2018 at 10:15

Da er spørsmålet, hva hører du på i dag? (Podkast, kun musikk?)

Kjell Berglund

5. mars 2018 at 10:56

For en utrolig latterlig og unødvendig ting å bruke en smart hjerne på å lage

Svar på denne kommentaren

Martin Gundersen (NRK) (svar til Kjell Berglund)
5. mars 2018 at 10:58

Hva er latterlig med å prøve ut nye måter å levere lydinnhold?

Sondre »slim shady» Tiset

5. mars 2018 at 14:16

Jeg kan forstå smått innputt fra »robotstemmer» til å introdusere en sang, eller for en rask nyhet/vær-varsling. Men jeg ville aldri trekket det så langt som å si at dette er en erstatning for radiovertene, type radioresepsjonen og andre lignende programmer.
Du vil aldri få den samme typen personlighet fra et kunstig intelligens som du vil få fra et menneske.

Svar på denne kommentaren

Martin Gundersen (NRK) (svar til Sondre ''slim shady'' Tiset)
6. mars 2018 at 12:14

Jeg tror du har et godt poeng her. Det er nok lenge til intervju- og samtaleprogrammer vil få konkurranse av disse stemmene, men det blir spennende å se hvordan de kan integreres i hverdagen.

Trond

5. mars 2018 at 17:34

Støtter det ekte.
Er gått veldig lei av alt mulig skal bli erstattet av kunstig og maskinelt!

Svar på denne kommentaren

Marit Skaarland

5. mars 2018 at 19:30

Eg gler meg til alle menneskje har blitt erstatta av robotar og ingen jobbar lenger eller har kontakt med andre menneskjer, då blir det paradis på jord!

Svar på denne kommentaren

Raymond

7. mars 2018 at 10:07

Oi, her gjekk de glipp av ein sjanse. Kvifor ikkje intervjue Ronny Brede Aase til denne artikkelen?

Svar på denne kommentaren

Greven

9. mars 2018 at 16:39

Jøss. Hvorfor i alle dager er det noen som ønsker seg tullprat mellom låter? Det er vel kanskje en grunn til at jeg kun hører på skiver og ikke på radio 🙂

Jeg kan ikke seg for meg at kunstig tullprat blir noe bedre enn ekte tullprat

Svar på denne kommentaren

Karl

14. mars 2018 at 18:18

Har prøvd appen litt nå, og synes konseptet er spennende. Tanken er jo at jeg selv skal kunne styre hvilken type musikk jeg ønsker skal spilles (logger inn på egen spotify-konto), samt at jeg selv velger hvor mye av tiden som skal brukes på musikk og hvor mye som skal være nyheter/podcaster ol. Nyhetsopplesingen har ikke gått helt som jeg hadde ønsket – går litt i stå, men jeg savner ikke generelt tomprat fra en radiovert. Du kan også sette den opp til å spille podcasts, så da er det kanskje muligheter for de som vil å få de dosene en ønsker av radioresepsjonen også. Lurer imidlertid på hvordan det funker med rettigheter – å lese opp nyheter fra vg, db, bbc ol?

Svar på denne kommentaren

Erlend (svar til Karl)
17. mars 2018 at 10:35

Enig, har også testet appen og må innrømme at jeg har begynt å bruke den litt. Stemmeteknologien må forbedres mye, men konseptet fungerer veldig bra. Har blitt glad i vekkerklokka som forteller meg mye god info når jeg våkner.
Når/hvis stemmeteknologien blir på et bra nivå så er jeg ganske sikker på at mange vil benytte dette. Personaliseringen er veldig spennende.

Legg igjen en kommentar Avbryt svar

Øyvind Michelsen, Oslo
4. mars 2018 at 19:46

Har hatt den glede å kommunisere med Jakob Arvola som så flott hver dag leder oss i gjennom morgentimene i NRK Klassisk og jeg vil ikke unnvære å ha levende personer som leder programmene. Tviler på at jeg kan føre samme samtale med de syntetiske radiovertene. Uansett Jakob og de andre i NRK Klassisk er så flotte og flinke og gir meg tro på livet og lys i livet hver dag så jeg er bitter motstander mot at de skal miste jobbene og erstattes av tekno-syntetiske stemmer. Emosjoner kan ikke programmeres inn, ikke ekte i alle fall. Hilsen Øyvind Michelsen, Oslo, Microsoft Certified Systems Engineer og IT-konsulent og vokal tenor. (OBS jeg er ikke i slekt med eller nær venn til noen i NRK Klassisk, men har lært dem å kjenne via radiosendinger og på Facebook).

Svar på denne kommentaren

Thorbjørn
4. mars 2018 at 19:48

Det er mange av DAB+ kanalene som kunne blitt bedre av slike funksjoner. F.eks Radio Rock burde vurdert en slik funksjon istedet for å bare spille av helt tilfeldig ferdiginnspilt tale mellom sangene.

Svar på denne kommentaren

BT
4. mars 2018 at 20:27

Skjønner ikke helt målsettingen om å forsøksvis erstatte levende programverter med såkalte roboter. Kan tenkes at det kunne fungere som et tillegg eller alternativ, men ikke som en erstatning.

Til sammenligning kan man ta syntetiske tonegeneratorer – da disse ble tilgjengelige på det brede markedet for 30-40 år siden, fryktet mange tradisjonelle musikere at «ekte» instrumenter ville bli utklassert av synthesizere. Det skjedde som kjent ikke. Det er fortsatt et marked for fiolin, klarinett og samtlige andre orkesterinstrumenter.

Svar på denne kommentaren
Stian Johansen
4. mars 2018 at 20:43

Latterlig. Mennesker har bruk for ekte menneske prat!

Svar på denne kommentaren

Spock
4. mars 2018 at 21:19

Gleder meg! Ramlet tilfeldigvis innom Radio 1 lørdag kveld, hvor radioverten serverte følgende kloke ord etter å ha spilt ei låt:

– Og det var Kygo som ga deg en skikkelig dose insulin denne lørdagen!

Svar på denne kommentaren
Emil
5. mars 2018 at 00:00

Vel, denne kommer ikke til å erstatte RadioResepsjonen på en god stund 🙂

Men, til korte nyhetsreplikker, litt lett prat om været / trafikkhendelser…

Svar på denne kommentaren
Rune
5. mars 2018 at 03:48

Ble skvisa ut som radiolytter for noen måneder siden, så derfor merker jeg ikke forskjell på hvem som prater i radio.

Svar på denne kommentaren

Kjell Berglund
5. mars 2018 at 10:56

For en utrolig latterlig og unødvendig ting å bruke en smart hjerne på å lage

Svar på denne kommentaren

Sondre »slim shady» Tiset
5. mars 2018 at 14:16

Jeg kan forstå smått innputt fra »robotstemmer» til å introdusere en sang, eller for en rask nyhet/vær-varsling. Men jeg ville aldri trekket det så langt som å si at dette er en erstatning for radiovertene, type radioresepsjonen og andre lignende programmer.
Du vil aldri få den samme typen personlighet fra et kunstig intelligens som du vil få fra et menneske.

Svar på denne kommentaren

Trond
5. mars 2018 at 17:34

Støtter det ekte.
Er gått veldig lei av alt mulig skal bli erstattet av kunstig og maskinelt!

Svar på denne kommentaren
Marit Skaarland
5. mars 2018 at 19:30

Eg gler meg til alle menneskje har blitt erstatta av robotar og ingen jobbar lenger eller har kontakt med andre menneskjer, då blir det paradis på jord!

Svar på denne kommentaren
Raymond
7. mars 2018 at 10:07

Oi, her gjekk de glipp av ein sjanse. Kvifor ikkje intervjue Ronny Brede Aase til denne artikkelen?

Svar på denne kommentaren
Greven
9. mars 2018 at 16:39

Jøss. Hvorfor i alle dager er det noen som ønsker seg tullprat mellom låter? Det er vel kanskje en grunn til at jeg kun hører på skiver og ikke på radio 🙂

Jeg kan ikke seg for meg at kunstig tullprat blir noe bedre enn ekte tullprat

Svar på denne kommentaren
Karl
14. mars 2018 at 18:18

Har prøvd appen litt nå, og synes konseptet er spennende. Tanken er jo at jeg selv skal kunne styre hvilken type musikk jeg ønsker skal spilles (logger inn på egen spotify-konto), samt at jeg selv velger hvor mye av tiden som skal brukes på musikk og hvor mye som skal være nyheter/podcaster ol. Nyhetsopplesingen har ikke gått helt som jeg hadde ønsket – går litt i stå, men jeg savner ikke generelt tomprat fra en radiovert. Du kan også sette den opp til å spille podcasts, så da er det kanskje muligheter for de som vil å få de dosene en ønsker av radioresepsjonen også. Lurer imidlertid på hvordan det funker med rettigheter – å lese opp nyheter fra vg, db, bbc ol?

Svar på denne kommentaren

Vis 23 kommentarer

Hils på radio-robotene

Har egne personligheter

Vil bli «ansiktet utad»

23 kommentarer

Øyvind Michelsen, Oslo

Martin Gundersen (NRK) (svar til Øyvind Michelsen, Oslo)

Thorbjørn

Helle (svar til Thorbjørn)

BT

Stian Johansen

Christina Palmesen (svar til Stian Johansen)

Inge Wallumrød (svar til Stian Johansen)

Terje (svar til Stian Johansen)

Spock

Emil

Rune

Martin Gundersen (NRK) (svar til Rune)

Kjell Berglund

Martin Gundersen (NRK) (svar til Kjell Berglund)

Sondre »slim shady» Tiset

Martin Gundersen (NRK) (svar til Sondre ''slim shady'' Tiset)

Trond

Marit Skaarland

Raymond

Greven

Karl

Erlend (svar til Karl)

Legg igjen en kommentar Avbryt svar