Møt den norske oppstarten som ønsker å utkonkurrere radiopraterne

Kategorier: Kunstig intelligens, Lyd, Radio & Teknologi og forbruker

Ronny Brede Aase er programleder for P3morgen. Bildet er tatt ved en annen anledning Foto: NRK

Den norske oppstarten Capsule.fm lager robot-personligheter til å småprate mellom låter. Målet er å utkonkurrere de menneskelige radiopraterne og tradisjonelle radiokanalene.

Oppstarten Capsule.fm utvikler en app (kun iOS) som lager en personlig lytteropplevelse satt sammen av ulike musikk- og nyhetskilder.

– Lønn til radioverter begrenser radioen som må spille et minste felles multiplum for målgruppen. Robotstemmer endrer dette. Du kan få det beste fra radio – som småprat og musikkintroer – og samtidig få personlig tilpasset innhold, sier Espen Systad i Capsule.fm.

Systads kongstanke er at det finnes en bedre måte å høre på radio og Spotify. Der Facebook i sin tid utviklet en algoritmestyrt nyhetsstrøm av venner, nyheter, og kattevideoer; har Capsule.fm planer om å gjøre noe lignende for lyd.

Espen Systad tar en selfie i Capsule.fm-appen. Basert på bildet vil appen tilpasse en introduksjon og finne passende musikk. Foto: Martin Gundersen CC 2018

Siden det er umulig å spille inn nok unike introduksjoner for ulike låter, værmeldinger, og nyhetsopplesninger har de tatt i bruk kunstig tale, ofte kalt talesyntese.

Målet er altså å dytte radiopraterne ut i kulden. De er ikke alene om den målsetningen.

Amazon har for eksempel mer enn 5 000 ansatte som jobber med deres digitale assistent Alexa, og de gjennomførte nylig en konkurranse mellom 15 universitetslag om å lage den beste digitale samtalepartneren.

Det beste laget klarte å holde en samtale i nesten 20 minutter før dommerne mente samtalen sporet av.

I tillegg har Google og Apple lansert smarthøytalere med målsetningen om å gi deg en mer personalisert lytteropplevelse.

Hils på radio-robotene

Det finnes en rekke forsøk på å utvikle kunstige stemmer vi mennesker oppfatter som komfortable å høre på.

Capsule.fm benytter seg av en database av stemmeinnleste setninger som deretter mikses og settes sammen for å lese opp tekstinnslag. Disse tekstinnslagene er delvis autogenererte etter en rekke regler.

– Vi bruker blant annet geolokasjonen din, været, hvem du følger i appen, og hva som skal avspilles til å avgjøre hvilke introduksjoner vi lager, sier teknisk sjef Tor Langballe i Capsule.fm.

Deretter vil appen prøve å variere hvilke type innhold du får ved å vekte hvor ofte de skal inntreffe. Slik unngår man at været gjentas to ganger i timen, og at for lik musikk spilles rett etter hverandre.

Har egne personligheter

For å gjøre introduksjonene interessante å høre på har de utviklet personaer, kunstige personligheter med særtrekk vi kan kjenne oss igjen i og underholdes av.

Blant annet er personaen «Carl» i Capsule.fm foret på 70-talls slang fra New York. Stemmen er raspete, noe sakte, og dyp.

Noen ganger kan han bli litt filosofisk:

Sound can travel through materials, let’s get materialistic
«Carl» introduserer sangen Ready av PWNDTIAC

– For å menneskeliggjøre personaene har vi lagt inn stemmeartefakter, uvaner, stamming, og spesiell uttale på enkeltord. Noen ganger sier de også feil, og må gjenta seg selv, sier Tor Langballe.

«Miranda», den andre engelske stemmen, er en britisk overklassestemme som foretrekker å flørte mellom låtene. I tillegg har de seks andre personaer, blant annet to norske.

Vil bli «ansiktet utad»

Capsule.fm bruker stemmeteknologien til et annet selskap, og metoden deres er foreløpig basert på skjøtesyntese, en måte å sette sammen lydklipp opplest av mennesker.

– Vi ser at utviklingen går mot å bruke maskinlæring der man genererer stemmer som høres like bra ut som de beste delene av skjøtesyntese, sier Langballe, og forteller at de etterhvert vil se på å gå over til nyere metoder innen talesyntese enn de bruker i dag.

Tor Langballe er teknisk ansvarlig i Capsule.fm. Foto: Martin Gundersen CC 2018

Han tror det framover vil være mulig å velge biblioteker av talesyntese som det skulle være skrifttyper som for eksempel Times New Roman eller Arial. Da kan deres radioverter være ansiktet utad, men basert på andres underliggende teknologi.

Konkurransen om hjemmene våre, og eksklusiv tilgang til ørene våre, er bare i startgropa. Akkurat på hvilken måte vi ønsker å kommunisere muntlig med en maskin er ennå uavklart.

Kanskje, bare kanskje, kan et norsk selskap med base i Berlin lykkes med å bli sentral i neste generasjons lytteropplevelse.

Her kan du få et dypdykk i hvordan maskiner snakker til oss, men om du er travel kan denne figuren gi deg en liten forsmak:

Grafikk: NRKbeta.no CC-BY-SA 2018

Dette er ikke den første gangen NRKbeta skriver om digitale assistenter og utviklingen på stemmefronten. Sjekk ut våre tidligere saker:

23 kommentarer

  1. Har hatt den glede å kommunisere med Jakob Arvola som så flott hver dag leder oss i gjennom morgentimene i NRK Klassisk og jeg vil ikke unnvære å ha levende personer som leder programmene. Tviler på at jeg kan føre samme samtale med de syntetiske radiovertene. Uansett Jakob og de andre i NRK Klassisk er så flotte og flinke og gir meg tro på livet og lys i livet hver dag så jeg er bitter motstander mot at de skal miste jobbene og erstattes av tekno-syntetiske stemmer. Emosjoner kan ikke programmeres inn, ikke ekte i alle fall. Hilsen Øyvind Michelsen, Oslo, Microsoft Certified Systems Engineer og IT-konsulent og vokal tenor. (OBS jeg er ikke i slekt med eller nær venn til noen i NRK Klassisk, men har lært dem å kjenne via radiosendinger og på Facebook).

    Svar på denne kommentaren

  2. Det er mange av DAB+ kanalene som kunne blitt bedre av slike funksjoner. F.eks Radio Rock burde vurdert en slik funksjon istedet for å bare spille av helt tilfeldig ferdiginnspilt tale mellom sangene.

    Svar på denne kommentaren

    • Radio Rock har ikke hatt ferdiginnspilte kommentarer på flere år. Det er ekte programledere på alle flatene.

  3. Skjønner ikke helt målsettingen om å forsøksvis erstatte levende programverter med såkalte roboter. Kan tenkes at det kunne fungere som et tillegg eller alternativ, men ikke som en erstatning.

    Til sammenligning kan man ta syntetiske tonegeneratorer – da disse ble tilgjengelige på det brede markedet for 30-40 år siden, fryktet mange tradisjonelle musikere at «ekte» instrumenter ville bli utklassert av synthesizere. Det skjedde som kjent ikke. Det er fortsatt et marked for fiolin, klarinett og samtlige andre orkesterinstrumenter.

    Svar på denne kommentaren

  4. Gleder meg! Ramlet tilfeldigvis innom Radio 1 lørdag kveld, hvor radioverten serverte følgende kloke ord etter å ha spilt ei låt:

    – Og det var Kygo som ga deg en skikkelig dose insulin denne lørdagen!

    Svar på denne kommentaren

  5. Sondre ''slim shady'' Tiset

    Jeg kan forstå smått innputt fra »robotstemmer» til å introdusere en sang, eller for en rask nyhet/vær-varsling. Men jeg ville aldri trekket det så langt som å si at dette er en erstatning for radiovertene, type radioresepsjonen og andre lignende programmer.
    Du vil aldri få den samme typen personlighet fra et kunstig intelligens som du vil få fra et menneske.

    Svar på denne kommentaren

  6. Jøss. Hvorfor i alle dager er det noen som ønsker seg tullprat mellom låter? Det er vel kanskje en grunn til at jeg kun hører på skiver og ikke på radio 🙂

    Jeg kan ikke seg for meg at kunstig tullprat blir noe bedre enn ekte tullprat

    Svar på denne kommentaren

  7. Har prøvd appen litt nå, og synes konseptet er spennende. Tanken er jo at jeg selv skal kunne styre hvilken type musikk jeg ønsker skal spilles (logger inn på egen spotify-konto), samt at jeg selv velger hvor mye av tiden som skal brukes på musikk og hvor mye som skal være nyheter/podcaster ol. Nyhetsopplesingen har ikke gått helt som jeg hadde ønsket – går litt i stå, men jeg savner ikke generelt tomprat fra en radiovert. Du kan også sette den opp til å spille podcasts, så da er det kanskje muligheter for de som vil å få de dosene en ønsker av radioresepsjonen også. Lurer imidlertid på hvordan det funker med rettigheter – å lese opp nyheter fra vg, db, bbc ol?

    Svar på denne kommentaren

    • Erlend (svar til Karl)

      Enig, har også testet appen og må innrømme at jeg har begynt å bruke den litt. Stemmeteknologien må forbedres mye, men konseptet fungerer veldig bra. Har blitt glad i vekkerklokka som forteller meg mye god info når jeg våkner.
      Når/hvis stemmeteknologien blir på et bra nivå så er jeg ganske sikker på at mange vil benytte dette. Personaliseringen er veldig spennende.

Legg igjen en kommentar

Din e-postadresse vil ikke bli publisert. Obligatoriske felt er merket med *. Les vår personvernserklæring for informasjon om hvilke data vi lagrer om deg som kommenterer.