nrk.no

Slik ble Ole Rolfsrud et språkgeni

Kategorier: Kunstig intelligens & NRK-stoff

Skjermdump av redigeringsprogramvaren i AI-tjenesten HeyGen som lar Ole Rolfsrud snakke alle verdens språk.
Sjakkprogramleder Ole Rolfsrud ble – ved hjelp av kunstig intelligens – plutselig i stand til å snakke russisk og mandarin. Illustrasjon: Heygen / Marius Arnesen

Vi fikk en NRK-programleder til å snakke i fire minutter på norsk. Nå kan vi få ham til å snakke uendelig lenge på språk han ikke kan.

I år er det VM i lyn- og hurtigsjakk, hvor sjakkyndling Magnus Carlsen stiller ved brettet.

Det var i denne forbindelse at vi i NRKbeta fikk en henvendelse fra sjakk-programleder Ole Rolfsrud. Han ville under sendingene snakke om mennesker mot maskiner innen sjakksporten.

Ole ville imidlertid også ha noe litt mer «visuelt og lett forståelig bruk av kunstig intelligens», som han så fint uttrykte det.

For la oss være ærlige – det er ikke kjempelett for oss vanlige dødelige å forstå hva som egentlig foregår inne i en sjakk-computer. Vi bestemte oss derfor for å lage en video av Ole hvor vi – ved hjelp av kunstig intelligens – lar ham bli svært språkmektig.

Resultatet ble videoen under. Her snakker Ole to språk han ikke kan:

Slik laget vi videoen

En av de mer «visuelle og lett forståelige» bruksområdene for kunstig intelligens, som vi i NRKbeta har lekt med de siste månedene, er en variant av såkalte deepfakes.

Kort forklart er deepfakes falske videoer som er laget ved hjelp av kunstig intelligens, hvor man i teorien kan få hvem som helst til å si hva som helst, på et hvilket som helst språk.

Og det var akkurat det vi ville gjøre med Ole. Det fikk være både visuelt og tydelig nok for sjakkpublikumet når det kommer til hva kunstig intelligens også kan brukes til ut over det å flytte sjakkbrikker.

Vi har lenge testet et verktøy ved navn HeyGen. Dette er en kommersiell tjeneste, hvor man ved å kjøpe et månedsabonnement til rundt 500 kroner. Det gir deg muligheten til å lage såkalte avatarer som kan brukes til å lage syntetiske videoer.

Heygen.com er en av tjenestene som gjør denne jobben svært lett. Foto: Skjermdump fra Heygen.com

En avatar i denne sammenheng er en modell av et menneske. I HeyGen lages avataren ved at man laster opp en fire minutter lang video hvor en person skravler. Om hva som helst. På hvilket som helst språk.

HeyGen bruker så denne videoen for å lage en digital versjon av deg – en avatar. Og det var akkurat det vi gjorde i NRKbeta-kroken med Ole.

Ole Rolfsrud går fra menneske til avatar.

I tillegg måtte Ole lese inn et samtykke, hvor han gav HeyGen lov til å bruke videoen han akkurat spilte inn, som treningsmateriale for å lage avataren. Det er heller ikke mulig å lage avatarer av barn.

En språkallmektig Ole

Resultatet, etter litt fikling og tilpassing av timing og språk, var at Ole kunne snakke både engelsk, russisk, mandarin og svensk. I en og samme video.

Alt ble laget i nettleseren ved at vi skrev inn en tekst av hva vi ville at Ole skulle si. Deretter trykket vi på oversettelsesknappen og valgte språket han skulle snakke. Vips, så var en syntetisk video generert.

Resultatet ble ganske overbevisende. Vi stolte dog ikke helt på at språket var riktig, og vi gjorde derfor også en sjekk med noen som har russisk og mandarin som morsmål for å verifisere at dette faktisk var korrekt. Ifølge dem er oversettelsene svært gode.

«Human in the loop» er jo et godt prinsipp når det kommer til den litt vanskelige blandingen mellom allmennkringkasting og kunstig intelligens.

Om du ikke har sett videoen allerede, dette ble resultatet:

Straks i en nyhetssending nær deg?

Så hvor langt unna er vi at for eksempel nyhetssendinger består av syntetiske programledere som introduserer innslag og leser nyheter for deg?

Ikke langt skal vi tro gründerne bak oppstartsselskapet «Channel 1 News». De ønsker å i løpet av 2024 starte en nyhetskanal drevet av kunstig intelligens, hvor programlederen og nyhetsoppleserne vil være generert på samme måte som vi laget videoer av Ole.

Selskapet tar sikte på å starte med en 30 minutters ukentlig nyhetssending med syntetiske nyhetsankre i løpet av 2024, og deretter utvide sendingene til å produsere flere tusen klipp per dag.

Foreløpig er teknologien imidlertid ikke helt klar for å skaleres opp, og det er fortsatt litt for dataspillaktige programledere. Det en av grunnene til at du ennå ser en Ole Rolfsrud av kjøtt og blod under sjakksendingene, og ikke en syntetisk generert versjon.

10 kommentarer

  1. Mathias Haugsbø

    Er ikke lenge før «alt» vi ser på Internett er generert og fake 🫡

    Men hadde vært supert om dere kunne sett på å bruke ai eller mer moderne text to speech teknologi på å oppgradere den forferdelige roboten som snakker på NRK Nyheter radiokanalen når det oversettes fra et annet språk.

    Svar på denne kommentaren

  2. Litt off-topic, men det er et tema som Beta bør ta snarest. Siden NRK i sin visdom(?) har besluttet å trekke seg fra TuneIn blir det snart stille i mange høyttalere hvor man så langt har kunnet si «Hei Google, sett på NRK P1 på bad». Kanskje på tide med en oppdatering av denne seks år gamle episoden:
    nrkbeta.no/2018/09/18/mine-tre-beste-tips-for-a-leve-med-smarthoyttaler/

    Svar på denne kommentaren

    • NRK har de siste årene gjort det så vanskelig som mulig å bruke andre apper enn deres egne som de er så «veldig» stolte over. Skulle tro de var en kommersiell aktør og IKKE finansiert av skattebetalerne.

Vil du kommentere? Svar på en quiz fra saken!

Vi er opptatt av kvaliteten på kommentarfeltet vårt. Derfor ønsker vi å sikre oss at alle som kommenterer, faktisk har lest saken. Svar på spørsmålene nedenfor for å låse opp kommentarfeltet.

Hvor lenge må en treningsvideo minimum være i vårt eksempel?

Hvilke språk har vi lært Ole?

Hvilken programvare har vi brukt?

Legg igjen en kommentar

Din e-postadresse vil ikke bli publisert. Obligatoriske felt er merket med *. Les vår personvernserklæring for informasjon om hvilke data vi lagrer om deg som kommenterer.