Falske soverom, katter og mennesker

Kategorier: Kunstig intelligens & Nettjenester

Flere nye prosjekter basert på StyleGAN har dukket opp den siste uka, en teknologi som kan lage fotorealistiske objekter av nesten hva som helst. Faksimile fra whichfaceisreal.com

Teknologiselskapet Nvidia har utviklet et system som kan skape troverdige, falske varianter av omtrent hva som helst. Det har tatt uante veier.

Tidligere i år skrev vi om StyleGAN, Nvidias nye teknologi for å lage falske portrettbilder. I ettertid har Nvidia frigitt koden til StyleGAN, og utviklere verden over har lekt seg med teknologien.

Denne personen finnes ikke

Den første nettsiden som dukket opp var This person does not exist – en side som kun viser deg et portrettbilde generert med StyleGAN. Phillip Wang er utvikleren, som i etterkant også har laget en variant for internettets favorittdyr: katten.

De falske kattebildene ser ikke alltid like gjennomført ut som portrettbildene av mennesker, og i blant dukker det opp noen særdeles rare artifakter:

Vi er veldig glade for at disse kattene ikke eksisterer. Foto: thiscatdoesnotexist.com

Fungerer også for anime

Twitter-brukeren Gwern har brukt StyleGAN for å lage nye anime-karakterer:

…og for soverom

Google-ingeniøren Christopher Schmidt har tatt det hele ett steg videre, og har kombinert flere teknikker for å lage nettsiden This AirBnb does not exist.

Disse soverommene eksisterer ikke.

Her kombinerer Schmidt flere disipliner: Bildene er generert med StyleGAN, mens beskrivelsen til AirBnb-annonsen kommer fra et maskinlæringsbibliotek som automatisk kan generere realistisk tekst.

Interessert i AI, maskinlæring og teknologi?

Vi følger med på de siste bevegelsene innenfor kunstig intelligens. Få et ping i postkassa hver gang vi publiserer noe!

Ser du hvilket bilde som er falsk?

Den siste og kanskje mest interessante nettsiden som bruker StyleGAN er Which face is real?

Which face is real er utviklet ved Universitetet i Washington, som en del av læreplanen til kurset Calling Bullshit, som har som mål å fremme fokuset på feilinformasjon i samfunnet anno 2019.

We feel that the world has become over-saturated with bullshit and we’re sick of it.

Calling Bullshit

Her blir man presentert med to valg: Ett ekte portrettfoto, og ett som er generert av StyleGAN.

Det er usedvanlig vanskelig å se hvilket bilde som er ekte. Faksimile fra whichfaceisreal.com

Vi prøvde dette innad i redaksjonen. De fleste av oss klarte ikke å gjette riktig mer enn 50% av gangene, men etter hvert fant vi ut at StyleGAN ofte surrer litt med bakgrunnene. Så ved å fokusere på bakgrunnen i stedet for selve ansiktet, klarte vi de fleste.

Hvor bærer dette?

Det kreves ganske mye datakraft for å trene StyleGAN på nye objekter, så foreløpig må vi klare oss med falske katter, leiligheter, biler og mennesker.

Det er likevel liten tvil om at det skjer mye innenfor maskinlæring på bildemateriale, og vi i NRKbeta følger utviklingen nøye.

40 kommentarer

    • Ja, nytteverdien av artikkelen deres er som du sier. Men deltakelse i spillet som refereres til vil vel egentlig mest bidra til bedret trening av maskinlæringa? Og når da det fabrikerte beskrives som skummelt bra, virker det noe paradoksalt.

      Spørsmålet jeg stilte i første kommentar var bare spontant, hvor nytteverdien ligger i at vi utvikler en stadig bedre evne hos maskinen til å fabrikere. Hva driver denne utviklinga?

    • Royba (svar til Even)

      Nytten er at menneske lærer seg kritisk tenkning. Vi er inne i en ny historisk tid der vi går fra følelsestyrt til fornuft. Dette har alltid gått i syklus.

      AI vil gjøre at mennesker blir mer klar over at vår subjektive virkelighet som vi tror er utenfor oss selv, faktisk er i oss selv. Den tvinger folk til å forstå seg selv og verden på en annen måte.

    • Andre (svar til Even)

      Nytteverdien ligger i at mange politikere/ prominente mennesker blir utpresset gjennom sex, gjerne med mindreårige. Dette blir filmet og flere slike videoer er nå på avveie. Eliten prøver nå å komme disse kommende avsløringene i forkjøpet, slik at vi tror det bare er ‘fake’. Derfor vil vi høre mye mer om falske bilder og videoer i media i nær framtid. For en tid vi lever i.

    • Veronika (svar til Even)

      Det er stor nytteverdi i å kunne produsere syntetiske data for trening av maskinlæringsalgoritmer. I mange tilfeller er datasettene for små til å få effektiv læring ut av algoritmene, da er syntetiske data som dette gull verdt. Hvis algoritmene jobber med computer vision, i så tilfelle.

    • Veronika, angående teknisk nytteverdi å produsere syntetisk data for trening av maskinlæringsalgoritmer.

      Vil ikke det trene maskinlæringa i dette tilfellet på å fordype seg i uperfekte gjengivelser av virkeligheten?

      Hvis maskinlæringa baseres på å etterlikne fabrikerte bilder, var min første tanke at den ville forsterke avvikene, og bli god på å fabrikere det fabrikerte.

      Tar jeg feil? Hva er computer vision i denne sammenheng?

      (NB I selskapet av NRK betas lesere og journalister, burde jeg sikkert vite det, men jeg kan ikke dette faget.)

    • Andre, jeg er ikke så begeistret over konspirasjonsteorier som forklaring på menneskelig utvikling. De fleste konspirasjonsteorier faller sammen i et paradoks av at endring er en konstant faktor i verden, og som kjerne i konspirasjonsteorier ligger en idé om institusjoner som består uforandret.

      Det er mye elendige mennesker i alle samfunnslag, og makt korrumperer. I det minste utfordrer den hver av oss i det vi har den, til å fortsette å handle etisk. Mange mennesker feiler den testen.

      Teknologisk nyvinning virker mer drevet av andre mekanismer enn å skulle skjule moralsk forfall. Nysgjerrighet, overlevelse (våpenkappløp), sjalusi / konkurranseinstinkt.

      Utfordringen er at ingen av de mekanismene i seg selv innebærer refleksjon over nytten/fornuften av å gjennomføre utviklinga. Overlevelse kunne hevdes å gjøre det, men den er som oftest i et eksistensielt perspektiv kortsiktig basert.

      Jeg tror det er viktig å ikke blande inn forenklende ideer om en elites maktmisbruk, når en skal forsøke å forstå det komplekse kaos av endring verden er.

    • Ragnar (svar til Even)

      Det er gode forfalskninger, men om man ser nøye etter, spesielt i detaljene til hår, er det ikke så vanskelig å se hvilken som er falsk. I tillegg er bakgrunnen i de fleste bildene lett å se at ikke er ekte. Du kan også se at de genererte bildene i mange tilfeller virker flatere med mindre dybdeeffekter slik man får med ekte kameraer og at posituren til subjektet i de fleste bildene er mindre utfordrende.
      Overgangen mellom hår og bakgrunn er nok den beste indikatoren, det ser ut til å være små problemer der som ikke ser troverdig ut.
      Hadde jeg ikke visst at at en av de var falske hadde jeg nok aldri stusset over det. Av de 8 første fikk jeg 2 feil, men så fort jeg skjønte hva jeg skulle se etter har jeg ikke fått en eneste feil etter det.
      Jeg lurer på når denne funksjonen kommer i Photoshop?

    • Trenger at å være nyttig i seg selv?

      Vi har nok av oppfinnelser opp gjennom tiden hvor nytteverdien ikke var veldig åpenbar i seg selv, men som senere har vist seg svært nyttige (uten at jeg kommer på så mange konkrete eksempler akkurat nå).

      Dette utvider vår totale kunnskap, noe som er nyttig i seg selv.

    • Kristian, nei, det trenger det jo ikke. Grunnforskning har gitt mye kunnskap som tok lang tid før ble oppdaget nytteverdi av.

      Det som gjør at jeg stiller spørsmålet, er vel fordi vi alt i startfasen her ser en åpenbar problematikk. Atombombe-sammenlikningen er ikke helt søkt.

      Når Martin i beta svarer at artikkelen viser oss det problematiske med det fabrikerte, er det interessant at selve dekningen samtidig vil bidra til økning av den samme problemstillinga fordi maskinlæringa bedres.

      Ingen av forslagene i kommentarfeltet, bortsett fra Veronikas, nevner annet enn primært negative bruksområder – forfalskning, misleding, økt AI-trening. Alle områdene kan anvendes i et godt formål, men det åpenbare formålet er destruktivt i natur.

    • Man skal ikke bagatellisere negative følger, men likevel være relativt nøkterne.

      Så godt som alle faremomentene som nevnes her kan også sies å gjelde for bøker og skrift i alle former. Det er jo ikke problemfritt der heller (f.eks. i en roman, om personene egentlig er de levende personene N.N og M.M), men vi klarer å handtere det.

      «Fotorealistiske» bilder og videoer vil komme; vi må bare forholde oss til det. Og lære oss tilsvarende kritisk sans: Ingen tar en tekstlig beskrivelse av en politisk motstander, presnetert i et partiorgan, som noen Absolutt Sannhet. Ingen tar en politisk karikaturtegning som et sant portrett. Ingen tar en revykunstners parodi på en politikers talestil som «ekte».

      Vi må lære oss til å vite at det du ser på skjermen kan være like generert som en roman, selv om både romanfigurene og skjermbildene ligner på virkelige mennesker. Ikke at vi skal automatisk godta hva som helst, men dette er ikke noe prinsipielt nytt og ukontrollert / ukontrollerbart. Det er bare å bruke en datamaskin som verktøy, i stedet for en tegneblokk eller en skrivemaskin.

    • Keal, jeg følger deg på at vi må tilpasse hvordan vi vurderer bilder, og at når det fabrikerte blir ikke skillbart fra dokumentasjon av virkelighet, vil vi egentlig bare gå bort fra å anse bilder som «bevis».

      Jeg synes samtidig du velger å overse det Beta problematiserer, at en AI lærer seg å generere noe vi mister forutsetningene til å skille fra faktisk virkelighet.

      Når vi gjetter på hvilke bilder som er ekte og fabrikerte, gir vi AIen tilbakemelding på hva som fungerer og ikke. Dermed hjelper vi den til å forstå hva vi overser og hvordan vi vurderer.

      En illusjonist vet at kombinasjonen avleding og utnyttelse av forventning kan lure oss. På sett og vis er det ikke å gjengi virkeligheten korrekt AIen lærer seg når dens læring er dels basert på menneskelig tilbakemelding i form av gjettinga. Den lærer hvordan og hva vi vurderer.

      Nytteverdien av å lære noe som lærer fortere enn meg og tenker / beregner fortere enn meg, hvordan vi fungerer, ringer av selvdestruktivt. Uenig?

      Så selv om du har gode poeng, gjenstår spørsmålet om hva nytteverdien egentlig er. Og tross Kristians gode påpekning at nytteverdi kan åpenbare seg etterhvert, er selve essensen i nettopp artikkelen at disse fabrikerte bildene har en problemstilling hengende ved seg.

      Ingen i kommentarfeltet har kommet med noen åpenbare gode forslag til konstruktiv nytteverdi.

      Jeg kan forsøke selv, at om en AI kan fabrikere et virkelighetstro bilde, vil den på veien også trolig lære seg å identifisere det fabrikerte. Dermen kan en AI benyttes til å oppdage og filtrere fabrikerte bilder. Det blir som et internt kappløp mellom AIer.

    • Even:

      Fotografier har vel ikke vært fellende bevis på ganske mange år nå, med mindre man har full kontroll over tilblivelsen. De kan være indisier, men da granskes de med mikroskop (analoge bllder) eller piksel for piksel, og hvert minste lille metadataelement i komprimert format (digitale).

      Jeg har lite prinsipielle motforestillinger til det du skriver, og i artikkelen, men reaksjonene (fra flere hold her) har litt preg av «det er fali’, det!». Nytt og ukjent, da gjør vi hva vi kan for å avvise det. Men så er det kanskje ikke så nytt likevel – det er bare verktøyet som er litt annerledes. Jeg har selv manipulert bilder i mørkerommet, bleket bort uønskede elementer med rødt blodlutsalt. Digitale teknikker er godt over tretti år gamle – Photoshop kom som et verktøy på proff-nivå for 29 år siden. Dokumentar-romaner, gjerne omstridte har eksistert i generasjoner.

      Offentlig framførte nidviser om levende personer har det blitt slutt på: Det viser at vi har mekansimer (her: injurie-lovgiving) for å kontrollere skadelige utslag.

      Her snakker vi ikke om levende mennesker, men om fiktive bilder av personer som slett ikke kan bli injuriert, fordi de ikke eksisterer. Det er ingen prinsipiell forskjell om en kunstner maler et portrett av en ikke-eksisterende person, etter å ha studert tusenvis av ansikter, eller om noen bruker en datamaskin for gjøre det samme. Har vi noen motreaksjon mot maleriet skapt av kunstneren med pensel og palett? Hvis vi ikke har det, hva er da begrunnelsen for å reagere mot «kunstnereren» med datamaskin? Er det bare en frykt for det nye og ukjente?

      Publikum gir tilbakemelding til skaperen på alle slags teknikker – hvordan fotografen bruker lys og skygger for å framheve trekkene, om det gir den portrettliket folk er fornøyd med. Det er det samme i skulptur, maleri, litteratur: Det gis tilbakemeldinger som veileder kunstneren i videre arbeide. Det er ikke noe nytt av vi «hjelper» dem til å bli bedre.

      Jeg har vokst opp med kjøretøyer som beveger seg fortere enn meg, datamaskiner som regner fortere enn meg, sirkelsager som kapper opp veden raskere enn jeg kan med båndsaga. Jeg har aldri tenkt på at det «ringer av selvdestruktivt». Kjører vi en slik filososfi til yttergrensen, må vi også oppleve en hammer på samme måten: Den slår hardere enn jeg kan.

      Så kan du si at vi «mister kontroll» fordi vi ikke fullt ut forstår hva AI-mekanismene gjør. Vel, vi har bygget mekanismene, vi vet hvordan de er konstruert. Jeg forstår mer av dem enn jeg forstår av motoren i bilen min :-), det er vel fordi jeg er datamann. Men jeg godtar bilens mekanismer uten følelser av seldestruktivitet.

      Det har jo kommet noen forslag til nytteverdi, men det er spørsmål om du godtar dem som «verdige». Mye er avhengig av om dette utvides til alle slags levende og døde objekter (soverom-interiør er jo allerede nevnt i artikkelen), og om det bare er «det ytre skallet» som bygges opp, eller om det er mer komplette «innnenfra og ut»-modeller, slik jeg har nevnt i andre innlegg.

      Et trivielt eksempel er underholdning: Hvis du har småunger kan du velge mellom et par hundre ulike animasjons-serier på TV hver eneste dag for dem – NRK Super har alene 34 ulike i dag noen av dem med flere episoder. (Jeg ble sjokkert da jeg så antallet!) Å produsere samme antall timer underholdning med levende skuespillere og videokamera ville kostet størrelsesordener mer! (Rett nok kostet digital generering av Jungelboka en formue og vel så det, men det er fordi vi ikke har et etablert produksjonsapparat for det!)

      For fire-fem år siden viste NRK Super sitt populærvitenskaplige program Newton en «fotorealistisk» 3D-animasjon om kjempeinsektene som levde for 3-400 millioner år siden. Visualiseringen er en fantastisk visualisering av noe som det ville vært helt umulig å preserentere med «ekte» bilder. Dessverre hadde ikke NRK rett til å beholde animasjonen permanent på tv.nrk.no. Har du sett den (evt, som meg, rippet den da den var tilgjengelig :-)) kunne det vært et utmerket eksempel på den pedagogiske siden ved totalt datagenererte bilder som ville være umulige å produsere.

      Mange scener i moderne underholdningsfilm er på grensen av det forsvarlige: Mange action-scener er filmet med stuntmen som stepper inn for de «egentlige» skuespillerne. I moderne filmer overtar «digital effects» stadig mer av dette, om enn med vekslende hell. Når digitale avatarer overtar for stuntmen kan filmene vise scener som ville vært for risikable selv for stuntmen. Om du anser dette som en «verdifull» utvikling er noe annet 🙂

      Tilsvarende kan gjelde for f.eks. historiske dokumentar-filmer. Skildringer av krigens brutalitet stopper som regel på en viss avstand. Mishandlingen av slavene USA viser en hånd som svinger en svepe, etterfulgt av et bilde av en skuespiller som vrir seg i smerte, men man kan ikke reelt piske en skuespiller bare for å få det filmet. Dette kan være eksempler der vår kultur har definert at man «ikke skal» vise bilder av hva som virkelig skjedde, enten det var en soldat som fikk hodet blåst av eller en piskesnert som treffer en slaves rygg. (Andre kulturer kan ha ganske annerledes oppfatninger!) Da kan du si at det ikke har noen verdi å kunne generere slike historiske scener digitalt uten at noen reelt blir skadd. Men det vil trolig fnnes mange scener som mange, også i vår kultur, mener at det er riktig å kunne vise, selv om det er umulig å bruke levende skuespillere i filmingen.

      Hvis modellene bygges opp innenfra, i samsvar med reell anatomi, kan du få en fantastisk pedagogisk mulighet for å vise hvordan ting fungerer. Tenk deg en digital modell der du gjør 95% gjennomsiktig alle andre organer enn de som har med fordøyelsen å gjøre (dem gjør du halvgjennomsiktige) så du kan følge maten fra munnen, ned gjennom spiserøret, magesekken og tarmene. Eller du kan på tilsvarende måte «se inn i» en eksplosjonsmotor.

      I kriminaletterforskning har kunstig genererte robotbilder vært brukt i femti år – først med plastfolier som ble lagt oppå hver andre: Ett med hake #11, ett med ører #41, osv. Senere ble det digitale del-bilder. I dag kan man presentere et fotorealistisk 3D-bilde og få vitner til å justere på det. Vitner blir bedt om å identifisere en mistenkt fra et panel av personer; det kan erstattes av et panel av bilder der alle andre enn den mistenkte er genererte bilder, og personlig konfrontasjon mellom et vitne/offer og en mistenkt kan unngås.

      Dette er bare begynnelsen, både på teknologien og på nyttige anvendelser. Vi vil i framtida se totalt uventede anvendelser – på godt og ondt, naturligvis. (Bare se på hvordan internett benyttes på godt og ondt! Eller om du vil: Skrivekunsten.) Mulighetene for å stoppe generering av bilder med PC er omtrent like store som for å stoppe bilder laget med blyant eller pensel, dvs. null. Da må vi forholde oss til det, og heller se om de etablerte regulerings-mekanismer vi har for andre media også kan fungere for det nye. Ofte kan de.

      Iblant kan de ikke. I så fall kan vi enten søke etter nye reguleringsmekanismer, eller akseptere at samfunnet endrer seg. Et eksempel på det siste er at da nettporno ble vanlig, og det viste seg praktisk talt umulig å regulere, ga moral-myndighetene opp kampen mot (voksen)porno; det er for alle praktiske formål fritt fram i dag. Photoshoppede bilder er også blitt mer eller mindre fullt akseptert. Jeg har vanskeligheter med å forstå hvorfor datamaskingenererte portretter av ikke-eksisterende mennesker skulle representere et vesentlig mer uoverstigelig problem enn naturalistiske oljemalerier av personer som bare finnes i kunsnerens hode.

    • Veronika (svar til Even)

      Even, syntetiske data bidrar ikke nødvendigvis til feilfabrikerte data.

      Om man skal trene en algoritme til å gjenkjenne katter, og man kun har 100 bilder av katter å trene på, kan det være hensiktsmessig å speilvende 25 kopier av bildene, tilføre et diffust filter på de neste 25 kopiene, croppe den neste mengden osv. Da ender man opp med et dobbelt så stort datasett med ulike bilder (selv om man har gjort små endringer på kopier av de opprinnelige bildene) som gir bedre treningsgrunnlag for algoritmen. Mer data gir som oftest bedre resultat. Metoden beskrevet i denne artikkelen kan dog være en kostbar (lite tideffektiv) måte å oppnå syntetiske data på, men likevel kult og relevant. 🙂

      Når jeg nevnte computer vision, så mente jeg algortimer som gjenkjenner objekter i bilder. I motsetning til tekst eller lyd f.eks.

  1. Det er en vellykket artikkel, siden den utløser refleksjonen. Om enn med en potensielt selvmotsigende effekt av flere som hjelper en problematisk maskinlæring.

    Det hele virker drevet av en curiosity killed the cat mekanisme.

    Svar på denne kommentaren

  2. Jeg får inntrykk (både her og i tidligere omtaler) av at maskinlæringen er basert på å lære hvordan ansikter ser ut, den ytre overflaten. Hvis det er riktig, er jeg svært usikker på om det viser framtida for digital animasjon og denslags.

    For å generere 25-50 bps må bildene beregnes. Man må ha en modell av hva som forårsaker et visst utseende: Et sett (usynlige) muskler strammes og det beregnes hvordan huden buler opp, hvordan lemmene løfter seg, fingrene krummer seg … Modellen må vise hva som trykker eller strammer hvor, og hvordan andre del-objekter reagerer på trykk og stramming. Trekker muskelen i en sene festet i en knokkel, bøyer et ledd seg, og det kan få et helt lem til å endre posisjon. Det går fram av modellen hvordan alt henger sammen, og hvordan kroppen tegnes opp etter at lemmet er flyttet. Ob så videre.

    Det er stadig mye behov for maskinlæring: Om du filmer en person som gjør bevegelser, grimaser etc., og lar avataren gjøre det samme, vil det trolig være synlige forskjeller i bildene. Animasjons-systemet kan lære ved å justere parametre i avataren så likheten med den ekte filmen blir større.

    En menneske-avatar bør kunne parametriseres etter alder, slik at den vokser, endrer proporsjoner, rynker i huden etc, i første omgang ut fra hvordan en «normal-kropp» utvikler seg gjennom livet. Har man da bilder og film av samme menneske i ulik alder, kan parametre for aldring og utvikling justeres så de genererte avatar-bildene blir likest mulig med de ekte bildene.

    Animasjons-systemer har benytter seg av slike modeller i mange år, men de er fortsatt ganske primitive: De modellerer ikke hver enkelt muskel i menneskekroppen, hver knokkel i riktig form, lagene med hud og kroppsfett og denslags, og modellene er ikke parametrisert for å kunne sette alderen eller effekten av for stor eller for liten næringstilførsel, og den slags.

    Komplette, parametriserbare anatomiske modeller vil komme. De kan være lært opp av bilder og video for et faktisk levende menneske, men deretter kan parametre endres for f.eks. pigmentering, hårvekst, muskelvolum osv. for å produsere en animert scene med helt ulikt utseende menneske, men med bibehold av all erfaring med hvordan ulike muskler spiller sammen for å danne én troverdig grimase (for et ekte menneske) til å bli troverdig også for et generert menneske. Utviklingen ved aldring som stemmer for et ekte menneske er et godt utgangspunkt for et generert … og så videre.

    Å generere syntetiske bilder ut fra en modell kan mye sammenlignes med vektorgrafikk i forhold til bitmap-grafikk: Å justere en kurve i et diagram er helt trivielt om den er representert ved en matematisk funksjon, men vanskelig om den er representert som et .bmp eller .jpeg-bilde. Når du skal presentere et resultat, et ‘endelig’ resultat, i en rapport er et bitmap-bilde greit nok, men skal det modifiseres og bearbeides videre, er det uegnet. Da må man inn med parametriserte modeller som bildene genereres fra, ‘innenfra og utover’, ikke basert kun på det ytre synlige resultatet.

    Svar på denne kommentaren

    • Fine tekniske innspill til begrensningen av fabrikerte bilder. Avansert datagrafikk i spill og underholdning, kanskje også i læringsplattformer, ser jeg kan ha nytte. Jeg har selv vært begeistret over grafikkutvikling i de tre siste tiår.

      Likevel spør jeg meg mht hva artikkelen over belyser av nettopp problematikken i at det fabrikerte blir ikke skillbart fra dokumentert virkelighet.

      Det minner om å stirre fascinert på en atombombe. Som er vakker i all sin nærmest unaturlighet, og samtidig så ødeleggende.

      Lykkes teknologien å gjøre det du beskriver her, hvordan orienterer vi oss i en sånn verden?

    • Jeg kan slutte meg til bekymringen din, til en viss grad. Men en del av det er basert på at vi pr. idag har en naiv tiltro til «fotografier». Vi burde jo ikke ha det, etter et par tiår med photoshopping, men det henger likevel igjen: Et bilde sier mer enn tusen ord.

      Et bilde lyver mer enn tusen ord…

      Vi må lære oss å leve i en verden der en ‘fotografisk’ beskrivelse er like pålitelig som en tekstlig beskrivelse. Stoler du på formidleren, da stoler du på reportasjen, både testlig og fotografisk. Har du en viss skepsis (som alltid er sunt!), er den skepsisen fordelt mellom tekstmaterialet og billedmaterialet.

  3. Og filmselskapene kan designe sine egne filmhelter; som ikke klager, har nykker, blir syke (i virkeligheten), ikke blir gravide (i virkeligheten) og som ikke krangler om eller krever høyere og høyere honorarer og royalties. Som ikke krever dyre stand-ins eller stunt-personer, eller som må forsikres. Skuespillere selskapene kan eie selv, og «legge i skuffen» eller på harddisken å påvente av en ny innspilling.

    Svar på denne kommentaren

    • Vi har gjort dette for unger i omtrent en generasjon: Barne-TV er 90% animasjons-ting, og har vært det i årevis.

      Det er lett å le av den tekniske kvaliteten på barneprogrammene forrige generasjon gledet seg over. Selvsagt var det en del ‘bløff’ – f.eks. ‘Daktari’-serien fra Afrika er filmet i et ‘Afrika’ bygget opp i California. Men det var virkelige mennesker, virkelige dyr, virkelige hus og kjøretøyer. Vi kan gjerne si: Virkelige konflikter og problemer.

      Virkelighet ble etter hvert for kostbart å forholde seg til for unger. Om ungene i dag fores med 2D, 2,5D eller 3D animasjoner er egentlig ett fett: Det er ‘tegneserier’ i den odiøse betydningen av ordet.

      I voksenverdenen har vi fått raffinerte, avanserte tegneserierier, men ingenting av raffinementet har krøpet ned i det vi produserer for barn under 8-10 år. Jeg har ganske skarpe motforestillinger mot Karsten & Petra, men i valget mellom dem og de typiske TV-animasjonene foretrekker jeg uansett ‘virkeligheten’…

      Når animasjonene kryper inn i voksenfilmen blir det nok adskillig mer ‘fotorealistisk’. En god del vil erstatte stuntmen og ‘special effects’ i ytre handlinger, som kan gjøre kriger og slagsmål og vettlaus bilkjøring enda mer dramatisk uten å risikere liv.

      Det er ikke billig nok enda. Disneys 2016 Jungle Book har én eneste menneskelig skuespiller – alt annet er animert. De som ga stemmer til dyrene var langt fra gratis, men likevel: Budsjettet var på 1,5 milliarder kroner (175 MUSD)!! Selv med det budsjettet klarer de ikke unngå en del svakheter (men for all del: som helhet er resultatet teknisk sett svært imponerende).

      Før fullstendig digitalt genererte filmer blir økonomisk fordelaktige må vi ha en basis-teknologi så vi slipper å finne opp kruttet på nytt for hver film. Disney fant trolig opp mye krutt for Jungelboka, men jeg mistenker at de ikke har en infrastruktur som bevarer det de genererte til senere bruk (les: At de fokuserte mer på bildene, og mindre på modellen bakom bildene).

      Jeg rister på hodet av både stuntman-triks og special effects, og ikke minst kombinasjonen. Greit nok som tidsfordriv, men der stopper det. Det blir ikke verdifulle filmer av det. Fotorealistisk animasjon kan også ende opp som fjernt fra ‘verdifulle’ filmer – det vil nok gjelde de fleste.

      Jeg ser for meg at det også åpner muligheten for å lage scener som det ville vært umulig å lage realistisk (eller ville vært for risikabelt) i en ‘verdifull’ film. I instruksjons-filmer og tildels dokumentarfilm kan det være svært verdifullt.

      Selvsagt kan digitalt genererte bilder misbrukes i all slags film. Vi snakker om tegning, med litt mer avansert redskap enn blyant og oljepensel, men prinsipielt det samme. All skade du kan forårsake med en blyant, kullstift eller oljepensel, kan du også forårsake med et digitalt generert bilde. Det er helt selvsagt. Det må vi leve med.

  4. Langt igjen. Jeg fokusert kun på fjesene og fikk rett så lenge jeg gadd – 20 av 20. Det er rare linjer og feil tekstur i alle de genererte. Det blir som menn som farger håret – du ser det med en eneste gang.

    Svar på denne kommentaren

  5. Royba, jeg skulle ønske jeg kunne si meg enig i ditt syn på at vi beveger oss mot fornuftsbasert og bort fra emosjon. Noen gjør det, men den politiske agendaen har ikke vært styrt mer av emosjon, særlig frykt og frustrasjon, på lenge. Pet Shop Boys sin vel tydelige politiske kommentarlåt Let’s give stupidity a chance beskriver noe av det, om enn ubalansert beskrevet fra én politisk ving.

    Aldri har flere sittet foran skjermer og latt seg passivt underholde. Og nå av stadig mer kunstig fabrikerte hovedpersoner i fiktive verdener. AI-drevet CGI vil drive dette videre.

    Noen andre som får Matrix-vibber?

    Du sier AI kan lære oss å tenke kritisk. Artikkelen beskriver derimot at det å ha et kritisk blikk vil være stadig vanskeligere, gående mot umulig? To av leserne av denne artikkelen har dokumentert i kommentarfeltet at de resignerte på å selv kunne finne ut hvilket bildet som var ekte. Det betyr at vårt kritiske blikk er blitt uten relevans, for vi klarer ikke skille. Vi er egentlig utspilt, i møte med noe som har gjort et forsøk på å etterlikne virkeligheten og lykkes godt nok.

    Programvaren som klarer dette, kan nesten argumenteres å ha bestått en form for Turing-test, ikke i en dialog, men i en gjenskapelse av virkeligheten?

    Du snakker om at virkeligheten er subjektiv. Til dels er vår tolkning av den fysiske verden omkring oss det, men selve virkeligheten er ikke subjektiv, i at den oppleves intersubjektivt, altså felles mellom flere. Uten det har vi ingen sosial konstruksjon. Mennesker med psykoser opplever å ha en dissosiert virkelighet fra oss andre.

    Dette utfordrer derimot en maskinfabrikert virkelighet, og kombinert med augmented reality er det en forvirrende framtid vi går inn i. Jeg klarer selv ikke se en nytteverdi som oppveier sannsynlige ulemper og risikoer ved utviklinga. Interessant å høre hva andre ser.

    Svar på denne kommentaren

    • Spørsmålet er om du stiller riktig spørsmål 🙂

      En kamerat nærmest kastet til meg ei bok han hadde kjøpt ved en feiltagelse, basert på historien om August Andrée’s forsøk på å krysse nordpolen i ballong. Boka er basert på dagbøkene som er funnet, hva som kan ha ligget bak dem. Det er jo bare gjetting! Bare tull – ikke fakta! … Min kamerat hadde ingen interesse av slike ‘fantasier’. For ham må alt være abosolutt, entydig og bevisbart.

      Noen tror at ‘virkeligheten’ er absolutt og entydig, udiskutabel. Mange asiatiske filosofier skiller mellom sannheter og dype sannheter – de som har mange og ulike tolkinger. Ofte, ikke minst innen politikk og sosiologi lærer vi etterhvert at om vi insisterer på å kalle noe én sannhet, er det en sannhet med mange ulike tolkinger.

      Jeg ser ikke mye moderne actionfilm, eller leser mye tilsvarende bøker – der én helt representer ett entydig sett verdier, ett sett egenskaper. Det er så uspennende! Jeg ser etter bok- og film-helter i spenningsfeltet mellom mange krefter, der helten har elementer av alle. En ‘helt’ er aldri en helt for meg, bare for seg selv. Kan jeg lære noe av hvordan ‘helten’ forholder seg til ulike situasjoner, da kan det heve filmens verdi.

      Vi har ‘alltid’ (les: en generasjon eller to) hatt en slik kritisk holdning til bok-helter. Selv for femti år siden ville en leser som med blanke øyne erklærte at ‘det er en historie om det onde mot det gode’ bli møtt med overbærende smil; det er ikke enkelt! For film kan du enda i dag se slike ‘det onde mot det gode’-reaksjoner (anbefalt: Erlend Loe ‘Doppler’, der han har vært og sett Ringenes Herre med sin datter. De som har lest passasjen vet hva jeg snakker om :-))

      Virtuelle, men naturtro, film-skikkelser må vi forholde oss til på lik fot med litterære, men naturtro, roman-skikkelser. Er det noen dramatisk forskjell mellom en forfatter ved sitt tastatur og en regissør ved sitt animasjonsprogram? Kan vi handtere litteraturens personer, og spillefilmens personer, som fiktive, så klarer vi det vel selv om det ikke har stått noen skuespiller foran et objektiv da scenen ble produsert.

      Turing-testen kan sies å være oppfylt ved at omvisere på Sigrid Undset-museet stadig blir spurt av gjester om å de kan få se graven til Kristin Lavransdatter 🙂

    • Keal, forstår jeg deg riktig i at du mener fantasien og det å skille den fra virkeligheten, eventuelt å ikke nødvendigvis alltid klare det, i seg selv kan ha en verdi?

      Jeg følger deg i så fall på det, muligheten til å drømme seg bort. Og ser at en tilstrekkelig realistisk fabrikert virkelighet kan utvide den muligheten.

      Likevel har det alltid vært mulig, om enn stadig vanskeligere, å trekke seg ut av en fantasi-verden man har midlertidig søkt til for avkobling og underholdning, og tre ut i den fysiske virkeligheten igjen.

      NRK hadde nylig en fantastisk artikkel om mulighetene til å leve ut en god personlighet med færre begrensninger enn hva livet fysisk kan pålegge en, med feks. motorisk funksjonsnedsettelse.

      Det jeg synes virker problematisk og uhyggelig med AI og evnen til å fabrikere noe ikke skillbart fra det dokumentert eksisterende, er at maskinlæringa ikke virker å ha som mål å gi oss en underholdningsverden, men en forvirrende kopi, som utfordrer oss eksistensielt.

      Før ble det kalt forfalskning. Hva er dette?

    • Jeg har stor sans for fantasi. Unger må vel bli minst 4-5 år før de klarer å skille (og det er en herlig tid før det :-)), men voksne som vet når de begir seg inn i en roman-verden, en film-verden eller for den saks skyld lyd-verden, kan hente med seg verdifulle impulser tilbake til virkeligheten. Men strengt tatt er det en forutsetning for at jeg anser fantasien som positiv: Du må bringe noen impulser med deg tilbake når du returnerer, ellers har den liten verdi utover den rene tidtrøyten.

      For meg synes det som om fantasi (ikke minst i varianten fantasy) har blitt stadig mer «brød og sirkus» – kun tidtrøyte og «underholdning». Det er vel en kontinuerlig utvikling fra den gang man lærte å lese kun for å lese bibelen. Senere, på 17- og 1800-tallet, skulle bøker være (religiøst) «oppbyggelige». Store deler av 1900-tallet skulle ihvertfall en betydelig del av dem være «pedagogiske» – rett nok i vid forstand, fra å detaljere hvordan gutteflokken samlet ved og tente opp et leirbål, til hva som foregår på ei fiskeskøyte. I dag skal det visst være slik at å lese en roman ikke skal etterlate noe som helst i deg som du kan ta med deg videre; den skal bare være tidtrøyte og fantasering uten kontakt med ditt virkelige liv.

      Når jeg i dag prøver å få ut av en tenåring hvilke ideer, forståelse av konflikter og interesser, hen får ut av bøkene fra en fantasy-setting, er det lett å få kommentarer til idealer og konflikter innenfor den fantasy-settingen. Det er adskillig vanskeligere å provosere fram tanker om betydningen for vår virkelige verden. Jeg tenker iblant at noen av de jeg snakker med går in i fantasy-verdenen nettopp fordi den er isolert fra virkeligheten, med frihet til å ‘på en måte’ forholde seg til (kvasi-)moralske spørsmål, uten ansvar for moralske spørsmål i den virkelige verden.

      Da jeg styrte hva jeg leste på sengekanten for avkommet valgte jeg naturlig nok bøker i grenselandet fantasi / realitet. (Tips for bokelskere: Tormod Haugen har en rekke bøker i det området. De er jo ikke helt dagens mote, men de er på ingen måte stramt bundet til tiden da de ble skrevet – tvert om!)

      Jeg ser fantasy-litteraturen som et langt større problem enn digitalt genererte bilder. Jeg ser heller ikke på malerier av ikke-eksisterende personer som en ‘forfalsking’. Heller ikke datamaskin-genererte portretter. Verken oljemaleriet, det datagenererte portrettet eller politietterforskernes ‘robotbiler’ av mistenkte forbyrtere opppleves som noen eksistensiell utfordring.

      At vi overlater masse beslutninger til vurderinger til automatiske mekanimser er naturligvis et problem, men det er i bare ubetydelig grad knyttet til generering av portretter. Og det er utgammelt. La meg illustrere det med et par utgamnle eksempler: For rundt 40 år siden fikk en advokat i USA store problemer: Han fikk ikke lån, fikk trøbbel med godkjenning av førerkortet sitt, og diverese tilsvarende trøbbel. Han flyuttet til en annen stat, som hjalp en stund, men så begynte det igjen. Før han «flyktet» på nytt begynte han å grave, og oppdaget at et database hadde registrert ham som saksøkt, istedetfor som advokat for saksøkte, i en rekke saker…

      Et annet tilfelle, fra Norge: Det hendte det ble sendt ut regninger på kr. 0,00 – trolig som resultat av en avrunding: Beløpet var ikke reelt 0, men under en halv øre. En kunde ignorerte dette kravet, og purringen han senere mottok. Eetter en stund fikk han inkassokrav, basert på kostnadene: Porto for utsendelse av purringen på kr.0,00.

      Ingen snakket om «AI» den gang, det var tvert om: Idiotiske datamaskiner. De ansvarlige forsvarte seg med at «det var datamaskinens feil». Når vi i dag legger skylda / ansvaret på «AI», er det bare et nytt navn. Skylda ligger hos dem som overlater det endlige ansvaret til en automatisk mekanisme uten å legge inn et tilstrekelig antall «sanity checks».

    • Det jeg leser er ikke at du aldri lar deg lure, men at du selv nå er blitt overbevist om at du aldri lar deg lure.

      Og derfor er sjansen stor for at du lar deg lure.

    • Du har bidratt til at maskinlæringa, som NRK beskriver som problematisk god, har blitt enda bedre.

      Vi mennesker trener ikke en hund her, men noe som er på vei til å bli dyktigere enn oss, og potensielt smartere enn oss. Det er vanskelig å forstå hensikten.

      Martin i beta, hvorfor?

  6. Håret oppfører seg fortsatt nesten alltid litt feil og tennene ser rare ut på de genererte bildene. Det kommer hår fra ingensteder og ender i unaturlige former. Der jenta stikker hånden inn i håret ser det ut som hamp som kommer fra et ubestemmelig sted på toppen av hodet. I det for store hulrommet under håret er det litt gugge inntil hodet som skal se ut som hår, men ikke helt er det.

    Svar på denne kommentaren

    • Natteravn (svar til Per)

      Ehh… bildet av jenta med hånden i håret er det EKTE bildet, det er bilde til VENSTRE som er falskt, leste du ikke bildeteksten?

    • Det som betyr mest i praksis er likevel om du ville reagert om du hadde sett disse bildene i vilkårlig sammenheng, uten å vite at ett av dem er ekte, ett er generert.

      Hadde bildene vært brukt som illustrasjon til en avisartikkel, som portretter av folk omtalt, ville du da stusset: Nei, det kan ikke stemme – det der til venstre er ikke et ekte bilde?

      Jeg tror ikke at noen av disse bildene er «dårlige» nok til at de ville blitt avslørt om de var brukt som rene illustrasjoner til avisartikler, på bokomslag, kanskje til og med som dokumentariske fotografier i ei bok.

      For rundt 20 år siden hadde vi «Sprøytvarsleren» (http://folk.ntnu.no/ystenes/sproyt/) som rapporterte om (hovedsaklig) naturvitenskapelig tullprat i media. I dag har faktisk.no en lignende rolle (over et mye bredere felt). For begge to ble/blir jeg stadig overrasket over hvor mye jeg tar for god fisk, helt til noen setter fingeren på en avslørende detalj. Slik blir det også med bilder: Vi godtar dem som ekte inntil det motsatte er bevist.

      For å teste deg selv: Se gjennom en film (eller ti) og noter ned hva du får med deg av ulike blundere i produksjonen. Let så opp filmen på imdb.com, og se i «goofs»-seksjonen hvor stor andel av den lista du har i dine egne notater. Hvis du som hovedregel har notert deg tredelen av de som listes på imdb.com, da mistenker jeg at du har «jukset» og sett goofs-lista tidligere.

Legg igjen en kommentar

Din e-postadresse vil ikke bli publisert. Obligatoriske felt er merket med *. Les vår personvernserklæring for informasjon om hvilke data vi lagrer om deg som kommenterer.