nrk.no

Tilnærmet ubrukelig fra Google

Kategorier: Media & Mobil

Google Goggles
Google Goggles

Med jevne mellomrom lanseres det tjenester og produkter som er så sci-fi at jeg nesten blir fysisk syk i mitt håp om at de skal fungere. I forrige uke slapp Google versjon 1.1 av sin Goggles programvare for Android. Den store nyheten var at Goggles nå skal kunne kjenne igjen tekst via kameraet, og oversette denne til ditt språk.

Google Goggles
Google Goggles - Foto: Marius Arnesen NRKbeta.no Creative Commons - BY-NC-SA

Og tanken er jo svært så tiltalende 🙂 Ta bildet av en tekst du ikke skjønner. La så mobiltelefonen analysere den og sende den til Google. Tilbake får du teksten oversatt.

Google Goggles har fra versjon 1.0 også vært et program som har tatt sikte på å la deg ta bilder av noe fysisk rundt deg, barcoder, kunstverk, produkter og logoer, for så å sende dette bildet, med tid og geo-lokasjon for analyse hos Google, og få informasjon om det du har tatt bildet av tilbake.

Google Goggles
Google Goggles - Foto: Marius Arnesen NRKbeta.no Creative Commons - BY-NC-SA

En kjapp test med ei tysk bok, viser imidlertid at Google langt fra er i mål med sine oversettelsesbriller.

Hovedproblemet ser rett og slett ut til å være OCR-funksjonaliteten. Den klarer ved så og si alle våre forsøk, ikke å gjenkjenne teksten. Enten tror den det er et bilde, eller så finner den ingen verdens ting.

Finner imidlertid først Google ut at det er en tekst, og klarer å treffe riktig på det området du har satt for scanning, klarer den oversettelsen relativt greit. Kanskje ikke så overraskende, da Google Translate har fungert i lang tid nå.

Google Goggles
Google Goggles - Foto: Marius Arnesen NRKbeta.no Creative Commons - BY-NC-SA

Google skal uansett få for ideen og det at de faktisk pusher denne type teknologi framover gjennom sine GoogleLabs prosjekter. Jeg er spent på hva de i framtiden kan tyne ut av både tekstgjenkjennelses-biten av Goggles, og men også bildegjenkjenningen sin.

Slik det framstår i dag er den dessverre mer eller mindre ubrukelig.

Google Goggles: Not even close
Google Goggles: Not even close - Foto: Marius Arnesen NRKbeta.no Creative Commons - BY-NC-SA

Google Goggles støtter idag Tysk, Engelsk, Fransk, Italiensk og Spansk som input-språk, mens den kan oversette til de samme språkene som Google Translate håndterer.

Goggles er tilgjengelig for alle som har en telefon med Android 1.6 eller høyere fra Android Market.

37 kommentarer

  1. forsmedelig -; som er til skam; nedverdigende: en forsmedelig behandling / en lang rekke forsmedelige nederlag; (med svekket bet.) det var da forsmedelig å bomme på så kort hold
    Etym.: avl. av foreld. forsmede , se forsmedelse
    Synonymer: fortredelig, lei, sårende, vanærende

    Svar på denne kommentaren

    • Ivar (svar til Dan)

      Du har tydeligvis aldri vært inne på App Store. Der finnes mengdevis av søppelprogrammer. Spesielt så finnes det enormt med programmer med overlappende funksjonalitet.

    • Kristian (svar til Dan)

      Diskusjoner om religion skaper bare fiender og gjør ellers oppegående mennesker ute av stand til å være runde i kantene.

      Det ser ut til at det gjelder uansett om religionen heter Liverpool, Nikon, Toyota, iPhone, Pepsi Max eller Michael Jackson.

      Jeezus!

  2. En ting er oversettelse av tekst.. Mn bruksområdet er vel større med skilt, menyer ++ Feks som turist i kina hadde det jo vært strålende å kunne ta bilde av ett skilt for å få vite hva som var herre- og damedo?

    Svar på denne kommentaren

  3. Nei, nei, nei!

    Her har dere bomma rimelig hardt!

    Applikasjonen Goggles skal jo ikke gjenkjenne og oversette tekst fra bøker. Den er ment til å gjenkjenne logoer, etiketter og kjente figurer (landemerker, maskoter etc) og strekkoder. At dere ikke har klar å få med dere dette er ganske tåpelig!

    Svar på denne kommentaren

    • Asbjørn (svar til Simon)

      Jeg ser der står tekst, men å gjenkjenne en hel side ut fra en roman er vel litt optimistisk fra NRK sin side 🙂

    • Marius Arnesen (NRK) (svar til Asbjørn)

      @Asbjørn: Det er mulig det er optimistisk, men det er strengt tatt dette Goggles idag lover med sin v1.1.

      Vi fikk det også til å fungere innimellom. Problemet at det er svært sjelden det gjør det. Når den klarer å kjenne igjen at dette er tekst, og OCR motoren gjør jobben med å faktisk kjenne igjen hva teksten også er, går oversetting av hele sider som en drøm.

      Vi hadde også store problemer med å faktisk få Goggles til å skjønne hva det var vi ville ha oversatt. Det er nemlig mulig å dra ut en firkant på skjermen for å definere hva av teksten du vil oversette.

    • Jeg syntes uansett overskriften var kvass. Dere har jo tross alt bare testet en liten bit av applikasjonen. Da kan det ikke kalles en anmeldelse, etter min mening.

    • Marius Arnesen (NRK) (svar til Asbjørn)

      Asbjørn: Det må du gjerne synes, og vi synes det er fint med tilbakemeldinger på hvordan artiklene våre tolkes.

      Vi har imidlertid aldri påberopt oss at dette er noen grundig anmeldelse av Google Goggles. Dette er en titt på den nye funksjonaliteten i Goggles 1.1, nemlig tekst oversettelse. Den synes vi er tilnærmet ubrukelig.

      Dette burde komme greit fram i artikkelen.

    • Riktig, står ingenting om anmeldelse noen sted. Jeg kom via nrk.no som linka med følgende overskrift: «NRKBeta slakter googles goggles». Jeg var naturligvis allerede i full kok da artikkelen lastet inn i Chrome. Slakt er noe jeg vanligvis forbinder med anmeldelser.

      😀

      Det får være nok trolling for idag xD

  4. Jeg har også lekt med Goggles app’en, og liker den veldig godt. Har også testet translate, og det funker det og. Dog, gjør som det står i tips når du starter appen første gang, bruk crop-knappen for å crop’e det du tar bilde av til kun å inkludere teksten.

    Svar på denne kommentaren

    • I følgje denne artikkelen er Tesseract faktisk den revolusjonen[1]. Du finn ein svært detaljert samanlikning av Ocrad, GOCR og Tesseract her (Ocrad og GOCR er to andre frie OCR-motorar).

      Men merk at Tesseract gjer berre OCR, det har ikkje som oppgåve å skilje tekst frå bilete/resten av layout, til det må du nytte andre program (eg har lest at OCRopus skal vere bra til dette).

      —–
      [1] Vel, om me skal vere pirkete er eit kvantesprang omtrent så ørlite som det er mogleg å springe, men eg trur intensjonen var at «Tesseract er eit kjempesprang» heller enn eit kvantesprang.

    • Anders Hofseth (NRK) (svar til Kevin)

      Neida.

      4. I dagligtalen benyttes ordet på samme måte som i fysikken, med den forskjell at man ikke begrenser seg til sprang i kvantetilstand/energinivå. Ordet kvantesprang understreker i dagligtalen enhver form for diskontinuerlig sprang som f.eks enhver stor og brå endring.

      5. På grunn av ordet kvantesprangs beslektskap med kvantefysikken, tror veldig mange feilaktig at der er galt å bruke ordet kvantesprang i dagligtalen. I tillegg er det mange som tror at et kvant er noe veldig lite, da kvantemekanikken er fysikken til elementærpartiklene som også er små. I virkeligheten betyr ordet kvant kun mengde og ikke at det er noe stort eller lite. F.eks. får man ofte kvantumsrabatt om man kjøper en mengde av noe i motsetning til et eksemplar.

      no.wikipedia.org/wiki/Kvantesprang

  5. Hvis du leser fra google’s side:

    # Point your phone at a word or phrase. Use the region of interest button to draw a box around specific words

    Altså, ord eller frase.

    Det står ikke noe sted at det er meningen den skal oversette en hel bok side for deg.
    Ganske urealistiske forventninger du har spør du meg men meg om det 🙂

    Svar på denne kommentaren

    • Marius Arnesen (NRK) (svar til Nicco)

      Vi prøvde både å få Goggles til å oversette hele avsnitt, sider, overskrifter og utsnitt av avsnitt ved bruk av croppefunksjonen.

      Resultatet er like varierende i alle tilfeller.

      Bildet som er brukt viser en hel side, rett og slett fordi det var mest visuelt og ble det beste bildet. 🙂

    • Kevin (svar til Morten)

      Morten, Google har ser aldri i ordbøker. Alle språkmodellane deira er basert på kva folk faktisk skriv (dvs. dei ser på store mengder tekst og lagar ein statistisk modell ut frå det), heller enn kva folk seier at folk skal skrive.

      (Men sjølv om ein skal basere teknologien på språkreglar ville det vere idiotisk å ikkje inkludere typiske stavefeil i ordbøker.)

  6. Bah. Denne typen journalistikk gjer meg berre deprimert.

    På den eine sida er både OCR og maskinomsetjing kjempevanskeleg å få til bra. Teknologien bak (via Google Translate og sannsynlegvis Tesseract-OCR) er fantastisk kul.

    På den andre side kan du jo faktisk laste ned og køyre Tesseract på eigen maskin (har du scanna inn nokre bøker allereie kan du jo lett lage ein norsk språkmodell, om du vil.) Det å lage eit program som lastar opp eit bilete til ein tenar med Tesseract på, som så sender tilbake teksta, kunne t.d. vore ei grei oppgåve å gi studentar på førsteåret i informasjonsvitskap.

    Er altså problemet at Goggles ikkje lèt deg overstyre objektgjenkjenninga og seie at «dette er faktisk tekst, og det er tysk»? (Mtp. at dei fleste einspråklege menneske likevel er svært gode til å skilje tekst frå hus og bilar ville det vel vore ei smart brukargrensesnittavgjerd å la mennesket velje objekttype, medan maskinen gjer det maskinen kan.)

    Svar på denne kommentaren

    • Marius Arnesen (NRK) (svar til Kevin)

      Problemet her er at det ikke fungerer slik som man lover at det skal fungere.

      Vi lykkes svært dårlig med å få programmet til å oversette tekst slik meningen er at det skal gjøre, både avsnitt, hele sider og små overskrifter. Vi gjorde dette både med og uten croppefunksjonen.

      Det er mulig dette kunne vært løst ved at man kunne velge hvilken type input man gir programmet, men det er altså dessverre ikke mulig.

  7. Jeg er ikke overrasket akkurat. Denne typen teknologi har nok lang vei å gå før den blir suksessfull. Kan være du hadde fått et bedre resultat hvis du hadde brukt et scannet bilde av teksten istedet for bilde tatt med telefonen.

    Svar på denne kommentaren

  8. Kris & Julie

    1. Vi har testet Google Goggles på HTC Desire i snart en uke, og det rocker! Vi testet nå med litt tekst fra en roman her, og det fungerte på første forsøk. Logoer og strekkoder fungerer også kjempebra.

    Jeg vet det er nevnt over, men jeg ville vel tro denne oversettelsestjensten virkelig kommer til sin nytte når det er snakk om alt fra ett ord og opp til et avsnitt (100 ord ca) på et språk du ikke skjønner. Hvor ofte trenger du en hel side fra en roman oversatt jo mindre du vil være vanskelig mot Google?

    2. Hva er det med norske geeks og ordet «dog», og da særlig i tester? Man kan lese testene, dog sitter man og ler hver gang «dog» dukker opp 🙂

    Svar på denne kommentaren

    • Marius Arnesen (NRK) (svar til Kris & Julie)

      1. Spennende å se at noen får andre resultater enn det vi gjør. Mulig valg av telefon og kamera også spiller en rolle her?!

      Som sagt tidligere. Vi testet med alt fra hele sider til avsnitt og overskrifter.

      2. Godt å se at vi kan glede dere med litt språklig krydder innimellom, dog ser vi også at det kan bli litt mye av og til 😉

  9. @Marius..
    Jeg sitter med samme telefonen som deg, og det fungerer ganske greit.
    Forsøkte meg på et arke, med en lisensnøkkel for Office 2010, som ga et noe merkelig resultat. Men det fungerer.
    Fant relativt fort ut at det er en fordel å legge teksten på «grid»linjene i displayet, slik at OCR motoren enklere kan skille linjer osv.
    Samt, og her sliter jo jeg maksimalt da, en stødig hånd og tid til å la optikken fokusere.
    Var jo ikke alt i det brevet som ble akkurat korrekt oversatt til Norsk, men godt nok til at jeg kan lese hva som står der.

    Svar på denne kommentaren

  10. Torgeir Garpestad

    Jeg prøvde å oversette ett av innleggene på dette forumet, og tok ett tilfeldig innlegg. Jeg oversatte bare en setning om gangen. Bruker HTC desire, og må si at jeg er fornøyd med resultatet. Selv om det er mye feil, så tenker jeg at dette er jo google lab, og forbedringer er helt sikker på vei. Her er resultatet:

    Spennende se at noen far andre resultater enn det vi gjer. mulig valg og kamera ogsä spider en rolle her?!

    som sagt tidligere. Vi testet med alt fra h ele sider til avsnitt og overskrifter.

    codt a se at vi kan glede dere mod litt spraklig krydder innimellom, dog se ogsa at det kan bit litt mye av og til.

    Og oversatt til engelsk:
    Exciting to see that a father different results than we do. Possible options and camera also spider a role here.

    As said earlier. We tested everything from h ele pages paragraphs and headings.

    Codt a view that we may rejoice mod little spice in between. but also see that it can bit a bit much sometimes.

    Svar på denne kommentaren

  11. Meningsløs artikkel ! Tekstgjenkjenning og oversettelse er kanskje noe av det mest kompliserte en kan gjøre. Da velger en å teste på tysk roman oversettelse. En kan vel ikke i sin villeste fantasi tro at det er det produktet er beregnet for. Da er en bare stupid!

    Og hva slags innteresse har NRK av å slakte produkter på sider som kaller seg beta? Tverrt imot må en se potensialet og følge med på teknologien. Den er jo fantastisk!

    Svar på denne kommentaren

    • Marius Arnesen (NRK) (svar til oldman)

      Tekstgjenkjennelse og oversettelse er kanskje noe av det mest kompliserte man kan gjøre, men det alene rettferdiggjør dessverre ikke det faktum at akkurat dette produktet fra Google ikke helt gjør jobben.

      NRK som sådan har ingen interesse i å slakte et produkt kun for å slakte det. Når teknologien likevel lanseres, og skrangler såpass som den gjør, forbeholder vi oss altså retten til å si ifra om akkurat det.

      Andre ganger er vi svært fornøyd med ting vi titter på, og da skriver vi også det. Det er på en måte litt slik det fungerer.

      Jeg er helt enig med deg i at potensialet i teknologien er spennende, noe som også kommer fram i artikkelen.

  12. Problemet med hele programmet er prisen på mobil datatrafikk i utlandet. Der man hadde hatt mest bruk for funksjonen er på reise i land hvor man ikke forstår språket. Hvis dette programmet fungerer ved hjelp av internett tilgang til google translator så vil det vel koste en formue å bruke?

    Svar på denne kommentaren

Legg igjen en kommentar

Din e-postadresse vil ikke bli publisert. Obligatoriske felt er merket med *. Les vår personvernserklæring for informasjon om hvilke data vi lagrer om deg som kommenterer.