nrk.no

Googleboksen vår snakker ikke norsk

Kategorier: Nettjenester & NRK


Google søk

En konsekvens av å bo i et lite land er at språket vårt ikke alltid er det første til å bli støttet i programvare. Heldigvis er vi et rikt land med mange nettbrukere med god kjøpekraft. Derfor er vi med i de største produktene. Dere NRKbeta-lesere har for lenge siden oppdaget at google.no har blitt svært god i norsk. «Mente du» dukker stadig opp og man får treff på andre former av ordet man søkte på.

Her er et eksempel: Søker du på «nokrs rikskringkasting» spør google.no om du mente «norsk rikskringkasting».

Google på nynorsk

Dessverre har ikke dette nådd vår egen Google-boks som vi bruker på søket på nrk.no. Derfor har vi søkt andre løsninger og funnet et lovende alternativ i Nyno. De tilbyr språktjenester. Det mest interessante er muligheten for å kunne søke på bokmål og nynorsk samtidig. I tillegg leverer de såkalte ekspanderte former av ord. På den måten kan man søke på “slyngel” og få resultater med ordene «slyngler», «slyngelen» og «slynglene».

Vi har lagt ut en test av dette. Sammen med noen andre nye funksjoner. Vi setter stor pris på tilbakemeldinger!

http://www.nrk.no/sok/index.php?q=b%C3%B8lle&type=nyno

I tillegg har vi laget en statistikkside for søket, og jeg tenkte det kunne være interessant for andre spesielt interesserte. Den vil utvides med mer detaljert statistikk etterhvert.

PS. Noen som kan hjelpe oss med samisk?

13 kommentarer

  1. Ricky Sookermany

    Aha… Kjører Google Mini selv, og der er det en del begrensninger, som f.eks. nettopp håndtering av trykkleifer. Trodde kanskje dere hadde funnet en løsning på problemet. Noe dere for så vidt har; Google Search Appliance… 😉

    Svar på denne kommentaren

    • Andreas Wiik (svar til Ricky Sookermany)

      GSA løser ikke språkutfordringene. Den er dårlig i norsk. den har støtte for flere andre språk. Det er derfor vi bruker Nyno. Kunne du fortelle litt om erfaringer med Mini? Vi vurderer å ta den i bruk på intranetttet.

    • Ricky Sookermany (svar til Andreas Wiik)

      Vi bruker i dag Google Mini til site search, men jobber for tiden med nytt nettsted og da vil vi velge bort Google Mini fordi den ikke klarer å levere det vi har behov for. Utfordringen vår i forhold til Google Mini er at vi selger kurs og konferanser, som da nødvendigvis også har avholdelsesdato som ligger frem i tid. Vi ønsker å vise søkeresultatene (kursene) i kronologisk rekkefølge i forhold til avholdelsestidspunkt. Dessverre klarer ikke Google Mini å indeksere nettsider på dato dersom datoene er lengre enn tre dager frem i tid. Dette er nok et tilfelle som de fleste ikke vil oppleve, men for vår del var/er det en show stopper.

      I tillegg har vi også hatt litt problemer med å tilpasse visningen og indekseringen i forhold til arkiverte nettsider, men det er nok selvforskyldt ettersom vi per i dag har en dårlig mappestruktur på nettsidene.

      Vi savnet også funksjonaliteten med at Google Mini kunne foreslå alternative stavemåter dersom man ikke fikk treff på et søk. F.eks. dersom noen søkte på "exelkurs" ønsket vi at den skulle foreslå "Excelkurs". Denne funksjonen er altså ikke tilgjengelig i Google Mini. Alternativet var at vi manuelt måtte legge alle alternative stavemåter inn som keymatch (som da utløser en form for sponsorlenke visning). Det ble veldig mye manuelt arbeid ettersom folk har en tendens til å benytte seg av kreavtive stavemåter…

      Det som er kult med Google Mini derimot, er jo mulighetene one-box modulen bringer med seg. Man kan få til noen snasne SERPs med den. Også selvfølgelig bra statistikkrapporter som kan hentes ut, både i GM admin og i Analytics.

  2. Henrik Steen

    En konsekvens av å bo i et lite land er at språket vårt ikke alltid er det første til å bli støttet… Ikke for å være surmaget (HAR drukket mye kaffe i dag…), problemstillingen berører jo også det å *bruke* norsk, unngå anglofisering, og her kunne jo NRKbeta gjort en noe bedre jobb. På websidene går stort sett alle funksjoner i engelsk: archives, feedback, tags, category, report, reply, sign up, notify, read more, related posts, date, last acticity… etc. etc.
    Ettersom dere kjører WordPress er dette en veldig smal sak å få oversatt i tema-filene (som forøvrig er tatt fra nettet uten å kreditere opphavsmann, det er tvert om FJERNET, kremt…!).
    Ellers glad for NRKBeta!
    H;)

    Svar på denne kommentaren

    • Øyvind Solstad (svar til Henrik Steen)

      Vi er veldig klar over dette med engelsk språk på NRKbeta og vil ikke ha det slik. Når det gjelder det themet vi bruker, så funker ikke den standard norske WordPress-oversettelsen som andre bruker. Dessuten vil vi ha themet på engelsk – men IKKE Dahsboardet til WordPress.

      Kommentarfeltet er på engelsk fordi vi tester IntenseDebate for tiden, og de har bare engelsk. Vi kommer snart til å slå det av igjen for det er ikke bra nok slik det er nå.

  3. Eg er i gong med å søkje på Google Summer of Code hos Apertium ( http://www.apertium.org ), med eit prosjekt for automatisk omsetjing mellom bokmål og nynorsk. Det er ein del kandidatar så det er langt frå sikkert eg får plassen, men eg tenkte eg skulle nemne at Trond Trosterud ved UiT driv og utviklar samiske språkpar (evt. samisktalande kan prøve bleeding-edge testversjonen på http://xixona.dlsi.ua.es/testing/ , Northern Sami->Lule Sami , sjå http://wiki.apertium.org/wiki/Northern_Sami for utviklingsdetaljar). Apertium har ein _god del_ ulike prosjekt på gong, spesielt med tanke på integrering mot andre vevsider, og slik eg kjenner medlemmene er dei alltid interessert i samarbeid.

    Svar på denne kommentaren

Legg igjen en kommentar

Din e-postadresse vil ikke bli publisert. Obligatoriske felt er merket med *. Les vår personvernserklæring for informasjon om hvilke data vi lagrer om deg som kommenterer.