Snacks

Ny «forbetra» versjon av VG


Dagens surferunde vart mykje artigare med nynorskvg.no : VG Nett på nynorsk.

Norsk Målungdom har ein kampanje for at journalistane i VG og Dagbladet skal få lov til å skrive nynorsk:

I dag er det slik at alle dei store riksavisene i Noreg har eit forbod mot nynorsk på redaksjonell plass. Det tyder at ein journalist tilsett i VG eller Dagbladet ikkje får lov til å skrive på nynorsk om han eller ho vil det. Dette kjem ingen til gode.

Som ein del av kampanjen omset målungdomane VG Nett til nynorsk. Dagbladet.no vart òg omsett, men sidene vart fjerna i går. Omsetjinga blir gjort med open source-programmet Apertium.

6 kommentarer

  1. For teknisk interesserte skreiv eg litt korleis sidene er sett opp på bloggen min. I korte trekk; lastfordelar (nginx), cache (varnish), vevtenar(nginx), styresystemet (skrive i django), langtidslagring av omsette sider (mysql), oppgåve-utsetjing og køying (celery og rabbitmq) og til slutt sjølve omsetjingsprogrammet apertium med nn-nb-språkparet til Unhammer.

    Òg verd å nemna er nynorskdb.no, som vart lagt ned etter press for dagbladet. NMU sette opp ein enkel send-epost-til-redaktør-side der no.

    Sidene var laga for NMU grunna nynorskforbodet som eksisterer i desse netavisene, trass i at dei kallar seg riksaviser. Dei må ikkje skriva nynorsk, men må dei absolutt forby det?

    Svar på denne kommentaren

    • Whoa! Det var litt av eit rigg for ei so lita oppgåve.
      Trur eg har eit perlscript liggande som med statiske html-sider kunne gjort same biffen med ca. 0.1% av innsatsen.

      Vel kan nynorsk være litt tregt og tungt, men det er då ikkje vits å gjere det verre enn det er.

      Svar på denne kommentaren

      • Fyrste versjon var slik, men det var ikkje godt nok. Kva når folk går inn på ei side du ikkje har omsett? Jo, då gjer han omsetjinga der og då, og lagrar cache-fila. Problemet er at du ikkje kan ha meir enn 1-3 instansar av apertium køyrande på likt, av di då kjem OOM-killeren og drep tilfeldige program. Pluss du swappar som ein helt.

        Den fyrste versjonen takla ikkje surfing av tvo (overdrive aktive) personar på same tid. 🙂 Men fungerte fint for meg åleina.

        Dessutan, kva gjer du med oppdateringar? Det er enkelt å laga til ein cronjobb for framsida, men kva med ein artikkel som vert kontinuerlig oppdatert (eller retta for feil?).

        Det viste seg at me ikkje trong nokon lastbalansar av di heile cachesystemet var so godt laga til, og cachen vart varm ganske kjapt (vel, eg varma han upp med ein enkel wget -r ;-)) og nesten alle treff er rett frå databasen. Hadde eg putta Varnish inn att so hadde nok veldig få treff gått lengre enn til Varnish.

        Men, ja, for dette her so kunne det vert gjort mindre, men me visste jo ikkje kva for type last sida ville få. Eg var konstant redd for at han ikkje ville tòla trafikken, so måtte ha ein plan for å kunna skalera veldig kjapt og enkelt. Og so hev eg jo lært masse nytt, det hadde eg ikkje med versjon 1.0 som var eit fint python-script.

        Svar på denne kommentaren

          • *Steinraus*: Varnish og memcached jobbar på forskjellege plan, sjølv om dei kann brukast på kvarandre sine område. Eg såg kort på memcached, men det eg eigentleg trong var ein som cacha den fulle sida ferdig.

            Memcached er jo berre eit nykel-innhald-lager i minnet, i hovudsak, og må brukast frå programmet ditt.

            Varnish på den andre sida, mmap-er ei fil på disken og er laga for å liggja mellom vevtenar og brukarar (altso, akkurat det eg ville ha brukt han til).

            Memcached vil du bruka i staden for ein database i program/netsider som ikkje berre les informasjon ekstremt ofte, men som òg endrar denne informasjonen snøgt. Altso; ikkje noko me trong nett her.

            Likevel so var jo mykje av dette for å læra ein del av dei nye måtane å laga større netsider på, og memcached er jo ein viktug ting der for dei meir dynamiske variantane 🙂

            Svar på denne kommentaren

Legg igjen en kommentar

Din e-postadresse vil ikke bli publisert. Obligatoriske felt er merket med *