nrk.no

På besøk hos Nasjonalbiblioteket

Kategorier: Fildeling, Internett & Nettjenester

Nasjonalbiblioteket, Mo i Rana.

Bokhylla.no skal gjøre all norsk litteratur (nokså) tilgjengelig for deg og meg. Vi tok turen til Mo i Rana for å finne ut hvordan det store digitaliseringsarbeidet foregår.

Nasjonalbiblioteket, Mo i Rana.

— Vi har valgt å ikke bruke tid på å velge ut hva vi skal digitalisere. Vi har like godt sagt at vi skal digitalisere alt, sier Svein Arne Solbakk, som er avdelingsdirektør for IKT og digitalisering ved Nasjonalbiblioteket.

Det er et ambisiøst mål, men ved hjelp av et storstilt, og i høy grad automatisert, digitaliseringsprosjekt ser det ut til at Nasjonalbiblioteket klarer oppgaven. Der man tidligere måtte møte opp på biblioteket, kanskje stå på venteliste eller ha tålmodighet til det man ville ha ble sendt fra et annet bibliotek, kan du nå gå til bokhylla.no og «låne» nesten akkurat hva du vil av norsk litteratur.

Men hvordan er det mulig?

NRKbeta ble med på omvisning i Nasjonalbiblotekets lokaler, for å se hvordan digitaliseringsprosessen av både bøker og annet materiale Nasjonalbiblioteket besitter foregår.

Forspranget ligger i teknikken, sier Audi. Det er nok også gjeldende for Nasjonalbiblioteket. Svein Arne Solbakk, avdelingsdirektør for IKT og digitalisering ved Nasjonalbiblioteket, står her ved siden av bøker som er plukket ut for å scannes. Foto: Sindre Skrede

Begynner med bøkene

Siden mesteparten av innholdet på bokhylla.no er bøker, begynner vi i bokavdelingen. Bøkene som skal digitaliseres hentes ut fra arkivet, som er et helautomatisk hyllesystem som vanligvis brukes i store varehus. I hyllene står det metallkasser med plass til rundt 15 bøker. Kassene er merket med en strekkode, og i hver kasse ligger bøkene i en bestemt kartotekmappe som også er merket med en strekkode. Når hver bok også har sin unike ID, er det lett for roboten å hente frem den bestemte kassen hvor den bestemte boken ligger.

En liten film som viser hvordan hylleroboten ser ut:

Nasjonalbiblioteket skal ha minst tre eksemplarer av hver bok på lager — ideelt sett.

— I de tilfellene hvor vi har mer enn tre eksemplarer, skjærer vi ryggen av bøkene, slik at vi til slutt får en stabel med enkeltark, som vi enkelt kan digitalisere, forteller Solbakk.

Den avskårne permen blir også digitalisert, og satt sammen med de scannede sidene når boken legges ut på bokhylla. Sidene i slike slaktede bøker scannes ved hjelp av en nokså standard tosidig scanner, som kan mates med en hel bok (eller: alle sidene i en bok) av gangen.

I tilfeller hvor Nasjonalbiblioteket ikke har mer enn tre eksemplarer av boken, kan ikke boken skjæres i stykker. Da må den digitaliseres slik den er, noe som kan være en langsom affære om man skal gjøre det manuelt.

— Heldigvis finnes det firmaer der ute som lager roboter for digitalisering av bøker og manuskripter. De er både skånsomme og effektive, og gjør også hele prosjektet mulig, sier Solbakk, mens han tar oss med inn til rommet hvor de spesielle bokscannerne, utviklet i Østerrike, befinner seg.

I dette rommet står Nasjonalbibliotekets scannere for skjøre eller sjeldne bøker og dokumenter. NB har to forskjellige scannere, som scanner på litt forskjellig måte. Foto: Sindre Skrede

Her scannes eldre dokumenter, bøker som kun finnes i få eksemplarer eller bøker som er for skjøre for de tosidige scannerne. Nasjonalbiblioteket har per i dag to forskjellige typer scannere. I begge tilfeller ligger boken med ryggen nedover, og er omtrent halvveis åpen. Den ene typen scanner har en mekanisk «finger» som blar i bøkene. Sidene scannes ved at to speilreflekskameraer tar bilder av hver side:

Den andre typen scanner tar tak i hver side ved hjelp av undertrykk, og løfter dokumentsiden opp samtidig som siden scannes:

Etter at bøkene er scannet, på enten den ene eller andre måten, skjer mye automatisk; de nå digitale bøkene settes sammen, og innholdet i boken indekseres. Posisjonen for hver bokstav og hvert ord blir logget, og i tillegg blir bokens indeks-sider registrert. Dersom programmene som utfører denne oppgaven opplever feil eller problemer blir dette loggført.

Når indekseringen og sammensetningen er fullført, blir resultatet gjennomgått for endelig «godkjenning», før de digitale bøkene overføres til den digitale bokhylla. I tillegg påføres boken informasjon om forfatter, tittel, emne og diverse katalogiserigstagger.

De aller skjøreste dokumentene må digitaliseres for hånd, hvor dokumentet må håndteres av en person som forsiktig blar fra side til side og tar bilder ved hjelp av et fastmontert kamera.

Alt i alt digitaliserer Nasjonalbiblioteket 1000 bøker per uke.

Et av de siste prosjektene som er gjennomført, er digitalisering, indeksering og katalogisering av alle Stortingsmeldingene, som nå blir lettere tilgjengelige og lettere søkbare enn før, helt tilbake til Stortingets første år. Foto: Sindre Skrede

— Nasjonalbiblioteket har ikke fått tilført noen nye midler for å gjennomføre dette digitaliseringsprosjektet. Det vi har gjort er å omdisponere midlene våre, for å satse digitalt, sier Solbakk.

Digitaliserer hele kulturarven

Det er ikke bare bøker som blir digitalisert hos Nasjonalbiblioteket. Fotografier, aviser, blader, lyd og film — alt Nasjonalbiblioteket tar vare på skal etter planen digitaliseres. Hver dag digitaliseres for eksempel en stor mengde ferske aviser, som Nasjonalbiblioteket får inn.

— Egentlig ønsker vi å få den digitale utgaven fra avisutgiverne, for eksempel den versjonen de sender til trykkeriet likevel, men det er ikke alle som gir oss det. Da må vi digitalisere en papirutgave selv, her hos oss, sier Solbakk.

Se video av en av Nasjonalbibliotekets avisscannere her:

Ståltråd med musikk — en innretning oppfunnet av dansken Valdemar Poulsen i 1898. Avspilleren i bakgrunnen er til magnetbånd. Foto: Sindre Skrede

Selv om mye kan gjøres ved hjelp av nåtidens teknologi, er det mange av de gamle formatene, for eksempel på musikkfronten, som ikke kan spilles av på annet enn originalt utstyr.

Han viser frem en snelle med syltynn ståltråd.

— Dette var en dansk oppfinnelse, og er i grunnen et slags magnetbånd. Jeg tror ikke produktet tok helt av, men vi har noen spoler i arkivet vårt som vi måtte digitalisere. Til slutt fikk vi tak i en original avspiller, så nå er innholdet reddet, forteller Solbakk.

Nasjonalbibliotekets lydavdeling er i det hele tatt en stor samling med dels underlige avspillingsmaskiner, som enten er kjøpt i fungerende stand eller satt sammen av deler man har klart å få tak i.

— Vi sitter mye på ebay, for å si det sånn – det er stort sett der vi får tak i gammelt avspillingsutstyr, sier Solbakk.

Kristian Granheim digitaliserer musikk, og holder for tiden på med 78-plater. Som tidligere lydtekniker i NRK, mener han å ha funnet drømmejobben mellom vinyl, stift og digital teknikk. Foto: Sindre Skrede

Film er også noe Nasjonalbiblioteket digitaliserer. Her finnes det, som på musikkfronten, mange forskjellige formater, og originalene kan være i svært forskjellig stand. På filmrommet fortelles det om gammel nitratfilm som spontant kan ta fyr, om film som krymper eller strekker seg, eller om gamle oppbevaringsbokser som ruster og ødelegger filmen.

Slik bør det helst ikke se ut. Her har esken filmen har ligget i rustet, og ødelagt deler av "Thor Solbergs flyvning over Atlanterhavet" fra 1930-årene. Foto: Sindre Skrede

Likevel renses og lappes filmene så godt det lar seg gjøre, før de kjøres gjennom en filmscanner som scanner filmene i 4k-oppløsning. Nasjonalbiliotekets scanner kan digitalisere film i sanntid (som ennå ikke er så vanlig i 4k-verden), og kan ta opp lyd samtidig. Etter scanning blir filmene behandlet digitalt for å fjerne fargestikk, riper og lignende.

Plass

Den store digitaliseringsjobben krever naturligvis lagringsplass. Foreløpig har Nasjonalbiblioteket digitalisert materiale nok til å fylle 10 petabyte — eller ti millioner gigabyte. Det genereres foreløpig omtrent 3-5000 gigabyte per dag.

Når filmdigitaliseringen for alvor kommer i gang, beregnes det at dette vil generere omtrent 1 gigabyte per sekund, som vil stille enda større krav til filhåndtering og lagringskapasitet.

— Vi lagrer data på et nokså standard serveroppsett inne i fjellhallen vår, sier Solbakk.

— I tillegg har vi to backuper på tape, eller magnetbånd. Èn tapemaskin står i fjellhallen, den andre i kjelleren i hovedbygget. Vi ønsker oss også en off-site backup, og jobber med å få det til, sier han.

I Nasjonalbibliotekets fjellhall finner vi også meter på meter med det analoge materialet — alt det som enten har blitt eller skal scannes.

I fjellhallene finner vi, foruten datalagring i form av servere og en taperobot, arkivene hvor alt av papir oppbevares. Her fra tidsskrifthallen. Foto: Sindre Skrede

Rettigheter og fremtiden

Når det gjelder bokhylla.no, tilgjengelighet og tilrettelegging forteller han at strikken nok er tøyet så langt det er mulig.

— Jeg deltok ikke i forhandlingene selv, men forstår på dem som var med at vi neppe hadde fått i stand en bedre avtale, rettighetsmessig, enn den vi har nå, sier Solbakk.

Han forteller likevel at det jobbes med Norges Blindeforbund for å få i stand en løsning som gjør bokhylla bedre å bruke for blinde og svaksynte, for eksempel.

— Grunnen til at vi kan digitalisere materialet i det omfanget vi gjør, er egentlig at Norge er et veldig lite land. Andre land, hvor samlingene er mye større, har nok neppe mulighet til å digitalisere absolutt alt, slik vi tenker, forteller Solbakk.

Digitaliseringsarbeidet er en stor jobb, og Solbakk forteller om et langsiktig perspektiv.

— Vi har nå holdt på med digitaliseringsarbeidet i seks år, og planlegger å holde på i 25 til. Det er ennå mye materiale som skal digitaliseres, sier Solbakk.

7 kommentarer

  1. Harald Groven

    Fantastisk at kulturarv eldre enn 1990-tallet blir søkbar på nett.

    Da jeg studerte historie for et tiår siden, var det veldig ofte noen som satt på lesesalen og biblioteket som hadde fått i vit.ass.-jobb å tråle mikrofilmer med gamle aviser etter historisk materiale for forsknings- og bokprosjekter. Dette var veeeeldig tidkrevende, og ofte resultatløst. Å finne hva en kjent person hadde sagt eller skrevet i 30 årganger av flere mikrofilma aviser ble en sak for personer med spesielt velutviklet tålmodighet. Nasjonalbibliotekets innsats gjør slik nåla-i-høystakken-leting mange titusen ganger enklere.

    Når det gjelder nyere materiale, er det egentlig redigitalisering som Nasjonalbiblioteket driver, med siden trykkoriginalene til nesten alle bøker og aviser har vært digitale siden begynnelsen av 1990-tallet. Men i steden for å tidlig skaffe seg originalfilene som forlagene og mediehusene har benyttet til å trykke, har de valgt (*) å samle inn papirversjonen, som de 10-20 år etter redigitaliserer. Å skanne inn fra papir medfører en betydelig kvalitetsforringelse, særlig på bilder, sammenlignet med om de hadde tatt vare på filene og konvertert disse til f.eks. PDF/A. Dessuten blir det haugevis av OCR-lesingsfeil ( l-er som blir tl 1-tall, e-er som blir til c-er. osv).

    (*) valg… bøkene får de som følge av pliktavleveringsloven, med lobbyvirksomhet kunne de sikkert fått tilgang til digitale filer i stedet for analoge, og dermed spart forlag for porto og administrasjon og seg selv for tungvindt redigitalisering.

    Svar på denne kommentaren

  2. Bølgeskvulp uke 1 | Making Waves Blogg

    […] flinke Anna Kirahs tanker om design- og arkitekturfeltet i Norge anno 2013, NRK Betas besøk hos Nasjonalbiblioteket som digitaliserer bøker og dette overslaget Porsgrunn Kommune har gjort på hva de kan spare på å digitalisere sine […]

    Svar på denne kommentaren

  3. Elsker Nasjonalbiblioteket for uten dem så hadde jeg neppe hatt så stor tilgang til lesestoff! Bor et stykke unna vanlig bibliotek.
    I tillegg driver jeg med litt slektsforskning og da er såkalte bygdebøker/sogebøker som er lagt ut på Nasjonalbiblioteket til svært god hjelp når en står fast da en veldig lettvint kan søke gjennom innholdet i bøkene!
    Håper derfor at Nasjonalbiblioteket velger å prioritere slike bøker.
    På Bergen Offentlige Biblioteks nettsider har de en ganske god oversikt over gårder og tilhørende bøker (imidlertid kun for Hordaland og Sogn og Fjordane) http://bergenbibliotek.no/lokalhistorie/gardsregister
    Bøker som er blitt lagt ut på NB vil ha en direktelenke til digital bok slik at det er veldig enkelt å finne frem til rett bok.
    Slekt1 har også en ok landsdekkende oversikt her: http://slekt1.com/nb/digitale-bygdeboker

    Svar på denne kommentaren

  4. Christian Løverås

    Interessant artikkel!

    Det virker veldig unødvendig å scanne innhold som finnes tilgjengelig digitalt. Kan NRKBeta grave litt mer i hvotfor digitalt innhold ikke leveres, og kanskje ta en prat med de som bidrar til ekstraarbeid?

    Svar på denne kommentaren

Legg igjen en kommentar

Din e-postadresse vil ikke bli publisert. Obligatoriske felt er merket med *. Les vår personvernserklæring for informasjon om hvilke data vi lagrer om deg som kommenterer.