Dette mener Biblioteksentralen er viktig i Nasjonalbibliotekets kommende metadataleveranse

Nasjonalbibliotekets leveranse av metadata til bibliotek er i stor endring. Anbudet med Bokbasen går ut i 2020. Metadata fra forlag blir trolig pliktavleverte i løpet av året. En nasjonal metadatabrønn skal etableres. Hva er viktigst når premissene nå skal legges på nytt?

Nasjonalbiblioteket jobber i disse dager med utformingen av en ny metadataleveranse. Planene kan ta utgangspunkt i at metadata er en del av den nye forskriften til pliktavleveringsloven og i føringene som ligger i Nasjonal bibliotekstrategi 2020–2023 om en nasjonal metadatabrønn. Metadata fra brønnen (i hvert fall en delmengde av dem) skal ifølge strategien være gratis tilgjengelig for allmennheten.

For Biblioteksentralen er det mest avgjørende å peke på hva vi mener er viktig for de kommunale folke- og skolebibliotekene. Vi ble grunnlagt i 1952 som et serviceorgan for disse bibliotekene og er et samvirkeforetak med kommuner og fylkeskommuner som medlemmer. Det ligger i samfunnsoppdraget vårt å tenke ut løsninger og tjenester som er til beste for fellesskapet av norske folke- og skolebibliotek.

Her er våre 4 anbefalinger til Nasjonalbibliotekets kommende metadataleveranse:

Nasjonalbiblioteket må kreve pliktavlevering av forhåndsdata som skapes av forlag

Den nye forskriften til pliktavleveringsloven sier at Nasjonalbiblioteket kan kreve nødvendige følgeopplysninger og metadata som er skapt i forbindelse med produksjonen av et dokument. Vi mener at et minimum av følgende opplysninger må kreves inn:

  • ISBN 
  • Hovedtittel 
  • Annen tittel informasjon 
  • Navn på bidragsytere 
  • Utgave
  • Spesielle detaljer vedrørende materiale eller publikasjonstype
  • Forlagsnavn
  • Utgivelsesår
  • Omfang (sidetall, størrelse på fil, osv)
  • Seriens hovedtittel
  • Nummer innen serien
  • Språk
  • Bokgruppe (hvorfra følgende opplysninger kan hentes):
    • Dokumenttype 
    • Innholdstype 
    • Medium 
    • Bærer 
    • Litterær form 
  • Omslagsbilde

Det er ingen andre enn forlagene som kan skape disse opplysningene – eller metadataene – før en bok er gitt ut. Punktum. 

Med unntak av omslagsbilder var samtlige ovennevnte opplysninger definert som minimumskrav til forhåndsposter i Nasjonalbibliotekets anbud på metadataleveranse for 2016–2020. Nasjonalbiblioteket skrev der at disse dataene skulle leveres så tidlig som mulig etter at utgivelsen ble gjort kjent. Det er stor forskjell på når forlag registrerer metadataene i egne systemer og gjør bøkene kjent. Særlig de store registrerer dem tidlig, eller så snart utgivelsesplanene er klare. Det  kan bety flere måneder eller uker før utgivelsesdato. I neste strategiperiode kan og bør Nasjonalbiblioteket kreve forhåndsdataene så tidlig som mulig direkte fra forlagene.

Vi er bekymret for at de fire største forlagene vil gjøre det de kan for å unngå å levere alle nødvendige metadata direkte til Nasjonalbiblioteket. De er redde for at dette vil føre til økonomisk tap for Bokbasen, et selskap de fire store forlagene eier. Vi mener Nasjonalbiblioteket bør bruke hjemmelen de har i pliktavleveringsloven til å kreve dem. 

Hvis forlagene ikke må levere forhåndsdata, kan etter vårt syn konsekvensen bli at én aktør får et monopol på nødvendige forhåndsdata til bibliotek. Dette monopolet kan brukes til å stenge andre aktører ute av markedet. Da får vi mindre, ikke mer innovasjon når det gjelder metadata og digitale formidlingstjenester i Norge. 

Ulike aktører må kunne bidra inn i den nasjonale metadatabrønnen

I Nasjonal bibliotekstrategi 2020–2023 står det at:

«Nasjonalbiblioteket skal i samarbeid med Unit etablere en nasjonal metadatabrønn som sikrer én autorisert kilde til metadata for norske bibliotek, og som muliggjør gjenbruk av metadata både mellom bibliotekene og mellom bibliotekene og andre aktører

Biblioteksentralen var blant flere aktører som spilte inn ideen om en nasjonal metadatabrønn til Kulturdepartementet i fjor vår. Da skrev vi at en metadatabrønn vil være bra for både bibliotek og utviklere. Den vil gi oss et samlet sted å hente ut metadata til bruk i tjenester. Vi skrev videre at en metadatabrønn vil kunne bidra til en fornuftig arbeidsfordeling av metadataproduksjon. En metadatabrønn åpner nemlig opp for nye, rikere og mer fleksible beskrivelser av ressursene i bibliotekenes samlinger, uten at det skaper støy i katalogene. 

Forhåndsdataene fra forlagene er ikke ferdigbehandlet. De krever både konvertering til MARC-formatet og en kvalitetssikring. Biblioteksentralen har lang erfaring med å konvertere forlagsskapte metadata i ulike varianter av ONIX-formatet til MARC-formatet. Det dreier seg i all hovedsak om et éngangskonverteringsarbeid som kan gjøres i det dataene mottas. I dag og i nærmeste framtid starter det bibliotekfaglige katalogiseringsarbeidet først når boka foreligger, om det er en fysisk eller digital bok. Forenklet kan vi si at arbeidet består av to ulike steg, som begge bør kunne utføres av flere og ulike aktører framover. 

Det første steget i katalogiseringsarbeid består i å kvalitetssikre og autorisere de forlagsskapte dataene basert på opplysninger i boka. I dette steget fyller bibliotekarer inn metadata der det mangler informasjon fra forlagene. Her kobles også bibliografiske metadata til autoritetsregistre, som er et svært viktig steg i arbeidet frem mot lenkede data. 

Uttrykket «én bok, én registrering», som har vært et kjent budskap i bibliotekvesenet i flere tiår, og som nevnes i Nasjonal bibliotekstrategi 2020–2023, passer fint til denne typen metadata. Her snakker vi om metadata som beskriver objektive aspekter ved boka basert på katalogiseringsregler. Dette arbeidet kan med fordel fordeles blant flere forhåndsgodkjente aktører, gitt at vi finner en ny økonomisk modell for metadataproduksjon, for eksempel ved å betale første-mann-til-mølla. På denne måten vil flere miljøer holdes aktive og samtidig få mer tid til å utføre det intellektuelle arbeidet som kreves i neste steg. 

Det andre steget i katalogiseringsarbeid består av intellektuell innholdsanalyse. Med mulig unntak av deweyklassifikasjon for hylleplassering, gir ikke «én bok, én registrering» mening i dette steget. Det virker rett og slett bakstreversk i denne sammenhengen. Ulike aktører kan og bør beskrive ulike aspekter ved bøker ut ifra ulike formål og behov. Bibliotek bør få lov til å velge blant disse beskrivelsene og hente ut de metadataene som best formidler deres ressurser til gitte målgrupper. Tjenesteleverandører bør kunne hente ut så mye metadata som de trenger for å lage gode tjenester. En metadatabrønn muliggjør nettopp dette. 

En intellektuell innholdsanalyse trenger ikke være begrenset til klassifikasjon, emne- og sjangeranalyse. Jo flere aktører som har mulighet til å analysere ulike aspekter ved innholdet, jo mer støtte kan bibliotekarer få og jo bedre tjenester kan lages. 

Biblioteksentralen har for eksempel begynt å jobbe med metadata som kan være til støtte for bibliotekarer som bruker Lesersørvis-teknikken i formidlingsarbeidet sitt. Vi undersøker i denne sammenheng registrering av appellfaktorer. Dette er termer som beskriver bestemte aspekter ved leseopplevelsen. Andre eksempler på «nye» metadatatyper er vanskelighetsgrad og skjønnlitterære temaer. Det er i grunnen bare fantasien som setter grenser for hva som kan beskrives, forutsatt at det finnes betalingsvilje for arbeidet.    

Det kan også tenkes at metadatabrønnen kan inneholde metadata skapt av maskiner. Vi synes at arbeidet Nasjonalbiblioteket gjør med kunstig intelligens og maskinlæring er spennende. Vi gleder oss til å se hvilke tjenester som etter hvert blir tilgjengelige basert på denne teknologien. Vi mener likevel at menneskeskapte metadata kommer til å bli stadig viktigere for bibliotek. Det er nettopp bibliotektjenester bygget på intellektuelle vurderinger av bibliografiske ressurser som vil skille bibliotek som institusjon og avsender fra det som ellers i økende grad vil finnes tilgjengelig på nettet.

Brønnen må være godt dokumentert og enkelt kunne utnyttes av tjenesteutviklere  

God digital formidling bygger på gode metadata. Metadata danner grunnlaget for søk, navigasjon, oppdagelse og formidling av bøker og andre ressurser i digitale tjenester. Etter vår mening finnes det et stort potensial i norske bibliotek for bedre digital formidling av bibliotekets samling. Samtidig finnes det i dag altfor mange tjenester til bibliotek uten god utnyttelse av metadata. 

Vi trekker fram følgende eksempler på potensialet som allerede i dag finnes til å bygge bedre tjenester:

  • Vi har hittil ikke sett bibliotektjenester i Norge som drar nytte av opplysningene som registreres i det nasjonale autoritetsregisteret for personer. Her registreres blant annet yrke, nasjonalitet og kjønn knyttet til forfattere og andre bidragsytere. Videre er mange av identifikatorene fra dette registeret registrert i Wikipedia, noe som åpner opp for å hente inn enda flere opplysninger om personer i bibliotektjenester.
  • Lanseringen av et nasjonalt autoritetsregister for verk vil på samme måte åpne opp for at tjenesteleverandører på sikt kan hente inn flere opplysninger om verk enn de som er registrert i bibliografiske poster, som for eksempel relasjoner til andre verk.
  • I de fleste eksisterende bibliotektjenester i dag, benyttes kontrollerte emneord i praksis på samme måte som frie nøkkelord, det vil si uten utnyttelse av synonymi og andre relasjoner som eksisterer innad i emnevokabularene. Brukeren forventes å gjette seg frem til «riktig» emneord uten hjelp. 
  • Det samme gjelder for deweyklassifikasjon. De fleste biblioteksystemer tillater søk etter deweynummer, men legger opp til at sluttbruker må søke med sifre. Dewey er mye mer enn bare notasjon. Underliggende deweydata kobler notasjonen til en klassebetegnelse og registertermer, samt relaterer det til overordnede, underordnede, sideordnede og relaterte klasser. 
  • Hele fire norske emneordssystemer er mappet til Dewey. Dette inkluderer BIBBI-emner, som har vært koblet til Dewey siden 1960-tallet, Humord og Realfagstermer, som begge er mappet til Dewey med SKOS-relasjoner, og Bokbasens emner. Disse mappingene er maskinlesbare og legger opp til at Dewey kan brukes som en underliggende hub fra et emnesystem til et annet i ulike typer søketjenester.

Vi tror at en hovedårsak til den hittil dårlige utnyttelsen av ovennevnte metadata er mest sannsynlig at informasjon om hvordan dataene kan utnyttes har vært tilgjengelig fra ulike steder og gjerne uten avklarte vilkår og betingelser for bruk . En metadatabrønn vil kunne åpne for at tjenesteutviklere skal kunne hente ut data fra et samlet sted. Dette gjelder både bibliografiske metadata og opplysninger fra autoritetsregistre, emnesystemer, deweydata og mer. For at det skal lykkes, kreves det god dokumentasjon og tydelige lisenser for bruk av dataene. 

Brønnen må inneholde metadata til alle typer ressurser i bibliotek

Biblioteksamlinger kan bestå av alt fra bøker til tidsskrifter til filmer til musikk til dataspill. I forrige strategiperiode ble metadataleveransen fra Nasjonalbiblioteket begrenset til metadata om norske utgivelser. Vi kan bare spekulere i om dette var én av grunnene til at gratisleveransen ble betegnet som «det elementet med lavest tilfredshet blant bibliotekledere» i evalueringsrapporten av nasjonal bibliotekstrategi.  

For at metadatabrønnen skal kunne lykkes som hovedkilde for utviklingen av bedre bibliotektjenester, må den inneholde metadata for alle ovennevnte ressurser, uavhengig av utgivelsessted. Av samme grunn er det også viktig at brønnen inkluderer metadata knyttet til eldre utgivelser (historiske poster). Slik kan også disse gjenfinnes og være utgangspunktet for digitale formidlingstjenester framover. 

Vi presiserer her at metadatabrønnen bør inneholde metadata for utgivelser på alle mulige språk og fra alle mulige utgivelsesland. Norge er et kunnskapsland og bibliotek er viktige tilbydere av kunnskap. Dette gjelder ikke minst for kunnskap som finnes i bøker utgitt i utlandet, som ikke alltid er lett tilgjengelig hos lokale bokhandlere. Biblioteksentralen har de siste årene merket en markant oppgang i katalogiseringen vår av utenlandske bøker. Vi er én av flere aktører på markedet som produserer metadata til utenlandske utgivelser. Vi kan være én av flere som leverer slike metadata til brønnen.   

Norge er hjem til ca. 750 000 innvandrere med annen språkbakgrunn enn norsk. Folkebibliotekene spiller en viktig rolle for inkludering og er til støtte for både asylsøkere og flyktninger. En brukerundersøkelse fra Det flerspråklige bibliotek (DFB) i 2015 viste at 98 prosent av folkebibliotekene har lånere med annet morsmål enn norsk. 81 prosent av bibliotekene hadde benyttet seg av tilbudet fra DFB i månedene før undersøkelsen. Dersom vi skal kunne utvikle bibliotektjenester til alle, er det viktig at både bibliotek og tjenesteleverandører har åpen tilgang til metadata fra DFB sammen med annen metadata i brønnen.


Del dette innlegget

Share on facebook
Share on google
Share on twitter
Share on linkedin

Legg igjen en kommentar

Din e-postadresse vil ikke bli publisert. Obligatoriske felt er merket med *