Hjem
Universitetsbiblioteket
Forskningsdata

Åpen tilgang til forskningsdata

Universitetsbiblioteket kan gi råd og veiledning om lagring og tilgjengeliggjøring av forskningsdata

Hovedinnhold

Forskningsdata er en sentral del av verdiskapingen ved universitetene. Å fremme åpen tilgang til forskningsdata er en strategi for å utnytte potensialet fullt ut og derved maksimere effekten av forskningsaktiviteter i et digitalt samfunn.

HVORFOR bør du gjøre dataene dine tilgjengelige? 

Universitetet i Bergen har som mål at data som er et resultat av de ansattes forskningsaktivitet, skal klargjøres og tilgjengeliggjøres for gjenbruk, i tråd med FAIR-prinsippene (Politikk for åpen vitenskap ved Universitetet i Bergen)

Åpen tilgang til forskningsdata er med på å øke påvirkningen og transparens av forskningsaktiviteter. Det sikrer at det fulle potensialet i et forskningsprosjekt blir utnyttet og kan legge grunnlag for videre forskning, med passende kreditering av dataskaperne. Derfor er god datahåndtering og åpen tilgang til forskningsdata blitt et krav fra finansiører, som Norwegian Research Council og Horizon2020/Horizon Europe.

Det er også vanlig at forlag og tidsskrift krever at forskeren gjør datasettene som ligger til grunn for resultatene i publikasjonen tilgjengelige, og derved sikre reproduserbar forskning.

"Bedre tilgjengeliggjøring og mer gjenbruk av forskningsdata kan bidra til vitenskapelige fremskritt ved at hver enkelt forsker får et større datagrunnlag å bygge på, til økt etterprøvbarhet og bedre kvalitetssikring av tidligere forskningsfunn, og til å unngå at samme type datainnsamling må finansieres flere ganger" Fra Nasjonal strategi for tilgjengeliggjøring og deling av forskningsdata 

Åpen tilgang til forskningsdata øker synlighet og påvirkning

Det er mange fordeler med åpen tilgang til forskningsdata, både for forskere, finansiører og samfunnet øvrig. 

• Artikler som lenker til forskningsdata siteres oftere
• Sammenkobling av data og publikasjoner øker forskernes synlighet
• Data som ikke er direkte lenket til en publikasjon kan gjøres tilgjengelige og siterbare
• Data- eller analyseverktøy kan inspirere til ny forskning og skape muligheter for samarbeid
• Åpenhet støtter forskningsintegritet og reproduserbarhet
• Tilgjengelige resultater tillater involvering av borgere og samfunn
• Færre ressurser blir brukt på duplisering av resultater, og dermed større effektivitet for finansiører
• Å bygge på resultater kan føre til akselerasjon av forskningsprosessen og tilrettelegge for raskere innovasjon

Les mer her:
Piwowar et al., 2013: Data reuse and the open data citation advantageCristensen et al., 2019: A study of the impact of data sharing on article citations using journal policies as a natural experiment
Colavizza et al., 2020: The citation advantage of linking publications to research data
McKiernan et al., 2016:
How open science helps researchers succeed

Krav til åpen tilgang til forskningsdata

Relevante retningslinjer, dokumenter og lenker.

National strategy on access and sharing of research data (2017)

  • Forskningsdata skal være så åpne som mulig, og så lukkede som nødvendig.
  • Forskningsdata bør håndteres og tilrettelegges slik at verdiene i dataene kan utnyttes best mulig.
  • Beslutninger om arkivering og tilrettelegging av forskningsdata må tas i forskerfellesskapene. 

University of Bergen Policy for Open Science (2020)

  • Forskningsdata bør håndteres og tilgjengeliggjøres slik at verdiene i dataene kan utnyttes best mulig.
  • Alle forskningsprosjekter som ledes fra UiB skal ha en datahåndteringsplan.
  • Studenter og ph.d.-kandidater oppfordres til å gjøre forskningsdataene sine tilgjengelige ved innlevering av masteroppgaver og ph.d.-arbeid. 
  • UiBs fagmiljøer skal bidra til å utvikle gode løsninger for arkivering og tilgjengeliggjøring av forskningsdata på sine fagfelt.

Norwegian Research Council (2017)

  • Forskningsdata skal lagres/arkiveres på en sikker måte
  • Forskningsdata skal gjøres tilgjengelig for videre bruk
  • Forskningsdata bør gjøres tilgjengelig på et tidlig tidspunkt
  • Forskningsdata skal utstyres med standardiserte metadata
  • Forskningsdata skal utstyres med lisenser for tilgang, gjenbruk og videredistribusjon
  • Forskningsdata bør gjøres tilgjengelig til lavest mulig kostnad
  • Håndtering av forskningsdata skal beskrives i en datahåndteringsplan

Policy for Open Access to Research Data (2017)Policy for Open Science (2020)

Horizon 2020 (2016)

  • "Data Management Plans (DMPs) are a key element of good data management. A DMP describes the data management life cycle for the data to be collected, processed and/or generated by a Horizon 2020 project."
  • The proposal is not expected to contain a fully developed DMP. However,good research data management as such should be addressed under the impact criterion, as relevant to the project.
  • Once a project has had its funding approved and has started, you must submit a first version of your DMP (as a deliverable) within the first 6 months of the project. The Commission provides a DMP template in annex, the use of which is recommended but voluntary.
  • The DMP should be updated as a minimum in time with the periodic evaluation/assessment of the project.

Guidelines on FAIR Data Management in Horizon 2020 (2016)
Guidelines to the Rules on Open Access to Scientific Publications and Open Access to Research Data in Horizon 2020 (2017)
European Research Council (ERC) Guidelines on Implementation of Open Access to Scientific Publications and Research Data (2017)
Frequently Asked Questions

Horizon Europe (2021)

  • Coming soon, mandatory Open Science practices are expected

HVA er forskningsdata - og skal alle data være åpent tilgengelige?

I National strategy on access and sharing of research data, defineres offentlig finansiert forskningsdata som " data som er samlet inn eller frembrakt til bruk for eller som et resultat av offentlig finansiert forskning, og data som utgjør grunnlaget for publikasjoner som er et resultat av offentlig finansiert forskning, uavhengig av hvilken kilde dataene kommer fra".

Dette inkluderer både helt nye data og data generert gjennom analyse av eksisterende data (sekundære data). For å utnytte potensialet fullt ut, bør forskningsdata administreres og kurateres. For å akselerere forskningsprosessen og for å gjøre forskningsresultater reproduserbare, bør også forskningsprotokoller og analyseprogramvare / programkode opprettet i forskningsprosessen gjøres tilgjengelig. Hovedprinsippet med åpen tilgang til forskningsdata er at data skal være så åpne som mulig, men så lukkede som nødvendig. For eksempel kan ikke personlige og sensitive personopplysninger, eller data som vil være i konflikt med immaterielle rettigheter og kommersialisering, gjøres fullstendig tilgjengelig. Imidlertid kan det være mulig å gjøre noen sensitive personopplysninger tilgjengelige i anonymisert form eller for spesifikke brukere etter definerte tilgangskriterier og sikre teknisk tilgangskontroll.

HVORDAN kan du gjøre dine forskningsdata åpent tilgjengelige?

Datahåndteringsplan (DMP) er et verktøy som sørger for god datahåndteringspraksis gjennom hele forskningsdatas livssyklus, fra prosjektplanlegging og gjennom den aktive forskningsfasen til prosjektslutt. Arkivering av data, ledsaget av metadata og en passende lisens, er en strategi som er med på å øke effekten av forskningsresultater og fremme reproduserbar forskning. FAIR-prinsippene er et sett med retningslinjer som sikrer at forskningsdata kan gjenbrukes. Det er viktig at FAIR-data ikke tilsvarer ubegrenset tilgang til data. I et prosjekt med personlige eller sensitive personopplysninger vil tiltak for å sikre dataene være en viktig del av datahåndteringsplanen. Universitetet i Bergen og mange finansiører krever at forskningsprosjekt har en datahåndteringsplan. Universitetsbiblioteket tilbyr jevnlig kurs i datahåndteringsplaner. For mer informasjon om kommende kurs, se høyremargen på siden, eller se i vår kalender.

Research data life cycle

Forskningsdataenes livssyklus beskriver prosessen fra planlegging, innsamling av data, til publisering og langsiktig bevaring, som kan gjenbrukes og legge grunnlag for nye forskningsprosjekter.

FAIR data: Findable, Accessible, Interoperable, Reusable

FAIR-prinsippene er et sett med retningslinjer for å sikre at forskningsdataene er av god kvalitet og skal kunne gjenbrukes.

"UiB skal i nasjonale og internasjonale nettverk og samarbeid fremme åpen tilgang til forskningsdata og FAIR-prinsippene." Fra Politikk for åpen vitenskap ved Universitetet i Bergen

FAIR-prinsippene står for: 

  • Findable – gjenfinnbar. Dette krever metadata ("data om data"), lesbare for mennesker og maskiner, og persistente identifikatorer.
  • Accessible – tilgjengelig. Kriterier for å sikre tilgang til et funnet datasett. Metadata må hentes ved hjelp av en standardisert protokoll som tillater at autorisasjonsprosedyrer var nødvendige. Det er viktigere at metadata må være tilgjengelig selv om selve dataene ikke lenger er tilgjengelige.
  • Interoperable - data skal kunne åpnes, forstås, kombineres, gjenbrukes og bearbeides uten begrensinger, både nå og i fremtiden.
  • Reuseable - gjenbrukbar

Datahåndtering i den aktive forskningsfasen 

God datahåndtering i den aktive fasen av et forskningsprosjekt letter din fremtidige forskning, letter samarbeid, muliggjør avanserte analysemetoder og er en forutsetning for arkivering av data av høy kvalitet. Noen aspekter å vurdere:

Datalagring og sikkerhetskopiering

• Mer informasjon om lokal datalagring ved UiB og muligheter for å øke lagringskapasiteten finner du her. Hvis du trenger personlig veiledning, kan du kontakte UiBhjelp.

• Sensitive data fra UiB kan lagres i SAFE. Se også informasjonen om personopplysninger og sensitive data.

• Aktiv lagring av store datamengder (TB-rekkevidde) leveres av Sigma2, applikasjoner kjøres to ganger per år. NIRD-tjenesteplattformen tillater on-site analyser.

Filhåndtering

• Bruk korte og deskriptive filnavn.
• Velg filformat som vil sikre langvarig tilgang.
• Spor forskjellige versjoner av dokumentene dine.
• Lag metadata for hvert eksperiment eller analyse du kjører. Sørg for å dokumentere f.eks. eksperimentelle forhold eller opprinnelsen til dataene. Se Deposit Guide til UiB Open Research Data eller DataONE Best Practices Primer for mer informasjon.
• Organiser / indekser dataene dine på en måte som lar deg og andre enkelt søke etter bestemte filer, også etter lengre tid. Se CESSDA Data Management expert guide for mer informasjon.
• Tenk på merknaden i datafilene og maskinlesbarheten. Lagre for eksempel ryddige data med hver variabel som en kolonne, hver observasjon som en rad og hver observasjonsenhet som en tabell.
• Hvis du skriver programvarekode, bør du vurdere versjonskontroll med Git. Universitetet i Bergen har sin egen Gitlab-forekomst.

Metadatastandarder

  • Gjør deg kjent med metadatastandardene i forskningsmiljøet ditt / i arkivet du vil publisere dataene dine allerede tidlig i prosessen, og sørg for å skaffe deg nødvendige poster. Se dataarkivering for mer informasjon. 

Prosjekt med persondata eller sensitive data

Hvis prosjektet inneholder personopplysninger eller sensitive data, må det tas spesifikke tiltak for å sikre dataene. Å beskrive disse tiltakene er en viktig del av datahåndteringsplanen. Personlige sensitive data beskriver en kategori av personopplysninger som inneholder informasjon om rase eller etnisk opprinnelse, politisk tro, religion, filosofisk tro, fagforeningsmedlemskap, genetisk og biometrisk informasjon, helseinformasjon eller seksuell informasjon. Retningslinjer og juridisk informasjon knyttet til arbeid med sensitive eller persondata finner du i Personvernportalen.

Alle forskningsprosjekter ved UiB som inneholder personlige eller sensitive data skal registreres og følges opp i RETTE. IT-avdelingen ved Universitetet i Bergen har utviklet en løsning for sikker behandling av sensitive personopplysninger i forskning:  SAFE. Andre sikre lagringsalternativer er TSD og HUNT Cloud.

Arkivering av sensitive og persondata

Langtidsbevaring av personlige (sensitive) data kan i visse tilfeller være hensiktsmessig. Noen sensitive data kan arkiveres i arkiver med teknisk tilgangskontroll for kun å tillate datatilgang for bestemte brukere etter definerte tilgangskriterier. I andre tilfeller kan anonymisering av sensitive data tillate deponering i et åpent depot. Det er viktigere at hvis forskningsdata samles inn med informert samtykke, må dataarkiveringsplaner inkluderes allerede i samtykkeskjemaene.

Ressurser

CESSDA Data Management Expert Guide inneholder et avsnitt om juridiske og etiske hensyn ved å gjøre persondata åpent tilgjengelige.
ELIXIR RDMkit: informasjon om planlegging, innsamling, prosessering, analyse, bevaring og gjenbruk av menneskelige forskningsdata og inneholder en samling relevante verktøy og ressurser.
PhD on Track 

    Fagspesifikk hjelp 

    Noen infrastrukturer gir spesifikke støttetjenester for forskningsdata og spørsmål knyttet til datahåndtering:

     

    NB! Hvis du føler at infrastrukturen din mangler, kan du kontakte oss.

    HVOR kan du gjøre forskningsdata åpent tilgjengelige? 

    Publisering av forskningsdata og tilhørende metadata i et forskningsarkiv sikrer langtidsbevaring og gjenbrukbarhet. Forskningsdata bør gjøres tilgjengelig senest ved publisering av den vitenskapelige artikkelen.

    Valg av dataarkiv

    For å gjøre forskningsdataene dine synlege og tilgjengelige, bør du velge et fagspesifikt arkiv. re3data.org er det største og mest omfattende registeret over tilgjengelige dataarkiv. Registret er kuratert og alle oppførte datalagre oppfyller definerte kvalitetskriterier. fairsharing.org er et annet, kuratert register over forskningsdataarkiv.

    Institusjonelle arkiver er et godt alternativ til fagspesifikke arkiver. Forskere ved UiB arkivere forskningsdata i UiB Open Research Data og få veiledning i arkiverinsprosessen. UiS har laget denne korte filmen om hvordan du arkiverer dataene dine i DataverseNO. 

    Har du store mengder data, kan NIRD Research Data Archive (Sigma2) et alternativ.

    Hvis det ikke finnes et fagspesifikt eller institusjonelt arkiv som passer for dine data, kan generelle arkiv, som feks Zenodo være et godt alternativ.

    Selv om forskningsdata bør gjøres tilgjengelige så tidlig som mulig, kan det noen ganger være hensiktsmessig med embargoer på datautgivelsen. Embargo-perioder og korrekturtilgang støttes av de fleste arkiver.

    Arkivering av personlige eller sensitive data

    Langtidsbevaring av sensitive data kan være hensiktsmessig i visse tilfeller. Noen sensitive data kan arkiveres i lukkede arkiv (for eksempel NSD) med teknisk tilgangskontroll for bestemte brukere etter definerte kriterier.

    I andre tilfeller kan anonymisering av sensitive data tillate deponering i et åpent arkiv. Dersom forskningsdata samles inn med informert samtykke, må planer for arkivering etter prosjektslutt inkluderes allerede i samtykkeskjemaene. Du finner mer informasjon om persondata i forskningsdataens livssyklus og arkiveringsalternativer her.

    Persistente filformat: sikre langvarig tilgang

    Forskningsdata bør arkiveres i åpne, ikke-proprietære formater for å sikre langvarig tilgang til filene. For mer informasjon om arkivverdige format, se her.

    Metadata: beskriv dataene dine

    Metadata er strukturert informasjon som beskriver, forklarer, lokaliserer og gjør det lettere å hente og gjenbruke data. For å gjøre dataene dine gjenbrukbare og tilgjengelige for andre i fremtiden, må du opprette og arkivere nøyaktige metadata sammen med dataene dine.

    Hvis du arkiverer dataene dine i et fagspesifikt eller institusjonelt arkiv, definerer arkivet oftest metadatastandarden.

    Mer om metadatastandarder:
    Digital Curation Centre
    fairsharing.org

    Datalisenser: tillat gjenbruk av data

    Gjenbruk av data med kreditering av dataskaperne krever lisens. For forskningsdata er det vanlig å bruke Creative Commons -lisenser. Generelt bør det velges en mest mulig åpen lisens på forskningsdata, for å sikre gjenbruk av dataene.Vær oppmerksom på at krav om kreditering (CC-BY) kan føre til attribution stacking. Les mer om lisenser her.

    For åpne programvarelisenser er choosealicense.com og Open Source Initiative nyttige ressurser.

    Siterbar kode

    For å sikre langsiktig bevaring og tillate sitering, anbefales det å publisere programkode som ble generert under et forskningsprosjekt. Mange forskere bruker Git, et system for distribuert versjonskontroll, for å administrere programkoden.