Hjem
Pandemisenteret
Nyhet

Datadeling ga raske covid-19-svar

– Det er vanskelig å se for seg hvordan man kan bekjempe en sykdom uten data om det som kan forårsake sykdommen, sier Christine Stansberg, seniorrådgiver ved Institutt for informatikk ved Det matematisk-naturvitenskapelige fakultet.

Bilde fra database av verden. Lilla og grå områder som viser smittebelastning.
Figuren er et utklipp fra SARS-CoV2 databasen som er laget av Tromsø-noden av ELIXIR Norge, og som ligger under Covid-19-portalen. Land som har delt virusdatasett er markert i kartet som lilla. Christine Stansberg har trukket ut noen land for å vise antall datasett hvert av disse har delt og antall smittede, friske og døde
Foto/ill.:
Elixir Norge

Da nyheten om en ny, ukjent og livstruende sykdom kom i begynnelsen av 2020, så kom forskerne raskt til konklusjonen om at dette skyldtes et såkalt koronavirus, av typen «SARS»-virus.

Dette var mulig fordi man i årevis allerede har kartlagt genene til og lagret informasjon om mange typer av virus, og at denne informasjonen allerede var åpent tilgengelig for forskere i ulike databaser:

– Hadde man ikke hatt disse databasene, hadde man ikke visst så raskt hva slags virus man har med å gjøre, forteller Stansberg. Hun er nodekoordinator for ELIXIR Norge, den norske noden av ELIXIR, som er den europeiske forskningsinfrastrukturen for biologiske og medisinske forskningsdata.

ELIXIR tar hånd om alle slags molekylære data som kommer fra livsvitenskapene. Formålet er å lagre, tilgjengeliggjøre og å lage gode systemer og verktøy for at andre forskere skal kunne ha nytte av dem. Den norske noden av ELIXIR ledes av professor Inge Jonassen ved Institutt for informatikk ved UiB, og er et samarbeid mellom UiB, UiO, UiT, NTNU og NMBU.

Tilgjengeliggjør norske covid-19 data

Informasjonen som samles, analyseres og deles om koronavirusene, deres proteinstrukturer og gensekvenser, bidrar til at vi i dag, knapt ett år etter sykdommen ble kjent har flere vaksiner på vei til å bli godkjent.

At data har vært viktig i bekjempelsen av sykdommen, merker Stansberg og kollegene i ELIXIR Norge, godt. På kort tid har ELIXIR både i Europa og lokalt i Norge opprettet en «task force» som legger til rette for at slike data og analyseverktøy enkelt kan deles og finnes og dermed bidra til at bekjempelsen kan gå enda raskere. En del av denne task forcen jobber nå sammen med Folkehelseinstituttet med å få delt norske virussekvenser gjennom den åpne databasen ENA, European Nucleotide Archive. I høst lanserte videre ELIXIR Norge den norske Covid-19-dataportalen, som nettopp viser vei til all tilgjengelig informasjon om SARS-CoV2 og covid-19 og også veileder norske forskere i hvordan de kan dele egne data.

Noe annet forskere og programmerere i ELIXIR og ELIXIR Norge jobber med er å opprette en sikker database som kan ta hånd om pasientdata, som blant annet kan gi informasjon om hvorfor noen blir alvorlig syke av covid-19 og andre ikke. Utfordringen med disse dataene er at personvernregelverket gjør at de ikke kan bli delt fritt:

– ELIXIR Norge jobber med en løsning som gjør at det er mulig for norske og internasjonale samarbeidspartnere å søke om tilgang til sensitive data i den norske filialen av denne databanken og så analysere disse dataene her, uten noen gang å ta dem ut av banken, forklarer Stansberg og sier at tjenesten straks er klar for lansering, som en av de første av sin sort i Europa.

Fortsatt finansering er viktig

Databehandlere og programvareutviklere er sentrale aktører i prosessen med å gjøre forskningen tilgjengelig og «FAIR».

FAIR står for findable, accessible, interoperable, og reusable og er et internasjonalt prinsipp for deling av forskningsdata. All statlig finansiert forskning, for eksempel støttet av Norges forskningsråd, skal være «FAIR»:

– Det er viktig å vite at folk vet hva man skal bruke oss til, men det er ikke alltid like godt å vite hvilke miljø man bør nå ut til, sier Stansberg. 

Synlighet er imidlertid viktig, spesielt i møte med en av de største utfordringene for databasene i fremtiden: Finansiering.

– Mister man finansieringen sitter man til slutt med en database som ikke blir vedlikeholdt. Det gjøres derfor nå en ekstra innsats for global finansering av sentrale ressurser (blant annet gjennom Global Biodata Coalition), som for eksempel ENA. Mister vi ENA, mister vi genetisk informasjon om alle typer organismer i hele verden, forteller Stansberg.

Les mer: "How open databases turn out to be crucial in the fight against Covid-19"