Når forskningsdata skal deles fritt

De siste årene har norske forskere publisert stadig mer forskning i åpne tidsskrifter. Noen går et hakk lenger og deler dataene sine også.

Bok, forstørrelsesglass

Foto: Colourbox

Da TIK-forskerne Lars Wenaas og Magnus Gulbrandsen høsten 2022 kom med en ny studie, var det helt klart for dem at de skulle publisere i et åpent tidsskrift.

– Det ville tatt seg ut om jeg, som skriver på en doktorgrad om åpen tilgang, valgte å gjøre det motsatte, sier Wenaas og får støtte av kollega Gulbrandsen.

Men de to gikk også lenger. De hadde analysert til sammen rundt 180 dokumenter. Her hadde de hentet ut en lang rekke utdrag og opplysninger som utgjorde materialet bak forskningen deres. Dette valgte de å publisere samtidig med studien.  

Økte krav fra Forskningsrådet

For Gulbrandsen, som har en lang forskerkarriere bak seg, var det første gang han publiserte datasettet bak en studie. 

– Det vanligste er å skrive en lang metodedel og la dette være grunnen til at den som leser, skal stole på deg. Jeg syns det var kult å gå et hakk lenger, sier han.

Forskningsrådet har fulgt den globale åpenhetsvinden og gitt norske forskere en dytt: Åpen publisering, i en eller annen variant, er en forutsetning for prosjektstøtte, med mindre forskerne har en god grunn til ikke å gjøre det.

I 2017 bestemte Forskningsrådet også at forskere som får støtte fra dem, skal vurdere å lage en datahåndteringsplan. Denne skal blant annet vise om dataene skal deles – og i så fall hvordan det skal gjøres.

Les mer om Forskningsrådets krav til åpen publisering og datadeling

Les mer om mulige fordeler med datadeling og åpen forskning (artikkel med begrenset tilgang) 

Åpner for etterprøvbarhet

I Norge har andelen forskning som publiseres åpent økt mye de siste ti årene. Mens under 40 prosent av norske forskningsartikler ble publisert åpent i 2013, var andelen i 2021 økt til rundt 75 prosent, ifølge OA-barometeret fra tjenesteleverandøren Sikt. 

Å dele data er ikke like vanlig.

– For oss handlet det om god vitenskapelig kutyme. Om transparens. Når vi deler data åpent, kan leserne av artikkelen undersøke om dataene støtter det vi skriver om. Det kan være svært vanskelig å etterprøve studieresultater uten tilgang på datasettet, sier Wenaas.

Flere studier har pekt på utfordringene ved å etterprøve resultatene av studier, noe som har blitt kalt replikasjonskrisen.

De to forskerne viser blant annet til Marshmallow-eksperimentet der en forskergruppe i USA studerte selvkontroll hos barn. De færreste barna klarte å vente i femten minutter på en marshmallow, selv om de skulle få dobbelt så mye dersom de klarte det. Barnas evne til selvkontroll holdt seg nokså stabil til tenårene, ifølge studien.

Nye studier har senere stilt spørsmål ved resultatene i Marshmallow-eksperimentet.

– Resultatene er enkle og intuitive, men de har ikke vært lette å etterprøve, blant annet fordi datasettet ikke har vært tilgjengelig. Dette gjelder mye forskning, sier Gulbrandsen.

Ikke alle data bør deles

En annen fordel med åpenhet rundt datamaterialet er at dataene i prinsippet kan brukes i andre sammenhenger, påpeker Wenaas.

– Det er ikke alt som egner seg for gjenbruk, men muligheten ligger der, sier han.

Det finnes imidlertid tilfeller der publisering av datasettet ikke er like lett, understreker de to, for eksempel intervjudata som du har lovet å anonymisere.

– Hva om du ønsker å bruke dataene mer selv først, før du deler dem? 

– Det er ikke uvanlig å ønske å utnytte datasett fullt og helt før du publiserer dem. Men det går ofte an å publisere bare deler av dataene, de som understøtter det du publiserer, i første omgang. Det er minimumsvarianten, sier Wenaas. 

Et spørsmål om kultur

Wenaas og Gulbrandsen mener at datadeling også handler om kultur. For mange er dette noe nytt, for andre har det kanskje vært praksis i lengre tid.

Ifølge datadelingstjenesten til UiT Norges arktiske universitet, som de selv har brukt, er det delt langt flere datasett innen naturvitenskapene og helse enn innen samfunnsvitenskapelige fag. I den grad tjenesten er representativ, er det mindre vanlig å dele data innen samfunnsvitenskapene og humaniora.

Datadeling krever dessuten tid og krefter, poengterer de.

– Det er en type merarbeid som du ikke blir merittert for. For oss med et lite datasett har dette vært en overkommelig oppgave. Har man større datasett, blir det en reell og kostnadskrevende utfordring, sier Wenaas. 

En åpen framtid?

De to er overbevist om at føringer fra Norges forskningsråd har vært avgjørende for den trenden som har vært de siste årene med stadig mer publisering i åpne tidsskrifter.

Wenaas og Gulbrandsen tror at datadeling er noe som vil holde fram.

– Jeg tror at datadeling etter hvert blir normalen. Det er en del av det større begrepet åpen forskning. De som finansierer forskningen krever det i større grad, det samme gjør offentlige aktører. EU satser tungt på det. Men også tidsskriftene har begynt å kreve det, så dette får vi nå fra flere kanter, sier Wenaas.

Forskningsrådet legger til grunn de internasjonale FAIR-prinsippene i sine føringer, som innebærer at data må være tilgjengelige, gjenfinnbare og gjenbrukbare, samt mulige å håndtere maskinelt.

Av Silje Pileberg
Publisert 14. nov. 2022 10:06 - Sist endret 14. nov. 2022 10:06