Elina Koivisto ja Elina Mäntylä selvittivät, miten kattavia avoimen tieteen ohjeistukset ja tieteellisten lehtien aineistokäytännöt ekologian ja evoluutiobiologian alalla ovat.
Avoimen tieteen käytäntöjen tiedostamisesta ja osaamisesta on tulossa yhä tärkeämpi osa jokapäiväistä tieteellistä työtä, sillä esimerkiksi monet tieteelliset lehdet edellyttävät tutkimusaineiston avointa jakamista. Näiden noudattaminen voi kuitenkin tuntua varsinkin alkuun haastavalta ja herättää monia kysymyksiä. Millaisessa muodossa data kannattaa jakaa, mikä olisi hyvä repositorio tai missä voisin jakaa käyttämäni koodin? Tämän vuoksi esimerkiksi tieteellisten lehtien omat ohjeet, kuten muidenkin saman tieteenalan toimijoiden laatimat konkreettiset ohjeistukset ovat tärkeitä. Eri tieteenaloilla on käytössä paitsi erilaisia menetelmiä ja aineistoja, myös omia tapoja ja perinteitä esimerkiksi aineiston jakamisen käytännöissä. Ekologia ja evoluutiobiologia ovat tyypillisesti datapainotteisia tieteenaloja, joskin alan sisälläkin on luonnollisesti vaihtelua.
Tutkimuksemme sai alkunsa Responsible Open Science in Europe (ROSiE) -hanketta varten kerätyistä tieteenalakohtaisista avoimen tieteen ohjeista (ROSiE Field-specific Guidelines on Responsible Open Science, englanniksi). Ekologian ja evoluutiobiologian alojen ohjeistuksia avoimesta tieteestä löytyi suhteessa paljon, mikä oli jo sinänsä mielenkiintoinen havainto. Kun Ecology and Evolution -lehti julkaisi kirjoittajakutsun avoimen tieteen erikoisnumeroon, päätimme yhdistää avoimen tieteen ja tieteenalakohtaisen substanssiosaamisemme ja laatia ohjeistuksista julkaisun.
Kävimme läpi kaikkiaan 20 ekologeille tai evoluutiobiologeille suunnattua julkaistua ja vertaisarvioitua avoimen tieteen ohjeistusta sekä 17 ekologian ja evoluutiobiologian tunnetun tieteellisen lehden datakäytännöt. Tarkoituksenamme oli kartoittaa alojen avoimen tieteen ohjeiden nykytilaa, löytää mahdollisia puutteita, tunnistaa alakohtaisia esteitä avoimen tieteen käytäntöjen toteutumiselle sekä keskustella keinoista, joilla nämä haasteet voitaisiin ratkaista.
Ohjeistuksissa on paljon päällekkäisyyksiä
Havaitsimme, että monet ekologian ja evoluutiobiologian ohjeistukset olivat keskenään hyvin samankaltaisia, samoin kuin artikkeleissa mainitut avoimen tieteen haasteet. Voidaankin kysyä, onko tarpeen julkaista omia ohjeita eri ekologian ja evoluutiobiologian osa-alueille. Samojen, yleisten ja yhdenmukaisten avoimen tieteen ohjeiden noudattaminen voisi hyödyttää alaa paremmin kattamaan tieteen nykyisiä standardeja.
Lähes kaikissa ohjeistuksissa mainittiin esimerkiksi repositoriot, metadata, työkalut, menetelmät, koodi ja avoimet ohjelmistot. Noin puolessa ohjeistuksissa mainittiin FAIR-periaatteet, aineiston hallintasuunnitelmat, pysyvät tunnisteet, lisenssit, sensitiivinen data ja preprintit.
Avoimeen tieteeseen liittyvistä haasteista tai huolista mainittiin esimerkiksi avoimen datan väärinkäyttö ja aineiston tai menetelmien väärät tulkinnat. Näihin haasteisiin voi vastata esimerkiksi käyttämällä sopivaa lisenssiä datan uudelleenkäyttöä varten sekä kirjoittamalla selkeät ja kattavat kuvaukset ja ohjeet aineistolle ja sen käytölle.
Erityisinä haasteina pitkät aikasarjat ja fyysiset näytteet
Vaikka ohjeistukset olivat kattavia, löytyi niistä kuitenkin hyvin vähän tietoa siitä, miten fyysiset näytteet tai tutkimusaineisto voitaisiin jakaa avoimesti. Toinen aloille tyypillinen aihe ovat pitkät aikasarjat, jotka oli myös mainittu ohjeistuksissa yllättävän harvoin. Näitä aiheita varten saattaisikin olla tarpeen laatia erityisiä ohjeita.
Pitkät aikasarjat ovat usein monien vuosikymmenten aikana kerättyjä aineistoja esimerkiksi muuttolintujen saapumisajoista, lumen syvyydestä tai kasvillisuuden peittävyydestä. Aineiston keräämiseen on luonnollisesti osallistunut ajan saatossa lukuisia ihmisiä, mikä osaltaan asettaa haasteita aineiston jakamiselle. Kenen aineisto on, ja kuka sen saa jakaa? Aikasarjaa on käytännössä usein mahdotonta jakaa kokonaisuudessaan, mutta aineistosta on kuitenkin mahdollista jakaa osa, tai vähintään sen metadata.
Fyysiset näytteet tai tutkimusaineisto voivat olla ekologian ja evoluutiobiologian alalla hyvinkin monenlaisia. Ne voivat olla esimerkiksi museonäytteitä, kuten kasvi- tai eläinnäytteitä, tai vaikkapa kudosnäytteitä. Erityyppisillä näytteillä on hyvin erilaisia vaatimuksia esimerkiksi säilytystilojen suhteen ja niiden säilyttäminen voi vaatia sekä taloudellisia että tilaresursseja. Näytteiden digitointi ja/tai niiden kuvailutietojen jakaminen mahdollistaa aineiston jakamisen myös muiden tutkijoiden käyttöön.
Tieteellisten lehtien oma ohjeistus vaihtelevaa
Tieteellisistä lehdistä lähes kaikissa odotettiin aineiston avointa jakamista, ja suurimmassa osassa näistä edellytettiin jakamista jo artikkelin lähetysvaiheessa. Aineiston avoin jakaminen on siis tutkimuksen julkaisemisen edellytys valtaosassa katsauksessamme mukana olleilla lehdillä. Noin puolet lehdistä vähintään kannusti metadatan jakamiseen tai jopa edellytti sitä. Samoin noin puolet lehdistä vähintään kannusti analyyseissa käytetyn koodin jakamiseen.
Koska kävimme läpi vain murto-osan alan lehdistä, emme tiedä kuin hyvin tulos kertoo laajemmin alan lehdistä. Mutta koska valitsimme lehdet alojen top10-listoilta vaikuttavuuskertoimen mukaan, ne ovat todennäköisiä lehtiä, joissa alojen tutkijat tyypillisesti tutkimuksiaan julkaisevat.
"Kattavistakaan ohjeista ei ole apua, jos tutkijat eivät ole tietoisia niistä."
Lehtien aineisto-ohjeiden kattavuus vaihteli suuresti eri lehtien välillä: toisilla ohjeita ei käytännössä ollut lainkaan, kun taas toisilla ne olivat hyvin laajoja ja konkreettisia. Kattavimmissa ohjeissa oli muun muassa esimerkkejä siitä, millainen ilmoitus aineiston saatavuudesta voi sanamuodoltaan olla, tai suosituksia sopivista datarepositorioista. Koska tieteelliset lehdillä on suuri vaikutusvalta avoimen tieteen käytäntöjen edistämiseen, olisi toivottavaa, että kustantajat ja lehdet panostaisivat selkeisiin, kattaviin ja ajantasaisiin datapolitiikkoihin sekä muihin ohjeisiin kirjoittajille.
Yleisille ohjeille on tarvetta
Vaikka löytämämme ohjeistukset olivatkin hyvin kattavia ja käytännönläheisiä, niistä ei ole apua tutkijoille, jos tutkijat eivät niistä ole tietoisia. Pohdimme, että samantyyppisten ohjeistuksien suuri lukumäärä voisi kertoa siitä, etteivät laatijat olleet tietoisia vastaavista, aiemmin julkaistuista ohjeistuksista. Kirjoittajat saattoivat myös kokea aiemmin julkaistujen ohjeistusten olevan sen verran erilaiselta tutkimusalalta, että oman erikoisalan ohjeistusten julkaisemiselle koettiin tarvetta. Vaihtoehtoisesti ekologian ja evoluutiobiologian tutkijat saattavat myös yksinkertaisesti olla erityisen innokkaita jakamaan avoimen tieteen osaamistaan.
Joka tapauksessa alalla voisi olla tarvetta yleisille ja yhdenmukaisille avoimen tieteen ohjeille, jotka olisivat myös helposti käyttäjien löydettävissä. Koska avoin tiede on nopeasti kehittyvä kenttä, ohjeiden tulisi myös olla päivitettävässä muodossa, elävänä dokumenttina. Kysymys siitä, minkä tahon ohjeiden kehittämisestä ja päivittämisestä tulisi olla vastuussa, onkin hankalampi. Päivitysvastuun olisi hyvä olla suuremmalla ja vakaammalla toimijalla yksittäisten tutkijoiden sijaan. Kyseeseen voisivat tulla esimerkiksi tutkimusorganisaatiot, kustantajat tai ekologian ja evoluutiobiologian alan tai avoimen tieteen yhteisöt.
*****
Teksti: Elina Koivisto ja Elina Mäntylä
Elina Koivisto on eläinekologian dosentti (TY), joka työskentelee tällä hetkellä vastuullisen tutkijanarvioinnin asiantuntijana Julkaisufoorumissa.
Elina Mäntylä on tohtori (FT) ekologian alalta (TY), ja työskentelee tällä hetkellä Turun yliopistossa kehittämisasiantuntijana Innovaatiopalvelut-yksikössä.