Metsätieteissä aineistojen jakamisella on pitkät perinteet, mutta niiden avaaminen on vielä uutta. Haastattelimme Suomen Metsätieteellisen Seuran toiminnanjohtaja Pekka Nygreniä.
Metsätieteissä kerätään hyvin monentyyppistä dataa, koska metsätieteellistä tutkimusta tekevät eri alojen tutkijat, joiden yhteinen tutkimuskohde on metsä. Avoimuuden haasteet vastaavat kunkin tutkimusalan tyypillisiä haasteita. Esimerkiksi yhteiskunnallisessa metsätieteessä törmätään samanlaisiin tietosuojakysymyksiin kuin muussakin yhteiskunnallisessa tutkimuksessa.
Metsätieteissä jakaminen on normi, avaaminen ei vielä
Metsätieteissä jakamisella, eli aineistojen liikkumisella tutkijoiden välillä on pitkät perinteet. Koska metsätieteiden tutkimuskohteet, metsät, ovat hyvin pitkäikäisiä, on tutkimuskin usein pitkäkestoista. Sekä jakamisen perinteistä että tutkimuksen pitkäkestoisuudesta johtuen tutkimusaineistojen jakaminen koetaan turvalliseksi. Jos jollain tutkimusryhmällä on valmiiksi kerättynä vaikkapa viiden vuoden aineisto, ei muiden ryhmien kannata ruveta kilpailumielessä keräämään omaa samanlaista aineistoa, koska ensimmäisenä aloittaneen etumatka on jo niin pitkä.
Aineistojen avaaminen verkossa kaikkien halukkaiden ulottuville on metsätieteissäkin vielä hieman uudempi asia, mutta avaamisen malleja on kuitenkin tarjolla. Esimerkiksi metsien ja metsävarojen valtakunnallinen inventointiaineisto (VMI), jota on tuotettu 1920-luvulta lähtien, on aivan uusimpia inventointeja lukuun ottamatta avoimesti saatavilla. VMI tuottaa tietoa muun muassa metsien terveydentilasta, metsien monimuotoisuudesta sekä metsien hiilivaroista. Samoin metsätieteiden ja ilmakehätieteen rajapinnalla operoivien SMEAR-tutkimusasemien (englanniksi) aineistot ovat olleet avoimesti saatavilla jo pitkään.
Yleisesti ottaen haasteita aineistojen avaamiselle tuottavat lähinnä tietosuojakysymykset sekä jossain määrin myös esimerkiksi uhanalaisten lajien esiintymispaikat. Metsänomistajien yksityisyyttä suojelevat sekä laki että perinteet. Joskus tiedot pidetään salassa jopa metsänomistajilta. Esimerkiksi VMI:n tuottamat metsävaratiedot perustuvat pysyviin maastokoealoihin, joilta mitataan tarkasti niillä oleva puusto paikan päällä. Näiden pysyvien koealojen tarkkaa sijaintia ei julkaista, jotta niitä hoidettaisiin samalla tavoin muutakin metsää, eikä VMI-koeala saa osakseen erityistä huomiota.
Metsäkeskuksen monimuotoiset, avoimet aineistot
Suomen metsäkeskus tarjoaa avointa metsä- ja luontotietoa koko metsäalan käyttöön, ja valtaosa sen keräämästä aineistosta on sähköisessä muodossa avoimesti saatavilla. Saatavilla oleva aineisto on joko anonymisoitu tai aggregoitu siten, ettei yksittäistä metsänomistajaa voi tiedoista tunnistaa. Aineistosta voi olla saatavilla keskiarvoja ja jakaumia, kuten tietynikäisten metsänomistajien vastausten jakauma.
Myös henkilötietoja sisältäviä, tarkempia aineistoja voidaan kuitenkin pyynnöstä luovuttaa lähinnä tutkimuskäyttöön. Aineistojen luovutusta pyydetään lomakkeella tai vapaamuotoisella anomuksella.
Silva Fennica edistää läpinäkyvyyttä ja tutkijan meritoitumista
Silva Fennica (englanniksi) on Suomen Metsätieteellisen Seuran aikakausjulkaisu, jota on julkaistu vuodesta 1926 lähtien. Tämän vuoden alusta alkaen Silva Fennica on ottanut toiminnassaan käyttöön Center for Open Sciencen läpinäkyvyyden ja avoimuuden edistämisen ohjeet. (Transparency and openness promotion guidelines of the Center for Open Science; englanniksi.) Koska suositus on vielä melko uusi, kerätään siirtymäaikana (vuoteen 2024 asti) kokemuksia suosituksen toteutumisesta ja sen mahdollisesti aiheuttamista haasteista. Toistaiseksi Silva Fennicaan otetaan käsittelyyn myös sellaiset artikkelit, joista tieto aineiston avoimuudesta puuttuu, mutta puutteesta huomautetaan.
Vaikka aineistojen avoimuus on tärkeää, ei se kuitenkaan pelkästään riitä. Läpinäkyvyyttä ja selkeyttä tarvitaan läpi koko tutkimus- ja julkaisuprosessin esimerkiksi siinä, miten aineisto on kerätty ja miten selkeästi se on kuvailtu. Avainasemassa on tutkimuksen toistettavuus ja aineistojen uudelleenkäyttö, joten myös esimerkiksi aineistojen muokkaamiseen käytettyjen laskentamallien ja analysointiin käytettyjen tilastomallien tulisi olla avoimesti saatavilla. Esimerkiksi laserkeilauksessa tarvitaan laskentamalleja, joilla alkuperäinen keilaussignaaliaineisto saadaan analysoitavaan muotoon. Silva Fennicassa pohditaan parhaillaan suosituksia aineistojen säilytyspaikasta, mutta toistaiseksi säilytyspaikka on kirjoittajien vapaasti päätettävissä. Koodit julkaistaan pääasiassa GitHub -verkkosivustolla (englanniksi).
Koska aineiston kerääminen ja sen muokkaaminen julkaisukelpoiseksi on työlästä, Silva Fennica haluaa edistää tutkijoiden meritoitumista aineistojen avaamisesta tarjoamalla mahdollisuutta julkaista aineistosta tehty Data note -artikkeli (englanniksi), jossa voidaan kuvata muun muassa miten aineisto on kerätty, mihin sitä voidaan soveltaa ja onko sitä jo käytetty jossain julkaisussa. Konsepti on vielä niin uusi, ettei toistaiseksi yhtään Data note -käsikirjoitusta ole ehtinyt tulla lehteen tarjolle.
Lisätietoja:
- Suomen Metsätieteellisen Seuran järjestämän ”Avoin data metsäntutkimuksessa – hyödyt, ongelmat ja tulevaisuus” –webinaarin tallenteet ovat katsottavissa seuran sivujen kautta.
Uutissarjan aikaisemmat osat:
- Tämän päivän tutkimusaineisto on huomisen kulttuuriperintöä
- Sensitiivisten aineistojen vastuullinen avaaminen
- Ratkaisuja epätyypillisen datan hallintaan tiedeinstituuteissa
Teksti: Elina Koivisto / Avoimen tieteen koordinaatio
Kuva: Steven Kamenar / Unsplash
Tämä uutinen on osa Tutkimusdatan avoimen saatavuuden osalinjausta pohjustavaa sarjaa.