Yli 600 tutkimusdatan asiantuntijaa kokoontui 23.–25.10.2019 Espoon Otaniemessä kansainvälisen Research Data Alliancen 14. yleiskokoukseen.
Tieteellisten seurain valtuuskunnan avoimen tieteen koordinaatio oli yksi suomalaisista järjestäjätahoista yhdessä Aalto-yliopiston, CSC:n, Helsingin yliopiston ja Ilmatieteen laitoksen kanssa.
Kolmipäiväisen tapahtuman teemana oli Data Makes a Difference. Päivien aikana kuultiin useita puheenvuoroja datan mahdollisuuksista vaikuttaa muun muassa yhteiskunnalliseen päätöksentekoon. Samalla pohdittiin niitä käytännön esteistä, joita tämän vaikuttamisen tiellä on.
Dataansa ei menetä vaikka sen jakaa
Tutkimusadatan ja -aineiston pitkäaikaistallentamiseen ja avaamiseen liittyy valtavasti kysymyksiä. Sensitiivinen ja arkaluonteinen data ovat aiheita, joita esimerkiksi erilaisia tallennusjärjestelmiä eli niin sanottuja repositorioita suunniteltaessa on huomioitava. Datan tallentaminen tietoturvallisiin järjestelmiin ei tietenkään edellytä datan avaamista mutta takaa sen säilymisen.
Toisaalta datan avaaminen itsessään tuntuu herättävän osassa tutkijoissa huolta sen menettämisestä. Euroopan komission Open Science Policy Platform -elimen puheenjohtaja Eva Méndez vertasi RDA-plenarissa tutkimusdatan jakamista omenan jakamiseen - toiselle annettua omenaa ei enää voi syödä, mutta muiden käyttöön muiden käyttöön tarjottua dataa voi varsin hyvin käyttää itsekin. Datan jakaja ei siis menetä omaa dataansa vaan mahdollistaa sen laajemman hyödyntämisen.
Toinen tapa lähestyä aihetta on verrata sitä tutkimusjulkaisuihin:
Tutkijat ovat varsin tottuneet ajatukseen, että tutkimusjulkaisut ovat muiden saatavilla. Lukijoitakin yleensä toivotaan mahdollisimman paljon. Tutkimuksen luotettavuus ja sen vaikuttavuus lisääntyvät, kun toiset tutkijat tai päätöksentekijät pääsevät käsiksi tutkimusjulkaisuihin ja voivat käyttää niitä asianmukaisin viittauskäytännöin.
Miksi sama ei pätisi dataan?
Käytännön kysymykseksi nousee kuitenkin ehkä yksi ylitse muiden: miksi tutkija käyttäisi aikaansa datansa avaamiseen? Tutkimuksenteon arki on kiireistä ja työtä arvioidaan jatkuvasti. Tutkimuksenteon ja -tarpeiden muuttuessa, onkin tarkasteltava arvioinnin käytäntöjä, kuten RDA-plenarissa toistuvasti kävi ilmi.
Muutos datan suhteen etenee vauhdilla
Dataan liittyvää vauhdilla etenevää muutosta käsitteli Helsingin yliopiston geoinformatiikan apulaisprofessori Tuuli Toivonen keynote-puheessaan. Toivonen kertoi, kuinka hän vielä graduvaiheessa törmäsi siihen, miten kallista kartta-aineistojen käytettäväksi saaminen oli. Vain muutamaa vuotta myöhemmin aineistoa oli tutkijoiden saatavilla enemmän kuin oli osattu toivoa. Osittain tämä johtui tietoteknisistä edistysaskeleista mutta myös kulttuurin muuttumisesta avoimempaan suuntaan.
- Henkilöt, jotka olivat keränneet dataa esimerkiksi virastojen käyttöön, alkoivat ymmärtää materiaalin tärkeyden myös muille, Toivonen totesi puheessaan.
Nopeasti etenevät muutokset vaikuttavat väistämättä tieteentekoon. George Strawn Yhdysvaltain kansallisesta tiedeakatemiasta kuvasi käännettä tieteen uudeksi vallankumoukseksi. Strawnin mukaan emme jatkossa jaa vain tutkimusjulkaisuja vaan myös kaiken muun oleellisen, kuten tutkimusdatamme.
- Tämä on hienoa tieteelle, mutta ei välttämättä yksittäiselle tieteentekijälle. Työtä tulee eittämättä lisää, Strawn pohti.
FAIR tulee, oletko valmis?
Minkälaista lisätyötä mahdollinen vallankumous voi tarkoittaa? RDA-plenarissa toistui useaan otteeseen akronyymi FAIR. FAIR-periaatteiden tarkoitus on tehdä data
- löydettäväksi (Findable),
- saavutettavaksi (Accessible),
- yhteentoimivaksi (Interoperable) ja
- uudelleenkäytettäväksi (Re-usable).
Periaatteet ovat vakiinnuttaneet asemansa varsin nopeasti tutkimusdatakeskusteluissa. Niiden noudattamisesta on linjannut muun muassa Euroopan unionin neuvosto vuonna 2016. Vuonna 2018 Euroopan komissio puolestaan julkaisi loppuraportin ja toimenpideohjelman Turning FAIR into reality. Suomessa myös Opetus- ja kulttuuriministeriö on sitoutunut periaatteisiin.
Datan hallinnoiminen pyrkien kohti FAIR-periaatteiden mukaisia tavoitteita ei kuitenkaan ole yksinkertaista. Ensinnäkin periaatteet edellyttävät teknisiltä järjestelmiltä paljon. Tätä tutkimusinfrastuktuuria rakennetaankin vauhdilla (ks. Fairdata.fi).
Toisaalta näistä järjestelmistä ei ole hyötyä, ellei tutkimusyhteisö ota niitä käyttöönsä. Eri aloilla on esimerkiksi hyvin erilaiset perinteet datan jakamisen suhteen. Joillain aloilla tutkimusdata on pitkään tallennettu erilaisiin sähköisiin järjestelmiin. Toisilla aloilla taas on arkipäivää, että data on tutkijan muistitikulla, jolloin se voi sekä kadota että joutua vääriin käsiin.
RDA-plenaarin keskusteluissa korostuikin alojen erojen huomioiminen sekä tutkijoiden tarvitsema tuki. Esimerkiksi metatietojen syöttäminen on usein tutkijoiden itsensä vastuulla mutta metatietokäytäntöjen tunteminen voi olla haastavaa. Ilman huolella laadittuja metatietoja, vaivalla kerätty ja muiden käyttöön viety data uhkaa hukkua järjestelmien villiin viidakkoon.
Lue tapahtuman tiedotteet:
- Eurooppa käyttää kolmasosan maailman laskentakapasiteetista mutta tuottaa siitä vain 2 % (CSC: 23.10.2019)
- Uudet teknologiat kaipaavat johtajuutta, eivät lakeja (CSC: 25.10.2019)
Teksti: Nina Järviö
Julkaistu 30.10.2019