Palvelut vastuullisen datanhallinnan mahdollistajina

3.5.2021
Keskeneräinen puutalon runko, ylhäältä kuvattuna

Datanhallinnan tukipalvelut mielletään usein IT-palveluiksi, mutta tutkimuksen elinkaari, ja sen myötä datan elinkaari, kattaa monen alueen asiantuntijoita.

Uutissarjamme edellisessä osassa käsiteltiin datanhallintaan liittyvän koulutuksen tilannetta ja sen keskeistä asemaa Tutkimusaineistojen ja -menetelmien avoimen saatavuuden linjauksessa. Hyvän ja vastuullisen datanhallinnan toinen tukipilari on tutkimuspalvelut – ne mahdollistavat tutkimuksen jouhevan etenemisen tutkimushankkeen alkuvaiheesta datan jatkokäytön suunnitteluun.

Parhaat palvelut toimivat usein niin saumattomasti, että niitä ei välttämättä huomaa. Näin toimii esimerkiksi korkeakoulujen ja tutkimuslaitosten käyttäjätunnistusjärjestelmä HAKA, jonka avulla tutkija voi kirjautua erilaisiin palveluihin rekisteröitymättä jokaiseen erikseen. Monet tutkimusorganisaatiot pystyvät myös tarjoamaan erittäin hyviä perustallennusratkaisuja, joihin kuuluu versioiva varmuuskopiointi.

Linjauksessa ja sen tutkimusdatan avointa saatavuutta käsittelevässä osalinjauksessa palvelut nousevat esiin jo toisessa strategisessa periaatteessa, jossa todetaan, että tutkijoilla tulee olla käytettävissään vastuullisen datanhallinnan mahdollistavat infrastruktuurit ja palvelut ja että niitä kehitetään tutkijoiden tarpeet huomioiden. Ensimmäinen askel tämän toteutumisessa on infrastruktuurien ja palveluiden minimitason määritteleminen. Tämän tehtävän linjaus asettaa koko tutkimusyhteisölle.

Lähtökohtana tutkimuksen elinkaaren vaiheet

Datanhallinnan tukipalvelut mielletään usein IT-palveluiksi, mutta tutkimuksen elinkaari, ja sen myötä datanhallinnan elinkaari, kattaa monen muunkin alueen asiantuntijoita aina tutkimussuunnittelusta juridiseen neuvontaan ja julkaisupalveluihin.

Datanhallinnan ja tutkimuksen elinkaaria esittävä kuvio. Datanhallinnan elinkaari muodostuu suunnittelusta, dokumentoinnista, suojaamisesta, tallentamisesta, avaamisesta ja säilyttämisestä. Tutkimuksen elinkaari muodostuu hahmotelmasta ja suunnittelusta, selvittämisestä ja järjestämisestä, keruusta ja analyysista, tuotoksista ja julkaisemisesta sekä vaikuttavuudesta ja jatkokäytöstä.

Tutkimusdatan avoimen saatavuuden osalinjausta ja sen palveluihin liittyviä tavoitteita voi lukea juuri elinkaaren kautta. Ensimmäisen tavoitteen fokus on datanhallintasuunnitelmien laatimisessa eli tutkimuksen suunnitteluvaiheessa, mutta myös suunnitelman ylläpitämisessä koko aineiston elinkaaren ajan. Tavoitteena on lisätä tämä osaksi tutkimus- ja palveluprosesseja. 

Suunnitteluun sisältyy myös tutkimusdataan liittyvistä oikeuksista, ehdoista ja lisensseistä sopiminen. Tavoitteeksi on kirjattu toimintamallit, joiden avulla tämä tapahtuu selkeästi kaikkien tutkimustyöhön osallistuvien kesken, ja tähän liittyy ohjeistusta lisensointiin ja kaupallistamiseen sekä neuvontaa erilaisiin erikoistapauksiin.

Tutkimuksen ja tutkimusdatan elinkaaren edetessä hyvään datanhallintaan kuuluu dokumentointi, tallennus tai säilytys sekä julkaiseminen. Tähtäimessä on tutkimusdatan avaaminen, jatkokäyttö, löydettävyys, yhteentoimivuus ja saatavuus, jotka edellyttävät toisaalta tukipalveluita ja toisaalta infrastruktuuriratkaisuja.

Selkeät palvelupolut

Palvelukehittämisen haasteisiin kuuluu datapalveluiden jakautuminen monelle alueelle. On siis tärkeää määritellä vastuutahot, jotta datapalvelut eivät jää varjoon. Keskeistä on myös yhteistyö, jossa hyödynnetään tutkimusmenetelmien ja -prosessien asiantuntemusta ja huomioidaan eri tieteenalojen tarpeet.

Hyvä esimerkki palveluiden monialaisuudesta on monessa yliopistossa ajankohtainen tutkimusdatan oikeudensiirto. Tutkimusorganisaation mahdollisuus säilyttää tutkijoidensa aineistoa riippuu sopimisesta, mutta prosessin aloittaminen nollasta joka kerran on työlästä, jälkikäteisestä selvittämisestä puhumattakaan. Selkeät toimintatavat mahdollistaisivat säilytyksen lisäksi sujuvan tutkimusdatan jatkokäytöstä ja avaamisen ehdoista sopimisen.

Tutkimusaineistoihin liittyvät palveluiden järjestäminen, kehittäminen ja niihin uusien asioiden sisällyttäminen palveluihin eivät kuitenkaan ole ilmaisia. Suomessa kehittäminen on lähtenyt käyntiin hyvin mutta usein projektiluontoisen rahoituksen turvin, ja jatkuvuuden varmistaminen edellyttää selkeän johtamisen lisäksi kestävää resursointia. Samalla palveluihin panostaminen edistää resurssien tehokkaampaa hyödyntämistä ja tuo säästöjä.

Tämä uutinen on osa Tutkimusdatan avoimen saatavuuden osalinjausta pohjustavaa sarjaa.

Teksti: Mari Elisa Kuusniemi (Helsingin yliopisto), Hanna Lahdenperä (Avoimen tieteen koordinaatio)
Valokuva: Unsplash/Emma Gossett

Kuvio: Mari Elisa Kuusniemi. Ei kuulu CC BY -lisenssin piiriin.

Uutissarjan aikaisemmat osat:

Lue lisää