Ratkaisuja epätyypillisen datan hallintaan tiedeinstituuteissa

1.4.2021
Keramiikan palasia Ateenan Akropoliilla.

Epätyypillisen ja monimuotoisen tutkimusdatan hallintaan ei ole ollut saatavilla helppokäyttöisiä kokonaisratkaisuja. Ratkaisuja erityisesti humanististen alojen aineistonhallintaan haettiin Tiedeinstituuttien avoin tutkimusdata -hankkeessa.

Epätyypillisen ja monimuotoisen tutkimusdatan hallintaan ei ole ollut valmiina helppokäyttöisiä kokonaisratkaisuja. Tällaisten ratkaisujen etsiminen ja luominen oli yksi Tiedeinstituuttien avoin tutkimusdata -hankkeen (2018–2020) keskeinen tavoite. Hankkeella haluttiin kehittää Suomen ulkomailla toimivien tiedeinstituuttien valmiuksia, osaamista ja yhteistyötä etenkin digitaalisten tutkimusaineistojen hallinnan ja avaamisen saralla.

Mukana hankkeessa olivat Rooman-, Ateenan-, Lähi-idän- ja Japanin instituutit, joissa toteutettiin yhteensä neljä pilottiprojektia. Keskeistä oli, että ratkaisuissa huomioitiin paitsi tieteenalakohtaiset, myös tutkimusaineistoon ja sen luonteeseen liittyvät tarpeet ja vaatimukset.

Tutkimusdatan erityisluonteen huomioiminen aineistonhallinnassa

Epätyypillisellä datalla tarkoitetaan tässä yhteydessä lähinnä humanististen alojen tutkimuksessa kerättävää ja syntyvää monipuolista tutkimusaineistoa – esimerkiksi arkeologisissa kaivauksissa löytyneitä esineitä tai valokuvia, videoita ja piirroksia niistä sekä tekstimateriaalia kenttämuistiinpanoista erilaisiin transkriptioihin ja haastatteluihin.

Tiedeinstituuttien yhteishanke osoitti, että aineistonhallintaratkaisuissa pitää välillä käyttää luovuutta ja ajatella tarvittaessa laatikon ulkopuoleltakin.

Ateenan-instituutin Archaeological Sites in Thesprotia -pilottiprojektissa haluttiin löytää Thesprotian alueen arkeologisten kaivausten dokumentaatiolle ja tutkimusaineistolle sopiva säilytyspaikka eli repositorio. Valokuvia, karttoja ja piirustuksia sisältävän aineiston sekä dokumentaatiota käyttävän julkaisun alustaksi valikoitui kulttuuriperintökohteita käsittelevän datan hallintaan suunniteltu Arches-portaali. Aineistot ovat rekisteröityjen käyttäjien saatavilla.

Rooman-instituutin I bolli doliari romani dell’Italia centro-occidentale -projektissa puolestaan etsittiin tuhansia tiilileimoja sisältävälle MS Word-dokumenttiaineistolle sopivaa ratkaisua. Aineisto oli lähtökohtaisesti hyvin järjestettyä, mutta siitä puuttui digitaalisessa ympäristössä tarvittavia ominaisuuksia. Aineistonhallinnassa käytettiin transkription mahdollistavaa EpiDocia sekä kuvallisille aineistoille paremmin soveltuvaa Islandora-ohjelmistoa. Islandora perustuu avoimeen lähdekoodiin ja hyödyntää haun ja linkityksen mahdollistavia metadatakuvailuja. Aineisto on julkaistu italiankielisenä tietokantana.

Näistä ja muiden projektien ratkaisuista voi lukea tarkemmin hankkeen loppuraportista.

Konkretiaa käytännön työhön

Tiedeinstituutit ovat olleet hankkeella muutoksen aallonharjalla ja osallistuneet hyviä datanhallinnan käytäntöjä rakentavaan keskusteluun. Pääpaino oli tutkimuksen jälkeisessä tallennuksessa ja julkaisussa, mutta hankkeessa selvitettiin myös mahdollisuuksia jo tutkimuksen aikana käytettäviin aineistonhallinnan ratkaisuihin. Lisäksi järjestettiin meritoitumista ja asiantuntijoiden yhteistyötä tukevia webinaareja, keskusteluryhmiä ja etäkoulutuksia.

Hankkeessa luotiin myös konkreettisia, koko tiedeyhteisöä hyödyttäviä toimintaohjeita ja suosituksia instituuteille sekä niiden taustaorganisaatioille. Hankkeessa määriteltiin muun muassa minimi- ja toivetasot aineistojen saatavuudelle, käytettävyydelle ja säilymiselle. Minimitasolla aineistonhallintasuunnitelma varmistaa, että kaikilla hankkeeseen osallistuvilla on pääsy tutkimusaineistoihin sekä sen, että aineistot ovat ymmärrettävässä ja käytettävässä muodossa. Toivetasolla asianmukaisesti kerätyt ja järjestetyt aineistot voidaan hankkeen päätyttyä siirtää mutkattomasti pitkäaikaissäilytykseen – useimmiten ulkopuoliseen repositorioon, mistä ne ovat helposti löydettävissä ja hyödynnettävissä.

Digitaalisessa aineistonhallinnan käsikirjassa ja toimintamallissa annetaan selkeitä käytännön ohjeita ja toimenpide-ehdotuksia, joilla tutkimuksen ja aineistonhallinnan avoimuutta voidaan edistää jatkossakin nykyisten kansallisten ja kansainvälisten käytäntöjen ja vaatimusten mukaisesti. Aineistonhallinnassa tulisi pyrkiä FAIR-periaatteiden noudattamiseen eli siihen, että aineistot ovat löydettäviä, saavutettavia, yhteensopivia ja uudelleenkäytettäviä.

Kansallisia suuntaviivoja tutkimusdatan avoimuuden osalinjauksella

Tiedeinstituuttien hanke teki myös näkyväksi erilaisia kulttuuriperintöön, tekijänoikeuksiin ja omistajuuteen sekä lainsäädäntöön liittyviä kysymyksiä ja esteitä. Hankkeessa kiinnitettiin erityistä huomiota instituuttien asemaan yksityisinä organisaatioina ja yksittäisten tutkijoiden äänen kuulumiseen. Tiedeinstituuttien avoin tutkimusdata -hanke onkin ollut tärkeä avaus tulevaisuuden kehitys- ja yhteistyökeskusteluille, joille haetaan suuntaa myös kansallisilla linjauksilla.

Yhteisillä aineistonhallinnan pelisäännöillä ja tavoitteilla halutaan tukea koko tieteen ja tutkimuksen avoimuutta ja yhdenvertaisuutta. Tänä keväänä valmistuu tutkimusdatan avoimen saatavuuden osalinjaus, joka on osa laajempaa tutkimusaineistojen ja -menetelmien avoimen saatavuuden linjausta. Linjauksen keskeisimmät strategiset periaatteet koskevat aineistojen ja menetelmien vastuullista ja tarkoituksenmukaista dokumentointia ja hallintaa, avaamista ja käyttöä, aineistonhallinnan mahdollistavien rakenteiden ja palveluiden kehittämistä sekä tutkijan meritoitumista. 

Kansallisten linjausten tavoitteena on lisätä tutkitun tiedon jakamisen ja hyödyntämisen mahdollisuuksia sekä vahvistaa kansainvälistä yhteistyötä ja vuoropuhelua, johon tiedeinstituutit jo nyt aktiivisesti osallistuvat.

Lue lisää hankkeesta:

Aiheesta aiemmin kirjoitettua:

Teksti: Elina Suominen, TSV
Kuva: Iuliia Isakova / Unsplash

Tämä uutinen on osa Tutkimusdatan avoimen saatavuuden osalinjausta pohjustavaa sarjaa.

Sinua saattaisi kiinnostaa myös