Miten merkittävien tietoaineistojen pitkäaikaissaatavuus turvataan?

Hyvään tieteelliseen käytäntöön kuuluu tutkimuksessa tuotetuista tietoaineistoista huolehtiminen. Tätä helpottamaan opetus- ja kulttuuriministeriö tarjoaa laajan Fairdata-palvelukokonaisuuden. Kokonaisuus koostuu palveluista, jotka tukevat aineistojen löydettävyyttä, säilyttämistä ja hallintaa. Yhteentoimivat mutta erilliset palvelut tarjotaan aineistonhallinnan suunnitteluun, itse aineistonhallintaan, aineistojen kuvailuun ja turvalliseen säilytykseen sekä merkittävien tietoaineistojen pitkäaikaissaatavuuden takaamiseen. Palveluiden taustalla, käyttäjälle mahdollisimman huomaamattomasti, huolehditaan metatietojen siirtymisestä palveluiden välilllä, kertakirjautumisesta palvelukokonaisuuteen sekä sujuvasta siirtymisestä erillisten palveluiden välillä.

Palvelut tarjoavat useita hyötyjä. Aineistot ovat turvassa jatkokäyttöä varten ja niillä on pysyvät tunnisteet viittauksia varten. Aineistojen jakaminen ja aineistojen etsiminen omaan käyttöön on helppoa. Myös tutkimusrahoittajien avoimuuden vaatimuksien toteuttaminen on helppoa.

Tutkimusaineistojen pitkäaikaissäilytyspalvelu (ns. TPAS) otetaan käyttöön kesäkuussa  2018.   Kansallisesti tai organisaatioille merkittävien tietoaineistojen pitkäaikaissaatavuuden turvaaminen tapahtuu OKM:n ja organisaation yhteisymmärryksessä. Fairdata-palvelu pitää tutkimusaineistot saatavilla ja käyttökelpoisina hyvin pitkälle tulevaisuuteen, yli vuosikymmenien, teknologiasyklien ja ennen kaikkea projektien iän.

Pitkäaikaissaatavuuden palvelukomponentit

IDA on tutkimusdatan säilytyspalvelu, joka tarjoaa tutkijoille luotettavaa tallennustilaa. Palvelu on OKMn järjestämä ja loppukäyttäjille maksuton. Tallennusoikeuksien jakoperusteet on sovittu tutkimusorganisaatioiden kanssa. Jokaisessa korkeakoulussa on IDA-yhteyshenkilö, joka myöntää tallennustilaa edelleen sitä hakeneille tutkimushankkeille. IDA-palveluun on tulossa useita uudistuksia vuonna 2018. Palvelun taustalla oleva ohjelmisto muuttuu ja verkkokäyttöliittymä SUI:n (Tutkijan käyttöliittymä) kautta poistuu. Vastaavia toiminnallisuuksia tarjoavat uusi Nextcloud-ohjelmiston päälle rakennettu selainkäyttöliittymä ja uudet komentorivikomennot. Lisätietoja IDAsta ja uudistuksesta

QVAIN on aineistojen kuvailutyökalu. Aineistojen kuvailutiedot ovat vältämättömiä, koska ilman niitä aineistoja ei voi avata eikä niitä voi löytää hakupalveluiden avulla. Qvaimen avulla tutkimusaineistoon liitetään kuvailutiedot eli metadata. Qvain mahdollistaa tiedostojen kokoamisen ja kuvailemisen julkaisukelpoisiksi aineistoiksi. Qvainta on kuitenkin suunniteltu itsenäisenä komponenttina, joka on aikanaan sovellettavissa myös muihin käyttöympäristöihin.  Qvain otetaan käyttöön kesäkuussa 2018. Lisätietoja Qvaimesta

ETSIN on tutkimusaineistojen hakupalvelu, jonka avulla voi hakea tietoa tutkimusaineistoista tai tutkimusaineistoja käyttöönsä. Etsimeen haravoidaan aineistoja myös muista palveluista, kuten Tietoarkiston Ailasta. Etsimen taustalla toimii tutkimusaineistojen käyttölupien haku- ja hallintatyökalu. Jos aineisto ei olekaan avoin vaan sen käyttö edellyttää käyttölupaa, Etsin opastaa täyttämään hakemuslomakkeen, toimittaa sen oikeaan osoitteeseen ja lopulta avaa hakijalle pääsyn aineistoon. Etsintä on aiemmin käytetty myös aineistojen kuvailuun, mutta tämä toiminto jää pois Qvaimen valmistuttua. Lisätietoja Etsimestä

Tutkimusaineistojen pitkäaikaissatavuudesta huolehti pitkäaikaissäilytyspalvelu eli TPAS-palvelu, joka pohjaa yleiseen PAS-ratkaisuun. Tutkimusorganisaatioiden toiminta on monimuotoista ja säilytyksen tarpeet, tavat  ja  prosessit ovat ja tulevat olemaan erilaisia. Säilytykseen siirrettävä aineisto voi olla tallennettuna IDAssa ja se voidaan kuvailla Qvaimella, mutta aineisto voi tulla myös muista lähteistä. Siirtotapa sovitaan tarkemmin, kun aineisto on katsottu merkittäväksi ja sen siirtämisestä palveluun on päätetty. Lisätietoja pirköaikaissaatavuudesta

Kun aineistoa siirretään pitkäaikaissäilytykseen, tarkistetaan ensin, että metatieto on muodollisesti riittävää ja että kaikki tutkimusaineistoon kuuluvat tiedostot ovat olemassa ja hyväksyttävissä formaateissa. Kun aineisto on valmis pitkäaikaissäilytykseen, sen siirtämiseen annetaan lupa hallintapalvelussa, jossa eri toimijat voivat myös tarkastella käytössään olevia kiintiöitä. Sen jälkeen kaikki aineiston osaset muodostetaan paketiksi paketointipalvelussa, josta tutkimusaineisto lähetetään varsinaisen pitkäaikaissäilytyspalvelun hyväksyttäväksi ja vastaanotettavaksi.

Tutkimusaineistojen pitkäaikaissäilytyspalvelussa on mukana myös taustalla olevia palveluita, jotka eivät näy käyttäjille. METAX on tutkimusaineistojen metatietovaranto IDAn, Qvaimen, Etsimen ja PAS-ratkaisun  taustalla. Metax keskustelee kuvailutyökalun, säilytyspalvelun, hakupalvelun ja pitkäaikaissäilytyspalvelun kanssa ja välittää tietoa niiden välillä. Metatieto on aineistoa kuvailevaa tietoa ja metatieto varmistaa koko PAS-palvelukokonaisuuden yhteentoimivuuden. Tutkimusaineistojen käyttölupien haku- ja hallintapalvelu Reetta toimii Etsimen taustalla.

DMPTuuli on tutkijoiden ja tutkimusorganisaatioiden tarpeisiin suunniteltu työkalu aineistonhallintasuunnitelmien tekemiseen. Aineistonhallintasuunnitelmassa kuvataan, miten tutkimuksessa käytetty aineisto hankitaan, miten sitä säilytetään, miten sitä käytetään tutkimuksessa sekä mitä tutkimusdatalle tehdään tutkimuksen päätyttyä. Suunnitelman voi laatia ilman työkalujakin, mutta DMPTuuli tarjoaa kuitenkin suunnitelmalle selkeän rakenteen sekä ohjeistuksen, joka auttaa aineistonhallintasuunnitelman laatimisessa. DMPTuuli tukee aineistonhallintaa, mutta se ei varsinaisesti kuulu tähän OKM:n palvelukokonaisuuteen. Lisätietoja DMPTuulista