Kaaoksesta kohti harmoniaa – Lajitietokeskus datan avoimen käytettävyyden puolestapuhujana

22.1.2021
Täytettyjä lintuja Lontoon luonnontieteellisessä museossa.

Avoimen tieteen edistäjät -palkinnon saanut Suomen Lajitietokeskus on työskennellyt määrätietoisesti saavutettavamman tutkimustiedon ja hyvän datanhallinnan puolesta jo vuosia.

Ajatus Suomen Lajitietokeskuksesta – yhteisestä digitaalisesta jakoalustasta – syntyi keskellä datakaaosta. Professori Leif Schulmanin, Lajitietokeskuksen alkuunpanijan, mukaan tietoa Suomen luonnossa esiintyvistä lajeista, niiden luokittelusta ja nimityksistä tarvitsivat ja tuottivat monet eri tahot.

Tiedonkulkua helpottamaan ideoitiin yhden luukun periaatteella toimiva kansallinen digitaalinen tietovaranto, josta kaikki olemassa oleva lajitieto olisi helposti saatavissa esimerkiksi hallinnollisen päätöksenteon tueksi tai tutkimuskäyttöön. Suomen Lajitietokeskusta ylläpidetään Luonnontieteellisessä keskusmuseossa Luomuksessa, joka on osa Helsingin yliopistoa. Vuonna 2018 Lajitietokeskus hyväksyttiin tutkimusta, opetusta, hallintoa, yrityksiä ja kansalaisia yhdistävänä alustana kansalliselle tutkimusinfrastruktuurien tiekartalle.

Vuoropuhelua tutkimusdatan avoimuudesta

Kantavana periaatteena koko kansallisen Lajitietokeskuksen toiminnassa on FAIR-periaatteiden hengessä ollut pitää aineistonjako niin avoimena kuin mahdollista ja niin suljettuna tai käyttörajoitteisena, kuin on pakko. Keskustelu tutkimusdatan omistajuudesta ja avaamisesta ei Lajitietokeskuksen viranomaistyöryhmän puheenjohtajan Aino Juslénin mukaan aina ole ollut helppoa. Tutkimusyhteisöissä data on usein henkilöitynyt vahvasti tiettyyn henkilöön tai henkilöihin, jotka usein kokevat omistajuutta keräämäänsä  aineistoa kohtaan. Julkinen, verovaroin kerätty aineisto kuuluu kuitenkin lakisääteisesti kaikille. Lajitietokeskuksen perustamisen ja rakentamisen edellytyksenä sekä osin tuloksena onkin ollut suuri kulttuurinen ja rakenteellinen muutos, joka jatkuu edelleen.

Avoimen tieteen ja tutkimuksen tulevaisuudesta on tällä hetkellä olemassa enemmän visioita kuin selkeää tietoa siitä, mihin avoimuus lopulta johtaa. Yksilö- ja organisaatiotasoilla tapahtuva kova kilpailu heikentää halua edistää avoimuutta, jos sillä voi olla negatiivisia vaikutuksia omaan asemaan. Yksittäisten tutkijoiden huolet ovat Leif Schulmanista erittäin ymmärrettäviä, mutta lopulta se yhteisöllinen ja jaettu hyvä, mitä avoimuudella voidaan saavuttaa, jättää hänestä mahdolliset yksilölliset edut tai haitat taka-alalle. Avoimuuden edistämisessä onkin usein mukana ripaus idealismia: maailmasta halutaan tehdä vähän parempi paikka kaikille.

Aineistoihin liittyvät omistajuus- ja käyttöoikeuskysymykset ovat harvoin yksiselitteisen selkeitä, minkä lisäksi omat haasteensa asettavat myös muun muassa GDPR-tietosuojalain tulkinta ja julkisuuslain noudattaminen. Siksi käytänteitä ja toimintatapoja testataan jatkuvasti ja pyritään löytämään parhaat mahdolliset ratkaisut niin teknisiin kuin periaatteellisiin ja toimintakulttuurisiin kysymyksiin.

Uhanalaisiin lajeihin liittyviä tietoaineistoja on aiemmin jaettu rajatusti, erillisten pyyntöjen perusteella, koska menettelyn on katsottu edistävän lajien suojelua. Avoimen tiedon periaatteiden noudattamisen myötä käytännöt ovat voimakkaassa murroksessa, kuvailee Juslén. Aineistojen mahdollisimman avointa jakamista kannattaa yhä useampi, sillä luonnonsuojeluun tai maankäyttöön liittyvien väärinkäsitysten ja vastuun välttämisen mahdollisuus pienenee, kun salassapidon sijaan asioista kerrotaan mahdollisimman avoimesti.

Yhteiskunnallinen käytettävyys ja vaikuttavuus tutkimuksen laadun mittarina

Lajitietokeskuksen asiakkaat eli tiedon käyttäjät voidaan palvelun rakentamishankkeen projektipäällikkönä toimineen Kari Lahden mukaan jakaa muutamaan pääryhmään. Merkittävimmät näistä ovat tieteellinen tutkimus sekä viranomaiset ja muut julkiset toimijat, jotka tarvitsevat luontoon ja lajeihin liittyvää tietoa esimerkiksi päätöksenteon tueksi. Näiden lisäksi voidaan erottaa esimerkiksi yritystoiminta, kansalaistiede sekä koulutus ja kasvatus. Ennen Lajitietokeskuksen perustamista tietopyynnöt eri toimijoiden välillä saattoivat liikkua hyvinkin hitaasti, koska kerääminen eri muodoissa ja eri lähteistä oli työlästä. Käytännön kysymykset etenkin tietoportaalin rakentamisen alkuvaiheissa olivatkin informatiikkaan ja teknologiaan liittyviä, kuten tietokantojen ja tiedostomuotojen yhteentoimivuuden parantaminen.

Tieteen avoimuus ei ole pelkkiä teknisiä ratkaisuja, vaan vaatii myös osallistamista ja yhteistyötä. Julkaisujen ja tutkimustulosten vieminen yhteen paikkaan ei vielä ole avointa tiedettä, vaan avainkysymykseksi nousee tietomalli ja tiedon käytettävyys. Laajempi yhteiskunnallinen hyötysuhde jää heikoksi, jos avoimia aineistoja ei ole kuvattu tai jäsennetty riittävästi. Lajitietokeskuksen kansainvälisestikin ainutlaatuista työtä ja ratkaisuja halutaan dokumentoida, jotta esimerkiksi tehdyn työn vaikuttavuutta voidaan paremmin tutkia ja arvioida. Yhdeksi Lajitietokeskuksen onnistumisista avoimuuden tiellä Lahti nostaa politiikkadokumenttien ja muiden toimintaa ohjaavien linjausten laadinnan. Niiden perusteella kaikki asianomaiset ymmärtävät toiminnan tarkoituksen ja reunaehdot. Vastaavien dokumenttien ja strategioiden luominen oman organisaation tarpeisiin onkin hyvä esimerkki siitä, millaista konkreettista työtä avoimuuden edistämiseksi voidaan tehdä.

Riittävien resurssien löytäminen voi koitua haasteeksi tutkimuksen ja toiminnan avaamiselle. Avoimesta tieteestä puhutaan tehokkaana resurssien käyttönä, mutta lopputulokseen ei päästä vain sormia napsauttamalla.  ”On aina aikamoinen passion killer, kun ruvetaan puhumaan rahasta”, Leif Schulman naurahtaa. Lajitietokeskus on saanut työhönsä merkittävää täydentävää rahoitusta, mutta miljoonien eri muodoissa olevien näytteiden digitointia tehdään myös paljon kokoelmatyöntekijöiden perustyönä. Miljoonien vuosittain kertyvien lajihavaintojen lisäksi Lajitietokeskuksessa digitoidaan tällä hetkellä vuosittain noin 400 000 tieteellistä kokoelmanäytettä kovan työn ja digitaalisten innovaatioiden ansiosta. Tavoitteena on päästä miljoonan näytteen vuosivauhtiin. Silloinkin digitoitavaa riittäisi vielä yli kymmeneksi vuodeksi. Koko Euroopan tasolla Schulman arvioi digitoitavaa olevan vielä ainakin miljardi näytettä.

Avoin tiede 3.0?

”Avoin tiede ei tarkoita sitä, että olemme ensin suljetussa tieteessä, jonka sitten avaamme”, Schulman huomauttaa. ”Se on prosessi, jossa jokainen uusi askel avaa uusia mahdollisuuksia seuraaviin askeliin.” Viime vuosikymmeninä on tehty valtavia teknologisia harppauksia, mikä on myös siivittänyt avoimen tieteen periaatteiden omaksumista laajempaan käyttöön. Esimerkiksi World Wide Web ja sen hyperlinkkeihin perustuva toimintaperiaate, jossa sanaa klikkaamalla pääsee uuteen paikkaan, on tällä hetkellä niin vallitseva, ettei kukaan kyseenalaista sitä. Niin sanotusta semanttisesta tietomallista ja webistä puhuttaessa ollaan kuitenkin vielä aivan alkuvaiheessa: Lajitietokeskuksenkin piirissä on visioitu eri tieteenalojen datan yhdistämistä ja keskinäistä linkittämistä (Linked Open Data), vaikka työ onkin toistaiseksi keskittynyt luonnontieteen alalle. Historialliset luonnontieteelliset näytteet ovat myös kulttuurihistoriallista aineistoa, ja niihin kytkeytyy tietoa muun muassa aineiston kerääjän henkilöhistorian ja liikkeiden kautta.

Saavutettavien aineistojen määrän kanssa rinnakkain kasvaa myös käyttäjän rooli ja vastuu. Kari Lahti korostaa aineistonhallinnassa laadun mittaamista ja hallinnointia, jotta myös käyttäjä ymmärtää, mitä aineistot pitävät sisällään ja miten niitä kannattaa käyttää. Lajitietokeskuksen toiminta yhteiskunnan eri sektorien rajojen yli on ollut monin tavoin vallankumouksellista. On ollut iso saavutus saada eri viranomaiset ja muut vastaavat toimijat saman pöydän äärelle keskustelemaan ja sopimaan aineistojen jakamisesta ja käytöstä. Vielä on kuitenkin lukuisia raja-aitoja, joita tulisi pystyä kaatamaan. Seuraava askel on Lahden mukaan saada poikkisektoraalinen toimintamalli myös lainsäädännön tasolle. Uudistuva luonnonsuojelulaki on hyvä esimerkki tästä pyrkimyksestä. Sen yhtenä tavoitteena on sisällyttää kaikki keskeiset luontotietoa hallinnoivat tietojärjestelmät lainsäädäntöön, jotta tiedon hallintaan ja jakamiseen saadaan vahvalla pohjalla oleva toimintamalli.  Kaikki kolme toivovat, että Lajitietokeskuksen kehittämä lajitiedon kansallisen hallinnan malli voisi toimia avoimuutta muillakin aloilla perustelevana esimerkkinä. Samalla voitaisiin edistää muidenkin digitaalisten infrastruktuurien saamista yhteiseen käyttöön.

Onnistuneen esimerkin voima ja ulkopuolinen paine onkin yksi parhaita tapoja saada ihmisiä mukaan avoimuuden edistämisen tielle. Askeleen ottaminen vaatii toki aina uskallusta, mutta ajattelu- ja toimintamallien vääntäminen uuteen muotoon voi olla hyvinkin antoisa prosessi. Se voi johtaa myös kansainväliseen ajatustenvaihtoon. Oman organisaation kipukohtien läpikäyminen sekä muutostarpeiden ja -kohteiden tunnistaminen avaavat keskustelua, mikä taas on välttämätöntä toimintakulttuurin muutokselle.

--

Haastattelu on tehty marras-joulukuun taitteessa 2020. Leif Schulman oli tuolloin Luomuksen johtaja, mutta on sittemmin siirtynyt Suomen ympäristökeskus SYKE:n pääjohtajaksi. Aino Juslén puolestaan nimettiin Luomuksen uudeksi johtajaksi vuodeksi 2021. Kari Lahti toimii yksikönjohtajana Luomuksen biodiversiteetti-informatiikan yksikössä.

Teksti: Elina Suominen (TSV)

Kuva:  Bruno Martins / Unsplash