Avoimet aineistot tekoälyn koulutuksessa – uhka vai mahdollisuus?

20.5.2026
Kuvituskuva Mary Shelleyn teoksesta Frankenstein, or the Modern Prometheus (vuoden 1831 painos)

Aineistojen avaaminen antaa tekoälykehittäjille mahdollisuuden hyödyntää niitä tekoälyn kouluttamisessa. Haluammeko edistää sitä?

Europeana-säätiö selvitti viime vuonna digitaalisen kulttuuriperinnön toimijoiden näkemyksiä tekoälystä ja erityisesti kulttuuriperintöaineistojen käyttämisestä tekoälyn koulutuksessa. Vastauksissa näkyi selkeä kahtiajako sen kannalta, suhtauduttiinko tekoälyyn kiinnostavana mahdollisuutena vai uhkakuvana.

Vaikka selvitys koski nimenomaan kulttuuriperintöaineistoja, samat asiat pohdituttavat myös tutkimusaineistojen kohdalla. Avoimen tieteen kannalta peruskysymys on, onko mahdollisuutta käyttää aineistoja tekoälytyökalujen kouluttamiseen syytä rajata jollain tavalla. Lause ”niin avointa kuin mahdollista, niin rajattua kuin tarpeellista” pätee varmasti tässäkin, mutta millä periaatteilla päätämme, miten tarpeellista rajaaminen on?

Koulutuskäytön esteet

Aineistojen käyttämiseen tekoälyn koulutusmateriaalina voi tietysti olla lainopillisia esteitä, kuten tietosuoja tai tekijänoikeus. Nämä esteet eivät kuitenkaan koske vain tekoälykäyttöä, vaan ne on huomioitava aina, kun aineistojen avaamista suunnitellaan. Erityisesti kulttuuriperintötoimijoiden kohdalla on lisäksi usein kyse aineistoista, joiden tekijänoikeus on jo rauennut.

Tekoälykäyttöä erityisesti koskevat kysymykset ovat enemmän eettisiä ja siksi vaikeammin vastattavissa: missä menevät aineistojen vastuullisen hyödyntämisen rajat? Europeanan selvityksessä osa vastaajista piti epäilyttävänä jo sitä, että aineistoilla koulutetaan kaupallisten toimijoiden tekoälytyökaluja eikä vain avoimeen lisenssiin pohjautuvia ratkaisuja. Avoimen tieteen keskusteluissa aineistojen kaupallista käyttöä ei kuitenkaan yleensä ole poissuljettu, vaan niiden avaamisen on nimenomaan toivottu synnyttävän uutta liiketoimintaa.

Vastuullinen ja vastuuton tekoäly

Selkeä ongelma nykyisissä tekoälytyökaluissa on niiden käytöstä syntyvä hiilijalkanjälki. Ei ole kuitenkaan vielä täysin selvää, miten aineistojen hallinnoija pystyisi tähän vaikuttamaan. Jos markkinoilla olisi ekologisempia ratkaisuja kehittäviä tekoälykehittäjiä, pitäisikö aineistoja tarjota ensisijaisesti heidän käyttöönsä?

Toinen selkeä ongelma on tekoälytyökalujen perustuminen epäluotettaviin tai jollain tavalla vinoutuneisiin aineistoihin. Tämä kysymys tuntuisi ratkeavan helpoiten nimenomaan avaamalla kaikkien tekoälykehittäjien käyttöön mahdollisimman luotettavia ja monimuotoisia aineistoja. Tällöinkin kysymykseksi jää, pitäisikö tutkimus- ja kulttuuriperintöalan toimijoiden valikoida ja kuratoida aineistoja erityisesti tähän tarkoitukseen.

Kohti aktiivisempaa toimijuutta

Tärkeä kysymys on myös, pitäisikö tutkimus- ja kulttuuriperintöalan toimijoiden ottaa aktiivisempi rooli tulevaisuuden tekoäly-ympäristön luomisessa. Pelkän aineistojen kuratoinnin ja jakamisen lisäksi toimijat voisivat esimerkiksi järjestää yhteistyöhankkeita vastuullisten tekoälynkehittäjien kanssa, osallistua tekoälyä koskevan lainsäädännön ja linjausten kehittämiseen sekä lisätä kansalaisten ymmärrystä ja osaamista tekoälystä.

Tekoälyn ja tutkimus- sekä kulttuuriperintöaineistojen kysymyksiin paneudutaan tarkemmin ensi syksynä, 30.9.2026 järjestettävässä paneelikeskustelussa. Mukana keskustelemassa on niin tekoälyn kuin tutkimus- ja kulttuuriperintöaineistojen asiantuntijoita.

 

Teksti: AVOTT-sihteeristö 

Kuva: Theodor von Holst, kuvituskuva Mary Shelleyn teoksesta Frankenstein, or the Modern Prometheus (vuoden 1831 painos), Public Domain

Sinua saattaisi kiinnostaa myös