Hanna-Mari Kupari (TY) pohtii kaksiosaisessa artikkelissaan keskiajan kirkollisten asiakirjojen avoimuutta suhteessa 2000-luvun tekijänoikeuslainsäädäntöön ja avoimeen julkaisemiseen. Muodostuuko tekoälystä muinaiskielten kääntäjien Kehruu-Jenny?
Muinaiskielten tutkija törmää monenlaisiin pohdintoihin avoimeen julkaisemiseen liittyen. Vaikka aineistojen alkuperäiset kirjoittajat eivät olisi olleet elossa vuosisatoihin tai -tuhansiin, ovat aineistot monikerroksisia, ja niihin liittyy usein voimassa olevia tekijänoikeudeksia tekstin julkaisijoilta. Tässä kirjoituksessa tarkoitukseni on pohtia, mitä sisältyy keskiaikaisten asiakirjojen saattamiseen kaikkien vapaasti saataville. Haluan myös spekuloida, mitä näkökulmia uudet generatiiviset kielimallit avaavat editointiin ja kieliresursseihin liittyen.
Avoimen julkaisemisen teemoja voi lähestyä menneisyyden lisäksi nykypäivän toimijoista käsin. Vaikka aineistot olisivat puoli vuosituhatta vanhoja, niiden työstämiseen on käyttänyt merkittävän määrän resursseja oman aikakauteni tutkijoita. Suomen lainsäädännön mukaan tekijänoikeus on voimassa tekijän elinajan ja 70 vuotta hänen kuolinvuotensa päättymisestä.
Penitentiariaattiaineiston osalta erilaiset tutkimusryhmät ympäri Eurooppaa ovat nähneet valtavasti vaivaa lukea ja julkaista käännetyn lyhennelmän kera alkuperäiset myöhäiskeskiajan kansliakäsialoilla kirjoitetut anomustekstit. Käsialojen lisäksi työ on vaatinut vaivalloista latinaa selvittävää filologista tutkimustyötä ja historiallista kontekstualisointia. Teokset on useimmiten päätetty julkaista painettuina kirjoina, joiden tekemiseen yleensä osallistuu kustannustoimittajan lisäksi myös taitto- ja painotyöntekijöitä. Kaikkien näiden asiantuntijoiden työpanosta kustannetaan myytävien kirjojen kautta.
Tietokirjamyynnin tulevaisuuden näkymät
Jos teksti on avoimesti ja ilmaiseksi verkossa saatavilla digitaalisena kopiona, on erittäin todennäköistä, että samaisen teoksen painettujen kirjojen myynti laskee merkittävästi. Tällöin onkin mielekästä kysyä, tulisiko vanhojen tekstien editointiin liittyvää työtä kustantaa verovaroin tai esimerkiksi yksityisellä säätiörahoituksella. Samalla voidaan pohtia, kuinka käy tulevaisuuden filologien ja kääntäjien, jos avoimesti ja ilmaiseksi saatavilla olevat editiot ovat imuroitavissa verkosta osaksi yritysvetoisten laajojen kielimallien opetusaineistoja. Onko niin, että perustyötä rahoitetaan verovaroin, mutta yksityiset toimijat kykenevät tekemään toiminnasta kannattavaa liiketoimintaa.
Väitöskirjani aineistona ovat myöhäiskeskiajalla ympäri kristikuntaa tuotetut kirkollisia lupia ja synninpäästöjä käsittelevät niin kutsutut penitentiariaattiasiakirjat, jotka ovat pitkälti säilyneet rekisterikopioina Vatikaanissa. Aineistoja on editoitu ja julkaistu alueittain eri muodoissa penitentiariaatin arkiston avauduttua tutkijoille muutama vuosikymmen sitten, esimerkiksi keskiajan Ruotsin asiakirjoja voi lukea painetusta editiosta englanninkielisinä tiivistelminä latinan lisäksi. Verkosta löytyy puolestaan tietokanta Saksan alueen penitentiariaattiasiakirjoista.
Omalla kohdallani työskentely on vaatinut yhteistyötä niin Vatikaanin edustajien kuin editioiden tekijänoikeuksien haltijoiden kanssa. Monilla aloilla avoimen tieteen periaatteet ovat vielä vakiintumattomia ja vaativat uusien toimintatapojen omaksumista. Uskoisin, että monessa muussakin tutkimushankkeessa nimenomaan kunnioittava, maltillisesti etenevä ja vuorovaikutteinen yhteistyö on paras tie eteenpäin. Kaikkea ei tarvitse mielestäni muuttaa kerralla, eikä kaikkea tarvitse heti saattaa avoimesti kaiken yleisön käytettäväksi netissä. En esimerkiksi näe huonona vaihtoehtona kieliresurssien avoimen käytön rajaamista vain ei-kaupalliseen tutkimuskäyttöön erillisillä tapauskohtaisilla sopimuksilla.
Avoimen julkaisemisen polku uhkakuvista huolimatta
Itse kannatan toimintamallia, jossa tutkijoiden tuottamat aineistot, niin editiot kuin kielivarannot, ovat kaikkien käytettävissä. Avoimuuden tuomat hyödyt tutkimuksen demokratisoinnille ovat mahdollisia uhkakuvia merkittävämmät. Itse en osaa myöskään nähdä ainakaan ihan lähitulevaisuudessa tilannetta, jossa humanistien työlle ei olisi generatiivisen tekoälyn vuoksi lainkaan tilausta.
Teknologisten saavutusten osalta esimerkiksi konekääntäminen on ollut jo pitkään osa parhaiten resursoitujen maailmankielten arkea, mutta nyt se on vähitellen laajenemassa myös muinaiskieliin. Esimerkiksi ChatGPT:tä voi käyttää melko hyvin keskiajan latinan kääntämiseen, varsinkin jos kielitaito riittää tuloksen onnistumisen tarkistamiseen.
Tulevaisuus pitää kuitenkin sisällään monia uusia ja melko vaikeastikin ennakoitavia kehityskulkuja. Mieleen tulee väkisinkin Kehruu-Jennyn keksiminen 1700-luvun lopulla ja Blackburnin käsityöläisyhteisön reaktio. On totta, että uusi keksintö vei alalta työpaikkoja, mutta toisaalta teollinen tekstiilituotanto loi myös uusia.
Tämän päivän kontekstissa, itselläni on käsitys, että kokonaisuutena kielialan toimenkuva onkin varmaan siirtymässä melko nopeasti konekäännösten tarkistamiseen ainakin selkeärakenteisten tyypillisten tekstien kääntämisestä. Tämä voi tarjota mahdollisuuksia, että saamme nopeammassa tahdissa nykyaikaisia käännöksiä niin nyky- kuin muinaiskielistäkin, jolloin erilaiset tekstit ovat myös laajemman yleisön saatavilla.
Toisaalta, ainakin historiallisten teosten osalta kontekstualisoivat ja selittävät alaviitteet tarvitsevat edelleen tekijöitä, mutta onko tämäkin työ jossain määrin automatisoitavissa? Entä jääkö ihmisille tarve lukea tekstit myös itse alkuperäiskielellä, jolloin ainakaan kielenopetuksen kenttä ei olisi katoamassa mihinkään. Vaikka teknologiset ratkaisut ovat muokanneet myös kielten opiskelua, moni tuntuu yhä suosivan perinteistä luokkahuoneessa tapahtuvaa osallistumista.
Generatiivisten kielimallien hyödyistä huolimatta koen, että alan yleinen sääntely ja eettinen keskustelu ylikansallisella tasolla on erittäin tarpeellista. Toivoisin myös läpinäkyviä käytäntöjä, joissa erilaisten työkalujen hyödyntämisestä kerrotaan julkaisuprosessin yhteydessä avoimesti. Samoin olisi tarpeen tietää, mitä kaikkia aineistoja kielimallien koulutusdatana on käytetty.
Kuten olen kirjoituksessani tuonut ilmi, avoimeen julkaisemiseen liittyy historiallisten aineistojenkin kohdalla lukuisia eettisiä kysymyksiä. Kunnioittavasta asenteesta tulee pitää kiinni myös jo kauan sitten edesmenneiden ihmisten kohdalla. Toisaalta on ponnistelujen takana ymmärtää, mitä asiaa kukin sukupolvi pitää yksityisenä ja julkisena asiana. Samaan aikaan kun haluamme edistää maksumuurien purkamista, meidän tulee myös kunnioittaa tekijänoikeuksia ja huolehtia niin tutkijoiden kuin kustantajien toimeentulosta. Vaikka avoin julkaiseminen ei ole aina se suoraviivaisin polku, näen, että sen hyödyt voittavat haitat. Toimimalla avoimesti voimme tiimityön avulla saavuttaa niin paljon enemmän kuin yksilöinä.
Teksti: Hanna-Mari Kupari, TY
Hanna-Mari Kupari on keskiajan latinaan erikoistunut digitaalisen kielentutkimuksen väitöskirjatutkija Turun yliopistossa. Työssään hän on keskittynyt modernien digitaalisten ihmistieteiden menetelmien käyttöön vanhojen aineistojen parissa. Erityisesti hän on kiinnostunut kieliopin tutkimuksesta. Tämän lisäksi hän panostaa tiedeviestintään ja haluaa tehdä latinan kielestä helposti lähestyttävää suurelle yleisölle. (Kuparin työn rahoittaa Emil Aaltosen säätiö.)
Artikkelin lähteitä:
- Kirsi Salonen, 2001. The Penitentiary as a Well of Grace in the Late Middle Ages: The Example of the Province of Uppsala 1448–1527. Finnish Academy of Science and Letters. Yleistajuisen johdannon aiheeseen voi lukea arkeologisesta Kalmistopiiri-verkkojulkaisusta.
- Sara Risberg & Kirsi Salonen. Appendix: Acta Pontificum Suecica. 2, Acta Poenitentiare: Auctoritate Papae: The Church Province of Uppsala and the Apostolic Penitentiary 1410-1526. Stockholm. Riksarkivet, 2008.
- Smith, Thomas W et al. “Killer Clergy: How Did Clerics Justify Homicide in Petitions to the Apostolic Penitentiary in the Late Middle Ages?” Petitions and Strategies of Persuasion in the Middle Ages. NED-New edition. United Kingdom: Boydell & Brewer, 2018. 202-. Web.