Haagin julkilausuma tiedonlouhinnan puolesta digitaaliaikakaudella

Uskomme, että voimme julkilausuman avulla muokata tutkimuseettisiä käytäntöjä, uudistaa lainsäädäntöä ja kehittää avoimen saatavuuden periaatteita ja infrastruktuuria. Voit ilmaista tukesi lisäämällä nimesi allekirjoittaneiden luetteloon.

Visio

Uudet teknologiat ovat mullistamassa ihmisten tapaa saada tietoa maailmasta ja itsestään. Uudet teknologiat eivät ole pelkästään keino käsitellä ns. isoa dataa (big data)1, vaan ne ovat avainasemassa myös löydettäessä uutta tietoa digitaaliaikakaudella. Teknologioiden tehokkuus perustuu saatavilla olevan datan määrän kasvuun. Kasvava laskentateho, internetin laajentuminen ja valtioiden sitoutuminen julkisrahoitteisen tutkimuksen avoimeen julkaisemiseen2 lisäävät tiedon, datan ja ideoiden saatavuutta.

Eri lainkäyttöalueiden voimassa olevat lainsäädäntökehykset eivät kuitenkaan tue tutkimuksen tekemisen uusien lähestymistapojen, kuten sisällönlouhinnan, käyttöönottoa. Sisällönlouhinta on prosessi, jossa informaatiota etsitään koneluettavasta aineistosta. Tämä tapahtuu kopioimalla suuria määriä aineistoa, hakemalla tietoa ja yhdistelemällä sitä uudelleen mallien ja suuntausten tunnistamiseksi.

Ajalta ennen internetiä peräisin oleva tekijänoikeuslainsäädäntö rajoittaa kuitenkin digitaalisen sisällön analyysitekniikoiden, kuten tekstin- ja tiedonlouhinnan (teksti ja data) tai sisällönlouhinnan (kaiken muotoisen sisällön tietokoneanalyysi)3 tehokkuutta. Nämä seikat luovat myös epätasa-arvoa tiedon saatavuuteen digitaaliaikakaudella. Edellä mainittua lainsäädäntöä ovat tekijänoikeuslaki ja patentteja tai tietokantoja säätelevät lait, jotka rajoittavat käyttäjän mahdollisuuksia tehdä perusteellista sisällönanalyysia.

Tutkijoilla olisi oltava vapaus analysoida aineistoja ja ruokkia älyllistä uteliaisuuttaan tarvitsematta pelätä seurantaa tai jälkiseurauksia. Näitä vapauksia ei saa rajoittaa digitaaliympäristössä. Myös datan käytön ja sisällönlouhinnan etiikka kehittyy kaiken aikaa muuttuvan teknologian mukana.

Kaiken muotoisen sisällön tietokoneanalyysi eli sisällönlouhinta mahdollistaa pääsyn louhimattomaan julkiseen tietoon ja tarjoaa tärkeää tietoa talous-, sosiaali- ja kulttuurielämän eri näkökohdista. Sisällönlouhinnalla on myös tärkeää merkitystä pyrittäessä ymmärtämään yhteiskuntaa ja yhteiskunnallisia liikkeitä esimerkiksi ennakoitaessa poliittisia mullistuksia ja analysoitaessa demografisia muutoksia. Uusien teknologioiden käyttö voi mullistaa akateemisen ja kaupallisen tutkimuksen tekotavan.

SISÄLLÖNLOUHINNAN HYÖDYT

Sisällönlouhinnan mahdolliset hyödyt ovat laaja-alaisia. Sisällönlouhinnan avulla voidaan

  • vastata suuriin haasteisiin, kuten ilmastonmuutokseen ja maailmanlaajuisiin epidemioihin
  • parantaa väestön terveyttä, hyvinvointia ja kehitystä
  • luoda uusia työpaikkoja ja kehittää työllisyyttä
  • kasvattaa tieteen nopeutta ja edistysaskeleita eksponentiaalisesti uusien näkemysten ja tehokkaamman tutkimuksen ansiosta
  • lisätä hallitusten ja niiden toimien avoimuutta
  • edistää innovointia ja yhteistyötä sekä tehostaa avoimen tieteen vaikutusta
  • luoda koulutus- ja tutkimusvälineitä
  • tarjota uusia ja entistä monipuolisempia kulttuurikäsityksiä
  • vauhdittaa taloudellista ja sosiaalista kehitystä kaikkialla maailmassa.

Tutkijat, pk-yritykset (pienet ja keskisuuret yritykset) ja suuret teknologiayritykset ovat tehneet sisällönlouhintaa jo ainakin kymmenen vuoden ajan, mutta louhinnan hyödyt ovat olleet rajalliset oikeudellisen epävarmuuden ja lainsäädännön rajoitusten vuoksi. Nykyisellä mahdollisuuksien aikakaudella on kuitenkin tärkeää, että kaikki yhteiskunnan jäsenet voivat tasapuolisesti hyötyä digitaalisen teknologian ja sisällön saatavuudessa tapahtuvista edistysaskelista. Tämä edellyttää uusien periaatteiden luomista tiedon, datan ja ideoiden saatavuuden osalta.

PERIAATTEET

Me julkilausuman allekirjoittaneet tunnistamme tiedonlouhinnan tarjoamat huikeat taloudelliset ja sosiaaliset mahdollisuudet digitaaliaikakaudella ja hyväksymme näin ollen seuraavat periaatteet:

1. TEKIJÄNOIKEUSLAKIA EI SUUNNITELTU SÄÄNNÖSTELEMÄÄN TIEDON, DATAN JA IDEOIDEN VAPAATA LIIKKUVUUTTA, VAAN SEN TÄRKEIMPÄNÄ TAVOITTEENA ON TUTKIMUSTOIMINNAN EDISTÄMINEN
Informaation ja ideoiden vapaa liikkuvuus on tärkeä ihmisoikeus4 ja perusta, jolta hyvinvoinnin ja vaurauden pohjana olevaa inhimillistä tietoa tuotetaan. Yhteiskunnat eri puolilla maailmaa suojelevat tiettyjä rajallisia tekijänoikeuksia innovoinnin ja tiedon levittämisen kannustimina. Tekijänoikeuslakia ei ole kuitenkaan koskaan tarkoitettu kattamaan tietoa, ideoita ja puhdasta dataa ja kyseisen lain moderni soveltaminen haittaa entistä enemmän tiedon luomista ja levittämistä jopa yksinkertaisimpien tiedonosasten osalta.

Joissakin maissa erityisesti tekijänoikeuslakia5 on tulkittu siten, että se rajoittaa mahdollisuutta soveltaa tietokonelukua ja -analyysia muutoin laillisesti saatavilla olevaan sisältöön. Muilla lainsäädäntöpuitteilla, kuten patenttilailla ja tietokantalailla, voi olla vastaavanlainen vaikutus. Jos tekijänoikeuslaki sallii ihmisten lukea ja analysoida sisältöä manuaalisesti mutta ei koneiden avulla, laki ei ole saavuttanut alkuperäistä tavoitettaan.

2. IHMISILLÄ ON OLTAVA VAPAUS ANALYSOIDA TIETOA JA RUOKKIA ÄLYLLISTÄ UTELIAISUUTTAAN TARVITSEMATTA PELÄTÄ SEURANTAA TAI JÄLKISEURAUKSIA
Sisällöntarjoajien olisi kunnioitettava yksittäisten lukijoiden yksityisyyttä ja ryhdyttävä toimenpiteisiin lukijoiden yksityisyyden suojaamiseksi minkä tahansa ulkoisen tahon häirinnältä. Kaikenlaiset poikkeukset voisivat loukata yksityisyydensuojaa, minkä vuoksi niiden olisi oltava välttämättömiä, oikeasuhteisia ja lain sallimia. Tiedon, datan ja ideoiden käyttö ei saa vaarantaa yksilöiden laillisia oikeuksia yksityisyyteen ja yksityiselämään.

3. LISENSSIT JA SOPIMUSEHDOT EIVÄT SAA ESTÄÄ YKSILÖITÄ KÄYTTÄMÄSTÄ TIETOA, DATAA JA IDEOITA
Yksilöiden tapaa analysoida ja käyttää tietoa, dataa ja ideoita sääntelevät ja rajoittavat lisenssit ja sopimusehdot eivät ole hyväksyttäviä vaan estävät innovointia ja uuden tiedon luontia, eikä niitä tämän vuoksi tulisi hyväksyä. Ei ole myöskään hyväksyttävää, että digitaalioikeuksien hallintajärjestelmien tekniset toimenpiteet rajoittaisivat laillista oikeutta tehdä sisällönlouhintaa.

4. SISÄLLÖNLOUHINNAN TEKNIIKOIDEN KÄYTTÖÖN LIITTYVÄN ETIIKAN ON KEHITYTTÄVÄ MUUTTUVAN TEKNOLOGIAN MUKANA
Tutkimuksen ja liiketoiminnan vakiintuneiden eettisten normien seurantaa ja kyseisten standardien ja lakien jatkuvaa kehittämistä on tuettava ja niihin on kannustettava, jotta voitaisiin varmistaa, että sisällön louhintateknologioita käytetään yhteiskuntaa hyödyttävällä tavalla.

5. TEKIJÄNOIKEUSLAKI EI SAA RAJOITTAA TIEDON, DATAN JA IDEOIDEN HYÖDYNTÄMISEEN PERUSTUVAA INNOVOINTIA JA KAUPALLISTA TUTKIMUSTA
Koska tieto, data ja ideat eivät ole tekijänoikeuksien alaisia, ei ole syytä rajoittaa laillisesti saadusta sisällöstä louhitun tiedon, datan ja ideoiden eettistä ja kaupallista käyttöä. Patenttilain tarkoituksena on innovaatioiden ja keksintöjen suojaaminen, mutta suojaa ei ole tarkoitettu kattamaan tietoa ja dataa. Tiedon, datan ja ideoiden käytön rajoituksilla voi olla huomattavaa vaikutusta innovointiin ja yleiseen talouskehitykseen. Rajoitukset voivat myös heikentää kykyä käyttää välineitä ja prosesseja, joista on hyötyä kansalaisille terveyden, tieteen, työllisyyden, tutkimuksen, ympäristön ja kulttuurin aloilla.

Toimintasuunnitelma

VISION JA PERIAATTEIDEN HYVÄKSYMINEN

1. Tähän julkilausumaan sisältyy visio siitä, ettei tekijänoikeuslakia ole alun perin säädetty tiedon, datan ja ideoiden vapaan liikkuvuuden säännöstelyyn, vaan sen tärkeimpänä tavoitteena on tutkimustoiminnan edistäminen.

2. Koska tekijänoikeuspuitteet eivät tällä hetkellä tue kyseistä visiota, lainsäätäjien olisi välittömästi ryhdyttävä toimiin sellaisten muutosten täytäntöönpanemiseksi, jotka tarjoaisivat käyttäjille mahdollisuuden louhia sisältöä aineistosta, johon heillä on laillinen pääsy.

3. Jos tekijänoikeuslakiin sisällytetään poikkeuksia tai rajoituksia6 sisällönlouhinnan sallimiseksi, niiden tulisi olla pakollisia eivätkä ne saisi olla kumottavissa sopimuksilla.

4. Ei ole hyväksyttävää, että digitaalioikeuksien hallintajärjestelmien teknisillä toimenpiteillä voitaisiin rajoittaa laillista oikeutta sisällönlouhintaan.

5. Sisällönlouhintatoimintaa ei saisi rajoittaa erillisillä lisensseillä, koska oikeus lukea merkitsee oikeutta louhia, kun louhintatoiminta tapahtuu asiaankuuluvassa sisällössä, johon on laillinen pääsy.

POLITIIKKA JA KANNUSTIMET

6. Poliittisten päättäjien olisi pyrittävä lisäämään oikeudellista selkeyttä varmistamalla, että sisällönlouhinta ei riko tekijänoikeuksia tai niihin liittyvä oikeuksia. Uskomme, että oikeuteen lukea sisältyy oikeus louhia sellaisessa sisällössä, johon yksilöllä on laillinen pääsy.

7. Jos tutkimuksen rahoittajat tai muut tahot vaativat ja sisällön laatijat toivovat, että tutkimustulokset saatetaan saataville erityisten lisenssien kautta, olisi julkaisujen osalta käytettävä CC-BY-lisenssiä ja tutkimustiedon osalta CC0-lisenssiä7.

8. Jokaisen yliopiston, tutkimusorganisaation, tutkimusrahoittajan ja liikeyrityksen olisi varmistettava, että niiden politiikoissa suositaan sisällönlouhintaa tutkimusmenetelmänä, jolla voidaan muuttaa tutkimuksen tekotapaa. Avoimen julkaisemisen ja avoimen tiedon lisääntyminen on ollut ja tulee jatkossakin olemaan sisällönlouhinnan perusedellytys.

9. Tutkijoiden olisi tunnustettava julkaisujen tekijöiden oikeus tulla tunnustetuksi. Julkaisujen tekijöitä olisi kunnioitettava ja heidät olisi mahdollisuuksien mukaan tunnustettava tiedon tuottajina.

10. Sisällönlouhinnan politiikoissa olisi kunnioitettava tekijöiden ja julkaisijoiden laillisia oikeuksia ja niiden olisi perustuttava tutkijoiden ja yritysten digitaaliaikakauden tarpeisiin.

11. Sisällönlouhintatoiminnan käyttöönoton edistämiseksi yliopistojen, tutkimusorganisaatioiden, tutkimusrahoittajien ja yritysten olisi harkittava kannustimien käyttöönottoa niiden tahojen palkitsemiseksi, jotka käyttävät uusia tekniikoita. Sisällönlouhintatoimintaa olisi esimerkiksi seurattava ja kommentoitava erityisissä arviointiprosesseissa.

INFRASTRUKTUURI JA VÄLINEET

12. Tutkimusorganisaatioiden, yliopistojen ja yritysten olisi varmistettava, ne ylläpitävät ja kehittävät infrastruktuureja, jotka tarjoavat säilytyspaikan sellaisille julkaisuille, jotka voidaan laillisesti asettaa saataville sisällönlouhintaa varten. Lisäksi niiden on varmistettava pääsy kyseisiin julkaisuihin. Riippumattomien tutkijoiden olisi pyrittävä hyödyntämään tällaisia säilytyspaikkoja, jos sellaisia on saatavilla.

13. Tutkimusorganisaatioiden, yliopistojen ja yritysten olisi tarjottava pääsy sopiviin infrastruktuureihin tutkimustiedon saattamiseksi saataville, kun se on sisällönlouhinnan kannalta laillista ja eettisesti mahdollista. Riippumattomien tutkijoiden olisi pyrittävä hyödyntämään tällaisia säilytyspaikkoja, jos sellaisia on saatavilla.

14. Viimeaikainen kehitys kattaa tekniset infrastruktuurit, standardit, eettiset normit ja rahoitusvaatimukset, joiden avulla tutkimustulokset saadaan avoimesti kaikkien saataville.

15. Avoimia standardeja, kuten tiedonsiirtoon soveltuvia XML- ja JSON-standardeja, tekijän identifiointiin soveltuvaa ORCID-standardia ja avoimeen lisensointiin soveltuvia CC-lisenssejä, olisi käytettävä aina kun mahdollista.

16. Jos aineisto on saatettu käyttöön CC BY -lisenssillä, sisällönluojien olisi tarjottava pääsy seuraavaan aineistoon lataamista varten: XML- tai muu korkealaatuinen tiedostomuoto, erittäin tarkat kuvat, kuvia tukeva data ja tekijän formatoimattomat ja hyväksytyt artikkelit.

SISÄLLÖNLOUHINNAN TUKEMINEN

17. Yliopistojen, tutkimusorganisaatioiden, kirjastoliittojen, lääketieteellisten yhteisöjen, yritysten ja sisällönlouhintayhteisöjen jäsenten olisi korostettava sisällönlouhinnan tuomia hyötyjä.

18. Tutkimuskirjastoilla on hyvät mahdollisuudet toimia sisällönlouhinnan puolestapuhujana osana tutkimusta tukevaa toimintaansa.

19. Kirjastojen olisi tarjottava tutkijoille koulutusta sisällönlouhintaa koskevasta kirjallisuudesta ja antaa oikeudellista neuvontaa.

HAAGIN JULKILAUSUMAN JA TOIMINTASUUNNITELMAN KEHITTÄMINEN JA SEURANTA

20. LIBER (Euroopan tutkimuskirjastojen liitto) on koordinoinut sidosryhmien toimintaa Haagin julkilausuman ja toimintasuunnitelman laatimiseksi. Se aikoo jatkossakin seurata julkilausuman kannattajien allekirjoitusten keräämistä ja edistää toimintasuunnitelman täytäntöönpanoa.

[1]Katso G8 Open Data Charter ja RDA Data Harvest Report (Takaisin).
[2]Katso Berlin Declaration ja Budapest Open Access Initiative 10 years on (Takaisin).
[3]Julkilausumassa käytetyllä ilmaisulla "tekstin ja tiedon louhinta" tarkoitetaan kaiken muotoisen tiedon louhintaa riippumatta siitä, onko tieto tekstissä, kuvissa, äänitallenteissa tai elokuvissa (Takaisin).
[4]Katso Ihmisoikeuksien yleismaailmallisen julistuksen 19 artikla (Takaisin).
[5]Euroopan unionin tietokantalaeissa myös tietokantadirektiivin muodossa (Takaisin).
[6]Katso esimerkiksi WIPO:n suhde rajoituksiin ja poikkeuksiin (Takaisin).
[7]Esimerkiksi suomalaisen Avoin tiede ja tutkimus -hankkeen puitteissa on julkaistu tiekartta. Tässä suositellaan kaikkien tutkimustulosten osalta CC BY 4.0 -lisenssiä. Metadatan säilytyspaikkojen osalta kansallinen suositus on CC0. (Takaisin).

 

Haagin julkilausuman laatijat luopuvat lain sallimissa rajoissa kaikista julkilausumaan liittyvistä tekijänoikeuksista ja lähioikeuksista

Lisätietoja: thehaguedeclaration.com