Provenanssitiedot

Tutkimusaineiston provenanssitiedoilla tarkoitetaan tietoa aineiston alkuperästä ja käsittelyhistoriasta; lisäyksistä, poistoista, käytetyista ohjelmistoista jne. Opetus- ja kulttuuriministeriön tarjoamissa avoimen tieteen palveluissa ei toistaiseksi kerätä provenanssitietoja, joten tutkijan on huolehdittava asiasta itse. Provenanssitietojen merkitys korostuu pitkäaikaissäilytettävien aineistojen kohdalla.

Pidempään säilytettävien aineistojen kohdalla provenanssitiedot ovat tärkeitä seuraavista syistä:

  • Tietojen syntytavan kunnollinen dokumentointi varmistaa osaltaan, että tietoja käsitellään laadukkaasti ja että syntyvä aineisto vastaa niihin kysymyksiin, joihin sen pitääkin vastata.
  • Tutkimus on paremmin toistettavissa, jos tietojen analysoinnin eri vaiheet on kunnolla dokumentoitu.
  • Lähteiden ja toimijoiden dokumentointi parantaa tutkimuksen läpinäkyvyyttä siinä mielessä, että aineiston käyttäjät pystyvät arvioimaan itsenäisesti käytettyjen lähteiden luotettavuutta ja riippumattomuutta.

Nykyään, kun suuri osa aineiston käsittelystä on automaattista, kannattaa käsittelyyn käytetyt ohjelmat ja menetelmät tallettaa sellaisinaan oheismateriaaliin. Aineiston käsittely kannattaa muutenkin automatisoida niin pitkälle kuin mahdollista, jotta tutkimus olisi helppoa toistaa omakätisesti ja vertaisarvioinnissa.

Lyhyt muistilista provenanssitietojen muodostamisesta:

  • Onko aineiston tuotantoketjun tapahtumat dokumentoitu?
  • Ovatko aineiston käsittelymenetelmät saatavilla?
  • Talletetaanko aineiston muutoshistoria?
  • Onko aineisto liitetty lähteisiinsä?
  • Talletetaanko aineistoa kerättäessä myös niitä tietoja, jotka saattavat vaikuttaa aineiston laatuun - esimerkiksi mittausdatassa antureiden kalibrointeja, haastatteludatassa haastattelutilanteen erityispiirteitä?
  • Huomioi versionhallinta: anna eri versioille omat tunnisteet ja kuvaile niiden suhteet toisiinsa, muihin aineistoihin ja jukiasuihin sekä versioiden keskinäiset erot.