Organisaatioille: Tunnisteet

Hyvien tutkijapalveluiden toteuttaminen ja tehokas palveluarkkitehtuuri vaativat organisaatioilta tunnisteiden hallintaa. Myös kansallisten arkkitehtuurien toimeenpano edellyttää organisaatioiden kiinnittävän huomiota semanttiseen yhteentoimivuuteen ja tiedon linkittämisen mahdollistamiseen. Tämä vaatii myös yksilöivien tunnisteiden ja niiden pysyvyyden pohdintaa. Ideaalitilanteessa verkossa näkyvää tunnistetta klikkaamalla pääsee aina alkuperäisen, yksilöidyn tiedon äärelle ja myös kone osaa tulkita tämän linkityksen sekä ymmärtää minkä tyyppisestä sisällöstä tai asiasta on kyse.

Tarjolla on sekä organisaatioiden sisäiseen käyttöön toimivia ratkaisuja että ulkopuolisia PID-palveluita. Esimerkiksi paikkatiedolle, julkaisuille ja digitaalisille resursseille, tutkijoille sekä opetus- ja koulutusalalle on olemassa eritasoista ohjeistusta ja palveluita yksilöivien tunnisteiden ja niiden käytön osalta. Asiasanoille löytyy puolestaan tunnisteita Finto-palvelusta, jossa on myös hallinnonalan sanastoja. Finto tarjoaa myös tieteenalaluokistusta. Kehitteillä on myös kansallinen Nimitietopalvelu. Yhteisten tunnisteiden, kuten ORCID:in käyttö helpottaa yleensä toimintaa huomattavasti ja on siksi suositeltavaa.

Mikäli käytössä on omia järjestelmiä joissa on verkkoon näkyviä tunnisteita, on syytä huolehtia siitä, että ne ovat vähintään EU-kommission ohjeiden sekä W3C:n suositusten mukaisia. Jos kyseessä on tavallinen URI sen vakaudesta on pidettävä huolta. Ulkoista palvelua valittaessa on puolestaan syytä tarkistaa, että järjestelmä on teknisesti luotettava, auktoritatiivinen, joustava metadatan esittämisen suhteen sekä yhteentoimiva omien ja kansallisten järjestelmien kanssa. Myös resolvoinnin tarvetta on syytä pohtia.

Erilaisia PID-järjestelmiä käytetään yhä useammin, sillä yksinkertaiset URI-tunnisteet eivät välttämättä ole riittävän pysyviä verkko-osoitteiden, -sivustojen tai organisaatioiden rakenteiden muuttuessa. Domainia valittaessa kannattaakin mieluummiin valita domain-nimi, joka kuvaa kyseistä tietovarantoa mahdollisimman hyvin, eikä organisaation nimeä sisältävää domain-nimeä. URI-tunnisteet voivat kuitenkin olla pysyviä niin kauan kuin niitä hallinnoiva organisaatio omistaa oikeuden kyseiseen verkko-osoitteeseen. PID-järjestelmän tunnisteet ovat puolestaan pysyviä niin kauan kuin palvelu on olemassa, eikä esimerkiksi verkkosivun osoitteen muutos vaikuta niihin. PID-järjestelmän, kuten esim. Handlen, ylläpitäminen vaatii kuitenkin jatkuvaa teknistä ylläpitoa ja osaamista. Content negotiation -mekanismin avulla järjestelmä voi myös sopeuttaa vastauksensa riippuen kyselyn agentista siten, että esimerkiksi selaimelle vastataan html-dokumentilla ja RDF-lukijan saadessa RDF-tiedoston. Tämä mahdollistaa uusien formaattien lisäämisen järjestelmään myöhemmin.

Ruotsin yhteentoimivuussihteeristö on kehittänyt organisaatioita varten seuraavan tarkistuslistan, jonka avulla voi lähestyä tunnisteiden hallintaa:

  • onko organisaatiollasi datapolitikka?
  • onko organisaatiollasi tunnistepolitiikka?
  • ovatko organisaatiosi tunnisteet sisäisesti yksilöllisiä?
  • ovatko organisaatiosi tunnisteet globaalisti yksilöllisiä?
  • ovatko organisaatiosi tunnisteet sisäisesti pysyviä?
  • ovatko organisaatiosi tunnisteet globaalisti pysyviä?
  • Mikäli käytössänne on vain organisaation sisäisiä tunnisteita, ovatko ne sellaisia, että niitä voidaan käyttää suositusten mukaisesti osana ulkoista pysyvää yksilöivää tunnistetta?
  • onko käytettyjen tunnisteiden luonti ja käyttö organisaatiossa hallittua?
  • toimiiko linkkien päivitys organisaatiossanne?
  • onko tarvetta ulkoisen resolverin käytölle?
  • jos pysyvät tunnisteet ovat URI-tunnisteita, ovatko ne EU-komission suosituksen mukaisia? ["http://{domain}/{tyyppi}/{käsite}/{viite}/"]

Mikäli käytössänne on PID-järjestelmä:

  • käytetäänkö sitä vain sisäisesti vai myös ulkoisesti?
  • onko järjestelmää integroitu muihin järjestelmiin?
  • onko järjestelmälle olemassa hallintasuunnitelmaa?
  • koulutetaanko järjestelmän käyttäjiä?
  • onko järjestelmä luotettava koskien esim. tietoturvaa ja kopiointia?
  • mikäli käytätte ulkopuolisen osapuolen tarjoamia tunnisteita tai resolvointia, onko niitä ylläpitävä taho auktoratiivinen ja luotettava?
  • onko järjestelmä joustava ja tarjoaako se tietoa sen laatua heikentämättä?
  • onko järjestelmä yhteentoimiva (kansallisten ja kansainvälisten tai avointen
  • standardien mukainen)?

Tutkimusorganisaatioilla on suuri vastuu hallinnoida ylläpitämiensä järjestelmien tunnisteita ja niiden pysyvyyttä. Jotta tutkijat voivat turvallisin mielin viitata julkaisuihin ja muihin tuotoksiin sekä tuoda sekä itselleen, että organisaatiolleen näkyvyyttä ja vaikuttavuutta, organisaatioiden on tuettava ja ohjattava tutkijoita tunnisteiden käytössä sekä hallionnoitava omia tunnisteitaan suunnitelmallisesti.


Lisää lukemista

Data Citation Synthesis Group: Joint Declaration of Data Citation Principles. Martone M. (ed.) San Diego CA: FORCE11; 2014.

Digisam: Checklista: Beständiga identifierare
EU-komission ohje 
Uniform Resource Identifier, Wikipedia
Kansalliskirjasto:URN:NBN (National Bibliography Numbers)
Uniform Resource Name (URN)
Persistent URL (PURL)
Digital object identifier (DOI)
ORCID
Suomen ORCID-sivu
EPIC
Archival Resource Key (ARK)
Open URL
Handle-järjestelmästä, Wikipedia
Best Current Practice RFC 7320 - URI Design and Ownership
"Implementing Persistent Identifiers: Overview of concepts, Guidelines and Recommendations", Consortium of European Research Libraries European Commission on Preservation and Access, 2006
"Persistent and unique identifiers", CLARIN, 2008.

Australian National Data Service ANDS Guides: Persistent Identifiers Working Level

 

Aineistoa W3C:ltä

Data Identification
URI Design Principles
Cool URISs don't change
Cool URIs for the Semantic Web

Research Data Alliancen video PID-järjestelmistä

< edellinen sivu seuraava sivu >