Avoimen tieteen käsikirjan sanasto

Tämä ei ole virallinen sanasto, vaan ohjeellinen luettelo tärkeistä käsitteistä selityksineen. Varsinaista sanastotyötä tehdään erikseen tietomallityön yhteydessä. Tässä oleva sanasto voi toimia lähinnä yleisenä keskustelunavauksena. Vastaanotamme mielellämme myös lisää ehdotuksia tänne sopivista tiedoista. Varsinaisia pääkäsitteitä ja niiden määritelmiä käsitellään tällä hetkellä myös Viima-alustalla.

 

A B C D E F G H I J K L M N  O P Q R S T U V W X Y Z Å Ä Ö

Aineiston avoimuus Aineisto on kenen tahansa käytettävissä mihin tahansa tarkoitukseen, myös kansainvälisesti, kunhan lähteeseen viitataan hyvän tieteellisen käytännön mukaisesti. Se ei välttämättä tarkoita maksuttomuutta; esimerkiksi aineiston tulkinnasta tai irrottamisesta voidaan periä palveluhinnaston mukainen korvaus mikäli tulkinta tai irrottaminen edellyttää työpanosta.

Aineistotyyppi (Resource Type) Aineistotyypillä kuvaillaan millaista aineisto on, esimerkiksi onko kyseessä fyysinen objekti, dataa, kuvia, äänitiedostoja vai sovellus. Periaatteessa aineistotyyppi käsittää aineistot, jotka syntyvät yhden prosessin tuloksena ja joille luodaan omantyyppinen, kuvaileva metatieto. Aineistotyyppikäsitteen avulla voidaan tarkentaa periaatteita: aineistotyyppi käsittää aineistot, joita koskevat samat periaatteet esimerkiksi pitkäaikaissäilytyksen teknisessä suunnittelussa.

Aitous (Authenticity) Datan oikeellisuus ja väärentämättömyys, vertaa termiin eheys.

Anonymisointi Tunnistetietojen poistaminen tai muuntaminen siten että tunnistaminen ei enää onnistu eikä henkilöitä voi identifioda. Tunnistetietoja ovat esimerkiksi nimet, osoitteet, puhelinnumerot tai henkilötunnukset. Tunnistaminen voi tapahtua myös eri taustamuuttujia yhdistelemällä, joten on syytä olla huolellinen myös niiden suhteen. Taustamuuttujia ovat esimerkiksi ikä, sukupuoli, koulutus, ammattiasema, kieli tai kansallisuus. Anonymisointia voi tehdä monella eri tavalla. Ks. esimerkiksi Yhteiskuntatieteellisen tietoarkiston Datanhallinnan käsikirja.

Altmetriikka Tutkimuksen yhteiskunnallisen vaikuttavuuden arviointia voidaan kehittää huomioimalla muutakin kuin viittausmääriä ja tieteensisäistä toimintaa. Altmetriikassa mitataan julkaisemista suurelle yleisölle, bloggaamista tai muuta aktiviteettia sosiaalisessa mediassa. Altmetriikan avulla yritetään löytää vastauksia siihen, mitä tieteessä tapahtuu juuri nyt. Mistä keskustellaan? Mikä kiinnostaa toisia tutkijoita, mikä kansalaisia? Sähköinen ympäristö antaa myös mahdollisuuden tilastoida aineistojen latauskertoja, jakamisia tai suosituksia. Tämän tyyppisellä kommunikaatiolla voi olla vaikuttavuuden kannalta suurtakin merkitystä.

Asiakirjajulkisuus Julkisuuslain mukaan yleiset asiakirjat ovat julkisia. Yleisiä asiakirjoja ovat viranomaisen laatimat ja antamat sekä sille lähetetyt tai annetut asiakirjat, jotka ovat sen hallussa. Asiakirjan käsite laissa on varsin laaja. Kirjallisten dokumenttien ohella asiakirjoina pidetään myös teknisiä tallenteita ja kuvallisia esityksiä. Asiakirja, joka on valmisteltavana viranomaisella, ei ole vielä julkinen, ei myöskään viranomaisen omassa keskuudessa syntynyt ehdotus, luonnos, mietintö, lausunto, muistio tai muu selvitys. Salassa on pidettävä sellainen asia tai asiakirja, josta niin on lailla säädetty. Julkisuuden kannalta asiakirjat voidaan jakaa julkisiin asiakirjoihin, (ei-julkisiin) valmisteluasiakirjoihin ja salaisiin asiakirjoihin.

Auktorisointi Valtuutus. Todennetulle käyttäjälle annettu lupa tietyn tiedon, suojattavan kohteen tai muun palveluelementin käyttöön.

Auktoriteettipalvelut (Authority services) Auktoriteettitiedosto tukee henkilön tai yhteisön identifiointia erottamalla toisistaan samannimiset henkilöt mm. aikamääreen, ammatin jne. avulla. Toisaalta auktoriteettitiedosto kokoaa yhteen tekijänä tai kohteena olevan henkilön/yhteisön eri nimimuodot tai nimen variaatiot takaamaan saman tekijän teosten löytyvyyden nimenmuodosta riippumatta. Auktoriteettitiedosto organisoi tietokantaa myös linkittämällä toisiinsa saman henkilön eri julkiset identiteetit, kuten todellinen nimi ja salanimi. Samalla tavoin linkitetään toisiinsa henkilöiden ja yhteisöjen nimenmuutoksista syntyneet vanhat ja uudet nimet. Myös niiden keskinäisiä suhteita ja historiaa voidaan kuvata koneluettavassa muodossa. Kansalliskirjastot luovat nimiauktoriteettitiedostoja oman maansa julkaisutuotannosta. Kansallisten sääntöjen mukaiset hakumuodot tallennetaan auktoriteettitietueisiin yhdessä kohdetta koskevien ID- tunnisteiden (ISNI, ORCID) ja nimen varianttimuotojen kanssa. Tiedot yhdistetään kansainvälisissä tietokannoissa (esim. ISNI- ja ORCID –kannat, Virtual International Authority File VIAF), jotka ovat vapaasti selailtavissa verkossa. Nykyään julkishallinnon suosituksena on julkaista nämä tiedot myös avoimena linkitettynä datana.

Autentikointi Todentaminen/tunnistautuminen. Käyttäjän henkilöllisyyden varmistaminen.

Autenttisuus Aitous, väärentämättömyys, luotettavuus.

Avoimet lisenssit (Open License) Tutkimusdata ja -julkaisut ovat yleensä tekijänoikeuksien suojaamia. Näiden aineistojen avoin käyttö voidaan kuitenkin mahdollistaa sopimuksin. Creative Commons -lisensseillä jaat osan tekijänoikeuksiasi ja annat haluamasi vapaudet teoksen käyttäjälle, katsojalle tai kokijalle. Eri ehtoja yhdistelemällä voit jakaa oikeuksiasi itsellesi ja tilanteeseen sopivalla tavalla. ATT-hanke suosittelee CC0:n, CC 4.0 BY:n tai tarvittaessa muiden yleisesti tunnettujen sopimuslisenssien käyttöä. http://creativecommons.fi/lisenssit/

Avoimet rajapinnat (Open interface) Avoimilla rajapinnoilla tarkoitetaan sellaisia ohjelmistoon toteutettuja vapaasti käytettäviä, huolellisesti dokumentoituja liittymäpintoja, joiden välityksellä ohjelmistot vaihtavat tietoja keskenään.

Avoimet standardit (Open standard) Avoin standardi tarkoittaa vakiointia, eli yhteistä sopimusta, jolloin standardia noudattavat pystyvät toteuttamaan saman, tai keskenään yhtenevän sovelluksen. Avoin standardi on kaikkien saatavilla, joten kuka tahansa saa halutessaan tiedon siitä ja voi noudattaa sitä.

Avoimet tutkimusympäristöt (Open research environments, Open research infrastructures) Tutkimusympäristö on tutkimusvälineiden, -laitteistojen, -aineistojen ja -palveluiden kokonaisuus, joka mahdollistaa tutkimuksen tekemisen. Tutkimusympäristöillä vahvistetaan tutkimusyhteistyötä ja tutkimuskapasiteettia. Tutkimusympäristöt voivat sijaita yhdessä paikassa tai olla hajautettuja kokonaisuuksia tai virtuaalisia infrastruktuureja. Avoin tutkimusympäristö tarjoaa pääsyn kokonaisuuteen, tutkimusprosessiin, joilla tutkimustuloksia tuotetaan. Avoin tutkimusympäristö edellyttää, että tutkimustulokset, julkaisut ja tausta- aineistot – ovat tiedeyhteisön vapaasti saatavissa.

Avoin data (Open data) Avoimella datalla tarkoitetaan tutkimukselle, julkishallinnolle, organisaatioille, yrityksille tai yksityishenkilöille kertynyttä jalostamatonta informaatiota, joka on avattu ulkopuolisillekin vapaasti ja maksutta hyödynnettäväksi.

Avoin julkaiseminen (Open publishing) Tutkimusjulkaisujen (artikkelien, raporttien, monografioiden) open access- julkaisemisella tarkoitetaan yksikertaisimmillaan julkaisun saattamista tietoverkkoon ja oikeutta lukea, kopioida, tulostaa ja linkittää kokonaisia tieteellisiä julkaisuja. Open access -julkaisemisella tarkoitetaan tieteellisen tiedon vapaata levitystä. Tieteellinen julkaisu on avoimesti saatavissa, kun se on sekä tiedeyhteisön että suuren yleisön luettavissa Internetistä ilmaiseksi ja esteettömästi.

Avoin lähdekoodi (Open source) Avoin lähdekoodi on tapa kehittää ja jakaa tietokoneohjelmistoja. Hyödyntäjä saa vapaasti käyttää, kopioida, muunnella ja jaella avoimen lähdekoodin ohjelmaa. Avoimessa ohjelmistojen kehitysmallissa sekä ideat että toteutukset ovat kaikkien nähtävissä ja hyödynnettävissä. Kehitystä ei hallinnoi vain yksi yritys, vaan mukana on maailmanlaajuinen yhteisö, joka koostuu sekä yksityishenkilöistä että yrityksistä. Kaikki voivat osallistua kehitystyöhön ja ohjelmistovirheet on mahdollista löytää ja korjata nopeasti. Tämä johtaa usein korkeaan laatuun, hyvään tietoturvaan ja yhteentoimiviin ohjelmistoihin.

Avoin tiede (Open Science) Avoin tiede tarkoittaa pyrkimyksiä edistää avoimia toimintamalleja tieteellisessä tutkimuksessa. Keskeinen tavoite on tutkimustulosten, tutkimusdatan ja tutkimuksessa käytettyjen menetelmien julkaiseminen siten, että ne ovat kaikkien halukkaiden tarkasteltavissa sekä käytettävissä. Avoin tiede sisältää käytäntöjä, kuten tutkimusjulkaisujen avoimen saatavuuden (open access) edistäminen, tutkimusaineistojen avoin julkaiseminen, avoimen lähdekoodin ja avoimien standardien hyödyntäminen, sekä tutkimusprosessin julkinen dokumentointi niin kutsutun avoimen muistikirjan menetelmällä.

Avoin tieto (open knowledge) Avoimella tiedolla viitataan digitaalisessa muodossa oleviin sisältöihin ja dataan, joita kuka tahansa voi vapaasti ja maksutta käyttää, muokata ja uudelleen jakaa. Avoimen tiedon määritelmän mukaisesti aineiston tulee olla kokonaisuudessaan saatavilla käyttökelpoisessa ja muokattavassa muodossa Internetin kautta ja sen tulee olla lisensoitu niin, että sen käyttöä, muokkausta ja uudelleenjakelua ei rajoiteta.

Bibliometriikka Bibliometriikka on tutkimusalue, joka tutkii tieteellistä julkaisutoimintaa kvantitatiivisin menetelmin. Aikaisemmin bibliometrinen tutkimus suuntautui enemmän tieteen rakenteen tutkimiseen, kuten esimerkiksi nousevien alojen tunnistamiseen, yhteistyöverkostojen kuvaamiseen tai yksilötason julkaisutuottavuuden tekijöiden tarkastelemiseen. Bibliometrisia menetelmiä hyödynsivät enimmäkseen alalle erikoistuneet asiantuntijat. Viimeaikainen kehitys on kuitenkin luonut haasteita bibliometriikan tutkimusalalle, ja nykyisin yhä suurempi osa bibliometrisesta tutkimuksesta liittyy arviointiin soveltuvien indikaattoreiden kehittämiseen. Ks myös altmetriikka. Jos julkaisukäytäntöjen moninaisuuden vuoksi on vaikeaa antaa yleispätevää määritelmää tieteelliselle julkaisulle, vielä haastavampaa on kaikenkattavasti määritellä laadukas julkaisu. Julkaisun laadun ominaisuuksia voivat olla esimerkiksi sen vaikuttavuus ja yhteiskunnallinen relevanssi. Bibliometriikassa tieteellistä vaikuttavuutta mitataan usein julkaisun saamien viittausten määrällä. Myös vaihtoehtoisia julkaisun laatua kuvaavia indikaattoreita on kehitetty esimerkiksi luokittelemalla lehtiä ja kustantajia niiden laadun perusteella. Viittausindikaattoreihin liittyy useita tunnettuja ongelmia, kuten negatiiviset viittaukset tai että ne suosivat valtavirtatutkimusta. Siitä huolimatta osa luonnon- ja lääketieteen tutkijoista kannattaa viittausindikaattoreiden käyttöä tutkimuksen arvioinnissa. Näillä aloilla on korkea yksimielisyys siitä, mikä on hyvää tutkimusta. Yhteiskunta- ja humanistisissa tieteissä näkemykset tutkimuksen laadun kriteereistä vaihtelevat enemmän

Data Digitaalinen aineisto, johon ei liity tulkintaa (vrt. käsite tieto, jolla viitataan tulkittuun informaatioon)

Datapolitiikka Organisaation aineistonhallinnan ohjeistus.

Digitaalinen informaatio Digitaaliseen muotoon tallennettu tai muunnettu (esim. skannattu dokumentti) aineisto sekä siihen liittyvä metatieto.

Digitointi Analogisessa muodossa olevan aineiston (esim. paperidokumentin) muuntaminen digitaaliseen muotoon.

DOAJ Directory of Open Access Journals Kansainvälinen rekisteri, josta löytyy tietoja avoimista tieteellisistä lehdistä. http://doaj.org/

E-infrastruktuuri Termi e-infrastruktuuri viittaa tutkimusta tukevaan sähköisten palveluiden ympäristöön, jossa kaikki tutkijat — työskennellessään sekä koti-instituutioissaan että kansallisissa tai kansainvälisissä tieteellisissä hankkeissa — saavat pääsyn palveluihin ja resursseihin. E-infrastruktuuri liittää yhteen tutkimuslaitteistot, tietoaineistot, laskentaresurssit, ohjelmistot, tietoverkot sekä palvelut.

Eheys (Integrity) Eheyden tarkistamisella tarkoitetaan sitä, että säilytettävän datan (tiedoston, bittijonon) sisällöstä laskettua tarkistussummaa verrataan samasta datasta aikaisemmin laskettuun tarkistussummaan. Vertailun perusteella voidaan luotettavasti havaita mahdolliset muutokset datassa. Vertaa aitous ja tarkistussumma

(Tietoaineiston) Elinkaari Tietoaineiston olemassaolo kokonaisuutena alusta loppuun. Tietoaineiston vaiheet raakadatan tuottamisesta tuotteeseen ja loppukäsittelyyn.

Emulaatio Vanhentuneen käyttöjärjestelmä- ja sovellusohjelmistoympäristön käytön mahdollistaminen uudistuneessa laiteympäristössä, siten että alkuperäinen käyttökokemus säilyy. Emulaatio voidaan toteuttaa joko ohjelmistotasolla (esimerkiksi DOS-käyttöjärjestelmän emulointi) tai laitteistotasolla (esimerkiksi Intel 80386- prosessorin emulointi).

ESFRI (European Strategy Forum on Research Infrastructures) EU-jäsenmaiden ja assosiaatiomaiden yhteistyöelin tutkimusinfrastruktuureja koskevan politiikan valmistelussa ja määrittelyssä. ESFRI koostuu tutkimusministeriöiden ja rahoittajien edustajista.

Embargo (Holding period) Karenssiaika. Rajoitus, jonka mukaan aineiston vapaa käyttö alkaa vasta säädetyn odotusajan jälkeen esimerkiksi julkaisun ilmestyttyä.

Ensikäyttö/primäärikäyttö (Primary use) Ensikäytöllä tarkoitetaan alkuperäisessä tutkimussuunnitelmassa ilmaistua tai muuta ensisijaista tutkimusaineiston käyttötarkoitusta.

Esitystieto (Representation Information) Osa säilytettävään informaatioon liitettävää metatietoa. Esitystiedon muodostaa aineiston luettavuuden mahdollistava tieto, tiedostomuodon kuvaus, semantiikka ja muu tieto, jolla tiedoston bittijonot voidaan muokata ihmisen tai koneen luettavaan ja ymmärrettävään muotoon.

Etäkäyttöjärjestelmä Etäkäyttöjärjestelmän avulla tutkijat pääsevät käsiksi aineistoihin (yleensä internetin kautta) ilman aineistojen siirtämistä tutkijan omalle koneelle. Tutkija voi tarkastella, yhdistellä ja analysoida aineistoja etäkäyttötyöpöydän avulla. Alkuperäisaineistot säilyvät palomuurien takana turvaten aineistojen korkean tietosuojavaatimuksen.

Federoitu järjestelmä Laaja järjestelmä koostuu useista eri osajärjestelmistä. Federointi voidaan toteuttaa esim. tietokanta- tai sovellustasolla, mutta se voi olla myös käyttäjän tunnistamista ja henkilötietojen ylläpitoa koskeva järjestelmä.

Haka-tunnistautuminen Haka on Suomen käytetyin korkeakoulujen ja tutkimuslaitosten käyttäjätunnistusjärjestelmä. Haka perustuu luottamusverkostoon, jonka jäsenet - tutkijat, opiskelijat ja muu henkilöstö - voivat käyttää kotiorganisaationsa käyttäjätunnuksia kirjautuessaan moniin eri palveluihin. Kotiorganisaation tietohallinto vastaa käyttäjiensä käyttäjätiedoista ja henkilöllisyyden todentamisesta. Hakassa olevien palvelujen käyttäjätiedot saadaan suoraan käyttäjän kotiorganisaatiosta. Haka-tunnistautumista käytetään myös esimerkiksi Etsin-palvelussa.

Hallinnollinen metatieto Metatieto, jonka avulla digitaalinen aineisto on hallittavissa ja säilytettävissä. Sen osa-alueet ovat tekninen, käyttöoikeuksiin liittyvä sekä pitkäaikaissäilytyksen metatieto. Perinteinen ns. kuvaileva metatieto sisältää hallinnollisen metatiedon elementtejä, mutta ei yhtä kattavasti kuin varsinaiset hallinnollisen metatiedon formaatit kuten still-kuvien teknisen metatiedon MIX.

Haravointi (Harvesting) Metatiedon automaattinen poiminta sovelluksesta toiseen, esimerkiksi jonkun tietoarkiston luettelosta Etsin- palveluun. Haravoinnissa sovelletaan yleensä jotakin rajapintastandardia kuten OAI-PMH protokollaa.

Harmaat julkaisut (Grey publications) Tieteelliset julkaisut, joita ei varsinaisesti ole vertaisarvioitu ja jotka voivat olla enemmän tai vähemmän valmiita. Tällaisia ovat esimerkiksi artikkeleiden tarkastamattomat preprint-versiot tai erilaiset työ- ja keskustelupaperit. Niiden julkaiseminen edistää tieteen avoimuutta ja nopean palautteen saamista tiedeyhteisöltä. Julkaisu voi tapahtua julkaisuarkistossa.

Harmonisointi Yhteensopivaksi tekeminen.

Henkilötieto Kaikenlaiset luonnollista henkilöä taikka hänen ominaisuuksiaan tai elinolosuhteitaan kuvaavat merkinnät, jotka voidaan tunnistaa häntä tai hänen perhettään tai hänen kanssaan yhteisessä taloudessa eläviä koskeviksi. Henkilötietojen käsittelyllä tarkoitetaan henkilötietojen keräämistä, tallettamista, järjestämistä, käyttöä, siirtämistä, luovuttamista, säilyttämistä, muuttamista, yhdistämistä, suojaamista, poistamista, tuhoamista sekä muita henkilötietoihin kohdistuvia toimenpiteitä. Henkilörekisterillä tarkoitetaan käyttötarkoituksensa vuoksi yhteenkuuluvista merkinnöistä muodostuvaa henkilötietoja sisältävää tietojoukkoa, jota käsitellään osin tai kokonaan automaattisen tietojenkäsittelyn avulla taikka joka on järjestetty kortistoksi, luetteloksi tai muulla näihin verrattavalla tavalla siten, että tiettyä henkilöä koskevat tiedot voidaan löytää helposti ja kohtuuttomitta kustannuksitta. (Henkilötietolaki 22.4.1999/523)

Hosting-palvelu Käyttöympäristön tarjoaminen palveluna, esimerkiksi web-palvelimen toiminnan ja ylläpidon tuottaminen ulkopuolisille.

Hybridi-OA Tilausmaksullisen ja maksuttoman käytön yhdistelmä. Kirjoittaja voi maksamalla kustantajan määrittelemän kirjoittajamaksun avata artikkelinsa avoimesti saataville. Muilta osin lehti on käytettävissä vain tilausmaksun maksaneille lukijoille. Kustantaja kerää tuloja tällöin sekä kirjoittajilta että lukijoilta.

Indikaattori Osoitin, ilmaisin tai tilastollinen luku, jonka avulla voidaan moninaista tietoa tiivistää helpommin hallittavaan ja ymmärrettävään muotoon. Indikaattori on siis laadullinen mittari, joka parhaimmillaan antaa laajoja ja monimutkaisiakin tietoja yksinkertaisemmassa muodossa. Indikaattori voi toimia myös apuvälineenä niin tavoitteiden asettamisessa ja seurannassa kuin suunnittelussa ja päätöksenteossakin.

INSPIRE-direktiivi INSPIRE-direktiivi 2007/2/EY luo yleiset puitteet tiettyjen viranomaisten hallinnassa olevien paikkatietoaineistojen saatavuudelle ja käytölle Euroopassa. Direktiivin toimeenpano perustuu ns. kansallisten paikkatietoinfrastruktuurien yhteentoimivuuden vaiheittaiseen kehittämiseen. Direktiivin toimeenpanoa varten on Suomessa säädetty laki paikkatietoinfrastruktuurista ja lakia täydentävä asetus.

Integraatioympäristö/arkkitehtuuri Integraatioarkkitehtuuri kuvaa miten eri sovellusten joukko jakaa ja välittää tietoa toisilleen. Se kuvaa ne periaatteet, joilla sovelluksen liittymät muihin järjestelmiin toteutetaan. Integraatioarkkitehtuuria määriteltäessä otetaan kantaa miten kokonaisuus integroidaan yhtenäisesti, ei vain yksittäisen liittymän integrointiin tapauskohtaisesti.

Irrottamiskustannus Käytetään myös muotoa irrotuskustannukset. Tässä raportissa kulut, jotka aiheutuvat aineistojen muokkauksesta tai kopioinnista luovutusta varten, aineiston toimittamisesta tai muista aineistojen luovuttamiseen liittyvistä toimista.

Jatkokäyttö/sekundäärikäyttö (Secondary Research, re-use) Jatkokäytöllä viitataan käyttöön, jossa joko ensi- tai jatkokäyttäjät hyödyntävät tutkimusaineistoa muuhun kuin alkuperäiseen esim. tutkimussuunnitelman sisältämään tutkimustarkoitukseen.

Jakaminen

Joukkoistaminen (Crowdsourcing) ks. Talkoistaminen

Julkaiseminen

Julkaisuarkisto Tieteellisten julkaisujen tallentamiseen ja avoimeen verkkojulkaisemiseen soveltuva tekninen järjestelmä ja sen ympärille rakennetut palvelut. Teknisen kehitystyön ja ylläpitotyön lisäksi julkaisuarkiston olemassaolo edellyttää mm. aineistojen tallentamiseen, kokoelmien hallinnointiin ja asiakaspalveluun liittyvien prosessien ja palvelujen järjestämistä. Julkaisuarkistot voivat olla joko organisaatio- tai tieteenalakohtaisia.

Julkaisufoorumi Julkaisufoorumi ylläpitää ja kehittää tieteellisten julkaisukanavien tasoluokitusta. Tavoitteena on ollut luoda järjestelmä, jossa tieteellistä julkaisutoimintaa voidaan arvioida määrän lisäksi myös laadullisesti. Järjestelmän perustana on kaikki tieteenalat kattava tasoluokitus erityyppisille julkaisukanaville: tieteellisille sarjoille, konferensseille ja kirjakustantajille. Julkaisukanavat arvioidaan asiantuntijapaneelissa. Julkaisufoorumi toimii Tieteellisten seurain valtuuskunnan yhteydessä. Julkaisufoormumi perustettiin Suomen yliopistot UNIFI ry:n aloitteesta vuonna 2010. Ensimmäinen tasoluokitus valmistui vuonna 2011. Tutkimusorganisaatiot ovat autonomisia soveltaessaan erilaisia arviointimenetelmiä oman toimintansa kehittämisessä, mutta tulisi huomioida, että Julkaisufoorumi-luokitus soveltuu tutkimuksen arvioinnin työvälineeksi ainoastaan suurten julkaisumäärien tasolla. Luokitus ei sovellu tieteenalojen välisten vertailujen tekemiseen, eikä se voi korvata julkaisujen sisältöön perustuvaa vertaisarviointia yksittäisten tutkijoiden tai tutkimusryhmien arvioinnissa.

Julkinen sektori Kansantalouden osa, joka on valtion tai kuntien omistuksessa. Julkiseen sektoriin lasketaan valtion ja kuntien varsinaisen toiminnan lisäksi laajimmillaan muun muassa julkiset sosiaaliturvarahastot (esimerkiksi Kansaneläkelaitos), kuntayhtymät, valtion tutkimuslaitokset, liikelaitokset ja valtionyhtiöt.

Julkisen sektorin tiedot Käytetään myös termiä PSI–tieto (Public sector information). Julkisorganisaatioiden keräämää ja tuottamaa tietoa (esim. digitaaliset kartat, säätiedot, liikennetiedot, liike- ja kansantaloudelliset tiedot, lakitiedot).

Julkinen tieto Julkista tietoa kuvaa kaksi piirrettä: ensinnäkin, julkisen tiedon muodostaa se, mikä jää tekijänoikeuslainsäädännön tai muun lainsäädännön ulkopuolelle. Toisaalta julkinen tieto voi tarkoittaa julkisen hallinnon tuottamaa tietyntyyppistä tietoa, jota tuotetaan viranomaistoimintana. Julkishallinnon tuottama tieto on osa laajempaa kategoriaa julkisen sektorin tiedot.

Julkishyödyke Taloustieteellinen käsite hyödykkeestä, jota lukuisat henkilöt voivat käyttää useita kertoja sen kulumatta tai jonka kulutus ei estä muita kuluttamasta samaa hyödykettä.

Julkisrahoitteinen tutkimus Tutkimus, jonka rahoitus pääosin tulee verovaroista suoraan tai epäsuorasti (esimerkiksi Helsingin yliopiston Luomukselle myöntämä budjettirahoitus, ministeriöiden, Tekesin, Suomen Akatemian ja EUn hankemäärärahat)

Kansalaistiede (Citizen Science) Laajan yleisön tekemää joukkoistettua tutkimusta, jota on tehty esimerkiksi tähtitieteen tai biologian alalla tiedon keräämisessä. "Kuka tahansa voi koska tahansa havaita jotakin tieteellisesti kiinnostavaa. Esimerkiksi Taivaanvahtiin kirjatut tulipallohavainnot voivat auttaa asiantuntijoita laskemaan tulipallon etenemisreitin ja mahdollisen putoamispaikan, vaikka havaitsijat olisivatkin enimmäkseen satunnaisia kulkijoita. Tietysti tietotaidon kasvaessa myös harrastajan mahdollisuudet lisääntyvät. Tiede on kyllä osannut jo pitkään hyödyntää puoliammattilaisten asianharrastajien panosta monilla aloilla, mutta kansalaistiede tuo tieteen tekemisen myös aidosti tavallisten, vailla kummempia erikoistaitoja olevien ihmisten ulottuville. Ympäristöeetikon sydäntäni lämmittää tietysti kovasti se että kansalaistieteelliseen tutkimukseen soveltuvat hyvin monet sellaiset alat, joiden tuloksista on hyötyä ympäristönsuojelun, ja sitä kautta myös kansalaisten oman hyvinvoinnin kannalta. Hyödyllisiä eivät ole ainoastaan kansalaisvoimin kerätyistä aineistoista saatavat tieteen tuotteet, vaan ennen kaikkea se, että kansalaistieteeseen osallistuminen nostaa tavallisten ihmisten tietoisuutta ympäristönsä tapahtumista ja auttaa hahmottamaan arkisten pikku havaintojen suhdetta suureen kuvaan ja ympäristössä tapahtuviin muutoksiin." Saara Reiman: "Eläköön kansalaistiede", blogissa Filosofian puutarhassa 17.2.2103.

Keskustelupaperi (Discussion paper) Keskustelupaperin tavoite on tuoda tutkimuksen alustavat tulokset tutkimusyhteisön arvioitavaksi. Tulokset julkaistaan yleensä muussa julkaisukanavassa myöhemmin.

Koneluettavuus Koneluettavuus tarkoitta, että tieto on rakenteistettu siten, että kone pystyy käsittelemään tietoja. Pilkku- tai sarkaineroteltu data sopii parhaiten taulukkomuotoisen tiedon tai nimi-arvoparien julkaisemiseen. Etuna on, että lähes jokaiselta tietokoneelta löytyy taulukkolaskentaohjelma, jolla tällaiset tiedostot voidaan avata tutustuttaviksi ja muokattaviksi. Monimutkaisempien tietorakenteiden esittämiseen esimerkiksi XML, JSON ja RDF ovat yleisen tason standardeja. Parhaimmillaan koneluettava tieto on yksilöity pysyvillä tunnisteilla, kuten ureilla, joita voi linkittää muihin lähteisiin esimerkiksi ontologioiden avulla. Esimerkiksi verkkosivuilla merkintäkielenä käytettävä HTML soveltuu hyvin asiakirjojen rakenteen kuvailuun (mikä on otsikkoa ja mikä leipätekstiä), mutta itse tietosisältöä se ei tarjoa koneluettavassa muodossa. Esimerkiksi jos kunnan verkkosivuilla luetellaan kaikkien kirjastojen osoitteet ja aukioloajat on ihmisen helppo löytää haluamansa tieto sivuilta, mutta koneellisesti on vaikea erottaa osoitteita, aukioloaikoja ja muuta sivuilta löytyvää informaatiota toisistaan. Koneluettavuuden näkökulmasta on pystyttävä yhdistämään eri ainestojen metatiedot, jotta koneellisesti voidaan todeta, kirjastojen «osoitteiden» olevan verrannollisia «katuosoitteeseen» uimahalleista puhuttaessa. Aina tietueiden yhdistäminen (harmonisoiminen) ei kuitenkaan ole näin suoraviivaista. Hyvän esimerkin tarjoavat työttömyysluvut, jotka Tilastokeskus ja työ- ja elinkeinoministeriö laskevat eri tavalla. Näitä lukuja ei voida helposti yhdistää.

Kokonaisarkkitehtuuri (Enterprise Architecture) Kuvaa kuinka eri elementit – organisaatioyksiköt, ihmiset, toimintaprosessit ja tietojärjestelmät – liittyvät toisiinsa ja toimivat kokonaisuutena.

(Tietoaineistojen) Kuratointi Käytetään myös termiä hoivaaminen. Aineistojen sisällön ylläpitoon ja päivityksiin liittyvät toimenpiteet, joilla turvataan aineistojen eheys ja käytettävyys.

Kultainen OA (Gold OA) Koko julkaisu (lehti tai kirja) on maksuttomasti käytettävissä kustantajan tai muun välittäjän verkkopalvelussa. Julkaisun avoin saatavuus perustuu usein kustantajan keräämiin kirjoittajamaksuihin.

Kuvaileva metatieto, kuvailutieto (Descriptive Metadata) Kohdetta kuvaileva metatieto, joka on liitetty luovuttajan toimesta kohteeseen siirrettäessä aineisto säilytettäväksi. Kuvaileva metatieto mahdollistaa aineiston löytämisen, tunnistamisen, valinnan sekä käyttöön saamisen ja ymmärrettävyyden (KDK).

Kuvailu Kuvailu on kuvailevan metatiedon tuottamista. Kuvaileva metadata kertoo dokumentista tai aineistosta ja sen sisällöstä (esimerkiksi tekijä, nimeke ja aihe). Ilman kuvailevaa metatietoa data ei kelpaa tutkimusaineistoksi, eikä se ole löydettävissä tai hyödynnettävissä. Kuvailu tulisi tehdä mahdollisimman rikkaasti mutta myös noudattaen sääntöjä (standardeja, kuvailuohjeita ja metatietomalleja), jotta löydettävyys olisi hyvä. Kannattaa aina käyttää sanastoja ja ontologoita ja noudattaa ohjeistusta tarkasti esimerkiksi nimimuotojen tai päivämäärien ilmaisussa.

Käsikirja Käsikirja perustuu opetus- ja kulttuuriministeriön asettaman poikkihallinnollisen Avoin tiede ja tutkimus -hankkeen (ATT) työhön tiedon saatavuuden ja avoimen tieteen edistämiseksi. Käsikirja on tarkoitettu tutkijoille, tutkimusryhmille, tutkimusorganisaatioille, päättäjille ja rahoittajille sekä kansalaisille avuksi avoimen tieteen ja tutkimuksen hyödyntämisessä ja edistämisessä.

Käytettävyys (Usability) Tietojärjestelmien käytettävyys määritellään seuraavasti: Valtiohallinnon tietoturvallisuuskäsitteistön (1/2000) mukaan käytettävyys tarkoittaa 1) ominaisuutta, että tieto, tietojärjestelmä tai palvelu on siihen oikeutetuille saatavilla ja hyödynnettävissä haluttuna aikana ja vaaditulla tavalla ja 2) helppokäyttöisyyttä. Jotta tieto olisi käytettävää, sen on oltava myös ymmärrettävää. Tässä dokumentissa kyse on usein tietoaineistojen käytettävyydestä tai käyttökelpoisuudesta tutkimuskäyttöön. Tämä määrittyy aina suhteessa tutkimustehtävään, mutta edellyttää vähintään tietoja aineiston alkuperästä.

Käyttöoikeus ja käyttörajoitus Käyttörajoitus on ehto, joka liittyy aineiston käyttöön ja joka perustuu sopimukseen, lakiin tai etiikkaan, ja joka toteutuessaan voi estää pääsyn aineistoon tai määrittelee miten aineistoa saa käyttää. Joskus aineistojen saatavuutta tai käyttöä on rajoitettava esimerkiksi tietosuojasyistä. Jonkun on silloin vastattava siitä, kenelle erilaisia oikeuksia aineistoihin annetaan (lukeminen, muokkaaminen, jakaminen). Saatavuudesta vastaa yleensä tietojen ja järjestelmien omistaja, joskus tutkija. Käyttöoikeus on puolestaan valtuus käyttää jotakin aineistoa. Käytöllä voidaan tarkoittaa esimerkiksi aineiston näyttämistä, kopioimista tai muokkaamista. Käytönhallinta on tekninen menettely, jolla pyritään rajaamaan pääsyä tietojärjestelmään tai tietoihin. Käytönhallinnassa voidaan hyödyntää esimerkiksi tunnistamista (autentikointia) ja valtuuksia (auktorisointia) siten, että tietojärjestelmään pyrkivältä käyttäjältä vaaditaan käyttäjätunnusta ja salasanaa. Suomen tutkimusjärjestelmässä yleinen käytetty menetelmä on Haka-järjestelmä. Pääsynhallintaan liittyy myös fyysinen pääsy laitteisiin. Tietoturvan ja aineiston laadun kannalta on tärkeää, että järjestelmä kerää käytöstä mahdollisimman tarkkoja lokitietoja.

Laatujärjestelmä (Quality system) Laatujärjestelmä koostuu koulutuksen, tutkimuksen, yhteiskunnallisen vuorovaikutuksen ja vaikuttavuuden, henkilöstövoimavarojen, palvelujen ja johtamisen laatua varmistavista menettelyistä ja prosesseista.

Linkitetty data (Linked data) Eri lähteissä sijaitseva rakenteinen data, jossa on lähteen sisäisiä ja lähteiden välisiä linkkejä. Linkitetty data perustuu standardoituihin verkkotekniikoihin kuten HTTP:hen, RDF:ään tai URI:in. Linkitettyä dataa on hyödynnetty esimerkiksi Kulttuurisampo-portaalissa (http://www.kulttuurisampo.fi/), joka sisältää tietoja usean suomalaisen museon, kirjaston, arkiston ja muun organisaation kokoelmista sekä erityyppisiä verkkoaineistoja. Portaalin kautta voi etsiä tietoja kaikkien osallistujaorganisaatioiden aineistoista. Linkittäminen on osa ns. semanttista webiä, ja sitä käytetään laajasti, esim. Google käyttää samankaltaista tekniikkaa nimellä Knowledge Graph. Tunnisteita sisältävien linkkien käyttö parantaa löydettävyyttä ja näkyvyyttä. Linkitetty data voi olla avointa dataa, jolloin puhutaan avoimesta linkitetystä datasta (open linked data).

Lokitieto (log data) Tietojärjestelmän muistiin automaattisesti kirjautuva tapahtumatieto. Lokitieto voi sisältää erilaisia tunnistautumistietoja. Lokitieto voi koskea muun muassa sitä, kuka järjestelmää on käyttänyt tai miten ja milloin järjestelmää on käytetty. Lokitiedoista voivat selvitä esimerkiksi järjestelmän virhetilanteet, yhteydenotot tietokoneelta Internetiin sekä tietokoneelle Internetistä tulleet yhteydenottopyynnöt.

Löydettävyys (Findability) Löydettävyydellä tarkoitetaan usein sitä, miten hyvin tietty aineisto löytyy hakukoneen kautta. Usein halutaan edistää oman sisällön tai aineiston näkyvyyttä käyttämällä hakukoneoptimointia (Search Engine Optimization). Tätä voi tehdä esimerkiksi huolehtimalla hyvästä linkittämisestä ja oikeiden avainsanojen käyttämisestä osoitteissa, otsikoissa tai kuvateksteissä. Löydettävyyden voi kuitenkin myös käsittää laajemmin. Esimerkiksi, ellei julkaisulle anneta oleellisia kuvailutietoja kuten sopivia asiasanoja vaikkapa julkaisuarkistossa, sitä ei hakija löydä kun sitä tarvitsee. Löydettävyys eroaa löytyvyydestä, jolla mitataan hakujärjestelmän kykyä löytää relevantteja hakuosumia. Löydettävyys kuvaa yksittäisen aineiston ominaisuuksia, joihin sen tuottaja usein voi itse vaikuttaa huolehtimalla hyvien kuvailutietojen syntymisestä. Yhä useammin kuvailutiedot leviävät avointen rajapintojen ja haravointien kautta myös muihin palveluihin ja hakukoneisiin, ja voivat näin edistää tutkimustiedon leviämistä.

Metatieto/metadata Tiedon kontekstia, sisältöä ja rakennetta sekä niiden hallintaa ja käsittelyä koko elinkaaren ajan kuvaavaa tietoa. Tätä tietoa voidaan käyttää mm. aineiston hakuun, paikallistamiseen ja tunnistamiseen. Metatiedot ovat olennaisia aineistojen löytämisen, luetteloinnin ja käytön kannalta. Metatiedoista saatetaan kirjallisuudessa käyttää myös termiä metadata. Metatiedot sisältävät sekä aineiston kuvailutietoja että teknisiä, järjestelmän metatietoja.

Meriitti / Ansio Tieteellinen tai virka-ansio.

Mikrodata Mikrodatalla tarkoitetaan aineistoja, jotka sisältävät tietoa yksittäisistä henkilöistä tai talousyksiköistä. Mikrodata on kerätty yleensä kyselytutkimuksin väestöotokseen poimituilta henkilöiltä tai kokonaisväestöltä väestönlaskennoissa. Tietoja voidaan poimia myös rekistereistä.

Migraatio (säilyttävä kopiointi) (Migration) Digitaalisen informaation muuntaminen tai kopioiminen siten, että alkuperäisen formaatti tai säilytysmedia muuttuu. Esimerkiksi tiedosto muunnetaan eri ohjelmalla luettavaan muotoon alkuperäisen tiedostomuodon vanhentuessa; tai tiedoston nimi muuttuu, jolloin viittaukset sisältötietoon täytyy päivittää uutta tiedostonimeä vastaaviksi. Muunnoksella pyritään säilyttämään digitaalisen aineiston luettavuus ja ymmärrettävyys.

My Data Omadata tai My Data on alun perin Britanniasta lähtöisin oleva termi. Sillä viitataan käytäntöihin, joilla ihmisille annetaan oikeus ja pääsy heistä kerättyyn dataan kuten ostotietoihin, liikennetietoihin, teletietoihin, energiatietoihin, eri verkkopalveluihin kertyvään dataan jne. Keskeistä My Data -ajattelussa on, että data on teknisesti helposti käytettävissä ja yksilö voi hallita, kuinka sitä hyödynnetään ja jaetaan edelleen (okf.fi)

Nanojulkaisu (Nanopublication) Julkaisutapa, jossa yksittäiseen tietoon, väittämään tai oletukseen (assertion) liittyy metadataa sen luojasta ja alkuperästä. Tämän avulla tietovarantoja on helpompi yhdistellä jalostaa ja yksittäiseen tietoon voi myös viitata. Käytössä lähinnä lääketieteen ja biologian alalla tällä hetkellä. Perustuu datan linkittämiseen.

Normalisointi 1. Metatietoelementin (esimerkiksi aika) esitystavan muuntaminen yhtenäiseen (standardi)muotoon. 2. Metatietoformaattien tietoelementtien semanttisten vastaavuuksien määrittely.

Omistajuus Ontologia Formaali, eksplisiittinen määrittely yhteisestä käsitteistöstä.

OpenDOAR Kansainvälinen rekisteri, josta löytää tietoa ja tilastoja julkaisurekistereistä. Ks. http://www.opendoar.org/

Paikkatieto (geographic information, spatial data) Paikkatiedolla tarkoitetaan kaikkea tietoa, joka sisältää välittömän tai välillisen viittauksen tiettyyn paikkaan tai maantieteelliseen alueeseen. Paikkatietoaineistot kuvaavat tiettyä teemaa tai ilmiötä kattaen rajatun maantieteellisen alueen. Paikkatietoteemoja ovat mm. maa- ja kallioperä, vesistöt ja ilmasto, kasvillisuus ja eläimistö, maankäyttö, kiinteistöt, rakennukset ja väestö sekä toimipaikat, liikenne- ja tietoliikenneverkot sekä johtoverkot. Digitaaliset ilma- ja satelliittikuvat ovat keskeistä paikkatietoaineistoa.

Paikkatietoinfrastruktuuri Paikkatietoinfrastruktuurilla, osana yhteiskunnan tietoinfrastruktuuria, tarkoitetaan yhteisesti sovitulla tavalla tuotettuja paikkatietoaineistoja ja paikkatietopalveluja, näiden kuvailuja ja teknisiä toteutuksia sekä tietojen saatavuutta ja käyttöä koskevia periaatteita ja prosesseja.

Perusrekisterit Viranomaisen ylläpitämä koko maan kattava hallinnollinen rekisteri. Perusrekistereihin kuuluvat: Väestötietojärjestelmä (henkilötiedot, rakennus- ja huoneistotiedot), Kiinteistötietojärjestelmä (kiinteistörekisteri, lainhuuto- ja kiinnitysrekisteri), Yritys- ja yhteisötiedot (kaupparekisteri, yritys- ja yhteisötietojärjestelmän tiedot, yhdistysrekisteri sekä yritys- ja toimipaikkarekisteri).

Perustietovarannot Perustietovarannot ovat julkisen hallinnon keskeisiä tietovarastoja, joita hyödynnetään laajalti yli viranomaisrajojen. Perusrekisterit ovat yksi keskeinen tietovaranto. Lisäksi perustietovarantoihin kuuluvat myös perusrekisterien kaltaiset rekisterit, tiettyjä käyttötarkoituksia palvelevat rekisterit sekä merkittävät paikkatietoaineistot.

Pitkäaikaissäilytys (Digital preservation) Sähköisessä muodossa olevan aineiston rakenteen, eheyden ja sisällön pitkäaikaista huolenpitoa. Säilytysaika on vähintään 10 vuotta ja enimmillään rajaton eli aineisto säilytetään pysyvästi, mikä vaatii huomattavaan paljon suunnittelua ja metatietoja.

Primääriaineisto Tai primäärikappale on aineiston päivitettävä versio. Tällä versiolla on metatiedot ja omistaja.

Preprint-versio (Preprint) Preprintin tavoite on tuoda tutkimuksen alustavat tulokset tutkimusyhteisön arvioitavaksi. Tulokset julkaistaan yleensä muussa julkaisukanavassa myöhemmin. Ei vertaisarvioitu ennen julkaisua.

PSI-direktiivi Europpan Unioin direktiivit EU PSI 2003/98/EC ja 2013/37/EU, jotka ohjaavat julkisen datan avaamiseen.

Pysyvä linkki Toiminnalliseen tunnukseen perustuva URI (verkko-osoite), joka viittaa pysyvästi samaan objektiin riippumatta kyseisen objektin web-osoitteen mahdollisista muutoksista. Pysyvä linkki perustuu yleensä URN-tunnukseen, jonka resoluutiopalvelu muuntaa ajantasaiseksi web-osoitteeksi tai -osoitteiksi. Ks myös Pysyvä tunniste.

Pysyvä tunniste (PID, Persistent identifier) Tunniste on kohteen yksilöivä ainutkertainen merkkijono, jonka avulla kohteeseen voidaan yksiselitteisesti viitata. Pysyvä tunniste on koko kohteen elinajaksi tallennettu tunniste. Digitaalisille materiaaleille on useita eri tunnistejärjestelmiä, esim. URN tai DOI-tunnisteet. Resolver-palvelun avulla tunnisteet voivat toimia toiminnallisina tunnuksina eli pysyvinä linkkeinä verkossa.

Pääsynhallinta Mekanismit, joilla hallitaan käyttäjien tunnistamista (autentikointi) ja sitä, mihin informaatioon kukin käyttäjä pääsee käsiksi (auktorisointi). Saatavuustieto on välttämätön metatieto, jos pääsyä halutaan hallita tietojärjestelmän avulla esimerkiksi tietoarkistossa tai säilytyspalvelussa. Suomessa käytämme yleisti REMS- palvelua. Tekniset ratkaisut ja palvelut, joilla voidaan antaa tietoturvan ja -suojan vaatimukset huomioon ottava pääsy aineistoon halutuille käyttäjäryhmille. Pääsynhallintaan kuuluu myös aineiston käyttötapahtumien rekisteröinti.

Raakadata Raakadata on jalostamatonta dataa jota syntyy moninaisissa muodoissa, ja joka voi elinkaarensa aikana kokea monia transformaatioita ja eri käsittelyvaiheita. Luonnontieteissä raakadataa tuottavat usein tutkimusinstrumentit kuten teleskoopit, satelliitit, synkrotronit ja kasvavassa määrin tietokonesimulaatiot. Humanistisissa ja yhteiskunnallisissa tieteissä raakadataa muodostuu esimerkiksi haastatteluista ja kyselyistä.

Rakenteellinen metatieto Metatiedon tyyppi, joka kuvaa miten kohteen komponentit järjestetään. Rakenteellisella metatiedolla voidaan esimerkiksi kertoa digitoidun kirjan, jossa jokainen sivu on erillinen tiedosto, sivujärjestys (KDK).

Rajapinta (avoin/suljettu) Ohjelmisto tai ohjelmistokomponentti, jolla eri ohjelmistot, tietokannat tai tietojärjestelmät voivat vaihtaa tietoja keskenään. Englanniksi Application Programming Interface (API). Ohjelmiston, järjestelmien, tai teknisten laitteiden rajapinnat voidaan määritellä joko suljetuiksi tai avoimiksi. Rajapintaa, jonka kaikki ominaisuudet ovat julkisia ja jota voi käyttää ilman rajoittavia ehtoja (esimerkiksi laatia rajapintaa hyödyntävän ohjelman ilman rajapinnan valmistajan erillistä hyväksyntää tai pakollisia lisenssimaksuja) kutsutaan avoimeksi. Suljetun rajapinnan ominaisuudet eivät ole julkisia tai niitä ei saa käyttää ilman rajoittavia ehtoja.

Rekisterit Julkisella sektorilla syntyy viranomaistoiminnan yhteydessä kattavia tietoaineistoja, joita kerätään rekistereihin ja tietojärjestelmiin. Lisäksi tilastotoimessa syntyy tilastollisia rekistereitä.

Rekisteritiedot Rekisteritiedot ovat rekisteriviranomaisten ylläpitämää tietoaineistoa tietystä, laissa määritellystä kohdejoukosta. Rekisteritiedot ovat yksikkötason tietoja tarkasteltavasta ilmiöstä (henkilö, yritys, ympäristö jne.), jotka tallennetaan viranomaisten keräämiin hallinnollisiin tai tilastollisiin rekistereihin.

Rekisteriviranomaiset Rekisteriviranomaiset ylläpitävät yhteiskunnan perusrekistereitä tai toimialuekohtaisena viranomaisena hallinnollisia seuranta- ja valvontatietoa sisältäviä rekistereitä ja tietojärjestelmiä. Näitä tehtäviä hoitavilla virastoilla ja laitoksilla on usein velvoitteita raportoida asiantiloista.

Rekisteritutkimus Rekisteritutkimus on tutkimusta, jossa käytetään hyväksi rekisteritietoja. Tutkimus voi perustua kokonaan rekisteritietoihin tai rekisteritietoja voidaan käyttää muita aineistoja (esimerkiksi haastattelu- tai kyselyaineistoja tai kliinisiä ja näyteaineistoja) täydentävinä tietoina.

Saatavuus (Access) Saatavuus määrittelee, onko tieto saatavilla käyttötarkoituksen mukaisesti; periaatteellisesti sekä teknisesti ja muiden toimintatarpeiden vaatimusten mukaisesti.

Sanasto Luettelo jossain kielessä tai ympäristössä sallituista sanoista tai termeistä luokitteluineen, määritelmineen, kuvauksineen ja esimerkkeineen. Sanastoja voidaan laatia monin eri tavoin ja eri käyttötarkoituksiin. Sanastotyyppejä ovat muun muassa terminologiset sanastot, asiasanastot, ontologiat sekä tietojärjestelmien ja sovellusten integrointia tukevat sanastot. Tietoteknisessä ympäristössä sanastoilla kuvataan käsitteiden merkityksiä siten, että eri tietojärjestelmät voivat ymmärtää käsittelemäänsä tietoa. (JHS 179).

Siirtokelpoinen tiedostomuoto Tiedostomuoto, jota voi käyttää kun tietoa siirretään pitkäaikaissäilytykseen. Katso tarkemmin Kansallisen digitaalisen kirjaston verkkosivut kdk.fi

Sekundääriaineisto Primääriaineistosta otettu kokonainen tai osittainen kopio. Sekundääriaieneistoon viitattaessa on aina mainittava alkuperä ja aikatieto (viittaus JHS179 Master Data Management -liite).

Semantiikka Semantiikka eli merkitysoppi tutkii esimerkiksi sanojen ja ajatusten merkitystä. Kielen merkitystä tutkiessaan se on kielitieteen alalaji, joka tutkii esimerkiksi sanan, virkkeen tai kokonaisten tekstien merkitystä ja viittauksia. Semantiikalle oleellista ovat ilmaisujen väliset suhteet, kuten antonymia, homonymia, hyponymia, meronymia, polysemia ja synonymia.

(Avoin) Standardi Valtuutetun tahon tietyllä alalla käytettäväksi hyväksymä tai alalla laajasti omaksuttu tuotetta tai toimintaa koskeva malli, mitta, ominaisuus tai nimitys (jota voi hyödyntää ilman rajoittavia ehtoja).

Sui generis –suoja Luo ylimääräisen suojakerroksen mm. aineistoille, jotka muuten olisivat vapaasti käytettävissä.

SHERPA/RoMEO Palvelu, jota ylläpitää Nottinghamin yliopisto, josta voi tutkia tieteellisten lehtien suhtautumista rinnakkaistallennukseen ja julkaisuarkistojen käyttöön. http://www.sherpa.ac.uk/romeo/

SHOK – Strategisen huippuosaamisen keskittymä Strategisen huippuosaamisen keskittymät (SHOK) ovat yritysten, yliopistojen ja tutkimuslaitosten muodostamia yhteistyöliittymiä osaamisen jalostamiseen. Keskittymien käynnistäminen perustuu tiede- ja teknologianeuvoston (nyk. innovaatio- ja tutkimusneuvosto) vuonna 2006 tekemään linjaukseen. SHOK:ien tavoitteena on tarjota huipputason tutkimusyksiköille ja tutkimustuloksia hyödyntäville yrityksille uuden tavan tehdä tiivistä ja pitkäjänteistä yhteistyötä keskenään. Keskittymät ovat sovelluslähtöisiä ja ne tukevat monitieteisyyttä. Teknologian edistämiskeskus Tekes vastaa pääosin SHOK:ien julkisesta rahoituksesta.

Skeema Rakennemalli, jolla kuvataan esimerkiksi dokumentin sisältöä.

Standardisalkku Yhteisesti sovittu valikoima standardeja, esimerkiksi kulttuuriorganisaatioiden järjestelmien välisen yhteistoiminnan edellyttämä, KDK:n kokonaisarkkitehtuuriin kuuluva standardi-kokonaisuus. Se määrittelee erityisesti sovellusten tietosisältöjä sekä sovellusten välisiä rajapintoja. Standardisalkkua ylläpidetään osana KDK-kokonaisarkkitehtuuria.

Sähköinen allekirjoitus Digitaalisessa muodossa oleva tieto, joka on liitetty tai joka loogisesti liittyy muuhun digitaaliseen tietoon ja jota käytetään allekirjoittajan henkilöllisyyden todentamisen välineenä (Laki sähköisistä allekirjoituksista 14/2003).

Talkoistaminen (Crowdsourcing) Käyttäjien tai muun laajemman joukon tai yleisön ottaminen mukaan aineiston jalostamiseen tai tuottamiseen. Tämä voi tapahtua verkon kautta tai muuten. Myös muodossa joukkoistaminen. Kohdennetulle asiantuntijaryhmälle suunnattu "niche sourcing" on samankaltainen, usein vapaaehtoiselle työlle perustuva toimintamalli.

Tarkistussumma (Check sum) Informaatiosta (merkkijonosta tai tiedostosta) soveltuvaa matemaattista algoritmia käyttäen laskettu lukuarvo tai merkkijono, jonka avulla voidaan tunnistaa informaatiossa syystä tai toisesta tapahtuneet muutokset. Jos yksikin bitti muuttuu, informaatiosta uudelleen laskettu lukuarvo ei täsmää aiemmin lasketun ja tallennetun lukuarvon kanssa. Tarkistussumman laskemiseen voidaan käyttää esimerkiksi MD5-algoritmia.

Tekijänoikeus Tutkimusjulkaisut ovat yleensä tekijänoikeuksien suojaamia, kun ne ylittävät teoskynnyksen. Aineistojen avoin käyttö voidaan kuitenkin mahdollistaa sopimuksin. ATT-hanke suosittelee CC0:n, CC 4.0 BY:n tai tarvittaessa muiden yleisesti tunnettujen sopimuslisenssien käyttöä.

Temaattinen keskittymä Tiettyyn tutkimukselliseen asiakokonaisuuteen keskittyvä toiminta.

Tiedonhallinta Tiedon keruu, organisointi ja tallentaminen siten, että se on helposti löydettävissä ja käytettävissä.

Tiedonkeruu Tässä yhteydessä tarkoitetaan useimmiten opetus- ja kulttuuriministeriön vuosittaista tiedonkeruuta yliopistojen toiminnasta (KOTA). Tuloksia voi tarkastella esim http://vipunen.fi/fi-fi tai julkaisutietoportaalista Juuli http://www.juuli.fi/ . Tietoja käytetään yliopistojen rahoitusneuvotteluissa.

Tiedonlouhinta (Data mining) Tiedonlouhinta tarkoittaa joukkoa menetelmiä, joilla pyritään oleellisen informaation löytämiseen suurista tietomassoista. Tiedonlouhintaa voidaan soveltaa hyvin laaja-alaisesti, sillä lähtökohdaksi tarvitaan ainoastaan raakadataa. Tyypillisesti tiedonlouhinnassa käytetty tietoaineisto on esimerkiksi mittauksia teollisuusprosessista, otteita asiakastietokannasta tai vaikkapa web-palvelimen loki-tiedostoja. Määritelmänä tiedonlouhinta ei rajaa käytettäviä menetelmiä.

Tiedonpoiminta Tiedonpoiminnalla tarkoitetaan prosessia, jolla kerättyä tietoa muutetaan koneluettavaan muotoon.

Tiedostomuoto (File format) Sovittu tapa tallentaa informaatiota digitaaliseen muotoon. Esimerkiksi Portable Document Format (pdf).

Tiekartta Tiekartta perustuu opetus- ja kulttuuriministeriön asettaman poikkihallinnollisen Avoin tiede ja tutkimus – hankkeen (ATT) työhön tiedon saatavuuden ja avoimen tieteen edistämiseksi. Tiekartta on tarkoitettu suomalaisille tutkijoille, tutkimusryhmille, tutkimusorganisaatioille, päättäjille, rahoittajille sekä kansalaisille etenemissuunnitelmaksi avoimen tieteen ja tutkimuksen edellytyksien, sovellusten ja tulosten hyödyntämisen edistämisessä vuosina 2014-2017. Tiekartan painotukset selkeytyvät ja toimenpiteet täsmentyvät hankkeen kuluessa kansallisen ja kansainvälisen tilannekuvan tarkentuessa erilaisten selvitysten kautta. Tiekartan taustatietona ovat aiemmat selvitykset ja julkaisut.

Tieteen neljäs paradigma Dataintensiivinen tutkimus, jonka nykyaikaiset tietokoneet, ohjelmistot ja tutkimusmenetelmät mahdollistavat. Se antaa tutkijoille työkalut tehdä kokeita ja laskuja eri suuruusluokissa, skaaloissa ja määrissä kuin koskaan ennen.

Tietoaineistojen uudelleen hyödyntäminen Uudelleen hyödyntämisellä tarkoitetaan sitä, että yksityiset ihmiset ja oikeushenkilöt voivat kopioida, muokata, julkaista ja levittää tietoaineistoja eri tarkoituksiin. Suurta osaa julkisin varoin kerätystä raakadatasta ja tutkimusaineistoista voidaan hyödyntää ja hyödynnetään niin tutkimuksessa kuin erilaisten arkipäivän tuotteiden ja palvelujen kehittämisessä.

Tietoaineiston hallintasuunnitelma Hallintasuunnitelma ja -mekanismi ohjaavat digitaalisen informaation keruuta, laadunvalvontaa, analysointia, julkaisemista ja varastointia. Suomen akatemian edellyttämässä hallintasuunnitelmassa kerrotaan, miten tutkimuksessa käytettävät aineistot hankitaan, miten aineistoja käytetään ja säilytetään ja miten mahdollistetaan aineistojen käyttö tutkimuksen päätyttyä.

Tietoarkisto (Data Archive, Data Center) Organisaatio tai toiminta jossa ammattimaisesti kerätään, säilytetään, hoivataan ja tehdään saatavaksi tutkimuksen tietoaineistoja.

Tietoinfrastruktuuri Tietoinfrastruktuuri on e-infrastruktuurin osa, joka sisältää kaikki tietoaineistojen tuottamiseen, tallentamiseen, jakamiseen ja hyödyntämiseen tarvittavat yhteentoimivat peruspalvelut ja työkalut.

Tietojärjestelmäarkkitehtuuri Tietojärjestelmän arkkitehtuuri kuvaa kohdealueensa rakenneosat, niiden ulospäin näkyvät ominaisuudet ja niiden väliset yhteydet ja riippuvuudet. Arkkitehtuuri muodostaa rungon järjestelmän suunnittelulle ja toteutukselle sekä ohjaa järjestelmän rakenteen kehittämistä järjestelmän elinkaaren ajan. Se toimii myös keskusteluvälineenä järjestelmän kehittämisen ja ylläpitämisen sidosryhmien (johto, käyttäjät, suunnittelijat) välillä.

Tietojen eheys (Data Integrity) Tietojen eheys tarkoittaa "1. (Tietojen tai tietojärjestelmän) aitous, väärentämättömyys, sisäinen ristiriidattomuus, kattavuus, ajantasaisuus, oikeellisuus ja käyttökelpoisuus. 2. Ominaisuus, että tietoa tai viestiä ei ole valtuudettomasti muutettu, ja että mahdolliset muutokset voidaan todentaa kirjausketjusta." (Valtionhallinnon tietoturvallisuuskäsitteistö 1/2000).

Tietokanta Tietokanta eli tietovarasto on kokoelma tietoja, joilla on yhteys toisiinsa. Tietokantaan voidaan tallentaa eri formaateissa olevaa tietoa, esimerkiksi tekstiä, ääntä ja videokuvaa. Tietokannan rakentaminen perustuu siihen tallennettavan tiedon mallintamiseen ja esittämiseen yleensä jonkin kuvauskielen tai tekniikan avulla. Tietokantoja luokitellaan usein niiden rakentamiseen käytetyn ohjelmointimallin mukaan.

Tietokantaohjelmisto/ympäristö Tietokantaohjelmisto/hallintajärjestelmä on kokoelma varusohjelmistoja, joiden tehtävänä on tukea varsinaista tietokantamoottoria (database engine) mm. optimoimalla kyselyjä käyttäen hyväksi tallennettua hakutilastoa (statistics) ja indeksejä. Tietokannan hallintajärjestelmät sisältävät myös ylläpitoa helpottavia apuohjelmia joiden avulla tietokantamoottorin säilyttämä tieto voidaan varmuuskopioida ja palauttaa sekä viedä ja tuoda muihin järjestelmiin, sekä käyttöliittymän.

Tietopolitiikka Tietopolitiikalla tarkoitetaan tässä yhteydessä kansallisen tason koordinoitua politiikkasuunnitelmaa ja - ohjelmaa, joka ohjaa toiminnan ja käytäntöjen kehittymistä eri hallinnonaloilla, ja joka sisältää eri toimijoiden roolien ja työnjaon määrittelyn sekä suunnitelmat niin immateriaalioikeuksien hallintaan, tietosuojakysymyksiin, hinnoitteluun kuin saatavuuden ja käyttöehtojenkin määrittelyyn.

Tietosuoja Ihmisten yksityisyyden suojeleminen. Sillä tarkoitetaan yksilöä koskevien tietojen suojaamista oikeudettomalta käytöltä henkilötietoja käsiteltäessä. Aineistonhallinnassa otetaan huomioon henkilön yksilöivän tiedon käsittely oikeudellisia säännöksiä noudattavin periaattein ja toimintakäytännöin. Lisää tietoa Tietosuojavaltuutetun toimiston "Rekisteritutkimuksen tietosuojaopas tutkijoille ja tietopyyntöjä käsitteleville viranomaisille http://www.tietosuoja.fi/material/attachments/tietosuojavaltuutettu/tietosuojavaltuutetuntoimisto/oppaat/6Jf qBT5i3/Rekisteritutkimuksen_tietosuojaopas_tutkijoille_ja_tietopyyntoja_kasitteleville_viranomaisille.pdf

Tietotilinpäätös Organisaation raportti siitä, millaista tietoa/tietoaineistoja heillä hallinnoidaan, miten niitä jaetaan ja hyödynnetään.

Tietoturva Tietoturvalla tarkoitetaan aineistojen suojaamista tuhoutumiselta, muuttumiselta tai varkaudelta aineiston käsittelyn, säilytyksen ja tiedonsiirron aikana. Tähän liittyy hallinnollisia ja teknisiä toimia, joilla varmistetaan se, että tiedot ovat vain niiden käyttöön oikeutettujen saatavilla, ettei tietoja voida muuttaa muiden kuin siihen oikeutettujen toimesta mutta että tiedot ja tietojärjestelmät ovat niiden käyttöön oikeutettujen hyödynnettävissä. Tietoturvaan liittyviä käsitteitä ovat pääsynvalvonta, salassapito, yksityisyys, todennus, eheys ja turvallisuus.

Tilastolliset tietosuojamenetelmät Yleisnimitys menetelmille, joiden tavoitteena on julkaistaviin tai tutkimuskäyttöön luovutettaviin taulukko- ja yksikköaineistoihin vaikuttavien yksiköiden yksityisyyden suojaaminen.

Tilastotieto/ tilastomuotoinen tieto Tilastointia varten hankittu yksikkötason tieto (esim. henkilötason tai yritystason tieto) tai tehtyyn tilastoon perustuva aggregoitu tieto. Termiä käytettäessä on syytä tarkentaa onko kyse yksikkötason tiedosta vai aggregoidusta tiedosta.

Tilastoviranomaiset Tilastoviranomaisilla on oikeus kerätä tietoja tilastotarkoituksiin tilastolaissa säädetyn tiedonantovelvollisuuden perusteella. Tilastoviranomaisia ovat Maa- ja metsätalousministeriön tietopalvelukeskus Tike, Terveyden ja hyvinvoinnin laitos THL, Tilastokeskus ja Tullihallitus. Tilastoviranomaisten lisäksi valtion tilastotoimeen kuuluu muita valtion virastoja tai laitoksia, tilastoja laativia muita viranomaisia kuten Ilmailuhallinto, Ilmatieteen laitos, MTT, Maanmittauslaitos, Metla, RKTL, SYKE ja TEM.

Tilastoyksikkö Tilastoyksiköllä tarkoitetaan tarkastelun perusyksikköä, eli luonnollista henkilöä, kotitaloutta, talouden toimijaa ja muita yrityksiä, johon tiedot viittaavat.

Tulkintatieto (Representation Information) Osa säilytettävään informaatioon liitettävää metatietoa. Tulkintatiedon muodostaa aineiston luettavuuden mahdollistava tieto, tiedostomuodon kuvaus, semantiikka ja muu tieto, jolla tiedoston bittijonot voidaan muokata ihmisen tai koneen luettavaan ja ymmärrettävään muotoon.

Tunnisteet (Persistent Identifiers) Julkaisujen ja tutkimusdatan tai muiden entiteettien tunnisteita sovelletaan muun muassa näiden aineistojen hakuun, identifiointiin ja linkitykseen. Aineistojen tunnisteet ovat lisäksi pitkäaikaissäilytyksen ehdoton edellytys. Tutkimusjulkaisujen tunnisteena voidaan käyttää julkaisutyypistä riippuen esimerkiksi ISBN:ää (monografiat) tai erilaisia pysyviä tunnisteita (persistent identifiers, PIDs), joista Handle-tunnistetta käytetään julkaisuarkistoissa, DOI:ta kaupallisten kustantajien järjestelmissä ja URN-tunnusta kansalliskirjastojen digitaalisissa kokoelmissa. Tutkimusdatalle sovelletaan kansainvälisissä ja kansallisissa hankkeissa lähes yksinomaan PID-tunnisteita, TTA- ja ATT-hankkeissa URN:ää. Aineistojen lisäksi tarvitaan tunnisteita tutkijoille sekä tutkimusprosessiin osallistuville juridisille henkilöille (yliopistot ja muut korkeakoulut sekä tutkimuslaitokset; tiedekunnat ja niiden laitokset, tutkimusryhmät). Näiden tunnisteiden soveltamista Suomessa selvitetään erikseen.

Yhtenäiset yksilöintikäytännöt ovat erityisen tarpeellisia, kun tietojärjestelmät vaihtavat informaatiota avointen rajapintojen kautta, useiden eri järjestelmien kanssa. Tällöin käytettävät tietosisällöt mm. koodistot ja niiden versiot on tunnistettava eli yksilöitävä. Kansainvälisesti on yksilöity mm. puhelinnumerot, sähköpostiosoitteet, kirjat (ISBN-numero), tuotteet (EAN-koodi). Yksilöinnissä voidaan käyttää ISO OID-yksilöintitunnusta. ISO OID- yksilöintitunnus on kansainvälisesti vain yhteen objektiin liitettävä numeroarvo, joka yksilöi kyseisen objektin yksiselitteisesti ISO:lle varatussa yksilöintijärjestelmässä. Muita yksilöintitunnuksia ovat mm. URI-nimet (Uniform Resource Identifiers) ja UUID (Universal Unique IDentifier).

Yksilöintitunnuksella (object identifier) tarkoitetaan ilmiön, kuten tutkimusjulkaisun, tunnistamista yksikäsitteisellä tunnuksella, jolla se voidaan erottaa muista vastaavista. Yksikäsitteisyys voi olla paikallista, alueellista, kansallista tai kansainvälistä. HTK-ohjeen mukaan: "Tutkijat ottavat muiden tutkijoiden työn ja saavutukset asianmukaisella tavalla huomioon niin, että he kunnioittavat muiden tutkijoiden tekemää työtä ja viittaavat heidän julkaisuihinsa asianmukaisella tavalla ja antavat heidän saavutuksilleen niille kuuluvan arvon ja merkityksen omassa tutkimuksessaan ja sen tuloksia julkaistessaan."

Tunnisteiden ja muiden standardien avulla organisoidaan tietosisällöt kansalliseen ja kansainväliseen käyttöön. Tunnisteet tukevat tiedon globaalia löytyvyyttä ja täsmentävät näin tiedonhakuja. Tunnisteet ovat osa metatietoa ja osa metatietoa hallinnoivia välineitä. Suositeltavia tunnisteita ovat mm. URN, OID, ontologiat, auktoriteettitiedot.

Turmeltuminen (Corruption) Informaation sisällön, eheyden tai käytettävyyden menetys tai muuttuminen. Turmeltumisen voi aiheuttaa esimerkiksi laitevika, ohjelmavirhe, tietojen epäonnistunut migraatio, huolimaton ylläpito tai järjestelmään kohdistunut hyökkäys.

Tutkimusaineisto, tutkimuksen tietoaineisto Tutkimusaineistoilla tarkoitetaan niitä resursseja, joita tutkija tuottaa tai joita hän käyttää tutkimusprosessin aikana. Tutkimuksen tietoaineistolla tarkoitetaan digitaalisessa, analogisessa ja fyysisessä muodossa olevia tieteellisen tutkimuksen perusaineistoja ja niistä jalostettuja aineistoja, joihin tutkimuksen löydökset ja tulokset perustuvat. Tutkimusaineistot voivat olla aineellisia tai aineettomia. Jotta aineisto olisi tutkimukseen kelpaavaa, siihen täytyy liittyä tietoja ainakin sen alkuperästä. Tietoaineistoihin yleensä kuuluvat sekä tutkimuksen tuottamat että tutkimuksen hyödynnettävissä olevat aineistot. Esimerkiksi datan liitteeksi tarvitaan kuvailevaa ja teknistä tietoa siitä mitä informaatiota se sisältää. Siksi tutkimusdataan liittyy paljon tietoa siitä, miten se on rakenteistettu ja koodattu, miten se on syntynyt ja miten sitä on käsitelty. Nämä tiedot on aina syytä tallentaa esimerkiksi metatietoihin, koodikirjoihin ja/tai muuhun dokumentaatioon. Yhdessä datan kanssa tästä kokonaisuudesta muodostuu tutkimusaineisto. On siis huomattava, että kaikki tutkimukselle hyödylliset tietoaineistot eivät välttämättä ole alun perin kerätty tutkimuskäyttöön vaan esimerkiksi hallinnollista seurantaa, valvontaa, raportointia ja tilastointia varten.

Tutkimusinfrastruktuuri Tutkimusinfrastruktuurit ovat tutkimusvälineiden, laitteistojen, aineistojen ja palveluiden varanto, joka mahdollistaa tutkimus- ja kehitystyön innovaatiotoiminnan eri vaiheissa, tukee organisoitunutta tutkimustyötä sekä ylläpitää ja kehittää tutkimuskapasiteettia.

Tutkimusjärjestelmä Suomen tutkimus- ja innovaatiojärjestelmä on kokonaisuus, jonka muodostavat uuden tiedon ja osaamisen tuottajat, niiden hyödyntäjät sekä näiden väliset vuorovaikutussuhteet. Innovaatiojärjestelmän keskeiset osat ovat koulutus, tutkimus ja tuotekehitys sekä näihin nojaava yritystoiminta. Tutkimus- ja innovaatiojärjestelmä nojaa yksityisen ja julkisen sektorin erilaisiin rooleihin ja yhteistyöhön. Yksityinen sektori rahoittaa järjestelmästä noin kaksi kolmasosaa ja julkinen sektori noin kolmanneksen. Uutta tietoa tuottavat erityisesti yliopistot, tutkimuslaitokset ja korkeakoulut mutta myös yritykset ja muut yhteiskunnan ja talouden uudistumiseen tähtäävät laitokset. Yritykset tuottavat pääosin tuotekehitykseen, uusien tuotteiden, palveluiden ja prosessien kehittämiseen liittyvää tietoa. Tietoa hyödyntävät useimmiten yritykset, yhdistykset, yksityiset kansalaiset sekä yhteiskunnan kehittämisestä vastaavat julkiset instituutiot kuten poliittiset päätöksentekijät ja hallinto. Tutkimustiedon merkitys yhteiskunnan ja talouden kehittämisessä on jatkuvasti kasvanut, mikä lisää hyvän yhteistyön ja verkottumisen merkitystä sektoreiden sisällä ja yksityisen sekä julkisen sektorin välillä.

Tutkimusjärjestelmän organisaatioita ja rakenteita ovat muun muassa:

  • Korkeakoulut. Yliopistojen tehtäviin kuuluu tieteellinen- ja taiteellinen sivistys, tutkimus ja siihen perustuva ylin opetus mukaan lukien tutkijankoulutus. Ammattikorkeakoulujen tehtävänä on harjoittaa työelämää ja aluekehitystä tukevaa ja alueen elinkeinorakenteen huomioon ottavaa soveltavaa tutkimus- ja kehitystyötä.
  • Valtion tutkimuslaitokset ja muut tutkimuslaitokset. Eri hallinnonalojen tutkimuslaitoksilla ja muilla tutkimuslaitoksilla on korkeakoulusektorin tutkimusyksiköiden ohella merkittävä asemansa innovaatiojärjestelmässä tieteelliseen tietoon perustuvan yhteiskunnan kehittäjinä.
  • Ohjelmatoiminta. Suomen Akatemia ja Tekes pyrkivät tutkimusohjelmatoiminnallaan panostamaan tulevaisuuden kannalta keskeisiin aloihin.
  • Huippuyksiköt. Oman tieteenalansa kansainvälisessä kärjessä olevat yksiköt uudistavat tutkimusta, kehittävät luovia tutkimusympäristöjä ja kouluttavat uusia tutkijoita.
  • Tutkimusyhteisöt. Strategisen huippuosaamisen keskittymissä (SHOK) toteutetaan yritysten, yliopistojen ja tutkimuslaitosten yhdessä määrittelemää tutkimusstrategiaa.
  • Yritysmaailma. Pörssiyhtiöt käyttivät liikevaihdostaan noin kaksi prosenttia tutkimus- ja tuotekehitykseen vuonna 2010.
  • Kansainvälinen yhteistyö. Suomi on mukana keskeisissä kansainvälisissä tutkimusyhteistyöelimissä ja organisaatioissa sekä osallistuu aktiivisesti eurooppalaiseen tutkimusyhteistyöhön. Kansainvälisen yhteistyön avulla vahvistetaan suomalaisen tutkimuksen laatua ja vaikuttavuutta.

Tutkimustietojärjestelmä Tietojärjestelmä, johon organisaatiossa kerätään tietoja tutkijoiden toiminnasta. Joissain tapauksissa yhdistetty julkaisuarkistoon, jotta julkaisujen kuvalieminen ja tallentaminen on käyttäjälle helpompaa.

Tutkimustulosten avoimuus ja luottamuksellisuus Luottamuksellisuus on "1. Tietojen säilyminen luottamuksellisina ja tietoihin, tietojenkäsittelyyn ja tietoliikenteeseen kohdistuvien oikeuksien säilyminen vaarantumiselta ja loukkaukselta. 2. Se missä määrin luottamuksellisuutta pidetään tärkeänä." (Valtionhallinnon tietoturvallisuuskäsitteistö 1/2000).

Työpaperi (Working paper) Työpaperin tavoite on tuoda tutkimuksen alustavat tulokset tutkimusyhteisön arvioitavaksi. Tulokset julkaistaan yleensä muussa julkaisukanavassa myöhemmin. Julkaisukäytännöt vaihtelevat tieteenaloittain, ja joillakin aloilla työpapereita pidetään tärkeinä julkaisukanavina.

Työvuo (Workflow) Työvuo eli työnkulku on tutkimusprosessin automaatio, jonka aikana dokumentteja, tietoa ja tehtäviä siirretään suoritettaviksi proseduraalisten sääntöjen mukaisesti.

Uutuusvahti (Alert) Ohjelmiston komponentti, joka toistaa ennalta määritellyn haun halutuin väliajoin halutuista tietokannoista, ja ilmoittaa uutuuksista haluttaessa sähköpostilla tai jollain muulla sopivalla teknisellä ratkaisulla.

Valtion tilastotoimi Tilastoviranomaiset ja muut tilastoja tuottavat viranomaiset. Nämä vastaavat mm. Suomen virallisen tilaston ja Euroopan tilastojärjestelmään kuuluvien tilastojen (ESS) tuotannosta. Valtion tilastotoimen tehtävänä on palvella yhteiskunnan yleistä tietotarvetta tuottamalla yhteiskuntaoloja ja niiden kehitystä kuvaavia tilastotietoja yhteiseen käyttöön. Tilastotoimen yleisenä perustana on tilastolaki.

Valtion tutkimuslaitokset Valtion omistamat tuottavat tietoa pääasiassa oman aihealueensa tilasta ja kehityksestä. Ne myös ylläpitävät oman hallinnonalansa seurantatietoa sisältäviä tietojärjestelmiä. Voidaan käyttää myös termejä tutkimusviranomaiset, tutkimusta harjoittavat viranomaiset tai valtion tutkimustoimintaa harjoittavat organisaatiot.

Verkkopalvelu Internet-verkkoon liitetyn tietojärjestelmän antama palvelu, myös Internetissä oleva multimedia- tai sisältökokonaisuus.

Vertaisarviointi (Peer Review) Vertaisarviointi eli referee-käytäntö on alun perin tieteellisen julkaisemisen tapa, jossa lehteen tai julkaisuun lähetetyt artikkelit arvioi sekä julkaisusarjan toimitus että sen valitsemat ulkopuoliset asiantuntijat. Vertaisarvioinnissa tarkistetaan julkaistavaksi tarjotun artikkelin asiasisällön ja tieteellisen merkittävyyden lisäksi myös sen kieliasu sekä varmistetaan, että tekstin rakenne vastaa tieteellisen kirjoittamisen käytäntöjä (esimerkiksi tekstin tiiviys, kuvien ja taulukoiden selkeys sekä lähdeviitteiden käyttö) ja että se sopii kyseiseen julkaisukontekstiin.

Viitetietue (Reference Information) Osa säilytettävään informaatioon liitettävää metatietoa. Se on aineiston pysyvä tunniste, bibliografinen tieto tai muu vastaava tieto. 

Vihreä OA (Green OA) Julkaisun tai sen osan rinnakkaiskopion tallentaminen tieteenala- tai organisaatiokohtaiseen julkaisuarkistoon, jossa se on vapaasti saatavilla joko heti tai ennalta määrätyn embargoajan jälkeen.

Viides vapaus Tutkijoiden, tiedon ja teknologian vapaa liikkuvuus, joka tarvitsee tuekseen avoimen tieteen ja sitä tukevan e- infrastruktuurin.

Viittaaminen (Citation) Viite on tietolähteeseen viittaava merkintä, joka voidaan sijoittaa juoksevaan tekstiin tekstiviitteeksi, sivun alareunaan alaviitteeksi, julkaisun tai sen osan loppuun loppuviitteeksi tai lähdeviitteeksi esimerkiksi lähdeluetteloon. Sähköisessä maailmassa sen tulisi myös sisältää pysyvä tunniste viittauksena lähteeseen.

Viranomaisaineisto Viranomaisaineisto voi olla paperinen tai sähköinen teksti, kuvat, ratkaisu, valmisteluasiakirja, viranomaiselle toimitetut tai toiminnan yhteydessä laaditut asiakirjat, rekisterit ja rekisteritiedot. Aineistot tulevat julkisiksi asian käsittelyn päätyttyä tai selvityksen valmistuttua käyttötarkoitukseensa muutoin keskeneräisessä asiassa.

Visualisointi Tietoaineiston havainnollistaminen graafisesti.

XML (Extensible Markup Language)n Laite- ja ohjelmistoriippumaton avoin standardi, joka tarjoaa syntaksin dokumenttien osien määrittelylle sekä standardoidun tavan kuvata osien välisiä suhteita. Sitä voidaan soveltaa sekä dokumentti- että tietoaineistomuotoisen tiedon tallentamisessa.

XML –skeema (XML Schema) W3C:n standardoima teknologia, jolla voidaan kuvata XML-dokumenttien rakenne. Skeemoilla voidaan kuvata esimerkiksi XML-muotoisen levytiedon tai vaikkapa myynti-ilmoituksen sallittu rakenne. Hyvä syy tällaisen kuvailun tekemiseen on yhteisen sanaston rakentaminen. XML-skeema on kuin standardoitu tapa puhua XML:stä.

Yhteentoimivuus Toiminnan eri tasojen ja toimijoiden sisäinen sekä niiden välinen saumaton toiminta. Toiminnan tasoja ovat muun muassa strategiat, palvelut, prosessit, organisaatiot, tiedot, määritelmät, termistö ja teknologia. Yhteentoimivuuden parantamiseksi julkisessa hallinnossa on ryhdytty hyödyntämään kokonaisarkkitehtuurisuunnittelua.