Datasanasto

Dataan ja data-alaan liittyy paljon hankalia käsitteitä.

Olemme pyrkineet oheisessa datasanastossa selittämään data-aiheisia termejä mahdollisimman selkeästi ja ymmärrettävästi. Toivomme, että näin voimme vähentää käsitteiden kryptisyyttä ja tehdä data-alasta helpommin lähestyttävän kaikille siitä kiinnostuneille.

Sanasto päivitetty viimeksi 26.4.2024.

Tämä sanasto pohjautuu Instagramin Viikon termi -postaussarjaamme. Käy seuraamassa tiliämme aioo.digital, niin näet uusia termejä ja muuta hyödyllistä sisältöä viikottain!

Avoin data

Kaikkien saatavilla olevaa ilmaista ja esteetöntä dataa, jota kuka tahansa voi hyödyntää mihin tahansa käyttötarkoitukseen. Dataa koskeva lisenssi määrittelee, millä tavoin dataa voidaan käyttää (esim. tuleeko sen lähde mainita).

Avoindata.fi

Digi- ja väestötietoviraston ylläpitämä palvelu, joka kokoaa Suomen avoimen datan yhteen paikkaan, josta sitä voi hyödyntää omaan käyttöön maksutta. Palvelussa voi myös julkaista dataa itse.

CSRD

EU-direktiivi, joka velvoittaa yritykset raportoimaan vastuullisuudestaan. Koskee aluksi osaa yrityksistä, mutta soveltamisala laajenee asteittain, kunnes se kattaa laajemman joukon yrityksiä.

Data-arkeologia

Käsite viittaa tiedon tutkimiseen ja palauttamiseen vanhoista ja usein vanhentuneista lähteistä ja järjestelmistä. Data-arkeologia käsittelee tietoa, joka voi olla vaikeasti ymmärrettävää, vanhentunutta (teknologia tai formaatti), tai se voi olla tietoa, johon ei löydy kuvausta.

Datajournalismi

Journalistinen lähestymistapa, jossa käytetään laajoja tietoaineistoja uutisten ja artikkelien luomiseen. Tämä sisältää tietojen keräämisen, analysoinnin ja visualisoinnin eri lähteistä, kuten avoimesta datasta, viranomaistiedoista tai muista hankituista tiedoista.

Datakatalogi

Datakatalogi on luettelo organisaation käytössä olevasta datasta sisältäen rakenne- ja metatiedot. Varsinaista dataa ei julkaista datakatalogin kautta.

Data citizen

Organisaation aktiivinen toimija, jolla on avoin pääsy dataan, ja joka pystyy hyödyntämään dataa esimerkiksi tuottamalla sen pohjalta yksinkertaista analyysia.

Datamaturiteetti

Datamaturiteetti vittaa organisaation kyvykkyyteen hyödyntää dataa tehokkaasti ja strategisesti. Arviointikriteeristöjen (joita on avoimesti saatavilla) avulla saadaan selville nykytila ja suurimmat kehityskohteet.

Datan monetisointi

Prosessi, jossa kerättyä dataa hyödynnetään siten, että siitä muodostuu taloudellista arvoa. Organisaatio tai yksilö muuntaa datan taloudelliseksi hyödyksi myymällä, lisensoimalla tai muulla tavoin hyödyntämällä tätä tietoa.

Datan visualisointi

Datan esittämistä graafisessa muodossa. Helpottaa suurten datamäärien ymmärtämistä.

Tuttuja esimerkkejä datan visuaalisista esitystavoista ovat esimerkiksi pylväskaaviot ja kartat.

Datanlukutaito

Kyky lukea, ymmärtää ja analysoida dataa. Ymmärrystä siitä, mitä data kuvaa ja mitä se meille kertoo.

Dataputki

Dataputki on hallittu toimintokokonaisuus, joka voidaan toteuttaa eri tavoin. Se sisältää muun muassa datan siirtämisen, muokkaamisen ja lataamisen.

Datastrategia

Datastrategia on organisaation suunnitelma siitä, miten dataa tulee säilöä, hallinnoida ja hyödyntää, jotta yritys pääsee tavoitteisiinsa.

Datasäädös (Data Act)

Euroopan unionin datastrategian osa, joka pyrkii varmistamaan datan arvon jakautumisen eri toimijoiden välillä, markkinoiden kilpailukykyisyyden, avoimet mahdollisuudet datavetoiselle innovoinnille ja dataan pääsyn helpottamisen.

Datatalous

Datan hyödyntämiseen perustuva tietotalouden haara. Datataloudessa dataa hyödynnetään palvelujen, tuotteiden ja liiketoimintojen kehittämisessä. Datatalous on syntynyt, kun datan laajamittainen kerääminen, säilyttäminen ja siirtäminen on tullut teknisesti ja taloudellisesti mahdolliseksi.

ERP (Enterprise Resource Planning)

ERP eli toiminnanohjausjärjestelmä on yrityksen tietojärjestelmä, joka mahdollistaa eri toimintojen, kuten tuotannon, jakelun, laskutuksen, varastonhallinnan ja kirjanpidon yhtenäisen hallinnan ja automaation.

ESG (Environmental, Social, Governance)

Kestävän kehityksen ja vastuullisuuden käsite. Koostuu kolmesta osa-alueesta: ympäristöstä, sosiaalisesta vastuullisuudesta ja hyvästä hallintotavasta. ESG-kriteerit toimivat arviointikehyksenä yrityksen vastuullisuuden arvioimiseksi.

FAIR-data

FAIR-datalla viitataan periaatteisiin, jotka koskevat datan hallintaa ja jakamista. Lyhenne tulee sanoista: Findable - löydettävyys, Accessible -saavutettavuus, Interoperable - yhteensopivuus ja Reusable - uudelleenkäytettävyys.

GDPR (General Data Protection Regulation)

EU:n jäsenmaita sitova yhtenäinen tietosuojaa koskeva lainsäädäntö. GDPR:ssä on säädelty kuinka henkilötietoja voidaan käyttää, käsitellä ja säilyttää.

Henkilötieto

Henkilötieto on tieto, joka liittyy tunnistettuun tai tunnistettavissa olevaan luonnolliseen henkilöön. Esimerkkejä henkilötiedoista ovat nimi, syntymäaika, osoite, puhelinnumero, henkilötunnus sekä biometriset- ja terveystiedot.

Infografiikka

Tietoa selkeästi esittävä visuaalinen esitys, joka yhdistää erilaisia graafisia elementtejä, kuten kaavioita, kuvia ja tekstiä informoidakseen, viihdyttääkseen ja/tai vakuuttaakseen. Käytetään esim. markkinoinnissa, opetuksessa ja uutisoinnissa. Eroaa datan visualisoinnista monipuolisemman tavoitteen ja sisällön vuoksi.

Kansallinen palveluväylä

Kansallinen palveluväylä eli Suomi.fi-palveluväylä on tiedonvälityskonsepti, joka helpottaa eri palveluiden tarvitseman tiedon jakamista avoimien rajapintojen kautta. Se parantaa tietojärjestelmien yhteentoimivuutta mahdollistaen tehokkaamman sähköisten palveluiden kehittämisen Suomessa.

Käyttöloki

Käyttöloki on tietojärjestelmän automaattisesti luoma tietue, joka tallentaa tietoja järjestelmän toiminnoista ja tapahtumista, kuten kirjautumisista ja käyttäjän toimista. Käyttölokia käytetään yleisesti seurantaan ja auditointitarkoituksiin.

Low-code-alusta (LCDP)

Low-code eli matalan koodin alusta tarjoaa kehitysympäristön, jota käytetään sovellusohjelmiston luomiseen yleensä graafisen käyttöliittymän avulla. Matalan koodin alusta voi tuottaa täysin toimivia sovelluksia sellaisenaan tai vaatia lisäkoodausta tiettyihin tilanteisiin.

Massadata

Massadatalla tarkoitetaan datakokonaisuksia, joiden käsittelyyn tarvitaan hajautettuja järjestelmiä datan suuruuden ja monimutkaisuuden takia.

Metadata

Metadata tarkoittaa tietoa tiedon ominaisuuksista ja kontekstista (esim. tiedon alkuperä, formaatti, luontiaika jne.). Se auttaa ymmärtämään, järjestämään ja hallitsemaan tietoa.

No-code-alusta (NCDPs)

Teknologinen alusta, joka mahdollistaa sovellusten tai digitaalisten ratkaisujen rakentamisen ilman koodia. Siinä käytetään visuaalisia työkaluja, lohkoja tai valmiita komponentteja, joiden avulla käyttäjät voivat luoda monimutkaisiakin sovelluksia ilman ohjelmointiosaamista.

Olennaisuusanalyysi

Raportointia edeltävä vaihe, jossa tunnistetaan ne tekijät, jotka ovat merkittäviä yrityksen toiminnalle ja sidosryhmille. Tavoitteena on kartoittaa ne tekijät, joilla on suurin vaikutus yrityksen liiketoimintaan sekä sen sosiaaliseen vastuuseen ja ympäristövastuuseen.

Promptaus / promptaaminen

Promptauksella tarkoitetaan komentojen antamista tekoälylle. Kun pyydät esimerkiksi ChatGPT:tä suorittamaan jonkin tehtävän tai kysyt siltä kysymyksen, kirjoitat promptin. Erilaiset promptit vaikuttavat siihen kuinka hyvin tekoäly suoriutuu tehtävästä.

RAWGraphs

Ilmainen avoimen lähdekoodin ohjelma, jolla tehdään datan visualisointeja. Ohjelma soveltuu hyvin staattisen datan visualisointiin, kun tarkoituksena on tehdä kuvitus esimerkiksi PowerPointiin tai PDF:ään.

Rekisterinpitäjä

Rekisterinpitäjä on se taho (ihminen tai organisaatio), joka vastaa henkilötietojen käsittelystä. Rekisterinpitäjä määrittelee tietojen käsittelyn tarkoitukset ja keinot. Laki asettaa rekisterinpitäjälle tietyt velvollisuudet ja vastuut.

Rekisteröity

Rekisteröidyllä viitataan henkilöön, jonka henkilötietoja kerätään, säilytetään tai käsitellään. Tällaisia tietoja ovat esimerkiksi nimi, syntymäaika, henkilötunnus tai osoite. Rekisteröidyllä on usein erilaisia oikeuksia, kuten oikeus saada tietoa tietojensa käsittelystä tai oikeus pyytää tietojensa poistamista (tulla unohdetuksi).

SaaS

SaaS eli Software as a Service on pilvipalveluiden toimitusmalli. SaaS-palvelussa ohjelmisto tarjotaan verkon kautta palveluna, eikä sitä asenneta asiakkaan omalle laitteistolle. SaaS perustuu usein kuukausi- tai vuosimaksuun.

Selittävä tekoäly (XAI)

Pyrkii avaamaan tekoälyn tekemiä päätöksiä ja sitä, kuinka niihin on päädytty. XAI selittää, miten koneoppimismallit tuottavat tuloksensa.

Sensoridata

Sensoridata on tietoa, joka on peräisin antureista tai sensoreista. Nämä laitteet keräävät mittauksia fyysisestä ympäristöstä (esim. lämpötila, kosteus, valoisuus tai liike) ja tuottavat numeerista tietoa, jota voidaan hyödyntää erilaisissa sovelluksissa.

Sovellusloki

Sovellusloki on tietojärjestelmän tai sovelluksen tuottama tietue, joka sisältää tietoa sovelluksen toiminnasta ja tapahtumista. Sovellusloki tallentaa yleensä erilaisia tapahtumia, ja sitä käytetään laajasti vianetsintään, suorituskyvyn seurantaan, turvallisuuden valvontaan ja auditointitarkoituksiin.

SQL

SQL (Structured Query Language) on perustyökalu muun muassa tiedon hakemiseen ja muokkaamiseen eri alustoilta.

Tekninen velka

It-alan käsite, joka kuvaa kompromisseja ja haasteita, joita syntyy, kun kehitystyötä tehdään nopeasti tuotantoon saamisen paineissa. Se voi muodostua myös myöhemmin esim. ylläpidon laiminlyönnin myötä. Tekninen velka on kuin “laina”, jonka kehittäjät ottavat, ja joka maksetaan takaisin tulevaisuudessa.

Tiedon anonymisointi

Anonymisointi tarkoittaa tietojen käsittelyä siten, että henkilöä ei voida enää tunnistaa niistä. Tietoja voidaan joko poistaa tai muokata siten, että anonymisoitua dataa ei ole mahdollista yhdistää tiettyyn henkilöön.

Tiedonhallintamalli

Tiedonhallintamalli on kuvaus toteutettavasta tiedonhallinnasta. Koskee viranomaisia ja julkista hallintotehtävää hoitavia. Pohjautuu tiedonhallintalakiin, jossa säädetän, miten tietoja käsitellään ja kuvataan.

Tiedon pseudonymisointi

Pseudonymisoinnilla tarkoitetaan henkilötietojen käsittelyä niin, että tietoja ei voida enää yhdistää tiettyyn henkilöön ilman esim. koodiavainta. Koska henkilö on lopulta mahdollista tunnistaa, pseudonymisoituun tietoon sovelletaan tietosuoja-asetusta.

Tiedon mallinnus

Tiedon mallinnus viittaa prosessiin, jonka tavoitteena on suunnitella tietomalli.

Tietomallissa esitetään data ja sen väliset riippuvuudet.

Tietokanta

Tietokanta on kokoelma syötettyä dataa, josta voi tehdä hakuja. Tietokantoja on eri muotoisia, joista yksi yleisesti käytössä oleva malli on relaatiotietokanta. Tietokantojen hallintaan ja hakujen suorittamiseen käytetään esimerkiksi SQL-kieltä.

Tietosuoja & tietoturva

Tietosuoja on perusoikeus, jok on osa yksityisyyden suojaa. Tietosuoja ohjaa henkilötietojen käsittelyä organisaatioissa. Tietoturva taas on joukko toimenpiteitä, joilla tietosuojaa toteutetaan.

Transaktiodata

Tietoa, joka liittyy tietyn tapahtuman tai prosessin suorittamiseen. Transaktiodata sisältää tietoa esimerkiksi tapahtuman ajankohdasta, osapuolista, suoritetuista toiminnoista sekä mahdollisista muutoksista, jotka tapahtuvat tietokannassa tai järjestelmässä.

Tunnetekoäly

Tekoälyn osa-alue, joka keskittyy ihmisten tunnetilojen analysointiin, tulkintaan ja simuloimiseen. Tunnetekoäly hyödyntää erilaisia teknologioita, kuten puheentunnistusta, kasvojen ilmeiden analyysiä ja biometristä dataa, jotta se voi havainnoida ja reagoida tunteisiin monipuolisesti.

Varmenne

Varmenne on digitaalinen todistus, joka varmistaa henkilöllisyyden sähköisessä viestinnässä ja tiedonsiirrossa. Se perustuu digitaaliseen allekirjoitukseen ja takaa tiedon salaamisen, viestinnän aitouden ja tietoturvan verkossa.

Vastuullisuusraportti

Dokumentti, joka kuvaa yrityksen toiminnan sosiaalisia, ympäristöllisiä ja hallinnollisia vaikutuksia. Sisältää tietoa yrityksen vastuullisustyöstä, kuten ympäristövaikutuksista, sosiaalisista vaikutuksista, ihmisoikeuksien kunnioittamisesta, työntekijöiden hyvinvoinnista ja hallintotavasta.