Esipuhe

Tietokomponentit ovat semanttisia tietokokonaisuuksia, joita käytetään asiakirjallisen sisällön rakenteistamisessa. Sosiaalihuollon asiakastietomallissa tietokomponentit edustavat reaalimaailman ilmiöitä, jotka esiintyvät sosiaalihuollon asiakasasiakirjoissa. Tietokomponenttien mallintamisen perustavoitteena on varmistaa, että samantyyppiset tiedot tallennetaan asiakirjoihin yhtenäisellä tavalla. Toisena perusajatuksena on uudelleenkäytettävyys: tietokomponentin rakenne määritellään kerran, minkä jälkeen sitä hyödynnetään useassa eri asiakirjassa. Joitakin tietokomponentteja käytetään jopa kaikissa sosiaalihuollon asiakirjoissa. Tietokomponentit muodostavat tärkeän osan sosiaalihuollon tietoarkkitehtuuria ja toimivat semanttisen yhteentoimivuuden perustana.

Jokaisella tietokomponentilla on objektiluokka sekä joukko tietokenttiä (objektiluokan ominaisuuksia). Sekä tietokomponentilla että sen kentillä pitää olla selkeästi määritelty käyttötarkoitus ja semanttinen merkitys. Tietokomponenttien mallinnustyöllä on käsityksemme mukaan selkeä yhteys terminologiseen sanastotyöhön. Kummassakin työssä pyritään analysoimaan käsitteitä ja niiden välisiä suhteita sekä määrittelemään käsitteet niin, että niiden merkitykset pysyvät selkeästi erillään toisistaan.

Tietokomponentteihin liittyvässä sanastotyössä on joitakin ominaispiirteitä, joilla se eroaa tavallisesta terminologisesta sanastotyöstä. Tietokomponentin luokan määritelmän suunnittelussa pitää huomioida kyseisen tietokomponentin kenttien sisällöt. Tämä pätee myös toisin päin: kentän määritelmässä tietokomponentti toimii kontekstina, joka vaikuttaa määritelmään. Näin ollen kenttien määritelmät ovat useimmiten kontekstisidonnaisia. Kentän määritelmässä tai huomautustekstissä voi olla myös viittauksia muihin tietokomponentin kenttiin. Aina tietokomponentilla tai sen määritelmällä ei ole tarkoitus kuvata kokonaan kyseessä olevaa reaalimaailman ilmiötä, esimerkiksi lapsen syntymää, vaan tiettyjä asiakirjassa tarvittavia ilmiöön liittyviä tietoja, kuten lapsen syntymäpaikkaa.

Tietokomponentteihin liittyvää perusteellista terminologista sanastotyötä ei tietojemme mukaan ole tehty aikaisemmin Suomessa tai ulkomailla. Vaikka kattavia tietokomponenttikirjastoja on kehitetty mm. YK:ssa (UN/CEFACT CCL), Yhdysvalloissa (NIEM) ja Tanskassa (OIO XML), tietorakenteet on yleensä varustettu vain kuvauksilla, ei terminologisilla määritelmillä. Tietokomponenttien mallinnustyössä tarvitaan kuitenkin sisällön, tietämyksen hallinnan ja tietojenkäsittelyn osaamisen lisäksi terminologista sanastotyötä.

Sosiaalialan tietoteknologiahanke (Tikesos) ja Sanastokeskus TSK toteuttivat vuosina 2010–2011 yhdessä sosiaalihuollon tietokomponentteihin liittyvän sanastoprojektin. Tikesos-hankkeen päätyttyä sosiaalihuollon tiedonhallinnan ja tietoteknologian kehittäminen siirtyi Terveyden ja hyvinvoinnin vastuulle, ja sanastoa täydennettiin ja päivitettiin Terveyden ja hyvinvoinnin laitoksen toimeksiannosta vuosina 2012–2013 ja 2014–2015. Vuosina 2014–2015 sanaston täydennys- ja päivitystyö liittyi sosiaalialan tiedonhallintaa varten eri aikona laadittujen sanastojen käsitteiden harmonisointiin. Kyseisen työn tuloksena keväällä 2015 julkaistaan Sosiaalialan tiedonhallinnan sanasto, jota myös tietokomponenttien käyttäjien kannattaa hyödyntää.

Tässä sanastossa selvitetään tietokomponenttien sisällöt määritelmien ja niitä täydentävien huomautusten avulla sekä annetaan suositukset suomenkielisistä termeistä. Osaa käsitteiden välisistä suhteista havainnollistetaan käsitekaavioiden avulla. Sanasto sisältää termitietueina tiedot sosiaalihuollon asiakastietomallin tietokomponenteista. Sanastossa on yleisiä tietokomponentteihin liittyviä käsitteitä, tietokomponenttien luokkia ja joidenkin tietokomponenttien kenttiä eli yhteensä 252 termitietuetta. Sanastotyössä on keskitytty laatimaan määritelmiä tietokomponenttien luokille. Ensimmäisessä sanastoprojektissa määriteltiin myös joitain kenttiä.

Sosiaalihuollon tietokomponenttien sanastoa laadittaessa lähteinä on käytetty muun muassa Suomen lainsäädäntöä, Tikesos-hankkeen palvelukohtaisia tietomäärityksiä1, JHS-suosituksia ja useita sanastoja, kuten Kelan terminologista sanastoa2, Sosiaalialan sanastoa asiakastietojärjestelmää varten3 ja Sosiaalipalvelujen luokituksen sanastoa ja Sosiaalihuollon asiakasasiakirjasanastoa4

  1. Palvelukohtaiset tietomääritykset. http://www.sosiaaliportti.fi/fi-FI/tikesos/aineistot/maaritykset/sisaltomaaritykset/
  2. Kelan terminologinen sanasto – Terveyteen liittyvät käsitteet. TSK 41. Kansaneläkelaitos (Kela) ja Sanastokeskus TSK. 2010.
  3. Lehmuskoski, Antero & Kuusisto-Niemi, Sirpa. Sosiaalialan sanasto asiakastietojärjestelmää varten. Sosiaalialan tietoteknologiahanke. Stakes, Raportteja 30/2008. Helsinki 2008.
  4. Laaksonen, Maarit, Suhonen, Mari & Suhonen Sirpa. Sosiaalipalvelujen luokituksen sanasto ja Sosiaalihuollon asiakasasiakirjasanasto. THL – Raportti 1/2012. Terveyden ja hyvinvoinnin laitos.

Sosiaalihuollon tietokomponenttien sanastoa voidaan hyödyntää sosiaalihuollon ja yleisemminkin julkishallinnon tietoarkkitehtuurityössä. Se palvelee myös tietomääritysten käyttäjiä, esimerkiksi tietojärjestelmätoimittajia sekä asiakirjarakenteiden suunnittelijoita.

Sosiaalihuollon tietomäärityksiä voi tarkastella voi tarkastella sosiaalihuollon tiedonhallinnan verkkosivustolla.

Sosiaalihuollon tietokomponenttien sanastoa laativaan työryhmään ovat osallistuneet:


Tommi Ahonen, tutkimusapulainen, Itä-Suomen yliopisto, Tietojenkäsittelytieteen laitos (2010–2011)
Erja Ailio, projektipäällikkö, Itä-Suomen sosiaalialan osaamiskeskus (2010–2011), erikoisuunnittelija, Terveyden ja hyvinvoinnin laitos (2012–2015)
Konstantin Hyppönen, projektitutkija, Itä-Suomen yliopisto, Tietojenkäsittelytieteen laitos (2010– 2011)
Niina Häkälä, projektitutkija, Itä-Suomen yliopisto, Sosiaali- ja terveysjohtamisen laitos (2010–2011)
Heli Hänninen, projektitutkija, Itä-Suomen yliopisto, Sosiaali- ja terveysjohtamisen laitos (2010–2011)
Mikko Kasanen, harjoittelija, Itä-Suomen yliopisto, Tietojenkäsittelytieteen laitos (2010–2011)
Jarmo Kärki, kehittämispäällikkö, Terveyden ja hyvinvoinnin laitos (2012–2015)
Antero Lehmuskoski, projektipäällikkö, Itä-Suomen sosiaalialan osaamiskeskus (2010–2011)
Jaana Nevalainen, projektitutkija, Itä-Suomen yliopisto, Tietojenkäsittelytieteen laitos (2010–2011)
Tiina Peksiev, projektipäällikkö, Terveyden ja hyvinvoinnin laitos (2014–2015)
Miia Ryhänen, korkeakouluharjoittelija, Terveyden ja hyvinvoinnin laitos (2014)
Mari Suhonen, terminologi, Sanastokeskus TSK (2010–2015)
Sirpa Suhonen, terminologi, Sanastokeskus TSK (2010–2015)
Päivi Tossavainen, projektitutkija, Itä-Suomen yliopisto, Sosiaali- ja terveysjohtamisen laitos (2010–2011)
Anna Väinälä, projektitutkija, Itä-Suomen yliopisto, Sosiaali- ja terveysjohtamisen laitos (2010–2011)

Sanaston laatimiseen tarvittavan terminologisen työn on rahoittanut Tikesos-hankkeen aikana vuosina 2010–2011 sosiaali- ja terveysministeriö ja vuosina 2012–2015 Terveyden ja hyvinvoinnin laitos.

Sanaston rakenne ja merkinnät

Periaatteita

Sanastotyön lähtökohtana on ollut selkeiden ja erottelevien määritelmien ja termien tuottaminen tietokomponenteille. Siksi sanasto on laadittu systemaattisesti, niiden terminologisten periaatteiden ja menetelmien mukaisesti, jotka on määritelty ISO/TC 37:n (International Organization for Standardization/ Technical Committee 37 Terminology and other language and content resources) laatimissa kansainvälisissä standardeissa.

Terminologiselle sanastotyölle on ominaista käsitekeskeisyys. Siinä missä sanakirjat tarkastelevat sanoja ja niiden merkityksiä, terminologisten sanastojen lähtökohtana ovat käsitteet ja niiden väliset suhteet. Terminologisten periaatteiden mukaisesti ajateltuna käsitteet ovat ihmisen mielessään muodostamia ajatusmalleja, jotka vastaavat tiettyjä todellisuuden kohteita, niin sanottuja tarkoitteita. Tarkoitteet voivat olla konkreettisia tai abstrakteja, ja niillä on erilaisia ominaisuuksia. Näistä ominaisuuksista muodostettuja ajatusmalleja kutsutaan käsitepiirteiksi. Käsitteen sisältö muodostuu joukosta erilaisia käsitepiirteitä, joista olennaiset ja erottavat kuvataan määritelmän avulla. Käsitteiden määritelmät pyritään kirjoittamaan sellaiseen muotoon, että niiden avulla voidaan tunnistaa kunkin käsitteen paikka toisiinsa liittyvien käsitteiden muodostamassa käsitejärjestelmässä. Termit puolestaan ovat käsitteiden nimityksiä, joiden avulla voidaan lyhyesti viitata käsitteen koko sisältöön.

Sosiaalihuollon tietokomponenttien sanastossa tietokomponentteja on analysoitu selvittämällä tietokomponenttien luokkien ja kenttien olennaiset sisällöt, tietokomponenttien välisiä suhteita ja näiden suhteiden perusteella muodostuvia käsitejärjestelmiä. Analyysin tuloksia on hyödynnetty määritelmien laadinnassa ja tietokomponenttien niminä käytettävien termien valinnassa. Joistain tietokomponenttikokonaisuuksista on myös piirretty graafisia käsitejärjestelmäkaavioita.

Sosiaalihuollon tietokomponenttien sanastossa tietokomponentteja on analysoitu selvittämällä tietokomponenttien luokkien ja kenttien olennaiset sisällöt, tietokomponenttien välisiä suhteita ja näiden suhteiden perusteella muodostuvia käsitejärjestelmiä. Analyysin tuloksia on hyödynnetty määritelmien laadinnassa ja tietokomponenttien niminä käytettävien termien valinnassa. Joistain tietokomponenttikokonaisuuksista on myös piirretty graafisia käsitejärjestelmäkaavioita.

Sosiaalihuollon tietokomponenttien sanastossa lähtökohtana olleet tietokomponentit eivät aina täysin vastaa reaalimaailman käsitteitä. Esimerkiksi osoite-tietokomponentilla kuvataan muutakin kuin vain yleisessä kielenkäytössä ymmärrettyyn osoite-käsitteeseen sisältyvää tietoa. Osoite-tietokomponentti sisältää muun muassa tietoa osoitteen voimassaolosta sekä tarkenteen, jolla voidaan antaa muihin osoitetietoihin liittyviä ohjeita, kuten rakennuksen sisäänkäynnin sijainti. Sen vuoksi tietokomponenttiluokka osoite on määritelty sijaintipaikan osoittavien tai muiden sijaintipaikkaan liittyvien tietojen kokonaisuudeksi.

Monessa tietokomponentissa esiintyy samankaltaisia kenttiä, kuten nimi. Jotta tällaisten eri tietokomponenteissa esiintyvien kenttien määritelmistä tulisi mahdollisimman yhdenmukaisia, on sanaston alun yleisissä käsitteissä määritelty joitain kenttinä toistuvia käsitteitä. Esimerkiksi kuvaus-käsite on määritelty yleisesti tietyn asian vapaamuotoiseksi kuvailuksi, mutta tulo-tietokomponentin kuvaus-kentän määritelmää on muokattu kyseisen tietokomponentin kontekstiin sopivammaksi: tulon luonteen vapaamuotoinen kuvailu. Toistuvat termit on sanastossa numeroitu, esimerkiksi kuvaus (1) ja kuvaus (2).

Sanaston ryhmittely ja termien haku

Sanasto on ryhmitelty kolmeen lukuun: yleisiin käsiteisiin, tietokomponenttien luokkiin ja kenttiin sekä pelkkiin tietokomponenttien luokkiin. Toisen luvun alaluvuissa on ensimmäisenä aina luokka ja sen jälkeen tähän luokkaan kuuluvia kenttiä. Luvuissa toisiinsa liittyvät käsitteet on pyritty sijoittamaan lähekkäin.

Aakkosellinen hakemisto löytyy sanaston lopusta. Hakemistoon on poimittu suositettavien ja hylättävien termien lisäksi muita hakusanoja, jotka liittyvät läheisesti tiettyyn käsitteeseen. Nämä hakusanat viittaavat hakemistossa siihen käsitteeseen, jonka yhteydessä kyseistä termiä käsitellään.

Merkintöjen selitykset – sanasto-osuus

Sanastossa käsitteille annetaan ensin suomenkieliset termit. Näiden jälkeen seuraa määritelmä ja mahdolliset määritelmää täydentävät huomautukset eli lisätiedot. Termitietueet on numeroitu juoksevasti.

Esimerkki lähiosoitetta kuvaavista tiedoista ja niiden selitykset:

30termitietueen numero
lähiosoitesuomenkieliset termit; suositettavin ensimmäisenä, jos termejä on useita
ei: katuosoiteei = termi, jota ei pidä käyttää tässä merkityksessä
osoitteen (1) osa, joka viittaa tiettyyn sijaintiin postitoimipaikan toimialueellamääritelmä; alkaa pienellä kirjaimella, ei pistettä lopussa, kursivointi viittaa sanastossa määriteltyyn käsitteeseen

Rakennuksella voi olla useita lähiosoitteita, kuten kulmatalolla.

Suomalainen lähiosoite koostuu yleensä kadunnimestä, osoitenumerosta, huoneiston tunnisteesta ja mahdollisesti osoitteen tarkenteesta. Tällainen lähiosoite voisi olla esimerkiksi Esimerkkikatu 1 A 2b. Lähiosoite voi viitata myös esimerkiksi haja-asutusalueella olevaan yhteiskäyttöiseen postinjättölaatikkoon. Myös postilokero-osoitetta voidaan käyttää lähiosoitteena.

Lähiosoitteen määritelmä ja esimerkit kuvaavat suomalaista lähiosoitetta, ja ulkomaiset lähiosoitteet saatetaan muodostaa hyvin toisenlaisin perustein.

Tietokomponentin tyyppi: osoite-luokan kenttä

huomautus; lisätietoa käsitteestä, esimerkkejä, tietoa termien käytöstä yms.

Kooste kaikista sanasto-osuudessa käytetyistä merkintätavoista:

lihavointisuomenkielinen suositettava termi; ensimmäisenä suositettavin ja sen jälkeen hyväksyttävät synonyymit
kursivointimääritelmässä tai huomautuksessa viittaa tässä sanastossa määriteltyyn käsitteeseen
(1)homonyymi; sanastossa on useita kirjoitusasultaan samanlaisia termejä, joilla voi olla eri merkitys, esim. nimi (1) ja nimi (2)
*termiehdotus
ei:termi tarkoittaa eri asiaa kuin suositettava termi, eikä sitä pitäisi käyttää tässä merkityksessä, tai se on kielenvastainen

Merkintöjen selitykset – käsitekaaviot

Käsitekaaviot ja sanasto-osuus on tarkoitettu toisiaan tukeviksi esitysmuodoiksi. Kaaviot havainnollistavat käsitteiden välisiä suhteita ja auttavat hahmottamaan kokonaisuuksia.

Sanastossa esiintyy seuraavanlaisia käsitesuhteita ja terminologisten käsitesuhteiden vakiintuneita merkintätapoja (ks. esimerkit seuraavalla sivulla):

Käsitteen merkitseminen kaavioon

Hierarkkinen suhde (puudiagrammi)

Koostumussuhde (kampadiagrammi)

Funktiosuhde (nuoli)

Moniulotteinen käsitejärjestelmä (puudiagrammin lihavoitu viiva)

Katkoviivat kuvaavat käsitesuhteita, jotka ovat käsitteen ymmärtämisen kannalta tärkeitä mutta määrittelyn kannalta epäolennaisia, joten suhteet eivät käy ilmi määritelmistä.