r e l i a b i l i t e e t t i ja v a l i d i t e e t t i
r e l i a b i l i t e e t t i
(engl. reliability; < lat. religare sitoa kiinni + habilis sopiva), luotettavuus, psykometriikassa menetelmän tai mittausinstrumentin, tavallisimmin psykologisen testin tai asteikon, riippumattomuus sattumanvaraisuuksista; ts. metodin kyky antaa tois-tettaessa ei-sattumanvaraisia tuloksia suhteellisen vakioisena (konstanttina) pysyvästä mittauskohteesta suhteellisen samantyyppisissä oloissa, joissa olojen erilaisuuden ei katsota olevan relevantti tekijä reliabiliteetin kannalta. Tämä merkitsee mm. sitä, että esimerkiksi kylpyhuonevaaka antaa esimerkiksi 100 kiloa painavasta henkilöstä saman lukeman, vaikkapa noin 90 kiloa myös olohuoneessa kuin myös ulkona ja ylipäätään tasaisessa maastossa mutta ei välttämättä veden alla tai vinolla pinnalla. (Esimerkissä vaaka on ”reliaabeli” siinä mielessä, että se antaa toistettaessa saman tuloksen mutta epä-reliaabeli 10 kilon konstantin virheen vuoksi väärän kalibroinnin pohjalta.) Tai testin tulisi antaa henkilöstä ekstravertti tulos niin tänään kuin ensi viikollakin, koska oletus on, että ekstraversio persoonallisuuden piirteenä on tuntuvan pysyvä. Reliabiliteetin heikkoutta ei kuitenkaan merkitse erilainen tulos tyystin poikkeavissa oloissa, esimerkiksi eräretkellä teltassa. – Reliabiliteetissa on erilaisia aspekteja, ja usein erotetaan kaksi osatekijää, stabiliteetti (pysyvyys) ja konsistenssi (yhtenäisyys).
Stabiliteetin vaade tuottaa suuria vaikeuksia esimerkiksi Lüscherin väritestin kaltaisten instrumenttien reliaabeliuden määrittelyssä, koska jotkut kohteen mitattavat ominaisuudet, esimerkiksi tunnetiloihin liittyvät, eivät de facto ole pysyviä vaan voivat vaihdella päivästä päivään. Tällöin joidenkin testien, varsinkin persoonallisuustestien, tiettyjen osien reliabiliteettia voi olla vaikea määrittää. Emme tiedä, johtuuko mahdollinen erilainen tulos testin puutteellisesta reliabiliteetista vai mitattavan kohteen de facto -vaihtelusta. Rele-vantimmillaan reliabiliteettiin liittyvät kysymykset ovat kyky- ja älykkyystestien tyyppisissä kokeissa.
Testin sisäinen konsistenssi viittaa siihen, kuinka paljon mittarin osiot (itemit) mittaavat samaa ominaisuutta. Tällöin mitään ulkoista kriteeriä ei ole, ja tutkitaan testin osien tai (erilaisten) puolikkaiden (split-half) keskinäisiä korrelaatioita, joiden tulisi olla (selvästi) positiivisia.
DSM:ssä on keskitytty testaus – uusintatestaus -reliabiliteettiin (test – retest), siis mittarin stabiliteettiin eli siihen, kuinka samanlainen tulos on uusinnassa toisen arvioitsijan tekemänä. Kyseessä on siis (myös) arvioitsijoiden välinen reliabiliteetti (inter-rater).
Psykometrisesti reliabiliteetin hyvyyttä kuvataan reliabiliteetti-kertoimella. Sisäisen konsistenssin kerroin on tavallisimmin Cronbach’in alfa (α), jonka voidaan ajatella olevan matemaattisesti instrumentin kaikkien puolitus-reliabiliteettien (split-half) keskiarvo. Kertoimen esitti yhdysvaltalainen psykologi Lee Joseph Cronbach (1916 – 2001) Psychometrikassa (1951). Arvioitsija-reliabiliteetissa käytetään tavallisimmin kappa-statistiikkaa, jonka perusmuodon, kappa-kertoimen (κ), esitti yhdysvaltalainen psykologi Jacob Cohen (1923 – 1998) journalissa Educational and Psychological Measurement (1960).
Reliabiliitetti on toinen tärkeä instrumentin hyvyyttä kuvastavista käsitteistä toisen – vielä tärkeämmän – ollessa *validiteetti. Metodi voi olla reliaabeli mutta ei validi.
v a l i d i t e e t t i
(engl. validity; lat. validus terve, vahva voimakas), pätevyys, psykometriikassa menetelmän tai mittausinstrumentin, tavallisimmin psykologisen testin tai asteikon, kyky mitata sitä mitä sen on tarkoitus mitata. Esimerkiksi älykkyystestin tulee mitata älykkyyttä eikä esimerkiksi koulumenestystä. Tai DSM:n skitsofrenian kriteerien tulee kuvastaa skitsofreniaa eikä maanis-depressiivistä psykoosia.
Validiteettiin on yhdistetty lukuisia erilaisia validiteetteja, joissa käsitettä on tarkasteltu eri perspektiiveistä, mm. teoreettinen tai käsite (constuct)
-validiteetti, joka on usein ainakin osin ei-empiirinen ja jolla tarkoitetaan sitä, missä määrin testi mittaa jotain käsitettä tai hypoteettista konstruktiota. Esimerkiksi Hans Jürgen Eysenck’illä (1916 - 1997) ekstravertit ehdollistuvat hitaammin kuin introvertit. Tällöin teorian mukaan introversio – ekstraversio
-asteikossa matalan pistemäärän saaneiden tulisi ehdollistua keskimäärin nopeammin. Jos näin on myös empiriassa, saatu näyttö tukee sitä, että ko. skaalalla on käsite-validiteettia Eysenk’in ekstraversio-käsitteen suhteen. Spesifimmin käsite-validiteetti liittyy erottelu- (discriminant) ja konvergenttiin validiteettiin: tämän mukaan saman hypoteettisen konstruktion eri mittareiden tulisi korreloida toisiinsa korkeasti, jotta käsite olisi validi.
Peruskysymykseksi jää loppujen lopuksi empiria: kuinka hyvin instrumentti erottelee esimerkiksi (muuten eri pätevillä metodeilla todetut) skitsofreenit normaaleista tai maanis-depressiivisistä. Käytännössä tuloksena on eri määrin virheitä: vääriä positiivisia (testi näyttää skitsofreniaa vaikka henkilö ei ole skitsofreeni) tai vääriä negatiivisia (testi näyttää normaaliutta tms. vaikka henkilö on skitsofreeni). Voidaan myös laskea (tavallisimmin Pearsonin tulomomenttikerroin) korrelaatio saadun testi-pistemäärän ja kriteerin välille, jolloin saadaan validiteetti-kerroin.
Validiteetti on toinen instrumentin hyvyyttä kuvastavista käsitteistä toisen ollessa *reliabiliteetti. Validilta metodilta edellytetään myös riittävää reliabiliteettia. Hyvän reliabiliteetin mutta huonon validiteetin omaava mittari voi periaatteessa olla hyvä jos ilmenee, että se on jonkun muun ominaisuuden suhteen validi. Voi esimerkiksi ilmetä, että depression mittariksi kehitetty testi onkin erinonmainen ahdistuksen mittari tms!
_