Diagnostická kalkulačka

Diagnostická kalkulačka zjednodušuje život všem psychologům, kteří se v praxi zabývají psychologickým testováním. Nechte se provést intervaly spolehlivosti, kritickými skóry a dalšími otázkami z psychometrické problematiky.

Pro používání diagnostické kalkulačky jsou potřeba jen minimální statistické znalosti. Podrobný návod vždy popíše, co, jak a kam zadat, a rovněž jak výsledky interpretovat.

Profesionální výpočty

Diagnostickou kalkulačku vyvíjí psychometrický tým Katedry psychologie Fakulty sociálních studií. K veškerým výpočtům je k dispozici podrobný postup, kód této kalkulačk je veřejně dostupný.

Ve stručnosti jsou jednotlivé postupy popsány i v zápatí každé kalkulačky tak, aby měl uživatel přehled nad způsobem výpočtu.

Dostupné kalkulačky

Interval spolehlivosti

Po zvolení jednotky, zadání naměřeného skóre a reliability testu máte k dispozici interval spolehlivosti pro vašeho respondenta. Kromě běžného intervalu spolehlivosti měření získáte navíc i interval predikce (v jakém rozmezí bude ležet skór retestu, pokud se výkon klienta nezmění?) a rozdílu (v jakém rozmezí by ležel skór jiného probanda se stejnou úrovní schopnosti?).

Převod skórů

Pokud potřebujete převést např. percentily na IQ skóry či T-skóry, nebo naopak např. steny či staniny na percentily či vážené skóry používané v inteligenčních testech, využijete právě tuto kalkulačku.

Další užitečné pomůcky

Kromě kalkulaček dostupných na této stránce můžete využít i další jednoduché nástroje z naší dílny:

Simulace měření výšky: Co by se stalo, kdybychom měřili lidskou výšku psychologickými nástroji? Jak by se projevila chyba měření? Jednoduchá aplikace vám nasimuluje výsledky hypotetického dotazníku výšky na základě vaší skutečné výšky v centimetrech a zadané reliability testu. Kalkulačka je v angličtině.
Skutečný dotazník výšky, který ilustruje běžné postupy měření v psychologii.
Výběrová chyba norem: Žádné normy nejsou bezchybné, vždy záleží na náhodě; na tom, jací lidé se dostali do vzorku. Že zvláště u malých norem a pro extrémní skóry může být výběrová chyba skutečně velká, to vám ukáže jednoduchá aplikace.

Složené skóre

Administrovali jste více testů, měřicích ten samý rys, a chcete se dozvědět „souhrnný“ výsledek – tedy výsledek agregovaný napříč všemi měřeními? Prostý průměr není nejlepší nápad, zvlášť, pokud každý test má jinou reliabilitu. Využijte raději kalkulačku složeného skóre – navíc se dozvíte i to, zda se jednotlivá měření liší (a měří tedy zřejmě něco jiného), nebo zda jsou jednotlivé naměřené skóry pravděpodobně stejné.

Rozdílové skóry

Máte více skórů a nevíte, zda se skutečně liší? Kalkulačka rozdílových skórů vám to jednoduše řekne. Na výběr máte mezi rozdílem dvou osob nebo dvou výsledků u jediného člověka, tedy test-retest, nebo tzv. statisticky a klinicky významné rozdíly.

Kalkulačku citujte jako: Cígler, H., & Šmíra, M. (2024) Diagnostická kalkulačka (Verze 0.1.1). Masarykova univerzita. http://kalkulacka.testforum.cz

Bugs and reports: Případné chyby hlaste prostřednictvím rozhraní GitHub

Převod mezi skóry

Vyberte vstupní skór

Zadejte z-skóre

Zadejte T-skóre

Standardní (Wechslerovo) skóre

Zadejte percentil

Zadejte sten

Zadejte IQ skóre

Zadejte stanin

Zaokrouhlit skóre na celá čísla

Spočítat procento pod křivkou

Nápověda

Tato kalkulačka převádí běžná skóre používaná v psychologické diagnostice. Do vstupního pole zadejte skóre a vyberte jeho typ. Pamatujte, že některé skóry mají možný rozsah! Dále si můžete vybrat zaokrouhlení. Protože steny a staniny nejsou bodovým odhadem, ale z definice reprezentují určitý rozsah možných hodnot, lze při jejich výběru zobrazit i podíl respondentů, kteří mají určité stenové či staninové skóre.

Použité skóry a jejich parametry

skóre	průměr	směrodatná odchylka	minimum	maximum	typ
^a zpravidla. Poznámky: typ standardní – převod pomocí lineární transformace; typ plošný – převod zpravidla pomocí plošné transformace za předpokladu normálního rozložení. NA – není definováno. Kromě z-skóre jsou všechny jednotky zaokrouhlovány zpravidla na celá čísla (včetně stenů a staninů, což vede k zaokrouhlení průměrného z-skóre 0 na „nadprůměrnou“ stenovou hodnotu 6); z-skóre bývají zaokrouhlována na dvě desetinná místa.
z-skóre	0	1	NA	NA	standardní
IQ skóre	100	15	NA	NA	standardní
percentil	NA	NA	0	100	plošný
T-skóre	50	10	NA	NA	standardní
Wechslerovo (vážené) skóre	10	3	0^a	20^a	standardní
steny	5,5	2	1	10	plošný
staniny	5	2	1	9	standardní

Autorem této kalkulačky je Martin Šmíra (2024) s mírným přispěním Hynka Cíglera.

Statisticky a klinicky významná změna

Vyberte použité skóre:

IQ skóry (100, 15)

T skóry (50, 10)

z-skóry (0, 1)

Vážené skóry (10, 3)

Percentily

jiné

Zadejte průměr:

Zadejte směrodatnou odchylku:

1. test

Skóre 1. osoby, testu nebo pretestu.

Skóre 1

reliabilita

2. Test

Skóre druhého testu.
Pokud nezadáte reliabilitu druhého testu, bude použita reliabilita testu prvního.
Pro účely test-retest rozdílu bude vždy použita reliabilita prvního testu

Skóre 2

reliabilita

korelace testů

Pokročilé možnosti

Statistická významnost

Použít regresi k průměru u statisticky významného rozdílu

Tabulka 1: Rozdíl mezi skóry

Pozor, u klinické významnosti záleží na pořadí testů!
E(T2) – očekávané skóre druhého testu podle testu prvního; CI – interval spolehlivosti pro druhý test; rozdíl – pozorovaný rozdíl mezi testy; SE – standardní chyba rozdílu; z – testová statistika rozdílu; p – statistická významnost. Pokud není vypnut regresní odhad pro statisticky významný rozdíl, nedává smysl interval spolehlivosti tohoto rozdílu.

Tabulka 2: Přehled skórů

X – pozorované skóre v daném testu; T – odhad pravého skóre daného testu; SE – standardní chyba měření; CI – interval spolehlivosti měření (bez zohlednění regrese k průměru); CI_reg – interval spolehlivosti měření (po zohlednění regrese k průměru)

Nápověda

Tato kalkulačka poskytuje informace o rozdílnosti dvou skórů. Uživatel může použít celkem tři různé rozdílové skóry:

Statisticky významný rozdíl: Testuje hypotézu, zda se dva skóry od sebe dostatečně liší natolik, abychom mohli konstatovat, že je jeden vyšší než druhý. Pokud je test signifikantní, znamená to, že s určitou mírou jistoty (typicky 5 %) jeden skór je vyšší než druhý.
Příklad 1: Existuje rozdíl mezi skórem fluidní a krystalizované inteligence daného respondenta?
Příklad 2: Dosáhla v inteligenčním testu vyššího skóre Anežka nebo Bedřich?
Klinicky významný rozdíl: Testuje hypotézu, zda se dva skóry od sebe liší více než u náhodně vybraného respondenta z populace. Pokud je test signifikantní, znamená to, že větší rozdíl skórů má jen velmi malé množství osob (typicky 5 %), což může být diagnosticky důležitá informace.
Příklad: Je rozdíl fluidní a krystalizované inteligence daného člověka věcně významný?
Rozdíl test-retest (chyba predikce): Ověřuje, zda se výkon respondenta změnil v čase. Pokud je test signifikantní, znamená to, že se výkon daného respondenta v retetu s určitou mírou jistoty (typicky 5 %) změnil od prvního měření (pretestu).
Příklad: Došlo u respondenta ke změně výkonu v čase mezi oběma měřeními?

Uživatel má k dispozici dvě tabulky. Zatímco však druhá tabulka obsahuje obyčejné intervaly spolehlivosti pro jedno měření (s pozorovaným skóre, odhadem skóru pravého, standardní chybou měření a intervaly spolehlivosti při zvážení a při nezvážení regrese k průměru), první tabulka poskytuje přímo výsledky rozdílových skórů.

V prvním sloupci, E(T), je k dispozici očekávaná (resp. nejpravděpodobnější) hodnota druhého testu při zadaných reliabilitách a skóre prvního testu. Okolo této hodnoty se pohybují naměřené skóry, přičemž odlišnost je způsobena chybou měření. Ve druhém sloupci je k dispozici interval spolehlivosti pro druhý test. Pokud skóre druhého testu leží vně tohoto intervalu, je rozdíl statisticky významný na zadané hladině spolehlivosti. Ve sloupci rozdíl je čistě jen rozdíl očekávané a pozorované hodnoty se standardní chybou zobrazenou ve sloupci SE. Ve sloupci z je testová statistika a ve sloupci označeném jako p je statistická významnost tohoto rozdílu. Poslední sloupec pak poskytuje slovní interpretaci případného rozdílu.

Pro výpočet statisticky významného rozdílu je nutné zadat skór prvního a druhého měření a reliabilitu testů. Pokud mají obě měření stejnou reliabilitu (např. porovnáváme výkon dvou osob v jednom testu), stačí zadat reliabilitu pouze prvního testu, ta se použije i pro druhé měření.

Pro Výpočet klinicky významného rozdílu je nutné zadat korelaci obou testů, reliability však nejsou nutné

Pro výpočet rozdílu test-retest je potřeba zadat skóre obou testů a reliabilitu prvního testu. V tomto případě je reliabilita druhého testu ignorovaná, protože předpokládáme, že jde o dvě měřením tím stejným testem se shodnou reliabilitou. Pokud jste při retestu měřili jiným testem, použijte statisticky významný rozdíl.

V pokročilých možnostech můžete změnit požadovanou hladinu statistické významnosti. Je možné rovněž ovlivnit výpočet statisticky významného rozdílu. V původním nastavení je použit regresní postup navržený Cíglerem a Šmírou (2015, vzorec 15). V tomto případě je srovnáván rozdíl pravých skórů. Tuto možnost lze vypnout, pak jsou srovnávány přímo skóry pozorované. Nejste-li si jistí, kterou z variant použít, zvolte přednastavenou možnost (a nechte políčko zatrhnuté). V takovém případě však není k dispozici interval spolehlivosti pro druhý test.

Uživatel aplikace má k dispozici rovněž i graf zobrazující obě měření včetně jejich intervalu spolehlivosti (bez zvážení regrese k průměru, která by mohla být v tomto případě matoucí).

Postup výpočtu

Obecný postup všech výpočtů

Ve všech případech je spočítán rozdíl očekávaného $E(B|A)$ a pozorovaného skóre $B$ ve druhém testu $X_{\Delta}$ (s výjimkou statisticky významného rozdílu při použití regresní metody, viz níže). Protože tento očekávaný rozdíl je vždy nula ($H_0: X_{\Delta}=0$), testová statistika $z$ je spočítána za předpokladu normálního rozložení jako podíl tohoto rozdílu a standardní chyby příslušného rozdílu: $$z=\frac{X_{\Delta}}{SE}$$ Pro tuto testovou statistiku je pak dohledána příslušná pravděpodovnost (ve všech případech je použit oboustranný test). Standardní chyba je využita i pro výpočet intervalu spolehlivosti s příslušným kvantilem normálního rozložení $z_w$ podle vzorce $$CI_w=z_w SE$$

Statisticky významný rozdíl

V případě použití regresní metody (Cígler a Šmíra, 2015, vzorec 15) je pozorovaný rozdíl spočítán jako $$X_{\Delta}=\sqrt{r_{aa'}}(A-M)-\sqrt{r_{bb'}}(B-M)$$ kde $r_{aa'})\ a \(r_{bb'}$ jsou reliability obou testů $A$ a $B$ a $M$ je průměr použitých jednotek.

Pokud není použita regresní metoda, je rozdíl spočítán jako prostý rozdíl pozorovaných skórů $$X_{\Delta}=A-B$$

Standardní chyba statisticky významného rozdílu je pak v obou případech odhadnuta jako $$SE_{stat.} = SD\sqrt(2-r_{aa'}-r_{bb'})$$ SD je směrodatná odchylka použitých jednotek.

Klinicky významný rozdíl

Očekávané skóre $E(B|A)$ ve druhém testu je spočítáno s využitím skóre prvního testu $A$ a jejich korelace $r_{ab}$ jako $$E(B|A) = r_{ab}A + (1-r_{ab})M$$ Standardní chyba klinického rozdílu je potom $$SE = SD\sqrt{1-r_{ab}^2}$$

Test-retest (chyba predikce)

Postup je analogický předchozímu příkladu s tím rozdílem, že namísto korelace obou testů je použita reliabilita testu (společná pro oba testy).
Očekávané skóre $E(B|A)$ ve druhém testu je spočítáno s využitím skóre prvního testu $A$ a jejich společné reliability $r_{aa'}=r_{bb'}$ jako $$E(B|A) = r_{aa'}A + (1-r_{aa'})M$$ Standardní chyba klinického rozdílu je potom $$SE = SD\sqrt{1-r_{aa'}^2}$$

Zdroje

Cígler, H., & Šmíra, M. (2015). Chyba měření a odhad pravého skóru: Připomenutí některých postupů Klasické testové teorie. Testfórum, 4(6), 67-84. doi:10.5817/TF2015-6-104