Diagnostická kalkulačka

Diagnostická kalkulačka zjednodušuje život všem psychologům, kteří se v praxi zabývají psychologickým testováním. Nechte se provést intervaly spolehlivosti, kritickými skóry a dalšími otázkami z psychometrické problematiky.

Pro používání diagnostické kalkulačky jsou potřeba jen minimální statistické znalosti. Podrobný návod vždy popíše, co, jak a kam zadat, a rovněž jak výsledky interpretovat.

Profesionální výpočty

Diagnostickou kalkulačku vyvíjí psychometrický tým Katedry psychologie Fakulty sociálních studií. K veškerým výpočtům je k dispozici podrobný postup, kód této kalkulačk je veřejně dostupný.

Ve stručnosti jsou jednotlivé postupy popsány i v zápatí každé kalkulačky tak, aby měl uživatel přehled nad způsobem výpočtu.


Dostupné kalkulačky

Interval spolehlivosti

Po zvolení jednotky, zadání naměřeného skóre a reliability testu máte k dispozici interval spolehlivosti pro vašeho respondenta. Kromě běžného intervalu spolehlivosti měření získáte navíc i interval predikce (v jakém rozmezí bude ležet skór retestu, pokud se výkon klienta nezmění?) a rozdílu (v jakém rozmezí by ležel skór jiného probanda se stejnou úrovní schopnosti?).

Převod skórů

Pokud potřebujete převést např. percentily na IQ skóry či T-skóry, nebo naopak např. steny či staniny na percentily či vážené skóry používané v inteligenčních testech, využijete právě tuto kalkulačku.


Další užitečné pomůcky

Kromě kalkulaček dostupných na této stránce můžete využít i další jednoduché nástroje z naší dílny:

  • Simulace měření výšky: Co by se stalo, kdybychom měřili lidskou výšku psychologickými nástroji? Jak by se projevila chyba měření? Jednoduchá aplikace vám nasimuluje výsledky hypotetického dotazníku výšky na základě vaší skutečné výšky v centimetrech a zadané reliability testu. Kalkulačka je v angličtině.
  • Skutečný dotazník výšky, který ilustruje běžné postupy měření v psychologii.
  • Výběrová chyba norem: Žádné normy nejsou bezchybné, vždy záleží na náhodě; na tom, jací lidé se dostali do vzorku. Že zvláště u malých norem a pro extrémní skóry může být výběrová chyba skutečně velká, to vám ukáže jednoduchá aplikace.

Složené skóre

Administrovali jste více testů, měřicích ten samý rys, a chcete se dozvědět „souhrnný“ výsledek – tedy výsledek agregovaný napříč všemi měřeními? Prostý průměr není nejlepší nápad, zvlášť, pokud každý test má jinou reliabilitu. Využijte raději kalkulačku složeného skóre – navíc se dozvíte i to, zda se jednotlivá měření liší (a měří tedy zřejmě něco jiného), nebo zda jsou jednotlivé naměřené skóry pravděpodobně stejné.

Rozdílové skóry

Máte více skórů a nevíte, zda se skutečně liší? Kalkulačka rozdílových skórů vám to jednoduše řekne. Na výběr máte mezi rozdílem dvou osob nebo dvou výsledků u jediného člověka, tedy test-retest, nebo tzv. statisticky a klinicky významné rozdíly.

Kalkulačku citujte jako: Cígler, H., & Šmíra, M. (2024) Diagnostická kalkulačka (Verze 0.1.1). Masarykova univerzita. http://kalkulacka.testforum.cz

Bugs and reports: Případné chyby hlaste prostřednictvím rozhraní GitHub

Výpočet chyby měření a intervalu spolehlivosti

Pokročilé nastavení

Interval spolehlivosti

Intervaly spolehlivosti pro rozdíl


Nápověda

Tato kalkulačka vypočítá interval spolehlivosti jednoho skóre při jednom měření, pokud znáte reliabilitu testu.

Zvolte jednotky, ve kterých je test vyhodnocen, a zvolte rovněž reliabilitu testu, který používáte. V pokročilém nastavení následně můžete zvolit šířku intervalu spolehlivosti. Můžete si rovněž zvolit, zda chcete aplikovat regresi k průměru (tedy sestrojit interval spolehlivosti kolem odhadu pravého skóre), nebo nikoli (a interval sestrojit okolo skóre pozorovaného). Ačkoli regrese k průměru je doporučovaným postupem (Dudek, 1979; Cígler a Šmíra, 2015), jeho předpokladem je, že klient byl „náhodně“ vybrán z populace o daném průměru. Naneštěstí, tento předpoklad zpravidla neplatí v běžném klinickém prostředí, v pedagogicko-psychologických poradnách apod. V takovém případě máte na výběr v zásadě tři možnosti:

  1. I přes to použít regresi k průměru. Takový závěr je „konzervativnější“. V takové situaci předpokádáte, že klient pochází z běžné populace.
  2. Regresi k průměru nepoužít. Tento postup a-priori neklade žádné předpoklady o skóre klienta, může však vést k extrémnějším závěrům, interval spolehlivosti bude posunutý směrem k extrémům.
  3. Zvolit si apriorní rozložení sám/sama. V takovém případě jako typ skóre vyberte jiné. Jako směrodatnou odchylku uveďte směrodatnou odchylku používaných skórů (tedy např. 15 pro IQ či 10 pro T-skóre), jako střední hodnotu uveďte vámi očekávaný skór, kterého respondent dosáhne. Jinými slovy: tipněte si výkon klienta a tento svůj tip dosaďte na místo průměru. Tento poslední postup by měl vést k nejadekvátnějšímu odhadu intervalu spolehlivosti.

Pokud jste zadali skóre v percentilech, jsou tyto percentily prvně převedeny na z-skóre, následně jsou provedeny veškeré výpočty a jejich výsledky (kromě standardní chyby měření) jsou převedeny zpět na percentil.

Kromě toho kalkulačka spočítá i dva další intervaly spolehlivosti, které naleznete v tabulce. Chyba rozdílu udává, jak široký je interval spolehlivosti pro výsledek jiného měření tím stejným testem za předpokladu, že se pravé skóry obou testů neliší. Pokud nový skór (např. výsledek jiné osoby) leží mimo tento interval, jsou oba skóry statisticky významně odlišné.
Chyba predikce odhaduje, v jakém rozmezí by měl ležet retestový výsledek respondenta za předpokladu, že se jeho pravý skóry mezi měřeními nezměnil. Pokud leží nový výsledek mimo uvedený interval, výkon respondenta se změnil.

Upozornění: Použitý výpočet je založen na postupu klasické testové teorie. Výpočet není vhodný pro testy, které byly konstruované s využití teorie odpovědi na položku nebo Raschova modelu (u nás např. Woodcock-Johnson či Krátký inteligenční test.


Postup odhadu

Standardní chybu měření označovanou jako \(SE\) („Standard Error of measurement“) lze odhadnout pomocí vzorce $$SE = SD\sqrt{1-r_{xx'}}$$ kde \(SD\) je směrodatná odchylka („Standard Deviation“) a \(r_{xx'}\) je reliabilita testu.

Podle doporučení řady autorů (např. Dudek, 1979; Cígler a Šmíra, 2015) je vhodnějším postupem konstruovat interval spolehlivosti nikoli kolem pozorovaného skóre, ale kolem odhadu skóre pravého, které se nachází trochu blíže k průměrnému skóru. Tato funkce je v našem výpočtu implementována (lze ji však vypnout v pokročilém nastavení). Odhad pravého skóre \(E(T)\) (očekávaná hodnota pravého skóre při určitém pozorovaném skóre) lze vypočítat jako $$E(T) = r_{xx'}X + (1-r_{xx'})M$$ kde \(r_{xx'}\) je reliabilita, \(M\) průměrné skóre a \(X\) skóre pozorované. Všimněte si, že pokud je reliabilita rovna jedné, člen \(1-r_{xx'}\) je roven nule, a průměrné skóre nemá na výpočet vliv; naopak pokud by reliabilita byla nulová, pak by na výpočet nemělo vliv pozorované skóre a odhad pravého skóre by byl shodný s populačním průměrem.

Posledním krokem je odhad vlastního intervalu spolehlivosti \(CI\) („Confidence Interval“). Ten je odhadnut okolo odhadu pravého skóre \(E(T)\) (je-li tato funkce vypnutá, pak přímo okolo skóre pozorovaného \(X\)) jako $$CI_w = E(T) \pm z_{w}SE$$ kde \(w\) označuje šířku intervalu (např. v procentech) a \(z_{w}\) je příslušný kvantil normální rozdělení. Pro běžné hodnoty je tento kvantil roven \(z_{90\%}=1,64\), \(z_{95\%}=1,96\) a \(z_{99\%}=2,58\).

Interval pro rozdíl \(CI_{\Delta}\) je spočítán okolo pozorovaného skóre podle vzorce, tedy $$ CI_{\Delta}=X \pm z_{w} SE_{\Delta} $$ kde \(SE_\Delta\) se je standardní chyba rozdílu odhadnutá s pomocí standardní chyby měření (viz dřívější vzorce) jako $$SE_\Delta=\sqrt{2}SE$$ Interval spolehlivosti predikce \(CI_{pred}\) je spočítán okolo odhadu pravého skóre \(E(T))\) jako $$CI_{pred} = E(T) \pm z_{w}SE_{pred}$$ kde \(SE_{pred}\) je standardní chyba predikce: $$SE_{pred}=SD\sqrt{1-r_{xx'}^2}$$

Autorem kalkulačky je Hynek Cígler (©2024) s mírným přispěním Martina Šmíry.


Zdroje

  • Cígler, H., & Šmíra, M. (2015). Chyba měření a odhad pravého skóru: Připomenutí některých postupů Klasické testové teorie. Testfórum, 4(6), 67-84. doi:10.5817/TF2015-6-104
  • Dudek, F.J. (1979). The Continuing Misinterpretation of the Standard Error of Measurement. Psychological Bulletin 86(2), 335-337. doi:10.1037/0033-2909.86.2.335

Převod mezi skóry

Nápověda

Tato kalkulačka převádí běžná skóre používaná v psychologické diagnostice. Do vstupního pole zadejte skóre a vyberte jeho typ. Pamatujte, že některé skóry mají možný rozsah! Dále si můžete vybrat zaokrouhlení. Protože steny a staniny nejsou bodovým odhadem, ale z definice reprezentují určitý rozsah možných hodnot, lze při jejich výběru zobrazit i podíl respondentů, kteří mají určité stenové či staninové skóre.

Použité skóry a jejich parametry

skóreprůměr směrodatná odchylka minimum maximum typ
a zpravidla.
Poznámky: typ standardní – převod pomocí lineární transformace; typ plošný – převod zpravidla pomocí plošné transformace za předpokladu normálního rozložení. NA – není definováno. Kromě z-skóre jsou všechny jednotky zaokrouhlovány zpravidla na celá čísla (včetně stenů a staninů, což vede k zaokrouhlení průměrného z-skóre 0 na „nadprůměrnou“ stenovou hodnotu 6); z-skóre bývají zaokrouhlována na dvě desetinná místa.
z-skóre01NANAstandardní
IQ skóre10015NANAstandardní
percentilNANA0100plošný
T-skóre5010NANAstandardní
Wechslerovo (vážené) skóre1030a20astandardní
steny5,52110plošný
staniny5219standardní

Autorem této kalkulačky je Martin Šmíra (2024) s mírným přispěním Hynka Cíglera.

Práce se složeným skóre

Pokud u druhého a dalšího testu nezadáte reliabilitu, použije se reliabilita prvního testu.

Dosáhli jste maximálního počtu deseti testů.

Tabulka 1: Výsledné skóre

odhad – odhad výsledného skóre na základě všech testů. CI – výsledný interval spolehlivosti;
x2, df, p – test dobré shody (s testovou statistikou x2 a počtem stupňů volnosti df), zda se jednotlivé testové výsledky neliší. Pokud je test signifikantní (p je menší než zvolená hodnota ), pak nelze výsledné kombinované skóre interpretovat.

Tabulka 2: Chyby měření jednotlivých testů

X – pozorované skóre r – reliabilita testu; SE – standardní chyba měření; CI – interval spolehlivosti.
Žádný z údajů nezohledňuje ostatní testy, týká se vždy jen daného testu. Při výpočtu není zohledněna regrese k průměru.

Tabulka 3: Vývoj chyb měření

X – odhad skóre u n-tého testu; SE = chyba měření daného testu; SE_true – chyba odhadu s využitím všech dosavadních testů; CI – interval měření, které využívá všechny dosavadní testy.


Nápověda

Tato kalkulačka nabízí možnost zkombinovat více testů tak, aby uživatel získal jediný skór s jediným intervalem spolehlivosti. Vyberte si požadovanou jednotku, kterou používáte (všechny testy musí být zadané ve shodných jednotkách) a zadejte skóre a reliabilitu prvního testu. Poté se zobrazí pole pro zadání pozorovaného skóre a reliability druhého testu, a tak dál; celkem lze zadat až 10 separátních testových výsledků.

V nabídce pokročilé možnosti máte zároveň možnost změnit hladinu spolehlivosti použitou pro všechny výpočty, a rovněž apriorní informaci. Nedoporučujeme měnit apriorní informaci, pokud si nejste zcela jisti, že víte, co děláte! Apriorní informace určuje průměr populace, ze které je proband vybrán. Je-li vybrán z běžné populace, je nejvhodnějším řešením ponechat původní nastavení (populační apriorní informace). V tomto případě je použita regrese k průměrnému skóru. Tuto funkci lze vypnout nastavením žádné apriorní informace; skóre prvního testu v takovémto případě není přibližováno k průměrnému skóre. Třetí možnost je nastavit vlastní apriorní informaci. V takovém případě můžete „zpřesnit“ výsledky vyšetření vaším odhadem. Zadejte do apriorní informace váš expertní odhad, jakého výsledku by měl proband dosáhnout. Výsledný odhad bude o něco blíže k této hodnotě, než by odpovídalo naměřenému skóre.

V tabulce 1 naleznete zkombinované výsledky jednotlivých testů. Ve sloupci odhad je výsledný bodový odhad respondentova skóre, ve sloupci CI naleznete příslušný interval spolehlivosti.
ve sloupcích x2, df a p jsou výsledky testu dobré shody ověřujícího, zda se jednotlivé testové výsledky statisticky významně neliší. Pokud ano, nelze kombinované skóre bezpečně interpretovat.

V tabulce 2 jsou k dispozici výsledky pro jednotlivé pozorované skóry: X jsou právě tyto skóry, r zadané reliability, SE chyby měření a CI intervaly spolehlivosti. Upozorňujeme, že tyto intervaly spolehlivosti byly odhadnuty bez využití regrese k průměru; nedoporučujeme je individuálně interpretovat. V grafické podobě jsou tyto výsledky pak na gafu níže-

Tabulka 3 potom předkládá vývoj, jak se postupně chyby měření zužovaly. N prvním řádku jsou výsledky po vyhodnocení prvního testu; na druhém po vyhodnocení druhého testu a tak dále. X, SE, a r jsou pozorované skóre, chyba měření a reliabilita daného testu (bez zohlednění ostatních měření). Naopak ve sloupcích X, SE_true a CI je výsledná odhadovaná hodnota pravého skóre, jeho chyba odhadu a příslušný interval spolehlivosti, pokud bereme v úvahu výsledek daného testu i všechna předchozí měření.

Upozornění: Použitý výpočet je založen na postupu klasické testové teorie. Výpočet není vhodný pro testy, které byly konstruované s využití teorie odpovědi na položku nebo Raschova modelu (u nás např. Woodcock-Johnson či Krátký inteligenční test.


Postup odhadu

Námi použitý postup kombinuje Bayesovský a tradiční, frekventistický způsob odhadu. Výpočet pracuje se z-skóry - všechny ostatní jednotky jsou úvodem převedeny právě na z-skór a po ukončení všech výpočtů jsou veškeré hodnoty transformovány zpět na původní škálu. V prvním kroku je proveden odhad pravého skóre E(T) podle vzorce $$E(T) = r_{xx'}X + (1-r_{xx'})M$$ kde \(r_{xx'}\) je reliabilita, \(M\) uživatelem zadaná apriorní informace a \(X\) skóre pozorované. Protože pracujeme se z-skóry, v případě použití populační apriorní informace platí \(M=0\). v případě žádné apriorní informace je tento krok přeskočen a namísto odhadu pravého skóre je použit přímo pozorovaný skór.

Následně je odhadnuta standardní chyba měření \(SE\) podle vzorce $$SE = SD\sqrt{1-r_{xx'}}$$ kde \(SD\) je směrodatná odchylka a \(r_{xx'}\) je reliabilita testu. Kromě toho je odhadnuta ještě i chyba odhadu pravého skóre \(SE_{T}\) jako $$SE_{T} = \sqrt{r_{xx'}}SE$$ pro účely dalších výpočtů. V případě druhého a dalších měření je použit odlišný postup. Odhad pravého skóre \(i\)-tého testu \(E(T_{i})\) je proveden jako posteriorní odhad podle vzorce $$E(T_{i}) = \frac{SE_i^2}{SE_i^2 + SE_{T,i-1}^2}E(T_{i-1}) + \frac{SE_{T,i-1}^2}{SE_i^2 + SE_{T,i-1}^2}X_i$$ kde \(SE_i^2\) je standardní chyba měření \(i\)-tého testu, \(SE_{T,i-1}\) je standardní chyba odhadu pravého skóre s využitím všech předchozích testů \(i-1\), \(E(T_{i-1})\) jeho bodový odhad a konečně \(X_i\) skóre pozorované v testu \(i\). Chyba tohoto odhadu je spočítána pomocí vzorce $$SE_{T, i} = \sqrt{\frac1{SE_{T, i}^2} + \frac1{SE_{T, i-1}^2}}^{-1}$$

S pomocí této chyby odhadu je zpětně odhadnuta reliabilita všech testů \(r_{ii'}\) jako $$r_{ii'} = 1 + \frac{\sqrt{1-4SE_{T, i}^2}}{2}$$ Tento vzorec bohužel není identifikovaný, pokud \(r_{ii'} \leq 0,5\). V takovém případě je uživatel upozorněn.

Poslední důležitý výpočet je statisticky významný rozdíl jednotlivých testů navzájem. Ten je odhadnut pomocí testu dobré shode, kdy testová statistika má hodnotu $$\chi^2=\sum_{i=1}^{n} \frac{(X_i-E(X))^2}{SE_i^2}$$ s přibližně \(\chi^2\) rozložením a \(n-1\) stupni volnosti, kde \(n\) udává počet zadaných testů. \(E(X)\) je potom očekávané skóre, odhadnuté jako vážený průměr všech dílčích testů $$E(X)=\frac{\sum_{i=1}^{n} SE_i^{-2}X_i}{\sum_{i=1}^{n}SE_i^{-2}}$$


Autorem této kalkulačky je Hynek Cígler (©2024).

Statisticky a klinicky významná změna


1. test

Skóre 1. osoby, testu nebo pretestu.


2. Test

Skóre druhého testu.
Pokud nezadáte reliabilitu druhého testu, bude použita reliabilita testu prvního.
Pro účely test-retest rozdílu bude vždy použita reliabilita prvního testu

Tabulka 1: Rozdíl mezi skóry

Pozor, u klinické významnosti záleží na pořadí testů!
E(T2) – očekávané skóre druhého testu podle testu prvního; CI – interval spolehlivosti pro druhý test; rozdíl – pozorovaný rozdíl mezi testy; SE – standardní chyba rozdílu; z – testová statistika rozdílu; p – statistická významnost. Pokud není vypnut regresní odhad pro statisticky významný rozdíl, nedává smysl interval spolehlivosti tohoto rozdílu.

Tabulka 2: Přehled skórů

X – pozorované skóre v daném testu; T – odhad pravého skóre daného testu; SE – standardní chyba měření; CI – interval spolehlivosti měření (bez zohlednění regrese k průměru); CI_reg – interval spolehlivosti měření (po zohlednění regrese k průměru)


Nápověda

Tato kalkulačka poskytuje informace o rozdílnosti dvou skórů. Uživatel může použít celkem tři různé rozdílové skóry:

  1. Statisticky významný rozdíl: Testuje hypotézu, zda se dva skóry od sebe dostatečně liší natolik, abychom mohli konstatovat, že je jeden vyšší než druhý. Pokud je test signifikantní, znamená to, že s určitou mírou jistoty (typicky 5 %) jeden skór je vyšší než druhý.
    Příklad 1: Existuje rozdíl mezi skórem fluidní a krystalizované inteligence daného respondenta?
    Příklad 2: Dosáhla v inteligenčním testu vyššího skóre Anežka nebo Bedřich?
  2. Klinicky významný rozdíl: Testuje hypotézu, zda se dva skóry od sebe liší více než u náhodně vybraného respondenta z populace. Pokud je test signifikantní, znamená to, že větší rozdíl skórů má jen velmi malé množství osob (typicky 5 %), což může být diagnosticky důležitá informace.
    Příklad: Je rozdíl fluidní a krystalizované inteligence daného člověka věcně významný?
  3. Rozdíl test-retest (chyba predikce): Ověřuje, zda se výkon respondenta změnil v čase. Pokud je test signifikantní, znamená to, že se výkon daného respondenta v retetu s určitou mírou jistoty (typicky 5 %) změnil od prvního měření (pretestu).
    Příklad: Došlo u respondenta ke změně výkonu v čase mezi oběma měřeními?

Uživatel má k dispozici dvě tabulky. Zatímco však druhá tabulka obsahuje obyčejné intervaly spolehlivosti pro jedno měření (s pozorovaným skóre, odhadem skóru pravého, standardní chybou měření a intervaly spolehlivosti při zvážení a při nezvážení regrese k průměru), první tabulka poskytuje přímo výsledky rozdílových skórů.

V prvním sloupci, E(T), je k dispozici očekávaná (resp. nejpravděpodobnější) hodnota druhého testu při zadaných reliabilitách a skóre prvního testu. Okolo této hodnoty se pohybují naměřené skóry, přičemž odlišnost je způsobena chybou měření. Ve druhém sloupci je k dispozici interval spolehlivosti pro druhý test. Pokud skóre druhého testu leží vně tohoto intervalu, je rozdíl statisticky významný na zadané hladině spolehlivosti. Ve sloupci rozdíl je čistě jen rozdíl očekávané a pozorované hodnoty se standardní chybou zobrazenou ve sloupci SE. Ve sloupci z je testová statistika a ve sloupci označeném jako p je statistická významnost tohoto rozdílu. Poslední sloupec pak poskytuje slovní interpretaci případného rozdílu.

Pro výpočet statisticky významného rozdílu je nutné zadat skór prvního a druhého měření a reliabilitu testů. Pokud mají obě měření stejnou reliabilitu (např. porovnáváme výkon dvou osob v jednom testu), stačí zadat reliabilitu pouze prvního testu, ta se použije i pro druhé měření.

Pro Výpočet klinicky významného rozdílu je nutné zadat korelaci obou testů, reliability však nejsou nutné

Pro výpočet rozdílu test-retest je potřeba zadat skóre obou testů a reliabilitu prvního testu. V tomto případě je reliabilita druhého testu ignorovaná, protože předpokládáme, že jde o dvě měřením tím stejným testem se shodnou reliabilitou. Pokud jste při retestu měřili jiným testem, použijte statisticky významný rozdíl.

V pokročilých možnostech můžete změnit požadovanou hladinu statistické významnosti. Je možné rovněž ovlivnit výpočet statisticky významného rozdílu. V původním nastavení je použit regresní postup navržený Cíglerem a Šmírou (2015, vzorec 15). V tomto případě je srovnáván rozdíl pravých skórů. Tuto možnost lze vypnout, pak jsou srovnávány přímo skóry pozorované. Nejste-li si jistí, kterou z variant použít, zvolte přednastavenou možnost (a nechte políčko zatrhnuté). V takovém případě však není k dispozici interval spolehlivosti pro druhý test.

Uživatel aplikace má k dispozici rovněž i graf zobrazující obě měření včetně jejich intervalu spolehlivosti (bez zvážení regrese k průměru, která by mohla být v tomto případě matoucí).


Postup výpočtu

Obecný postup všech výpočtů

Ve všech případech je spočítán rozdíl očekávaného \(E(B|A)\) a pozorovaného skóre \(B\) ve druhém testu \(X_{\Delta}\) (s výjimkou statisticky významného rozdílu při použití regresní metody, viz níže). Protože tento očekávaný rozdíl je vždy nula (\(H_0: X_{\Delta}=0\)), testová statistika \(z\) je spočítána za předpokladu normálního rozložení jako podíl tohoto rozdílu a standardní chyby příslušného rozdílu: $$z=\frac{X_{\Delta}}{SE}$$ Pro tuto testovou statistiku je pak dohledána příslušná pravděpodovnost (ve všech případech je použit oboustranný test). Standardní chyba je využita i pro výpočet intervalu spolehlivosti s příslušným kvantilem normálního rozložení \(z_w\) podle vzorce $$CI_w=z_w SE$$

Statisticky významný rozdíl

V případě použití regresní metody (Cígler a Šmíra, 2015, vzorec 15) je pozorovaný rozdíl spočítán jako $$X_{\Delta}=\sqrt{r_{aa'}}(A-M)-\sqrt{r_{bb'}}(B-M)$$ kde \(r_{aa'})\ a \(r_{bb'}\) jsou reliability obou testů \(A\) a \(B\) a \(M\) je průměr použitých jednotek.

Pokud není použita regresní metoda, je rozdíl spočítán jako prostý rozdíl pozorovaných skórů $$X_{\Delta}=A-B$$

Standardní chyba statisticky významného rozdílu je pak v obou případech odhadnuta jako $$SE_{stat.} = SD\sqrt(2-r_{aa'}-r_{bb'})$$ SD je směrodatná odchylka použitých jednotek.

Klinicky významný rozdíl

Očekávané skóre \(E(B|A)\) ve druhém testu je spočítáno s využitím skóre prvního testu \(A\) a jejich korelace \(r_{ab}\) jako $$E(B|A) = r_{ab}A + (1-r_{ab})M$$ Standardní chyba klinického rozdílu je potom $$SE = SD\sqrt{1-r_{ab}^2}$$

Test-retest (chyba predikce)

Postup je analogický předchozímu příkladu s tím rozdílem, že namísto korelace obou testů je použita reliabilita testu (společná pro oba testy).
Očekávané skóre \(E(B|A)\) ve druhém testu je spočítáno s využitím skóre prvního testu \(A\) a jejich společné reliability \(r_{aa'}=r_{bb'}\) jako $$E(B|A) = r_{aa'}A + (1-r_{aa'})M$$ Standardní chyba klinického rozdílu je potom $$SE = SD\sqrt{1-r_{aa'}^2}$$

Zdroje

Cígler, H., & Šmíra, M. (2015). Chyba měření a odhad pravého skóru: Připomenutí některých postupů Klasické testové teorie. Testfórum, 4(6), 67-84. doi:10.5817/TF2015-6-104


Autorem kalkulačky je Hynek Cígler (©2024).


© 2024 Hynek Cígler & Martin Šmíra
Katedra psychologie, Fakulta sociálních studií
Masarykova univerzita | kalkulacka@testforum.cz