Z-test

Standardizované normální rozdělení s vyznačenou oblastí hodnot testovací statistiky, při kterých zamítáme nulovou hypotézu na hladině α = 10 %

Z-test je statistický test, při němž za předpokladu nulové hypotézy má testová statistika normální rozdělení se známou směrodatnou odchylkou. Pokud směrodatnou odchylku předem neznáme, ale odhadujeme z dat, tak se používá Studentův t-test, leda by počet pozorování byl tak velký (udává se aspoň 30), že rozdíl mezi oběma typy testu je prakticky zanedbatelný.

Postup testování z-testem je takový, že testovou statistiku lineární transformací standardizujeme a porovnáme s kritickou hodnotou, zde tedy vhodným kvantilem standardizovaného normálního rozdělení, vypočteným na základě požadované hladiny spolehlivosti. Pokud hodnota padne příliš daleko od nuly, tedy do „chvostu“ rozdělení za kritickou hodnotu, tak nulovou hypotézu zamítneme, v opačném případě nezamítneme.

Z-test obvykle vychází z předpokladu, že máme k dispozici n {\displaystyle n} nezávislých realizací náhodné veličiny X 1 , X 2 , , X n {\displaystyle X_{1},X_{2},\dots ,X_{n}} , o které předpokládáme, že platí-li nulová hypotéza, mají normální rozdělení se středem μ X {\displaystyle \mu _{X}} a směrodatnou odchylkou σ X {\displaystyle \sigma _{X}} . Jejich aritmetický průměr

X ¯ = 1 n i = 1 n X i {\displaystyle {\bar {X}}={\frac {1}{n}}\sum _{i=1}^{n}X_{i}}

proto má také normální rozdělení se středem μ X {\displaystyle \mu _{X}} a standardní chybou σ X / n {\displaystyle \sigma _{X}/{\sqrt {n}}} .

Lineární transformací uvedeného aritmetického průměru dostaneme veličinu

Z = X ¯ μ X σ X n , {\displaystyle Z={\frac {{\bar {X}}-\mu _{X}}{\sigma _{X}}}{\sqrt {n}},}

která má za předpokladu nulové hypotézy standardizované normální rozdělení a používá se jako testová statistika.

Z-test lze použít i pro testování velikosti rozdílu mezi středními hodnotami dvou normálních náhodných veličin se známými směrodatnými odchylkami. Mám-li vedle již popsané řady pozorování ještě další nezávislé realizace náhodné veličiny Y 1 , Y 2 , , Y m {\displaystyle Y_{1},Y_{2},\dots ,Y_{m}} se střední hodnotou μ Y {\displaystyle \mu _{Y}} , směrodatnou odchylkou σ Y {\displaystyle \sigma _{Y}} a aritmetickým průměrem

Y ¯ = 1 m i = 1 m Y i , {\displaystyle {\bar {Y}}={\frac {1}{m}}\sum _{i=1}^{m}Y_{i},}

jež jsou navíc nezávislé na X , {\displaystyle X,} tak je X ¯ Y ¯ {\displaystyle {\bar {X}}-{\bar {Y}}} normálně rozdělena se střední hodnotou μ X μ Y {\displaystyle \mu _{X}-\mu _{Y}} a směrodatnou odchylkou σ X 2 n + σ Y 2 m {\displaystyle {\sqrt {{\frac {\sigma _{X}^{2}}{n}}+{\frac {\sigma _{Y}^{2}}{m}}}}} . Testovací statistika pak je

Z = ( X ¯ Y ¯ ) δ σ X 2 n + σ Y 2 m {\displaystyle Z={\frac {({\bar {X}}-{\bar {Y}})-\delta }{\sqrt {{\frac {\sigma _{X}^{2}}{n}}+{\frac {\sigma _{Y}^{2}}{m}}}}}}

a má opět standardizované normální rozdělení.

Pahýl
Pahýl
Tento článek je příliš stručný nebo postrádá důležité informace.
Pomozte Wikipedii tím, že jej vhodně rozšíříte. Nevkládejte však bez oprávnění cizí texty.