» aplikace
Tato webová aplikace byla vytvořena na jaře roku 2011, kdy vznikla jako výsledek semestrálního projektu z předmětu "aplikovaná statistika" v rámci studia na Univerzitě Hradec Králové oboru "Informační management".
Vytvořil: Milan Kábrt
Máme k dispozici náhodný výběr rozsahu n rozdělený dle dvou statistických znaků (znak1, znak2), které nám tvoří tabulku, přičemž každý z obou znaků je rozdělen do r (řádky), resp. s (sloupce) skupin. Úkolem testu je rozhodnout, zdali jsou oba znaky na sobě závislé či nezávislé. Tedy zdali "typ" znaku1 má vliv na znak2. Hodnoty ni• a n•j vyjadřují marginální četnosti (součty četností v řádcích a sloupcích):
znak1 - 1.skupina | znak1 - 2.skupina | ... | celkem | |
---|---|---|---|---|
znak2 - 1.skupina | skutečné četnosti | skutečné četnosti | ... | n1• |
znak2 - 2.skupina | skutečné četnosti | skutečné četnosti | ... | n2• |
znak2 - 3.skupina | skutečné četnosti | skutečné četnosti | ... | n3• |
... | ... | ... | ... | ni• |
celkem | n•1 | n•2 | n•j | n |
V předešlé tabulce máme zaznamenány skutečné (naměřené) relativní četnosti. Následující tabulka však ukazuje očekávané četnosti výskytu jednotlivých variant.
Hodnoty očekávaných četností spočítáme následovně:
znak1 - 1.skupina | znak1 - 2.skupina | ... | celkem | |
---|---|---|---|---|
znak2 - 1.skupina | očekávané četnosti | očekávané četnosti | ... | n1• |
znak2 - 2.skupina | očekávané četnosti | očekávané četnosti | ... | n2• |
znak2 - 3.skupina | očekávané četnosti | očekávané četnosti | ... | n3• |
... | ... | ... | ... | ni• |
celkem | n•1 | n•2 | n•j | n |
Jako nulohou hypotézu H0 stanovíme, že znaky 1 a 2 jsou nezávislé.
Oproti tomu HA říká, že zde existuje závislost.
V této chvíli, když již máme sestaveny obě tabulky četností, jsme schopni vypočítat testové kritérium G mající rozdělení chí kvadrát s df = (r-1)(s-1) stupni volnosti podle vzorce:
Kritickou hodnotu můžeme získat pomocí funkce CHINV v MS Excel.
Jestliže testové kritérium < kritická hodnota, pak hypotézu H0 o nezávislosti znaků nezamítáme a můžeme tedy onu nezávislost předpokládat.
• nejvíce 20 % teoretických četností může být menších než 5
• žádná teoretická četnost nesmí být menší než 1
Pro tabulku 2x2:
• n > 40
• pokud 20 < n < 40, pak je nutná úprava testového kritéria pomocí Yatesovy korekce
• pokud n < 20, pak použijeme Fisherův test
Skalská H.: Aplikovaná statistika. Přednášky a materiály k předmětu APSTA,
2009. , pred_3_2009.pdf, Test nezávislosti v kontingenční tabulce - postup výpočtu
© CREATED BY | Milan Kábrt | www.milankabrt.cz