»  o aplikaci

»  aplikace


Test chí-kvadrát nezávislosti v kontingenční tabulce

vznik

Tato webová aplikace byla vytvořena na jaře roku 2011, kdy vznikla jako výsledek semestrálního projektu z předmětu "aplikovaná statistika" v rámci studia na Univerzitě Hradec Králové oboru "Informační management".

Vytvořil: Milan Kábrt

Spustit aplikaci



Test chí-kvadrát nezávislosti v kontingenční tabulce

Máme k dispozici náhodný výběr rozsahu n rozdělený dle dvou statistických znaků (znak1, znak2), které nám tvoří tabulku, přičemž každý z obou znaků je rozdělen do r (řádky), resp. s (sloupce) skupin. Úkolem testu je rozhodnout, zdali jsou oba znaky na sobě závislé či nezávislé. Tedy zdali "typ" znaku1 má vliv na znak2. Hodnoty ni• a n•j vyjadřují marginální četnosti (součty četností v řádcích a sloupcích):

znak1 - 1.skupinaznak1 - 2.skupina...celkem
znak2 - 1.skupinaskutečné četnostiskutečné četnosti...n1•
znak2 - 2.skupinaskutečné četnostiskutečné četnosti...n2•
znak2 - 3.skupinaskutečné četnostiskutečné četnosti...n3•
............ni•
celkemn•1n•2n•jn

  

V předešlé tabulce máme zaznamenány skutečné (naměřené) relativní četnosti. Následující tabulka však ukazuje očekávané četnosti výskytu jednotlivých variant.

Hodnoty očekávaných četností spočítáme následovně:

znak1 - 1.skupinaznak1 - 2.skupina...celkem
znak2 - 1.skupinaočekávané četnostiočekávané četnosti...n1•
znak2 - 2.skupinaočekávané četnostiočekávané četnosti...n2•
znak2 - 3.skupinaočekávané četnostiočekávané četnosti...n3•
............ni•
celkemn•1n•2n•jn



Hypotézy:

Jako nulohou hypotézu H0 stanovíme, že znaky 1 a 2 jsou nezávislé.

Oproti tomu HA říká, že zde existuje závislost.



Testové kritérium:

V této chvíli, když již máme sestaveny obě tabulky četností, jsme schopni vypočítat testové kritérium G mající rozdělení chí kvadrát s df = (r-1)(s-1) stupni volnosti podle vzorce:

Kritická hodnota:

Kritickou hodnotu můžeme získat pomocí funkce CHINV v MS Excel.

Rohodnutí:

Jestliže testové kritérium < kritická hodnota, pak hypotézu H0 o nezávislosti znaků nezamítáme a můžeme tedy onu nezávislost předpokládat.

Podmínky pro použití testu nezávislosti v kontingenční tabulce:

• nejvíce 20 % teoretických četností může být menších než 5
• žádná teoretická četnost nesmí být menší než 1

Pro tabulku 2x2:
• n > 40
• pokud 20 < n < 40, pak je nutná úprava testového kritéria pomocí Yatesovy korekce
• pokud n < 20, pak použijeme Fisherův test

zdroje

Skalská H.: Aplikovaná statistika. Přednášky a materiály k předmětu APSTA,
2009. , pred_3_2009.pdf, Test nezávislosti v kontingenční tabulce - postup výpočtu