referat chi square

17
CHI SQUARE Tehnici neparametrice de comparatie între grupuri Tehnicile statistice parametrice pleaca de la o serie de conditii privind normalitatea si omogenitatea dispersiei distributiei rezultatelor subiectilor. Când acestea nu sunt îndeplinite sunt utilizate tehnicile neparametrice denumite si tehnici statistice independente de distributia datelor. Avantajele acestui tip de tehnici constau în diversitatea datelor care pot fi prelucrate atât calitativ cât si cantitativ. Dezavantajul principal este puterea mai mica de a detecta falsitatea unei ipoteze nule. Exista mai multe metode nonparametrice, cele mai întâlnite fiind: tehnica lui c 2 (chi patrat); testul U a lui Mann-Whitney (echivalentul testului parametric t independent); testul Wilcoxon al rangurilor pereche (echivalent ANOVA masuratori repetate ori t dependent); testul ANOVA Kruskal-Wallis al rangurilor (echivalent ANOVA simpla, însa datele sunt convertite în ranguri); testul Friedman ANOVA biunivoc al rangurilor (echivalent ANOVA masuratori repetate). Tehnica lui c2 Se aplica atunci când rezultatele sunt clasificate în functie de gen, vârsta, nivel de pregatire, grupuri de tratament sau orice alta masura nominala . Proba furnizeaza un test statistic asupra semnificatiei discrepantei dintre rezultatele observate si asteptate. De exemplu, studentul Ionel este superstitios. El crede ca o anumita sala îi poarta ghinion atunci când are de sustinut un examen. El a tinut evidenta tuturor salilor în care a dat examen.

Upload: alexandru-munteanu

Post on 20-Oct-2015

65 views

Category:

Documents


0 download

DESCRIPTION

Database mining, DB

TRANSCRIPT

CHI SQUARE

Tehnici neparametrice de comparatie ntre grupuri

Tehnicile statistice parametrice pleaca de la o serie de conditii privind normalitatea si omogenitatea dispersiei distributiei rezultatelor subiectilor. Cnd acestea nu sunt ndeplinite sunt utilizate tehnicile neparametrice denumite si tehnici statistice independente de distributia datelor.

Avantajele acestui tip de tehnici constau n diversitatea datelor care pot fi prelucrate att calitativ ct si cantitativ. Dezavantajul principal este puterea mai mica de a detecta falsitatea unei ipoteze nule. Exista mai multe metode nonparametrice, cele mai ntlnite fiind:

tehnica luic2 (chi patrat);

testulUa lui Mann-Whitney (echivalentul testului parametric t independent);

testul Wilcoxon al rangurilor pereche (echivalent ANOVA masuratori repetate ori t dependent);

testul ANOVA Kruskal-Wallis al rangurilor (echivalent ANOVA simpla, nsa datele sunt convertite n ranguri);

testul Friedman ANOVA biunivoc al rangurilor (echivalent ANOVA masuratori repetate).

Tehnica luic2

Se aplica atunci cnd rezultatele sunt clasificate n functie de gen, vrsta, nivel de pregatire, grupuri de tratament sau orice altamasura nominala. Proba furnizeaza un test statistic asupra semnificatiei discrepantei dintre rezultatele observate si asteptate.

De exemplu, studentul Ionel este superstitios. El crede ca o anumita sala i poarta ghinion atunci cnd are de sustinut un examen. El a tinut evidenta tuturor salilor n care a dat examen. n total a sustinut 120 de examene n 4 sali diferite, adica n medie 30 de examene n fiecare sala.

Iata situatia reala (observata) si pe cea teoretica, pentru fiecare sala n ce priveste examenele luate cu note ntre 5 si 7 ("operationalizarea ghinionului")

Numarul salii

1234Total

Observat (O)24342240120

Probabil (E)30303030120

Formula luic2:

Unde: O = frecventa observata;

E =frecventa probabila (teoretica, expectata).

SalaO - E(O E) (O E) / E

1-6361,20

2+4160,53

3-8642,13

4+101003,33

c2=7,19

Valoarea obtinuta este interpretata prin compararea ei cu valoarea corespondenta din tabelulc. Deoarece n cazul de fata exista patru variante (4 sali), numarul de grade de libertate este c-1, adica 3.

Valoarea luic2 de 7, 19 este mai mica dect cea din tabel la 3 df. Se observa ca la un prag de semnificatie p