referat chi square
DESCRIPTION
Database mining, DBTRANSCRIPT
CHI SQUARE
Tehnici neparametrice de comparatie ntre grupuri
Tehnicile statistice parametrice pleaca de la o serie de conditii privind normalitatea si omogenitatea dispersiei distributiei rezultatelor subiectilor. Cnd acestea nu sunt ndeplinite sunt utilizate tehnicile neparametrice denumite si tehnici statistice independente de distributia datelor.
Avantajele acestui tip de tehnici constau n diversitatea datelor care pot fi prelucrate att calitativ ct si cantitativ. Dezavantajul principal este puterea mai mica de a detecta falsitatea unei ipoteze nule. Exista mai multe metode nonparametrice, cele mai ntlnite fiind:
tehnica luic2 (chi patrat);
testulUa lui Mann-Whitney (echivalentul testului parametric t independent);
testul Wilcoxon al rangurilor pereche (echivalent ANOVA masuratori repetate ori t dependent);
testul ANOVA Kruskal-Wallis al rangurilor (echivalent ANOVA simpla, nsa datele sunt convertite n ranguri);
testul Friedman ANOVA biunivoc al rangurilor (echivalent ANOVA masuratori repetate).
Tehnica luic2
Se aplica atunci cnd rezultatele sunt clasificate n functie de gen, vrsta, nivel de pregatire, grupuri de tratament sau orice altamasura nominala. Proba furnizeaza un test statistic asupra semnificatiei discrepantei dintre rezultatele observate si asteptate.
De exemplu, studentul Ionel este superstitios. El crede ca o anumita sala i poarta ghinion atunci cnd are de sustinut un examen. El a tinut evidenta tuturor salilor n care a dat examen. n total a sustinut 120 de examene n 4 sali diferite, adica n medie 30 de examene n fiecare sala.
Iata situatia reala (observata) si pe cea teoretica, pentru fiecare sala n ce priveste examenele luate cu note ntre 5 si 7 ("operationalizarea ghinionului")
Numarul salii
1234Total
Observat (O)24342240120
Probabil (E)30303030120
Formula luic2:
Unde: O = frecventa observata;
E =frecventa probabila (teoretica, expectata).
SalaO - E(O E) (O E) / E
1-6361,20
2+4160,53
3-8642,13
4+101003,33
c2=7,19
Valoarea obtinuta este interpretata prin compararea ei cu valoarea corespondenta din tabelulc. Deoarece n cazul de fata exista patru variante (4 sali), numarul de grade de libertate este c-1, adica 3.
Valoarea luic2 de 7, 19 este mai mica dect cea din tabel la 3 df. Se observa ca la un prag de semnificatie p