statistica ii_seminar07-08_testul u-mann whitney

5
Statistică II - Seminarul 8 1. TESTUL U (MANN-WHITNEY) – PENTRU DATE NEPARAMETRICE Se compară datele de la 2 eşantioane independente pentru a vedea dacă sunt extrase din aceeaşi populaţie. Ipoteze: H 0 : R 1 = R 2 (unde R i este suma ponderată a rangurilor din grupul i); H 1 : R 1 R 2 . Condiţia de respingere H 0 şi acceptare H 1 : - pentru N 1 , N 2 < 20 se calculează valoarea U = min (R 1 2 ) 1 1 ( 1 + N N , R 2 2 ) 1 2 ( 2 + N N ) la tabelul Mann-Whitney; valoarea testului U trebuie să fie mai mică sau cel mult egală cu valoarea tabelară; - pentru N 1 , N 2 > 20 se ia în calcul valoarea R i cea mai mică i se calculează valoarea testului z care se va raporta la tabelul z. Dacă R 1 este valoarea mai mică se calculează statistica: 12 / ) 1 ( 2 1 2 / ) 1 ( 1 1 + + = N N N N N R z ; Dacă R 2 este valoarea mai mică se calculează statistica: 12 / ) 1 ( 2 1 2 / ) 1 ( 2 2 + + = N N N N N R z ; |z| calculat < z critic Acceptam H 0 |z| calculat > z critic Rspingem H 0 i acceptăm H 1 Exemplu: Se aplică un test pe două eşantioane: unul experimental (antrenat prealabil) şi unul de control (neantrenat) şi se obţin note de la 0 la 10. Ambele eşantioane au un volum de 25. Rezultatele sunt prezentate în tabelul de mai jos: Nota 0 1 2 3 4 5 6 7 8 9 10 Gr. exp. Frecv. 0 1 2 1 3 0 4 5 4 3 2 N=25 Nota 0 1 2 3 4 5 6 7 8 9 10 Gr. ctrl. Frecv. 4 3 4 2 3 4 1 1 2 1 0 N=25 1

Upload: lauric-ovidiu

Post on 06-Feb-2016

10 views

Category:

Documents


0 download

DESCRIPTION

spss

TRANSCRIPT

Page 1: Statistica II_seminar07-08_testul U-Mann Whitney

Statistică II - Seminarul 8

1. TESTUL U (MANN-WHITNEY) – PENTRU DATE NEPARAMETRICE Se compară datele de la 2 eşantioane independente pentru a vedea dacă sunt extrase din aceeaşi populaţie. Ipoteze:

H0: R1 = R2 (unde Ri este suma ponderată a rangurilor din grupul i); H1: R1 ≠ R2.

Condiţia de respingere H0 şi acceptare H1:

- pentru N1, N2 < 20 se calculează valoarea U = min (R1 – 2

)11(1 +NN, R2 –

2)12(2 +NN

) la

tabelul Mann-Whitney; valoarea testului U trebuie să fie mai mică sau cel mult egală cu valoarea tabelară;

- pentru N1, N2 > 20 se ia în calcul valoarea R i cea mai mică �i se calculează valoarea testului z care se va raporta la tabelul z.

Dacă R 1 este valoarea mai mică se calculează statistica: 12/)1(21

2/)1(11

+

+−=

NNN

NNRz ;

Dacă R 2 este valoarea mai mică se calculează statistica: 12/)1(21

2/)1(22

+

+−=

NNN

NNRz ;

|z|calculat < zcritic → Acceptam H0 |z|calculat > zcritic → Rspingem H0 �i acceptăm H 1 Exemplu: Se aplică un test pe două eşantioane: unul experimental (antrenat prealabil) şi unul de control (neantrenat) şi se obţin note de la 0 la 10. Ambele eşantioane au un volum de 25. Rezultatele sunt prezentate în tabelul de mai jos:

Nota 0 1 2 3 4 5 6 7 8 9 10 Gr. exp. Frecv. 0 1 2 1 3 0 4 5 4 3 2

N=25

Nota 0 1 2 3 4 5 6 7 8 9 10 Gr. ctrl. Frecv. 4 3 4 2 3 4 1 1 2 1 0

N=25

1

Page 2: Statistica II_seminar07-08_testul U-Mann Whitney

Statistică II - Seminarul 8

Se combină rezultatele, ordonând notele şi se calculează rangul fiecărei note:

Nota 10 9 8 7 6 5 4 3 2 1 0 Gr.exp.+ Gr.ctrl. f 2 4 6 6 5 4 6 3 6 4 4

ranguri 1,5 4,5 9,5 15,5 21 25,5 30,5 35 39,5 44,5 48,5 1

2 3 4 5 6

7 8 9 10 11 12

13 14 15 16 17 18

19 20 21 22 23

24 25 26 27

28 29 30 31 32 33

34 35 36

37 38 39 40 41 42

43 44 45 46

47 48 49 50

Gr. exp. Gr. ctrl.

Note f Rang f*Ran

g f Rang f*Rang10 2 1,5 3 0 1,5 09 3 4,5 13,5 1 4,5 4,58 4 9,5 38 2 9,5 197 5 15,5 77,5 1 15,5 15,56 4 21 84 1 21 215 0 25,5 0 4 25,5 1024 3 30,5 91,5 3 30,5 91,53 1 35 35 2 35 702 2 39,5 79 4 39,5 1581 1 44,5 44,5 3 44,5 133,50 0 48,5 0 4 48,5 194 R1 = 466 R2 = 809

R1+R2 trebuie să fie egal cu N(N+1)/2, unde N=N1+N2.

N(N+1)/2 = 2

5150 ∗ =1275

R1+R2=466+809=1275. Verificarea aceasta ne ajută să vedem dacă am calculat corect.

33.354,51

5,171

25,2656

637466

12/)12525(25*25

2/)12525(25466−=

−=

−=

++

++−=z

Pentru |z|>2,58 avem p<0,01 deci pentru cazul nostru p<0,01, deci respingem H0. Valorile critice pentru z la pragurile 0.05 şi 0.01 sunt: p 0.05 0.02 0.01 z 1.96 2.33 2.58

2

Page 3: Statistica II_seminar07-08_testul U-Mann Whitney

Statistică II - Seminarul 8

2. TESTUL U GENERALIZAT (KRUSKAL – WALLIS) – se compară mai multe serii de date (ordinale sau de interval dar care nu se distribuie normal) Exemplu: 5 grupe de experţi evaluatori acordă următoarele note unor subiecţi:

Notele acordate: Gr1 Gr2 Gr3 Gr4 Gr5

11 14 12 5 9

13 10 15 6 11

15 9 13 7 8

14 10

Se calculează rangul notelor: Nota 15 14 13 12 11 10 9 8 7 6 5 T

f 2 2 2 1 2 2 2 1 1 1 1 17

R 1, 3, 5, 7 8, 1 1 14 15 16 17 ang 5 5 5 5 0,5 2,5

1 2

3 4

5 6

7 8 9

11

11

14 15 16 17 0 1

2 3

Se calculează valoarea lui χ2 după formula: )1(3

2

)1(

122+−

+=

⎥⎥

⎢⎢

⎡∑ N

jn

jR

NNχ ;

N este volumul total al e�antionului; n j este volumul grupurilor; k este numărul de grupuri independente Gradele de libertate v = k – 1.

Rj este suma rangurilor notelor acordate de grupul j (în cazul nostru j de la 1 la 5);

Gr1 Gr2 Gr3 Gr4 Gr5 8.5 3.5 7 17 12.5 5.5 10.5 1.5 16 8.5 1.5 12.5 5.5 15 14 3.5 10.5

Rj 15.5 26.5 17.5 48 45.5 2jR 240.25 702.25 306.25 2304 2070.25

nj 3 3 4 3 4 Total 2jR /

nj

80.08 234.08 76.56 768.00 517.56 1676.28

N este numărul notelor acordate de fiecare grup: N=3+3+4+3+4=17

74,1118*328,1676*)117(17

122=−

+=χ ;

Ne uităm în tabel la ν=k-1 (k este numărul de grupuri), deci 5-1=4 şi la α=0,05 şi găsim 9,488, ceea ce înseamnă că se respinge H0, deci există diferenţe semnificative între cele 5 grupe de experţi.

3

Page 4: Statistica II_seminar07-08_testul U-Mann Whitney

Statistică II - Seminarul 8

3. χ2 McNEMAR – Test neparametric Condiţii:

• O variabilă dihotomică (cu două modalităţi) Ex: admis-respins; fumător - nefumător • Eşantioane perechi (dependente) Ex: situaţii de tip pretest / post-test; înainte şi după • Efectivele observate să fie mai mari de 10. (Mai mult de 10 schimbări: a + d > 10).

Deci testul McNemar:

• presupune încrucişarea a 2 variabile dihotomice (2 modalităţi x 2 momente) • Măsoară schimbarea:

- de la DA la NU (a) - de la DA la NU (b) - de la NU la DA (d) - de la NU la DA (c)

După NU DA

DA a b Înainte NU c d

După DA NU DA a b Înainte NU c d

Formula: χ2

McN = (a-d)2/(a+d) χ2McN = (b-c)2/(b+c)

Ipoteze:

H0: Schimbarea nu este semnificativă. H1: Schimbarea este semnificativă.

Condiţia de respingere H0 şi acceptare H1: χ2calculat ≥ χ2

(v; 1-α) v (nr. de grade de libertate) este mereu 1.

Exemplu: Cunoaştem că în eşantionul nostru de 200 de subiecţi avem 30% nefumători şi restul fumători. După prezentarea unui film despre efectele nocive ale fumatului, efectuăm o nouă investigaţie şi constatăm că procentul de fumători este de 20%. Este schimbarea semnificativă din punct de vedere statistic la un p = 0,05?

După DA

20% NU 80%

Total

DA 70%

14% 28 sub

56% 112 sub

N=200 Înainte: 30% nefum şi 70% fum După: 80% nefum şi 20% fum

a=70%x20%=14% → 200x14%=28 b=70%x80%=56%→200x56%=112 140 c=30%x20%=6% → 200x6%=12 Înainte

NU 30%

6% 12 sub

24% d=30%x80%=24% → 200x24%=48 48 sub 60

Total 40 χ2

McN = (b-c)2/(b+c) = (112-12)2/(112+12)= 160 = 10000/124=80,64

χ2(1; 95%) = 3,84 < 80,64 → Respingem H0 şi acceptăm H1 (Schimbarea este semnificativă)

200

4

Page 5: Statistica II_seminar07-08_testul U-Mann Whitney

Statistică II - Seminarul 8

4. χ2 CORIJAT Se aplică atunci când unul din efectivele observate este mai mic de 10.

- pentru eşantioane dependente (perechi) folosim formula corijată a lui McNemar: χ2

McNemar corijat = (|B-C| – 1)2/(B+C);

- pentru eşantioane independente folosim corecţia lui Yates: χ2

Yates = Σ[(|fo-ft| – 0,5)2/ft]; Recapitulare – exerci�iile de la chi pătrat, seminarul 6. TEMA – de adus după vacanţa de Paşte!

1. Verificaţi dacă există diferenţe semnificative între blonde şi brunete în ceea ce priveşte numărul de accidente rutiere produse.

Nr. Accidente 0 1 2 3 4 5 6 7 8 20 Total

Blonde 3 2 1 2 2 3 3 1 2 1 20 Grup Brunete 5 2 1 3 1 3 2 2 1 0 20

2. Într/un studiu ne-a interesat să aflăm dacă există diferenţe semnificative în funcţie de gen

în ceea ce priveşte implicarea în activităţi extraşcolare la liceeni. Datele obţinute au fost următoarele:

Implicare în activităţi extraşcolare Total Da Nu

Masculin 55 85 Gen biologic Feminin 85 45

Total Cerinţe:

(a) Realizaţi tabelul de contingenţă cu frecvenţele teoretice; (b) Verificaţi asocierea prin testul χ2 de asociere la un p=0,05.

5