17.teste neparametrice

Prof.univ.dr. Alin Gilbert Sumedrea – Statistică psihologică (curs universitar)

1

17. TESTE NEPARAMETRICE

17.1 TESTE PARAMETRICE VERSUS TESTE NEPARAMETRICE Testele statistice abordate anterior sunt cunoscute ca teste parametrice. Acestea implică ipoteze şi / sau presupuneri referitoare la parametrii şi distribuŃiile populaŃiilor. Din fericire aceste teste sunt destul de robuste. O abatere reală de la presupunerile menŃionate nu poate invalida testul atâta timp cât volumul eşantionului este mare. Totuşi, o problemă serioasă apare atunci când presupunerile făcute pe marginea distribuŃiilor sunt profund afectate şi mărimea eşantioanelor este mică. Pentru a compensa aceste neajunsuri statistica face apel la testele ne-parametrice. Aceste teste au calitatea de a fi mai puŃin restrictive în sensul nuanŃat mai sus (distribuŃie normală + volum mare de date). Ele se dovedesc mai puŃin senzitive decât testele parametrice dacă distribuŃiile de frecvenŃe sunt relativ normale iar volumul de date este mare. Prezentăm mai jos trei dintre cele mai utilizate teste ne-parametrice (testul Mann-Whitney, testul Kruskal-Wallis şi testul semnului). 17.1.1 TRANSFORMAREA SCORURILOR ÎN RANGURI

Anumite teste solicită transformarea scorurilor în ranguri. Utilizarea rangurilor nu necesită nici un fel de condiŃii referitoare la forma distribuŃiei populaŃiei, cu toate că cele mai multe (distribuŃii) pornesc de la ipoteza că „variabila” este continuă. Altfel, ne plasăm în domeniul variabilei discrete. În acest ultim caz apar situaŃii de scoruri identice ceea ce ridică problema stabilirii rangurilor. Cea mai simplă procedură de determinare a rangurilor constă în atribuirea pentru fiecare scor identic a unui rang mediu, calculat ca medie a rangurilor care ar fi fost înregistrate dacă acestea ar fi fost diferite.

Subiect 1 2 3 4 5 6 7 8 9

Scor 1 2 2 3 3 3 3 4 5

Rang 1 2+3=2,5

2 2+3

=2,52

5,5 5,5 5,5 5,5 8 9

___________________

4+5+6+7=5,5

4

Suma rangurilor astfel fixate trebuie să fie egală cu ( )2

1+nn , în cazul nostru 452

109 =⋅ .

Într-adevăr 45985,55,55,55,55,25,21 =++++++++ . 17.2 TESTUL MANN-WHITNEY

Testul Mann-Whitney este o alternativă la testul t pentru eşantioane independente. Se aplică în situaŃiile în care eşantioanele sunt mici, distribuŃiile datelor nu sunt normale iar datele pot fi prezentate sub formă de clasament. Logica testului este simplă şi fără complicaŃii.

Să presupunem că se dispune de două grupuri de câte 10 subiecŃi fiecare, pentru care distribuŃiile scorurilor sunt cele indicate în tabelul de mai jos.


2

Grup 1 1 1 1 1 1 1 1 1 1 2 2 2 2 2 2 2 2 2 2 Scor 5 6 7 8 9 10 11 12 13 14 16 17 18 19 20 21 22 23 24 25 Rang 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

5510...43211 =+++++=∑R

155201918..1312112 =++++++=∑R

Aşa cum se poate constata, scorurile grupului 1 sunt mai mici decât cele ale grupului 2 ceea ce explică şi diferenŃa dintre sumele rangurilor ( 10012 =−∑∑ RR ).

Refăcând componenŃa grupurilor prin trecerea unor subiecŃi din grupul 2 în grupul 1 şi invers, distribuŃia scorurilor, evident se modifică ca de altfel şi diferenŃa dintre sumele rangurilor (vezi tabelul de mai jos).

Grup 1 1 1 1 2 2 1 2 2 1 2 1 1 2 2 2 1 1 2 2 Scor 5 6 7 8 10 11 14 17 19 24 12 16 13 9 18 28 21 26 30 32 Rang 1 2 3 4 6 7 10 12 14 16 8 11 9 5 13 18 15 17 19 20

881 =∑R

1222 =∑R

În ciuda acestor „intercalări” ∑ 1R rămâne mai mică decât ∑ 2R . O altă re-aranjare,

ca în tabelul de mai jos, ne conduce la o echilibrare perfectă a celor două sume ale rangurilor:

Grup 1 2 2 1 1 2 2 1 2 1 2 1 2 1 2 1 1 1 2 2 Scor 5 6 7 8 9 10 11 12 13 14 16 17 18 19 4 24 26 28 30 32 Rang 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

1051 =∑R

1052 =∑R

Aceste exemple ilustrează semnificativ efectul întâmplării în dinamica rangurilor.

Testul Mann-Whitney este utilizat pentru a evalua discrepanŃa dintre sumele rangurilor a două eşantioane. Practic se urmăreşte să se vadă dacă discrepanŃa este suficient de mare pentru a nu mai putea fi explicată prin efectul întâmplării. Paşii urmăriŃi pentru aplicarea testului Mann-Whitney sunt:

1. Stabilirea celor două grupuri. Dacă cele două grupuri nu sunt egale în volum, atunci grupul cel mai mic va fi considerat grupul 1;

2. Combinarea tuturor scorurilor într-o distribuŃie de volum 21 nn + . În situaŃia identificării unor scoruri identice, pentru stabilirea rangurilor se aplică procedura de mai sus;

3. Se calculează suma rangurilor tuturor scorurilor în grupul 1. În anexa E sunt date valorile critice pentru ∑ 1R , corespunzând testului unilateral la pragurile

de: 0.005 ; 0.1 ; 0.025 şi 0.05; 4. Localizarea liniei din anexa E corespunzătoare lui 2n şi luarea deciziei în

funcŃie de următoarele situaŃii:


3

a) 211 : grupgrupH ≠ . Dacă ipoteza alternativă este bidirecŃională, se

găseşte intervalul pentru ∑ 1R corespunzător pragului de semnificaŃie

egal cu 2

α. Ipoteza nulă (în situaŃia în care nu există diferenŃe între cele

două populaŃii) este respinsă dacă ∑ 1R este egală sau mai mică decât

limita inferioară în anexă sau dacă este egală sau mai mare decât limita superioară; b) 211 : grupgrupH < . În cazul acestei ipoteze alternative

unidirecŃionale se găseşte intervalul pentru ∑ 1R corespunzător

pragului de semnificaŃie egal cu α . Ipoteza nulă se respinge dacă

∑ 1R este egală sau mai mică decât limita inferioară indicată în anexă;

c). 211 : grupgrupH > . Se aplică acelaşi raŃionament de mai sus cu

deosebirea că ipoteza nulă se respinge dacă ≥∑ 1R limita superioară

indicată.

Pentru testul Mann-Whitney statistica utilizată dacă nu se urmăresc situaŃiile a), b) şi c) este:

( )[ ]( )

12

1

15,0

2121

2111

++

++−= ∑

nnnn

nnnRz

Se acceptă ipoteza nulă dacă criticcalculat zz < .

EXEMPLU Presupunem că două grupuri de subiecŃi hiperemotivi sunt supuse la două tipuri de tratamente de psihoterapie, rezultatele post-terapii fiind cele indicate prin scorurile de mai jos (scorurile mari – indică hiperemotivitate ridicată, scorurile mici – hiperemotivitate apropiată de nivelurile liminale ale emotivităŃii).

Subiect 1 2 3 4 5 6 7 8 9 10 11 Grup 1 5 7 7 9 10 19 22 22 30 30 31 Grup 2 8 10 19 23 26 27 27 28 28 29 30

Se solicită un punct de vedere argumentat statistic referitor la cele două grupuri, urmărindu-se în realitate eficacitatea terapiilor. Calculăm rangurile pentru scorurile celor două grupuri.

Subiect 1 2 3 4 5 6 7 8 9 10 11 Grup 1 1 2,5 2,5 5 6,5 8,5 10,5 10,5 20 20 22 Grup 2 4 6,5 8,5 12 13 14,5 14,5 16,5 16,5 18 20

∑ =1091R

1442 =∑R


4

În anexa E pentru n1=11, n2=11 şi / 2 0.005α = , valoarea critică corespunzătoare este cuprinsă între 87 şi 166. Întrucât 1091 =∑R , se reŃine ipoteza nulă iar concluzia care se

trage este că cele două terapii au fost relativ de aceeaşi eficacitate. La acelaşi rezultat se poate ajunge calculând statistica z.

( )[ ]

( )15,1

22,15

5,126109

12

111111111

11111115,0109 −=−=++⋅

++−=z

Valoarea critică a statisticii z la un prag de semnificaŃie / 2 0,005α = este 58,2)005,0( ±=criticz . Cum ⇒< criticcalculat zz se acceptă ipoteza nulă.

17.3 TESTUL KRUSKAL-WALLIS

Testul Kruskal-Wallis este o alternativă la analiza de varianŃă pentru cazul unifactorial. Logica de bază a testului Kruskal-Wallis este similară cu cea a testului Mann-Whitney.

Presupunând că urmăm procedura de combinare a scorurilor de la k grupuri, scorurile fiind marcate cu ranguri de la 1 la knn ++ ...1 , în situaŃia în care

eşantioanele provin de la populaŃii similare ne aşteptăm ca sumele rangurilor pentru toate grupurile să fie relativ egale, eventualele diferenŃe datorându-se întâmplării. Dacă însă grupurile provin de la populaŃii diferite ne aşteptăm ca sumele rangurilor să difere semnificativ. Testul Kruskal-Wallis este destinat să măsoare aceste discrepanŃe. Statistica necesară aplicării acestui test se determină din relaŃia:

( )( ) ( ) ( ) ( )13...

1

122

2

2

2

1

2

1 +−

+++

+= ∑∑∑

totalk

k

totaltotal

nn

R

n

R

n

R

nnH

cu ∑ kR - suma rangurilor grupului k;

kn - numărul de cazuri în grupul k;

totaln - număr total de cazuri.

DistribuŃia de selecŃie teoretică a lui H aproximează distribuŃia 2χ . Pentru a aplica testul Kruskal-Wallis este nevoie să dispunem de cel puŃin trei grupuri, fiecare având un volum 5≥ . În testarea ipotezei nule kgrupgrupgrupH ...: 210 == se compară

valoarea calculată a lui H cu valorile critice 2χ pentru 1−k grade de libertate. EXEMPLU

15 studenŃi de la 3 specializări diferite sunt solicitaŃi să rezolve o problemă de atenŃie distributivă. Rezultatele sunt prezentate în tabelul din pagina alăturată.

StudenŃi în inginerie StudenŃi în arte plastice StudenŃi în matematică


5

timpi de rezolvare (min.) timpi de rezolvare (min.) timpi de rezolvare (min.) 1,10 0,6 0,7 1,12 0,5 0,8 1,14 1,17 1,16 1,23 1,27 1,15 1,18 1,21 1,19

Se solicită un punct de vedere statistic referitor la gradul în care cele trei specializări cultivă studenŃilor capacităŃi de atenŃie distributivă.

Se construieşte distribuŃia tuturor scorurilor obŃinute. Fiecărui scor i se atribuie un rang de la 1 la 15.

Timpii de soluŃionare a sarcinii de atenŃie distributivă (min.) şi rangurile corespunzătoare

StudenŃi în inginerie StudenŃi în arte plastice StudenŃi în matematică Scor rang scor rang scor rang 1,10 5 0,6 2 0,7 3 1,12 6 0,5 1 0,8 4 1,14 7 1,17 10 1,16 9 1,23 14 1,27 15 1,15 8 1,18 11 1,21 13 1,19 12

∑ = 431R ∑ = 412R

∑ = 363R

( ) [ ] 26,0482,965240

12482,2592,3368,369

240

121153

5

36

5

41

5

43

1615

12 222

=−⋅=−++=+−

++

⋅=H

Numărul gradelor de libertate = k-1=3-1=2, 99,5205,0 =χ . Cum ⇒< 2

05,0χH se

acceptă ipoteza nulă, ceea ce înseamnă că la nivelul celor trei specializări studenŃii dispun de capacităŃi sensibil egale de atenŃie distributivă. 17.4 TESTUL SEMNULUI Testul semnului este o alternativă la testul t pentru eşantioane dependente. Este utilizat pentru a compara „calitatea” a două distribuŃii în condiŃii de dependenŃă a eşantioanelor. EXEMPLU

Un grup de subiecŃi incapabili de încredere în forŃele proprii sunt evaluaŃi pe o scala de încredere cu note de la 1 la 7. După evaluare, aceştia beneficiază de terapie de specialitate la sfârşitul căreia sunt supuşi din nou evaluării. Rezultatele sunt cele prezentate în tabelul de mai jos.

Nivelul de încredere al subiecŃilor ante şi post terapie Subiect Ante Post DiferenŃă

1 1 4 +3 2 1 4 +3 3 2 6 +4 4 2 6 +4 5 1 7 +6 6 3 2 -1 7 1 4 +3 8 3 4 +1 9 2 3 +1 10 2 3 +1


6

Se cere să se aprecieze eficacitatea terapiei aplicate.

Pentru fiecare subiect se evaluează diferenŃa dintre stările post şi ante-terapie. Se calculează numărul diferenŃelor pozitive şi negative. Ipoteza nulă se formulează astfel: ProporŃia diferenŃelor pozitive este egală cu proporŃia diferenŃelor negative ( 5,0:0 =− −+ dd PPH ). În cazul exemplului prezentat, diferenŃa pozitivă semnalează

eficacitatea terapiei iar cea negativă – ineficacitatea. Folosirea testului 2χ solicită evaluarea valorile aşteptate pentru numărul diferenŃelor pozitive şi negative. Acestea vor fi f aşteptate ( ) f=+ aşteptate ( ) 5=− , numărul de subiecŃi chestionaŃi fiind de 10.

Valorile observate sunt 9)( =+of şi 1)( =−of . Calculând statistica 2χ , obŃinem:

( ) ( ) ( )2 2 2

02 9 5 1 5 16 16 326,4

5 5 5 5 5

aşteptate

aşteptate

f f

fχ

− − − = = + = + = =

∑

Dar 84,3205. =χ pentru un grad de libertate ( 12 −grupuri ) şi cum 2

05,02 χχ >calculat , se

respinge ipoteza nulă. Întrucât 5,09,0)( >=+observatP rezultă că eficacitatea terapiei

aplicate este dovedită.

17.teste neparametrice

Documents