spss_12_testeneparametrice

20
M. Popa – AplicaŃii SPSS (teste neparametrice) 1/20 Actualizat la: 08.11.2006/12:13:21 Teste neparametrice cu SPSS Testele neparametrice se utilizează în următoarele situaŃii: - atunci când variabila dependentă este măsurată pe scală nominală sau ordinală; - atunci când variabila dependentă este de tip categorial, indiferent de scala de măsurare; - atunci când, deşi variabila dependentă este măsurată pe scală cantitativă (interval sau raport), nu întruneşte condiŃiile impuse de testele parametrice: distribuŃie care se abate grav de la forma normală – asimetrie sau boltire mari, valori excesive: - volumul eşantionului este foarte mic. Tipurile de teste care vor fi tratate în continuare sunt următoarele: Teste neparametrice pentru date nominale: - testul z pentru proporŃia unui singur eşantion; - testul z pentru diferenŃa dintre proporŃiile a două eşantioane; - testul semnului; - testul chi-pătrat al asocierii (independenŃei); - testul chi-pătrat pentru gradul de corespondenŃă (goodness of fit). Teste neparametrice pentru date ordinale: - testul Mann-Whitney (U) pentru două eşantioane independente; - testul Wilcoxon pentru două eşantioane perechi ; - testul Kruskal-Wallis pentru mai mult de două eşantioane independente ; - testul Friedman pentru măsurări repetate; - teste de corelaŃie pentru date ordinale (Spearman, Kendall). A. Teste neparametrice pentru date nominale A. 1 Testul z al proporŃiei pentru un singur eşantion Utilizare Testul z pentru proporŃii pentru un eşantion, este utilizat în cazul variabilelor dihotomice, pentru a testa diferenŃa dintre proporŃiile valorilor în eşantion prin comparaŃie cu proporŃia la nivelul populaŃiei. Exemplu: La întrebarea „cine se uită la telenovele?” răspund DA 7 subiecŃi, dintre care 5 femei şi 2 bărbaŃi. Întrebarea cercetării este dacă femeile se uită într-o proporŃie mai mare decât bărbaŃii la telenovele. CondiŃii Cunoaşterea proporŃiei la nivelul populaŃiei pentru valorile variabilei testate. În cazul nostru, raportul femei/bărbaŃi este cunoscut din studiile demografice (51%-49%) Aranjarea datelor Se creează variabila dihotomică cu valori numerice. Variabilele de tip „string” nu sunt acceptate de procedura SPSS. În cazul nostru, valorile sunt 1 pentru feminin şi 2 pentru masculin.

Upload: meda-luca

Post on 22-Jun-2015

811 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: SPSS_12_testeneparametrice

M. Popa – AplicaŃii SPSS (teste neparametrice)

1/20 Actualizat la: 08.11.2006/12:13:21

Teste neparametrice cu SPSS Testele neparametrice se utilizează în următoarele situaŃii:

- atunci când variabila dependentă este măsurată pe scală nominală sau ordinală;

- atunci când variabila dependentă este de tip categorial, indiferent de scala de măsurare;

- atunci când, deşi variabila dependentă este măsurată pe scală cantitativă (interval sau raport), nu întruneşte condiŃiile impuse de testele parametrice: distribuŃie care se abate grav de la forma normală – asimetrie sau boltire mari, valori excesive:

- volumul eşantionului este foarte mic.

Tipurile de teste care vor fi tratate în continuare sunt următoarele:

Teste neparametrice pentru date nominale: - testul z pentru proporŃia unui singur eşantion; - testul z pentru diferenŃa dintre proporŃiile a două eşantioane; - testul semnului; - testul chi-pătrat al asocierii (independenŃei); - testul chi-pătrat pentru gradul de corespondenŃă (goodness of fit).

Teste neparametrice pentru date ordinale:

- testul Mann-Whitney (U) pentru două eşantioane independente; - testul Wilcoxon pentru două eşantioane perechi ; - testul Kruskal-Wallis pentru mai mult de două eşantioane independente ; - testul Friedman pentru măsurări repetate; - teste de corelaŃie pentru date ordinale (Spearman, Kendall).

A. Teste neparametrice pentru date nominale

A. 1 Testul z al proporŃiei pentru un singur eşantion

Utilizare Testul z pentru proporŃii pentru un eşantion, este utilizat în cazul variabilelor

dihotomice, pentru a testa diferenŃa dintre proporŃiile valorilor în eşantion prin comparaŃie cu proporŃia la nivelul populaŃiei.

Exemplu: La întrebarea „cine se uită la telenovele?” răspund DA 7 subiecŃi, dintre care 5 femei şi 2 bărbaŃi. Întrebarea cercetării este dacă femeile se uită într-o proporŃie mai mare decât bărbaŃii la telenovele.

CondiŃii

Cunoaşterea proporŃiei la nivelul populaŃiei pentru valorile variabilei testate. În cazul

nostru, raportul femei/bărbaŃi este cunoscut din studiile demografice (51%-49%) Aranjarea datelor Se creează variabila dihotomică cu valori numerice. Variabilele de tip „string” nu

sunt acceptate de procedura SPSS. În cazul nostru, valorile sunt 1 pentru feminin şi 2 pentru masculin.

Page 2: SPSS_12_testeneparametrice

M. Popa – AplicaŃii SPSS (teste neparametrice)

2/20 Actualizat la: 08.11.2006/12:13:21

Procedura: Statistics-Non Parametric Tests-Binomial...

• Variabila testată este trecută în lista Test Variable List: • În zona Define Dichotomy se alege Get from data, dacă variabila este

dihotomică, sau Cut point, dacă variabila este continuă, prin fixarea unei valori care împarte distribuŃia în două categorii.

• În zona Test proportion se introduce proporŃia primei categorii. • Butonul Options permite solicitarea statisticii descriptive pentru variabila

testată.

Rezultate Rezultatul în cazul exemplului dat cuprinde frecvenŃa pe categorii, procentul şi

semnificaŃia testului în raport cu proporŃia la nivelul populaŃiei (p=0.243).

În acest caz, se acceptă ipoteza de nul şi se respinge ipoteza cercetării. ProporŃia

femeilor care se uită la telenovele nu diferă semnificativ de proporŃia bărbaŃilor, prin raportare la proporŃia lor în populaŃia generală.

Page 3: SPSS_12_testeneparametrice

M. Popa – AplicaŃii SPSS (teste neparametrice)

3/20 Actualizat la: 08.11.2006/12:13:21

A. 2 Testul z al diferenŃei dintre două proporŃii independente

Utilizare

Acest test se utilizează atunci când se doreşte compararea a două proporŃii obŃinute pentru o variabilă dihotomică. Exemplu: În urma unui studiu cu privire la interesul faŃă de fenomenele paranormale, efectuat în rândul studenŃilor de la Universitate, comparativ cu studenŃii de la Politehnică, se înregistrează următoarele rezultate1:

• La psihologie: 25 studenŃi „nu cred” în fenomenele paranormale, iar 175 „cred”

• La politehnică: 124 „nu cred” în fenomenele paranormale, iar 32 „cred” Problema cercetării este dacă diferenŃa dintre cei „cred” în fenomenele paranormale

din cele două categorii de studenŃi este semnificativă.

Aranjarea datelor Datele pot fi introduse fie caz cu caz, existând o variabilă pentru opinia faŃă de

fenomenele paranormale şi una pentru tipul de instituŃie de învăŃământ, fie ca în imaginea de mai jos, care presupune o prealabilă sintetizare a datelor:

• o variabilă (paranorm) pentru codificare „credinŃei” în fenomenele paranormale;

• o variabilă (stud_la) pentru apartenenŃa la una din cele două instituŃii de învăŃământ superior;

• o variabilă (frecv) pentru frecvenŃa cazurilor.

� Este important de reŃinut faptul că toate variabilele trebuie să fie numerice. În baza de date de mai sus, variabila paranorm ia valoarea 1 pentru „cred” şi valoarea 2 pentru „nu cred”, iar variabila stud_la are valoarea 1 pentru Universitate şi 2 pentru Politehnică.

� Valorile variabilelor au fost etichetate corespunzător, iar afişarea etichetelor în locul valorilor, în celulele tabelului de date, a fost obŃinută cu setarea View-Value labels din meniul SPSS Data Editor. De reŃinut că, deşi afişează etichetele, SPSS va opera în calcule cu valorile.

Procedura: SPSS nu dispune de o procedură specifică pentru calcularea directă a

diferenŃei dintre două procente. În acest scop se utilizează procedura Crosstabs şi testul chi-pătrat.

� În prealabil, se execută procedura Weight pentru variabilele categoriale (paranorm şi stud_la) în funcŃie de variabila frecv, care contorizează numărul cazurilor.

1 Datele nu sunt reale

Page 4: SPSS_12_testeneparametrice

M. Popa – AplicaŃii SPSS (teste neparametrice)

4/20 Actualizat la: 08.11.2006/12:13:21

OperaŃia asociază valorile variabilelor categoriale (paranorm şi stud_la) cu valorile variabile frecv. Efectul ei este unul „invizibil” pe ecran, dar se va reflecta în analizele statistice ulterioare.

� Efectul de ponderare (weight) a unei variabile rămâne activ atâta timp cât nu se ponderează o altă variabilă sau nu se anulează ponderarea efectuată. La salvarea fişierului se salvează şi variabila ponderată. Includerea variabilei ponderate în diverse proceduri de analiză are efecte specifice.

� Dacă datele ar fi fost introduse în baza de date caz cu caz, operaŃia Wheight nu ar mai fi fost necesară.

� Se execută procedura Statistics-Summarize-Crosstabs... pentru variabilele

paranorm şi stud_la, cu selectarea Chi-Square din caseta Statistics. (nu mai prezentăm imaginile, acestea fiind identice cu cele de la testul chi-pătrat).

Rezultate

SPSS Viewer prezintă mai întâi tabelul de corespondenŃă dintre variabilele

categoriale, cu valorile variabilei ponderate prin procedura Wheight.

Din tabelul Chi-Square Tests citim valoarea Pearson Chi-Square (161.598).

Testul z pentru diferenŃa proporŃiilor se calculează prin extragerea radicalului din valoarea lui chi-pătrat:

71.12598.161 ==z Semnul lui z se află din diferenŃa proporŃiilor testate, astfel:

Page 5: SPSS_12_testeneparametrice

M. Popa – AplicaŃii SPSS (teste neparametrice)

5/20 Actualizat la: 08.11.2006/12:13:21

67.0205.0875.0156

32

200

175+=−=−=− ba pp

Decizia statistică se ia prin raportarea valorii calculate a lui z la valorile critice ale acestuia de pe curba normală, pentru test unilateral sau bilateral. În cazul nostru, pentru test bilateral, cu alfa=0.05, z calculat (12.71) este mai mare decât z critic (1.96), fapt care permite respingerea ipotezei de nul şi confirmarea ipotezei că studenŃii de la Universitate „cred” într-o măsură semnificativ mai mare în fenomenele paranormale decât studenŃii de la Politehnică.

A. 3 Testul semnului

Utilizare

Testul semnelor este utilizat pentru a testa diferenŃa dintre valori, utilizându-se

semnul diferenŃei şi nu valoarea acesteia, atunci când ambele valori sunt măsurate pentru aceiaşi subiecŃi. Dacă nu ar exista nici o diferenŃă între valorile perechi, atunci numărul diferenŃelor pozitive ar trebui să fie egal cu cel al diferenŃelor negative. Cu cât numărul diferenŃelor de un anumit semn este mai mare, comparativ cu cel al diferenŃelor de semn opus, cu atât creşte probabilitatea ca diferenŃa dintre variabile să fie statistic semnificativă.

Exemplu: Într-un experiment cu privire la efectul motivării asupra memorării, subiecŃilor (N=8) li se cere să memoreze cuvinte dintr-o listă, înainte si după introducerea unui factor motivant. Dat fiind faptul că numărul subiecŃilor este prea mic pentru asumarea normalităŃii distribuŃiei de eşantionare, se alege testul semnului în locul testului t pentru eşantioane dependente.

CondiŃii Variabilele vor fi de tip numeric, iar valorile exprimate în aceeaşi unitate de măsură,

pentru a se putea face diferenŃa lor. Aranjarea datelor Imaginea de mai jos conŃine variabilele „inainte” şi „dupa”, care vor fi analizate.

Variabila „dif” conŃine rezultatul diferenŃei „dupa-inainte”. Variabila „semn”, conŃine semnul diferenŃei. Ambele sunt prezentate numai pentru a

face mai evident baza de calcul a testului deoarece, în fapt, nu sunt relevante sub aspectul procedurii SPSS.

Dacă nu se dispune de valorile variabilelor, ci numai de semnul diferenŃei, testul semnului va fi calculat manual, pe baza formulei 4.7.

Page 6: SPSS_12_testeneparametrice

M. Popa – AplicaŃii SPSS (teste neparametrice)

6/20 Actualizat la: 08.11.2006/12:13:21

Procedura: Statistics-Nonparametric Tests-2 Related Samples...

În prima fază, cele două variabile sunt selectate, pe rând, prin clic de mouse pe fiecare, constituindu-se în pereche. Acest fapt se observă în partea de jos a casetei, în zona Current Selections. Se bifează Sign în zona Test Type.

Apoi, perechea de variabile este trecută în lista Test Pair(s) List: prin acŃionarea butonului ►. Dacă este necesar, se pot testa simultan mai multe perechi de variabile.

Rezultate Tabelul Sign Test cuprinde numărul diferenŃelor pozitive, respectiv negative, pentru

cazurile din baza de date. În cazul nostru, există 7 diferenŃe pozitive şi nici o diferenŃă negativă.

Tabelul Test Statistics, prezintă semnificaŃia testului (p=0.016). Ipoteza de nul se

respinge dacă valoarea lui p este mai mică decât pragul fixat şi care, implicit, este 0.05. În exemplul dat, ipoteza de nul se respinge, acceptându-se ipoteza cercetării (motivarea stimulează memorarea).

Page 7: SPSS_12_testeneparametrice

M. Popa – AplicaŃii SPSS (teste neparametrice)

7/20 Actualizat la: 08.11.2006/12:13:21

A.4 Testul Chi-pătrat al asocierii (independeŃei)

Utilizare Testul chi-pătrat este utilizat pentru evidenŃierea gradului de asociere între două

variabile categoriale. Exemplu: Să presupunem că am evaluat numărul femeilor şi al bărbaŃilor, pasageri

într-un avion care a suferit un accident la aterizare, fără victime, diagnosticaŃi cu sindrom de stres posttraumatic (PTSD). FrecvenŃele absolute sunt cele din următorul tabel de corespondenŃă:

Problema cercetării este dacă incidenŃa PTSD este în legătură cu caracteristica de sex.

CondiŃii

• Variabile categoriale, care pot fi exprimate, fie prin valori numerice, fie prin valori de tip string (caracter tipăribil)

• Cele două variabile nu trebuie să se „intersecteze” (să nu existe subiecŃi care să fie incluşi în mai mult de o celulă de tabel).

• Este recomandabil ca frecvenŃa aşteptată să nu ia valori mai mici de 5 (sau, cel puŃin, în nu mai mult de 20% din celule).

• Nici o celulă nu trebuie să aibă frecvenŃa aşteptată 0.. Aranjarea datelor Datele pot fi incluse în Data Editor în două moduri: a. Sub forma unor înregistrări distincte pentru fiecare caz

Acest mod poate fi extrem de dezavantajos atunci când sunt multe cazuri sau când există deja o statistică globală a fenomenului PTSD în raport cu sexul.

b. Sub forma unor înregistrări distincte pentru valorile caracteristicii de sex:

Femei BărbaŃi

PTSD 40 20

Non-PTSD 10 30

Page 8: SPSS_12_testeneparametrice

M. Popa – AplicaŃii SPSS (teste neparametrice)

8/20 Actualizat la: 08.11.2006/12:13:21

În această situaŃie, se introduc frecvenŃele PTSD pentru toate combinaŃiile valorilor celor două variabile analizate şi frecvenŃele asociate fiecăreia. Pentru a se realiza corespondenŃa dintre variabilele sex şi PTSD cu variabila frecv, se apelează la procedura Data-Wheight Cases...:

Facem precizarea că în tabelele de date din imaginile de mai sus variabilele au fost codificate numeric cu 1 respectiv 2, atât pentru sex cât şi pentru PTSD, valorile fiind etichetate. Faptul că în celule apar etichetele şi nu valorile, se obŃine prin setarea Data-Value Labels.

� Procedura chi-pătrat acceptă şi variabile de tip caracter (string), dar reamintim recomandarea de principiu ca toate variabilele să fie declarate de tip numeric.

Procedura: Statistics-Summarize-Crosstabs... Casetele de configurare sunt următoarele:

• În caseta principală Crosstabs se trec variabilele analizate în lista Row(s), respectiv Columns(s). Pot fi analizate mai multe perechi de variabile simultan. Rezultatul analizei nu depinde de modul de plasare a variabilelor pe linie sau pe coloană. Dacă de doreşte crearea unui grafic al corespondenŃei dintre variabile, se va bifa şi Display clustered bar charts.

• În caseta Statistics se bifează Chi-Square. • În caseta Cell Display se bifează Counts-Observed; Percentages-Row, Column, Total

şi Residuals-Unstandardized (bifarea opŃiunilor este în funcŃie de informaŃiile pe care le doreşte analistul). Rezultate Imaginea prezintă tabelul de corespondenŃă, având pe linii valorile caracteristicii de

sex iar pe coloane valorile aferente variabilei PTSD. În celulele tabelului se află valorile solicitate prin configurarea casetelor. Vom exemplifica pentru celula „feminin/da”:

Page 9: SPSS_12_testeneparametrice

M. Popa – AplicaŃii SPSS (teste neparametrice)

9/20 Actualizat la: 08.11.2006/12:13:21

• Count 40 indică numărul femeilor cu PTSD • %within Sex 80.0% indică procentul femeilor care au manifestat PTSD din totalul

femeilor • %within PTSD 66.7% indică procentul femeilor cu PTSD din totalul celor care au

manifestat PTSD • % of Total 40% indică procentul femeilor cu PTSD din totalul subiecŃilor • Residual 10% indică diferenŃa dintre numărul de femei cu PTSD (frecvenŃa

observată) şi frecvenŃa aşteptată (în cazul nostru, +10)

În tabelul Chi-Square Tests citim valoarea testului Pearson Chi-Square (16.66) şi, în

special, pragul de semnificaŃie al acestuia (p=0.000 care va fi citit ca p<0.001). În cazul particular al acestui exemplu, unde tabelul de corespondenŃă este format din două linii şi două coloane, valoarea lui chi-pătrat poate fi luată de pe linia Continuitiy Correction (15.04) cu valoarea aferentă a pragului de semnificaŃie: p<0.0005.

Valoarea lui p pentru testului chi-pătrat fiind mai mică decât nivelul alfa 0.05, se respinge ipoteza de nul şi se confirmă ipoteza cercetării: există o incidenŃă mai mare a reacŃiei de stres posttraumatic la femei decât la bărbaŃi.

� În raportarea statisticii chi-pătrat va fi inclusă valoarea gradelor de libertate (df) şi

numărul cazurilor � Valoarea lui chi-pătrat se raportează cu două zecimale

Page 10: SPSS_12_testeneparametrice

M. Popa – AplicaŃii SPSS (teste neparametrice)

10/20 Actualizat la: 08.11.2006/12:13:21

Graficul de tip bară permite vizualizarea relaŃiei dintre variabile:

A.5 Testul chi-pătrat pentru gradul de corespondenŃă (goodness of fit)

Utilizare Testul chi-pătrat pentru gradul de corespondenŃă se utilizează atunci când dorim să

comparăm frecvenŃele observate ale unei singure variabile categoriale, cu frecvenŃele aşteptate ale acesteia, dinainte cunoscute.

Exemplul 1: Avem evaluarea nivelului de inteligenŃă pe cinci categorii valorice, de la foarte slab, la foarte bun şi dorim să ştim dacă distribuŃia acestor calificative se supune curbei normale, procentele aferente pe curba normală fiind cunoscute (2.5%, 14%, 67%, 14%, 2.5%).

Exemplul 2: Am solicitat unui grup de tineri să îşi exprime genul muzical preferat şi am obŃinut frecvenŃe diferite pentru mai multe genuri de muzică. Problema cercetării este dacă diferenŃele dintre aceste frecvenŃe sunt semnificative. Ipoteza de nul în acest caz este că preferinŃele se distribuie egal între genurile muzicale (adică, dacă ar fi trei genuri, fiecare ar trebui să întrunească un procent de 33.33%).

Aranjarea datelor

Vom exemplifica pe o situaŃie corespunzătoare celui de-al doilea exemplu. Baza de

date se poate constitui fie prin înregistrarea fiecărui caz în parte (având o variabilă pentru genul muzical şi o alta pentru exprimarea preferinŃei faŃă de acesta), fie, ca în exemplul anterior, prin înregistrarea rezultatelor sintetice şi ponderarea variabilei gen_muz cu variabila frecv prin operaŃia Data-Weight cases...:

Page 11: SPSS_12_testeneparametrice

M. Popa – AplicaŃii SPSS (teste neparametrice)

11/20 Actualizat la: 08.11.2006/12:13:21

Procedura: Statstics-NonParametric-Tests-Chi-Square...

• În caseta Chi-Square Test se trece variabila analizată în zona Test Variable List.

• Se bifează All categories equal, acesta fiind modelul în raport cu care dorim să testăm frecvenŃele variabilei analizate

• Dacă am fi dorit să le testăm în raport cu alte frecvenŃe cunoscute, am fi bifat Values şi, apoi, am fi introdus pe rând acele frecvenŃe (scriindu-le în dreptul lui Values şi înregistrându-le prin butonul Add)

Rezultate Cele două tabele cu rezultate din Viewer prezintă:

• FrecvenŃele observate, frecvenŃele aşteptate şi valorile reziduale (diferenŃa dintre frecvenŃe) pentru cele trei genuri muzicale

• Valoarea testului chi-pătrat al corespondenŃei (12.17), df(2) şi p=0.002

Acest rezultat justifică respingerea ipotezei de nul şi acceptarea concluziei că diferenŃele dintre preferinŃele pentru cele trei genuri muzicale sunt semnificative şi nu se datorează variaŃiei întâmplătoare de eşantionare.

B. Teste neparametrice pentru date ordinale B. 1 Testul Mann-Whitney (U) pentru două eşantioane independente Utilizare Testul Mann-Whitney este utilizat pentru testarea diferenŃei dintre grupuri independente pentru care variabila dependentă este exprimată în valori ordinale (de rang) sau atunci când, chiar dacă este de tip cantitativ, nu suportă un test parametric (testul t). Exemplu: La ieşirea dintr-un club de noapte, un psiholog interesat de efectul depresiv al drogurilor a efectuat interviuri în legătură cu acest aspect şi a identificat un număr de 10 tineri care au consumat câte o pastilă de Ecstasy şi un număr de 10 tineri care au consumat doar alcool. Apoi i-a convins să ia parte la un experiment şi le-a administrat un chestionar de

Page 12: SPSS_12_testeneparametrice

M. Popa – AplicaŃii SPSS (teste neparametrice)

12/20 Actualizat la: 08.11.2006/12:13:21

evaluare a depresiei. Acelaşi chestionar a fost aplicat din nou, peste trei zile. Obiectivele studiului sunt:

a. verificarea ipotezei că cele două tipuri de drog (Ecstasy şi alcool) au efecte depresante diferite între ele;

b. Ecstazi are un efect depresant pe termen lung, mai mare decât alcoolul. În acest scop vor trebui comparate valorile la depresie ale celor două grupuri. Această analiză va fi efectuată atât pentru valorile depresiei de la prima măsurare cât şi pentru cele de la a doua evaluare a depresiei (după trei zile). Aranjarea datelor

Variabilele din baza de date sunt următoarele:

• cod_sub, un cod numeric de identificare a fiecărui subiect (deşi exemplele anterioare nu au cuprins această variabilă, ea nu trebuie să lipsească din nici o baza de date)

• drog, pentru tipul de drog utilizat (sunt afişate etichetele, iar valorile sunt 1=Ecstasy, 2=Alcool)

• depr_1, scorul la depresie la prima evaluare • depr_2, scorul la depresie la a doua evaluare

� Variabilele dependente din exemplul nostru au valori măsurate pe scală cantitativă.

Testarea lor cu un test ordinal nu presupune o prealabilă transformare de rang, programul efectuând automat această transformare. Procedura se aplică în acelaşi mod şi direct pe valori ordinale de rang.

Procedura: Statistics-Non Parametric Tests-2 Independent Samples...

Se cuvine să precizăm că, în mod normal, datele de acest tip ar conduce la utilizarea testului t pentru eşantioane independente. Cu toate acestea, având în vedere volumul foarte mic al eşantionului, utilizarea unui test neparametric este de preferat.

Page 13: SPSS_12_testeneparametrice

M. Popa – AplicaŃii SPSS (teste neparametrice)

13/20 Actualizat la: 08.11.2006/12:13:21

În caseta Two-Independent Samples Tests variabilele analizate sunt trecute în lista Test Variable List. Rezultate Tabelul Ranks oferă informaŃii sintetice despre cele două variabile: volumul grupurilor, media rangurilor şi suma rangurilor.

Tabelul Test Statistics include valorile testului Mann-Whitney pentru cele două variabile testate simultan, depresia imediată şi remanentă. Valorile de interes din tabel sunt cele ale lui Z şi nivelul de încredere p. În cazul nostru, se observă că depresia imediată nu diferă semnificativ în funcŃie de tipul de drog utilizat, în timp ce depresia remanentă este semnificativ diferită, mai mare la utilizatorii de Ecstasy decât la utilizatorii de alcool (conform datelor din tabelul anterior).

B. 2 Testul Wilcoxon pentru două eşantioane perechi Utilizare În exemplul anterior, pentru testul Mann-Whitney, psihologul a testat diferenŃa intensităŃii depresiei între consumatorii de Ecstasy şi alcool, imediat şi după trei zile. Rezultatul a fost acela că efectul depresiv nu este diferit pe termen imediat, dar este semnificativ diferit după trei zile. Datele pot fi analizate însă şi separat, pe fiecare grup de

Page 14: SPSS_12_testeneparametrice

M. Popa – AplicaŃii SPSS (teste neparametrice)

14/20 Actualizat la: 08.11.2006/12:13:21

consumatori (Ecstasy, respectiv alcool) în cele două momente diferite (imediat şi după trei zile). Dacă testul Mann-Whitney a verificat ipoteza diferenŃei dintre categorii de consumatori (eşantioane independente), testul Wilcoxon va permite testarea ipotezei că depresia este diferită de la un moment la altul în cadrul fiecărei categorii de consumatori în parte (eşantioane dependente). Facem precizarea că aceste două teste nu trebuie întotdeauna utilizate împreună, succesiv, ca în exemplul acestui studiu. Dacă facem aici acest lucru, este numai pentru că ne-am propus două obiective distincte, fiecare fiind testat cu o procedură diferită, în funcŃie de natura eşantioanelor comparate. Aranjarea datelor

Este identică cu cea prezentată pentru testul Mann-Whitney. În acest caz, deoarece analiza trebuie efectuată separat pe grupurile de consum Ecstasy/Alcool, există două soluŃii. Prima ar fi selectarea (cu Data-Select Cases) a primului grup şi efectuarea testului, apoi selectarea celui de-al doilea grup şi efectuarea testului. O soluŃie mai elegantă este însă aceea de a declara împărŃirea bazei de date în funcŃie de grupurile definite prin tipul de drog. În acest scop se va utiliza procedura Data-Split File...

În locul setării implicite Analyze all cases, do not create groups, se bifează opŃiunea Compare groups şi se declară variabila ale cărei valori vor servi drept criteriu de împărŃire a bazei de date în grupuri de analiză separată (în cazul nostru, tipul de drog) prin trecerea ei în zona Groups Based on:. Efectul acestei acŃiuni este acela că toate prelucrările care vor fi efectuate din acest moment se vor aplica, separat, pe fiecare grup identificat prin valorile variabilei.

� OperaŃiunea de împărŃire a bazei de date nu are semne vizibile pe ecran, fapt care poate face să fie uitată şi, astfel, atunci când se revine la prelucrări care ar trebui să implice toată baza de date rezultatele vor fi incorecte. De aceea, se va avea în vedere revenirea la setarea Analyze all cases, do not create groups atunci prelucrarea pe grupuri a bazei de date nu mai este becesară.

Page 15: SPSS_12_testeneparametrice

M. Popa – AplicaŃii SPSS (teste neparametrice)

15/20 Actualizat la: 08.11.2006/12:13:21

Procedura: Statistics-Non Parametric Tests-2 Related Samples... Setarea procedurii în caseta Two-Related-Samples tests se face în doi timpi: 1. Se selectează prin clic de mouse fiecare variabilă, constituindu-se perechea supusă analizei

2. Se acŃionează butonul ► pentru a se transfera perechea de variabile în zona Test Pair(s) list.

Se bifează opŃiunea pentru testul Wilcoxon (care este, de fapt, cea implicită) Rezultate

Tabelul Ranks oferă informaŃii sintetice despre rangurile pozitive şi negative pentru cele două grupuri, numărul subiecŃilor, media rangurilor şi suma lor.

Tabelul Test Statistics prezintă valorile comparative ale depresiei pentru cele două grupuri. Aşa cum se observă, diferenŃa este semnificativă (p=0.007) în cazul consumatorilor de Ecstasy şi nesemnificativă (p=0.053), în cazul consumatorilor de alcool. Concluzia generală a studiului este aceea că Ecstasy, comparativ cu alcoolul, are un efect depresiv mai mare (testul Mann-Whitney) şi mai accentuat cu trecerea timpului (testul Wilcoxon).

Aducem aminte că testul Wilcoxon presupune calcularea a două valori, T(+) pentru diferenŃa pozitivă a rangurilor şi T(-) pentru diferenŃa negativă a rangurilor, cea mai mică dintre ele fiind considerată valoarea testului. În exemplul nostru, testul Wilcoxon pentru Ecstazy a fost calculat "pe baza rangurilor negative" (vezi nota a. de sub tabel), ceea ce înseamnă că acestea au fost mai puŃine, iar cele pozitive au fost mai multe. Ori, diferentele pozitive de rang exprima valori ale depresiei mai mari după trei zile decât după o zi. Asta, deoarece SPSS atribuie rangul 1 valorii celei mai mici, şi rangul cel mai mare valorii celei

Page 16: SPSS_12_testeneparametrice

M. Popa – AplicaŃii SPSS (teste neparametrice)

16/20 Actualizat la: 08.11.2006/12:13:21

mai mari din distribuŃie. Ca urmare, este corect să concluzionăm că rezultatul testului indică o valoare semnificativ mai mare a depresiei după trei zile decât după o zi.

B. 3 Testul Kruskal-Wallis pentru mai mult de două eşantioane independente Utilizare Testul Kruskal-Wallis este utilizat atunci când avem o variabilă dependentă ordinală, măsurată pentru mai mult de două grupuri independente (formate din subiecŃi diferiŃi), şi dorim să testăm diferenŃa dintre acestea. Acest test pentru date ordinale este analog testului ANOVA pentru date cantitative. Exemplu: A fost studiată relaŃia dintre condiŃiile familiale (familie armonioasă, mamă singură, familie conflictuală) şi frecvenŃa reacŃiilor emoŃionale pozitive la copiii de vârstă preşcolară, pe durata unei săptămâni. Problema cercetării este dacă diferenŃele sunt semnificative iar mediul familial are legătură conduita emoŃională a copiilor. Aranjarea datelor se face ca în imaginea alăturată:

În baza de date, variabila familie a fost codificată şi etichetată astfel: 1=familie armonioasă, 2=mamă singură, 3=familie conflictuală. Etichetele sunt afişate ca urmare a opŃiunii Data-Value Labels. Rezultatele vor fi identice dacă variabila dependentă este exprimată şi direct în valori de rang. Procedura: Statistics-Non Parametric tests- k Independent Samples...

În caseta principală se trece variabila testată în zona Test Variable List: iar variabila independentă în zona Gouping Variable. Se activează comanda Define Range...

Se defineşte domeniul valorilor variabilei independente, în cazul nostru: minim 1, maxim 3.

Forma finală a casetei este aceasta. Testul Kruskal-Wallis este bifat implicit.

Page 17: SPSS_12_testeneparametrice

M. Popa – AplicaŃii SPSS (teste neparametrice)

17/20 Actualizat la: 08.11.2006/12:13:21

Rezultate

Primul tabel include informaŃii descriptive cu privire la variabila testată: numărul subiecŃilor din fiecare grup şi media rangurilor pentru fiecare grup. De precizat că programul acordă rangul 1valorii celei mai mici. Datele din tabel indică descreşterea mediei rangurilor (expresii emoŃionale pozitive numeroase) de la familia armonioasă la cea conflictuală.

Rezultatul testului, afişat în tabelul Test Statistics se exprimă printr-o valoare chi-pătrat (6.33) cu două grade de libertate şi p=0.042. Ca urmare, ipoteza de nul poate fi respinsă. Datele confirmă ipoteza că mediul familial (exprimat prin cele trei tipuri de familie) îşi pune amprenta asupra expresivităŃii emoŃionale a copiilor de vârstă preşcolară. B. 4 Testul Friedman pentru măsurări repetate Utilizare Testul Friedman se utilizează pentru testarea diferenŃei de rang în cazul unei variabile măsurate repetat, de mai mult de două ori, pe acelaşi grup de subiecŃi. El este echivalentul testului ANOVA pentru măsurări repetate, pentru date parametrice. Dacă este utilizat pentru doar două măsurări repetate, rezultatul său este echivalent cu al testului Wilcoxon. Exemplu: Efectele altitudinii asupra memoriei sunt testate pe un grup de alpinişti. Capacitatea de memorare de cuvinte este măsurată la trei înălŃimi diferite: 1000m, 3000m şi 6000m. Problema cercetării este dacă diferenŃa de performanŃă de memorare corespunzătoare celor trei înălŃimi este semnificativă. Dat fiind volumul extrem de mic am eşantionului (N=5), efectuarea unui test parametric (ANOVA RM) ar fi nesigură iar apelul le testul Friedman este pe deplin justificat. Aranjarea datelor

Page 18: SPSS_12_testeneparametrice

M. Popa – AplicaŃii SPSS (teste neparametrice)

18/20 Actualizat la: 08.11.2006/12:13:21

Variabilele mem_1000, mem_3000 şi mem_6000 conŃin numărul cuvintelor memorate pentru fiecare dintre cei 5 alpinişti. Nu este necesară transformarea lor în valori de rang, deoarece acest lucru va fi efectuat automat de program. Dacă datele primare sunt sub formă de ranguri, ele vor fi introduse ca atare, rezultatul fiind identic.

Procedura: Statistics-Non Parametric Tests-K related Samples...

Se setează opŃiunea Friedman, iar variabilele testate sunt trecute în lista Test Variables:

Rezultate

Primul tabel prezintă media rangurilor pe înălŃimi (rangul 1 este atribuit valorii celei mai mici). În al doilea tabel găsim valoarea testului Friedman exprimată în valori chi-pătrat (8.40), având un nivel de semnificaŃie p=0.015. Acest rezultat permite respingerea ipotezei de nul şi confirmă ipoteza că memoria cuvintelor este în legătură cu înălŃimea (pe cele trei niveluri avute în vedere).

B. 5 CorelaŃia datelor ordinale (Spearman, Kendall)

Utilizare

Testul de corelaŃie a rangurilor (Spearman) este echivalentul pentru date ordinale testului de corelaŃie Pearson. Rezultatul său variază pe aceeaşi plajă de valori (-1/+1) şi se interpretează în mod similar cu rezultatul testului Pearson. Exemplu: Să luăm în considerare studiul aceluiaşi grup de alpinişti, care au efectuat, la aceleaşi înălŃimi descrise mai sus, şi un test de viteză de decizie (măsurată în zecimi de secundă). Problema cercetării este dacă între performanŃa de memorare şi timpul de decizie este o relaŃie (variaŃie concomitentă) semnificativă.

Aranjarea datelor

Alături de variabilele „memorie” pentru cele trei înălŃimi, avem acum şi variabilele pentru timpul de decizie.

Page 19: SPSS_12_testeneparametrice

M. Popa – AplicaŃii SPSS (teste neparametrice)

19/20 Actualizat la: 08.11.2006/12:13:21

Procedura: Statistics-Corelation-Bivariate

Variabilele supuse testului de corelaŃie se trec în lista Variables:

Se anulează setarea pentru testul Pearson şi se bifează Spearman (aici am ales şi testul Kendal tau-b, care este echivalent lui Spearman, doar pentru a le putea compara. În practică, se va utiliza doar unul dintre acestea două). Această configurare a casetei de dialog produce o matrice de corelaŃii cu şase linii şi şase coloane pentru fiecare dintre cele două teste alese. În fiecare celulă a matricii se vor afla, aşa cum vom vedea, mai multe numere. Din acest motiv citirea ei nu este tocmai comodă. Pentru a obŃine un format mai convenabil de prezentare a rezultatelor, recomandăm o procedură suplimentară, prezentată anterior la corelaŃia Pearson: Se acŃionează butonul Paste care deschide fereastra Syntax, unde găsim comenzile procedurii. Aici se introduce clauza WITH între primul grup de variabile (memorie) şi al doilea grup de variabile (decizie):

Mai departe, procedura de corelaŃie se lansează cu butonul ► de pe bara de comenzi a ferestrei Syntax. Această variantă de lucru nu este obligatorie. Se poate efectua corelaŃia şi direct din caseta principală, dar, aşa cum am spus, rezultatele vor fi prezentate într-o formă mai puŃin „ergonomică” la citire.

Rezultate

Tabelul cu rezultate cuprinde pe linii variabilele „memorie” şi pe coloane, variabilele „decizie”. Deoarece am cerut calcularea simultană a ambilor coeficienŃi de corelaŃie, datele

Page 20: SPSS_12_testeneparametrice

M. Popa – AplicaŃii SPSS (teste neparametrice)

20/20 Actualizat la: 08.11.2006/12:13:21

sunt dublate. Este de la sine înŃeles că în practică nu vom utiliza decât unul dintre aceşti coeficienŃi de corelaŃie a rangurilor. Din celulele tabelului de mai sus nu ne interesează decât cele care cuprind corelaŃia dintre memorie şi decizie la acelaşi palier de înălŃime. Pentru a fi mai vizibile, am îngroşat valorile utile analizei. În jumătatea de sus a tabelului, avem corelaŃiile pentru testul Kendall iar în jumătatea de jos pe cele ale testului Spearman. Testul Kendall al corelaŃiei dintre memorie şi decizie la 1000 de metri are valoarea -0.94, semnificativ la p=0.023. La interpretarea coeficienŃilor de corelaŃie este extrem de important să se ia în considerare, simultan, semnul şi semnificaŃia variaŃiei valorilor. În cazul nostru, valori mari ale memoriei, înseamnă o capacitate de memorare mai bună iar valori mari ale timpului de decizie înseamnă capacitate de decizie mai proastă (sub aspectul vitezei, desigur). În consecinŃă, un coeficient de corelaŃie negativ între aceste variabile indică, de fapt, o variaŃie concomitentă pozitivă a memoriei şi vitezei deciziei (când capacitatea de memorare scade, şi decizia este mai lentă, timpul de decizie fiind mai mare). Analiza coeficienŃilor din tabelul de mai sus arată existenŃa unei corelaŃii de rang semnificative (p<0.05) între memorie şi decizie la toate palierele de înălŃime. Dacă facem comparaŃia dintre coeficienŃii Spearman şi Kendal, vom vedea că, deşi ei diferă valoric, semnificaŃiile se află, în toate cazurile, de aceeaşi parte a deciziei statistice (respingerea ipotezei de nul). Utilizarea unuia sau altuia dintre cei doi coeficienŃi rămâne la latitudinea cercetătorului.