s6. corelatia bivariata. corelatia partiala

10
1 Seminarul 6. Corelația bivariată. Corelația parțială Sursa bibliografică: Cazan, A.M. (în curs de apariție). Statistică psihologică. Noțiuni teoretice, exemple și aplicații. Brașov: Editura Universității Transilvania din Brașov. Recapitulare: Un coeficient de corelaţie este un număr unic care indică mărimea relaţiei dintre două fenomene, procese psihice, lucruri, adică în ce grad variază unul în paralel cu variaţia celuilalt. Coeficientul de corelație (r) poate lua valori între -1 și 1, unde 0 înseamnă absența legăturii între două variabile. Corelaţia nu dezvăluie o relaţie de tip cauză–efect, nu este deci o măsură a cauzalităţii, ci doar a gradului de paralelism, a modului de asociere, natura relaţiei urmând a fi interpretată (Clinciu, 2013). Reprezentarea grafică a corelației se numește nor de puncte. Norul de puncte oferă informații despre direcția și intensitatea asocierii dintre variabile. Pentru a aprecia intensitatea relației dintre două variabile se folosește coeficientul de determinare. Prin intermediul coeficientului de determinare se evaluează partea de asociere comună a două variabile, indicând procentul din dispersia unei variabile care se asociază cu modul de împrăștiere a celeilalte variabile (Sava, 2004). Exemple de studii corelaţionale - Există vreo legătură între scorurile la testele de inteligenţă şi performanţa şcolară? - Există asociere între înălţime şi greutate? - Există asociere între inteligenţa părinţilor şi inteligenţa copiilor? Cum identificăm faptul că este vorba despre o corelaţie? Necesitatea analizei corelaţionale poate fi identificată din modul de formulare a obiectivului şi al ipotezelor („urmărim să evidenţiem gradul de asociere dintre memorie şi inteligenţă”, „există o legătură între scorurile la testele de inteligenţă şi performanţa şcolară”, „un nivel ridicat al extraversiei se asociază cu performanţe ridicate în vânzări”) (Sava, 2004). Ce fel de date au fost colectate? O condiție importantă pentru corelația liniară este ca datele să fie numerice. Lector univ.dr. Ana-Maria CAZAN Anul universitar 2013-2014, Aplicații computerizate ale datelor

Upload: nico-nicoleta

Post on 14-Apr-2017

265 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: S6. Corelatia Bivariata. Corelatia Partiala

1

Seminarul 6. Corelația bivariată. Corelația parțială

Sursa bibliografică:

Cazan, A.M. (în curs de apariție). Statistică psihologică. Noțiuni teoretice, exemple și aplicații.

Brașov: Editura Universității Transilvania din Brașov.

Recapitulare:

Un coeficient de corelaţie este un număr unic care indică mărimea relaţiei dintre două

fenomene, procese psihice, lucruri, adică în ce grad variază unul în paralel cu variaţia

celuilalt. Coeficientul de corelație (r) poate lua valori între -1 și 1, unde 0 înseamnă absența

legăturii între două variabile. Corelaţia nu dezvăluie o relaţie de tip cauză–efect, nu este deci

o măsură a cauzalităţii, ci doar a gradului de paralelism, a modului de asociere, natura

relaţiei urmând a fi interpretată (Clinciu, 2013). Reprezentarea grafică a corelației se

numește nor de puncte. Norul de puncte oferă informații despre direcția și intensitatea

asocierii dintre variabile. Pentru a aprecia intensitatea relației dintre două variabile se

folosește coeficientul de determinare. Prin intermediul coeficientului de determinare se

evaluează partea de asociere comună a două variabile, indicând procentul din dispersia unei

variabile care se asociază cu modul de împrăștiere a celeilalte variabile (Sava, 2004).

Exemple de studii corelaţionale

- Există vreo legătură între scorurile la testele de inteligenţă şi performanţa şcolară?

- Există asociere între înălţime şi greutate?

- Există asociere între inteligenţa părinţilor şi inteligenţa copiilor?

Cum identificăm faptul că este vorba despre o corelaţie?

Necesitatea analizei corelaţionale poate fi identificată din modul de formulare a obiectivului şi al

ipotezelor („urmărim să evidenţiem gradul de asociere dintre memorie şi inteligenţă”, „există o

legătură între scorurile la testele de inteligenţă şi performanţa şcolară”, „un nivel ridicat al

extraversiei se asociază cu performanţe ridicate în vânzări”) (Sava, 2004).

Ce fel de date au fost colectate?

O condiție importantă pentru corelația liniară este ca datele să fie numerice.

Lector univ.dr. Ana-Maria CAZAN

Anul universitar 2013-2014,

Aplicații computerizate ale datelor

Page 2: S6. Corelatia Bivariata. Corelatia Partiala

2

Condiţiile de aplicare a lui r sunt îndeplinite?

- Variabilele sunt măsurate pe scale de interval sau de raport (pentru corelaţia Pearson).

- Variabilele sunt normal distribuite.

- Numărul de subiecţi este mai mare de 30.

- Absenţa outlierilor sau a valorilor extreme.

- Relaţia dintre variabile este liniară.

- Norul de puncte indică homoscedasticitate.

Folosim corelaţia Spearman, atunci când:

- Cel puţin una dintre variabile este măsurată pe scală ordinală.

- Cel puţin una dintre variabile nu este normal distribuită.

- Numărul de subiecţi este mai mic de 30.

Cum interpretăm asocierea dintre două variabile

Coeficientul de corelaţie poate să ia valori cuprinse în intervalul (-1; 1). Indiferent de semn

(pozitiv sau negativ), coeficientul de corelaţie este interpretat în felul următor:

Coeficient de corelaţie Interpretare

0,0-0,1 Foarte mic, neglijabil

0,1-0,3 Mic, minor

0,3-0,5 Moderat, mediu

0,5-0,7 Mare, ridicat

0,7-0,9 Foarte mare, foarte ridicat

0,9-1 Aproape perfect

- Corelaţia pozitivă arată relaţia directă între cele două variabile: creşterea variabilei X se

asociază cu creșterea variabilei Y.

- Corelaţia negativă arată relaţia de inversă între cele două variabile: creșterea variabilei X se

asociază cu scăderea variabilei Y.

Corelaţia nu implică o cauzalitate

Există trei posibile direcţii ale cauzalităţii:

1. X → Y

2. Y → X

3. Z

X Y

Page 3: S6. Corelatia Bivariata. Corelatia Partiala

3

Folosirea SPSS pentru redarea norului de puncte și pentru calculul corelației

Introduceți datele în SPSS.

Graphs – Legacy Dialogs – Scatter/Dot – Simple Scatter.

Figura 2. Obținerea norului de puncte (Pasul 1)

Introduceți variabila stare de fericire în câmpul Y Axis și variabila Număr de ore de somn

în câmpul X Axis – OK.

Figura 3. Obținerea norului de puncte (Pasul 2)

Graficul va apărea în output:

Page 4: S6. Corelatia Bivariata. Corelatia Partiala

4

Figura 4. Reprezentarea grafică a corelației

Pentru calculul corelației Pearson sau Spearman, urmați pașii de mai jos:

Analyze – Correlate – Bivariate.

Figura 5. Calculul corelației bivariate (Pasul 1)

Introduceți în câmpul Variables variabilele între care doriți să calculați coeficientul de

corelație.

Bifați coeficientul adecvat datelor introduse (Pearson sau Spearman).

Page 5: S6. Corelatia Bivariata. Corelatia Partiala

5

Figura 6. Calculul corelației bivariate (Pasul 2)

Matricea de corelații va apărea în output:

Figura 7. Coeficientul de corelație bivariată Pearson

Coeficient de corelație (r)

Prag de semnificație (p)

Număr de participanți (N)

Page 6: S6. Corelatia Bivariata. Corelatia Partiala

6

Corelația parțială

- Relația dintre două variabile este afectată de o a treia variabilă. Acest lucru este evident în

cazul unor relații false sau a unor relații de moderare.

Exemplul 1:

Zilele ploioase duc la o dispoziție afectivă negativă.

In realitate, există alți factori precum presiunea atmosferică, gradul de luminozitate pot influența

dispoziția afectivă, nu ploaia propriu-zis.

Exemplul 2:

Persoanele mai scunde au părul mai lung.

Dacă avem în vedere variabila gen care corelează atât cu lungimea părului cât și cu înălțimea,

obținem un alt rezultat. Femeile au păr mai lung și sunt mai scunde, iar relația dintre X și Y devine

nesemnificativă, dacă ținem cont de gen.

Exemplul 3:

Relația dintre timpul stat la soare și nivelul de bronzare.

Dacă avem în vedere variabila tip de ten, rezultatele sunt diferite.

Exemplul 4:

Relația dintre motivația pentru învățare și performanțele școlare este mediată de strategiile de

învățare.

Motivația pentru învățare duce la alegerea unor strategii mai eficiente care, la rândul lor, duc la

rezultate școlare ridicate.

C

X

Y

X

C

Y

X C Y

Figura 8. Schemele unor relații false

între două variabile

Figura 9. Schema unei relații între X

și Y moderată de a treia variabilă

Figura 10. Schema unei relații între X

și Y mediată de a treia variabilă

X

C

Y

Page 7: S6. Corelatia Bivariata. Corelatia Partiala

7

Folosirea SPSS pentru calculul corelației parțiale

Analyze – Correlate – Partial.

Figura 11. Pași SPSS pentru calculul corelației parțiale (1)

Relația dintre abilitățile spațiale și calculul matematic este moderată de nivelul QI.

Introducem abilitățile spațiale și calculul matematic în câmpul Variables

Introducem QI în câmpul Controlling for

La options bifăm Menas and standard deviations și Zero order correlations

Figura 12. Pași SPSS pentru calculul corelației parțiale (2)

Page 8: S6. Corelatia Bivariata. Corelatia Partiala

8

Figura 13. Output SPSS pentru calculul corelației parțiale

Prima parte a tabelului arată că există o corelație bivariată (Pearson) puternică semnificativă

statistic între reprezentări spațiale și calcul aritmetic.

! QI corelează semnificativ cu ambele variabile!

In partea a doua a tabelului (Controlling for QI) observăm că de această dată corelația dintre

Reprezentarea spațială și calculul aritmetic devine nesemnificativă legătura dintre cele două

variabile nu era decât efectul influenței pe care o exercita inteligența asupra lor.

(Marian Popa, 2009, Statistică psihologică – nivel intermediar, note de curs).

Dacă relația dintre Reprezentarea spațială și Calculul aritmetic ar fi rămas semnificativă, în

condițiile în care influența QI este eliminată, am fi putut vorbi despre existența uni corelații

parțiale.

Calculul mărimii efectului pentru corelație

Indicatori care se bazează pe gradul de asociere dintre variabile (de tipul corelației

Pearson r) care descriu procentul variabilității explicate de fiecare variabilă în raport cu

cealaltă:

Intensitatea asocierii dintre variabile – coeficientul de determinare

Page 9: S6. Corelatia Bivariata. Corelatia Partiala

9

Coeficientul de determinare este cel mai utilizat criteriu pentru a aprecia intensitatea

relaţiei dintre două variabile și se notează cu r2. Prin intermediul său se evaluează partea de

asociere comună a două variabile, indicând procentul din dispersia unei variabile care se asociază

cu modul de împrăştiere a celorlalte variabile (Sava, 2004). Valorile lui r trebuie considerate pe o

scală ordinală. Nu este corect să afirmăm că un coeficient de corelaţie de 0,40 este de două ori mai

mare decât un altul de 0,20. Dacă dorim să comparăm în mod direct doi coeficienţi de corelaţie

trebuie să ridicăm valorile lui r la pătrat (r2) (Popa, 2008).

Intensitatea asocierii dintre variabile

Coeficientul de determinare este un indicator al mărimii efectului. Acesta se interpretează

astfel:

r2 0,01 Efect mic

0,13 Efect mediu

0,26 Efect mare

Aplicații SPSS

Deschideți baza de date Baza de date.sav. Pornind de la această bază de date, rezolvați

următoarele cerințe:

1. Calculați indicatorii statistici descriptivi pentru variabilele care măsoară trăsături de

personalitate.

2. Redați norurile de puncte pentru asocierea dintre stima de sine și trăsăturile de

personalitate măsurate cu EPQ. Analizați și interpretați graficele obținute.

3. Calculați corelația dintre stima de sine și trăsăturile de personalitate măsurate cu EPQ.

4. Calculați mărimea efectului pentru toate corelațiile calculate și explicați dpdv psihologic

rezultatele obținute.

Page 10: S6. Corelatia Bivariata. Corelatia Partiala

10

5. Calculați corelația dintre perceperea de sine și perceperea de sine corporală, separat pentru

băieți și fete. Calculați mărimea efectului pentru corelațiile obținute și explicați dpdv

psihologic rezultatele obținute.

6. Transformați variabilele nevrotism și stima de sine în variabile ordinale, folosind opțiunea

Rank Cases.

7. Calculați coeficientul de corelație adecvat între cele două variabile nou create la punctul 6.

8. Verificați asocierea dintre stima de sine și perceperea de sine corporală, în condițiile în

care influența genului este ținută constantă.

9. Verificați, folosind testul statistic adecvat dacă există diferențe de gen în ceea ce privește

stima de sine, eficacitatea de sine și perceperea de sine corporală. Calculați mărimile

efectului și explicați dpdv psihologic rezultatele obținute.

10. Calculați coeficienții de corelație între Înălțimea știută – dorită și Greutatea știută-dorită.

11. Redați grafic asocierile dintre Înălțimea știută – dorită și Greutatea știută-dorită, marcând

cu culori diferite băieții și fetele.

12. Verificați asocierile de la punctul 10, în condițiile în care influența genului și a vârstei

sunt ținute constante.

13. Formulați două ipoteze care pot fi testate prin corelații bivariate. Verificați dacă cele două

ipoteze se confirmă. Calculați mărimea efectului, raportați conform APA rezultatele și

interpretați psihologic rezultatele obținute.

14. Formulați o ipoteză care poate fi testată printr-o corelație parțială. Verificați dacă ipoteza

se confirmă. Calculați mărimea efectului, raportați conform APA rezultatele și interpretați

psihologic rezultatele obținute.

15. Formulați o ipoteză care poate fi testată prin intermediul unui test t. Verificați dacă ipoteza

se confirmă. Calculați mărimea efectului, raportați conform APA rezultatele și interpretați

psihologic rezultatele obținute.