statistica_c8.ppt

31
METODA CORELAŢIEI METODA CORELAŢIEI CURS NR. 8 CURS NR. 8

Upload: cercel-madalina

Post on 17-Jan-2016

4 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: statistica_C8.ppt

METODA CORELAŢIEIMETODA CORELAŢIEIMETODA CORELAŢIEIMETODA CORELAŢIEI

CURS NR. 8CURS NR. 8

Page 2: statistica_C8.ppt

6.4. Metoda corelaţiei 6.4. Metoda corelaţiei parametriceparametrice

6.4. Metoda corelaţiei 6.4. Metoda corelaţiei parametriceparametrice

Page 3: statistica_C8.ppt

Introducere• Odată stabilita existenţa unei legături

între două sau mai multe variabile dintre care una este rezultativă, iar cealaltă (celelate) factorială se pune problema stabilirii cât de strânsă, de intensă este această legătură şi deci cât de mult pot varia estimările făcute pe baza analizei de regresie.

• Aici intervine metoda corelaţiei care măsoară intensitatea legăturii prin intermediul unor coeficienţi de corelaţie.

Page 4: statistica_C8.ppt

Corelaţia parametrică

• Corelaţia parametrică presupune calculul unor indicatori ai intensităţii legăturii pe baza valorilor variabilelor corelate care sunt de tip cantitativ.

• Indicatorii de corelaţie ce vor fi prezentaţi sunt aplicabili cel puţin teoretic ţinând seama de distribuirea normală a variabilelor

• Metodele ce apelează la aceşti indicatori se numesc parametrice.

Page 5: statistica_C8.ppt

6.4.1. Covarianţa

• Covarianţa este un indicator statistic ce se obţine ca medie aritmetică a produselor abaterilor variantelor variabilelor cuplului corelativ faţă de media lor, respectiv:

n

n

iyiyxix

yx

1),cov(

Page 6: statistica_C8.ppt

Interpretarea covarianţei:

• semnul indicatorului arată sensul legăturii:» “+” – legătură directă, » “-“ – legătură inversă;

• cov(x,y)=0 indică faptul că cele două variabile sunt independente, iar acest lucru se întâmplă când suma produselor pozitive ale abaterilor este egală cu suma produselor negative;

• valoarea absolută a covarianţei nu are limită, dar cu cât această valoare creşte cu atât este mai intensă legătura dintre cele două variabile.

Page 7: statistica_C8.ppt

De reţinut:• Acest indicator nu face distincţie

între variabila factorială şi cea rezultativă, ca urmare locul acestora în formulă este interschimbabil.

• Acest indicator reprezintă de fapt o metodă ajutătoare de măsurare a legăturilor statistice.

Page 8: statistica_C8.ppt

6.4.2. Coeficientul de corelaţie simplă liniară

• Coeficientul de corelaţie, unul dintre cei mai importanţi indicatori ai corelaţiei, arată cât de puternică este legătura dintre variabilele corelate, adică intensitatea legăturii.

• Coeficientul de corelaţie simplă liniară cunoscut şi sub numele de coeficientul lui Pearson,

Page 9: statistica_C8.ppt

• Se calculează ca o medie a produselor abaterilor normale normate ale variabilelor cuplului corelativ.

n

y

yiy

x

xix

xyr

/

Page 10: statistica_C8.ppt

În practică se foloseste următoarea formula de calcul:

222/ 2iiii

iiii

yynxxn

yxyxnxy

r

Page 11: statistica_C8.ppt

Interpretarea coeficientului de corelaţie liniară simplă:

• Acest indicator este un parametru ce caracterizează legătura dintre cele două variabile şi ele cărui valori satisfac relaţia:

-1 ry/x +1

Page 12: statistica_C8.ppt

• dacă ry/x ia valori pozitive, legătura este directă, iar dacă ia valori negative, legătura este inversă;

• dacă ry/x=±1, legătura este de tip funcţional,

• valori apropiate de ±1 indică legături foarte puternice,

• iar valori egale cu 0 indică lipsa legăturii dintre cele două variabile;

Page 13: statistica_C8.ppt

• Pentru o mai bună interpretare a sa, intervalul de valori ale coeficientului de corelaţie [-1,+1] poate fi divizat astfel:

Page 14: statistica_C8.ppt

De reţinut:• Valoarea coeficientului de corelaţie depinde

de forma funcţiei de regresie şi ca urmare acest indicator nu este indicat în cazul legăturilor neliniare fiind nesemnificativ,

• Pentru aceste situaţii se apeleaza la alt indicator al corelaţiei, raportul de corelatie, Ry/x.

• În cazul unei legături liniare se pot calcula ambii indicatori aceştia dovedindu-se având aceeaşi valoare absolută, relaţie ce poate fi folosită ca test de verificare a liniarităţii legăturii. y/xy/x Rr

Page 15: statistica_C8.ppt

6.4.3. Raportul de corelaţie

• Calculul raportului de corelaţie se bazează pe descompunerea dispersiei totale a variabilei rezultative în dispersia valorilor empirice faţă de valorile teoretice calculate prin funcţia de regresie Yx şi dispersia valorilor teoretice de la media valorilor empirice.

Page 16: statistica_C8.ppt

• Se calculează cu formula:

2

2

1/ y

iy

xiY

iy

xyR

Page 17: statistica_C8.ppt

Interpretarea raportului de corelaţie:

• Nivelurile raportului de corelaţie se vor găsi în intervalul [0,1], altfel spus:

0Ry/x1.

Page 18: statistica_C8.ppt
Page 19: statistica_C8.ppt

• Dacă funcţia de regresie este liniară atunci raportul de corelaţie se poate calcula după una din formulele:

niy

iy

iyixb

iya

iy

xyR

22

2

1/

niy

iy

iyixb

iya

iy

niy

iy

xyR

22

22

2

/

Page 20: statistica_C8.ppt

6.5. METODA CORELAŢIEI 6.5. METODA CORELAŢIEI NEPARAMETRICENEPARAMETRICE

6.5. METODA CORELAŢIEI 6.5. METODA CORELAŢIEI NEPARAMETRICENEPARAMETRICE

Page 21: statistica_C8.ppt

Introducere:• Atunci când distribuţiile variabilelor corelate nu

sunt de tip normal, sunt asimetrice, nu se cunoaşte cu exactitate forma de distribuţie sau variabilele nu se exprimă numeric, pentru măsurarea intensităţii corelaţiei se utilizează alţi indicatori pentru calculul cărora nu este nevoie ca modelele de corelaţie să includă neapărat nivelurile variabilelor ci pot fi luate în consideraţie numerele lor de ordine din şirul de date denumite ranguri.

• În acest scop unităţile statistice se ordonează crescător sau descrescător în funcţie de variabila factorială şi se atribuie fiecărei variante câte un rang. Astfel de metode se numesc neparametrice şi au o largă aplicabilitate mai ales în cadrul variabilelor nenumerice.

Page 22: statistica_C8.ppt

6.5.1. Coeficientul lui Spearman de corelaţie a

rangurilor

• Acest coeficient nu se calculează pe baza nivelurilor individuale ale variabilelor, ci pe baza numărului lor de ordine numit rang.

• Rangurile se obţin prin ordonarea prealabilă a nivelurilor individuale ale celor două variabile.

Page 23: statistica_C8.ppt

• Formula de calcul este:

unde:– di - este diferenţa de rang între

variabilele corelate pentru aceeaşi unitate statistică;

– n - numărul perechilor corelative sau altfel spus numărul rangurilor.

nn

id

SC

3

261

Page 24: statistica_C8.ppt

De reţinut:• Coeficientul lui Spearman ia valori

cuprinse în intervalul -1CS1

• Fiind în fapt o aplicaţie a coeficientului de corelaţie liniară are aceeaşi semnificaţie cu acesta şi se aplică doar dacă se constată o legătură liniară între cele două variabile, altfel indicatorul nu este elocvent.

Page 25: statistica_C8.ppt

6.5.2. Coeficientul lui Kendall de

corelaţie a rangurilor • Coeficientul lui Kendall se determină cu relaţia:

• unde:– S=P-Q, respectiv suma algebrică între numărul de

ranguri superioare fiecărui rang luat succesiv (P) şi numărul de ranguri inferioare fiecărui rang (Q) calculate numai pentru caracteristica rezultativă.

• Şi acest coeficient ia valori cuprinse între –1 şi +1 având aceeaşi semnificaţie cu cea a coeficientului Spearman.

12

nn

SKC

Page 26: statistica_C8.ppt

Atenţie:• Utilizarea celor doi coeficienţi este

condiţionată de nerepetarea rangurilor. • În acest scop se impune respectarea uneia

dintre următoarele condiţii:

unde:– ui - rangurile factorialei;– wi - rangurile rezultativei.

iwiu

wu

Page 27: statistica_C8.ppt

Corelograma rangurilor

• În caracterizarea corelaţiei rangurilor se foloseşte cu succes şi corelograma rangurilor, prin intermediul căreia se pot cunoaşte existenţa, sensul şi intensitatea corelaţie.

Page 28: statistica_C8.ppt

Metodologie de construcţie:

• Pe abscisă se trec rangurile ui , iar pe ordonată rangurile wi .

• Din dreptul diviziunilor se duc paralele la cele două axe, obţinându-se un nor de puncte.

• Diagonalele reţelei sintetizează corelaţia funcţională directă sau inversă.

Page 29: statistica_C8.ppt

Fig. 1 Corelograma rangurilor – legătură inversă

rangurile u

1514131211109876543210

ran

gu

rile

w15

14

13

12

11

10

9

8

7

6

5

4

3

2

10

Page 30: statistica_C8.ppt

4.5.3. Coeficientul de asociere

• Această metodă se utilizează pentru măsurarea intensităţii legăturii a două caracteristici alternative prezentate într-un tabel de asociere de forma:

Page 31: statistica_C8.ppt

• Produsul ad arată gradul de realizare a legăturii directe dintre x şi y, iar produsul bc gradul de legătură inversă între aceste două caracteristici cercetate.

• Pentru stabilirea valorii numerice a coeficientului de asociere, care să indice existenţa şi intensitatea unei legături, formula cea mai utilizată este cea propusă de Yule:

• Acest indicator poate să ia valori între -1 şi +1, arătând nu numai gradul de intensitate al asocierii celor două caracteristici, dar şi sensul ei.

bcad

bcadQ