corelatia

50
Corelaţia şi regresia

Upload: cristian-belous

Post on 02-Feb-2016

212 views

Category:

Documents


0 download

DESCRIPTION

biostatistica stomatologie anul III

TRANSCRIPT

Page 1: Corelatia

Corelaţia şi regresia

Page 2: Corelatia

Subiecte în discuţie

• Noţiunea de corelaţie. Tipurile de corelaţii• Calcularea şi interpretarea coeficientului de

corelatie. Corelograma.• Noţiunea de regresie. Tipuri. Calcularea şi

interpretarea coeficientului de regresie.

Page 3: Corelatia

CORELAŢIA

•În majoritatea domeniilor de activitate există interdependenţe între fenomene.

•Apariţia şi evoluţia unui fenomen este în strânsă legătură cu o serie de alte fenomene ce îl determină.

• Corelaţia este o metodă care ne permite să cunoaştem fenomenele din natură şi societate sub raportul conexiunilor în care se găsesc.

Page 4: Corelatia

În statistică, pentru studierea legăturilor multiple ce au loc între diferite fenomene, se foloseşte noţiunea de funcţie f , care constă în faptul că fiecărei valori a variabilei independente (X), numită argument, îi corespunde valoarea altei variabile numită funcţie (Y).

Page 5: Corelatia

Tipuri de corelaţiiTipuri de corelaţii

• corelaţii funcţionale sau matematice corelaţii funcţionale sau matematice

• corelaţii statistice sau stohastice.corelaţii statistice sau stohastice.

Page 6: Corelatia

Corelaţiile funcţionaleCorelaţiile funcţionale

• sunt perfecte, rigide, exprimând legătura de la sunt perfecte, rigide, exprimând legătura de la cauză la efect între fenomene. cauză la efect între fenomene.

• ele sunt studiate în cadrul ştiinţelor exacte, ele sunt studiate în cadrul ştiinţelor exacte, unde legătura de la cauză la efect se exprimă unde legătura de la cauză la efect se exprimă sub formă de lege. sub formă de lege.

• În cazul lor unei valori determinate a unei În cazul lor unei valori determinate a unei variabile independente X (argument) îi variabile independente X (argument) îi corespunde strict o valoare corespunde strict o valoare a a variabilei dependente Y (funcţie).variabilei dependente Y (funcţie).

Page 7: Corelatia

Corelaţiile statisticeCorelaţiile statistice

• sunt mai puţin perfecte sunt mai puţin perfecte

• se evidenţiază mai greu se evidenţiază mai greu

În cazul lor, fiecărei valori numerice a În cazul lor, fiecărei valori numerice a variabilei X corespund nu una ci mai multe variabilei X corespund nu una ci mai multe valori a variabilei Y, adică o totalitate valori a variabilei Y, adică o totalitate statistică a acestei valori, care se grupează statistică a acestei valori, care se grupează în jurul mediei Yîn jurul mediei Yxx..

Page 8: Corelatia

Legătura de corelaţieLegătura de corelaţie

• după formă poate fi: după formă poate fi: 1.1. lineară (rectilinie) lineară (rectilinie) 2.2. nelineară (curbilinie)nelineară (curbilinie)

• după sens: după sens: 1.1. directă (pozitivă) directă (pozitivă) 2.2. inversă (negativă).inversă (negativă).

Page 9: Corelatia

În corelaţiile lineare

• schimbărilor uniforme a valorilor medii a unei variabile le corespund schimbări egale a altei variabile.

Page 10: Corelatia

În corelaţia nelineară

• schimbărilor uniforme a unei valori îi corespund valori medii a altei variabile, care poartă caracter de creştere ori de micşorare.

Page 11: Corelatia

• Aprecierea legăturilor de corelaţie lineare se realizează cu ajutorul coeficientului de corelaţie rxy,

• iar a celor nelineare – cu raportul de corelaţie η (eta).

Page 12: Corelatia

Corelaţiile directe

• se stabilesc între fenomene care evoluează în acelaşi sens. Creşte unul, creşte şi cel cu care are legătură de dependenţă; sau scade un fenomen, scade şi cel cu care corelează.

• Exemplu: majorarea înălţimii copiilor determină mărirea greutăţii lor.

Page 13: Corelatia

Corelaţiile inverse

• se stabilesc între fenomene care evoluează în sens opus. Creşte un fenomen şi scade cel cu care are o legătură de dependenţă; sau scade un fenomen şi creşte cel cu care se corelează.

• Exemplu: cu cât e mai mare vârsta copiilor, cu atât e mai mică mortalitatea lor.

Page 14: Corelatia

Corelaţiile statistice directe

• presupun evoluţia în acelaşi sens a fenomenelor ce se corelează, dar nu cu aceeaşi unitate de măsură.

• Exemplu: creşte nivelul de trai al populaţiei unei colectivităţi de două ori, creşte şi rezistenţa organismului la îmbolnăviri dar nu în aceeaşi măsură

Page 15: Corelatia

Corelaţiile statistice inverse

• presupun creşterea unui fenomen şi scăderea celui cu care se corelează, dar nu în aceeaşi măsură.

• Spre exemplu, dacă într-o colectivitate am efectuat un număr dublu de vaccinări, numărul copiilor ce vor contracta boala, în anul următor, va fi cu siguranţă mai scăzut, dar nu va fi de două ori mai mic decât în anul premergător.

Page 16: Corelatia

• Corelaţiile statistice, spre deosebire de cele funcţionale, pot fi numai vremelnice şi într-un singur sens.

Page 17: Corelatia

• Legătura de dependenţă dintre două sau mai multe fenomene, sensul şi intensitatea acesteia, se stabilesc cu ajutorul coeficientului de corelaţie lineară (simplă sau multiplă) al lui Bravais-Pearson.

Page 18: Corelatia

Pentru seriile statistice simple

Formula de calcul:

Σdxdy

rxy = ±

√ Σdx2Σdy

2

în care:

Page 19: Corelatia

• rxy = coeficientul de corelaţie;

• Σdxdy = suma produselor dintre abaterile de la media aritmetică a valorilor frecvenţelor celor două fenomene (x şi y) ce se corelează;

• Σdx2 = suma pătratelor abaterilor de la media

aritmetică a valorilor frecvenţelor fenomenului x;• Σdy

2 = suma pătratelor abaterilor de la media aritmetică a valorilor frecvenţelor fenomenului y.

Page 20: Corelatia

Exemple:

1. Timpul trecut din momentul accesului de pancreatită acută (x) şi numărul complicaţiilor postoperatorii (y)Nr. Timpul

x Număr

complicaţii y

dX dY d2X d2

Y dXdY

1 2 3 4 5 6

3 5 7 10 13 16

6 8 12 19 20 24

-6 -4 -2 1 4 7

-8,8 -6,8 -2,8 4,2 5,2 9,2

36 16 4 1 16 49

77,4 46,2 7,8 17,6 27

84,6

52,8 27,2 5,6 4,2 20,8 64,4

Total 54 89 122 260,6 175 9 14,8 178,3

RXY =0,98

Page 21: Corelatia

2. Nivelul de asigurare cu medici stomatologi (x) şi ponderea copiilor sanaţi în cadrul a 5 raioane (y)

Nr. Asigurare medici

x

Copii sanaţi

y

dX dY d2X d2

Y dXdY

1 2 3 4 5

2,3 3,2 3,4 3,6 3,9

65,7 91,7 88,0 91,4 90,3

-1 -0,1 0,2 0,3 0,6

-19,7 6,3 2,6 6,0 4,9

1 0,01 0,04 0,09 0,36

388,1 39,7 6,8 36

24,0

19,7 -0,63 0,52 1,8 2,94

Total 16,4 427,1 1,5 494,6 24,3 3,3 85,4 27,2

rXY=0,89

Page 22: Corelatia

pentru seriile statistice grupate

Formula de calcul:

  Σdxdyfxy

rxy = ±

√ Σ(dx2fx)Σ(dy

2fy)

 în care:

Page 23: Corelatia

rxy = coeficientul de corelaţie;

dxdyfxy = produsul dintre abaterile de la media ponderată a variantelor celor două fenomene ce se corelează şi frecvenţele perechi corespunzătoare variantelor fenomenelor x şi y;

dx2fx = produsul dintre pătratele abaterilor de la

media ponderată a valorilor variantelor fenomenului x şi numărul de frecvenţe corespunzătoare fiecărei variante;

dy2fy = produsul dintre pătratele abaterilor de la

media ponderată a valorilor variantelor fenomenului y şi numărul de frecvenţe corespunzătoare fiecărei variante.

Page 24: Corelatia

Coeficientul de corelaţie

poate fi cuprins între:

• minus unu

• zero

• plus unu.

Page 25: Corelatia

Interpretarea coeficientului de corelaţie

• Când valoarea coeficientului de corelaţie se apropie de +1, înseamnă că între cele două fenomene ce se corelează există o legătură foarte puternică.

• Semnul + al coeficientului de corelaţie denotă că legătura de dependenţă dintre fenomene este directă. Deci ambele fenomene evoluează în acelaşi sens, în aceeaşi direcţie.

• Când valoarea coeficientului de corelaţie se apropie de –1, înseamnă că între cele două fenomene există o legătură foarte puternică, dar inversă, în sens opus: creşte un fenomen, scade cel cu care se corelează.

Page 26: Corelatia

Interpretarea coeficientului de corelaţie

Pentru interpretarea intensităţii legăturii de dependenţă dintre fenomene, Guilford indică următoarele CRITERII:

  valoarea coeficientului de corelaţie cuprinsă între ±1 denotă o corelaţie foarte puternică între fenomene;

valoarea coeficientului de corelaţie cuprinsă între ±0,99 şi ±0,70 denotă o corelaţie puternică;

Page 27: Corelatia

Interpretarea coeficientului de corelaţie

   valoarea coeficientului de corelaţie cuprinsă între ±0,69 şi ±0,30 denotă o corelaţie medie între fenomene;

   valoarea coeficientului de corelaţie cuprinsă între ±0,0 şi ±0,29 exprimă existenţa unei corelaţii slabe între fenomene;

   valoarea coeficientului de corelaţie 0 denotă că legătura dintre fenomene în mod practic o considerăm inexistentă.

• Cele două fenomene evoluează deci independent unul de altul.

Page 28: Corelatia

Coeficientul de corelaţie între fenomene poate fi corect interpretat dacă se ţine seama de următoarele ASPECTE:

între fenomenele ce se corelează să existe, în mod logic, o legătură;

cele două fenomene să fie cercetate pe eşantioane omogene;

selecţia frecvenţei eşantioanelor să se facă la întâmplare.

Page 29: Corelatia

• Pentru a analiza fidelitatea coeficientului de corelaţie, în interpretarea legăturii dintre fenomenele obţinute pe eşantioane, se apreciază eroarea coeficientului de corelaţie, care se notează cu mr.

Page 30: Corelatia

pentru n > 100:

  1 – r2xy

mr =

√ n

  în care:

mr = eroarea coeficientului de corelaţie;

r2xy = pătratul valorii coeficientului de corelaţie,

obţinut pe eşantioane;

1 = valoarea absolută a coeficientului de corelaţie, obţinut pe univers, pe întreaga populaţie;

n = numărul variantelor perechi ale fenomenelor ce se corelează.

Page 31: Corelatia

• pentru n < 30, se utilizează n-2

• când 30 < n < 100 se utilizează n-1

Page 32: Corelatia

Dacă valoarea coeficientului de corelaţie obţinut pe eşantioane este mai mare decât triplul erorii sale, înseamnă că acesta a fost obţinut pe eşantioane reprezentative, este deci real şi ne putem bizui pe el în interpretarea legăturii de dependenţă între fenomene.

Page 33: Corelatia

Raportul dintre coeficientul de corelaţie şi eroarea lui se numeşte criteriu de exactitate al coeficientului de corelaţie - tr. Criteriul

în cauză se stabileşte cu ajutorul tabelului valorilor criteriului t. Dacă treal > ttabel,

coeficientul de corelaţie se consideră semnificativ.

Page 34: Corelatia

CORELOGRAMA

• Existenţa sau inexistenţa unei corelaţii între fenomene se poate evidenţia aproximativ cu ajutorul reprezentărilor grafice. În acest caz, folosim un grafic cu două scări, ordonată şi abscisă, pe care înscriem valorile variantelor celor două fenomene x şi y.

Page 35: Corelatia

• Se realizează astfel „norul de puncte”.

• Dacă norul de puncte se va dispune fuziform, oblic de jos în sus şi de la stânga la dreapta, între cele două fenomene există o corelaţie directă. Creşte un fenomen, creşte şi cel de al doilea, cu care se corelează, sau ambele fenomene scad, evoluând în aceeaşi direcţie.

Page 36: Corelatia

• Dacă norul de puncte se dispune fuziform, oblic de sus în jos şi de la stânga la dreapta, între cele două fenomene există o corelaţie inversă.

Page 37: Corelatia

Dacă punctele se dispun pe toată reţeaua grafică, neavând nici o tendinţă de a se grupa, înseamnă că între fenomene nu există nici o legătură de dependenţă, fenomenele evoluând independent unul faţă de celălalt.

În cazul acesta, dreapta care trece prin mijlocul punctelor este paralelă fie cu ordonata, fie cu abscisa.

Page 38: Corelatia

CORELAŢIA MULTIPLĂ

• Se stabileşte între mai mult de două fenomene, care au legătură de dependenţă între ele.

• În asemenea situaţii, existenţa legăturii de dependenţă între fenomene, sensul şi intensitatea acestei legături, se stabilesc cu ajutorul coeficientului de corelaţie lineară multiplă.

Page 39: Corelatia

FORMULA DE CALCUL

rxyz = r2xy + r2

xz – 2(rxy) ryz rxz

1 – r2xz

în care:

Page 40: Corelatia

• rxyz=coeficientul de corelaţie lineară multiplă între cele trei fenomene;

• rxy=coeficientul de corelaţie lineară simplă între fenomenele x şi y;

• ryz=coeficientul de corelaţie lineară simplă între fenomenele y şi z;

• rxz=coeficientul de corelaţie lineară simplă între fenomenele x şi z;

• Interpretarea intensităţii corelaţiei multiple ţine seama de aceleaşi criterii enunţate la interpretarea coeficientului de corelaţie lineară simplă.

Page 41: Corelatia

CORELAŢIA RANGURILOR (SPEARMAN)

În cazul în care dorim să stabilim legătura de dependenţă între fenomenele cercetate pe eşantioane mici, utilizăm coeficientul de corelaţie al rangurilor, propus de Spearman (1904).

• Acest coeficient se notează cu litera greacă (ro) şi se determină după formula propusă de Spearman:

Page 42: Corelatia

6 Σd2

= 1-

n – (n2 – 1)

în care:

1 = valoarea absolută a coeficientului de corelaţie;

= coeficientul de corelaţie Spearman;

6 = valoare constantă;

Σd2 = suma pătratelor diferenţelor dintre rangurile primului şir de variante şi rangurile celui de al doilea şir de variante, cu care se corelează;

n = numărul variantelor perechi variantelor ce se corelează.

Page 43: Corelatia

• Coeficientul de corelaţie al rangurilor poate avea valori cuprinse între –1 -0- +1. El exprimă o legătură perfectă când are valoarea +1. În această situaţie, rangurile au valori egale, iar diferenţa între ranguri este egală cu 0.

Page 44: Corelatia

Exemple:

1. Timpul trecut din momentul accesului de pancreatită acută (x) şi numărul complicaţiilor postoperatorii (y)

Nr. Timpul x

Număr complicaţii

y

Rangul x

Rangul y

d d2

1 2 3 4 5 6

3 5 7 10 13 16

6 8 12 19 20 24

1 2 3 4 5 6

1 2 3 4 5 6

0 0 0 0 0 0

0 0 0 0 0 0

Total 54 89 0 = 1

Page 45: Corelatia

2. Legătura de corelaţie între copiii cu deficienţă mintală (la 100 mii copii) şi invaliditatea copiilor (la 100 mii copii)

Nr. Ţara

Deficienţă mintală

x

Invaliditatea copiilor

y

Rangul x

Rangul y

d d2

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15

Armenia Tadjikistan Azerbaidjan Turkmenistan Georgia Kîrgîzstan Uzbekistan Kazahstan Bielarusi Ucraina Rusia Moldova Estonia Lituania Letonia

120 138 167 198 245 318 342 455 538 625 795 1018 1110 1021 1127

33 27 38 30 43 28 30 29 36 48 38 44 47 57 33

1 2 3 4 5 6 7 8 9 10 11 12 14 13 15

6,5 1

9,5 4,5 11 2

4,5 3 8 14 9,5 12 13 15 6,5

-5,5 1

-6,5 -0,5 -6 4

2,5 5 1 -4 1,5 0 1 -2 8,5

30,25 1

42,25 0,25 36 16

6,25 25 1 16

2,25 0 1 4

72,25 Total =-24,5

=+24,5

=253,5

= 0,55

Page 46: Corelatia

REGRESIA

 

• Termenul de regresie a fost introdus de

F. Galton, care a observat că înălţimea descendenţilor regresează către înălţimea părinţilor.

Page 47: Corelatia

Regresia

• completează corelaţia şi prin intermediul coeficientului de regresie, se stabileşte cu cât creşte sau descreşte sub aspect cantitativ, un fenomen, când cel cu care se corelează creşte sau descreşte cu o unitate de măsură.

Page 48: Corelatia

Regresia poate fi: • simplă şi multiplă • liniară şi neliniară• directă, când fenomenele evoluează în acelaşi

sens (creşte x, creşte y sau scade x scade şi y)• indirectă, când fenomenul evoluează în sens

opus (creşte x scade y sau scade x creşte y)

Page 49: Corelatia

Formula coeficientului de regresie este:

y

Rgyx = rxy

x

sau

x

Rgxy = rxy

y

în care:

Page 50: Corelatia

Rgxy = coeficientul de regresie a lui x în funcţie de y. El

exprimă, cantitativ, cu cât creşte sau scade fenomenul x când y creşte sau scade cu o unitate de măsură;

Rgyx = coeficientul de regresie a lui y în funcţie de x. El

exprimă, cantitativ, cu cât creşte sau scade fenomenul y când x creşte sau scade cu o unitate de măsură;

rxy = coeficientul de corelaţie liniară Bravais-Pearson;

x = deviaţia standard a fenomenului x;

y = deviaţia standard a fenomenului y.