corelatia si regresia

Upload: calanceastefan

Post on 08-Mar-2016

216 views

Category:

Documents


0 download

DESCRIPTION

Biostatistica

TRANSCRIPT

Corelaia i regresia

CORELAIA

n majoritatea domeniilor de activitate exist interdependene ntre fenomene. Apariia i evoluia unui fenomen este n strns legtur cu o serie de alte fenomene ce l determin. Corelaia este o metod care ne permite s cunoatem fenomenele din natur i societate sub raportul conexiunilor n care se gsesc.

n statistic, pentru studierea legturilor multiple ce au loc ntre diferite fenomene, se folosete noiunea de funcie f , care const n faptul c fiecrei valori a variabilei independente (X), numit argument, i corespunde valoarea altei variabile numit funcie (Y).

Tipuri de corelaii

corelaii funcionale sau matematice corelaii statistice sau stohastice.

Corelaiile funcionale sunt perfecte, rigide, exprimnd legtura de la cauz la efect ntre fenomene. ele sunt studiate n cadrul tiinelor exacte, unde legtura de la cauz la efect se exprim sub form de lege. n cazul lor unei valori determinate a unei variabile independente X (argument) i corespunde strict o valoare a variabilei dependente Y (funcie).

Corelaiile statistice sunt mai puin perfecte se evideniaz mai greu n cazul lor, fiecrei valori numerice a variabilei X corespund nu una ci mai multe valori a variabilei Y, adic o totalitate statistic a acestei valori, care se grupeaz n jurul mediei Yx.

Legtura de corelaiedup form poate fi: linear (rectilinie) nelinear (curbilinie)

dup sens: direct (pozitiv) invers (negativ).

n corelaiile lineare

schimbrilor uniforme a valorilor medii a unei variabile le corespund schimbri egale a altei variabile.

n corelaia nelinear

schimbrilor uniforme a unei valori i corespund valori medii a altei variabile, care poart caracter de cretere ori de micorare.

Aprecierea legturilor de corelaie lineare se realizeaz cu ajutorul coeficientului de corelaie rxy, iar a celor nelineare cu raportul de corelaie (eta).

Corelaiile directese stabilesc ntre fenomene care evolueaz n acelai sens. Crete unul, crete i cel cu care are legtur de dependen; sau scade un fenomen, scade i cel cu care coreleaz. Exemplu: majorarea nlimii copiilor determin mrirea greutii lor.

Corelaiile inversese stabilesc ntre fenomene care evolueaz n sens opus. Crete un fenomen i scade cel cu care are o legtur de dependen; sau scade un fenomen i crete cel cu care se coreleaz.

Exemplu: cu ct e mai mare vrsta copiilor, cu att e mai mic mortalitatea lor.

Corelaiile statistice directepresupun evoluia n acelai sens a fenomenelor ce se coreleaz, dar nu cu aceeai unitate de msur. Exemplu: crete nivelul de trai al populaiei unei colectiviti de dou ori, crete i rezistena organismului la mbolnviri dar nu n aceeai msur Corelaiile statistice inverse

presupun creterea unui fenomen i scderea celui cu care se coreleaz, dar nu n aceeai msur. Spre exemplu, dac ntr-o colectivitate am efectuat un numr dublu de vaccinri, numrul copiilor ce vor contracta boala, n anul urmtor, va fi cu siguran mai sczut, dar nu va fi de dou ori mai mic dect n anul premergtor. Corelaiile statistice, spre deosebire de cele funcionale, pot fi numai vremelnice i ntr-un singur sens. Legtura de dependen dintre dou sau mai multe fenomene, sensul i intensitatea acesteia, se stabilesc cu ajutorul coeficientului de corelaie linear (simpl sau multipl) al lui Bravais-Pearson.

Pentru seriile statistice simpleFormula de calcul: dxdyrxy = dx2dy2

n care:

rxy = coeficientul de corelaie;dxdy = suma produselor dintre abaterile de la media aritmetic a valorilor frecvenelor celor dou fenomene (x i y) ce se coreleaz;dx2 = suma ptratelor abaterilor de la media aritmetic a valorilor frecvenelor fenomenului x;dy2 = suma ptratelor abaterilor de la media aritmetic a valorilor frecvenelor fenomenului y.

Exemple:1. Timpul trecut din momentul accesului de pancreatit acut (x) i numrul complicaiilor postoperatorii (y)

2. Nivelul de asigurare cu medici stomatologi (x) i ponderea copiilor sanai n cadrul a 5 raioane (y)

pentru seriile statistice grupateFormula de calcul: dxdyfxyrxy = (dx2fx)(dy2fy)n care:

rxy = coeficientul de corelaie;dxdyfxy = produsul dintre abaterile de la media ponderat a variantelor celor dou fenomene ce se coreleaz i frecvenele perechi corespunztoare variantelor fenomenelor x i y;dx2fx = produsul dintre ptratele abaterilor de la media ponderat a valorilor variantelor fenomenului x i numrul de frecvene corespunztoare fiecrei variante;dy2fy = produsul dintre ptratele abaterilor de la media ponderat a valorilor variantelor fenomenului y i numrul de frecvene corespunztoare fiecrei variante.Coeficientul de corelaie

poate fi cuprins ntre: -minus unu -zero -plus unu.

Interpretarea coeficientului de corelaieCnd valoarea coeficientului de corelaie se apropie de +1, nseamn c ntre cele dou fenomene ce se coreleaz exist o legtur foarte puternic. Semnul + al coeficientului de corelaie denot c legtura de dependen dintre fenomene este direct. Deci ambele fenomene evolueaz n acelai sens, n aceeai direcie. Cnd valoarea coeficientului de corelaie se apropie de 1, nseamn c ntre cele dou fenomene exist o legtur foarte puternic, dar invers, n sens opus: crete un fenomen, scade cel cu care se coreleaz.

Pentru interpretarea intensitii legturii de dependen dintre fenomene, Guilford indic urmtoarele CRITERII:valoarea coeficientului de corelaie cuprins ntre 1 denot o corelaie foarte puternic ntre fenomene;valoarea coeficientului de corelaie cuprins ntre 0,99 i 0,70 denot o corelaie puternic;

valoarea coeficientului de corelaie cuprins ntre 0,69 i 0,30 denot o corelaie medie ntre fenomene;valoarea coeficientului de corelaie cuprins ntre 0,0 i 0,29 exprim existena unei corelaii slabe ntre fenomene;valoarea coeficientului de corelaie 0 denot c legtura dintre fenomene n mod practic o considerm inexistent. Cele dou fenomene evolueaz deci independent unul de altul.

Coeficientul de corelaie ntre fenomene poate fi corect interpretat dac se ine seama de urmtoarele ASPECTE:

-ntre fenomenele ce se coreleaz s existe, n mod logic, o legtur;-cele dou fenomene s fie cercetate pe eantioane omogene;-selecia frecvenei eantioanelor s se fac la ntmplare.

Pentru a analiza fidelitatea coeficientului de corelaie, n interpretarea legturii dintre fenomenele obinute pe eantioane, se apreciaz eroarea coeficientului de corelaie, care se noteaz cu mr.

pentru n > 100: 1 r2xymr = n n care:mr = eroarea coeficientului de corelaie;r2xy = ptratul valorii coeficientului de corelaie, obinut pe eantioane;1 = valoarea absolut a coeficientului de corelaie, obinut pe univers, pe ntreaga populaie;n = numrul variantelor perechi ale fenomenelor ce se coreleaz.

pentru n < 30, se utilizeaz n-2

cnd 30 < n < 100 se utilizeaz n-1

Dac valoarea coeficientului de corelaie obinut pe eantioane este mai mare dect triplul erorii sale, nseamn c acesta a fost obinut pe eantioane reprezentative, este deci real i ne putem bizui pe el n interpretarea legturii de dependen ntre fenomene.

Raportul dintre coeficientul de corelaie i eroarea lui se numete criteriu de exactitate al coeficientului de corelaie - tr. Criteriul n cauz se stabilete cu ajutorul tabelului valorilor criteriului t. Dac treal > ttabel, coeficientul de corelaie se consider semnificativ.

CORELOGRAMAExistena sau inexistena unei corelaii ntre fenomene se poate evidenia aproximativ cu ajutorul reprezentrilor grafice. n acest caz, folosim un grafic cu dou scri, ordonat i abscis, pe care nscriem valorile variantelor celor dou fenomene x i y.

Se realizeaz astfel norul de puncte. Dac norul de puncte se va dispune fuziform, oblic de jos n sus i de la stnga la dreapta, ntre cele dou fenomene exist o corelaie direct. Crete un fenomen, crete i cel de al doilea, cu care se coreleaz, sau ambele fenomene scad, evolund n aceeai direcie. Dac norul de puncte se dispune fuziform, oblic de sus n jos i de la stnga la dreapta, ntre cele dou fenomene exist o corelaie invers. Dac punctele se dispun pe toat reeaua grafic, neavnd nici o tendin de a se grupa, nseamn c ntre fenomene nu exist nici o legtur de dependen, fenomenele evolund independent unul fa de cellalt. n cazul acesta, dreapta care trece prin mijlocul punctelor este paralel fie cu ordonata, fie cu abscisa.

CORELAIA MULTIPLSe stabilete ntre mai mult de dou fenomene, care au legtur de dependen ntre ele.

n asemenea situaii, existena legturii de dependen ntre fenomene, sensul i intensitatea acestei legturi, se stabilesc cu ajutorul coeficientului de corelaie linear multipl.

FORMULA DE CALCULrxyz = r2xy + r2xz 2(rxy) ryz rxz 1 r2xzn care:

rxyz=coeficientul de corelaie linear multipl ntre cele trei fenomene;rxy=coeficientul de corelaie linear simpl ntre fenomenele x i y;ryz=coeficientul de corelaie linear simpl ntre fenomenele y i z;rxz=coeficientul de corelaie linear simpl ntre fenomenele x i z;

Interpretarea intensitii corelaiei multiple ine seama de aceleai criterii enunate la interpretarea coeficientului de corelaie linear simpl.

CORELAIA RANGURILOR (SPEARMAN)

n cazul n care dorim s stabilim legtura de dependen ntre fenomenele cercetate pe eantioane mici, utilizm coeficientul de corelaie al rangurilor, propus de Spearman (1904). Acest coeficient se noteaz cu litera greac (ro) i se determin dup formula propus de Spearman:

6 d2= 1- n (n2 1) n care:1 = valoarea absolut a coeficientului de corelaie; = coeficientul de corelaie Spearman;6 = valoare constant;d2 = suma ptratelor diferenelor dintre rangurile primului ir de variante i rangurile celui de al doilea ir de variante, cu care se coreleaz;n = numrul variantelor perechi variantelor ce se coreleaz.

Coeficientul de corelaie al rangurilor poate avea valori cuprinse ntre 1 -0- +1. El exprim o legtur perfect cnd are valoarea +1. n aceast situaie, rangurile au valori egale, iar diferena ntre ranguri este egal cu 0.

Exemple:1. Timpul trecut din momentul accesului de pancreatit acut (x) i numrul complicaiilor postoperatorii (y)

2. Legtura de corelaie ntre copiii cu deficien mintal (la 100 mii copii) i invaliditatea copiilor (la 100 mii copii)

REGRESIATermenul de regresie a fost introdus de F. Galton, care a observat c nlimea descendenilor regreseaz ctre nlimea prinilor.

completeaz corelaia i prin intermediul coeficientului de regresie, se stabilete cu ct crete sau descrete sub aspect cantitativ, un fenomen, cnd cel cu care se coreleaz crete sau descrete cu o unitate de msur.

Regresia poate fi: -simpl i multipl -liniar i neliniar=direct, cnd fenomenele evolueaz n acelai sens (crete x, crete y sau scade x scade i y)=indirect, cnd fenomenul evolueaz n sens opus (crete x scade y sau scade x crete y)

Formula coeficientului de regresie este: yRgyx = rxy xsau xRgxy = rxy yn care:

Rgxy = coeficientul de regresie a lui x n funcie de y. El exprim, cantitativ, cu ct crete sau scade fenomenul x cnd y crete sau scade cu o unitate de msur;Rgyx = coeficientul de regresie a lui y n funcie de x. El exprim, cantitativ, cu ct crete sau scade fenomenul y cnd x crete sau scade cu o unitate de msur;rxy = coeficientul de corelaie liniar Bravais-Pearson;x = deviaia standard a fenomenului x;y = deviaia standard a fenomenului y.