regresie ii
DESCRIPTION
statisticaTRANSCRIPT
-
1Regresie si corelatie/SERII INTERDEPENDENTE-II
Note de cursDisciplina : STATISTICA
Modele neliniare de regresie (1)Modelul exponen?ial transformat al ecua?iei exponen?iale are la baz?
ecua?ia:
y = a bx care se estimeaz? folosind modelul:
Y = a bx + ?Prin logaritmare, modelul se poate transforma ntr-un model liniar de
forma:
lg Y = lg a + x lg b
??cnd urm?toarele nlocuiri:
Y = lg Y ; a' = lg a ; b' = lg b, rezult? ecua?ia unei drepte,
respectiv:
y' = a' + b' x
Modele neliniare de regresie (2)Modelul hiperbolei
Leg?turile dintre fenomenele economice pot fi ?i de forma unei hiperbole.
n acest caz, dependen?a invers? dintre cele dou? variabile (x scade, y cre?te sau
x cre?te, y scade) se poate exprima prin ecua?ia:
xysau
x1
y????????
Func?ia de estima?ie este:
???? bx1
aYi
iar cei doi parametri rezult? din rezolvarea sistemului de ecua?ii normale:
???
???
?
??
??
???
??
ii2ii
ii
yx1
x
1b
x1
a
yx1
bna
Click
here
to bu
y
ABB
YYPDF
Transformer 2.0
www.ABBYY.com
Click
here
to bu
y
ABB
YYPDF
Transformer 2.0
www.ABBYY.com
-
2Modele neliniare de regresie (3)Modelul logaritmic este dat de expresia:
y = a + b lg x, care se estimeaz? prin modelul:
Y = a + b lg xi + ?,Cnd a > 0 ?i b > 0 curba este cresc?toare, iar cnd a > 0 ?i b < 0 curba
este descresc?toare.
Folosind metoda celor mai mici p?trate se ajunge la urm?torul sistem de
ecua?ii normale:
? ????
????
?????
ii2
ii
ii
xlgyxlgbxlga
yxlgbna
MODELE DE REGRESIE MULTIFACTORIAL?
(X11,X21,Y1)
(X13,X23,Y3)
Y
(X14,X24,Y4)
X1
(X15,X25,Y5)
(X12,X22,Y2)
X2
X15 X25
Y5
Y
34
1,0
1,5
3 2
2,0
2,5
2 1
3,0
3,5
1 0X2X1
0 -1-1 -2-2 -3-3
Y = (10 - X12 - X22)1/2Y' = a + b1*X1 + b2*X2.
Metoda corela?iei
?Corela?ia parametric? (variabile m?suratepe scala de raport)?Corela?ia neparametric? (variabile??surate pe scala nominal?, ordinal? saude interval)
Click
here
to bu
y
ABB
YYPDF
Transformer 2.0
www.ABBYY.com
Click
here
to bu
y
ABB
YYPDF
Transformer 2.0
www.ABBYY.com
-
3Corela?ia parametric?
Metoda corela?iei prezint? avantajul c? ofer? o m?sur? sintetic? aleg?turilor dintre variabilele statistice. Indicatorii care m?soar?intensitatea leg?turii sunt: covarian?a, coeficientul de corela?ie ?iraportul de corela?ie.
COVARIAN?A
Covarian?a se calculeaz? sub forma mediei aritmetice simple a produselor
abaterilor celor dou? variabile corelate, x??i y, de la mediile lor aritmetice x ??iy , conform rela?iei:
? ? ??
???????
? ???????
? ??n
iii yyxxn
yx1
1,cov
Covarian?a (2)Covaria?ia este nul? dac? variabilele sunt independente (lipsa leg?turii de
corela?ie).
Valoarea sa absolut? cov (x,y) nu are limit? superioar?. Pe m?sur? ce
intensitatea corela?iei cre?te ?i covaria?ia cre?te.
Indicatorul reprezint? avantajul c? se calculeaz? destul de u?or. n acela?i
timp, prezint?? ?i dezavantajul c? depinde de unit??ile n care se m?soar?
variabilele aleatoare.
Deci nu este comparabil de la o variabil? la alta.
Indicatorul ia valori pozitive dac? leg?tura dintre variabile este direct?? ?i
valori negative n coz contrar. Valori apropiate de zero semnific? lipsa
oric?rei leg?turi ntre x??i y; valori ridicate ale indicatorului arat? o leg?tur?
puternic?.
COEFICIENTUL DE CORELA?IE LINIAR? SIMPL? (1)Este un indicator care m?soar? numai intensitatea leg?turii de tip liniar
dintre dou? variabile x ?i y. Se calculeaz? ca o medie aritmetic? a produsului
abaterilor normale normate ale celor dou? variabile.
Notnd abaterile normale normate ale variabilelor x??i y:
y
iy
x
ix
yyz;
xxz
???
???
rezult? urm?toarea rela?ie de calcul:
? ?? ? ? ?? ?? ? ? ??
????
??????22
yyxx
yyxxn
yyxxx
ii
ii
yx
iixy ??
n care n " este num?rul observa?iilor-perechi.
Fa?? de covarian?? rezult? c? rela?ia:
? ? ? ?? ?yx
ii
yxxy n
yyxxy,xcovr ????????
?
sau, altfel spus, covaria?ia abaterilor normate zx, zy se transform? n coeficientul
de corela?ie liniar? simpl?.
Click
here
to bu
y
ABB
YYPDF
Transformer 2.0
www.ABBYY.com
Click
here
to bu
y
ABB
YYPDF
Transformer 2.0
www.ABBYY.com
-
4COEFICIENTUL DE CORELA?IE LINIAR? SIMPL? (2)n practic? se utilizeaz? rela?ia:
? ?? ? ? ?? ?2222 ???????
????
iiii
iiii
yynxxn
yxyxnr
Coeficientul de corela?ie simpl? se mai poate calcula ?i cu rela?ia:
y
xbr??? ,
n care:
b - este coeficientul de regresie simpl?;
?x - abaterea medie p?tratic? a caracteristicii factoriale;?y - abaterea medie p?tratic? a caracteristicii rezultative.
COEFICIENTUL DE CORELA?IE LINIAR? SIMPL? (3)
Coeficientul de corela?ie poate lua valori cuprinse ntre -1 ?i+1, adic? satisface inegalit??ile: - 1 ? ryx ? 1, iar semnul??u, ca ?i cel al coeficientului de regresie, semnific? tipulde leg?tur?: semnul minus indic? leg?tura invers?,semnul plus indic? leg?tura direct?.
Cu ct coeficientul de corela?ie are valori mai apropiate de1 sau 1, cu att corela?ia rectilinie dintre variabilele x ?iy este mai puternic?. Pe m?sur? ce coeficientul decorela?ie se apropie de zero, scade ?i intensitatealeg?turii dintre cele dou? variabile. n cazul n care ryx =0, variabilele sunt independente ori necorelate liniar, iarpentru egal cu unitatea, rezult? dependen?a func?ional?ntre cele dou? variabile.
Raportul de corela?ie (1)Denumit ?i coeficientul de corela?ie Pearson, acest indicator
??soar? att intensitatea leg?turilor liniare, ct ?i curbilinii. Se
define?te cu rela?ia:
? ?? ??
??????
2i
2i
yy
yy1
sau cu rela?ia:
? ?? ??
?????
2i
2i
yy
yy
Click
here
to bu
y
ABB
YYPDF
Transformer 2.0
www.ABBYY.com
Click
here
to bu
y
ABB
YYPDF
Transformer 2.0
www.ABBYY.com
-
5Raportul de corela?ie (2)Calculul raportului de corela?ie se bazeaz? pe descompunerea dispersiei
totale a variabilei dependente 2ys n dispersia valorilor empirice fa?? de valorile
teoretice 2 Y/ys ??i dispersia valorilor teoretice fa?? de medie2
y/Ys .
2y/Y
2Y/y
2y sss ??
sau ntr-o form? explicit?:
? ? ? ?n
yYn
yy22 ?? ???
Aceasta ne permite s? scriem:
2y
2Y/y
2y
2y/Y 1ssau1
?
????
?
????
Raportul de corela?ie (3)Dispersiile au urm?toarele semnifica?ii:- m?soar? ac?iunea tuturor factorilor care au influen?at asupra
variabilei rezultative:- m?soar? varia?ia valorilor y sub influen?a tuturor celorlal?i factori
necuprin?i n model, a c?ror ac?iune e considerat? constant?;este denumit???i dispersia rezidual?;
- m?soar? numai influen?a variabilei independente sau factoriale xasupra variabilei y. Cu ct ponderea acestei dispersii n cadruldispersiei generale va fi mai mare, cu att leg?tura dintre celedou? variabile va fi mai puternic?.
InterpretareRaportul de corela?ie poate lua valori ntre 0 ?i 1. Cu ct valoarea
raportului este mai apropiat? de 1 cu att leg?tura de corela?ieeste mai puternic???i invers.
n cazul corela?iei liniare, raportul de corela?ie este egal cucoeficientul de corela?ie luat n valoare absolut???i aceast? rela?iepoate fi considerat? ca un test de verificare a liniarit??ii leg?turii .
Validarea modelului de regresie (1)Pentru verificarea ipotezei c? parametrul a al ecua?iei de regresie liniar?
simpl? difer? semnificativ de zero, se utilizeaz? criteriul (testul):
nsa
t ? ,
n care:
? ?2nYy
s2
??? ?
este abaterea medie p?tratic? a valorilor nregistrate ale caracteristicii y fa?? de
linia de regresie Y, iar n este num?rul perechilor de valori (x,y).
Valoarea lui t calculat? cu rela?ia de mai sus se compar? cu valoarea
tabelar? tq;f, corespunz?toare nivelului de semnifica?ie q ?i num?rului gradelor de
libertate f = n - 2.
Click
here
to bu
y
ABB
YYPDF
Transformer 2.0
www.ABBYY.com
Click
here
to bu
y
ABB
YYPDF
Transformer 2.0
www.ABBYY.com
-
6Validarea modelului de regresie (2)
Verificarea semnifica?iei coeficien?ilor de regresie se poate face cu ajutorulanalizei dispersionale, adic? (y - Y)2, se descompune n sumele de p?tratede abateri: (Y - y)2 ?i (y - Y)2. Cu ajutorul acestor sume de p?trate secalculeaz? dispersiile corectate:cu n - 1 grade de libertate;cu f grade de libertate;
cu n f 1 grade de libertate,unde:n - este num?rul valorilor observate ale caracteristicii y;f num?rul coeficien?ilor ecua?iei de regresie liniar?.Se calculeaz? raportul dintre ?i , adic? se ob?ine valoarea calculat? F care se
compar? cu cea tabelar? n func?ie de nivelul de semnifica?ie q ?i denumerele gradelor de libertate f ?i n f - 1.
Interpretarea se face astfel:dac? Fcalc. < Ftabelar se accept? ipoteza nul?;dac? Fcalc. > Ftabelar se respinge ipoteza nul?, respectiv se apreciaz? c?
valorile x (sau variabilele xi) influen?eaz? semnificativ variabila y.
Testarea coeficientului de corela?ie liniar? r
Folosim testul t:
2nr1
rt
2?
?? ,
unde:
n - reprezint? volumul e?antionului;
Valoarea calculat? se compar? cu valoarea tabelar? tq;n-2, corespunz?toare
nivelului de semnifica?ie q ?i num?rului gradelor de libertate n 2.
Dac?:
t ? tq;n-2 coeficien?ii de corela?ie sunt semnificativi;t < tq;n-2 coeficien?ii de corela?ie nu sunt semnificativi, leg?tura
dintre caracteristicile studiate fiind ntmpl?toare.
Corela?ia neparametric?Modalit??i de abordare statistic? a variabilelor calitativeVariabile/Scala de??surare
Nominal? Ordinal?
Dihotomice Coeficien?ii ?, Q, Y, J ?i d2Indicele de coinciden??Coeficientul de corela?ie rdTestul 2?Regresie categorial? de tip Logit ?i Probit
Polihotomice(categoriale)
Coeficien?ii ?, C, V, T,? *,? *Testul 2?Coeficientul de incertitudineU*Regresie logistic?multinomial?Regresie utiliznd variabilen form? stratificat?
Coeficientul Spearman ?Coeficien?ii lui Kendall (? )Coeficien?ii d, ?Regresie ordinal? de tip Logit ?iProbitRegresie utiliznd variabile nform? stratificat?
Click
here
to bu
y
ABB
YYPDF
Transformer 2.0
www.ABBYY.com
Click
here
to bu
y
ABB
YYPDF
Transformer 2.0
www.ABBYY.com
-
7Coeficientul de asociere QDistribu?ia persoanelor n func?ie de na?ionalitate ?i religieReligia/ Na?ionalitatea Romn Non-romn TotalOrtodox n11 n12 n1.Non-ortodox n21 n22 n2.Total n.1 n .2 n
Coeficientul QA fost introdus de statisticianul englez Yule. Formula sa de
calcul este:
21122211
21122211
****
nnnnnnnnQ ?
??
Acesta ia valori tot ntre 1 ?i 1. Dac? n cazul coeficientului ?la apari?ia unei valori nule marimea calculat? nu atinge valorile maxime,n cazul coeficientului Q apari?ia unei valori nule duce la atingereavalorii maxime pozitive sau negative. n cazul unor variabileindependente, ca ?i la ? valoarea coeficientului Q este nul?.
Coeficien?ii de corela?ie ai rangurilor (1)Pe baza datelor din anuarul statistic al Romniei pentru anul 1999 s-au
nregistrat datele urm?toare pentru 10 judete.Nr. Jud. Supraf.
(km2)Nr.
Comunelor1 AB 6242 662 AG 6826 933 AR 7754 674 BC 6621 795 BH 7544 866 BN 5355 537 BR 4766 398 BT 4986 689 BV 5363 43
10 BZ 6103 81
?? se stabileasc? dac? exist? o leg?tur? ntre suprafa?a total?? ?i num?rul
comunelor, utiliznd coeficien?ii de corela?ie a rangurilor a lui Spearman ?i Kendall. S?
se interpreteze rezultatele.
Coeficien?ii de corela?ie ai rangurilor (2)
Nr. Jud. (X)Supraf.(km2)
(Y)Nr.
Comunelor
Rx Ry di di2 P Q S
1 AR 7754 67 1 6 -5 25 4 5 -12 BH 7544 86 2 2 0 0 7 1 63 AG 6826 93 3 1 2 4 7 0 74 BC 6621 79 4 4 0 0 5 1 45 AB 6242 66 5 7 -2 4 3 2 16 BZ 6103 81 6 3 3 9 4 0 47 BV 5363 43 7 9 -2 4 1 2 -18 BN 5355 53 8 8 0 0 1 1 09 BT 4986 68 9 5 4 16 1 0 110 BR 4766 39 10 10 0 0 0 0 0
Tot. 62 33 12 21
624.09903721
99*1062*61
)1(6
1 22
??????
?? ?nn
dC iS
467.09*10
21*2)1(
2 ???
? ?nn
SCK unde S=P-Q
Leg?tura este direct???i de intensitate medie.
Click
here
to bu
y
ABB
YYPDF
Transformer 2.0
www.ABBYY.com
Click
here
to bu
y
ABB
YYPDF
Transformer 2.0
www.ABBYY.com