regresie ii

Upload: lorena-lungu

Post on 14-Oct-2015

7 views

Category:

Documents


0 download

DESCRIPTION

statistica

TRANSCRIPT

  • 1Regresie si corelatie/SERII INTERDEPENDENTE-II

    Note de cursDisciplina : STATISTICA

    Modele neliniare de regresie (1)Modelul exponen?ial transformat al ecua?iei exponen?iale are la baz?

    ecua?ia:

    y = a bx care se estimeaz? folosind modelul:

    Y = a bx + ?Prin logaritmare, modelul se poate transforma ntr-un model liniar de

    forma:

    lg Y = lg a + x lg b

    ??cnd urm?toarele nlocuiri:

    Y = lg Y ; a' = lg a ; b' = lg b, rezult? ecua?ia unei drepte,

    respectiv:

    y' = a' + b' x

    Modele neliniare de regresie (2)Modelul hiperbolei

    Leg?turile dintre fenomenele economice pot fi ?i de forma unei hiperbole.

    n acest caz, dependen?a invers? dintre cele dou? variabile (x scade, y cre?te sau

    x cre?te, y scade) se poate exprima prin ecua?ia:

    xysau

    x1

    y????????

    Func?ia de estima?ie este:

    ???? bx1

    aYi

    iar cei doi parametri rezult? din rezolvarea sistemului de ecua?ii normale:

    ???

    ???

    ?

    ??

    ??

    ???

    ??

    ii2ii

    ii

    yx1

    x

    1b

    x1

    a

    yx1

    bna

    Click

    here

    to bu

    y

    ABB

    YYPDF

    Transformer 2.0

    www.ABBYY.com

    Click

    here

    to bu

    y

    ABB

    YYPDF

    Transformer 2.0

    www.ABBYY.com

  • 2Modele neliniare de regresie (3)Modelul logaritmic este dat de expresia:

    y = a + b lg x, care se estimeaz? prin modelul:

    Y = a + b lg xi + ?,Cnd a > 0 ?i b > 0 curba este cresc?toare, iar cnd a > 0 ?i b < 0 curba

    este descresc?toare.

    Folosind metoda celor mai mici p?trate se ajunge la urm?torul sistem de

    ecua?ii normale:

    ? ????

    ????

    ?????

    ii2

    ii

    ii

    xlgyxlgbxlga

    yxlgbna

    MODELE DE REGRESIE MULTIFACTORIAL?

    (X11,X21,Y1)

    (X13,X23,Y3)

    Y

    (X14,X24,Y4)

    X1

    (X15,X25,Y5)

    (X12,X22,Y2)

    X2

    X15 X25

    Y5

    Y

    34

    1,0

    1,5

    3 2

    2,0

    2,5

    2 1

    3,0

    3,5

    1 0X2X1

    0 -1-1 -2-2 -3-3

    Y = (10 - X12 - X22)1/2Y' = a + b1*X1 + b2*X2.

    Metoda corela?iei

    ?Corela?ia parametric? (variabile m?suratepe scala de raport)?Corela?ia neparametric? (variabile??surate pe scala nominal?, ordinal? saude interval)

    Click

    here

    to bu

    y

    ABB

    YYPDF

    Transformer 2.0

    www.ABBYY.com

    Click

    here

    to bu

    y

    ABB

    YYPDF

    Transformer 2.0

    www.ABBYY.com

  • 3Corela?ia parametric?

    Metoda corela?iei prezint? avantajul c? ofer? o m?sur? sintetic? aleg?turilor dintre variabilele statistice. Indicatorii care m?soar?intensitatea leg?turii sunt: covarian?a, coeficientul de corela?ie ?iraportul de corela?ie.

    COVARIAN?A

    Covarian?a se calculeaz? sub forma mediei aritmetice simple a produselor

    abaterilor celor dou? variabile corelate, x??i y, de la mediile lor aritmetice x ??iy , conform rela?iei:

    ? ? ??

    ???????

    ? ???????

    ? ??n

    iii yyxxn

    yx1

    1,cov

    Covarian?a (2)Covaria?ia este nul? dac? variabilele sunt independente (lipsa leg?turii de

    corela?ie).

    Valoarea sa absolut? cov (x,y) nu are limit? superioar?. Pe m?sur? ce

    intensitatea corela?iei cre?te ?i covaria?ia cre?te.

    Indicatorul reprezint? avantajul c? se calculeaz? destul de u?or. n acela?i

    timp, prezint?? ?i dezavantajul c? depinde de unit??ile n care se m?soar?

    variabilele aleatoare.

    Deci nu este comparabil de la o variabil? la alta.

    Indicatorul ia valori pozitive dac? leg?tura dintre variabile este direct?? ?i

    valori negative n coz contrar. Valori apropiate de zero semnific? lipsa

    oric?rei leg?turi ntre x??i y; valori ridicate ale indicatorului arat? o leg?tur?

    puternic?.

    COEFICIENTUL DE CORELA?IE LINIAR? SIMPL? (1)Este un indicator care m?soar? numai intensitatea leg?turii de tip liniar

    dintre dou? variabile x ?i y. Se calculeaz? ca o medie aritmetic? a produsului

    abaterilor normale normate ale celor dou? variabile.

    Notnd abaterile normale normate ale variabilelor x??i y:

    y

    iy

    x

    ix

    yyz;

    xxz

    ???

    ???

    rezult? urm?toarea rela?ie de calcul:

    ? ?? ? ? ?? ?? ? ? ??

    ????

    ??????22

    yyxx

    yyxxn

    yyxxx

    ii

    ii

    yx

    iixy ??

    n care n " este num?rul observa?iilor-perechi.

    Fa?? de covarian?? rezult? c? rela?ia:

    ? ? ? ?? ?yx

    ii

    yxxy n

    yyxxy,xcovr ????????

    ?

    sau, altfel spus, covaria?ia abaterilor normate zx, zy se transform? n coeficientul

    de corela?ie liniar? simpl?.

    Click

    here

    to bu

    y

    ABB

    YYPDF

    Transformer 2.0

    www.ABBYY.com

    Click

    here

    to bu

    y

    ABB

    YYPDF

    Transformer 2.0

    www.ABBYY.com

  • 4COEFICIENTUL DE CORELA?IE LINIAR? SIMPL? (2)n practic? se utilizeaz? rela?ia:

    ? ?? ? ? ?? ?2222 ???????

    ????

    iiii

    iiii

    yynxxn

    yxyxnr

    Coeficientul de corela?ie simpl? se mai poate calcula ?i cu rela?ia:

    y

    xbr??? ,

    n care:

    b - este coeficientul de regresie simpl?;

    ?x - abaterea medie p?tratic? a caracteristicii factoriale;?y - abaterea medie p?tratic? a caracteristicii rezultative.

    COEFICIENTUL DE CORELA?IE LINIAR? SIMPL? (3)

    Coeficientul de corela?ie poate lua valori cuprinse ntre -1 ?i+1, adic? satisface inegalit??ile: - 1 ? ryx ? 1, iar semnul??u, ca ?i cel al coeficientului de regresie, semnific? tipulde leg?tur?: semnul minus indic? leg?tura invers?,semnul plus indic? leg?tura direct?.

    Cu ct coeficientul de corela?ie are valori mai apropiate de1 sau 1, cu att corela?ia rectilinie dintre variabilele x ?iy este mai puternic?. Pe m?sur? ce coeficientul decorela?ie se apropie de zero, scade ?i intensitatealeg?turii dintre cele dou? variabile. n cazul n care ryx =0, variabilele sunt independente ori necorelate liniar, iarpentru egal cu unitatea, rezult? dependen?a func?ional?ntre cele dou? variabile.

    Raportul de corela?ie (1)Denumit ?i coeficientul de corela?ie Pearson, acest indicator

    ??soar? att intensitatea leg?turilor liniare, ct ?i curbilinii. Se

    define?te cu rela?ia:

    ? ?? ??

    ??????

    2i

    2i

    yy

    yy1

    sau cu rela?ia:

    ? ?? ??

    ?????

    2i

    2i

    yy

    yy

    Click

    here

    to bu

    y

    ABB

    YYPDF

    Transformer 2.0

    www.ABBYY.com

    Click

    here

    to bu

    y

    ABB

    YYPDF

    Transformer 2.0

    www.ABBYY.com

  • 5Raportul de corela?ie (2)Calculul raportului de corela?ie se bazeaz? pe descompunerea dispersiei

    totale a variabilei dependente 2ys n dispersia valorilor empirice fa?? de valorile

    teoretice 2 Y/ys ??i dispersia valorilor teoretice fa?? de medie2

    y/Ys .

    2y/Y

    2Y/y

    2y sss ??

    sau ntr-o form? explicit?:

    ? ? ? ?n

    yYn

    yy22 ?? ???

    Aceasta ne permite s? scriem:

    2y

    2Y/y

    2y

    2y/Y 1ssau1

    ?

    ????

    ?

    ????

    Raportul de corela?ie (3)Dispersiile au urm?toarele semnifica?ii:- m?soar? ac?iunea tuturor factorilor care au influen?at asupra

    variabilei rezultative:- m?soar? varia?ia valorilor y sub influen?a tuturor celorlal?i factori

    necuprin?i n model, a c?ror ac?iune e considerat? constant?;este denumit???i dispersia rezidual?;

    - m?soar? numai influen?a variabilei independente sau factoriale xasupra variabilei y. Cu ct ponderea acestei dispersii n cadruldispersiei generale va fi mai mare, cu att leg?tura dintre celedou? variabile va fi mai puternic?.

    InterpretareRaportul de corela?ie poate lua valori ntre 0 ?i 1. Cu ct valoarea

    raportului este mai apropiat? de 1 cu att leg?tura de corela?ieeste mai puternic???i invers.

    n cazul corela?iei liniare, raportul de corela?ie este egal cucoeficientul de corela?ie luat n valoare absolut???i aceast? rela?iepoate fi considerat? ca un test de verificare a liniarit??ii leg?turii .

    Validarea modelului de regresie (1)Pentru verificarea ipotezei c? parametrul a al ecua?iei de regresie liniar?

    simpl? difer? semnificativ de zero, se utilizeaz? criteriul (testul):

    nsa

    t ? ,

    n care:

    ? ?2nYy

    s2

    ??? ?

    este abaterea medie p?tratic? a valorilor nregistrate ale caracteristicii y fa?? de

    linia de regresie Y, iar n este num?rul perechilor de valori (x,y).

    Valoarea lui t calculat? cu rela?ia de mai sus se compar? cu valoarea

    tabelar? tq;f, corespunz?toare nivelului de semnifica?ie q ?i num?rului gradelor de

    libertate f = n - 2.

    Click

    here

    to bu

    y

    ABB

    YYPDF

    Transformer 2.0

    www.ABBYY.com

    Click

    here

    to bu

    y

    ABB

    YYPDF

    Transformer 2.0

    www.ABBYY.com

  • 6Validarea modelului de regresie (2)

    Verificarea semnifica?iei coeficien?ilor de regresie se poate face cu ajutorulanalizei dispersionale, adic? (y - Y)2, se descompune n sumele de p?tratede abateri: (Y - y)2 ?i (y - Y)2. Cu ajutorul acestor sume de p?trate secalculeaz? dispersiile corectate:cu n - 1 grade de libertate;cu f grade de libertate;

    cu n f 1 grade de libertate,unde:n - este num?rul valorilor observate ale caracteristicii y;f num?rul coeficien?ilor ecua?iei de regresie liniar?.Se calculeaz? raportul dintre ?i , adic? se ob?ine valoarea calculat? F care se

    compar? cu cea tabelar? n func?ie de nivelul de semnifica?ie q ?i denumerele gradelor de libertate f ?i n f - 1.

    Interpretarea se face astfel:dac? Fcalc. < Ftabelar se accept? ipoteza nul?;dac? Fcalc. > Ftabelar se respinge ipoteza nul?, respectiv se apreciaz? c?

    valorile x (sau variabilele xi) influen?eaz? semnificativ variabila y.

    Testarea coeficientului de corela?ie liniar? r

    Folosim testul t:

    2nr1

    rt

    2?

    ?? ,

    unde:

    n - reprezint? volumul e?antionului;

    Valoarea calculat? se compar? cu valoarea tabelar? tq;n-2, corespunz?toare

    nivelului de semnifica?ie q ?i num?rului gradelor de libertate n 2.

    Dac?:

    t ? tq;n-2 coeficien?ii de corela?ie sunt semnificativi;t < tq;n-2 coeficien?ii de corela?ie nu sunt semnificativi, leg?tura

    dintre caracteristicile studiate fiind ntmpl?toare.

    Corela?ia neparametric?Modalit??i de abordare statistic? a variabilelor calitativeVariabile/Scala de??surare

    Nominal? Ordinal?

    Dihotomice Coeficien?ii ?, Q, Y, J ?i d2Indicele de coinciden??Coeficientul de corela?ie rdTestul 2?Regresie categorial? de tip Logit ?i Probit

    Polihotomice(categoriale)

    Coeficien?ii ?, C, V, T,? *,? *Testul 2?Coeficientul de incertitudineU*Regresie logistic?multinomial?Regresie utiliznd variabilen form? stratificat?

    Coeficientul Spearman ?Coeficien?ii lui Kendall (? )Coeficien?ii d, ?Regresie ordinal? de tip Logit ?iProbitRegresie utiliznd variabile nform? stratificat?

    Click

    here

    to bu

    y

    ABB

    YYPDF

    Transformer 2.0

    www.ABBYY.com

    Click

    here

    to bu

    y

    ABB

    YYPDF

    Transformer 2.0

    www.ABBYY.com

  • 7Coeficientul de asociere QDistribu?ia persoanelor n func?ie de na?ionalitate ?i religieReligia/ Na?ionalitatea Romn Non-romn TotalOrtodox n11 n12 n1.Non-ortodox n21 n22 n2.Total n.1 n .2 n

    Coeficientul QA fost introdus de statisticianul englez Yule. Formula sa de

    calcul este:

    21122211

    21122211

    ****

    nnnnnnnnQ ?

    ??

    Acesta ia valori tot ntre 1 ?i 1. Dac? n cazul coeficientului ?la apari?ia unei valori nule marimea calculat? nu atinge valorile maxime,n cazul coeficientului Q apari?ia unei valori nule duce la atingereavalorii maxime pozitive sau negative. n cazul unor variabileindependente, ca ?i la ? valoarea coeficientului Q este nul?.

    Coeficien?ii de corela?ie ai rangurilor (1)Pe baza datelor din anuarul statistic al Romniei pentru anul 1999 s-au

    nregistrat datele urm?toare pentru 10 judete.Nr. Jud. Supraf.

    (km2)Nr.

    Comunelor1 AB 6242 662 AG 6826 933 AR 7754 674 BC 6621 795 BH 7544 866 BN 5355 537 BR 4766 398 BT 4986 689 BV 5363 43

    10 BZ 6103 81

    ?? se stabileasc? dac? exist? o leg?tur? ntre suprafa?a total?? ?i num?rul

    comunelor, utiliznd coeficien?ii de corela?ie a rangurilor a lui Spearman ?i Kendall. S?

    se interpreteze rezultatele.

    Coeficien?ii de corela?ie ai rangurilor (2)

    Nr. Jud. (X)Supraf.(km2)

    (Y)Nr.

    Comunelor

    Rx Ry di di2 P Q S

    1 AR 7754 67 1 6 -5 25 4 5 -12 BH 7544 86 2 2 0 0 7 1 63 AG 6826 93 3 1 2 4 7 0 74 BC 6621 79 4 4 0 0 5 1 45 AB 6242 66 5 7 -2 4 3 2 16 BZ 6103 81 6 3 3 9 4 0 47 BV 5363 43 7 9 -2 4 1 2 -18 BN 5355 53 8 8 0 0 1 1 09 BT 4986 68 9 5 4 16 1 0 110 BR 4766 39 10 10 0 0 0 0 0

    Tot. 62 33 12 21

    624.09903721

    99*1062*61

    )1(6

    1 22

    ??????

    ?? ?nn

    dC iS

    467.09*10

    21*2)1(

    2 ???

    ? ?nn

    SCK unde S=P-Q

    Leg?tura este direct???i de intensitate medie.

    Click

    here

    to bu

    y

    ABB

    YYPDF

    Transformer 2.0

    www.ABBYY.com

    Click

    here

    to bu

    y

    ABB

    YYPDF

    Transformer 2.0

    www.ABBYY.com