cap 3[1]. modelul liniar multiplu

Upload: alexandru-vrabie

Post on 14-Apr-2018

241 views

Category:

Documents


0 download

TRANSCRIPT

  • 7/29/2019 Cap 3[1]. Modelul Liniar Multiplu

    1/18

    Capitolul 2.

    MODELUL LINIAR MULTIPLU

    2.1. Forma modelului

    n general fenomenele economice pe care dorim s le modelm prineconometrie sunt complexe i nu pot fi reprezentate printr-un model liniar simplu.Modelul liniar multiplu corespunde mai bine acestei necesiti, introducnd maimulte variabile explicative.

    tktkttt xaxaxaay +++++= ...22110 Tt ,...,1= (2.1)

    t indexeaz observaiile T numrul de observaii

    ty variabila endogen la momentul t (sau observaia cu rangul t)

    tx1 este realizarea variabilei explicative 1 la momentul t (sau observaia cu

    rangul t)

    tx2 este realizarea variabilei explicative 2 la momentul t (sau observaia cu

    rangul t)....... ktx este realizarea variabilei explicative k la momentul t (sau observaia cu

    rangul t)

    t este realizarea n ta variabilei reziduale

    kaaaa ,...,,, 210 parametrii de estimat ai modelului.

    Sub forma din ecuaia 1.1 modelul este greu de utilizatat, fapt pentru carevom prefera o form mai condensat, matricial. Dac rescriem modelul observaiecu observaie, obinem:

    TkTkTTT

    tktkttt

    kk

    kk

    xaxaxaay

    xaxaxaay

    xaxaxaay

    xaxaxaay

    +++++=

    +++++=

    +++++=+++++=

    ...

    .......

    ...

    .......

    ...

    ...

    22110

    22110

    2222212102

    1121211101

    ceea ce sub form matricial (ntre paranteze numrul de linii i respectiv decoloane) devine:

    1

  • 7/29/2019 Cap 3[1]. Modelul Liniar Multiplu

    2/18

    )1,()1,1()1,()1,( Tk

    a

    kT

    X

    T

    Y +

    +

    +

    =(2.2)

    unde:

    =

    T

    t

    y

    y

    y

    y

    Y

    ...

    ...

    2

    1

    =

    kTTT

    kttt

    k

    k

    xxx

    xxx

    xxx

    xxx

    X

    ...1

    ...............

    ...1

    ...............

    ...1

    ...1

    21

    21

    22112

    12111

    =

    ka

    a

    a

    a

    a

    ...

    2

    1

    0

    =

    T

    t

    ...

    ...

    2

    1

    Prima coloan a matriceiXconine doar valoarea 1, care corespunde coeficientului

    0a . Astfel matricea X are T linii i k+1 coloane (k variabile explicative plus

    constanta).

    2.2. Estimarea parametrilor

    Considerm modelul sub form matricial, cu k variabile explicative i Tobservaii:

    += aXYPentru estimarea componentelor vectorului a , avnd ca i componente coeficienii

    kaaaa ,...,,, 210 aplicm ca i la modelul liniar simplu metoda patratelor minime

    (MPM), minimiznd suma patratelor erorilor.

    Notm: =

    =T

    t

    tS1

    2

    )''''2'min(

    )''''''min(

    )()'min(

    )'min(min1

    2

    XaXaYXaYY

    XaXaYXaXaYYY

    XaYXaY

    T

    t

    t

    +=+=

    =

    ==

    (2.3)

    unde :' este vectorul transpus al lui ;'a este vectorul transpus al lui a ;

    'Y este vectorul transpus al lui Y ;'X este transpusa matricii X .

    2

  • 7/29/2019 Cap 3[1]. Modelul Liniar Multiplu

    3/18

    Pentru a minimiza expresia, derivm n raport cu a :

    0'2'2 =+=

    aXXYXa

    S(2.4)

    YXXXa ')'( 1= (2.5)

    Aceast soluie este realizabil dac matricea patratic XX' este inversabil.Matricea este este neinversabil doar n caz de coliniaritate perfect ntre oricaredou variabile explicative.

    1.3. Ipoteze fundamentale asupra modelului

    H1 : 0)( =tE ; variabila rezidual este de medie nul ;

    H2 : ty i tx reprezint valori numerice observate fr erori

    H3 : Modelul este liniar n raport cu tx sau o transformare a lui tx (logaritm,

    inversiune, etc.) ; H4 : tE t = )(

    22 (variana perturbaiilor este constant, indiferent de t)

    H5 : 0),cov( ' =tt (erorile nu sunt corelate) ;

    H6 : 0),cov( =titx ki ,...,2,1= perturbaiile sunt independente n raport cu variabilaele explicative ;

    H7 : tNt ),0(2

    Pe lng aceste ipoteze ntlnite i la modelul liniar simplu, mai avem i ipoteze

    structurale, care in de forma modelului: H8 : variabilele explicative nu sunt coliniare. Aceasta implic existena matricei

    inverse a lui )'( XX , respectiv 1)'( XX ;

    H9 :T

    XX )'(tinde spre o matrice finit nesingular ;

    H10 : 1+> kT , adic numrul de observaii este mai mare dect numrul devariabile explicative plus constanta. n cazul 1+> kT s-ar obine unsistem de ecuaii nedeterminat. n cazul 1+= kT s-ar obine un sistem deT ecuaii cu T necunoscute perfect determinat.

    1.4. Proprietile estimatorilor

    Sub form matricial, modelul poate fi scris sub diferite forme:+= aXY

    aXY =

    eaXY += (unde YYe = )Obinem:

    3

  • 7/29/2019 Cap 3[1]. Modelul Liniar Multiplu

    4/18

    ')'(

    ')'()(')'(

    )(')'(

    ')'(

    1

    11

    1

    1

    XXXa

    XXXXaXXX

    XaXXX

    YXXXa

    +=

    +=

    +=

    =

    (2.6)

    Dar cunoatem c 0)( =E , aEXXXaaE =+= )(')'()( 1 (2.7)

    deci estimatorul este nedeplasat:aaE =)( (2.8)

    Calculm matricea varianelor i covarianelor coeficienilor modelului a :

    ]))([( 1= aaaaE

    a (2.9)

    Din 2.6 avem :

    ')'(

    1

    XXXaa

    =i deci:1

    )'(')'(

    = XXXaa

    deoarece 1)'( XX este o matrice simetric.11 )'('')'()')(( = XXXXXXaaaa

    de unde obinem:11

    )'()'(')'()')((== XXXEXXXaaaaa (2.10)

    Notnd cu: =)'(E matricea varianelor i covarianelor lui i innd cont

    de ipotezele de homoscedasticitate (variana erorilor constant) i de independenaa erorilor, avem:

    =

    ==

    2

    2

    2

    21

    22212

    12111

    000

    ............

    0...0

    0...0

    )(...)()(

    ............

    )(...)()(

    )(...)()(

    )'(

    TTTT

    T

    T

    EEE

    EEE

    EEE

    E

    de unde:112

    )'(')'(= XXXXXXa

    12 )'(

    = XXa (2.11)

    Fr a prezenta aici calculele, se poate demonstra (vezi Dormont, 1999) c un

    estimator nedeplasat al lui 2

    este:

    1

    ' 2

    =

    kT

    ee

    (2.12)

    nlocuind variana erorilor prin estimatorul su n expresia matricei de variane i

    covariane a coeficienilor (2.11), obinem:

    4

  • 7/29/2019 Cap 3[1]. Modelul Liniar Multiplu

    5/18

    12 )'(

    = XXa (2.13)

    Tot fr a demonstra aici, menionm c estimatorul obinut prinYXXXa ')'(

    1= este BLUE (Best Linear Unbiased Estimator), adic estenedeplasat i are variane minime ale estimatorilor.

    2.5. Teste i intervale de ncredere

    Din ipoteza de normalitate a erorilor ),0( 2 Nt rezult :

    )1,0(

    Naa

    ia

    ii

    2

    )1(2

    2

    )1( kT

    a

    a

    i

    ikT

    ca fiind suma patratelor unei variabile aleatoare normale.

    Ca urmare,ia

    ii aa

    este raportul dintre o variabil normal i rdcina patrat a

    unei variabile care urmeaz o distribuie 2 , deci:

    )1(

    kT

    a

    ii Studentaa

    i

    (2.14)

    2

    )1(

    1 )()'( + ka aaaa

    )1;1(1

    )()'(1

    1 +

    + kTkaFisheraaaa

    k

    Teste referitoare la un coeficient

    Testm egalitatea unui coeficient cu o valoare dat *a (utilizm aceast notaie,deoarece am notat cu a vectorul parametrilor.

    *:

    *:

    1

    0

    aaH

    aaH

    i

    i

    =

    tim din 2.14 c )1(

    kT

    a

    ii Studentaa

    i

    . Sub ipoteza 0H , rezult:

    )1(

    *

    =

    kTa

    a

    iiStudentt

    aai

    i

    (2.15)

    - dac2/

    1

    *

    > kTa tt i respingem 0H , deci ia este semnificativ diferit de *a (cuun risc de % )

    5

  • 7/29/2019 Cap 3[1]. Modelul Liniar Multiplu

    6/18

    - dac2/

    1

    *

    kTa tt i acceptm 0H , deci ia nu este semnificativ diferit de *a (cu un risc de % )

    n cele mai multe situaii dorim s testm nulitatea coeficienilor pentru a ti dac ovariabil explicativ este ntr-adevr semnificativ, ceea ce devine un caz particularal ipotezei de mai sus, pentru care 0* =a . Relaia 2.15 devine:

    )1(

    *

    = kTa

    a

    iStudentt

    ai

    i

    (2.16)

    Se poate construi astfel un interval de ncredere pentru coeficientul ia :

    =+ 1)(Prob

    2/

    1

    2/

    1 ii akTiiakTitaata (2.17)

    Test referitor la un ansamblu de coeficieni

    Testm simultan egalitatea unui ansamblu de coeficieni din modelul de regresie cuun ansamblu de valori fixate.

    *

    1

    *

    0

    :

    :

    mm

    mm

    aaH

    aaH

    =

    Efectum testul cu privire la m coeficieni, deci ma i respectiv*

    ma sunt vectori

    de dimensiune m :

    )1;(

    *

    1 )(

    )'(1

    = kTmammamm FisherFaaaa

    m mm(2.18)

    - dac

    )1;(

    * kTma FFm acceptm 0H , deci ma nu este semnificativ diferit

    de *ma (cu un risc de % )

    - dac

    )1;(

    * kTma FFm respingem 0H , deci ma este semnificativ diferit de

    *

    ma (cu un risc de % ).

    Desigur i pentru testul cu privire la un ansamblu de coeficieni, dorim s testmcel mai adesea nulitatea lor. Testul devine:

    mm

    mm

    aH

    aH

    0:

    0:

    1

    0

    =

    unde m0 este vectorul nul de dimensiune m :

    )1;(

    *

    1

    '

    1

    = kTmamam FisherFaam mm

    (2.19)

    2.6. Analiza varianei

    Ca i n cazul modelului liniar simplu, avem urmtoarele relaii:

    1) Suma reziduurilor este nul:

    6

  • 7/29/2019 Cap 3[1]. Modelul Liniar Multiplu

    7/18

    =

    =T

    t

    t

    1

    0 .

    2) Media (suma) seriei variabilei endogene este egal cu media (suma) serieiajustate:

    ==

    =T

    t

    t

    T

    t

    t yy11

    ttyy =

    Din aceste dou relaii putem deduce ecuaia de analiz a varianei:

    SPRSPESPT

    eyyyyT

    t

    t

    T

    t

    t

    T

    t

    t

    )()(1

    22

    1

    2

    1

    +=

    += === (2.20)

    Suma patratelor total (SPT) = Suma patratelor explicat (SPE) ++ Suma patratelor rezidual (SPR)

    Ecuaia ne permite s apreciem global calitatea ajustrii modelului. Aceastaeste cu att mai bun cu ct variana (suma patratelor) rezidual este mai mic.Pentru c valoarea ei depinde de unitatea de msur a variabilei, preferm unparametru adimensionat:

    2

    1

    1

    2

    2

    1

    2

    12

    )(

    1

    )(

    )(

    =

    =

    =

    =

    =

    =T

    t

    t

    T

    t

    t

    T

    t

    t

    T

    t

    t

    yy

    e

    yy

    yy

    R (2.21)

    care este de fapt raportul dintre variana explicat i cea total. 2R se numetecoeficient de determinaie, iar R coeficient de corelaie liniar multipl.

    tim c dac numrul de observaii T este egal cu numrul de variabileexplicative plus constanta (k+1) funcia trece prin toate punctele de coordonatereprezentate de observaii. Abaterile fiind nule, coeficientul de determinaie va fiegal cu 1, dar puterea explicativ a modelului este nul. Atunci cnd numrul de

    observaii este relativ mic n raport cu numrul de variabile explicative calculm un2R corectat, pe care l notm cu 2R :

    )1(1

    11 22 R

    kT

    TR

    = (2.22)

    Analiza varianei permite estimarea semnificativitii globale a modeluluide regresie. Testul se formuleaz astfel:

    nenulcoeficientunputincelexista:

    0...:

    1

    210

    H

    aaaH k ====

    7

  • 7/29/2019 Cap 3[1]. Modelul Liniar Multiplu

    8/18

    Nulitatea termenului constant 0a nu ne intereseaz, ci doar variabilele explicative.

    Oricum, un model n care numai termenul constant este semnificativ nu are sens

    economic. Dac ipoteza 0H este acceptat nseamn c nu exist nici o relaie

    liniar semnificativ ntre variabila endogen i cele explicative, adic SPEnu este

    semnificativ diferit de 0. Pe baza ecuaiei de analiz a varianei:

    ===

    +=T

    t

    t

    T

    t

    t

    T

    t

    t eyyyy1

    22

    1

    2

    1

    )()(

    construim tabloul de analiz a varianei:

    Tabelul 2.1 : Analiza varianeiSursa variaiei Suma patratelor Numrul gradelor

    de libertate

    Variabilele explicative (

    kxxx ,...,, 21 )

    2

    1

    )(=

    =T

    t

    t yySPE k

    Variabila rezidual =

    =T

    t

    teSPR1

    2

    1kT

    Total2

    1

    )(=

    =T

    t

    t yySPT 1T

    Se construiete raportul:

    )1/()1(

    /

    )1/(

    /)(

    *2

    2

    1

    2

    1

    2

    =

    =

    =

    =

    kTR

    kR

    kTe

    kyy

    FT

    t

    t

    T

    t

    t

    (2.23)

    Din ipoteza de normalitate e erorilor i sub ipoteza 0H rezult c *F urmeaz

    o distribuie Fisher (fiind un raport ntre dou variabile 2 ) cu k, respectiv T-k-1

    grade de libertate.)1,(

    *

    kTk

    FisherF (2.24)

    - dac )1,(* > kTkFF respingem ipoteza 0H , modelul este global explicativ ;

    - dac )1,(* kTkFF acceptm ipoteza 0H , modelul nu este global

    explicativ.

    2.7. Variabile indicatoare n modelul liniar multiplu

    n anumite situaii dorim s integrm ntr-un model un factor explicativbinar de tipul un fenomen are loc sau nu sau un factor cu dou valori posibile8

  • 7/29/2019 Cap 3[1]. Modelul Liniar Multiplu

    9/18

    brbat / femeie sau a mai avut / nu a mai avut accident . Pentru a modelaastfel de fenomene apelm la variabile indicatoare, care pot lua doar dou valori: 0sau 1. Modelul de regresie difer dup apariia / neapariia fenomenului doar prinvaloarea unui coeficient, iar ceilali coeficieni rmn identici.

    - n cazul existenei fenomenului:tktkttt xaxaxaay +++++= ...22110 Tt ,...,1= (2.25)

    - n cazul inexistenei fenomenului:

    tktkttt xaxaxaby +++++= ...22110 Tt ,...,1= (2.26)

    Putem scrie aceste dou ecuaii sub forma unei ecuaii unice:

    tktktttt xaxaxaDaby +++++= ...)( 221100 (2.27)

    unde: 1=tD atunci cnd fenomenul exist ;0=tD atunci cnd fenomenul nu exist.

    Se ncorporeaz deci o variabil explicativ suplimentar fa de modelul iniial ise aplic metodele clasice de estimare.

    2.8. Previziunea variabilei endogene prin regresia liniar multipl

    Problema se pune ca i la modelul liniar simplu de a estima valoareavariabilei endogene pentru un ansamblu cunoscut de valori ale variabilelorexplicative. Presupunem modelul estimat sub forma:

    tktkttt exaxaxaay +++++= ... 22110 (2.28)

    Valoarea punctual previzionat pentru observaia 1+t este:112211101

    ... ++++ ++++= ktkttt xaxaxaay (2.29)Eroarea de previziune este:

    111 +++ = ttt yye (2.30)

    Valoarea estimat 1 +ty este nedeplasat dac ipotezele modelului liniar multiplu

    sunt respectate.Previziunea se poate realiza astfel doar dac valorile variabilelor explicative

    sunt cunoscute cu exactitate. n cazul n care acestea sunt probabiliste este necesaro alt abordare. Este cazul seriilor de timp de exemplu pentru care s-a dezvoltat oteorie diferit.

    Variana erorii de previziune este egal cu:

    ])'('1[ 11

    1

    22

    1 +

    ++=+ tte XXXXt (2.31)

    9

  • 7/29/2019 Cap 3[1]. Modelul Liniar Multiplu

    10/18

    unde

    =

    +

    +

    +

    +

    1

    12

    11

    1

    ...

    1

    kt

    t

    t

    t

    x

    x

    x

    X este matricea (vectorul) valorilor variabilelor explicative

    pentru observaia 1+t .Expresia varianei erorii de previziune a fost dat fr demonstraie. Pentru

    detalii privind deducerea ei vezi Dormont (1998).

    Eroarea de previziune este distribuit normal de medie nul i varian2

    1+te :

    ),0( 21 1++ tet Ne

    Dac nlocuim 2

    cu estimatorul su:

    =

    =T

    t

    tekT 1

    22

    1

    1

    atunci:

    )1(

    1

    1

    1

    2

    11

    ])'('1[

    +

    +

    ++ +

    kT

    tt

    tt StudentXXXX

    yy

    (2.32)

    Ca i la modelul liniar simplu, variana erorii de previziune este cu att mai mic cuct variana rezidual este mai mic i valorile variabilelor explicative se apropie

    de mediile lor. Putem construi i un interval de ncredere pentru valoareaprevizionat a variabilei endogene:

    ( =+++ +++

    1Prob11

    2/

    111

    2/

    11 tt ekTttekTttyyty (2.33)

    unde:

    [ ]1111

    2 )'('11

    1

    1 +

    +=

    +

    = + ttT

    t

    te XXXXekTt

    (2.34)

    Exerciiul 2.1Presupunem c o variabil ty este influenat de factorii tx1 , tx2 , tx3 .

    Dispunem de 23 de observaii cu privire la realizrile acestor variabile.

    Tabelul 2.2Nr.crt.

    ty tx1 tx2 tx3 Nr.crt.

    ty tx1 tx2 tx3

    1 163 669 17,4 69 13 295 869 10,3 672 381 872 10,5 75 14 256 824 17,5 883 455 1191 14,3 64 15 309 676 13,0 64

    10

  • 7/29/2019 Cap 3[1]. Modelul Liniar Multiplu

    11/18

    4 451 933 12,5 85 16 286 885 13,2 675 373 668 15,3 90 17 379 1179 11,8 606 321 733 13,8 61 18 425 1161 13,9 867 316 933 15,0 85 19 404 1074 11,5 64

    8 410 1165 10,7 74 20 330 775 16,0 899 348 932 8,2 70 21 354 752 8,9 7610 383 840 8,1 66 22 384 740 15,1 8511 386 901 12,0 87 23 233 590 9,3 6212 163 669 17,4 64

    Se cere:

    1) n ipoteza unei legturi liniare multiple dintre ty i factorii tx1 , tx2 , tx3 s

    se calculeze estimatorii parametrilor.

    2) S se testeze nulitatea fiecrui parametru.3) S se stabileasc intervale de ncredere la un prag de 95% pentru parametriimodelului.4) S se testeze simultan nulitatea tuturor coeficienilor din modelul de regresie.5) S se calculeze 2R i 2R .6) S se construiasc tabloul de analiz a varianei i testul Fisher adecvat.

    7) S se fac o previziune a lui 1+ty , dac 88011 =+tx , 5,1212 =+tx , 7513 =+tx .

    8) S se compare precizia estimrii prin regresia multipl n raport cu regresia

    simpl.

    1) Conform relaiei 2.5 estimatorii parametrilor se obin prin:YXXXa ')'(

    1=

    n cazul aplicaiei noastre avem:

    =

    =

    623,95901

    ............

    755,108721

    694,176691

    1

    ............

    1

    1

    321

    322212

    312111

    TTT xxx

    xxx

    xxx

    X

    =

    =

    233

    ...

    381

    163

    ...

    2

    1

    Ty

    y

    y

    Y

    unde 23=T .YXXXa ')'(

    1=

    11

  • 7/29/2019 Cap 3[1]. Modelul Liniar Multiplu

    12/18

    =

    233

    ...

    381

    163

    62...7569

    3,9...5,104,17

    590...872669

    1...11

    623,95901

    ............

    755,108721

    694,176691

    62...7569

    3,9...5,104,17

    590...872669

    1...11

    1

    a

    =

    3,1281

    11,065-

    0,2643

    20,530

    a

    Estimatorii parametrilor sunt deci:530,200 =a

    2643,01 =a

    065,112 =a1281,33 =a

    2) Pentru testarea ipotezelor de nulitate a parametrilor avem nevoie de varianafiecrui estimator. Acestea se pot deduce din matricea de variane i covariane aparametrilor (vezi relaia 2.13):

    12 )'(

    = XXa

    unde estimatorul varianei variabilei reziduale este dat de:

    1' 2

    =

    kTee

    Tabelul 2.3 : Calculul reziduurilor din estimareNr. crt.

    ty

    t

    tt

    x

    xy

    2

    1

    1281,3065,11

    2643,0530,20

    ++= te

    1 163 220.65 -57.652 381 369.42 11.583 455 377.28 77.72

    4 451 394.7 56.35 373 309.32 63.686 321 252.38 68.627 316 367.04 -51.048 410 441.52 -31.529 348 395.09 -47.0910 383 359.37 23.6311 386 398.03 -12.0312 163 205.01 -42.01

    13 295 345.82 -50.82

    12

  • 7/29/2019 Cap 3[1]. Modelul Liniar Multiplu

    13/18

    14 256 319.95 -63.9515 309 255.55 53.4516 286 317.96 -31.9617 379 389.26 -10.26

    18 425 442.6 -17.619 404 377.34 26.6620 330 326.72 3.2821 354 358.54 -4.5422 384 314.92 69.0823 233 267.5 -34.5

    ==

    =

    =

    =23

    1

    223

    1

    22

    20

    1

    1

    1

    1

    '

    t

    t

    t

    t eekTkT

    ee

    2369,28 2 =1

    12

    623,95901

    ............

    755,108721

    694,176691

    62...7569

    3,9...5,104,17

    590...872669

    1...11

    055,2494)'(

    == XXa

    =

    1,1486581.480421-0,002791-63,33703-

    1,480421-15,912900,049006137,9706-0,002791-0,0490060,00359843,557957-

    63,33703-137,9706-3,557957-9656,855

    a

    Pentru toate testele cu privire la cte un parametru, vom avea :

    093,2025,0232/

    1 == tt kT

    Pentru parametrul 0a :

    093,221,0855,9656

    53,20

    0

    0

  • 7/29/2019 Cap 3[1]. Modelul Liniar Multiplu

    14/18

    093,241,40035984,0

    2643,0

    1

    1 >==a

    a

    Acceptm c 1a este semnificativ diferit de 0.

    Intervalul de ncredere (95%) pentru 1a este :

    95,0)3898,00,1387(Prob 1 = a

    Pentru parametrul 2a :

    093,277,215,9129

    065,11

    2

    2 >==a

    a

    Acceptm c 2a este semnificativ diferit de 0.

    Intervalul de ncredere (95%) pentru 2a este :

    95,0)-2,71519,414-(Prob 2 = a

    Pentru parametrul 3a :

    093,292,21,1486

    1281,3

    3

    3 >==a

    a

    Acceptm c 3a este semnificativ diferit de 0.

    Intervalul de ncredere (95%) pentru 3a este :

    95,0)5,3710,884(Prob 3 = a

    4) La latitudinea cititorului.

    5) Pentru calculul lui 2R folosim formula:

    2

    1

    1

    2

    2

    1

    2

    12

    )(

    1

    )(

    )(

    =

    =

    =

    =

    =

    =T

    t

    t

    T

    t

    t

    T

    t

    t

    T

    t

    t

    yy

    e

    yy

    yy

    R

    0,6623140311,2

    47387,051

    )35,339(

    12

    1

    1

    2

    2 ==

    =

    =

    =T

    t

    t

    T

    t

    t

    y

    e

    R

    Pentru calculul lui 2R corectat, notat cu 2R , folosim:

    )1(1

    11 22 R

    kT

    TR

    =

    6089,0)6623,01(1323

    123

    12

    =

    =R

    14

  • 7/29/2019 Cap 3[1]. Modelul Liniar Multiplu

    15/18

    6) Pentru tabloul de analiz a varianei, calculm:

    92924,15)(23

    1

    2 ===t

    i yySPE

    47387,0523

    1

    2 ===t

    tSPR

    140311,2)(20

    1

    2 ===t

    i yySPT

    Tabelul 2.4 : Analiza varianeiSursa variaiei Suma patratelor Numrul gradelor

    de libertateVariabilele explicative (

    kxxx ,...,, 21 ) 92924,15=SPE 3

    Variabila rezidual 47387,05=SPR 19

    Total 140311,2=SPT 22

    )1/()1(

    /

    )1/(

    /)(*

    2

    2

    1

    2

    1

    2

    =

    =

    =

    =

    kTR

    kR

    kTe

    kyyF

    T

    t

    t

    T

    tt

    4,19419/

    3/* ==

    SPR

    SPEF

    Din tabelele cu distribuia Fisher-Snedecor avem:

    13,305,0 )19;3()1,( == FF kTk

    )1,(* > kTkFF respingem ipoteza 0H , modelul este global explicativ.

    7) Previziunea punctual a lui 1+ty , dac 88011 =+tx , 5,1212 =+tx , 7513 =+tx

    este:

    13312211101 ++++ +++= tttt xaxaxaay

    751281,35,12065,118802643,0530,20 1 ++=+ty

    4,349 1 =+ty

    Sub form general, intervalul de ncredere se scrie:

    15

  • 7/29/2019 Cap 3[1]. Modelul Liniar Multiplu

    16/18

    ( =+++ +++

    1Prob11

    2/

    111

    2/

    11 tt ekTttekTttyyty

    unde: [ ]1111

    2 )'('11

    1

    1 +

    +=

    +

    = + ttT

    t

    te XXXXekTt

    ( )

    0,0453887

    75

    5,12

    880

    1

    623,95901

    ............

    755,108721

    694,176691

    62...7569

    3,9...5,104,17

    590...872669

    1...11

    755,128801

    )'('

    1

    1

    1

    1

    =

    =

    =

    =

    +

    + tt XXXX

    061,510453887,147387,0519

    1

    )0453887,01(19

    1

    1

    2

    1 ==+= =+T

    t

    te et

    Din valorile tabelate ale distribuiei Student, deducem:

    09,2025,0192/

    1 == tt kT

    Intervalul de ncredere va fi deci:( ) %95061,5109,24,349061,5109,24,349Prob 1 =+ +ty

    ( ) %95456,1242,7Prob 1 = +ty

    Constatm o abatere de 8,106 (sau %6,30 ) fa de limitele intervalului de

    ncredere.

    Aceleai rezultate cu privire la model, obinute prin software-ul STATA sunturmtoarele:

    . regress Y X1 X2 X3

    Source | SS df MS Number of obs = 23

    ---------+----------------------- F( 3, 19) = 12.42

    Model | 92924.1 3 30974.7 Prob > F = 0.0001

    Residual | 47387.0 19 2494.05 R-squared = 0.6623

    -------------+------------------- Adj R-squared = 0.6089

    Total | 140311.1 22 6377.78 Root MSE = 49.941

    ----------------------------------------------------------------

    Y | Coef. Std.Er. t P>|t| [95% Conf.Interv]

    ---------+------------------------------------------------------

    X1 | .264256 .059987 4.41 0.000 .13870 .38981

    X2 | -11.0651 3.98909 -2.77 0.012 -19.414 -2.715

    X3 | 3.12806 1.07175 2.92 0.009 .88485 5.3712

    16

  • 7/29/2019 Cap 3[1]. Modelul Liniar Multiplu

    17/18

    _cons | 20.5296 98.2693 0.21 0.837 -185.15 226.20

    ----------------------------------------------------------------

    Pentru a compara intervalul de ncredere obinut pentru regresia multipl cuintervalele de ncredere obinute prin regresiile simple, estimm parametrii celortrei modele simple tot cu STATA:

    . regress Y X1

    Source | SS df MS Number of obs = 23

    ---------+------------------------ F( 1, 21) = 17.05

    Model | 62868.5 1 62868.5 Prob > F = 0.0005

    Residual | 77442.6 21 3687.74 R-squared = 0.4481

    ---------+------------------------ Adj R-squared = 0.4218

    Total | 140311.2 22 6377.78 Root MSE = 60.727

    ----------------------------------------------------------------

    Y | Coef. Std.Er. t P>|t| [95% Conf.Interv]

    ---------+------------------------------------------------------

    X1 | .294662 .071365 4.13 0.000 -49.187 .44307

    _cons | 82.7220 63.4299 1.30 0.206 -185.15 214.63

    ----------------------------------------------------------------

    . regress Y X2

    Source | SS df MS Number of obs = 23

    ---------+------------------------ F( 1, 21) = 3.56

    Model | 20358.5 1 20358.5 Prob > F = 0.0729

    Residual | 119952.7 21 5712.03 R-squared = 0.1451

    ---------+------------------------ Adj R-squared = 0.1044

    Total | 140311.2 22 6377.78 Root MSE = 75.578

    ----------------------------------------------------------------

    Y | Coef. Std.Er. t P>|t| [95% Conf.Interv]

    ---------+------------------------------------------------------

    X2 | -10.470 5.54617 -1.89 0.073 -22.004 1.0633

    _cons | 473.963 73.0252 6.49 0.000 322.098 625.82

    ----------------------------------------------------------------

    . regress Y X3

    Source | SS df MS Number of obs = 23

    ---------+------------------------ F( 1, 21) = 1.50

    17

  • 7/29/2019 Cap 3[1]. Modelul Liniar Multiplu

    18/18

    Model | 9347.64 1 9347.64 Prob > F = 0.2344

    Residual | 130963.5 21 6236.36 R-squared = 0.0666

    ---------+------------------------ Adj R-squared = 0.0222

    Total | 140311.2 22 6377.78 Root MSE = 78.971

    ----------------------------------------------------------------Y | Coef. Std.Er. t P>|t| [95% Conf.Interv]

    ---------+------------------------------------------------------

    X3 | 1.94564 1.58919 1.22 0.234 -1.3592 5.2505

    _cons | 195.708 118.474 1.65 0.113 -50.672 442.08

    ----------------------------------------------------------------

    Fr a detalia calculele, prezentm comparativ pentru cele trei modele simple ipentru modelul multiplu intervalele de ncredere (95%) pentru estimarea variabilei

    endogene.

    Variabilaendogen

    Variabileexogene

    2R Interval dencredere

    Eroare limitabsolut

    Eroare limitrelativ (%)

    Y1

    X 0,4481

    (212,4 ; 471,7) 129,7 37,9

    Y 2X 0,1451

    (181,7 ; 504,5) 161,4 47,0

    Y 3X 0,0666

    (173,0 ; 510,3) 168,6 49,4

    Y 1X , 2X ,

    3X

    0,6623

    (242,7 ; 456,1) 106,8 30,6

    Se observ o eroare limit mai mic la modelul multiplu i deci o estimare maiprecis a variabilei endogene. La modelele simple se observ o precizie cu att mai

    bun cu ct 2R este mai mare. Acest fapt este perfect coerent, deoarece att 2R

    ct i eroare de estimare depind n bun msur de variana rezidual.

    18