teme econometrie pirvu cristian 958.docx
TRANSCRIPT
TEME DE CONTROL- 16H
TC1: Se consideră modelul:
yt = a + bxt + ut
În urma prelucrării electronice a calculelor econometrice privind modelul de mai sus s-au
obţinut următoarele rezultate:
SUMMARY OUTPUTRegression Statistics
Multiple R 0,6809R Square 0.46362Adjusted R Square 0,4223Standard Error 7,5104Observations 15
R Square = R2=0.68092=0.46362
ANOVA
df SS MS FSignificanc
e F
Regression 1 633,6594633.659
4 11.23396 0,0052Residual 13 733.10519 56,4057Total 14 1366.76459
R2=SSR/SST => SST=1366.76459MSR=SSR / dfSy/x
2 = MSRMSR/MSE=11.23396
Coefficients
Standard Error t Stat P-value Lower 95%
Upper 95%
Intercept -8,5185 13.4044 -0,6355 0,5361 -37,4749 20.4376X Variable 1 0,1812 0,0541 3.3493 0,0052 0.0646 0,2981
Durbin – Watson Statistics = 1,54 ( d1 = 1,08; d2 = 1,36)
F (White Heteroskedasticity Test) =2,03 (Critical F (White Heteroskedasticity Test) = 3,88)
â= -8.5185 ; b = 0.1812
Sb=0.0541
t1calc= â/Sa => -0.6355=-8.5185/Sa => Sa=13.4044
t2calc= b /Sb => t2
calc = 0.1812/0.0541 => t2calc = 3.3493
lower 95%
â - tα/2,n-2*Sa = -37.4749 => tα/2,n-2= 2.1602
b - tα/2,n-2*Sb= 0.1812 – 2.1602 * 0.0541 = 0.0646
Upper 95%
â + tα/2,n-2*Sa = 20.4376
b + tα/2,n-2*Sb = 0.2981
Se cere:
1) Sa se scrie ecuatia de regresie si sa se interpreteze economic valorile coeficientilor
Y=20.4376+0.2981*X
o â este estimatorul punctului de intercepţie (a) obţinut pe baza datelor din
eşantion;
o este estimatorul pantei liniei drepte (b) obţinut pe baza datelor din
eşantion ; arata ca media este in crestere cu 0.1812
o Fsignificance =0.0052 < 0.05 => modelul este valid
o Coeficientul de determinatie : 46.362%
2) Să se verifice semnificaţia parametrilor modelului, să se determine intervalele de
încredere corespunzătoare acestora (Critical t = 2,16);
â= -8.5185 = punctul in care variabilele explicative sunt 0.
tâ=| - 0.6355| < critical t=2.16 => â nu este semnificativ diferit de 0, deci nu este
semnificativ statistic.
b
Intervalul de incredere pt â:
â - tα/2,n-2*Sa <= α <= â + tα/2,n-2*Sa
-8.5185 – 2.1602 * 13.4044 <= α <= -8.5185 + 2.1602*13.4044
-37.4746 <= α <= 20.4376
= 0.1812 ceea ce însemnă că, la creşterea cu o unitate de măsură a variabilei x1,
variabila endogenă y va creşte cu 0,1812 unităţi de măsură.
tb=|3.3493| > critical t=2.16 => este semnificativ diferit de 0, deci este semnificativ
statistic.
Intervalul de incredere pt :
- tα/2,n-2*Sb <= α <= + tα/2,n-2*Sb
0.1812 – 2.1602 *0.0541 <= β <= 0.1812+2.1602*0.0541
0.0644 <= β <= 0.2981
3) Să se completeze tabelul ANOVA şi să se verifice validitatea modelului de
regresie pentru un prag de semnificaţie de 5% (Critical F = 4,67);
F=11.23396 > critical F=4.67, iar significance F =0.0052 (valoare mai mica decat 0.05),
deci modelul de regresie construit este semnificativ statistic (valid) si poate si utilizat
pentru analiza dependentei dintre variabilele incluse in model pentru o probabilitatea
de cel mult 100 – 0.0052 = 99.9948 > 95%
4) Sa se analizeze bonitatea modelului de regresie.
Acesti indicatori sunt:raportul de corelatie(Multiple R), coeficientul de corelatie dintre
valorile observate si valorile ajustate prin ecuatia de regresie (R Square), si
coeficientul de determinatie ajustat (Adjusted R Square). Cu cat si au valori
mai apropiate de 1 cu atat regresia este mai buna.
R square=0.46362
Adjusted R square = 0,4223
Standard error = 7,5104
b
b
bb
5) Să se verifice ipotezele de independenţă a erorilor şi de homoscedasticitate a
erorilor.
Varianta variabilei reziduale, σε2 este constantă şi independentă de variabila exogenă X -
ipoteza de homoscedasticitate a erorilor.
σε2 = MSE = 56,4057
Pt ipotezele de independenta a erorilor:
H0: X1=X 2=. .. . ..=X j=. . .. .. .. .= Xk , pentru i=1,…,k
H1: există i≠ j astfel încât X i≠X j .
6) Ştiind că în perioada imediat următoare xt+1 = 20 să se estimeze yt+1 pe baza unui
interval de încredere.
yt+1 = -8.5185 + 0.1812 * xt+1
yt+1 = -8.5185 + 0.1812 * 20
yt+1 = -4.8945
TC2:Se cunosc următoarele date referitoare la numărul de turişti sosiţi într-o staţiune montană în
perioada 2006-2008:
AnulNumărul de turişti
Trim. I Trim. II Trim. III Trim. IV
2006 400 320 380 450
2007 420 360 400 450
2008 440 400 420 500
Se cere:
1) Să se reprezinte grafic datele, să se determine componenta sezonieră prin
ambele modele(aditiv si multiplicativ) şi să se interpreteze valorile obţinute;
2) Să se determine seria desezonalizată;
3) Să se previzioneze vânzările trimestriale pentru anul 2007.
I II III IV I II III IV I II III IV2006 2007 2008
400
320380
450420
360400
450 440400 420
500
Yt
Yt
Metoda multiplicativa
Perioada yt ytMMM yt/ytMMM ysk* yts Yt/yts (seria corectata)
Comp. Aleat.
Tr 1 2006
400 - - 0,974984365
1,104959892
1,036165577
0,902812892
0,970393741 412,2038127 -Tr 2 2006
320 - -1,09975729 290,9732929 -
Tr 3 2006
380390 0,974358974 1,031286887 368,4716684 0,94
Tr 4 2006
450397,5 1,132075472 0,898562081 500,8001221 1,26
Tr 1 2007
420405 1,037037037 0,970393741 432,8140033 1,07
Tr 2 2007
360407,5 0,883435583 1,09975729 327,3449545 0,80
Tr 3 2007
400410 0,975609756 1,031286887 387,8649141 0,95
Tr 4 2007
450417,5 1,077844311 0,898562081 500,8001221 1,20
Tr 1 2008
440425 1,035294118 0,970393741 453,4241939 1,07
Tr 2 2008
400433,75 0,922190202 1,09975729 363,7166161 0,84
Tr 3 2008
420 - -1,031286887 407,2581598 -
Tr 4 2008
500 - -0,898562081 556,4445802 -
total Media = 1.0047
M. Aditiva
Media DSB=1,71875
ytMMM1 = 400
2+320+380+450+ 420
24
=390
A T Y Y DSB (deviatii sezoniere brute)
YtS
(componenta sezoniera)
Yt-YtS
(seria desezonalizata)
Valorile trendului pt. seria corectata
2 I 4 15
13,28125
386,71875
386,71875
I 3 -40,625
-42,34375
362,34375
393,3096591
I 3 - -10
-11,71875
391,71875
399,900568
ytMMM2 = 320
2+380+450+420+ 360
24
=397.5
ytMMM3 = 380
2+450+420+360+ 400
24
=405
ytMMM4 = 450
2+420+360+400+ 450
24
=407.5
ytMMM5 = 420
2+360+400+450+ 440
24
=410
ytMMM6 = 360
2+400+450+440+ 400
24
=417.5
ytMMM7 = 400
2+450+440+400+ 420
24
=425
ytMMM8 = 450
2+440+400+420+ 500
24
=433.75
Rezulta:
In trimestrul 1, factorul sezonier a determinat o crestere medie a numarului de
turisti cu 10 fata de trend.
In trimestrul 2, factorul sezonier a determinat o scadere medie a numarului de
turisti cu 30 fata de trend.
In trimestrul 3, factorul sezonier a determinat o scadere medie a numarului de
turisti cu 15 fata de trend.
In trimestrul 4, factorul sezonier a determinat o crestere medie a numarului de
turisti cu 37 fata de trend.
Δ=463−39011
=6 . 636
y tT (Δ )= y1+Δ⋅(t−1 ), t=1 , n
y tT (Δ )=390+6 .636⋅(1−1 ) = 390
y tT (Δ )=390+6 .636⋅(2−1 ) = 396.636
y tT (Δ )=390+6 .636⋅(3−1 ) = 403.272
y tT (Δ )=390+6 .636⋅(4−1 )= 409.908
y tT (Δ )=390+6 .636⋅(5−1 ) = 416.544
y tT (Δ )=390+6 .636⋅(6−1 ) = 423.18
y tT (Δ )=390+6 .636⋅(7−1 ) = 429.816
y tT (Δ )=390+6 .636⋅(8−1 ) = 436.452
y tT (Δ )=390+6 .636⋅(9−1 ) = 443.088
y tT (Δ )=390+6 .636⋅(10−1 ) = 449.724
y tT (Δ )=390+6 .636⋅(11−1 ) = 456.36
y tT (Δ )=390+6 .636⋅(12−1 ) = 462.996
Valorile previzionate ale trendului pt trimestrele 1,2,3,4 ale anului 2009 sunt:
y I ' 07 (Δ )=463+6 . 636=469 . 636
y II ' 07 (Δ)=469 .636+6 . 636=476 . 272
y III ' 07( Δ)=476 .272+6 .636=482.908
y IV ' 07( Δ)=482 .908+6 .636=489.544
Valorile previzionate ale vanzarilor in anul 2009 se obtin insumand valorile estimate ale
trendului cu deviatiile sezoniere corectate:
y I ' 07prev =496 .636+10=506 .636
y II ' 07prev =476 .272−30=446 .272
y III ' 07prev =482 . 908−15=467 . 908
y IV ' 07prev =489 . 544+37=526 .544
Anul Trimestrul p ytS previziune
1 1 469.636 10 506.636
2 2 476.272 -30 446.272
y(n+ p )T Δ y(n+ p )= y(n+ p )T Δ+ ytS
2009 3 3 482.908 -15 467.908
4 4 489.544 37 526.544
TC3:1. Pentru un mare magazin alimentar s-au cules date privind vânzările (zeci mil RON) şi profitul (mil
RON), realizate în primele 10 luni ale anului 2009:
Vânzări (zeci mil. RON) 7 6 6 8 14 5 15 8 16 10Profitul (mil. RON) 7 6 7 5 7 4 10 7 10 8Timpul(luni) 1 2 3 4 5 6 7 8 9 10
Se cere:1. Sa se estimeze parametrii modelului de regresie, sa se scrie ecuatia de regresie, sa se
interpreteze valorile coeficientilor de regresie
a= -2.69301
b= 1.71733
Functia de regresie : Yx = -2.69301 + 1.71733 X
Panta nu este 0 ; profitul (Y) creste pe masura ce vanzarile (X) cresc.
Modelul se scrie:
VANZARI= -2.69301 + 1,7133 * PROFIT
Interpretare : creşterea profitului cu un mil RON reduce vanzarile cu 1.7133 zeci mil RON.
Modelul este valid din punct de vedere statistic, Significance F= 0,004652294 < 0,05, cu un
coeficient de determinaţie R2= 65.33%, ceea ce înseamnă că vanzarile explică într-o proporţie
de aproximativ 65% profitul, restul fiind determinat de alţi factori.
2. Sa se testeze validitatea modelului de regresie pentru un nivel de semnificatie de 5%
(Fcrit=5.317)
ANOVA
df SS MS F Significance F
regression 1 97.02887 97.02887 15.0809 0.00465
Residual 8 51.47112 6.43389
total 9 148.5
s y /x2 =
V x2
k=97 .02887
2=48.5144
su2=
V u2
n−k−1⇒V u
2=su2⋅(n−k−1 )=51 . 47112⋅8=411.7689
sau
V 02=V x
2+V u2⇒V u
2=V 02−V x
2⇒V u2=148 .5−97 . 02887=51. 47113
Fc=s y /x
2
su2
=97. 028876 . 43389
=15 . 0809>F critic=5 . 317
, rezultă că modelul este valid statistic sau este semnificativ diferit de zero, pentru un
prag de semnificaţie de 0,05.
O altă variantă de verificare a semnificaţiei modelului se poate realiza prin verificarea
semnificaţiei raportului de corelaţie:
Fc=n−k−1
k⋅ R2
1−R2=10−1−1
1⋅ 0 , 6533
1−0 , 6533=15 . 0747>F critic=5 . 317
rezultă că
raportul de corelaţie este semnificativ diferit de zero pentru un prag de semnificaţie de 5%,
deci şi modelul este valid statistic pentru un prag de semnificaţie de 5%.
3. Sa se testeze semnificatia parametrilor modelului de regresie(tcrit=2.3), sa se determine si sa
se interpreteze intervalele de incredere pentru acestia
Coeficientul â= -2.693 este punctul in care variabilele explicative sunt egale cu 0. Deoarece
tâ=| - 0.831| < critical t=2.16 => â nu este semnificativ diferit de 0, deci nu este semnificativ
statistic.
â= -2.693 ; b = 1.7173
Sb=0.4422
t1calc= â/Sa => -0.8310 = -2.6930 / Sa => Sa= 3.2406
t2calc= b /Sb => t2
calc = 0.7173 / 0.4422 => t2calc = 1.6221
Lower 95%
â - tα/2,n-2*Sa = - 10.1658 => tα/2,n-2= 7.4728
b - tα/2,n-2*Sb= 0.7173 – 7.4728 * 0.4422 = -2.5871
Upper 95%
â + tα/2,n-2*Sa = 21.5233
b + tα/2,n-2*Sb = 0.6114
INTERVALE DE INCREDERE PT PARAMETRULUI αH0: α nu este semnificativ statistic
H1: α este semnificativ statistic
t=a/sa=-0.83102 > -tcrit, rezulta acceptam H0, deci α nu e semnificativ statistic
Intervalul de incredere pentru α este: a-tcrit*sa≤α≤a+tcrit*sa, rezulta -10.1659≤α≤4.779838
INTERVALE DE INCREDERE PT PARAMETRULUI β
H0: β nu este semnificativ statistic
H1: β este semnificativ statistic
t=b/sb=3.883414 > tcrit, rezulta respingem H0, deci β e semnificativ statistic
Intervalul de incredere pentru β este: b-tcrit*sb≤α≤b+tcrit*sb, rezulta 0.697563≤β≤2.737088
4. Analizati sensul si intensitatea legaturii dintre cele doua variabile si testati semnificatia
indicatorului utilizat.
b=1.7173 > 0, rezulta ca legatura dintre cele doua variabile este directa
intensitatea legaturii dintre cele doua variabile rezulta din calculul raportului de corelatie
R=√(SSR/SST)=0.808327, deci legatura este destul de puternica
H0: R nu este semnificativ statistic
H1: R este semnificativ statistic
F=R2/(1-R2)*8=0.653393/(1-0.653393)*8=15.0809>Fcrit, rezulta ca respingem ipoteza nula,
deci R este semnificativ statistic
5. Sa se calculce valorile estimate de model si erorile.
a b Vanzari (Yi)Profit (Xi)
Valorile estimate de model: ŷi=-a+bxi Erorile: yi-ŷi
-2,693011,71732
5 7 7 9,328267477 -2,328267477
-2,693011,71732
5 6 6 7,610942249 -1,610942249
-2,693011,71732
5 6 7 9,328267477 -3,328267477
-2,693011,71732
5 8 5 5,893617021 2,106382979
-2,693011,71732
5 14 7 9,328267477 4,671732523
-2,693011,71732
5 5 4 4,176291793 0,823708207
-2,693011,71732
5 15 10 14,48024316 0,519756839
-2,693011,71732
5 8 7 9,328267477 -1,328267477
-2,693011,71732
5 16 10 14,48024316 1,519756839
-2,693011,71732
5 10 8 11,04559271 -1,045592705
6. Pe baza seriei erorilor sa se verifice ipoteza de non-autocorelare a erorilor utilizand
testul Durbin-Watson pentru un nivel de semnificatie de 5%(d1=1,08 şi d2=1,36)
Erori ei ei-ei-1 Σ(ei-ei-1)2 Σei2 d
-2,328267477 0,717325228
72,58734
51,47112
1,410254
-1,610942249 -1,717325228
-3,328267477 5,4346504562,106382979 2,5653495444,671732523 -3,8480243160,823708207 -0,3039513680,519756839 -1,848024316
- 2,848024316
1,3282674771,519756839 -2,565349544
-1,045592705
TESTUL DURBIN-WATSON
H0: erorile nu sunt sunt autocorelate (ρ=0)
H1: erorile sunt autocorelate (ρ≠0)
d=(Σ(ei-ei-1)2)/(Σei2)=1.410254 care se gaseste in intervalul (d2, 4-d2), deci acceptam H0 ,
adica erorile nu sunt autocorelate
7. Sa se verifice ipoteza de normalitate a distributiei erorilor(S= -0.841, K= -1.137) pentru
un nivel de semnificatie de 5%( χ α ,22 =5. 99 ).
TESTUL JARQUE-BERA
H0: erorile sunt normal distribuite
H1: erorile nu urmeaza o distributie normala
JB = 10/6 * (S2+(K-3)2/4)= 8.31 > χ2α,2 , deci respingem ipoteza nula, adica erorile nu sunt normal
distribuite.
8. Sa se verifice ipoteza de homoschedasticitate a erorilor daca F (White
Heteroskedasticity Test) =2,84 (Critical F (White Heteroskedasticity Test) =
3,88).
H0: erorile prezinta homoscedasticitate
H1: erorile prezinta heteroscedasticitate
F = 2.84 < Critical F = 3.88 , rezulta ca acceptam ipoteza nula, deci erorile sunt homoscedastice.
9. Ştiind că în perioada imediat următoare xt+1 = 20 să se estimeze yt+1 pe baza unui
interval de încredere.
În acest caz, dacă x0=1 , x1=20 :
Y n+v¿ =b0 xn+v , 0+b1 xn+v , 1+b2 xn+ v , 2
unde:
Y n+v¿ = estimaţia punctuală a valorii de prognoză pentru variabila y;
yn+v= valoarea reală a variabilei y în momentul de prognoză (n+v ).
Sub formă matriceală, relaţia anterioară devine:
Y n+v¿ =X v
' B=X v' ( X ' X )−1
X ' Y
unde:
X v=¿¿=- reprezintă matricea coloană a valorilor de prognoză ale
variabilelor x j ( j=0,1 ) pentru momentul (n+v ).
Y n+v¿ =−2 . 693∗1+1 , 7173∗20=31 .653≈32 mil. RON.
În vederea estimării intervalului de încredere pentru această valoare probabilă este
necesară calcularea dispersiei de prognoză acestei valori cu ajutorul relaţiei:
sY n+ v¿
2 =su2 [1+ Xv
' ( X ' X )−1X v ]
x1tx2t y t x1t y t x2t y t x1t x2 t x1t
2 x2t2 y t=207 . 03
+63 . 88 x1 t
−118. 52 x2 t
ut= y t− y t
7 7 1 7 7 49 49 49
6 6 2 12 16 36 36 36
6 7 3 18 21 42 36 49
8 5 4 32 20 40 64 25
14 7 5 70 35 98 196 49
5 4 6 30 24 20 25 16
15 10 7 105 70 150 225 100
8 7 8 64 56 56 65 49
16 10 9 144 90 160 256 100
10 8 10 100 80 80 100 64
95 71 172 582 419 731 1052 537
{n b0+ b1∑ x1t+b2∑ x2t=∑ y t ¿ {b0∑ x1t+b1∑ x1 t2 + b2∑ x1t x2t=∑ x1t y t ¿ ¿¿¿
12 b0 + b1 * 95+ b2*71=172
95*b0 + b1 * 1052 + b2 * 731=582
71*b0 + b1 * 731 + b2 * 537 = 419
B0=207.03
B1=63.88
B2=-118.52
Intervalul de încredere a prognozei profitului, estimat cu un prag de semnificaţie
α=0 , 05 , pentru care valoarea lui tα , preluată din tabela distribuţiei Student, este
t0 ,05 ; 10=2 ,228 se va calcula cu ajutorul relaţiei:
P [Y n+ v¿ −tα s
Y n+ v¿ ≤ yn+ v¿Y n+v
¿ + tα sY n+v¿ ]=1−α
P [231−2 ,228∗31,65≤ yn+v≤231+2 ,228∗31 ,65 ]=1−0 ,05=0 ,95
P [160≤ y n+v≤301 ]=0 ,95
În concluzie, pentru un prag de semnificaţie de 5%, profitul va fi cuprins între 160 şi
301 milioane lei.
10. Daca se include in cadrul modelului o a doua variabila exogena timpul sa se estimeze
parametrii modelului de regresie bifactoriala de forma: y i=b0+b1∗x1 i+b2∗x2i+εi si sa
se interpreteze economic si econometric rezultatele obtinute(rezolvarea se va face
in excel).
SUMMARY OUTPUT
Regression StatisticsMultiple R 0,827778R Square 0,685216Adjusted R Square 0,595277Standard Error 2,584168Observations 10
ANOVA
df SS MS FSignificance
FRegression 2 101,7545 50,87727 7,618727 0,0175Residual 7 46,74546 6,677923Total 9 148,5
CoefficientsStandard
Error t Stat P-value Lower 95%Upper 95%
Lower 95.0%
Upper 95.0%
Intercept -2,75071 3,302202 -0,83299 0,432348 -10,5592 5,057757 -10,5592 5,057757X Variable 1 1,515374 0,510499 2,968415 0,020855 0,308235 2,722513 0,308235 2,722513X Variable 2 0,271192 0,322379 0,841222 0,428022 -0,49111 1,033496 -0,49111 1,033496
RESIDUAL OUTPUT
Observation Predicted Y Residuals1 8,128098 -1,12812 6,883917 -0,883923 8,670482 -2,670484 5,910927 2,0890735 9,212867 4,7871336 4,937938 0,0620627 14,30137 0,6986288 10,02644 -2,026449 14,84376 1,156244
10 12,0842 -2,0842
Vanzari (Yi)
Profit (X1i) Timpul (X2i)
7 7 16 6 26 7 38 5 4
14 7 55 4 6
15 10 78 7 8
16 10 910 8 10
Ecuatia modelului de regresie bifactoriala: ŷi = -2.75 + 1.51*x1i + 0.27*x2i
Interpretare parametrii:Daca profitul creste cu 1 mil. RON, iar timpul ramane constant, atunci vanzarile cresc cu 1.51 zeci mil. RON.Daca timpul creste cu 1 luna, iar profitul ramane constant, atunci vanzarile cresc cu 0.27 zeci mil. RON.
Se observa ca b1 si b2 sunt pozitivi, deci legatura dintre variabile este directa.F = 7.618 > F critic =5.317, deci respingem ipoteza nula si acceptam ipoteza alternativa, adica modelul este valid.
Se observa ca doar parametrul β1 este semnificativ statistic (t = 1.96 > t critic), pe cand parametrii α si β2 nu sunt semnificativi statistic ( t< t critic sau capetele intervalelor de incredere au semne diferite sau P-value > 0.05)
Coeficientul de determinatie R2 = 0.68 ne arata ca 68% din variatia vanzarilor este explicata de variatia profitului si a perioadei de timp.