tema 1 - econometrie
DESCRIPTION
econometrie - temaTRANSCRIPT
-
Econometrie financiara
Tema 1
1. Setul de date si descriptive statistics
Setul de date ales pentru aceasta tema este reprezentat de patru variabile
macroeconomice ce tin de economia SUA. Datele au fost obtinute de pe site-ul Federal
Reserve Bank, de la adresa web: http://www.stlouisfed.org/.
Cele patru serii de date, ce vor fi descrise pe scurt in cele ce urmeaza, sunt prelevate cu
o frecventa trimestriala, incapand cu data de 01.01.1947 si incheindu-se la data de 01.04.2014.
Datele sunt aceleasi pentru toate seriile de date, iar unitatile de masura sunt reprezentate de
miliarde de dolari (rate anuale, ajustate sezonier). Atat pentru analiza statistica a celor patru
serii de date luate individual, cat si pentru regresiile simple si multiple realizate in partea a
doua, datele au fost logaritmate in prima diferenta.
Cele patru serii de date sunt: GDP (gross domestic product va fi considerat variabila
dependenta in partea a doua a temei), GPDI (gross private domestic investment una dintre
variabilele independente in cazul regresiei), GPSAVE (gross private saving variabila
independenta) si FedGovTax (federal government tax receipts variabila independenta).
Dupa cum am mentionat, toate patru seriile de date au aceleasi unitati de masura si sunt
prelevate la aceleasi momente de timp.
In continuare, urmeaza o scurta descriere a celor patru variabile in ceea ce priveste
legaturile economice stabilite intre ele. GDP reprezinta produsul intern brut al SUA si
reprezinta valoarea monetara a tuturor bunurilor si serviciilor produse in interiorul granitelor
unei tari intr-o perioada determinata de timp (de regula, un an). Exista doua moduri de a
exprima GDP ca suma de componente, dupa cum urmeaza:
1. GDP = C + G + I + NX, unde C reprezinta consumul privat, G reprezinta
valoarea cheltuielilor guvernamentale, I reprezinta suma tuturor investitiilor
private in capital, iar NX sunt exporturile nete, calculate ca exporturi totale
importuri totale.
2. GDP = C + S + T, unde C reprezinta o suma a consumului, S reprezinta
economiile, iar T reprezinta taxarea.
-
Din definitiile anterioare se poate deduce existenta unei relatii intre produsul intern brut
al unei tari si componentele sale, exprimate in acest caz prin cele trei variabile independente.
In cele ce urmeaza, va fi prezentata o analiza statistica realizata independent, in Excel,
pentru cele patru variabile. Rezultatele obtinute pentru fiecare din cele patru serii de date sunt
prezentate in tabelul urmator (ce include medii, deviatii standard, skewness si kurtosis):
Date statistice GDP GPDI GPSAVE FedGovTax
Mean 0.0159 0.0163 0.0173 0.0149
Standard
deviation 0.0111 0.0511 0.0437 0.0445
Skewness 0.1949 -0.2093 1.2888 -0.5954
Kurtosis 2.1052 2.8696 7.5280 6.9835
Tabel 1: calcule proprii bazate pe date obtinute de la http://www.stlouisfed.org/
Skewness reprezinta o masura a non-simetriei. Daca datele sunt distribuite simetric,
valoarea acestui parametru este apropiata de zero. In cazul GDP si GPSAVE, valorile pozitive
pentru skewness semnifica o orientare catre dreapta, in timp ce pentru GPDI si FedGovTax
valorile negative reprezinta o orientare catre stanga.
Kurtosis reprezinta o masura ce indica gradul de aplatizare sau de ascutire a unei
distributii. In cazul GDP si GPDI, valoarea kurtosis semnifica o distributie platikurtica (mai
plata decat o distributie normala, avand valori dispersate pe un interval mai mare in jurul
mediei; probabilitatea pentru valori extreme este mai redusa). In cazul GPSAVE si
FedGovTax, valorile pentru kurtosis indica o distributie leptokurtica (mai ascutita decat o
distributie normala, cu mai multe valori concentrate in jurul mediei si cozi mai groase).
In continuare sunt prezentate cele patru histograme realizate pentru fiecare serie de date:
0102030405060
Fre
qu
en
cy
Bin Range
Histogram GDP
Frequency
-
Figuri 1-4: calcule proprii bazate pe date obtinute de la http://www.stlouisfed.org/
0102030405060
Fre
qu
en
cy
Bin Range
Histogram GPDI
Frequency
0
20
40
60
80
100
Fre
qu
en
cy
Bin Range
Histogram GPSAVE
Frequency
020406080
100
Fre
qu
en
cy
Bin Range
Histogram FedGovTax
Frequency
-
2. Analiza a regresiilor simple si multiple realizate in Excel, Eviews si Matlab
2.1 Sinteza datelor obtinute in urma regresiilor in Excel:
Tabel : date regresie obtinute prin calcule proprii de la http://www.stlouisfed.org/
Toate cele cinci regresii au ca variabila dependenta GDP, ceilalti termeni(GPDI,
FedGovTax, GPSAVE) fiind pe rand variabile independente.
De asemenea ultimele doua regresii sunt regresii multiple , avand ca variabile
independente doi termeni( GPDI si GPSAVE), respectiv trei termeni
(GPDI,GPSAVE,FedGovTax); desigur variabila dependenta a ramas GDP.
2.2 Rezultate regresii in Eviews
Urmatorul program in care am realizat regresiile a fost Eviews. In prima faza am ales ca
variabila dependenta GDP si celelalte fiind ca variabile independente(FGT, GDPI, GPS). In
faza a doua a creat seriile si am scris ecuatiile pentru fiecare variabila :
series gdp
series gpdi
series gps
series fgt
series gdpret
series gpdiret
series gpsret
Regression
statistics
Regresie
GDP-
GPDI
Regresie
GDP-
FedGovTax
Regresie
GDP-
GPSAVE
Regresie GDP-
GPDI-GPSAVE
Regresie GDP-
GPDI-GPSAVE-
FedGovTax
Multiple R 0,7408 0,5083 0,187635127 0,744061736 0,798224361
R Square 0,5488 0,2584 0,035206941 0,553627866 0,592626575
Adjusted R
Square 0,5471 0,2556 0,031593484 0,550271685 0,5880148
Standard
Error 0,0075 0,0096 0,010947182 0,007460168 0,007140264
Observations 269 269 269 269 269
Intercept 0,0132 0,0140 0,01503294 0,01348031 0,012497885
Log Returns
GPDI 0,1611 0,1271 0,047806928 0,166651262 0,132280888
Log Returns
GPSAVE -0,018928974 0,014390378
Log Returns
FedGovTax 0,064711285
-
series fgtret
gdpret=d(log(gdp))
gpdiret=d(log(gpdi))
gpsret=d(log(gps))
fgtret=d(log(fgt))
Dupa ce am realizat cele mentionate mai sus, am creat urmatoarele regresii (Quick>>
Estimate equation) :
1. Regresie GDP GPSave
Dependent Variable: GDPRET
Method: Least Squares
Date: 11/12/14 Time: 17:33
Sample (adjusted): 3 271
Included observations: 269 after adjustments
Variable Coefficient Std. Error t-Statistic Prob.
C 0.015033 0.000718 20.92992 0.0000
GPSRET 0.047807 0.015316 3.121423 0.0020
R-squared 0.035207 Mean dependent var 0.015861
Adjusted R-squared 0.031593 S.D. dependent var 0.011124
S.E. of regression 0.010947 Akaike info criterion -6.184062
Sum squared resid 0.031997 Schwarz criterion -6.157336
Log likelihood 833.7564 Hannan-Quinn criter. -6.173329
F-statistic 9.743279 Durbin-Watson stat 1.088901
Prob(F-statistic) 0.001997
Din aceasta regresie rezulta ca : GDP= 0.015033+0.047807*GPS
R-squared indica faptul ca 3.5 % din variatia GDP-ului este explicata de variatia GPS.
2. Regresie GDP GPDI
Dependent Variable: GDPRET
Method: Least Squares
Date: 11/12/14 Time: 17:49
Sample (adjusted): 3 271
Included observations: 269 after adjustments
Variable Coefficient Std. Error t-Statistic Prob.
C 0.013242 0.000479 27.64257 0.0000
GDPIRET 0.161127 0.008942 18.01927 0.0000
R-squared 0.548753 Mean dependent var 0.015861
Adjusted R-squared 0.547063 S.D. dependent var 0.011124
-
S.E. of regression 0.007487 Akaike info criterion -6.943962
Sum squared resid 0.014966 Schwarz criterion -6.917236
Log likelihood 935.9629 Hannan-Quinn criter. -6.933229
F-statistic 324.6943 Durbin-Watson stat 1.265987
Prob(F-statistic) 0.000000
Din aceasta regresie rezulta ca : GDP=0.013242+0.161127*GPDI
R-squared ne indica ca 54.87% din variatia lui GDP este explicate de variatia GPDI-ului, deci
e model bun.
3. Regresie GDP- FGT
Dependent Variable: GDPRET
Method: Least Squares
Date: 11/12/14 Time: 17:53
Sample (adjusted): 3 271
Included observations: 269 after adjustments
Variable Coefficient Std. Error t-Statistic Prob.
C 0.013967 0.000617 22.62815 0.0000
FGTRET 0.127136 0.013182 9.645009 0.0000
R-squared 0.258387 Mean dependent var 0.015861
Adjusted R-squared 0.255610 S.D. dependent var 0.011124
S.E. of regression 0.009598 Akaike info criterion -6.447149
Sum squared resid 0.024596 Schwarz criterion -6.420422
Log likelihood 869.1415 Hannan-Quinn criter. -6.436415
F-statistic 93.02619 Durbin-Watson stat 1.400639
Prob(F-statistic) 0.000000
Din acesta regresie rezulta ca : GDP= 0.013967+0.127136*FGT
R-squared ne arata ca 12.71% din variatia lui GDP e explicate de variatia lui FGT, deci e un
model bun si semnificativ.
4. Regresie GDP GPS, FGT
Dependent Variable: GDPRET
Method: Least Squares
Date: 11/12/14 Time: 17:57
Sample (adjusted): 3 271
Included observations: 269 after adjustments
Variable Coefficient Std. Error t-Statistic Prob.
C 0.011919 0.000628 18.96510 0.0000
GPSRET 0.094548 0.012839 7.363981 0.0000
FGTRET 0.154670 0.012604 12.27181 0.0000
R-squared 0.383974 Mean dependent var 0.015861
Adjusted R-squared 0.379342 S.D. dependent var 0.011124
-
S.E. of regression 0.008764 Akaike info criterion -6.625251
Sum squared resid 0.020431 Schwarz criterion -6.585162
Log likelihood 894.0963 Hannan-Quinn criter. -6.609151
F-statistic 82.89989 Durbin-Watson stat 1.701186
Prob(F-statistic) 0.000000
Din aceasta rezulta ca : GDP=0.011919+0.094548*GPS
R-squared ne indica ca 38,28% din variatia lui GDP se explica prin variatia lui GPS, deci
rezulta ca modelul e semnificativ si bun.
5. Regresie GDP GDPI, GPS
Dependent Variable: GDPRET
Method: Least Squares
Date: 11/12/14 Time: 17:59
Sample (adjusted): 3 271
Included observations: 269 after adjustments
Variable Coefficient Std. Error t-Statistic Prob.
C 0.013480 0.000497 27.10299 0.0000
GDPIRET 0.166651 0.009481 17.57655 0.0000
GPSRET -0.018929 0.011106 -1.704327 0.0895
R-squared 0.553628 Mean dependent var 0.015861
Adjusted R-squared 0.550272 S.D. dependent var 0.011124
S.E. of regression 0.007460 Akaike info criterion -6.947388
Sum squared resid 0.014804 Schwarz criterion -6.907298
Log likelihood 937.4237 Hannan-Quinn criter. -6.931288
F-statistic 164.9577 Durbin-Watson stat 1.160815
Prob(F-statistic) 0.000000
Din aceasta regresie rezulta ca : GDP=0.013480+0.166651*GDPI-0.018929*GPS
R-squared ne indica ca 55,36 din variatia lui GDP e de la variatia lui GPDI si GPS, deci
rezulta ca modelul e semnificativ si bun
6. Regresie GDP GDPI, FGT, GPS
Dependent Variable: GDPRET
Method: Least Squares
Date: 11/12/14 Time: 18:01
Sample (adjusted): 3 271
Included observations: 269 after adjustments
Variable Coefficient Std. Error t-Statistic Prob.
C 0.012498 0.000514 24.29345 0.0000
-
GDPIRET 0.132281 0.011354 11.65034 0.0000
FGTRET 0.064711 0.012848 5.036768 0.0000
GPSRET 0.014390 0.012520 1.149360 0.2514
R-squared 0.592627 Mean dependent var 0.015861
Adjusted R-squared 0.588015 S.D. dependent var 0.011124
S.E. of regression 0.007140 Akaike info criterion -7.031376
Sum squared resid 0.013511 Schwarz criterion -6.977923
Log likelihood 949.7200 Hannan-Quinn criter. -7.009909
F-statistic 128.5029 Durbin-Watson stat 1.334375
Prob(F-statistic) 0.000000
Din aceasta regresie rezulta ca :
GDP=0.012498+0.132281*GDPI+0.064711*FGT+0.014390*GPS
R-squared ne indica ca 59.26% din variatia lui GDP se explica din variatia variabilelor
independente(GDPI, GPS, FGT), astfel putem spune ca modelul e semnificativ si bun.
2.3 Rezultate regresii in Matlab
Prima regresie are GDP ca variabila dependenta si GPDI ca variabila independenta.
Rezultatele aplicarii regresiei in Matlab sunt prezentate in tabelul urmator:
Regresie GDP - GPDI
Coeficient de
determinare Eroare standard Slope (panta) P-value
0,5488
0.0075 0.1611 0.0000
Tabel : date regresie obtinute prin calcule proprii de la http://www.stlouisfed.org/
Coeficientul de determinare arata cat de bine satisfac datele un model statistic. In acest
caz, coeficientul de determinare indica faptul ca modelul ales (prin regresie) explica 54.9%
din variatia GDP (GPDI explica variatia GDP in proportie de 54.9%).
Eroarea standard este o masura a preciziei cu care coeficientul regresiei este masurat.
Slope (panta) este coeficientul GPDI din ecuatia regresiei, care are in acest caz
urmatoarea forma:
= 0.0132 + 0.1611 , unde reprezinta seria de valori prezise de
ecuatia regresiei pentru GDP si 0.0132 reprezinta coeficientul intercept (care nu are, in
general, semnificatie economica). Coeficientul slope are urmatoarea semnificatie: pentru
fiecare crestere cu o unitate in GPDI, GDP se modifica, in medie*, cu 0.1611 unitati.
-
P-value este valoarea de referinta pentru testul Fischer aplicat modelului. Pentru o
valoare foarte mica a P-value, modelul este considerat statistic semnificativ (P-value sub
0.05% pentru un interval de incredere de 95%).
A doua regresie are GDP ca variabila dependenta si GPSAVE ca variabila
independenta:
Regresie GDP GPSAVE
Coeficient de
determinare Eroare standard Slope (panta) P-value
0.0352 0.0109 0.0478 0.0020
Tabel : date regresie obtinute prin calcule proprii de la http://www.stlouisfed.org/
In acest caz, coeficientul de determinare indica faptul ca modelul ales (prin regresie)
explica 3.52% din variatia GDP (GPSAVE explica variatia GDP in proportie de 3.52%).
Ecuatia regresiei are in acest caz urmatoarea forma:
= 0.0150 + 0.0478 ;
A treia regresie are GDP ca variabila dependenta si FedGovTax ca variabila
independenta:
Regresie GDP FedGovTax
Coeficient de
determinare Eroare standard Slope (panta) P-value
0.2584 0.0096 0.1271 0.0000
Tabel : date regresie obtinute prin calcule proprii de la http://www.stlouisfed.org/
In acest caz, coeficientul de determinare indica faptul ca modelul ales (prin regresie)
explica 25.84% din variatia GDP (FedGovTax explica variatia GDP in proportie de 25.84%).
Ecuatia regresiei are in acest caz urmatoarea forma:
= 0.0140 + 0.1271 ;
A patra regresie are GDP ca variabila dependenta si GPDI si GPSAVE ca variabile
independente:
-
Coeficient
de
determinare
Eroare
standard Slope GPDI
P-value
GPDI
Slope
GPSAVE
P-value
GPSAVE
55.36% 0.0075 0.1667 0.0000 -0.0189 0.0895
Tabel : date regresie obtinute prin calcule proprii de la http://www.stlouisfed.org/
In acest caz, coeficientul de determinare indica faptul ca modelul ales (prin regresie)
explica 55.36% din variatia GDP (GPDI si GPSAVE explica impreuna variatia GDP in
proportie de 55.36%).
Ecuatia regresiei are in acest caz urmatoarea forma:
= 0.0135 + 0.1667 0.0189 ;
De aceasta data, interpretarea pantelor celor doua variabile independente este diferita. In
cazul primei variabile, o crestere cu o unitate in GPDI genereaza, in medie, o crestere cu
0.1667 in GDP in absenta influentei GPSAVE (GPSAVE ramane fixat). Interpretarea este
echivalenta pentru panta GPSAVE.
Ultima regresie are GDP ca variabila dependenta si restul seriilor de date ca variabile
independente:
Coeficient de
determinare
Eroare
standa
rd
Slope
GPDI
P-value
GPDI
Slope
GPSAVE
P-value
GPSAV
E
Slope
FedGo
vTax
P-value
FedGovTax
0.5926 0.0071 0.1323 0.0000 0.0144 0.2514 0.0647 0.0000
Tabel : date regresie obtinute prin calcule proprii de la http://www.stlouisfed.org/
In acest caz, coeficientul de determinare indica faptul ca modelul ales (prin regresie)
explica 59.26% din variatia GDP (GPDI, GPSAVE si FedGovTax explica impreuna variatia
GDP in proportie de 59.26%).
Ecuatia regresiei are in acest caz urmatoarea forma:
= 0.0125 + 0.1323 + 0.0144 + 0.0647 ;