c_dummy-2013

19
ECONOMETRIE - 2013 -

Upload: emma-luca

Post on 22-Dec-2015

2 views

Category:

Documents


0 download

DESCRIPTION

econometrie

TRANSCRIPT

Page 1: C_dummy-2013

ECONOMETRIE

- 2013 -

Page 2: C_dummy-2013

Modele de regresie cu variabile alternative

Modele ANOVA

Modele ANCOVA

Variabilele alternative (dummy) sunt variabile categoriale care pot lua doar două valori. Acestor două valori li se acordă două coduri: codul 1 şi codul 0.

Exemplu: - sexul persoanei: masculin şi feminin.

Page 3: C_dummy-2013

MODELE ANOVA (I)Modelele ANOVA sunt modelele în care variabilele independente sunt variabile dummy.Variabilele dummy vor fi notate cu D, iar parametrii asociaţi acestora cu ai.

Forma generală a modelului ANOVA cu variabile dummy este:

Y= a0+ a1D+ε

Valorile variabilei independente sunt: D=1, dacă se îndeplineşte o anumită condiţie sau proprietate pentru unităţi; D=0, dacă nu se îndeplineşte proprietatea.

De exemplu, pentru variabila D = sexul persoanei, valorile sunt:-D=1, dacă persoanele de sex masculin,-D=0, dacă persoanele nu sunt de sex masculin (sunt de sex feminin).

-M(Y/D)= a0, D=0 a0 + a1, D=1

Page 4: C_dummy-2013

MODELE ANOVA (II)

Interpretarea parametrilor- a0 este nivelul mediu al variabilei Y pentru categoria D=0;

- a0+a1 arată nivelul mediu al variabilei Y pentru categoria D=1;

- a1 arată cu cât diferă nivelul mediu al variabilei Y în funcţie de cele două categorii (diferenţa dintre nivelul mediu al variabilei Y pentru categoria 1 şi nivelul mediu al variabilei Y pentru categoria 0).

În situaţia în care nu există nici o diferenţă semnificativă între valoarea medie a variabilei Y, obţinută pentru variabila dummy când D = 0 şi valoarea medie a variabile Y când D = 1, variabila dummy nu exercită o influenţă semnificativă asupra variabilei Y.

Page 5: C_dummy-2013

MODELE ANOVA (III)

Pentru o populaţie împărţită în două grupe, se utilizează modelul de regresie:Y= a0+ a1D+ε

Notăm cu:- μ1 media variabilei pentru prima grupă (D=0);

- μ2 media variabilei pentru a doua grupă (D=1);

Regresia este: M(Y/D)= a0 = μ1, D=0

a0 + a1 = μ2, D=1

Pentru parametrii modelului se construiesc estimatorii:

10 ˆˆ

210 ˆˆˆ

121 ˆˆˆ

Page 6: C_dummy-2013

MODELE ANOVA (IV)

Estimaţiile parametrilor modelului sunt:

unde n1 este volumul eşantionului pentru prima grupă, iar n2 este volumul eşantionului pentru a doua grupă.

Estimarea parametrului α1 echivalează cu estimarea diferenţei μ1-μ2, iar testarea parametrului echivalează cu testarea ipotezeiH0: μ1=μ2

1

110 n

yya

2

2210 n

yyaa

121 yya

Page 7: C_dummy-2013

Exemplu: Pentru un eşantion format din 10 persoane, se înregistrează salariul lunar obţinut (mil.lei/lună) pe sexe (1- masculin; 0 feminin).

Salariu (mil.lei)

Sexul persoanei

15 1

10 0

9 0

17 1

11 0

18 1

17 1

12 0

11 0

19 1

MODELE ANOVA (V)

Page 8: C_dummy-2013

În urma prelucrării datelor s-au obţinut următoarele rezultate:Estimarea parametrilor modelului : Yi=10,6+6,6D

Coefficientsa

10,600 ,592 17,917 ,000

6,600 ,837 ,941 7,889 ,000

(Constant)

sexul

Model1

B Std. Error

UnstandardizedCoefficients

Beta

StandardizedCoefficients

t Sig.

Dependent Variable: salariua.

MODELE ANOVA (VI)

Valorile estimate ale parametrilor:- salariului mediu corespunzător persoanelor de sex feminin este de 10,6 mil. lei/lună (estimaţia lui a0).- diferenţa dintre salariul mediu al persoanelor de sex masculin şi salariul mediu al persoanelor de sex feminin este de 6,6 mil.lei/lună (estimaţia lui a1 ) iar nivelul mediu al salariului persoanelor de sex masculin este de 17,2 mil. lei/lună (estimaţia lui a0+ a1).

Page 9: C_dummy-2013

Testarea semnificaţiei parametrilor - atât pentru parametrul α0,

cât şi pentru parametrul a1 avem sig.< 5% => respingem H0 cu un risc asumat de 5%.Din tabelele de mai jos rezultă că intensitatea legăturii dintre variabile, măsurată prin R, este de 0,941, iar raportul de corelaţie diferă semnificativ de zero (sig. < 0.05).

Model Summary

,941a ,886 ,872 1,32288Model1

R R SquareAdjustedR Square

Std. Error ofthe Estimate

Predictors: (Constant), sexula.

MODELE ANOVA (VII)

ANOVAb

108,900 1 108,900 62,229 ,000a

14,000 8 1,750

122,900 9

Regression

Residual

Total

Model1

Sum ofSquares df Mean Square F Sig.

Predictors: (Constant), sexula.

Dependent Variable: salariub.

Page 10: C_dummy-2013

MODELE ANOVA (VIII)

Pentru o populaţie împărţită în trei grupe cu ajutorul unei variabile nominale, construirea unui model de regresie ANOVA presupune construirea mai multor variabile alternative. Dacă variabila nominală are p categorii, atunci se vor construi p-1 variabile alternative.De exemplu, pentru o variabilă nominală cu 3 categorii, care împarte populaţia în 3 grupe, cele două variabilele dummy, D1 şi D2, se construiesc astfel:

Pentru verificarea diferenţelor dintre cele trei grupe se utilizează modelul ANOVA: Y = α0+α1D1+α2D2+ε.

Grupa D1 D2

1 1 0

2 0 1

3 0 0

Page 11: C_dummy-2013

MODELE ANOVA (IX)

Mediile condiţionate sunt:

M(Y/D)= α0, D1=0, D2=0

α0+α1, D1=1, D2=0

α0+α2, D1=0, D2=1

Interpretare- Parametrul α0 este media grupei 3, adică μ3;- α0+α1 este media grupei 1, adică μ1;- α0+α2 este media grupei 2, adică μ2;- α1 este diferenţa dintre grupa 1 şi grupa 3, μ1- μ3;- α2 este diferenţa dintre grupa 2 şi grupa 3, μ2- μ3.

Grupul pentru care nu se construieşte explicit o variabilă dummy este considerat grup de referinţă (de comparare).

Page 12: C_dummy-2013

MODELE ANOVA (X)

ExempluSe consideră legătura dintre venitul persoanelor şi nivelul de educaţie. Variabila nivelul de educaţie are trei categorii: gimnazial, liceal şi universitar. Pentru a analiza legătura dintre venit şi educaţie se construiesc două variabile dummy, gimnazial şi liceal:

Grupa D1 D2

Gimnazial 1 0

Liceal 0 1

Universitar 0 0

Page 13: C_dummy-2013

MODELE ANOVA (XI)

Ecuaţia estimată a modelului este:Y = 12-7.667D1-4.5D2+ε.

Interpretare:-a0: venitul mediu pentru persoanele cu studii universitare;

-a1: diferenţa dintre veniturile medii ale persoanelor cu studii gimnaziale şi universitare;-a2: diferenţa dintre veniturile medii ale persoanelor cu studii liceale şi universitare;-a0+a1=12-7.667=4.333: venitul mediu pentru persoanele cu studii gimnaziale;

-a0+a2=12-4.5=7.5: venitul mediu pentru persoanele cu studii liceale.

Coefficientsa

12.000 .626 19.178 .000

-7.667 .921 -1.016 -8.324 .000

-4.500 .857 -.641 -5.252 .000

(Constant)

gimnazial

liceal

Model1

B Std. Error

UnstandardizedCoefficients

Beta

StandardizedCoefficients

t Sig.

Dependent Variable: venita.

Page 14: C_dummy-2013

Modele de regresie cu variabile alternative (II)

Modele ANCOVA

Modelele ANCOVA sunt modele de regresie în care variabila dependentă este numerică iar variabilele independente sunt numerice şi categoriale (dummy).

Page 15: C_dummy-2013

MODELE ANCOVA (1)

Modelul ANCOVA cu o variabilă dummy şi o variabilă numerică

Forma generală a modelului: Y=α0+ α1D+ βX+εunde:- Y este variabila dependentă numerică;- D este variabila independentă dummy;- X este variabila independentă numerică;- α0 este nivelul mediu al variabilei Y când D=0, în condiţiile în care X=0;

- α0 + α1 este nivelul mediu al variabilei Y atunci când D=1, în condiţiile în care X=0;

- α1 arată diferenţa dintre valoarea medie a variabilei Y pe cele două categorii (categoria 1 şi categoria 0), în condiţiile în care X=0;

- β arată cu cât variază, în medie, nivelul variabilei Y la o creştere cu o unitate a lui X, indiferent de grup (categorie).

- M(Y/D)= a0+β, D=0 (a0+a1) + βX, D=1.

Page 16: C_dummy-2013

MODELE ANCOVA (2)

Exemplu: Pentru un eşantion de persoane se înregistrează salariul lunar obţinut (Y, mil.lei), sexul persoanei (1-masculin, 0- feminin) şi numărul de ani de şcoală.

În urma prelucrării datelor s-au obţinut următoarele rezultate:

Coefficientsa

3,109 2,592 1,199 ,276

5,757 ,689 ,778 8,351 ,000

,480 ,165 ,272 2,914 ,027

(Constant)

sexul

ani_scoala

Model1

B Std. Error

UnstandardizedCoefficients

Beta

StandardizedCoefficients

t Sig.

Dependent Variable: salariua.

Page 17: C_dummy-2013

MODELE ANCOVA (3)

- a0: Nivelul mediu al salariului pentru persoanele de sex feminin, în condiţiile în care nivelul educaţiei este de 0 ani;

-a0+ a1 = 8,866: Nivelul mediu estimat al salariului pentru persoanele de sex masculin, în condiţiile în care nivelul educaţiei este de 0 ani;

- a1: Nivelul mediu al salariului persoanelor de sex masculin este mai mare cu 5,757 mil. lei/lună decât nivelul mediu al salariului persoanelor de sex feminin, în condiţiile în care nivelul educaţiei este nul;

- b: La o creştere cu un an a numărului de ani de şcoală, nivelul salariului, în medie, cu 0,48 mil. lei/lună, indiferent de sexul persoanelor.

Observaţie: dacă valoarea parametrului α1 este semnificativ diferită de zero, atunci există diferenţe între nivelurile medii ale salariului pe sexe.

Page 18: C_dummy-2013

MODELE ANCOVA (4)

Modelul ANCOVA cu două variabile dummy şi o variabilă numerică

Pentru acest tip de model, populaţia este structurată în 3 grupe, pentru care creăm două variabile dummy.

Forma modelului: Y=a0+ α1D1+ α2D2+ βX+ε,unde:Y = variabila rezultativă, numerică;D1, respectiv D2 = variabile factoriale, dummy, ale căror variante sunt „da” şi „nu” (posedă sau nu posedă însuşirea), respectiv „1” şi „0”;X = variabila explicativă (factorială), numerică.

Rezultă 3 regresii:

α0+βX, D1=0, D2=0

M(Y/X, D1, D2)= (α0+α1)+βX, D1=1, D2=0

(α0+α2)+βX, D1=0, D2=1

Page 19: C_dummy-2013

MODELE ANCOVA (5)

Variabila categorială este regiunea de provenienţă (OECD, Europa de Est şi Asia). D1 este creată pentru OECD, iar D2 pentru EE.

Interpretare:-a0=47.226 este nivelul mediu estimat al speranţei de viaţă pentru femei din Asia;- a1=4.379 este diferenţa dintre speranţa de viaţă a femeilor din OECD faţă de cele din Asia. Speranţa medie de viaţă a femeilor din OECD este cu 4.379 ani mai mare decât acelor din Asia;- a2=-1.653 este diferenţa dintre speranţa de viaţă a femeilor din EE faţă de cele din Asia. Speranţa medie de viaţă a femeilor din EE este cu 1.653 ani mai mică decât acelor din Asia; - b=0.304 este creşterea medie a speranţei de viaţă a femeilor la o creştere cu 1% a RAF;- a0+a1=51.505 este nivelul mediu estimat al SVF pentru persoanele din OECD;- a0+a2=45.573 este nivelul mediu estimat al SVF pentru persoanele din EE;

Coefficientsa

47.226 1.785 26.457 .000

.304 .027 .811 11.386 .000

4.379 2.745 .105 1.595 .115

-1.653 2.402 -.048 -.688 .493

(Constant)

Rata de alfabetizarepentru femei (%)

OECD

EE

Model1

B Std. Error

UnstandardizedCoefficients

Beta

StandardizedCoefficients

t Sig.

Dependent Variable: Speranta medie de viata pentru femeia.