regresie lineara multipă cu variabile dummy - efecte aditive - efecte interactive

10
Regresie lineara multipă cu variabile dummy - efecte aditive - efecte interactive Norbert Petrovici NorbertPetrovici @yahoo.com

Upload: mireya

Post on 14-Jan-2016

19 views

Category:

Documents


0 download

DESCRIPTION

Regresie lineara multipă cu variabile dummy - efecte aditive - efecte interactive. Norbert Petrovici NorbertPetrovici @yahoo.com. regresie multiplă. Ipoteza : venitul asteptat este dependent de nivelul d e consum , de mediu de rezidenţă şi consumul în funcţie de mediul de rezidenţăww. - PowerPoint PPT Presentation

TRANSCRIPT

Page 1: Regresie lineara multipă cu variabile dummy -  efecte aditive -  efecte interactive

Regresie lineara multipă cu variabile dummy- efecte aditive

- efecte interactive

Norbert Petrovici

[email protected]

Page 2: Regresie lineara multipă cu variabile dummy -  efecte aditive -  efecte interactive

• Ipoteza: venitul asteptat este dependent de nivelul de consum, de mediu de rezidenţă şi consumul în funcţie de mediul de rezidenţăww

regresie multiplă

Page 3: Regresie lineara multipă cu variabile dummy -  efecte aditive -  efecte interactive

• Putem modela în două moduri ipoteza

– 1. Teorie: Mediu urban comparativ cu mediul rural oferă mai multe oportunităţi de consumVenit = a+ b1*Consum + b2*Mediu

– 2. Teorie: Mediu urban comparativ cu mediul rural oferă oportunităţi diferit, şi în plus chiar consumul variază în funcţie de mediu.Venit = a+ b1*Consum + b2*Mediu + b3*Consum*Mediu

regresie multiplă efecte aditive si efcte de interactiune

Page 4: Regresie lineara multipă cu variabile dummy -  efecte aditive -  efecte interactive

0

5

10

15

20

25

30

35

40

0 10 20 30 40 50

Consumul per membru de familie

Ven

itul as

tepta

t per

mem

bru

de

fam

ilie

b

Urban

Rural

0

2

4

6

8

10

12

0 2 4 6 8 10 12

Consumul per membru de familie

Venitul aste

pta

t per

mem

bru

de fam

ilie

b

Urban

RuralModel 1. Teorie: Pe măsură ce creşte consumul

venitul aşteptat creşte în acelaşi ritm si in urban şi în rural, doar că în urban începe de la un nivel mai mare

Modelare dreapta de regresie: - Interceptul diferă pentru urban şi

rural (venitul asptetat va creşte de la o valoare mai mare in urban comparativ cu rural=

- panta este aceeaşi pentru urban si rural (venitul asteptat va creste in acelasi ritm şi în urban şi în rural)

Model 2. Teorie: Pe măsură ce consumul creşte

venitul aşteptat în urban creşte mult mai mult decât în rural.

Modelare dreapta de regresie: - Interceptul diferă pentru urban şi

rural (venitul aşptetat creşte de la o valoare mai mare in urban)

- Panta este diferită pentru urban si rural (venitul asteptat creste mai accentuat în urban decât în rural)

Page 5: Regresie lineara multipă cu variabile dummy -  efecte aditive -  efecte interactive

ANOVAb

4676.716 2 2338.358 231.540 .000a

15078.042 1493 10.099

19754.758 1495

Regression

Residual

Total

Model1

Sum ofSquares df Mean Square F Sig.

Predictors: (Constant), mediu Tip localitate, consum Consum per membru defamilie

a.

Dependent Variable: exinc Venit asteptatb.

Model Summary

.487a .237 .236 3.17792Model1

R R SquareAdjustedR Square

Std. Error ofthe Estimate

Predictors: (Constant), mediu Tip localitate, consum Consum per membru de familie

a.

Coefficientsa

2.572 .135 19.051 .000

.511 .032 .375 16.032 .000

1.657 .171 .227 9.689 .000

(Constant)

Consum

Mediu

Model1

B Std. Error

UnstandardizedCoefficients

Beta

StandardizedCoefficients

t Sig.

Dependent Variable: exinc Venit asteptata.

• Consum + Mediu -> Venit aşteptat

Modelul este generalizabil de la eşantion la populaţie. Diferenţele dintre panta dreptei de regresie si medie nu se datoreaza erorilor de eşantionare

Valoarea de 0.487 a corelaţia indică o intensitate moderată a legătură medii dintre variabile

Nivelul Consumului per membru de familie luna trecuta şi tipul localităţii explică 23,7%, din varianţa variabilei venit asteptat per membru de familie

Dreapta de regresie nestand. Y* = 2,572+0,511*X1+ 1,657*X2

Sau standardizatY* = 0.375*X1+ 0,227*X2

Toţi coeficienţii sunt semnificativi (sig. < 0.050)

regresie multiplă (catintativ + dummy)

Page 6: Regresie lineara multipă cu variabile dummy -  efecte aditive -  efecte interactive

• Interpretare R– Intensitatea medie a legăturii dintre venitul aşteptat, consum şi mediu de rezidenţă

este de 0,487 (pe o scală de la -1 la 1, unde zero indică lipsa unei legături).

• Interpretare R2

– Dacă utilizăm ecuaţia lineară de predicţie Venit = 2,572 + 0.511*Consum + 1,657*Mediu pentru a estima venitul aşteptat comitem cu 23,7% mai puţine erori decât dacă l-am estima pe baza mediei.

• Interpretarea coeficientului b– Venitul aşteptat creşte în medie cu 511 mii lei cu fiecare milion de lei consumat

pentru subieţii a care provin din acelaşi mediu rezidenţial (admiţând că între cele două variabile există o dependeţă lineară).

– Venitul aşteptat creşte în medie cu 1,757 mii lei pentru cineva din urban comparativ cu cineva din rural pentru un nivel de consum similar (admiţând că între cele două variabile există o dependeţă lineară).

• Interpretarea coeficientului a– cineva care nu a consumat deloc luna trecuta şi provine din mediul rural atunci se

aşteaptă în medie la 2 572 mii lei (admiţând că între cele două variabile există o dependeţă lineară)

• Interpretarea coeficientului β– La o creştere cu o abatere standard a consumului per membru de familie, pentru

subiecţii din acelaşi mediu de rezidenţă, îi corespunde o creştere de 0,375 abateri standard a variabilei venit aşteptat per membru de familiei (admiţând că între cele două variabile există o dependenţă lineară)

cum interpretăm?

Page 7: Regresie lineara multipă cu variabile dummy -  efecte aditive -  efecte interactive

• Consum + Mediu + Consum*Mediu-> Venit asteptat

regresie multiplă (catintativ + dummy + catitativ*dummy)

Modelul este generalizabil de la eşantion la populaţie. Diferenţele dintre panta dreptei de regresie si medie nu se datoreaza erorilor de eşantionare

Intensitatea medie a leg[turii ]ntre variabile a crescut de la 0.487 din modelul precedent la 0.497

Proporţia explicată din varianţa variabilei dependent[ (venit asteptat per membru de familie) a crescut la 24,7% de la 23,7% (valoarea din modelul anterior)

Dreapta de regresie nestand. Y* = 2,936+0,307*X1+ 1,657*X2

Sau standardizatY* = 0.375*X1+ 0,227*X2

Toţi coeficienţii sunt semnificativi (sig. < 0.050)

Coefficientsa

2.936 .156 18.852 .000

.307 .054 .226 5.643 .000

.962 .227 .132 4.232 .000

.307 .067 .222 4.596 .000

(Constant)

Consum

Mediu

Consum*Mediu

Model1

B Std. Error

UnstandardizedCoefficients

Beta

StandardizedCoefficients

t Sig.

Dependent Variable: Venit asteptata.

ANOVAb

4887.216 3 1629.072 163.482 .000a

14867.541 1492 9.965

19754.758 1495

Regression

Residual

Total

Model1

Sum ofSquares df Mean Square F Sig.

Predictors: (Constant), Consum, Mediu, Consum*Mediua.

Dependent Variable: Venit asteptatb.

Model Summary

.497a .247 .246 3.15671Model1

R R SquareAdjustedR Square

Std. Error ofthe Estimate

Predictors: (Constant), Consum, Mediu,Consum*Mediu

a.

Page 8: Regresie lineara multipă cu variabile dummy -  efecte aditive -  efecte interactive

• Interpretare R– Intensitatea medie a legăturii dintre venitul aşteptat, consum şi mediu de rezidenţă şi

interacţiunea dintre rezidneţă şi consum este de 0,497 (pe o scală de la -1 la 1, unde zero indică lipsa unei legături).

• Interpretare R2

– Dacă utilizăm ecuaţia lineară de predicţie Venit = 2,936 + 0.307*Consum + 0,962*Mediu + 0.307 Consum*Mediu pentru a estima venitul aşteptat comitem cu 24,7% mai puţine erori decât dacă l-am estima pe baza mediei.

• Interpretarea coeficientului b factor interactiune – Venitul aşteptat creşte în medie în urban faţă de rural cu 307 mii lei mai mult pentru

fiecare milion de lei consumat per membru de familie pentru acelaşi nivel de consum (admiţând că între cele două variabile există o dependeţă lineară).

• Interpretarea coeficientului a– cineva care nu a consumat deloc luna trecuta şi provine din mediul rural atunci se

aşteaptă în medie la 2 936 mii lei (admiţând că între cele două variabile există o dependeţă lineară)

• Interpretarea coeficientului β factor interacţiune– Venitul aşteptat creşte în medie în urban faţă de urban cu 0.223 abateri standard,

dacă consumul per membru de familie creşte cu o abatere standard, pentru acelaşi nivel de consum (admiţând că între cele două variabile există o dependenţă lineară)

cum interpretăm?

Page 9: Regresie lineara multipă cu variabile dummy -  efecte aditive -  efecte interactive

Mediu Urban: Mediu = 1 Venit* = 3,010 + 0,287*Consum + 0,595 *1 + 0,496*Consum*1 = (3.010 + 0,595) + (0,287+ 0,496)*Consum = 3.605 + 0,783

Mediu Rural: Mediu = 0 Venit* = 3,010 + 0,287*Consum + 0,595*0 + 0,496*Consum*0 = 3,010 + 0,287*Consum

Dreapta de regresie nestand Venit= 3.010+0,287*Consum+ 0,595*Mediu + 0,496*Consum*Mediu

Mediu Urban: Mediu = 1 Venit* = 2.419 + 0,618*Consum+ 1,716*1 = (2,419 +1,716) + 0,618*Consum = 4,135 + 0,618*Consum

Mediu Rural: Mediu = 0 Venit* = 2.419 + 0,618*Consum+ 1,716*0 = 2,419 + 0,618*Consum

Dreapta de regresie nestand Venit= 2.419 + 0,618*Consum + 1,716*Mediu

În acest model se schimba doar interceptul (coeficientul a) din dreapta de regresie

În acest model se schimba şi interceptul şi panta (coeficientul a şi b) din dreapta de regresie

Care e diferenţa algebrică?

efect aditiv efect interactiv

Page 10: Regresie lineara multipă cu variabile dummy -  efecte aditive -  efecte interactive

Care e diferenţa geometrică?

0

5

10

15

20

25

30

35

40

0 10 20 30 40 50

Consumul per membru de familie

Ven

itul as

tepta

t per

mem

bru

de

fam

ilie

b

Urban

Rural

0

2

4

6

8

10

12

0 2 4 6 8 10 12

Consumul per membru de familie

Venitul aste

pta

t per

mem

bru

de fam

ilie

b

Urban

Rural

Efect aditiv: se schimbă doar interceptul (a-ul)

Efect interactiv: se schimbă - şi interceptul (a-ul)- şi panta (b-ul)