regresie lineara multipă cu variabile dummy - efecte aditive - efecte interactive
DESCRIPTION
Regresie lineara multipă cu variabile dummy - efecte aditive - efecte interactive. Norbert Petrovici NorbertPetrovici @yahoo.com. regresie multiplă. Ipoteza : venitul asteptat este dependent de nivelul d e consum , de mediu de rezidenţă şi consumul în funcţie de mediul de rezidenţăww. - PowerPoint PPT PresentationTRANSCRIPT
Regresie lineara multipă cu variabile dummy- efecte aditive
- efecte interactive
Norbert Petrovici
• Ipoteza: venitul asteptat este dependent de nivelul de consum, de mediu de rezidenţă şi consumul în funcţie de mediul de rezidenţăww
regresie multiplă
• Putem modela în două moduri ipoteza
– 1. Teorie: Mediu urban comparativ cu mediul rural oferă mai multe oportunităţi de consumVenit = a+ b1*Consum + b2*Mediu
– 2. Teorie: Mediu urban comparativ cu mediul rural oferă oportunităţi diferit, şi în plus chiar consumul variază în funcţie de mediu.Venit = a+ b1*Consum + b2*Mediu + b3*Consum*Mediu
→
regresie multiplă efecte aditive si efcte de interactiune
0
5
10
15
20
25
30
35
40
0 10 20 30 40 50
Consumul per membru de familie
Ven
itul as
tepta
t per
mem
bru
de
fam
ilie
b
Urban
Rural
0
2
4
6
8
10
12
0 2 4 6 8 10 12
Consumul per membru de familie
Venitul aste
pta
t per
mem
bru
de fam
ilie
b
Urban
RuralModel 1. Teorie: Pe măsură ce creşte consumul
venitul aşteptat creşte în acelaşi ritm si in urban şi în rural, doar că în urban începe de la un nivel mai mare
Modelare dreapta de regresie: - Interceptul diferă pentru urban şi
rural (venitul asptetat va creşte de la o valoare mai mare in urban comparativ cu rural=
- panta este aceeaşi pentru urban si rural (venitul asteptat va creste in acelasi ritm şi în urban şi în rural)
Model 2. Teorie: Pe măsură ce consumul creşte
venitul aşteptat în urban creşte mult mai mult decât în rural.
Modelare dreapta de regresie: - Interceptul diferă pentru urban şi
rural (venitul aşptetat creşte de la o valoare mai mare in urban)
- Panta este diferită pentru urban si rural (venitul asteptat creste mai accentuat în urban decât în rural)
ANOVAb
4676.716 2 2338.358 231.540 .000a
15078.042 1493 10.099
19754.758 1495
Regression
Residual
Total
Model1
Sum ofSquares df Mean Square F Sig.
Predictors: (Constant), mediu Tip localitate, consum Consum per membru defamilie
a.
Dependent Variable: exinc Venit asteptatb.
Model Summary
.487a .237 .236 3.17792Model1
R R SquareAdjustedR Square
Std. Error ofthe Estimate
Predictors: (Constant), mediu Tip localitate, consum Consum per membru de familie
a.
Coefficientsa
2.572 .135 19.051 .000
.511 .032 .375 16.032 .000
1.657 .171 .227 9.689 .000
(Constant)
Consum
Mediu
Model1
B Std. Error
UnstandardizedCoefficients
Beta
StandardizedCoefficients
t Sig.
Dependent Variable: exinc Venit asteptata.
• Consum + Mediu -> Venit aşteptat
Modelul este generalizabil de la eşantion la populaţie. Diferenţele dintre panta dreptei de regresie si medie nu se datoreaza erorilor de eşantionare
Valoarea de 0.487 a corelaţia indică o intensitate moderată a legătură medii dintre variabile
Nivelul Consumului per membru de familie luna trecuta şi tipul localităţii explică 23,7%, din varianţa variabilei venit asteptat per membru de familie
Dreapta de regresie nestand. Y* = 2,572+0,511*X1+ 1,657*X2
Sau standardizatY* = 0.375*X1+ 0,227*X2
Toţi coeficienţii sunt semnificativi (sig. < 0.050)
regresie multiplă (catintativ + dummy)
• Interpretare R– Intensitatea medie a legăturii dintre venitul aşteptat, consum şi mediu de rezidenţă
este de 0,487 (pe o scală de la -1 la 1, unde zero indică lipsa unei legături).
• Interpretare R2
– Dacă utilizăm ecuaţia lineară de predicţie Venit = 2,572 + 0.511*Consum + 1,657*Mediu pentru a estima venitul aşteptat comitem cu 23,7% mai puţine erori decât dacă l-am estima pe baza mediei.
• Interpretarea coeficientului b– Venitul aşteptat creşte în medie cu 511 mii lei cu fiecare milion de lei consumat
pentru subieţii a care provin din acelaşi mediu rezidenţial (admiţând că între cele două variabile există o dependeţă lineară).
– Venitul aşteptat creşte în medie cu 1,757 mii lei pentru cineva din urban comparativ cu cineva din rural pentru un nivel de consum similar (admiţând că între cele două variabile există o dependeţă lineară).
• Interpretarea coeficientului a– cineva care nu a consumat deloc luna trecuta şi provine din mediul rural atunci se
aşteaptă în medie la 2 572 mii lei (admiţând că între cele două variabile există o dependeţă lineară)
• Interpretarea coeficientului β– La o creştere cu o abatere standard a consumului per membru de familie, pentru
subiecţii din acelaşi mediu de rezidenţă, îi corespunde o creştere de 0,375 abateri standard a variabilei venit aşteptat per membru de familiei (admiţând că între cele două variabile există o dependenţă lineară)
cum interpretăm?
• Consum + Mediu + Consum*Mediu-> Venit asteptat
regresie multiplă (catintativ + dummy + catitativ*dummy)
Modelul este generalizabil de la eşantion la populaţie. Diferenţele dintre panta dreptei de regresie si medie nu se datoreaza erorilor de eşantionare
Intensitatea medie a leg[turii ]ntre variabile a crescut de la 0.487 din modelul precedent la 0.497
Proporţia explicată din varianţa variabilei dependent[ (venit asteptat per membru de familie) a crescut la 24,7% de la 23,7% (valoarea din modelul anterior)
Dreapta de regresie nestand. Y* = 2,936+0,307*X1+ 1,657*X2
Sau standardizatY* = 0.375*X1+ 0,227*X2
Toţi coeficienţii sunt semnificativi (sig. < 0.050)
Coefficientsa
2.936 .156 18.852 .000
.307 .054 .226 5.643 .000
.962 .227 .132 4.232 .000
.307 .067 .222 4.596 .000
(Constant)
Consum
Mediu
Consum*Mediu
Model1
B Std. Error
UnstandardizedCoefficients
Beta
StandardizedCoefficients
t Sig.
Dependent Variable: Venit asteptata.
ANOVAb
4887.216 3 1629.072 163.482 .000a
14867.541 1492 9.965
19754.758 1495
Regression
Residual
Total
Model1
Sum ofSquares df Mean Square F Sig.
Predictors: (Constant), Consum, Mediu, Consum*Mediua.
Dependent Variable: Venit asteptatb.
Model Summary
.497a .247 .246 3.15671Model1
R R SquareAdjustedR Square
Std. Error ofthe Estimate
Predictors: (Constant), Consum, Mediu,Consum*Mediu
a.
• Interpretare R– Intensitatea medie a legăturii dintre venitul aşteptat, consum şi mediu de rezidenţă şi
interacţiunea dintre rezidneţă şi consum este de 0,497 (pe o scală de la -1 la 1, unde zero indică lipsa unei legături).
• Interpretare R2
– Dacă utilizăm ecuaţia lineară de predicţie Venit = 2,936 + 0.307*Consum + 0,962*Mediu + 0.307 Consum*Mediu pentru a estima venitul aşteptat comitem cu 24,7% mai puţine erori decât dacă l-am estima pe baza mediei.
• Interpretarea coeficientului b factor interactiune – Venitul aşteptat creşte în medie în urban faţă de rural cu 307 mii lei mai mult pentru
fiecare milion de lei consumat per membru de familie pentru acelaşi nivel de consum (admiţând că între cele două variabile există o dependeţă lineară).
• Interpretarea coeficientului a– cineva care nu a consumat deloc luna trecuta şi provine din mediul rural atunci se
aşteaptă în medie la 2 936 mii lei (admiţând că între cele două variabile există o dependeţă lineară)
• Interpretarea coeficientului β factor interacţiune– Venitul aşteptat creşte în medie în urban faţă de urban cu 0.223 abateri standard,
dacă consumul per membru de familie creşte cu o abatere standard, pentru acelaşi nivel de consum (admiţând că între cele două variabile există o dependenţă lineară)
cum interpretăm?
Mediu Urban: Mediu = 1 Venit* = 3,010 + 0,287*Consum + 0,595 *1 + 0,496*Consum*1 = (3.010 + 0,595) + (0,287+ 0,496)*Consum = 3.605 + 0,783
Mediu Rural: Mediu = 0 Venit* = 3,010 + 0,287*Consum + 0,595*0 + 0,496*Consum*0 = 3,010 + 0,287*Consum
Dreapta de regresie nestand Venit= 3.010+0,287*Consum+ 0,595*Mediu + 0,496*Consum*Mediu
Mediu Urban: Mediu = 1 Venit* = 2.419 + 0,618*Consum+ 1,716*1 = (2,419 +1,716) + 0,618*Consum = 4,135 + 0,618*Consum
Mediu Rural: Mediu = 0 Venit* = 2.419 + 0,618*Consum+ 1,716*0 = 2,419 + 0,618*Consum
Dreapta de regresie nestand Venit= 2.419 + 0,618*Consum + 1,716*Mediu
În acest model se schimba doar interceptul (coeficientul a) din dreapta de regresie
În acest model se schimba şi interceptul şi panta (coeficientul a şi b) din dreapta de regresie
Care e diferenţa algebrică?
efect aditiv efect interactiv
Care e diferenţa geometrică?
0
5
10
15
20
25
30
35
40
0 10 20 30 40 50
Consumul per membru de familie
Ven
itul as
tepta
t per
mem
bru
de
fam
ilie
b
Urban
Rural
0
2
4
6
8
10
12
0 2 4 6 8 10 12
Consumul per membru de familie
Venitul aste
pta
t per
mem
bru
de fam
ilie
b
Urban
Rural
Efect aditiv: se schimbă doar interceptul (a-ul)
Efect interactiv: se schimbă - şi interceptul (a-ul)- şi panta (b-ul)