curs12 ipoteze dv (1)
TRANSCRIPT
1
Curs 12
2
Ipoteza de necoliniaritate a variabilelor independente
Ipoteza de necoliniaritate presupune că între variabilele independente ale unui model de regresie liniar multiplu nu există o legătură de tip liniar.
Probleme: identificarea gradului de coliniaritate stabilirea cauzelor încălcării ipotezei stabilirea efectelor coliniarităţii testarea ipotezei de coliniaritate şi corectarea modelului în cazul existenţei acesteia.
3
Ipoteza lipsei de coliniaritate a variabilelor independente
Grade de coliniaritate Coliniaritate perfectă dacă există p constante , nu toate nule,
respectiv coliniaritate neperfectă dacă are loc relaţia:
unde u este o variabilă aleatoare care respectă ipotezele modelului clasic de regresie.
0X...XX pp2211 =+++ λλλ
0uX...XX pp2211 =++++ λλλ
4
Cauzele încălcării necoliniarităţii:Tipul de model utilizat;Variabilele alese pentru a realiza modelarea etc.
Efectele coliniarităţii:Varianţa estimatorilor parametrilor de regresie creşte, deci estimatorii nu vor mai fi eficienţi. Dacă există coliniaritate perfectă, varianţa estimatorilor este infinită, iar parametrii nu pot f estimaţi. Dacă există coliniaritate imperfectă, atunci varianţele estimatorilor parametrilor vor fi mari
5
Ipoteza lipsei de coliniaritate a variabilelor independenteIdentificarea coliniarităţii
Testarea coeficienţilor de regresie în cazul unui model cu un coeficient de determinaţie ridicat (de obicei peste 0.8). Dacă coeficienţii de regresie sunt nesemnificativ diferiţi de zero, atunci ipoteza de
necoliniaritate este încălcată.
Testarea coeficienţilor de corelaţie bivariaţi pentru variabilele independente din modelul de regresie Dacă aceşti coeficienţi au valori ridicate (de regulă, peste 0.8), atunci există
posibilitatea coliniarităţii între variabilele independente.
Estimarea şi testarea parametrilor modelelor de regresie auxiliară dintre variabilele independente . Ipoteza de necoliniaritate este încălcată dacă aceşti coeficienţi de regresie sunt
semnificativ diferiţi de zero. Detectare a coliniarităţii pe baza a doi indicatori (aplicaţi în SPSS):
Tolerance (TOL) VIF (Variance Inflation Factor).
6
Ipoteza lipsei de coliniaritate a variabilelor independente Indicatorul VIF se defineşte prin relaţia:
este raportul de determinaţie din modelul de regresie auxiliar, construit pe baza variabilelor independente, în care variabila j este considerată variabila dependentă, iar celelalte variabile factoriale sunt considerate variabile independente.
Lipsa coliniarităţii dă o valoare VIF = 1
Existenţa coliniarităţii determină o valoare mare a indicatorului, condiţia limită fiind în cazul unei coliniarităţi perfecte
În practică, se consideră că o valoare VIF>10 indică prezenţa coliniarităţii.
)R1(
1VIF
2j
j −=
2jR
∞→⇒= VIF1R2j
7
Ipoteza lipsei de coliniaritate a variabilelor independente Indicatorul Tolerance
Se determină ca inversul valorii indicatorului VIF, după:
Dacă TOL = 1, nu există coliniaritate, iar dacă TOL = 0 suntem în situaţia extremă, de coliniaritate perfectă.
)R1(VIF
1TOL 2
jj
j −==
8
Corectarea coliniarităţii
Eliminarea din model a variabilei care induce coliniaritatea
Construirea unui model de regresie cu variabile transformare folosind diverse funcţii sau operatori (decalaj, diferenţă etc.)
9
Exemplu
Coefficientsa
208.654 12.503 16.689 .000
-.001 .000 -.128 -2.002 .049 .349 2.864
-6.059 1.993 -.178 -3.040 .003 .422 2.372
-1.345 .100 -.803 -13.420 .000 .402 2.489
-.016 .004 -.235 -3.684 .000 .354 2.829
(Constant)
Gross domesticproduct / capita
Population increase(% per year))
People who read (%)
Daily calorie intake
Model1
B Std. Error
UnstandardizedCoefficients
Beta
StandardizedCoefficients
t Sig. Tolerance VIF
Collinearity Statistics
Dependent Variable: Infant mortality (deaths per 1000 live births)a.
9
Exemplu
Coefficientsa
208.654 12.503 16.689 .000
-.001 .000 -.128 -2.002 .049 .349 2.864
-6.059 1.993 -.178 -3.040 .003 .422 2.372
-1.345 .100 -.803 -13.420 .000 .402 2.489
-.016 .004 -.235 -3.684 .000 .354 2.829
(Constant)
Gross domesticproduct / capita
Population increase(% per year))
People who read (%)
Daily calorie intake
Model1
B Std. Error
UnstandardizedCoefficients
Beta
StandardizedCoefficients
t Sig. Tolerance VIF
Collinearity Statistics
Dependent Variable: Infant mortality (deaths per 1000 live births)a.