curs12 ipoteze dv (1)

10

Click here to load reader

Upload: suciu-bogdan

Post on 03-Jul-2015

226 views

Category:

Documents


6 download

TRANSCRIPT

Page 1: Curs12 ipoteze dv (1)

1

Curs 12

Page 2: Curs12 ipoteze dv (1)

2

Ipoteza de necoliniaritate a variabilelor independente

Ipoteza de necoliniaritate presupune că între variabilele independente ale unui model de regresie liniar multiplu nu există o legătură de tip liniar.

Probleme: identificarea gradului de coliniaritate stabilirea cauzelor încălcării ipotezei stabilirea efectelor coliniarităţii testarea ipotezei de coliniaritate şi corectarea modelului în cazul existenţei acesteia.

Page 3: Curs12 ipoteze dv (1)

3

Ipoteza lipsei de coliniaritate a variabilelor independente

Grade de coliniaritate Coliniaritate perfectă dacă există p constante , nu toate nule,

respectiv coliniaritate neperfectă dacă are loc relaţia:

unde u este o variabilă aleatoare care respectă ipotezele modelului clasic de regresie.

0X...XX pp2211 =+++ λλλ

0uX...XX pp2211 =++++ λλλ

Page 4: Curs12 ipoteze dv (1)

4

Cauzele încălcării necoliniarităţii:Tipul de model utilizat;Variabilele alese pentru a realiza modelarea etc.

Efectele coliniarităţii:Varianţa estimatorilor parametrilor de regresie creşte, deci estimatorii nu vor mai fi eficienţi. Dacă există coliniaritate perfectă, varianţa estimatorilor este infinită, iar parametrii nu pot f estimaţi. Dacă există coliniaritate imperfectă, atunci varianţele estimatorilor parametrilor vor fi mari

Page 5: Curs12 ipoteze dv (1)

5

Ipoteza lipsei de coliniaritate a variabilelor independenteIdentificarea coliniarităţii

Testarea coeficienţilor de regresie în cazul unui model cu un coeficient de determinaţie ridicat (de obicei peste 0.8). Dacă coeficienţii de regresie sunt nesemnificativ diferiţi de zero, atunci ipoteza de

necoliniaritate este încălcată.

Testarea coeficienţilor de corelaţie bivariaţi pentru variabilele independente din modelul de regresie Dacă aceşti coeficienţi au valori ridicate (de regulă, peste 0.8), atunci există

posibilitatea coliniarităţii între variabilele independente.

Estimarea şi testarea parametrilor modelelor de regresie auxiliară dintre variabilele independente . Ipoteza de necoliniaritate este încălcată dacă aceşti coeficienţi de regresie sunt

semnificativ diferiţi de zero. Detectare a coliniarităţii pe baza a doi indicatori (aplicaţi în SPSS):

Tolerance (TOL) VIF (Variance Inflation Factor).

Page 6: Curs12 ipoteze dv (1)

6

Ipoteza lipsei de coliniaritate a variabilelor independente Indicatorul VIF se defineşte prin relaţia:

este raportul de determinaţie din modelul de regresie auxiliar, construit pe baza variabilelor independente, în care variabila j este considerată variabila dependentă, iar celelalte variabile factoriale sunt considerate variabile independente.

Lipsa coliniarităţii dă o valoare VIF = 1

Existenţa coliniarităţii determină o valoare mare a indicatorului, condiţia limită fiind în cazul unei coliniarităţi perfecte

În practică, se consideră că o valoare VIF>10 indică prezenţa coliniarităţii.

)R1(

1VIF

2j

j −=

2jR

∞→⇒= VIF1R2j

Page 7: Curs12 ipoteze dv (1)

7

Ipoteza lipsei de coliniaritate a variabilelor independente Indicatorul Tolerance

Se determină ca inversul valorii indicatorului VIF, după:

Dacă TOL = 1, nu există coliniaritate, iar dacă TOL = 0 suntem în situaţia extremă, de coliniaritate perfectă.

)R1(VIF

1TOL 2

jj

j −==

Page 8: Curs12 ipoteze dv (1)

8

Corectarea coliniarităţii

Eliminarea din model a variabilei care induce coliniaritatea

Construirea unui model de regresie cu variabile transformare folosind diverse funcţii sau operatori (decalaj, diferenţă etc.)

Page 9: Curs12 ipoteze dv (1)

9

Exemplu

Coefficientsa

208.654 12.503 16.689 .000

-.001 .000 -.128 -2.002 .049 .349 2.864

-6.059 1.993 -.178 -3.040 .003 .422 2.372

-1.345 .100 -.803 -13.420 .000 .402 2.489

-.016 .004 -.235 -3.684 .000 .354 2.829

(Constant)

Gross domesticproduct / capita

Population increase(% per year))

People who read (%)

Daily calorie intake

Model1

B Std. Error

UnstandardizedCoefficients

Beta

StandardizedCoefficients

t Sig. Tolerance VIF

Collinearity Statistics

Dependent Variable: Infant mortality (deaths per 1000 live births)a.

Page 10: Curs12 ipoteze dv (1)

9

Exemplu

Coefficientsa

208.654 12.503 16.689 .000

-.001 .000 -.128 -2.002 .049 .349 2.864

-6.059 1.993 -.178 -3.040 .003 .422 2.372

-1.345 .100 -.803 -13.420 .000 .402 2.489

-.016 .004 -.235 -3.684 .000 .354 2.829

(Constant)

Gross domesticproduct / capita

Population increase(% per year))

People who read (%)

Daily calorie intake

Model1

B Std. Error

UnstandardizedCoefficients

Beta

StandardizedCoefficients

t Sig. Tolerance VIF

Collinearity Statistics

Dependent Variable: Infant mortality (deaths per 1000 live births)a.