model regresie multipla

8
PROBLEMA B Pornind de la ecuatia : capacitatea de cazare turistica in functiune=f(numarul sosirilor, numarul innoptarilor) vom obtine modelul de regresie multifactorial. y = capacitatea de cazare turistica in functiune(variabila dependenta sau endogena) x 1 = nmarul sosirilor (variabila independenta sau exogena 1) x 2 = numarul innoptarilor (variabila independenta sau exogena 2) y i = f (x 1i ,x 2i ) capacitatea de cazare turistica in functiune=(numarul sosirilor,numarul innoptarilor) y i = ^ y i +e i Functia de regresie este urmatoarea: ^ y x 1 ,x 2 ,i =b 0 +b 1 x 1i + b 2 x 2 i b0 – coeficientul termenului liber b1 – coeficientul de regresie(primul factor) b2 – coeficientul de regresie (al doilea factor) Astfel am obtinut : ^ y x 1 ,x 2 ,i =142.5094+ 1.9218 x 1i + 2.7274 x 2i b 0 – termenul liber(INTERCEPT) ne arata ca functia de regresie ^ y intersecteaza axa Oy in punctual 142.5094 b 1 – ne indica cresterea capacitatii de cazare turistica in functiune cu 1.9218 in cazul in care numarul sosirilor creste cu o unitate.

Upload: catta-catalina

Post on 11-Sep-2015

218 views

Category:

Documents


6 download

DESCRIPTION

Regresie multipla - Model

TRANSCRIPT

PROBLEMA BPornind de la ecuatia : capacitatea de cazare turistica in functiune=f(numarul sosirilor, numarul innoptarilor) vom obtine modelul de regresie multifactorial. y = capacitatea de cazare turistica in functiune(variabila dependenta sau endogena) x1 = nmarul sosirilor (variabila independenta sau exogena 1) x2 = numarul innoptarilor (variabila independenta sau exogena 2)

yi = f (x1i,x2i)capacitatea de cazare turistica in functiune=(numarul sosirilor,numarul innoptarilor)

Functia de regresie este urmatoarea:

b0 coeficientul termenului liber b1 coeficientul de regresie(primul factor) b2 coeficientul de regresie (al doilea factor)

Astfel am obtinut : b0 termenul liber(INTERCEPT) ne arata ca functia de regresie intersecteaza axa Oy in punctual 142.5094 b1 ne indica cresterea capacitatii de cazare turistica in functiune cu 1.9218 in cazul in care numarul sosirilor creste cu o unitate. b2 ne arata ca la o crestere cu o unitate a numarului innoptarilor,capacitatea de cazare turistica in functiune creste cu o 2.7274.

Estimarea parametrilor modelului de regresie multifaclorial prin intervale de increderePentru 0 :

-8.1158 0 293.134Pentru 2:

0.7926 1 3.0511Pentru 2:

2.3003 2 3.1545Testarea semnificatiei corelatiei (r x/y)Se stabilesc ipotezele dupa cum urmeaza:H0: r x/y = 0 (coeficientul de corelatie nu este semnificativ din punct de vedere statistic) H1: r x/y 0 (coeficientul de corelatie este semnificativ din punct de vedere statistic)Se calculeaz testul statistic: = = 34.08tcalc > t critic se accespta H1 si se respinge H0 Cu o probabilitate de 95% putem afirma ca,coeficientul de corelatie nu este semnificativ statistic.Testarea semnificatiei raportului de corelatie ( R )Se stabilesc ipotezele dupa cum urmeaza:H0: R = 0 (raportul de corelatie nu este semnificativ din punct de vedere statistic) H1: R 0 (raportul de corelatie este semnificativ din punct de vedere statistic)

Se calculeaz testul statistic: F calc = * = * = 40 * = 1194.56F calc > F critic se accepta H1 si se respinge H0 Cu o probabilitate de 95% putem afirma ca raportul de corelatie este semnificativ din punct de vedere statistic.Testarea semnificatiei parametrului 0:Se stabilesc ipotezele dupa cum urmeaza:H0: 0= 0 (parametrul nu este semnificativ din punct de vedere statistic) H1: 0 0 (parametrul este semnificativ din punct de vedere statistic)Se calculeaz testul statistic:

t calc < t critic Se accepta H0 si se respinge H1 Cu o probabilitate de 95% putem afirma ca se accepta ipoteza conform careia coeficientul 0 nu este semnificativ din punct de vedere statistic.Testarea semnificatiei parametrului 1:Se stabilesc ipotezele dupa cum urmeaza:H0: 1= 0 (parametrul nu este semnificativ din punct de vedere statistic) H1: 1 0 (parametrul este semnificativ din punct de vedere statistic)Se calculeaz testul statistic:

t calc > t critic Se accepta H1 si se respinge H0 Cu o probabilitate de 95% putem afirma ca se accepta ipoteza conform careia coeficientul 1 este semnificativ din punct de vedere statistic.

Testarea semnificatiei parametrului 2:Se stabilesc ipotezele dupa cum urmeaza:H0: 2= 0 (parametrul nu este semnificativ din punct de vedere statistic) H1: 2 0 (parametrul este semnificativ din punct de vedere statistic)Se calculeaz testul statistic:

t calc > t critic Se accepta H1 si se respinge H0 Cu o probabilitate de 95% putem afirma ca se accepta ipoteza conform careia coeficientul 1 este semnificativ din punct de vedere statistic.Testarea validitatii modelului de regresiemultifacorialSe stabilesc ipotezele dupa cum urmeaza:H0: modelul nu este valid H1: modelul este validSe calculeaz testul statistic:

Deoarece Significance F < 0.05 putem afirma ca se accepta ipoteza conform careia modelul este semnificativ din punct de vedere statistic.

Testarea liniaritatii modelului de regresie (rx/y)

Coeficientul de corelaie liniar fiind definit n intervalul , rezult c valoarea obinut de 0,91 indic o foarte puternic corelaie liniar ntre cele dou variabile.

Testarea ipotezei de autocorelare a erorilor(Durbin-Watson)

= = 2.007

Lucrnd cu un prag de semnificaie , numrul variabilelor exogene fiind , iar numrul observaiilor , din tabela distribuiei Durbin-Watson se citesc valorile (pentru cazul ) i . d2=1.424 < d = 2.007 < 4-d2 =4-1.424=2.576 erorile sunt independente ccea ce inseamna ca nu exista fenomenul de autocorelare al erorilor.Testarea normalitatii erorilor(Jarque-Berra)Verificarea ipotezei de normalitate a erorilor se va realiza cu ajutorul testului Jarque-Berra, care este i el un test asimptotic (valabil n cazul unui eantion de volum mare), ce urmeaz o distribuie hi ptrat cu un numr al gradelor de libertate egal cu 2, avnd urmtoarea form:

~

Unde:S= coeficientul de asimetrie (skewness), ce msoar simetria distribuiei erorilor n jurul mediei acestora, care este egal cu zero, avnd urmtoarea relaie de calcul:

= 3.15K = coeficientul de aplatizare calculat de Pearson (kurtosis), ce msoar boltirea distribuiei (ct de ascuit sau de aplatizat este distribuia comparativ cu distribuia normal), avnd urmtoarea relaie de calcul:

= 11.59

~ devine:=42[ + ] = 42*(1.65+3.07)=42*4.73=198.59 J-B > ipoteza de normalitate a erorilor este respinsa.Daca numarul sosirilor si numarul innoptarilor va creste cu 10% fata de ultima valoare inregistrata putem estima capacitatea de cazare turistica in functiune inregistrand valori dupa cum urmeaza:

Pentru : x1.1 ; x2.1= 142.50 + 1.92* 251.13 + 2.72 * 1104.84 = 2951.84 x1.2 ; x2.2 = 142.50 + 1.92 * 63.58 + 2.72 * 158.29 = 1178.83 x1.3 ; x 2.3 = 142.50 + 1.92 * 315.69 + 2.72 8 * 547.69 = 1519.25 s.a.Pe baza ipotezei formulate anterior,cum capacitatea de cazare turistica in functiune urmeaza o distributie normal vom obtine :Pentru : x1.1 = 251.13 ; x 2.1 = 1104.84 y1 = 2951.84 x1.2 = 63.58 ; x2.2 = 158.29 y1 = 1178.83 x1.3 = 315.81 ; x 2.3 = 547.69 y1 = 1519.25