proiect econometrie final

Upload: doris-paraschiv

Post on 13-Jul-2015

313 views

Category:

Documents


4 download

TRANSCRIPT

1. Folosind tehnica verificrii ipotezelor statistice, stabilii dac exist vreo diferen semnificativ ntre preul caselor din zona Cotroceni i cel al caselor din zona Foiorul de Foc. Pentru a decide dac exista vreo diferenta semnificativa ntre preul caselor din zona Cotroceni i preul caselor din zona Foiorul de Foc, am aplicat testul privind diferena a dou medii pentru eantioane de volum mare,cu dispersii necunoscute,presupuse egale, t-Test for Two-Sample Assuming Equal Variances. Ipotezele folosite au fost :

H 0 : 1 3 = 0 H A : 1 3 03 reprezinta estimatorul diferenei dintre x1 i 3 , mediile unde 1 eantioanelor, preurile caselor din zona Cotroceni, si preurile caselor din zona Foiorul de Foc. Regula de decizie a acestui test este:

x

t < t critic = >acceptH 0 t t critic = >respingH 0 Dupa aplicarea testului t, s-a obinut variabila t stat = 5,6749. Deoarece 2, rezult :

t critic =

0 , asadar exist t stat = 5,6749> critic = 2 =>se respinge ipoteza nul diferen semnificativ ntre preul caselor din zona Cotroceni i din zona Foiorul de Foc.

t

H

t-Test: Two-Sample Assuming Equal Variances cotrocen i 389.849 3 14493.2 9 30 8758.01 8 0 58 5.67495 6 2.33E-07 1.67155 3 4.65E-07 2.00171 7 foisor de foc 252.723333 3 3022.74047 1 30

Mean Variance Observations Pooled Variance Hypothesized Mean Difference df t Stat P(T Fcrit = >respingH 0n urma aplicrii modelului ANOVA, am obinut variabila F=56. De asemenea,

Fcrit =3,101, rezult:

Fcalculat = 56 > Fcrit = 3,101 => se respinge ipoteza nul H 0 , ceea ce

inseamna ca mediile preurilor celor 3 zone prezinta diferente semnificative.Asadar zona este un factor semnificativ care influeneaza a preul vnzarii caselor. Anova: Single Factor SUMMARY Groups cotroceni p vict foisor

Count 30 30 30

Sum 11695.4 8 17806.4 7581.7

Average 389.849 3 593.546 7 252.723 3

Variance 14493.2 9 29743.1 4 3022.74

ANOVA Source of Variation Between Groups Within Groups Total

SS 176456 7 137051 6 313508 3

df 2 87 89

MS 882283. 4 15753.0 6

F 56.0071 2

P-value 2.33E16

F crit 3.10129 6

3. Alegei una dintre cele trei zone i stabilii dac suprafaa casei, suprafaa terenului, precum i numrul de camere influeneaz semnificativ preul de vnzare, construind pentru fiecare caz n parte cte un model de regresie liniar simpl. Am ales zona Piaa Victoriei pentru a putea observa dac suprafaa casei,

suprafaa terenului, precum i numrul de camere au vreo influenta semnificativa asupra preul. Forma general a unui model de regresie liniar este urmatoarea: Yi=b0 + b1*xi + i Unde: Yi, xi sunt valorile numerice ale variabilelor efect i cauz variabile nregistrate la nivelul unitii statistice i, iar b0 i b1 sunt parametrii ai ecuaiei de regresie. Pentru problema noastra, variabila efect este preul,in timpce variabilele cauzale sunt reprexentate de suprafaa casei, suprafaa terenului i numrul de camere, modelul general fiind: Pi = b0 + b1*Suprcasa + b2*Suprteren + b3*Nrcamere + i Acum vom arta ct de mult variabilele influenteaza preul caselor din Cotroceni. a) Suprafaa casei Pentru a putea gasi dependena dintre pre i suprafaa casei s-a realizat un grafic pentru determinarea tipului de legtur:pret-supr casei 1500 pretul 1000 supr casei 500 0 0 500 supr casei 1000

Aici se poate observa faptul c punctele reprezentate sunt grupate n jurul diagonalei principale, fapt care arata existena unei dependene liniare, directe ntre variabile. Deci, se poate afirma faptul c suprafaa unei casei influeneaz semnificativ i n aceeai direcie preul de vnzare al caselor din Piaa Victoriei.

SUMMARY OUTPUT Regression Statistics Multiple R 0,84029921 8 R Square 0,70610277 5 Adjusted R 0,69560644 Square 6 Standard Error 95,1505081 7 Observations 30

Interpretarea rezultatelor din tabelul SUMMARY OUTPUTIntensitatea legturii se stabilete cu ajutorul coeficientului de corelaie liniar (Multiple R). n acest caz, R=0,84, ceea ce arat c ntre pre i suprafaa casei

exist o legtur direct, puternic, suprafaa casei influennd foarte mult preul acesteia. Pentru a putea spune n ce msur modelul liniar de regresie explic dependena dintre variabile, se calculeaz coeficientul de determinaie (R-square). n cazul nostru, R2=0,70, deci 70% din variaia preului este explicat prin influena suprafeei casei asupra preului. Abaterea medie ptratic a erorilor (Standard Eror) = 95,1505 reprezint deviaia punctelor de la dreapta de regresie. Coeficientul de determinaie ajustat (Adjusted R Square) = 0,6956. ANOVA Regression Residual Total df 1 28 29 SS 609049,636 9 253501,337 8 862550,974 7 MS 609049, 6 9053,61 9 F 67,271 4 Significanc eF 0,00

Interpretarea rezultatelor din tabelul ANOVAValiditatea modelului de regresie se testeaz folosind testul F (Fischer). n tabelul ANOVA din Excel sunt calculate cele trei variaii: cea explicat de model, cea rezidual i cea total. Cu ajutorul acestora se calculeaz statistica F. n cazul nostru, F=67,271, iar Significance F (pragul de semnificaie) este 0,00 (valoare mai mic de 0,05) rezult c modelul de regresie construit este valid i poate fi utilizat pentru analiza dependenei dintre cele dou variabile. Coefficients Intercept supr casei 157,641773 0,611822103 Standard Error 55,9138779 5 0,07459503 6 t Stat 2,81936 8 8,20191 4 P-value 0,00873 7 0,00 Lower 95% 43,1073 9 0,45902 1 Upper 95% 272,176 2 0,76462 3

Interpretarea rezultatelor din tabelul SUMMARY OUTPUT: Intercept este termenul liber, deci coeficientul b0 este 157,641773, ce reprezint punctul n care dreapta de regresie intersecteaz axa y. Limitele inferioar i superioar ale intervalului de ncredere sunt 43,10739 = 1 = 72,1762. Coeficientul b1 este 0,611822103, ceea ce nseamn c la creterea cu un metru ptrat a suprafeei casei, preul va crete cu 0,61182 mii euro. Intervalul de ncredere pentru acest parametru este 0,459021 = 1 = 0,764623. n coloana Standard Error sunt calculate erorile standard ale parametrilor estimai: 55,91387795 pentru b0 i 0,074595036 pentru b1. Aceste erori sunt folosite pentru calculul statisticii t pentru testarea semnificaiei estimatorilor. Acestea sunt calculate n coloana tStat, t0=2,819368 i t1=8,201914. Deoarece valorile p asociate (P-value) sunt foarte apropiate de 0 (i 0,05 nseamn c acest coeficient este nesemnificativ. Faptul c limita inferioar a intervalului de ncredere pentru acest parametru este negativ, iar limita superioar este pozitiv (-64,6731= 1 = 25,54323), arat c parametrul din colectivitatea general este aproximativ 0. Coeficientul b1 este 0.08619, ceea ce nseamn ca la creterea cu 1 metru ptrat al suprafeei terenului, preul va crete cu 0.08619 mii euro. Deoarece t b1= 4.6606, iar pragul de semnificaie P-value este 0.00