subiecte rezolvate econometrie 20015

15
CURS De studiat: 1. Componentele unei serii cronologice: definiție, mod de calcul, interpretare 2. Determinarea trendului unei serii cronologice cu sezonalitate, desezonalitatea unei serii cronologice. Problema: Despre exportul si importul RO se cunosc datele: Exportul (mld Euro) Importul (mld Euro) 10,36 11,38 11,38 14,35 14,67 17,42 15,61 19,56 18,93 24,25 22,25 30.06 a) Să se estimeze parametrii modelului simplu de regresie si să se determine variabila reziduală (variabila eroare) b) Să se valideze modelul de regresie pentru un nivel de semnificație de 5% F critic=7,71 (Atentie, F crititc e acelasi cu F Tabelar) c) Măsurați intensitatea legăturii directe dintre cele 2 variabile folosind un indicator adecvat și testați semnificația acestuia pentru o probabilitate de 95%; T critic=2,77 d) Să se testeze semnificația parametrilor și să se interpeeteze valorile; T critic=2,77. Regresie – ne spune daca exista sau nu legatura intre variabile Corelația-se foloseste pentru a vedea cat de puternica este legatura intre doua variabile si pentru a studia un model de regresie Modelul de regresie are la baza 1 sau mai multe ecuatii- un model matematic care exprima dependenta variabilelor complexe de un ansamblu de factori Ecuatia de baza pentru un model unifactorial este y = f(x) + e

Upload: stuffyx

Post on 15-Sep-2015

805 views

Category:

Documents


58 download

DESCRIPTION

econometrie ase 2015

TRANSCRIPT

CURS

De studiat: 1. Componentele unei serii cronologice: definiie, mod de calcul, interpretare 2. Determinarea trendului unei serii cronologice cu sezonalitate, desezonalitatea unei serii cronologice.

Problema:Despre exportul si importul RO se cunosc datele:Exportul (mld Euro)Importul(mld Euro)

10,3611,38

11,3814,35

14,6717,42

15,6119,56

18,9324,25

22,2530.06

a) S se estimeze parametrii modelului simplu de regresie si s se determine variabila rezidual (variabila eroare)b) S se valideze modelul de regresie pentru un nivel de semnificaie de 5% F critic=7,71 (Atentie, F crititc e acelasi cu F Tabelar)c) Msurai intensitatea legturii directe dintre cele 2 variabile folosind un indicator adecvat i testai semnificaia acestuia pentru o probabilitate de 95%; T critic=2,77d) S se testeze semnificaia parametrilor i s se interpeeteze valorile; T critic=2,77.

Regresie ne spune daca exista sau nu legatura intre variabileCorelaia-se foloseste pentru a vedea cat de puternica este legatura intre doua variabile si pentru a studia un model de regresieModelul de regresie are la baza 1 sau mai multe ecuatii- un model matematic care exprima dependenta variabilelor complexe de un ansamblu de factoriEcuatia de baza pentru un model unifactorial este y = f(x) + eY e variabila dependent, endogen- depinde de 1 sau mai multi factorif(x)- variabila independent- exogenae- variabila rezidualaEcuatia este la nivelul esantionului (care se extrage din populatie)Este unifactorial deoarece are o variabila X

AplicatiePentru un magazin se cunosc vanzarile de camasi barbatesti si profitul obtinut pentru 8 zile consecutiveNr. camasi vandute (bucati)Profitul

330

442

110

662

112

230

221

528

a) Sa se stabileasca existenta, forma si directia dintre cele doua variabile.Acest lucru se realizeaza cu metoda grafica (diagrama sau graficul de corelatie)

=> legatura directa (ambele variabile cresc sau scad in acelasi sens) si liniarab) sa se determine modelul de regresie calculand valorile ajustate ale profitului in functie de vanzareModelul de regresie se afla cu sistemul de ecuatii

= 5.75=7.875 > 0 => legatura este directa si liniara- ambele variabile cresc si scad in acelasi sens ; la cresterea numarului de camasi vandute cu 1 unitate, profitul creste cu 7.875 unitati monetare in medieValorile ajustate se afla calculand pentru fiecare variabila nr. de camasi

Nr. camasi vandute (bucati)xProfituly

3305.75 + 7.875 * 3=

4425.75 + 7.875 *4

1105.75 + 7.875 *1

6625.75 + 7.875 *6

1125.75 + 7.875 *1

2305.75 + 7.875 *1

2215.75 + 7.875 *1

5285.75 + 7.875 *5

c) Sa se verifice semnificatia si validitatea modelului de regresie determinat la punctul anterior folosind criteriul Fischer, adica testul F pentru un factor de semnificatie alfa = 5%. Ftabelar = 5,99Defapt aici ne intereseaza sa aflam F calculat in final, ca sa il comparam cu F tabelar si sa determinam daca modelul e sau nu valid; probabilitatea de a fi sau nu valid se detrimna scazand din 100% pe .Ca pasi: calculam , apoi abaterile, apoi variantele, apoi nr gradelor de libertate, dispersiile corectate si in final pe F calculat., ca sa il comparam cu F tabelar.

abatere totala (variatia neexplicata de modelul de regresie) abatere reziduala abatere sistematica (variatia explicate demodelul de regresie) = 29,374 nivelul mediu al profituluiPe baza abaterilor se calculeaza indicatorii- variante -> suma patratelor- variana total: - variana rezidual: - varianta sistematica: - numarul gradelor de libertate- k = 1 -> pentru varianta sistemica, nr variabilelor independente (k = 1 pt. ca avem un singur x)- n k 1 -> pentru varianta reziduala- n 1 -> pentru varianta totala- dispersiile corectate- - - Fcalculat = -> Ipoteze:- ipoteza nula -> modelul nu este valid din punct de vedere statistic- ipoteza alternativa = not -> modelul este valid

Sursa variatiei Suma patratelor calc. cu ajut. variantelorNr. gradelor de libertateMedia patratelorFcalculat

Din interiorul grupelor explicata de modelk = 1

Dintre grupen k 1 = 6

Totaln 1 = 7

0.3952.5662.02

159.39805.14185.64

375.391849.002809.00

1064.392340.14185.64

301.8990.25462.25

0.3972.25462.25

70.14582.022036.27

1.89495.0633.06

Fcalculat > Ftabelar si concluzia: pentru o probabilitate de 95% (100 ) exista suficiente dovezi pentru a afirma ca modelul este valid d.p.d.v. statistic, iar variabila nr. camasi vandute are o influenta semnificativa asupra variabilei profit.d) Sa se masoare intensitatea legaturii dintre variabile folosind coeficientul de corelatie liniara, testati semnificatia acestuia pentru un nivel de semnificatie de =5%. Ttabelar = 2,74- Asta nu e musai dar nu stric s aruncai o privire

abaterea standard a variabilei x abaterea standard a variabilei y= 0,86; semnul pantei ne da semnul lui r; dc e negativ trecem direct in fata lui rTestarea semnificatiei coeficientului de corelatie se face cu testul Student (testul T) cand avem un esantion redus, altfel se face cu testul Z sau Laplace.Ipoteze:

Tcalculat = test Student = =4.28Tcalculat > Ttabelar => pentru o probabilitate de 95% (100 ) exista suficiente dovezi pentru a aprecia ca coeficientul de corelatie liniara este semnificativ, adica exista suficiente dovezi pentru a respinge ipoteza nula.e) Sa se masoare intensitatea legaturilor dintre cele doua variable prin raportul de corelatie; sa se testeze semnificatia acestuia pentru =5%; sa se arate ce pondere din variatia totala a profitului este explicata de influenta numarului de camasi vandute. Ftabelar = 5,99 = 0,85 => regresia e liniara => leg. puternicaPonderea din variatia totala se calculeaza cu:Aici nu cred ca e cu 1- = 0,74 => 74% din variatia profitului este explicata de influenta numarului de camasi, iar 26% este influenta exercitata de alti factori considerati cu actiune constanta, neinclusi in modelul de regresieTestarea semnificatiei se realizeaza cu ajutorul criteriului Fischer, adica testul F. : R = 0 -> nesemnificativ : R 0 -> semnificativFcalculat = = 17,07Ftabelar = 5,99Fcalculat > Ftabelar => pentru o probabilitate de 95% (100 ) exista suficiente dovezi ca raportul de corelatie este semnificativ statistic (H1)f) Sa se determine intervalul de incredere pentru un nivel de semnificatie de 5%, Ttabelar = 2,24- Nici asta nu trebuie neaprat, dar poate aruncai o privire- trebuie sa aflam: pe Sb1 si pe Se ca sa le inlocuim in formula b1 l-am aflat in ecuatia de regresie deviatia standard (abaterea medie) ; pe l-am aflat mai sus

Trebuie sa calculam X mediu; este egal cu suma din nr de camasi vandute/numarul de camasi; adica (3+4+1+6+1+2+2+5)/8=24/8=3Apoi calculam (xi-) ca sa aflam suma care ne trebuie in formula de mai jos-nr de camasi

3

4

1

6

1

2

2

5

deviatia standard (abaterea medie)= 8,99 =>= 4,897,87 2,44 * 4,89 7,87 + 2,44 * 4,89Datorita faptului ca limita inferioara a intervalului este negativa iar limita superioara este pozitiva inseamna ca intervalul provine dintr-o populatie in care nu este semnificativ.

= 6,3575,75 4,28 * 6,357 5,75 + 4,28 * 6,357Datorita faptului ca limita inferioara a intervalului este negativa iar limita superioara este pozitiva inseamna ca intervalul provine dintr-o populatie in care nu este semnificativ

Testarea ipotezelor statisticeUn test statistic reprezinta un procedeu de verificare a unei ipoteze statistice. Ipoteza statistica este ipoteza care se face cu privire la parametrii unei repartitii (media si dispersia), sau la legea de repartitie pe care le urmeaza anumite variabile. In statistica exista 2 ipoteze:- : ipoteza nula, ce urmeaza a fi testata, ce presupune ca nu exista diferente semnificative intre valorile comparate- : ipoteza alternativa, care neaga sau contrazice In urma aplicarii ipotezei statistice apar 2 tipuri de erori:- eroare de genul I, eroarea care se face eliminand ipoteza adevarata considerand ca este falsa. Probabilitatea aparitiei se cheama risc si se noteaza - eroare de genul II, eroare pe care o facem acceptand cand ea este falsa. Probabilitatea comiterii se noteaza Nivelul de incredere al unui test se noteaza 1- si reprezinta probabilitatea de succes (sau de garantare). Regiunea critica reprezinta valorile tabelare ale unui test statistic pentru care va fi respinsa (zona hasurata).Etapele privind testarea ipotezei statistice:1. se stabileste 2. se stabileste 3. se stabileste testul statistic ce va fi utilizat ca si criteriu de acceptare, refuzare , precum si nivelul de semnificatie al testului4. se determina indicele statistic din esantion5. se determina valoarea calculata a testului statistic si se stabileste regiunea critica6. se desprind concluziile si anumea. daca valoarea numerica a testului apartine regiunii critice atunci se respinge b. daca valoarea numerica nu apartine regiunii critice atunci exista dovezi sa acceptam Ipoteza poate avea una din forme daca se testeaza egalitatea parametrului media colectivitatii generale cu o valoare prestabilita (ipotetica).Vom nota cu = media colectivitatii generale (sau media populatiei) = valoarea ipotetica (prestabilita) = dispersia la nivelul populatiei = dispersia la nivelul esantionului = media esantionuluin = numarul de observatiiPentru Rcriticastanga: Tcalculat < TtabelarTest unilateral dreaptaH0 : = 0H1 : < 0Pentru Rcriticadreapta: Tcalculat > TtabelarTest unilateral stangaH0 : = 0H1 : > 0Pentru Rcriticastanga : Tcalculat < Ttabelardreapta: Tcalculat > TtabelarTest bilateralH0 : = 0H1 : 0

Reg. de acceptare H0=0

-+Regiunea critica H0Regiunea critica H0Valoarea tabelara=0

-+Reg. de acceptare H0Regiunea critica H0Valoarea tabelara-+

Regiunea critica H0Reg. de acceptare H0

=0

Valoarea tabelara

Testarea ipotezei privind media populatiei pentru esantioane de volum redus.In activitatea practica foarte multe decizii se iau pe baza unor date limitate (esantioane de volum mic, n 0 > 58950- etapa 3Deoarece n = 12 < 30 observatii => test unilateral dreapta? = 5% = 0.05- etapa 4Sx = 52000 = 62460 = Me = 62460 (serie perfect simetrica)- etapa 5Tcalculat = = 2,34- etapa 6Tcalculat > Ttabelar (2,34 > 1,79)=0

-+Reg. de acceptare H0Regiunea critica H01,79

2,32

Rezulta ca pentru o probabilitate de 95% exista suficiente dovezi pentru a aprecia ca valoarea locuintelor creste cu cat ele sunt mai aproape de acest colegiu deoarece valoarea calculata se gaseste in regiunea critica (de respingere H0).AplicatieConducerea unei companii apeleaza la 5 experti pentru a previziona profitul companiei in anul curent. Valorile previzionate, Xi : 2.60, 3.32, 1.80, 3.43, 2.00; miliarde de lei. Stiind ca profitul companiei in anul anterior a fost de 2.01 milioane de lei (=0), sunt suficiente dovezi pentru a concluziona ca media previziunilor expertilor este diferita de cifra anului anterior, pentru o probabilitate de 95% ? n=5, Ttabelar = 2.776- etapa 1H0 : = 0 = 2.01- etapa 2H1 : 0 2.01- etapa 3Deoarece n = 5 testul bilateral-, = 5% = 0.05

Reg. de acceptare H0=0

-+Regiunea critica H0Regiunea critica H0-2.776+2.7761.87

- etapa 4 = 2.63 = = 0.55 => S = = 0.74- etapa 5Tcalculat = = 1.874- etapa 6Tcalculat < Ttabelar (1.874 < 2.776)

Rezulta ca pentru o probabilitate de 95% apreciem ca exista suficiente dovezi pentru a a firma ca media profitului previzionata de cei 5 experti pentru anul curent nu este diferita de valoarea anului trecut.

Testarea ipotezei privind media populatiei generale () pentru esantioane de volum mareIn acest caz se vor utiliza esantioane de volum mare (n >= 30) avand la baza utilizarea functiei Gauss-Laplace. Testarea ipotezei se face pe baza mediei esantionului. Pentru a efectua testarea vom utiliza testul Z cu un nivel de semnificatie prestabilit.Zcalculat = Teste bilateralTest unilateral dreaptaTest unilateral stanga

Pentru Rcriticastanga : Zcalculat < Ztabelardreapta: Zcalculat > Ztabelar

Pentru Rcriticadreapta: Zcalculat > ZtabelarPentru Rcriticastanga : Zcalculat < Ztabelar

AplicatiePatronul unei firma de prestari servicii doreste sa fluidizeze servirea. Pana in prezent prezent presupune ca timpul mediu de servire este 130 min. (=0) si o abatere de 15 min. El este de acord cu abaterea dar se indoieste de faptul ca durata mediu de servire este de 130 min. Pentru a studiu problema se inregistreaza timpii de servire pentru 100 clienti, cu timpul mediu de 100 min. Poate patronul sa concluzioneze pentru o probabilitate de 99% ca timpul mediu este diferit de 130 min ? Ztabelar = 2.57- etapa 1H0 : = 0 = 130- etapa 2H1 : 0 130- etapa 3Deoarece n = 100 > 30 => test Z bilateral, = 1%- etapa 4S = 15 min = 120 min0 = 130 minn = 100- etapa 5Zcalculat = = -6.6-6.6+2.57-2.57Reg. de acceptare H0=0

-+Regiunea critica H0Regiunea critica H0

Rezulta ca pentru o probabilitate de 99% exista suficiente dovezi pentru a aprecia ca timpul mediu de servire difera de 130 minute, deoarece valoarea calculata se gaseste in regiunea critica.

AplicatieUn reporter se documenteaza pentru un articol privind costurile tot mai ridicate ale educatiei in mediul superior. Pentru aceasta a luat in considerare costul unui manual in semestrul in curs. In urma considerarii unui esantion de 41 manual a gasit ca = 550.22 u.m. si = 1617.984a) determinati media si abaterea mediei patratice a costului unui manualb) testati ipoteaza conform careia valoarea media a unui manual este mai mica decat (de aceea avem test unilateral stanga, pt ca este mai mica) 15 u.m. pentru un nivel de semnificatie = 1%- etapa 1H0 : = 0 = 15- etapa 2H1 : < 15 < 0- etapa 3Deoarece n = 41 > 30 => test Z unilateral stanga, = 1%- etapa 4 = 13.42 = 39.46 => S = 6.28- etapa 5Zcalculat = = -1.61Rezulta ca pentru o probabilitate de 99% exista suficiente dovezi pentru care valoarea medie nu este mai mica de 15 u.m. deoarece Zcalculat e in afara regiunii critice-1.61-2.33+-Regiunea critica H0