seminar1 econometrie

Upload: teodoraoana

Post on 25-Feb-2018

298 views

Category:

Documents


4 download

TRANSCRIPT

  • 7/25/2019 Seminar1 Econometrie

    1/13

    1

    Seminar 1 ECONOMETRIE (Silvia SPTARU)

    I) Elemente Recapitulative de Probabiliti i Statistic Matematic

    Variabile aleatoare.Variabila aleatoare este o mrime care poate lua orice valoare, necunoscut aprioric, depinznd de

    rezultatul efecturii unui anumit experiment, rezultat care este imposibil de precizat. Variabilaaleatoare este o funcie real definit pe mulimea , a evenimentelor elementare asociateexperimentului considerat. Orice funcie X, definit pe i care ia valori n mulimea numerelor reale, se numete variabil aleatoare.Variabila aleatoare ofer informaii privind valoarea numeric a mrimii msurate i informaii privindfrecvena de apariie a unei valori numerice ntr-un ir de valori.Variabilele aleatoare pot fi discrete sau continue.Variabila aleatoare discretare un numr finit de valori sau o mulime cel mult numrabil de valori.Repartiiasau distribuia de probabilitatea unei variabile aleatoare discrete se scrie sub forma unuitablou n care prima linie conine toate valorile posibile ale variabilei ( ix , ,...2,1=i ), iar a doua linie

    conine probabilitile de apariie ale acestor valori ( ii

    pxXP == )( , ,...2,1=i ).

    LL

    LL

    i

    i

    ppp

    xxxX

    21

    21: sau

    i

    i

    p

    xX: , unde Ii

    Probabilitatile care apar pe a doua linie sunt numere reale care satisfac dou conditii:1) 0ip pentru fiecare valoare ix

    2) 121 =++++ LL ippp

    Valoarea medie a unei variabile aleatoare discreteeste:

    ==Ii

    ii pxXE )(

    Proprietile mediei:......

    Dispersia(Variana) i abaterea standard a unei variabile aleatoare discrete sunt:== )()( XVarXD

    ===Ii

    iiIi

    ii pxxXPXEx222 )()()]([

    ==Ii

    ii px22 )(

    Proprietile dispersiei:......Variabila aleatoare continuare un numr infinit de valori-Funcia densitate de probabilitate. )(xf ..-Funcia de repartiie. =

  • 7/25/2019 Seminar1 Econometrie

    2/13

    2

    Coeficientul de corelaie dintre X i Y....

    Distribuii de probabilitate teoretice importante1) Distribuia Normal, cu parametrii i 2 ( ),(~ 2NX )

    Spunem c o v.a. are o distribuie normal de parametrii i i notm prin ),(~ 2NX , dacare funcia densitate de probabilitate (pdf) de forma

    2

    2

    1

    2

    1)(

    =

    x

    exf , 0,, > RRx .

    Distribuia normal este utilizat atunci cnd o caracteristic este supus unui numr mare de influenentmpltoare, de slab intensitate i independente unele de altele. Distribuia normal este cea maicunoscut distribuie continu folosit n statistic, pentru c: Numeroase variabile continue, folosite n afaceri, au distribuii care sunt asemntoare distribuieinormale. Distribuia normal poate fi utilizat pentru a aproxima diferite distribuii de probabilitate discrete. Distribuia normal ofer bazele pentru inferena statistic clasic, datorit relaiei sale cu teoremalimit central.

    Portretul lui Carl Friedrich Gauss (1777-1855) i celebra curb, pe bancnota german de 10 mrci.

    Funcia densitate de probabilitate a distribuiei normale cu media i abaterea standard areurmtoarele proprieti: Este simetric fa de dreapta = . Datorit simetriei, modul, mediana i media distribuieinormale sunt egale. Valoarea medie este cea mai probabil valoare a unei variabile cu distribuie

    normal. Cele mai multe valori ale acestei variabile sunt n mijlocul distribuiei. Media poate lua oricevaloare: negativ, pozitiv sau zero. Este unimodal: derivata lui )(xf este pozitiv pentru < , negativ pentru >x i zero numaidac =x Punctele = i +=x sunt puncte de inflexiune (unde derivata de ordinul doi este 0) Domeniul valorilor sale este de la la + , astfel nct fiecare interval de numere reale are oprobabilitate diferit de zero. Curba normal se extinde, fr a atinge axaOx, n ambele direcii, de la

    la + .

  • 7/25/2019 Seminar1 Econometrie

    3/13

    3

    O variabil aleatoare normal poate lua orice valoare pe dreapta real, astfel nct 1)( =

  • 7/25/2019 Seminar1 Econometrie

    4/13

    4

    Regula empiric #2Aria total de sub curba de distribuie normal este egal cu 1:90% din arie este ntre 1.645 abateri standard de la medie

    95% din arie este ntre 1.960 abateri standard de la medie99% din arie este ntre 2.575 abateri standard de la medie

    Teorema Limit Centralconstituie baza teoretic pentru larga aplicabilitate a distribuiei normale.Dac dintr-o populaie se extrag, n mod aleator, eantioane de volum n, pentru valori mari ale lui n,mediile eantioanelor sunt repartizate aproximativ normal.1) Dac ),(~ 2NX , atunci )/,(~ 2 nNX 2) Dac X este distribuit aproximativ normal, atunci media eantioanelor va fi distribuit normal chiari pentru valori mici ale lui n.

    Rezult c variabila )1,0(~

    /

    )(N

    n

    XXEXZ

    X

    =

    = cnd n .

    Calculul probabilitilor:

    a) b)a)Aria A1(aria din stnga lui 1,96) este egal aria A2(aria din dreapta lui +1,96).Aria din dreapta lui +1,96 este egal cu 1 minus aria de la stanga lui +1,96b)Aria A2(aria din stnga lui 0,0) este egal cu 0,5.Aria din stnga lui 0,67 este egal cu 0,5 (aria A2) plus aria de la 0,0 la 0,67 (aria A1).

  • 7/25/2019 Seminar1 Econometrie

    5/13

    5

    2) Distribuia Hi-ptratcu ngrade de libertate - 2n

    Este obinut direct din variabile aleatoare cu distribuie normal standard.

    Teorem: Fie )1,0(~NZi , ni ,1= . Atunci v.a.22 ~ niZX =

    n corespunde numrului de termeni din sum.

    O v. a. cu distribuie Hiptrat este totdeauna nenegativ i graficul lui )(xf nu este simetric. Forma sagrafic, asimetric spre dreapta, depinde numai de numrul gradelor de libertate.Distribuia Hiptrat se folosete pentru c apar frecvent situaii n care intervin sume de ptrate de v.a.independente una de alta, urmnd fiecare o distribuie normal.Exist tabele care dau funcia de repartiie Hiptrat.

    Teorem: Variabila2

    2)1(

    snU

    = are o distribuie 2 cu (n-1) grade de libertate.

    3) Distribuia Student nSt~ (sau notat ntt~ )

    Este folosit n statistica clasic i analiza de regresieObinem o v.a. cu distribuie Student dintr-o variabil normal standard i una Hi-ptrat.Teorem: Fie )1,0(~NZ i 2~ nX v.a. independente. Atunci variabila aleatoare

    nXZt /= are o distribuie Student cu ngrade de libertate (df=n).Densitatea de repartiie are o form similar cu cea a distribuiei normale standard i converge spredistribuia normal standard pe msur ce numrul gradelor de libertate crete.

  • 7/25/2019 Seminar1 Econometrie

    6/13

    6

    La distribuia Student se ajunge n cazul sondajelor de volum mic, n sensul c n relaia

    )(XEXZ

    = nlocuim abaterea medie ptratic cu estimaia sa (s ) din eantionul de date, iar

    variabila standardizat care rezult estes

    XEXt

    )(= .

    Distribuia Student este indicat n situaia n care dispersia n populaia studiat nu este cunoscut i

    este nlocuit cu estimaia acesteia.Ne referim la distribuia Student n cazul: stabilirii intervalelor de ncredere pentru estimaii verificrii semnificaiei estimaiilor obinute pentru parametrii funciei de regresie (testul t).

    Teorem: Variabilans

    Xt

    /

    = are o distribuie Student cu (n-1) grade de libertate.

    4) Distribuia F(Fisher-Snedecor)Se folosete n testarea ipotezelor n analiza de regresie multifactorial.

    Teorem: Fie dou v.a. independente:

    2

    1 1~ nX i

    2

    2 2~ nX . Atunci, v.a.

    )/(

    )/(

    22

    11

    nX

    nXF= are o distribuie F cu ),( 21 nn grade de libertate.

    Notm21 ,

    ~ nnFF

    Ordinea gradelor de libertate este critic

    1n este asociat cu variabila de la numrtor

    2n este asociat cu variabila de la numitor. Distribuia F este asimetric la dreapta. Ptratul unei v.a. nt are o distribuie nF,1 . Simbolic, nn Ft ,1

    2 =

    II)INFERENA STATISTIC

    Prin inferen statistic se nelege obinerea de concluzii bazate pe o eviden statistic, adic peinformaii obinute dintr-un eantion. Concluziile sunt asupra caracteristicilor populaiei din careprovine eantionul. Estimarea este operaia de stabilire, n baza datelor unui eantion, a valorilor parametrilor repartiiei

    populaiei din care a fost extras eantionul.Estimarea poate fi

    1) Estimare punctual inferena asupra unei populaii statistice pe baza unui singure valori2) Construirea unui interval de ncredere inferena asupra unei populaii statistice pe baza construiriiunui interval (n termeni de probabilitate)

  • 7/25/2019 Seminar1 Econometrie

    7/13

    7

    Testarea ipotezelor statisticeDeterminarea parametrului unuei populaii pe baza statisticii unui eantion

    ESTIMAREAPutem avea estimare punctualsau estimare prin interval de ncredere.

    Inferena statistic implic trei distribuii asociate cu caracteristica studiat: distribuia populaiei = distribuia pe care o are caracteristica studiat (sau v.a. asociat ei) npopulaie. Aceast distribuie nu este, n general, cunoscut. Scopul unei cercetri este tocmai acela dea studia aceast distribuie. distribuia eantionului= distribuia pe care o are caracteristica studiat n eantionul disponibil nstudiu. Aceast distribuie este cunoscut complet, deoarece toate datele necesare sunt msurate. distribuia de sondaj a unei statistici = distribuia pe care o are statistica n mulimea tuturoreantioanelor de volum dat. Aceast distribuie nu este cunoscut.ntre distribuia populaiei i distribuia de sondaj exist legturi bine precizate. Datorit unor teoremede limit central, se cunoate forma acestei distribuii atunci cnd volumul eantionului crete (tindespre infinit).

    Inferena statistic urmeaz, n general, urmtorul algoritm: se obine, printr-un procedeu valid, un eantion; se calculeaz o valoare tipic a eantionului (o statistic de sondaj); din considerente teoretice, se cunoate repartiia din care provine aceast valoare tipic i relaiarepartiiei de sondaj a statisticii cu valoarea tipic din populaie; utiliznd repartiia de sondaj a statisticii se pot face evaluri ale erorilor de estimaie.

    Estimarea punctualConsiderm o populaie caracterizat de o v.a. teoretic X, care are o lege de probabilitate cunoscut,

    ),( xf , dar este un parametru necunoscut.Prin parametrual unei populatii ntelegem un numr ce descrie, ntr- un anumit sens, populatia.

    Extragem o selecie aleatoare )...,,( ,21 nXXX din populaie (din distribuia de probabilitate cunoscut)i folosim datele din eantion pentru a estima parametrii necunoscui.

    )...,,( ,21 nXXXf= se numete statisticsau estimator.O valoare numeric particular:

    )...,,( ,21 nxxxf= este o estimaiea parametrului real .

    Menionm c poate fi tratat ca o v.a. deoarece este o funcie de datele de selecie.Estimarea punctualfurnizeaz o singur valoare (estimaie ) a lui .Estimatori punctuali se obin prin MCMMP i prin metoda verosimilitii maxime.Proprieti ale estimatorilor s.n. estimator nedeplasatpentru parametrul dac =)(E

    este estimator liniaral lui dac este o funcie liniar de datele de observaie. este estimator eficiental lui dac este estimator de varian minim.

    s.n. estimator asimptotic nedeplasat al lui dac =

    )(lim nn

    E , unde n nseamn c

    estimatorul este bazat pe o selecie de volum n.Estimator BLUEeste cel mai bun estimator liniar i nedeplasat al parametrului real

    este estimator consistental lui dac aproximeaz valoarea real atunci cnd volumul selecieicrete indefinit. Consistena este o proprietate a eantioanelor mari.

  • 7/25/2019 Seminar1 Econometrie

    8/13

    8

    Notaii:Indicatorul Populaia general Eantion

    MediaXNi i= =1

    n

    xx

    ni i= =1

    Variana (Dispersia)XNi i = =1

    22 )(

    1

    )(12

    2

    = =

    n

    xxs

    ni i

    Abaterea medie ptratic 2= 2ss=

    Exemplu: cazul mediei aritmetice.Considerm o populaie statistic i o caracteristic continu X cu parametrii =)(XE i

    2)()( == XVarXD . Repartiia variabilei X este necunoscut (deci nu sunt cunoscute , , forma

    distribuiei). Din populaia respectiv se extrage un eantion de volum n. Fie acesta ),...,,( 21 nxxx , i se

    calculeaz media aritmetic . Este evident c se dorete ca aceast valoare s fie utilizat ca estimaiea mediei a populaiei.

    Repartiia de sondaj a mediei este caracterizat prin: media este =)(XE i variana este

    nXVar 2)( = . Variabila Xare o repartiie aproximativ normal, adic ),(~ 2 nNX .Media aritmetic Xeste estimator nedeplasatpentru media populaiei , abaterea standard s esteestimator nedeplasat pentru abaterea standard a populaiei, .Utiliznd repartiia normal, se pot calcula probabilitile cu care pot aprea diverse erori, ajungndu-se la afirmaii probabiliste de genul:

    6827,0)|)(| =

  • 7/25/2019 Seminar1 Econometrie

    9/13

    9

    Dac vom construi intervaluln

    X 96,1 , putem spune, cu o ncredere de 95% c astfel de intervale

    vor conine valoarea real a mediei populaiei. Un astfel de interval este aleator deoarece este bazat pemedia X, care va varia de la eantion la eantion.

    Considerm pragul de semnificatie 05,0= . Dac dispersia 2 este cunoscut, intervalul de

    ncredere pentru media populaiei este: )(22 n

    zXn

    zX

    + .

    ( Definiie: Dac )1,0( se numete cuantil de rang a repartiiei normale standard Z, un numr

    z cu urmtoarea proprietate: =< 1)( zZP , sau => )( zZP . Exist tabele care dau

    => )( zZP i 2/)( 2/ =>zZP ).

    Dac vom construi 100 de astfel de intervale, 95 din cele 100 intervale vor include valoarea real a lui . Cu alte cuvinte, 95% dintre eantioane vor produce estimri corecte, iar 5% vor produce estimrigreite (adic 5% este riscul de a grei bazndu-ne estimarea lui pe un eantion).Ipoteza c variana populaiei este cunoscut nu este plauzibil. Mult mai plauzibil pare ipotezac, atunci cnd media nu este cunoscut, nici variana nu este cunoscut. Putem s nlocuim pe cu abaterea standard de selecie s , obinut din datele ce provin dintr-un eantion. ns, dac facemaceast nlocuire, apare o dificultate suplimentar: distribuia valorilor medii provenite din eantioanenu mai este normal!

    Obinerea intervalelor de ncredere pentru media , pe baza distribuiei Student.tim c

    ns

    Xt

    /

    = urmeaz o distribuie Student cu 1n grade de libertate.

    Dac dispersia 2 nu este cunoscut, un interval de ncredere pentru media populaiei este

    )(1;

    21;

    2 n

    stX

    n

    stX

    nn +

    TESTAREA IPOTEZELOREstimarea i testarea ipotezelor constituie cele dou ramuri ale inferenei statistice clasice.Testarea ipotezelor statistice reprezint o alt modalitate, alturi de estimaia pe interval de ncredere,

    de a realiza inferena statistic.Scopul acestui tip de inferen este s determinm dac exist suficiente dovezi statistice care s ne

    permit s concluzionm c o afirmaie (sau o ipotez) despre un parametru este adevrat.n urma extragerii unui eantion dintr-o populaie statistic se obine un estimator al parametruluiurmrit n populaia general.Estimatorul reprezint o presupunere asupra parametrului, deci o ipotez statistic.

  • 7/25/2019 Seminar1 Econometrie

    10/13

    10

    Presupunem c avem o v.a. X, avnd o pdf cunoscut ),( xf , unde este parametrul distribuiei.

    Avnd o selecie aleatoare de volum n, obinem estimatorul punctual .Parametrul real este necunoscut.ntrebare: H0: 0= ?Ar putea eantionul nostru s provin dintr-o distribuie avnd ),( 0=xf ?Ipoteza nul H0este testat contra ipotezei alternative H1: 0

    Ipotez nul (H0) = const n faptul c admitem caracterul ntmpltor al deosebirilor, adicpresupunem c nu exist deosebiri eseniale.Ipotez alternativ (H1) = este o teorie care contrazice ipoteza nul. Ea va fi acceptat doar cndexist suficiente dovezi pentru a se stabili c este adevrat.Testul statisticeste utilizat drept criteriu de acceptare sau de respingere a ipotezei nuleRegiunea critic, Rc= valorile numerice ale testului statistic pentru care ipoteza nul va fi respins.Rceste aleas astfel nct probabilitatea ca ea s conin testul statistic, cnd ipoteza nul este adevrats fie , cu mic (=0.01etc).Dac valoarea testului cade n regiunea critic Rc, respingem ipoteza H0, iar dac este n afara regiuniicritice Rc, acceptm ipoteza H0.Regiunea critic este delimitat de o valoare critic.n luarea deciziei de acceptare sau de respingere a ipotezei H0se pot comite 2 tipuri de erori:Eroare de genul nti= eroarea pe care o facem dac respingem ipoteza nul, dei este adevrat.Riscul de genul nti() = probabilitatea comiterii unei erori de genul nti; se numete nivel sau pragde semnificaie.Eroare de genul al doilea= eroarea pe care o facem dac acceptm ipoteza nul, dei este fals.

    )adev.|Hresping( 00 == HP este risc de genul nti (nivel de semnificaie)

    )fals|Haccept( 00 == HP este risc de genul al doilea

    Decizia de acceptareIpoteza adevrat

    H0 H1

    H0 Decizie corect(probabilitate 1-)Eroare de gen II

    (risc )

    H1Eroare de gen I

    (risc )Decizie corect

    (probabilitate 1-)

    Etape n testarea ipotezelor:1) Se formuleaz ipoteza nul i ipoteza alternativ

    Ipoteza nul (H0) se refer la afirmaii supuse testrii. Ea specific ntotdeauna o singurvaloare a parametrului populaiei i reprezint ceea ce este acceptat pn se dovedete a fi fals.Ipoteza alternativ (H1) se refer la afirmaii care vor fi acceptate dac se respinge ipoteza nul.

    2) Se calculeaz indicatorii statistici n eantion

    3) Se determin testul statistic ce va fi utilizat drept criteriu de acceptare sau de respingere a ip. nule.4)Se stabilete regiunea critic, Rc. Regiunea critic reprezint valorile numerice ale testului statistic

    pentru care ipoteza nul va fi respins.5)Se stabilete regula de decizie:

    a) dac valoarea numeric a testului statistic caden regiunea critic (Rc), respingem ipotezanul i acceptm c ipoteza alternativ este adevrat.

    b) dac valoarea numeric a testului nu cade n regiunea critic (Rc), acceptm ipoteza nul.

  • 7/25/2019 Seminar1 Econometrie

    11/13

    11

    Testarea ipotezei privind media populaiei

    Testul bilateral Testul unilateral dreapta Testul unilateral stnga

    00 : =H 00 : =H 00 : =H

    01 : H 01 : >H 01 : ZZR calcc >: ZZR calcc ncalcc ttR 1;: < ncalcc ttR

    Exemplu: Presupunem ))5,2(,(),(~ 22 NNXi = , 67=x , 05,0= i n=100.

    Ipotezele de testat sunt:69: 00 ==H ;

    69:1 H Ar putea selecia cu 67=x , statistica testului calculat, s provin dintr-o populaie cu valoarea mediede 69? Nu putem respinge H0dac 67=x este suficient de aproape de 690 = . Cum putem decide

    dac 67=x este suficient de aproape de 690 = ? Avem dou abordri:

    1) Abordarea testului de semnificaien orice aplicaie i n sunt cunoscui (sau pot fi estimai) dar i sunt necunoscui.

    Dac este cunoscut i noi presupunem (sub H0) c 0= , atunci variabilelen

    XZi

    /

    = pot fi

    calculate direct i putem gsi, din tabelele distribuiei N(0,1), probabilitatea de a obine valoareacalculat a lui Z:

    n

    xZcalc

    /0

    = .

    Dac aceast probabilitate este mai mic dect =0,05 vom respinge H0.

  • 7/25/2019 Seminar1 Econometrie

    12/13

    12

    690 = 8100/5,2

    6967=

    =calcZ .

    96,1025,02/ === ZZZtab , 96,1025,02/ === ZZZtab

    Respingem H0dac 2/ZZcalc < sau 2/ZZcalc > (zonele haurate reprezint regiunea critic)

    Geometric, vedem regiunea de acceptare i cea de respingere a ipotezei H 0.Deoarece avem 2/ZZcalc < ( 96,18 3) sau P(Z

  • 7/25/2019 Seminar1 Econometrie

    13/13

    13

    Dac nivelul de semnificaie este , atunci regiunea critic, sau de respingere a ipotezei nule:

    1;2/: < ncalcC ttR sau 1;2/ > ncalc tt

    1;: > ncalcC ttR

    1;: < ncalcC ttR

    Problem: La o fabric, un anumit sortiment de chifle trebuie s cntreasc 65g. Inspectorii decalitate vor s verifice acest lucru i selecteaz aleator un eantion de 12 chifle. Sunt notate greutile:55, 62, 54, 58, 65, 64, 60, 62, 59, 67, 62, 61.Exist suficiente dovezi s afirmm, la un nivel de semnificaie de 5%, c greutatea chiflelor nu estecea standard (corect)?

    Variabila de interes este: X greutatea unei chifle presupunem c are o distribuie normal

    n urma efecturii calculelor, s-au obinut == nxxi / 60,75 i =s 3,8406

    Greutatea medie ipotetic : =0 65Greutatea medie din eantion: = 60,75Pragul de semnificaie: 05,0= Ipotezele de testat sunt:

    == 00 : H 65;

    :1H 65

    Valoarea critic: )1;(20,211;025,01;2/ ==== nTINVttt ncrt

    Valoarea testului: =

    =

    =

    12/8406,3

    6575,60

    /

    0

    ns

    xtcalc

    -3,83

    Verificarea: 20,283,3 1;2/ =