mract curs 1 teoria estimatiei analizadate selectii

19
1. Elemente de teoria selecţiei 1.1. Orice cercetare statistică are drept punct de plecare o mulţime (numită colectivitate sau populaţie) alcătuită din elemente care au în comun o caracteristică generală şi care se diferenţiază prin valori diferite sau atribute. Elementele colectivităţii (populaţiei) le vom numi unităţi. Când se face studiul unei colectivităţi cel mai adesea suntem nevoiţi să ne limităm studiul la o parte finită, bine determinată din întreaga colectivitate. Ca atare, se pune întrebarea: dacă concluziile pe care le tragem concordă cu rezultatul pe care l-am obţine studiind întreaga colectivitate. Apare problema studiului modului în care valorile tipice (care stau la baza concluziilor) ale colectivităţii parţial studiate, pot furniza informaţii asupra valorilor tipice ale întregii colectivităţi. Vom presupune, în cele ce urmează, că urmărim o anumită caracteristică a colectivităţii generale şi că această caracteristică este descrisă de o variabilă aleatoare X definită pe un câmp de probabilitate , în care elementele mulţimii Ω sunt tocmai elementele colectivităţii generale, K este un corp borelian de părţi ale lui Ω, iar P este o probabilitate definită pe K. ( , , P Ω K ) Faptul că suntem obligaţi să cercetăm numai o anumită parte din populaţie este impus de natura concretă a colectivităţii. Astfel, dacă numărul elementelor populaţiei este infinit, în mod necesar vom cerceta doar un număr finit de unităţi şi drept urmare vom obţine o informaţie trunchiată. Chiar şi în cazul în care numărul unităţilor populaţiei este finit, atunci când cercetarea calităţii unităţilor conduce la distrugerea lor (exemplul unui lot de conserve îmbuteliate) evident că se impune alegerea unui număr finit pentru cercetare. Dacă vom ţine cont şi de faptul că orice cercetare implică şi anumite cheltuieli, rezultă clar că suntem obligaţi să cercetăm numai o parte din întreaga colectivitate. Vom numi selecţie (eşantion) o colectivitate parţială de elemente (unităţi) luate la întâmplare. Numărul elementelor dintr-o selecţie îl vom numi volumul selecţiei. Vom spune că o selecţie este repetată dacă elementul luat la întâmplare este reintrodus în colectivitatea generală, înainte de efectuarea următoarei extrageri. Selecţia se va numi nerepetată dacă elementele extrase la întâmplare nu se mai introduc în colectivitatea generală. Să considerăm o populaţie Γ , finită sau infinită, în sensul că este 1

Upload: bianca-ulrich

Post on 08-Nov-2015

8 views

Category:

Documents


0 download

DESCRIPTION

teoria estimatiei- actuariat

TRANSCRIPT

  • 1. Elemente de teoria seleciei 1.1. Orice cercetare statistic are drept punct de plecare o mulime

    (numit colectivitate sau populaie) alctuit din elemente care au n comun o caracteristic general i care se difereniaz prin valori diferite sau atribute.

    Elementele colectivitii (populaiei) le vom numi uniti. Cnd se face studiul unei colectiviti cel mai adesea suntem nevoii s ne limitm studiul la o parte finit, bine determinat din ntreaga colectivitate. Ca atare, se pune ntrebarea: dac concluziile pe care le tragem concord cu rezultatul pe care l-am obine studiind ntreaga colectivitate. Apare problema studiului modului n care valorile tipice (care stau la baza concluziilor) ale colectivitii parial studiate, pot furniza informaii asupra valorilor tipice ale ntregii colectiviti.

    Vom presupune, n cele ce urmeaz, c urmrim o anumit caracteristic a colectivitii generale i c aceast caracteristic este descris de o variabil aleatoare X definit pe un cmp de probabilitate

    , n care elementele mulimii sunt tocmai elementele colectivitii generale, K este un corp borelian de pri ale lui , iar P este o probabilitate definit pe K.

    ( , , P K )

    Faptul c suntem obligai s cercetm numai o anumit parte din populaie este impus de natura concret a colectivitii. Astfel, dac numrul elementelor populaiei este infinit, n mod necesar vom cerceta doar un numr finit de uniti i drept urmare vom obine o informaie trunchiat. Chiar i n cazul n care numrul unitilor populaiei este finit, atunci cnd cercetarea calitii unitilor conduce la distrugerea lor (exemplul unui lot de conserve mbuteliate) evident c se impune alegerea unui numr finit pentru cercetare. Dac vom ine cont i de faptul c orice cercetare implic i anumite cheltuieli, rezult clar c suntem obligai s cercetm numai o parte din ntreaga colectivitate.

    Vom numi selecie (eantion) o colectivitate parial de elemente (uniti) luate la ntmplare. Numrul elementelor dintr-o selecie l vom numi volumul seleciei.

    Vom spune c o selecie este repetat dac elementul luat la ntmplare este reintrodus n colectivitatea general, nainte de efectuarea urmtoarei extrageri. Selecia se va numi nerepetat dac elementele extrase la ntmplare nu se mai introduc n colectivitatea general.

    S considerm o populaie , finit sau infinit, n sensul c este

    1

  • format dintr-un numr finit sau infinit de uniti. Dac populaia este

    finit, vom nota cu N numrul unitilor ce o compun, iar N l vom numi

    volumul populaiei . Studiem populaia

    din punctul de vedere al unei proprieti X. Aceast proprietate, care variaz (n general) aleator de la o

    unitate la alta a populaiei o vom asimila cu o variabil aleatoare X i o vom

    numi variabil aleatoare teoretic definit pe populaia . Caracteristicile probabilistice ale variabilei aleatoare teoretice X le vom

    numi caracteristici teoretice, astfel:

    )(XMm = , media teoretic; )(2 XDD == , dispersia teoretic (notat i ( )2D X , aici 2 nu este

    putere);

    )( rr XMm = , momentul iniial de ordinul r, teoretic; ])[( rr mXM = , momentul centrat de ordinul r, teoretic.

    Cercetarea unitilor din populaia se poate face printr-o observare total sau parial.

    Cercetarea total (care se efectueaz de exemplu sub form de recensmnt) este o operaie complex, care de cele mai multe ori primete

    mai multe caracteristici ale unitilor, pentru a realiza o analiz

    multilateral. Practic, o cercetare total se recomand atunci cnd volumul

    populaiei nu este prea mare, pentru a evita cheltuieli ce pot depi

    avantajele concluziilor trase.

    Cercetarea parial (selectiv) se efectueaz asupra unei subpopulaii , subpopulaie de volum n. Variabila aleatoare asimilat caracteristicii studiate corespunztoare subpopulaiei de selecie este reprezentativ, ceea ce nseamn c n subpopulaia sunt reflectate proprietile ntregii populaii .

    2

  • Construirea eantionului (subpopulaiei de selecie) se face cu uniti din populaia , alese dup o anumit tehnic (dup anumite reguli)

    numit operaie de sondaj.

    n efectuarea unui sondaj ntlnim dou metode de baz:

    a) Sondaj cu revenire:

    Fiecare unitate de sondaj extras din pentru a fi studiat, se reintroduce n , dup cercetare, putnd deci s apar din nou n procesul

    de construcie al eantionului

    . Efectuarea sondajului cu revenire are ca

    schem probabilistic urna lui Bernoulli (urna cu bil revenit). n acest caz

    vom spune c s-a efectuat o selecie repetat de volum n. Sondajele astfel

    efectuate sunt echiprobabile, iar valorile de selecie astfel obinute sunt

    independente.

    b) Sondaj fr revenire:

    Fiecare unitate de sondaj extras din pentru a fi studiat nu mai este reintrodus n dup studiere (cercetare). Efectuarea sondajului fr

    revenire are ca schem probabilistic schema urnei cu bil nerevenit. n

    acest caz vom spune c s-a efectuat o selecie nerepetat de volum n.

    Aplicarea seleciei nerepetat nu are sens dect n cazul cnd volumul

    populaiei este finit. Valorile de selecie astfel obinute sunt dependente.

    Selecia repetat i selecia nerepetat sunt aplicate colectivitilor omogene.

    O colectivitate este omogen dac este constituit din elemente care sunt

    susceptibile de a avea sau de a nu avea caracteristica studiat, cu o aceeai

    pondere. n cazul cnd sondajul se efectueaz dintr-o populaie omogen, el

    se numete sondaj simplu (selecie simpl) .

    n cazul cnd populaia nu este omogen din punct de vedere al caracteristicii (al proprietii) cercetate dar poate fi mprit n subpopulaii

    , fiecare n parte omogen, ca nite straturi ale populaiei i , se va efectua

    3

  • aa numita selecie stratificat.

    Fie , o populaie de selecie de volum n. Valorile variabilei teoretice X pentru fiecare unitate din eantionul determin irul de valori

    . Considerate aposteriori, valorile observate sunt valori determinate ale variabilei aleatoare X. Privite apriori, valorile X

    nj XXXX ,...,,...,, 211, X2,.., Xn

    pot fi considerate ca variabile aleatoare independente, identic repartizate cu variabila X (n cazul unei selecii repetate). Deoarece participarea oricrei uniti din populaia la eantionul este echiprobabil (deoarece sondajul se face ntmpltor) , fiecare valoare din irul anterior se

    realizeaz n eantion cu aceeai probabilitate

    jX

    n1 . Astfel se construiete

    variabila de selecie *X , cu repartiia :

    nnnn

    XXXXX

    nj

    1111:21

    *

    Caracteristicile variabilei aleatoare de selecie *X , numite

    caracteristici de selecie, sunt:

    - media de selecie =

    ==n

    jjXn

    Xm1

    * 1 ;

    - dispersia de selecie (notat i 2n sau 2 )

    ==

    n

    jj XXn

    D1

    2* )(1

    (se numete dispersia de selecie nemodificat sau necorectat),

    avem i dispersia de selecie modificat (sau corectat)

    2

    1

    1 (1

    n

    jj

    s Xn =

    = 2)X ; precum i dispersia de selecie 2 2

    1

    1 (n

    jj

    )X mn

    =

    = , unde ( )m M X= .

    - momentul iniial de selecie de ordin r: =

    =n

    j

    rjr Xn

    m1

    * 1 (notat i cu

    rm sau cu rM );

    4

  • - momentul centrat de selecie de ordin r: =

    =n

    j

    rjr XXn 1

    * )(1

    (notat i cu r );

    - Coeficientul de variaie al seleciei: 2

    cvX=

    Eantionul , la rndul lui, are un aspect aleatoriu determinat n primul rnd de caracterul ntmpltor al sondajului. Prin urmare, efectund alte sondaje se obin alte eantioane i alte variabile aleatoare de selecie.

    Dac selecia este nerepetat, atunci variabilele X1, X2,.., Xn sunt dependente, dependena fiind de tipul lanurilor cu legturi complete.

    Dac volumul colectivitii generale este suficient de mare, iar volumul seleciei este destul de mic, deosebirea dintre o selecie repetat i una nerepetat este nesemnificativ i, ca atare, n aplicaiile practice, o selecie nerepetat se trateaz dup modelul seleciei repetate.

    Orice funcie de datele de selecie o vom numi funcie de selecie sau statistic.

    Vom introduce cteva funcii de selecie, spre exemplificare, pornind de la o selecie de volum n: X1, X2,.., Xn. S aezm n ordine nedescresctoare datele acestei selecii: ( ) ( ) ( )1 2 .. nX X X unde:

    ( ) { }1 21 min , ,.., nX X X= X i ( ) { }1 2max , ,.., nnX X X= X . Mulimea ( ) ( ) ( ){ }1 2, ,.., nX X X o vom numi statistic a ordinei, iar pe

    ( )rX statistic de ordine de rang r. Pornind de la statistica ordinei definim amplitudinea de selecie: ( ) ( ) ( )1 2 1, ,.., n nW X X X X X= .

    Un rol fundamental n statistica matematic l constituie funcia de selecie numit funcia de repartiie empiric (sau de selecie), definit prin

    ( ) , xn nF x xn= R , unde n este volumul seleciei, iar nx este numrul valorilor de selecie X1, X2,.., Xn mai mici dect x. Avem

    ( ) ( ) (,1

    1 nn kx

    kF x I X

    n == ) , unde ( ) ( ) ( ), 1 pentru ,0 n restx

    Y xI Y

    = . Se

    constat imediat c ( )nF x este o funcie de repartiie ca i

    5

  • ( ) ( )( : )F x P X x= < care este ns funcia de repartiie teoretic a variabilei aleatoare X.

    n cele ce urmeaz vom considera numai selecii repetate. Vom meniona, fr demonstraii dou teoreme ce constituie justificarea

    teoretic a metodei seleciei i anume teorema lui V.I.Glivenko (teorema fundamental a statisticii matematice) i teorema lui A.N. Kolmogorov.

    Teorema lui Glivenko Dac ( )F x este funcia de repartiie teoretic, iar ( )nF x funcia de

    repartiie empiric, atunci: ( ) ( )lim sup 0 1nn xP F x F x = = R

    Teorema lui Kolmogorov Dac funcia de repartiie teoretic ( )F x este continu, iar este

    funcia de repartiie empiric corespunztoare, atunci : ( )nF x

    ( ) ( ) ( ) ( ) 2 2lim sup 1 e , 0k knn x kP F x F x Kn =

    = = > R Rezult c teorema lui Kolomogorov d posibilitatea evalurii distanei

    dintre funcia de repartiie ( )F x i funcia empiric de repartiie . ( )nF x

    1.2. Momente de selecie (momente empirice) Printre cele mai importante caracteristici numerice de selecie se afl

    momentele de selecie. Acestea sunt n realitate funcii de selecie, cu care se opereaz atunci cnd nu se cunoate legea de repartiie a variabilei aleatoare X, din care s-a prelevat selecia.

    Definiia 1.2.1. Dac X1, X2,.., Xn este o selecie de volum n, atunci vom numi moment de selecie de ordin r, pe care-l vom nota rM , expresia:

    1

    1 n rr j

    jM X

    n ==

    Se nelege c rM este o variabil aleatoare. Pentru 1r = se obine media de selecie: 1

    1

    1 nj

    jM X X

    n == = .

    Definiia 1.2.2. Numim moment centrat de ordin r de selecie, notat r , expresia ( )

    =1

    1= -n r

    jrj

    X Xn

    . Pentru 2r = se obine dispersia de selecie necorectat:

    6

  • ( )222=1

    1= = -n

    jj

    X Xn

    Am numit 2 dispersia de selecie necorectat, pentru a o deosebi de

    ( 221

    11

    n

    jj

    s Xn =

    = )X , pe care o vom numi dispersie de selecie corectat. Proprieti: 1. Media momentului iniial de selecie de ordin r este momentul iniial teoretic de ordin r, adic ( ) ( )r r rM M M X m= = .

    Calculnd media variabilelor aleatoare rM vom obine:

    ( ) ( ) ( ) ( )j 1 j 1

    1 1rn n

    r rr j j

    n M XrM M M X M X M Xn n n= =

    = = = = Deci media momentului iniial de selecie este momentul iniial teoretic. 2. Dispersia variabilei aleatoare rM este:

    ( ) 21 1

    1 1n nr rr j j

    j jD M D X D X

    n n= =

    = = =

    ( ) ( ) ( ) ( )2 22 22

    r r r rn M X M X M X M Xn n

    = , n ipoteza c exist ( )rM X i ( )2 rM X . S-a aplicat aici faptul c variabilele de selecie X1, X2,.., Xn sunt independente i identic repartizate cu variabila aleatoare X. 3. S aplicm inegalitatea lui Cebev variabilei rM :

    ( )( ) ( ) ( ) ( )222 21 1r r rr r D M M X M XP M M X n < = Prin trecere la limit se obine: ( )( )lim 1r rn P M M X < = , ceea ce conduce la faptul c ( )pr rnM M X (momentele iniiale de selecie converg n probabilitate ctre momentele iniiale teoretice, cnd volumul seleciei tinde la infinit).

    7

  • 4. Dac exist ( )rM X i ( )2 rM X atunci, conform teoremei limit central, variabila normat ( )( ) ( ) ( )22 N 0;1

    r r B

    nr r

    M M XY

    M X M Xn

    n aplicaii practice, aceste rezultate asimptotice se aplic astfel: dac volumul de selecie este suficient de mare atunci variabila

    (n)

    ( )( )

    X M X

    D Xn

    are aproximativ o lege de repartiie normal N(0,1), iar

    ( )( ) ( )22r r

    r r

    M M X

    M X M Xn

    urmeaz aproximativ o lege normal N(0,1).

    Aceste rezultate au loc oricare ar fi legea de repartiie a variabilei aleatoare X, ce caracterizeaz colectivitatea din care s-a efectuat selecia, respectndu-se condiiile impuse.

    5. Ca i n cazul momentelor teoretice, putem exprima momentele centrate de selecie cu ajutorul momentelor iniiale (obinuite) de selecie.

    ( ) ( ) -1 1 0

    1 1- -1n n rr hh h r h

    j rrj j h

    X X C X Xn n

    = = =

    j = = =

    ( )0 1

    11r nhh h r

    r jh j

    C X Xn

    = =

    = h

    Deci ( )0

    1r hh h

    r hrrh

    C X M = = i reciproc

    ( ) 2 *1 2

    1,

    2r r r r

    r rM r X X r = + + + N" Pentru 2r = se obine 222 M X = .

    Cu ajutorul momentelor de selecie putem pune n eviden i ali

    indicatori de selecie ca: asimetria, excesul i coeficientul de corelaie, calculate pe baza datelor de selecie. Astfel:

    Coeficientul de asimetrie de selecie: 32

    31

    2

    =

    8

  • Coeficientul de exces de selecie: 42 22

    3 =

    Coeficientul de corelaie de selecie (empiric):

    ( ) ( )( ) ( )

    1

    2 2

    1 1

    1

    1 1

    n

    j jj

    n n

    j jj j

    X X Y Yn

    X X Yn n

    =

    = =

    =

    Y

    1.3. Selecia dintr-o populaie normal N(m, )

    n aplicaii, adesea ntlnim situaii cnd suntem interesai s cunoatem

    repartiia exact a diverselor statistici ( )1 2, ,..,nT X X X n cnd volumul de selecie n ia valori mici. Desigur, toate rezultatele obinute anterior, rmn valabile dac selecia s-a efectuat dintr-o populaie normal N(m, ).

    S presupunem acum c populaiile, din care se efectueaz seleciile, sunt supuse unei legi normale N(m, ).

    S aplicm inegalitatea lui Cebev variabilei rM :

    ( )( ) ( ) ( ) ( )222 21 1r r rr r D M M X M XP M M X n < = Prin trecere la limit se obine: ( )( )lim 1r rn P M M X < = , ceea ce

    conduce la faptul c ( )pr rnM M X . Acest lucru justific nlocuirea n aplicaii a momentelor teoretice de ordin r (cnd acestea exist) cu momentele empirice de acelai ordin, dac n este suficient de mare.

    Dac selecia efectuat este dintr-o colectivitate caracterizat de variabila aleatoare X cu lege de repartiie arbitrar i pentru care exist M(X)

    i D(X), atunci : ( )( ) (N 0;1B

    n

    X M XY

    D Xn

    ) , unde B nseamn

    converge n repartiie. Vom stabili repartiiile exacte ale celor mai importante funcii de

    selecie ce intervin curent n aplicaiile practice. Cel mai frecvent caz ntlnit n practic este cel al erorilor de observaie ale msurtorilor, care, dup cum se tie, sunt repartizate dup o lege normal.

    Un prim rezultat se refer la legea de repartiie a mediei de selecie.

    9

  • Teorema 1.3.1. Dac X1, X2,.., Xn este o selecie de volum n (oarecare) dintr-o populaie caracterizat de variabila ( )N ,X m atunci media de selecie

    1

    1 nj

    jX X

    n == are o lege de repartiie N ,m

    n .

    Demonstraie. Cum X1, X2,.., Xn sunt independente i identic repartizate, avnd repartiia N(m, ), rezult c fiecare are funcia caracteristic :

    ( )2

    22 , 1

    j

    i t m tX t e j

    n=

    Atunci:

    ( ) ( ) 111

    n

    j jj

    ti t X n i Xni t X nX

    jt M e M e M e=

    =

    = = = =

    ( )2 2

    2 222 2

    1 1j

    tn n i m t i t m tnt n nX n

    j je e

    = = = =

    Conform teoremei de inversiune i unicitate, aceasta este funcia

    caracteristic a unei variabile aleatoare normale N ,mn .

    Deci densitatea de repartiie a variabilei X este:

    ( ) ( )2

    2-

    2

    2

    n x m

    X

    nf x e =

    S considerm variabila abatere normat X mZ

    n= . Atunci:

    ( ) ( )X mi t

    t n t ni X i mi t Z nZ t M e M e M e e

    = = =

    =

    2 2 2

    2 2 2j

    t n t nt n t n ti mi m i mn

    X

    t ne e e

    e = =

    Rezult c densitatea de repartiie a variabilei Z este

    ( )2

    212

    x

    Zf x= e , adic Z urmeaz o lege normal N(0;1).

    10

  • S considerm acum dou colectiviti C1 i C2, caracterizate de variabilele aleatoare ( )1 1N ;X m , respectiv ( )2 2N ;Y m , independente. Din colectivitatea C1 se efectueaz o selecie de volum n1: X1, X2,.., 1nX , iar din colectivitatea C2 se efectueaz o selecie de volum n2:

    Y1,Y2,..,. . 2nY

    Pe baza acestor selecii, obinem mediile de selecie X , Y i dispersiile de

    selecie , : 21s22s

    1

    11

    1 nj

    jX X

    n == i (1 221

    11

    11

    n

    jj

    s Xn =

    = -- )X , respectiv

    2

    jj 12

    1 nY Yn =

    = i ( )2 22212

    11

    n

    jj

    s Yn =

    = Y . n aceste condiii variabila aleatoare X Y urmeaz o lege de repartiie

    normal 2 21 2

    1 21 2

    N ;m mn n

    + .

    ntr-adevr X , Y sunt independente i drept urmare:

    ( ) ( )( ) ( )( ) ( ) ( )( )i t i t i ti t i tt M e M e e M e M eX Y Y YX XX Y = = = = ( ) ( ) ( ) ( )

    2 222 2 2 21 21 2 1 21 21 21 2

    tt t i t m mi t m i t m 2 n n2 n 2 nt t e e eX Y

    + = =

    Acest rezultat conduce la concluzia c variabila X Y urmeaz o lege normal

    2 21 2

    1 21 2

    N ;m mn n +

    .

    Dac acum normm variabila aleatoare X Y obinem, ca i n cazul unei singure colectiviti, c variabila

    ( )1 22 21 2

    1 2

    ZX Y m m

    n n

    = + urmeaz o lege

    de repartiie normal N(0;1).

    Se demonstreaz c pentru o selecie dintr-o populaie normal X i 2 sunt variabile aleatoare independente.

    11

  • Aplicaii 1. Pentru a cerceta prezena studenilor la un anumit curs s-a ales un eantion de 100n = studeni i s-a nregistrat numrul absenelor acestora la patru cursuri consecutive. Rezultatele sunt n tabelul urmtor:

    Nr. studeni in 40 25 15 10 10 Nr. absene ix 0 1 2 3 4

    a). S se scrie variabila aleatoare de selecie i funcia de repartiie empiric ( )nF x . b). S se calculeze media i dispersia de selecie. c). S se calculeze . ( )100 3FRezolvare: Fie variabila aleatoare de selecie. X

    a). *0 1 2 3 440 25 15 10 10

    100 100 100 100 100X

    = , ( )100

    0, 00,4, 0 10,65, 1 20,8, 2 30,9, 3 41, 4

    xxx

    F xxx

    x

    < < = < < >

    b). 4

    1

    1 125 1,25100i ii

    x n xn =

    = = = , ( )4 221

    1i i

    in x x

    n

    == =

    62,5 1,5625 8,4375 30,625 75,625 178,75 1,7875100 100

    + + + + = = c). . ( )100 3 0,F = 82. Se consider o colectivitate de oameni a cror nlime are repartiia normal cu media 170 cm. Probabilitatea ca media de selecie corespunztoare unei selecii de volum 36 s depeasc 175 cm este 0,1977. S se determine probabilitatea ca lund la ntmplare un membru al colectivitii, el s aib nlimea peste 195 cm.

    Rezolvare. Avem ( )~ 170, , 175 0,1977,6X N P X > = ( )175P X > = ( ) 170 5 301 175 1 1 0,19776 6XP X P F = = = , unde F este

    funcia de repartiie a normalei ( )0,1N . Rezult ( )130 0,8023 0,85,F = =

    12

  • 30 35,294117650,85

    = = , probabilitatea cerut este

    ( )195P X > = 1 ( )195P X = 170 251 XP = 1 ( )0,7083333F =

    1 0,760573 0,239427 = 3. Determinai volumul minim al seleciei dintr-o populaie normal, astfel nct cu o probabilitate de 0,98 media de selecie X s estimeze media teoretic m cu o eroare absolut mai mic de 0,2, tiind c abaterea standard a populaiei este 4. = Rezolvare: Fie n volumul seleciei i caracteristica ( )~ ,X N m . Avem

    ~ ,X N mn i ( )0,2 0,98P X m < = . Deci 0,2 0,98X m nP n < = ,

    ( )~ 0,1X mZ Nn

    = , 0,2 0,2n nP Z < < =

    0,2 0,24 4

    n nF F =

    0,22 14

    nF

    , obinem 0,22 1,4

    nF =

    98, ( )1 0,99 2,3320

    n F = = ,

    ( )22,33 20 1 2172n = + = 4. Se constat c pe o suprafa de un m2 sunt 60 tulpini de lalea cu o abatere standard 12 = tulpini. Pentru o selecie aleatoare de 64 parcele de un m2, care este probabilitatea ca media de selecie s fie cuprins ntre 57 i 63 de tulpini. Rezolvare: Avem , 60m = 64n = , ( )~ ,X N m unde variabila X reprezint numrul tulpinilor de lalea pe metru ptrat,

    12~ 60, 1,58

    X N mn = = = . Deci

    ( ) 57 60 63 6057 63 1,5 1,5X mP X P n < < = < < = ( ) ( )2 2F F = ( )2 2 1 2 0,9772 1 0,9544F = =

    5. Proporia p de piese defecte dintr-un lot este necunoscut. Productorul acestora susine c ar fi de 4%. Extragem la ntmplare, cu revenire, piese i constatm c una este defect. Acceptm lotul respectiv sau nu ?

    9n =

    Rezolvare: Fie N variabila aleatoare care d numrul defectelor din eantion. N are repartiia binomial de parametri 9n = i p. Dac , atunci avem , care este o

    0,04p =( ) ( ) 11 81 1 9 0,04 0,96 0,2597nnP N C p p = = =

    13

  • probabilitate prea mic pentru a accepta lotul, deci l respingem. Cum , pentru a accepta lotul ar fi

    trebuit s nu gsim piese defecte. Menionm c volumul seleciei fiind mic nu putem utiliza teorema Moivre-Laplace, conform creia

    ( ) ( )0 0 90 1 0,96 0,692534nnP N C p p= = =

    ( )( )~ , 1N N np np p . 6. Se consider c greutatea persoanelor dintr-o instituie are repartiia normal cu media de 75 kg i cu o abatere standard de 10 kg. Liftul mare suport o greutate de 2400 kg. S se determine probabilitate ca 30 de salariai ce urc simultan n lift s aib o greutate ce depete capacitatea liftului.

    Rezolvare: Avem de aflat 2400 8030

    P X > = .

    Cum 10~ 75,30

    X N mn = = avem

    ( ) 80 758010 30

    X mP X Pn

    > = > = 51

    10 30F =

    ( )1 2,738613F . 1 0,996886 0,003114 =

    . Lectur suplimentar

    Introducem o dispersie de selecie 2 dat de relaia: 2 21

    1 ( )n

    jj

    X mn

    =

    = Vom arta c

    2

    2

    n

    urmeaz o lege de repartiie ( )2n (hi ptrat cu n grade de libertate).

    ntr-adevr 22

    22

    1 1

    -n njj

    j j

    X mn Y= =

    = = , unde jj X mY = sunt

    variabile aleatoare independente, repartizate normal N(0;1). S artm c:

    ( )2

    21

    12 2

    0, 0

    1 , 02

    2

    n

    njj

    n x

    Y

    x

    f x x e xn

    =

    = >

    14

  • Fie ( )N 0;1Y . Atunci: ( ) ( ) ( )2 2

    0, 0

    , 0Yx

    F x P Y xP Y x x

    = < = < >=

    ( ) ( )0, 0

    , 0

    x

    x x x

    >

    Rezult c:

    ( ) ( )2 2 2 20, 0

    1 1 1 1 , 02 2 2 2

    x xY Y

    xf x F x

    e ex x

    = = x + >

    Deci ( )( )

    212 2

    12

    0, 0

    1 , 02

    xY

    xf x

    x e x

    = > , care este densitatea de

    repartiie a unei variabile 2 cu un grad de libertate. Drept urmare, funcia caracteristic a variabilei Y2 este ( ) ( ) 122 1 2Y t i t = .

    Obinem: , ( ) ( )2

    21

    22

    11 1

    n

    jj j

    nj

    jj

    i t Y n ni t YYY j j

    t M e M e t=

    =

    = =

    = = =

    adic ( ) ( ) 22

    1

    1 2n

    n

    jj

    Yt i

    =

    = t i din teorema de inversiune i unicitate se

    obine:

    ( )( )2 21

    12 2

    2

    0, 0

    1 , 02

    n

    njj

    n x

    Yn

    xf x x e x

    =

    = >

    Rezult c 2

    2

    n

    urmeaz o lege de repartiie ( )2n . Acum putem enuna rezultatul ce urmeaz:

    Teorema 1.3.2. Variabilele 22n i ( ) 221n s urmeaz fiecare o lege

    de repartiie (hi ptrat cu n-1 grade de libertate). ( )2 1n

    15

  • Demonstraie. Din ( 221

    1 nj

    j)X Xn == rezult ( )

    2

    21

    n

    jj

    n X=

    = X . Dar

    ( ) ( ) ( ) ( )22 21 1 1

    n n n

    j j jj j j

    X X X m X m X m= = =

    = = + ( ) ( ) ( )2

    12

    n

    jj

    n X m X m X m=

    = ( ) ( )221

    n

    jj

    X m n X m=

    Rezult:

    2

    2

    22

    1

    nj

    j

    X mn X m

    n

    =

    = ; ( )

    22

    1

    nj

    nj

    X m = = ;

    ( )

    2

    21

    X m

    n

    =

    , deci ( )22 12 nn = i ( ) ( )

    22

    12

    1n

    n s = .

    Rezultatele obinute ne dau posibilitatea s obinem imediat:

    ( ) ( ) 22 1nM n = ; ( ) ( )4

    22 2

    2 1nD

    n = ; ; ( )2 2M s =

    ( ) 42 2 2 1D s n= . ntr-adevr 22 1

    nM n =

    , ( )22 1n M n = i ( ) 22 1nM n = .

    ( )( ) ( )22 22 22 4 2 1n nD D n = = i ( )2 42 22 1n

    Dn

    = . ( ) 2

    2

    11

    n sM n =

    ; ( ) ( )221 1n M s n = deci ( )2 2M s =

    ( ) ( )22 21 2 1n sD n = ; ( ) ( ) ( )2 2 241 2 1n D s n =

    Deci: ( )2 2 42 1D s n=

    16

  • Rezultatele de mai sus justific faptul c pe 2 am numit-o dispersie de selecie necorectat iar pe s2 dispersie de selecie corectat.

    Bazai pe rezultatul teoretic: dac X, Y sunt variabile aleatoare

    independente, i Y cu repartiie (0;1X N ) ( )2n atunci variabila XT Yn

    =

    urmeaz o lege de repartiie Student cu n grade de libertate, adic T are densitatea de repartiie .

    ( )1

    2 2

    12 1

    2

    n

    T

    nxf x

    n nn

    ++ = +

    S considerm variabilele X m

    n

    i

    ( ) 22

    1n s , care sunt independente

    i repartizate, dup cum am vzut, normal N(0;1), respectiv (2 1n ) , atunci:

    ( )( )

    ( )122

    11

    n

    X m

    X mn Tsn snn

    = =

    adic are o repartiie Student cu n-1 grade de libertate. Bazai pe faptul c suma a doua variabile aleatoare ( )1

    2k i ( )22k

    independente, este tot o variabil 2 cu numrul gradelor de libertate egal cu suma gradelor de libertate: ( ) ( ) (1 2 1 2

    2 2k k k k )2 + = + , se obine un alt rezultat

    important. Colectivitile fiind independente rezult c ( ) 21 121

    1n s i

    ( ) 2222

    1n

    2s sunt variabile aleatoare ( )12

    1n , ( 22 1n ) independente i, ca atare: ( ) ( )

    ( )1 22 2

    1 1 2 2 222 2

    1 2

    1 1n n

    n s n s + + = Acest rezultat, combinat cu cel de mai sus duce la:

    17

  • ( )

    ( ) ( ) ( )1 2

    1 2 1 2

    2 21 2

    1 222 2

    1 1 2 22 21 2 1 2

    1 1 12

    n n

    X X m m

    n nT

    n s n sn n

    +

    +

    = + +

    adic are o lege de repartiie Student cu ( 1 2 2n nT + ) 1 2 2n n+ grade de libertate (se presupun cunoscute dispersiile 21 i 22 ).

    Dac n particular (necunoscut), atunci: 2 21 2 = = 2( )

    ( ) ( )( )

    ( )( ) ( ) ( )1 2

    1 2 1 2

    2 21 2

    1 2 1 21 2 1 222 2 2 2

    1 21 1 2 2 1 1 2 22

    1 2 1 2

    1 1 1 12 2

    n n

    X X m m

    X X m mn n n n Tn nn s n s n s n s

    n n n n

    +

    + = + + + + +

    =

    n virtutea rezultatului teoretic, care afirm c dac variabilele aleatoare

    ( )12k , ( )22k sunt independente, atunci

    ( )

    ( )

    1

    2

    2

    12

    2

    k

    k

    k

    k

    urmeaz o lege de repartiie

    Snedecor cu k1, k2 grade de libertate.

    Rezult c

    ( )( )( )( )

    1 2

    21 1

    2 2 21 1 1 2

    1; 12 2 22 2 2 1

    22 2

    1111

    n n

    n sn s Fn s sn

    = =

    urmeaz o lege de repartiie

    Snedecor cu , grade de libertate. Se mai spune c raportul celor dou variabile independente, este o variabil

    1n 1 2n 12

    1 2n 1;n 1F , cu gradele de

    libertate n ordinea menionat. n particular, dac dispersiile 21 , 22 sunt egale ( 2 2 21 2 = = ),

    variabila 1 2

    21

    1; 122

    n ns Fs

    = n aplicaiile practice va trebui s inem seama de faptul c tabelele

    pentru repartiia Snedecor se construiesc pentru valori ale variabilei 1 2n 1;n 1

    F

    18

  • mai mari dect unu. Cnd efectum calcule numerice, nu este nici un inconvenient deoarece rmne la latitudinea noastr care dispersie de selecie o vom pune la numrtor, cu atenie la numrul de grade de libertate corespunztor.

    Va trebui totui s fim ateni s nu inversm numrul de grade de

    libertate cci 2 1

    1 2

    22

    1; 1 2211 122

    1 1n n

    n n

    sFss Fs

    ; 1

    = = = , fapt ce justific de ce s-au

    construit tabele numai pentru . 1 2k ;k

    F 1>

    19