estimarea parametrilor radu tr^ mbit˘a˘s

43
Select ¸ie ¸ si estimat ¸ie Estimarea parametrilor Radu Trˆ ımbit ¸a¸ s UBB 16 aprilie 2020 Radu Trˆ ımbit ¸a¸ s (UBB) Select ¸ie ¸ si estimat ¸ie 16 aprilie 2020 1 / 43

Upload: others

Post on 03-Oct-2021

8 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Estimarea parametrilor Radu Tr^ mbit˘a˘s

Selectie si estimatieEstimarea parametrilor

Radu Trımbitas

UBB

16 aprilie 2020

Radu Trımbitas (UBB) Selectie si estimatie 16 aprilie 2020 1 / 43

Page 2: Estimarea parametrilor Radu Tr^ mbit˘a˘s

Continut

1 SelectieFunctii de selectieMedia de selectie

2 Estimarea parametrilor si metode de estimatie

3 Metoda verosimilitatii maxime

4 Metoda intervalelor de ıncredereIntervale de ıncredere pentru medieIntervale de ıncredere pentru diferenta a doua mediiEstimarea unei proportiiIntervale de ıncredere pentru dispersie si raportul a doua dispersii

5 Bibliografie

Radu Trımbitas (UBB) Selectie si estimatie 16 aprilie 2020 2 / 43

Page 3: Estimarea parametrilor Radu Tr^ mbit˘a˘s

Functii de selectie

Fie datele de selectie x1, x2, . . . , xn. Numarul n se va numi volumulselectiei.Datele de selectie vor fi considerate valori ale unor variabile aleatoareX1, . . . , Xn, numite variabile de selectie; ın cazul unei selectii repetate elesunt identic repartizate cu caracteristica de studiat X .

Definitia 1

Variabila aleatoareZn = hn(X1, X2, . . . , Xn),

unde hn : Rn → R este masurabila se va numi functie de selectie saustatistica, iar zn = hn(x1, . . . , xn) se va numi valoarea functiei de selectie.

Radu Trımbitas (UBB) Selectie si estimatie 16 aprilie 2020 3 / 43

Page 4: Estimarea parametrilor Radu Tr^ mbit˘a˘s

Media de selectie I

Definitia 2

Statistica

X =1

n

n

∑k=1

Xk

se va numi medie de selectie, iar valoarea ei valoarea mediei de selectie.

Propozitia 3

Daca X are media m = M(X ) si dispersia σ2 = D2(X ) atunci

M(X ) = m si D2(X ) =σ2

n.

Radu Trımbitas (UBB) Selectie si estimatie 16 aprilie 2020 4 / 43

Page 5: Estimarea parametrilor Radu Tr^ mbit˘a˘s

Media de selectie II

Demonstratie.

M(X ) =1

n

n

∑k=1

M(Xk) =1

nnm = m

D2(X ) =1

n2 ∑ D2(Xk) =1

n2nσ2 =

σ2

n,

deoarece Xk sunt independente si identic repartizate cu X .

Daca n→ ∞, X va urma legea N

(µ,

σ2

n

).

Radu Trımbitas (UBB) Selectie si estimatie 16 aprilie 2020 5 / 43

Page 6: Estimarea parametrilor Radu Tr^ mbit˘a˘s

Media de selectie III

Propozitia 4

Daca m = M(X ) si σ2 = D2(X ) atunci

Zn =X −m

σ√n

converge ın repartitie catre legea normala N(0, 1) cand n→ ∞, iar candX ∈ N(m, σ) afirmatia are loc pentru orice n.

Demonstratie. Rezulta din teorema limita centrala sau din proprietatiledistributiei normale.

Radu Trımbitas (UBB) Selectie si estimatie 16 aprilie 2020 6 / 43

Page 7: Estimarea parametrilor Radu Tr^ mbit˘a˘s

Estimarea parametrilor si metode de estimatie I

Definitia 5

Fie caracteristica X cu functia de probabilitate f (x ; θ), parametrul θ ∈ Anecunoscut si o selectie repetata de volum n. Numim functie de estimatiesau estimator pentru parametrul θ functia de selectie

θ = ϕ(X1, X2, . . . , Xn)

care ia valori ın domeniul A, iar valoarea numerica θ = θ(x1, . . . , xn) senumeste estimatie a lui θ.

Radu Trımbitas (UBB) Selectie si estimatie 16 aprilie 2020 7 / 43

Page 8: Estimarea parametrilor Radu Tr^ mbit˘a˘s

Estimarea parametrilor si metode de estimatie II

Definitia 6

Estimatorul θ = θ(X1, X2, . . . , Xn) este un estimator nedeplasat pentruparametrul necunoscut θ daca M(θ) = θ, iar valoarea numericaθ = θ(x1, x2, . . . , xn) se numeste estimatie nedeplasata pentru parametrulθ.

Definitia 7

Spunem ca estimatorul θ = θ(X1, X2, . . . , Xn) este estimator consistent

pentru parametrul necunoscut θ daca θp→ θ, adica

limn→∞

P(|θ − θ| < ε) = 1,

pentru orice ε > 0, iar valoarea numerica θ = θ(x1, . . . , xn) se numesteestimatie consistenta pentru parametrul θ.

Radu Trımbitas (UBB) Selectie si estimatie 16 aprilie 2020 8 / 43

Page 9: Estimarea parametrilor Radu Tr^ mbit˘a˘s

Estimarea parametrilor si metode de estimatie III

Definitia 8

θ = θ(X1, X2, . . . , Xn) se numeste estimator absolut corect pentru θ dacasatisface conditiile(i) M(θ) = θ(ii) lim

n→∞D2(θ) = 0,

iar valoarea numerica θ = θ(x1, . . . , xn) se numeste estimatie absolutcorecta pentru parametrul θ.

Propozitia 9

Orice estimator absolut corect este consistent.

Radu Trımbitas (UBB) Selectie si estimatie 16 aprilie 2020 9 / 43

Page 10: Estimarea parametrilor Radu Tr^ mbit˘a˘s

Estimarea parametrilor si metode de estimatie IV

Demonstratie. Fie θ = θ(X1, X2, . . . , Xn) un estimator absolut corectpentru θ. Din inegalitatea lui Cebısev avem

1 ≥ P(|θ − θ| < ε) ≥ 1− D2(θ)

ε2, ∀ ε > 0.

Trecand la limita pentru n→ ∞ se obtine

limn→∞

P(|θ − θ| < ε) = 1, ε > 0.

Radu Trımbitas (UBB) Selectie si estimatie 16 aprilie 2020 10 / 43

Page 11: Estimarea parametrilor Radu Tr^ mbit˘a˘s

Estimarea parametrilor si metode de estimatie V

Propozitia 10

Fie caracteristica X pentru care exista momentul teoretic de ordinul 2k,M2k = M(X 2k). Momentul de selectie de ordinul k

mk =1

n

n

∑i=1

X ki

este o estimatie absolut corecta pentru parametrul Mk .

Radu Trımbitas (UBB) Selectie si estimatie 16 aprilie 2020 11 / 43

Page 12: Estimarea parametrilor Radu Tr^ mbit˘a˘s

Metoda verosimilitatii maxime I

Este o metoda clasica pentru construirea de estimatii consistente,asimptotic eficiente si asimptotic normale.Se considera caracteristica X cu functia de probabilitate f (X , θ), θ ∈ Rp

parametru necunoscut. Relativ la caracteristica X se considera o selectierepetata de volum n.

Definitia 11

Se numeste functie de verosimilitate functia de selectie

L(X1, X2, . . . , Xn; θ) =n

∏k=1

f (Xk , θ).

Valoarea acestei functii

L(X1, . . . , Xn; θ) =n

∏k=1

f (Xk , θ)

Radu Trımbitas (UBB) Selectie si estimatie 16 aprilie 2020 12 / 43

Page 13: Estimarea parametrilor Radu Tr^ mbit˘a˘s

Metoda verosimilitatii maxime II

reprezinta ın cazul discret functia de frecventa, iar ın cazul continuudensitatea de probabilitate a vectorului aleator (X1, X2, . . . , Xn).Pentru x1, . . . , xn vom considera ca valoarea cea mai verosimila este ceapentru care L (x1, . . . , xn; θ) este maxima. Maximul lui L (x1, . . . , xn; θ) areloc ın acelasi timp cu maximul lui H(θ) := ln P (x1, . . . , xn; θ). El seobtine ca solutie a ecuatiei de verosimilitate maxima sau a sistemului deverosimilitate maxima obtinute anuland derivatele partiale ale functieiln L (x1, . . . , xn; θ) ın raport cu componentele lui θ:

∂ ln L (x1, . . . , xn; θ)

∂θj= 0, j = 1, k .

Exemplul 12

Estimatie de verosimilitate maxima pentru parametrii repartitiei normaleN(m, σ2).

Radu Trımbitas (UBB) Selectie si estimatie 16 aprilie 2020 13 / 43

Page 14: Estimarea parametrilor Radu Tr^ mbit˘a˘s

Metoda verosimilitatii maxime III

Solutie. Parametrul de estimat este θ = (m, σ2) ∈ R2; deoarecedensitatea de probabilitate este

f (x ; m, σ2) =1

σ√

2πe−

(x−m)2

2σ2 ,

functia de verosimilitate va fi

L(x1, . . . , xn; m, σ2) =1

(2πσ2)n/2e−

12σ2 ∑n

i=1(xi−m)2

,

iar

H(m, σ2)= ln P(x1, . . . , xn; m, σ2)=−n

2ln σ2−n

2ln 2π− 1

2σ2

n

∑i=1

(xi−m)2.

Radu Trımbitas (UBB) Selectie si estimatie 16 aprilie 2020 14 / 43

Page 15: Estimarea parametrilor Radu Tr^ mbit˘a˘s

Metoda verosimilitatii maxime IV

Ecuatia de verosimiliate maxima este∂H(m, σ2)

∂m= 0

∂H(m, σ2)

∂σ2= 0

,

adica 1

σ2

n

∑i=1

(xi −m) = 0

− n

2σ2+

1

2σ4

n

∑i=1

(xi −m)2 = 0,

Radu Trımbitas (UBB) Selectie si estimatie 16 aprilie 2020 15 / 43

Page 16: Estimarea parametrilor Radu Tr^ mbit˘a˘s

Metoda verosimilitatii maxime V

cu solutiile

m =1

n

n

∑i=1

xi = x

σ2 =1

n

n

∑i=1

(xi − x)2 = s2.

Exemplul 13

Estimatie de verosimilitate maxima pentru parametrul p al repartitieibinomiale b(n, p).

Solutie. Consideram n observatii, x1, . . ., xn, fiecare din ele avandvaloarea 0 sau 1, dupa cum s-a ınregistrat succes sau insucces. Valoarea

Radu Trımbitas (UBB) Selectie si estimatie 16 aprilie 2020 16 / 43

Page 17: Estimarea parametrilor Radu Tr^ mbit˘a˘s

Metoda verosimilitatii maxime VI

kn = ∑i=1 xi reprezinta numarul de succese ın n probe. Functia deverosimilitate este

L(x1, . . . , xn; p) =

(n

kn

)pkn(1− p)n−kn ,

cu p /∈ {0, 1}. Avem

H(p) = ln P(x1, . . . , xn; p) = ln

(n

kn

)+ kn ln p + (n− kn) ln(1− p),

iar ecuatia de verosimilitate maxima este

H ′(p) = kn1

p− (n− kn)

1

1− p= 0,

cu solutia

p =knn

=1

n

n

∑i=1

xi = x .

Radu Trımbitas (UBB) Selectie si estimatie 16 aprilie 2020 17 / 43

Page 18: Estimarea parametrilor Radu Tr^ mbit˘a˘s

Metoda verosimilitatii maxime VII

Exemplul 14

Estimatie de verosimilitate maxima pentru parametrul λ al repartitieiPoisson.

Solutie. Functia de verosimilitate este

L(x1, . . . , xn; λ) = e−nλn

∏i=1

λxi

xi !, λ 6= 0,

iar

H(λ) = ln P(x1, . . . , xn; λ) = −nλ +n

∑i=1

(xi ln λ− ln(xi !)) .

Se obtine urmatoare ecuatie de verosimilitate maxima

H ′(λ) = −n +1

λ

n

∑i=1

xi = 0

Radu Trımbitas (UBB) Selectie si estimatie 16 aprilie 2020 18 / 43

Page 19: Estimarea parametrilor Radu Tr^ mbit˘a˘s

Metoda verosimilitatii maxime VIII

cu solutia λ = x .

Radu Trımbitas (UBB) Selectie si estimatie 16 aprilie 2020 19 / 43

Page 20: Estimarea parametrilor Radu Tr^ mbit˘a˘s

Metoda intervalelor de ıncredere

A da un interval de ıncredere pentru parametrul unidimensional θ cucoeficientul de ıncredere 1− α revine la construirea pe baza unei selectiix1, . . . , xn a unui interval

[θ(x1, . . . , xn), θ(x1, . . . , xn)]

cu proprietatile

(i) θ(x1, . . . , xn) ≤ θ(x1, . . . , xn);

(ii) P(θ(x1, . . . , xn) ≤ θ ≤ θ(x1, . . . , xn)) = 1− α.

Pentru determinarea statisticilor θ si θ se cauta o statistica Zn = Z (X1,. . ., Xn) care urmeaza o lege de probabilitate cunoscuta (independenta deθ), dar ın a carei expresie intervine parametrul necunoscut θ. Pentruα ∈ [0, 1], mic, se determina un interval numeric (z1, z2) astfel ıncatP(Zn ∈ (z1, z2)) = 1− α. De aici, prin operatii algebrice, se obtine orelatie de tipul celei din conditia (ii) de mai sus. Cu cat intervalul (θ, θ)este mai mic, cu atat estimatia este mai buna.

Radu Trımbitas (UBB) Selectie si estimatie 16 aprilie 2020 20 / 43

Page 21: Estimarea parametrilor Radu Tr^ mbit˘a˘s

Intervale de ıncredere pentru medie I

Daca caracteristica X urmeaza legea normala N(m, σ2), cu m ∈ R

necunoscut si σ2 > 0 cunoscut, atunci statistica

Z =X −m

σ√n

urmeaza legea normala standard (propozitia 4). Fie zα cuantila de ordin αa repartitiei normale reduse. Deoarece

P(zα/2 < Z < z1−α/2) = 1− α

(vezi figura 1), se obtine pentru m urmatorul interval de ıncredere100(1− α)%:

x + zα/2σ√n< m < x + z1−α/2

σ√n

sau tinand cont ca zα/2 = −z1−α/2, putem spune ca intervalul are formax ± zα/2

σ√n

.

Radu Trımbitas (UBB) Selectie si estimatie 16 aprilie 2020 21 / 43

Page 22: Estimarea parametrilor Radu Tr^ mbit˘a˘s

Intervale de ıncredere pentru medie II

Exemplul 15

Sa presupunem ca avem n = 25 de date, x = 20 si ca σ = 5. Sa sedetermine un interval de ıncredere de 95% pentru medie.

Solutie. Deoarece α = 5%, avem zα/2 = −1.96, si se obtine

x − 1.96 · 5√25

< m < x + 1.96 · 5√25

,

adica m ∈ (18.04, 21.96). Rezultatul obtinut se poate interpreta astfel: ın95% din cazuri intervalul (18.04, 21.96) va acoperi media m, sauprobabilitatea ca m sa cada ın intervalul (18.04, 21.96) este de 95%.Daca σ este necunoscut, vom ınlocui σ cu estimatia absolut corecta a sas ′, data de formula

s ′2 =1

n− 1

n

∑i=1

(xi − x)2.

Radu Trımbitas (UBB) Selectie si estimatie 16 aprilie 2020 22 / 43

Page 23: Estimarea parametrilor Radu Tr^ mbit˘a˘s

Intervale de ıncredere pentru medie III

Statistica

T =X −m

s ′√n

urmeaza legea Student cu n− 1 grade de libertate T (n− 1). Daca tn,α

este cuantila de ordinul α a repartitiei T (n), rationand ca ın cazulprecedent se obtine un interval de ıncredere pentru medie de forma

x + tn−1,α/2s ′√

n< m < x + tn−1,1−α/2

s ′√n

.

Radu Trımbitas (UBB) Selectie si estimatie 16 aprilie 2020 23 / 43

Page 24: Estimarea parametrilor Radu Tr^ mbit˘a˘s

Intervale de ıncredere pentru medie IV

Exemplul 16

Un fabricant de praf de pusca doreste sa testeze o noua pulbere. Eltesteaza 8 cartuse, masurand viteza glontelui la gura tevii. Se obtinurmatoarele viteze ın m/s:

1001. 7 975.0 978. 33 988. 33998. 33 1001. 7 979.0 968. 33

Determinati un interval de ıncredere de 95% pentru media vitezelor ınipoteza ca vitezele sunt normal distribuite.

Solutie. Cu datele de mai sus media este x = 986. 33, s ′ = 13.03, iarcuantilele sunt t7,0.025 = −2.365 si t7,0.9755 = 2.365 (distributia estesimetrica). Se obtine intervalul 986.33± 2.365 · 13.03√

8= 986.33± 10. 895,

adica (986.33− 10. 895, 986.33+ 10. 895) = (975. 44, 997. 23).

Radu Trımbitas (UBB) Selectie si estimatie 16 aprilie 2020 24 / 43

Page 25: Estimarea parametrilor Radu Tr^ mbit˘a˘s

Intervale de ıncredere pentru medie V

Figura: Intervale de ıncredere pentru medie

Radu Trımbitas (UBB) Selectie si estimatie 16 aprilie 2020 25 / 43

Page 26: Estimarea parametrilor Radu Tr^ mbit˘a˘s

Intervale de ıncredere pentru diferenta a doua medii I

Fie doua populatii cu caracteristicile X1 ∈ N(m1, σ21 ) si X2 ∈ N(m2, σ2

2 ).Se considera doua selectii repetate de volume n1 si respectiv n2. Mediile sidispersiile lor de selectie sunt

X2 =1

n1

n1

∑i=1

X1i , X2 =1

n2

n2

∑i=1

X2i

si

s ′21 =1

n1 − 1

n1

∑i=1

(X1i − X1)2

, s ′22 =1

n2 − 1

n2

∑i=1

(X2i − X2)2

.

Radu Trımbitas (UBB) Selectie si estimatie 16 aprilie 2020 26 / 43

Page 27: Estimarea parametrilor Radu Tr^ mbit˘a˘s

Intervale de ıncredere pentru diferenta a doua medii II

(a) Daca σ1 si σ2 sunt cunoscuti, atunci statistica

Z =(X1 − X2)− (m1 −m2)√

σ21n1

+σ2

2n2

urmeaza legea normala standard. Obtinem urmatorul interval deıncredere pentru diferenta m1 −m2 a mediilor

X1− X2 + zα/2

√σ2

1

n1+

σ22

n2< m1−m2 < X1− X2 + z1−α/2

√σ2

1

n1+

σ22

n2.

Radu Trımbitas (UBB) Selectie si estimatie 16 aprilie 2020 27 / 43

Page 28: Estimarea parametrilor Radu Tr^ mbit˘a˘s

Intervale de ıncredere pentru diferenta a doua medii III

(b) Daca σ1 si σ2 sunt necunoscuti si σ1 = σ2 = σ, atunci σ poate fiınlocuit prin

Sp =

√(n1 − 1)s ′21 + (n2 − 1)s ′22

n1 + n2 − 2,

iar statistica

T =(X1 − X2)− (m1 −m2)

Sp

√1n1

+ 1n2

este repartizata Student cu n1 + n2 − 2 grade de libertate. Expresiaintervalului de ıncredere este analoaga celei de mai sus, cu precizareaca ın locul cuantilelor legii normale standard se iau cuantilelerepartitiei T (n1 + n2 − 2).

Radu Trımbitas (UBB) Selectie si estimatie 16 aprilie 2020 28 / 43

Page 29: Estimarea parametrilor Radu Tr^ mbit˘a˘s

Intervale de ıncredere pentru diferenta a doua medii IV

Exemplul 17

Se compara doua procedee de montaj pentru un dispozitiv, unul clasic siunul nou, care necesita pentru aplicarea corecta o perioada de instruire deo luna si respectiv 3 saptamani. Au fost instruite doua grupuri de cate 9muncitori, unul cu metoda clasica si celalat cu metoda noua. S-aınregistrat timpul de montaj (ın minute) pentru fiecare muncitor,obtinanduse rezultatele din tabela de mai jos:

Procedura Timpul

Clasica 32 37 35 28 41 44 35 31 34Noua 35 31 29 25 34 40 27 32 31

Determinati un interval de ıncredere de 95% pentru diferenta mediilor ınipoteza ca timpii au distributia normala si dispersiile sunt egale.

Radu Trımbitas (UBB) Selectie si estimatie 16 aprilie 2020 29 / 43

Page 30: Estimarea parametrilor Radu Tr^ mbit˘a˘s

Intervale de ıncredere pentru diferenta a doua medii V

Solutie. Pentru datele din tabelul de mai sus avem

x1 = 35.22 x2 = 31.56

∑9i=1(x1i − x1)2 = 195.56 ∑9

i=1(x2i − x2)2 = 160.22.

Deci

Sp =

√195.56 + 160.22

9 + 9− 2= 4. 7155.

Cum numarul de grade de libertate este n1 + n2 − 2 = 16 sit16,0.975 = 2.120 se obtine un interval de forma

(x1 − x2)± tn1+n2−2,1−α/2Sp

√1

n1+

1

n2,

Radu Trımbitas (UBB) Selectie si estimatie 16 aprilie 2020 30 / 43

Page 31: Estimarea parametrilor Radu Tr^ mbit˘a˘s

Intervale de ıncredere pentru diferenta a doua medii VI

de unde prin ınlocuire avem

(35.22− 31.56)± 2.120 · 4.7155 ·√

1

9+

1

9= 3. 66± 4. 7126 =

= (−1. 0526, 8. 3726) .

(c) Daca σ1 si σ2 sunt necunoscuti si σ1 6= σ2, atunci statistica

T =(X1 − X2)− (m1 −m2)√

s ′21n1

+s ′22n2

urmeaza legea Student cu n grade de libertate, unde n este solutiaecuatiei

1

n=

c2

n1 − 1+

(1− c)2

n2 − 1,

Radu Trımbitas (UBB) Selectie si estimatie 16 aprilie 2020 31 / 43

Page 32: Estimarea parametrilor Radu Tr^ mbit˘a˘s

Intervale de ıncredere pentru diferenta a doua medii VII

iar c este dat de

c =

s ′21n1−1

s ′21n1−1 +

s ′22n2−1

.

Observatia 18

Daca volumul selectiei este mare diferenta ıntre valorile cuantilelorrepartitiei Student si cele ale repartitiei normale standard este neglijabila siatat la determinarea intervalelor de ıncredere pentru medie cat si pentrudiferenta a doua medii se poate considera ca statisticile utilizate audistributia normala.

Radu Trımbitas (UBB) Selectie si estimatie 16 aprilie 2020 32 / 43

Page 33: Estimarea parametrilor Radu Tr^ mbit˘a˘s

Estimarea unei proportii I

Metodele folosite pentru estimarea valorii medii pot fi folosite si pentru aestima proportia p de indivizi dintr-o populatie care au o anumitacaracteristica (calitativa), de exemplu pentru a estima cu ajutorul uneiselectii proportia de alegatori care au votat ın favoarea unui anumitcandidat. Proportia indivizilor dintr-o selectie care au o anumitacaracteristica poate fi tratata ca un caz special de medie, introducand ovariabila aleatoare X care ia valoarea 1 pentru indivizii care aucaracteristica respectiva si 0 pentru ceilalti indivizi. Media acestor variabilealeatoare Xn are, pentru selectii de volum mare, o repartitie aproximativ

normala cu media egala cu p si abaterea medie patratica σ√n=√

p(1−p)n .

Faptul ca abaterea medie patratica depinde de parametrul p necunoscutıngreuneaza calculele, dar totusi putem sa afirmam ca:

a) oricare ar fi valoare lui p ∈ [0, 1], p(1− p) ≤ 14 ; asadar daca folosim

0.5/√

n ın loc de σ√n

, vom folosi un numar care nu este mai mic

decat media patratica;

Radu Trımbitas (UBB) Selectie si estimatie 16 aprilie 2020 33 / 43

Page 34: Estimarea parametrilor Radu Tr^ mbit˘a˘s

Estimarea unei proportii II

b) daca n este suficient de mare, eroare ce provine din ınlocuirea

cantitatii

√p(1−p)

n cu√

xn(1− xn)/n este mica.

Folosind unul din aceste procedee, putem forma intervale de ıncrederepentru p ın acelasi mod ca si pentru m.

Exemplul 19

La un sondaj organizat ın timpul alegerilor, din 1000 de persoanechestionate, 300 s-au pronuntat ın favoarea unui anumit candidat.Intervalul de ıncredere de 95% pentru procentul de alegatori care estepentru acel candidat este dat de

300

1000− 1.96

√0.3 · 0.7

1000< p <

300

1000+ 1.96

√0.3 · 0.7

1000,

adica 0. 2716 < p < 0.3284.

Radu Trımbitas (UBB) Selectie si estimatie 16 aprilie 2020 34 / 43

Page 35: Estimarea parametrilor Radu Tr^ mbit˘a˘s

Estimarea unei proportii III

Vom prezenta ın continuare o aplicatie a estimatiei de mai sus ladeterminarea volumului unei selectii.Eroarea maxima a estimatiei pentru o proportie este jumatate dinlungimea intervalului de ıncredere, adica

E = |zα/2|√

pq

n. (1)

De aici rezulta

n =z2

α/2pq

E 2. (2)

Exemplul 20

Determinati dimensiunea selectiei necesare pentru a estima proportia destudenti cu ochi albastrii, daca dorim ca estimatia sa fie ın limita de 0.02cu probabilitatea de ıncredere de 90%.

Radu Trımbitas (UBB) Selectie si estimatie 16 aprilie 2020 35 / 43

Page 36: Estimarea parametrilor Radu Tr^ mbit˘a˘s

Estimarea unei proportii IV

Solutie. Avem zα/2 = −1.65, si deoarece pq este maxim daca p = q,p = 0.5. Aplicand formula (2) obtinem

n =1.652 · 0.5 · 0.5

0.022= 1701. 6 ≈ 1702.

Exemplul 21

Un producator sustine ca marfa sa are defecte ın proportie de 5%. Sa sedetermine dimensiunea selectiei astfel ıncat estimatia sa fie cu precizia0.02 (eroarea) la nivelul de 90%.

Solutie. Avem zα/2 = −1.65, p = 0.05, q = 0.95;

n =1.652 · 0.05 · 0.95

0.022= 323. 3 ≈ 324.

Radu Trımbitas (UBB) Selectie si estimatie 16 aprilie 2020 36 / 43

Page 37: Estimarea parametrilor Radu Tr^ mbit˘a˘s

Intervale de ıncredere pentru dispersie si raportul a douadispersii I

Estimarea lui σ2 cu ajutorul intervalelor de ıncredere se bazeaza perepartitia dispersiei de selectie s2 (sau s ′2). Statistica

X 2 =ns2

σ2=

(n− 1)s ′2

σ2

urmeaza legea hi-patrat standard cu n− 1 grade de libertate χ2(n− 1, 1).Pentru a determina un interval de ıncredere 1− α pentru σ2, vomdetermina valorile χ2

1 si χ22 astfel ıncat

P(χ2

1 < X 2 < χ22

)= 1− α.

Daca χ2n,α este cuantila de ordin α a repartitiei χ2(n, 1), atunci putem lua

χ21 = χ2

n−1,α/2 si χ22 = χ2

n−1,1−α/2, asa cum se arata ın figura 2. Avem

χ2n−1,α/2 < X 2 < χ2

n−1,1−α/2 ⇔ χ2n−1,α/2 <

ns2

σ2< χ2

n−1,1−α/2,

Radu Trımbitas (UBB) Selectie si estimatie 16 aprilie 2020 37 / 43

Page 38: Estimarea parametrilor Radu Tr^ mbit˘a˘s

Intervale de ıncredere pentru dispersie si raportul a douadispersii II

de unde se obtine

ns2

χ2n−1,1−α/2

< σ2 <ns2

χ2n−1,α/2

. (3)

Radu Trımbitas (UBB) Selectie si estimatie 16 aprilie 2020 38 / 43

Page 39: Estimarea parametrilor Radu Tr^ mbit˘a˘s

Intervale de ıncredere pentru dispersie si raportul a douadispersii III

Figura: Interval de ıncredere pentru σ2

Radu Trımbitas (UBB) Selectie si estimatie 16 aprilie 2020 39 / 43

Page 40: Estimarea parametrilor Radu Tr^ mbit˘a˘s

Intervale de ıncredere pentru dispersie si raportul a douadispersii IV

Exemplul 22

Un experimentator doreste sa determine variabilitatea echipamentuluipentru masurarea volumului unei surse audio. S-au efectuat treimasuratori independente pentru acelasi sunet si s-au obtinut valorile 4.1,5.2 si 10.2. Dati un interval de ıncredere de 90% pentru σ2.

Solutie. Presupunand ca datele sunt normale, avem s ′2 = 10.57,α/2 = 0.05, numarul de grade de libertate este n− 1 = 2, iar cuantilelesunt χ2

2,0.05 = 0.103 si χ22,0.95 = 5.991. Aplicand formula (3) se obtine

intervalul ((n− 1)s ′2

χ2n−1,1−α/2

,(n− 1)s ′2

χ2n−1,α/2

)= (3.53, 205.4).

Radu Trımbitas (UBB) Selectie si estimatie 16 aprilie 2020 40 / 43

Page 41: Estimarea parametrilor Radu Tr^ mbit˘a˘s

Intervale de ıncredere pentru dispersie si raportul a douadispersii V

Pentru estimarea raportului a doua dispersii, folosim faptul ca statistica

F =

s ′21

σ21

s ′22

σ22

urmeaza legea F cu n1 − 1 si n2 − 1 grade de libertate. Rationand ca maisus se obtine

1

fn1−1,n2−1;1−α/2

s ′21

s ′22

<σ2

1

σ22

<1

fn1−1,n2−1;α/2

s ′21

s ′22

.

Exemplul 23

Sa consideram datele din exemplul 17. Dorim sa determinam un intervalde ıncredere 95 % pentru raportul dispersiilor.

Radu Trımbitas (UBB) Selectie si estimatie 16 aprilie 2020 41 / 43

Page 42: Estimarea parametrilor Radu Tr^ mbit˘a˘s

Intervale de ıncredere pentru dispersie si raportul a douadispersii VI

Solutie. Avem n1 = 8, n2 = 8, cuantilele sunt f8,8,0.025 = 0.224707,f8,8,0.975 = 4.45023, iar dispersiile de selectie s ′21 = 24.4444,

s ′22 = 20.0278. Raportul dispersiilor de selectie estes ′21

s ′22= 1.22053, iar

intervalul de ıncredere (0.274262, 5.43163).

Radu Trımbitas (UBB) Selectie si estimatie 16 aprilie 2020 42 / 43

Page 43: Estimarea parametrilor Radu Tr^ mbit˘a˘s

Bibliografie I

Robert Johnson –Elementary Statistics, 4th edition, PWS-Kent, 1984

Mircea Malita, Corneliu Zidaroiu – Incertitudine si decizie, EdituraStiintifica si enciclopedica, Bucuresti, 1980.

Gheorghe Mihoc, G. Ciucu, V. Craiu – Teoria probabilitatilor sistatistica matematica, Editura Didactica si pedagogica, Bucuresti,1970.

Radu Trımbitas - Metode statistice, Presa Universitara Clujeana,Cluj-Napoca, 2000

D. D. Wackerly, W. Mendenhall, R. L. Scheafer – MathematicalStatistics with Application, 7th ed. Thompson/Brooks-Cole, 2008.

Radu Trımbitas (UBB) Selectie si estimatie 16 aprilie 2020 43 / 43