necesitatea estimării metode de estimare teorema …ileana.brudiu.ro/mvr/curs/13. estimarea...

62

Upload: others

Post on 27-Dec-2019

48 views

Category:

Documents


0 download

TRANSCRIPT

Ce înseamnă “estimare statistică”

Necesitatea estimării

Metode de estimare

Teorema limitei centrale

Eroarea standard a mediei

Intervale de încredere

Limite de încredere

Marjă de eroare

Prin estimaţie se înţelege operaţia de extindere, in limitele specificate de incertitudinea exprimată în termeni probabilistici, a rezultatelor obţinute în sondaj, asupra întregii populaţii.

Estimarea reprezintă procesul utilizării informaţiilor obţinute de la un eşantion ales la întâmplare în scopul obţinerii de concluzii referitoare la valori ale parametrilor ce caracterizează populaţia.

DEFINIȚII DEX

A estima = a aproxima. Estimare = aproximare. Estimaţie = aproximaţie.

POPULAȚIE

Toți indivizii care ne interesează

Eșantion

Eșantion grup de indivizi aleși din poplație care ne interesează pentru

studiu

Concluziile (rezultatele) obținute petru eșantion se folosesc ca o estimare pentru polulație.

(eșantionul trebuie să fie reprezentativ pentru populație)

Populație și eșantion

Populație

Estimarea

parametrului pentru eșantion

Parametrul populației

Eșantion

Intervalul de încredere pentru parametrul populației

Mecanismul de eșantionare

Indicatorii eșantionului se numesc STATISTICI

Indicatorii populației numesc PARAMETRI

Populație (idivizii luați în studiu)

Eșantion (idivizii supuși studiului (experimentului))

Parametru (valoarea indicatorului caracteristicii luate în studiu la nivelul populației)

Statistică (valoarea indicatorului caracteristicii luate în studiu calculată pe eșantion)

Variabilă (caracteristica luată în studiu)

Date (valorile măsurate pentru caracteristica luată în studiu din eșantion)

Indicatorul poate fi: medie, deviație standard, etc.

Din raţiuni economice şi de logistică

EXEMPLU

Pentru urmărirea unui anumit efect (terapeutic) nu se poate lua in studiu o întreagă populaţie.

Studiul se face pe un eşantion ales la întâmplare, pe o perioada determinata de timp.

Nivelul sangvin al calciului

Lotul 1

17,7 8,9 11,6 9,6 9,6 9,5 15,6 10,2

12,4 9,6 14,2 11,6 11,6 10,2 16,2 15,6 11,7 11,6 14,6 14,2 10,2 15,6 12,4 16,2 11,6 14,2 11,6 14,6 12,9 12,4 11,7 12,4 9,8 11,6 10,2 11,6 8,9 11,7 14,2 11,7 9,5 10,2 12,4 10,2 9,6 8,9 11,6 10,1

Estimare

Estimare interval Estimare

punctuală

Estimarea punctuală este atunci când parametrul al unei populații se estimează printr-o valoare izolată determinată de un estimator „e”.

Estimare interval este atunci când se stabilește un interval (e-, e+) care cu o probabilitate dată p, să includă valoarea adevărată a parametrului estimat

Estimaţie punctuală = o valoare care aproximează un parametru, fără a se cunoaşte precizia (respectiv, marja de eroare) a aproximării.

Estimaţie prin interval de încredere = două numere 1. marja de eroare (diferenţa celor 2 numere) saus, “precizia aproximării”) 2. o probabilitate care exprimă gradul de încredere ataşat intervalului.

Folosește o singură valoare.

Se bazează pe observarea unui singur eșantion.

Nu ne dă nici o informație legată de cât de aproape este această valoare de parametrul populației (care este necunoscut).

Exemplu: Media eșantionului (𝑥 =11,85 este o estimare punctuală pentru media populaței)

Extragem 3 eșantioane aleatoare:

› Eșantioan A: 20 pacienți din 200

› Eșantioan B: 50 pacienți din 200

› Eșantioan C: 100 pacienți din 200

Media valorilor (Hb A1c ) pentru cele 3 eșantioane sunt:

› Eșantioan A (20 pacienți) : 7,4

› Eșantioan B (50 pacienți) : 6,48

› Eșantioan C(100 pacienți): 6,65

Care dintre aceste estimări este cea mai bună pentru cei 200 de pacienți?

Repetăm experimentul pe mai multe eșantioane de

aceiași dimensiune.

OBSERVAȚII:

− Eșantioane diferite pot să dea estimări diferite pentru media populației.

− Există o dispersie a mediei eșantioanelor

Repetăm fiecare eșantion de 50 de ori și

avem următoarele rezulatate pentru medie:

20 eșantioane 50 eșantioane 100 eșantioane

1. Media tuturor mediilor eșantioanelor va fi aceiași cu media populației

2. Deviația standard (abaterea standard s) pentru toate mediile eșantioanelor este cunoscută ca

Eroarea standard (eroarera standard a mediei)

Populaţia Eşantioane Distribuţia

mediei de

eşantionare

1

2

3

4

1,2,3 M1=2.00

1,2,4 M2=2.33

3,4,1 M3=2.67

2,3,4 M4=3.00

μ=2.5

σ=1.29 Toate eşantioanele

posibile pentru N=3

Σ=10.00 m=10/4=2.5

1. Media tuturor mediilor eșantioanelor va fi aceiași cu media populației

media mediilor eşantioanelor extrase (denumită medie de eşantionare) este identică cu media populaţiei (în cazul dat: m=μ=2.5).

Media fiecărui eşantion variază în jurul mediei de eşantionare.

Media fiecărui eşantion pot fi considerată o ESTIMARE a mediei de eşantionare.

medie de eşantionare

Pentru exemplificare, se presupune o „populaţie” constituită din valorile 1,2,3,4

‒ Este expresia directă a variabilității (împrăștierii) valorilor eșantionului

‒ Este întotdeauna mai mică decât abaterea standard a valorilor populației.

Se calculează cu formula:

𝜎𝑥 =𝜎

𝑛 sau 𝑠𝑥 =

𝑠

𝑛 unde 𝑠2 =

𝑥𝑖−𝑥 𝑛𝑖=1

𝑛−1

𝜎𝑥 , 𝑠𝑥 : Eroarea standard a mediei

σ : abaterea standard a valorilor individuale la nivelul populației n : volumul eșantionului

cât de mult ar fluctua media dacă am calcula-o pentru eșantioane diferite, de aceeași mărime, extrase din aceeași populație

cât de precis/imprecis este estimată media populației de către media eșantionului

𝑠𝑚 … cu atât mai mare cu cât s este mai mare

𝑠𝑚 … cu atât mai mică cu cât n este mai mare

𝑠𝑚 =𝜎

𝑛

Dacă dimensiunea eșantionului crește și

se apropie de volumul populației

eroarea standard a mediei devine din

ce în ce mai mică.

Estimările sunt mai precise și valoarea

erorii standard scade pe măsură ce

crește dimensiunea eșantionului.

Eroarea standard a mediei=𝑠

𝑛

Deviația Standard

(s)

Eroarea standard a mediei

(𝒔𝒎)

− Măsoară dispersia între

valori individuale

− Măsoară dispersia mediei

− Se folosește în statistica

descriptivă și descrie

variabilitatea datelor

− Se folosește pentru

estimare și descrie

precizia medie

Deviație Standard DESCRIERE

Eroare Standard ESTIMARE

CONCLUZII: − Media de eșantionare este o variabilă aleatoare.

− Pentru un număr mare de eșantioane, această variabilă are o

distribuție normală.

− Media mediilor de eșantionare este egală cu media populației.

− Se poate calcula o deviație standard pentru acestă variabilă

aleatoare.

Eroarea de estimare este în legătură cu împrăștierea distribuției de eșantionare

Pentru un număr mare de eșantioane, MEDIA DE EȘANTIONARE are o distribuție normală.

Eșantion Populație ESTIMARE

Cât de buna este ESTIMAREA?

Teorema LIMITEI CENTRALE

Atunci când n (numarul de eșantioane) este suficient de mare:

𝑥 ~𝑁 𝜇,𝜎2

𝑛

Media are o distribuție normală.

Eșantion Populație ESTIMARE

Pe baza TLC

Distribuţia normală reprezintă o lege de distribuţie a unei mărimi aleatoare în jurul mediei sale.

Cea mai importantă distribuție continuă

Multe distribuții pot fi aproximate printr-o distribuție normală.

Distribuția normală este piatra de temelie a inferenței statistice.

Expresia analitică a legii lui Gauss

Graficul densităţii de probabilitate pentru legea

distribuţiei normale (Gauss-Laplace)

Este o curbă sub formă de clopot, cu următoarele proprietăţi:

Aria totală de sub curbă este egală cu 1

Este simetrică în jurul mediei

Cozile ei se întind la infinit, nu ating niciodată planul orizontal

Distribuţia normală are media μ şi variaţia σ2

Distribuţia normală standard este o distribuţie normală de medie 0 şi variaţie 1

26

Media ± 1 deviaţie standard: include ~ 68% din cazuri (34% din fiecare parte a distribuţiei)

Media ± 2 deviaţii standard: include ~ 95% din cazuri

Media ± 3 deviaţii standard: include ~ 99.7% din cazuri

27

0 1 2 3 -1 -2 -3

aria = 0.3413

Date importante

media > 2 SD,

media > SD

comparare cu

graficul de clopot

(curba lui Gauss)

media = mediana =

modul

testul de normalitate Kolmogorov-Smirnov (p>0.10)

68% dintre valori sunt în intervalul ± 1 deviație standard de medie, iar 95% în intervalul ± 2 deviații standard de medie

30

Estimarea punctuală

› = o valoare pentru parametrul teoretic estimat

› Influenţată de fluctuaţiilor de eşantionare

› poate fi la o mare distanţă de valoarea reală a parametrului estimat

Se recomandă ca estimarea unui parametru teoretic să se realizeze prin intermediul unui interval nu a unei singure valori ▫ Acest interval se numeşte interval de încredere ▫ Parametrul estimat aparţine cu o probabilitate intervalului de încredere

Concurs. Câte oi sunt???

V1. Pentru a câștiga trebuie să spui exact câte oi sunt. Nu este loc pentru eroare. Intervalul de încredere este minim, de fapt nu există. Puțini concurenți. V2. Pentru a câștiga trebuie să spui câte oi sunt cu eroare de ±50. Câțiva concurenți. V3. Pentru a câștiga trebuie să spui câte oi sunt cu eroare de ±100. Mai mulți concurenți.

Există un compromis între eroare și interval de încredere. Cu cât se cere o precizie mai mare, siguranța răspunsului este mai mică.

Acesta este conceptul fundamental al intervalului de încredere!!!!

32

CI este un şir de valori al unui estimator de interes calculat

astfel încât pentru o probabilitate de eroare aleasă, să

includă valorile adevărate ale variabilei.

P [valoarea critică inferioară < estimatorul < valoarea critică superioară] =

1-α

unde α = prag de semnificație (0,05; 0,01; 0,001

sau procentual 5%, 1%, 0,1%)

Intervalul definit de valorile critice va cuprinde estimatorul

populaţiei cu nivelul de încredere (probabilitate) de 1-α.

Se aplică în cazul

variabilelor distribuite normal!

Inteval de incredere (CI) =Prag de semnificație 1- =Nivel de încredere

Un interval de încredere (Confidence interval) pentru un

parametru este un interval construit pe baza datelor observate în aşa fel încât probabilitatea ca valoarea adevărată a parametrului să aparţină intervalului de încredere.

Nivelul de încredere (Confidence level) sau siguranța statistică este probabilitatea ca un interval de încredere

al unui parametru să conţină valoarea adevărată a parametrului. Este notată uzual cu 1-, fiind pragul (nivelul) de

încredere al intervalului.

Estimare a plajei de valori pe care o poate lua parametrul

Se utilizează:

media

eroarea standard a mediei

un nivel de încredere convențional de 95% (0.95) (confidence level) pe curba normală delimitată de anumite valori z sau t specificate in tabele

𝑥 ± t95% * 𝜎

𝑛 sau cu formula: 𝑥 ± t95% * 𝑠𝑚

unde:

𝑥 = media eşantionului,

σ = deviaţia standard a eşantionului

𝑠𝑚eroarea standard, a mediei

n = volumul eşantionului

t95% = pragul teoretic pentru nivelul de confidență

de 95%(distribuţie t).

De unde obţinem valoarea lui t95%?

Marja de eroare Marja de eroare

Sau în Excel cu ajutorul funcției TINV sau T.INV.2T (probabilitate, grade de libertate)

n

sm

n

sm 96.1,96.1

n96.1m

n96.1m

m

95.0aria

limita

inferioară

limita

superioară

z=1.96 se numeşte z critic deoarece reprezintă un prag limită, de o parte şi de alta a mediei

CI

› Dacă deviaţia standard este mare, CI mare

› Dacă volumul eşantionului este mare, CI mic.

Sau

CI crește (↑) cu creșterea deviației standard

CI crește (↑) cu creșterea nivelului de încredere

CI scade (↓) cu creșterea volumului eșantionului

39

Media glicemiei la un eşantion de 121 pacienţi este de 105 iar variaţia de 36.

Care este intervalul de încredere al mediei glicemiei în populaţia din care s-a extras eşantionul cu un prag de semnificaţie α=0,05, considerând că glicemia este normal distribuită şi pentru acest prag Z = 1,96.

n = 121

s2 = 36

s = 6

Se obțin următoarele

intervale de încredere

[105-1.07, 105+1.07] =0,05

[103.93 – 106.07] =0,01

[104-106] =0,001

1,07 este marja de eroare (1,2%)

40

200

100

TAS(mmHg)

Tratament A Tratament B Tratament C

Intervalele estimate sunt numite intervale de încredere;

Extremităţile intervalului de încredere sunt numite limite de încredere (Class Boundary).

Intervalul de încredere are 2 limite:

limita inferioară θi

limita superioară θs .

Intervale de încredere se pot stabili pentru orice parametru

Intervalele de încredere sunt din ce în ce mai utilizate in literatura medicală

1. 1-0,05=0,95 (95%)

2. 1-0,01=0,99 (99%)

3. 1-0,001=0,999 (99,9%)

Intervalul ( x − ∂, x + ∂ ) acoperă parametrul media x (media) cu o

probabilitate dată P P(x − ∂ < m < x + ∂) =1−

1- este nivelul de încredere

(95%,99%,99,9%)

prag de semnificaţie. (0,05,

0,01, 0,001)

Etape:

1. Stabilirea eşantionului

2. Determinarea volumului eşantionului (n)

3. Determinarea mediei eşantionului (m)

4. Determinarea dispersiei eşantionului (s)

5. Determinarea erorii standard a mediei

6. Determinarea argumentului α z

7. Determinarea intervalului de încredere

zsmzsmm mm ;

nux

nux

=0,05 sau =5% u=1,96

=0,01 sau =1% u=2,58

=0,001 sau =0,1% u=3,29

n este volumul selecţiei extrase

X este media selecţiei extrase

2 este dat şi este dispersia populaţiei

Prag de semnificatie

Marja de eroare

I. N>120

n

Sux

n

Sux

reprezintă eroarea standard a mediei n

S

II. N<120

n

Stx

n

Stx 1n,1n,

unde t,n-1 se citeşte din tabelul cu distribuţia "t" la

nivelul şi n-1 grade de libertate

În EXCEL funcția T.INV.2T((probabilitate,grade_libertate)

GL 0,05 0,01 0,001 GL 0,05 0,01 0,001 GL 0,05 0,01 0,001

2 4,3027 9,925 31,599 46 2,0129 2,687 3,515 89 1,987 2,632 3,403

3 3,1824 5,841 12,924 47 2,0117 2,6846 3,5099 90 1,987 2,632 3,402

4 2,7764 4,604 8,6103 48 2,0106 2,6822 3,5051 91 1,986 2,631 3,401

5 2,5706 4,032 6,8688 49 2,0096 2,68 3,5004 92 1,986 2,63 3,399

6 2,4469 3,707 5,9588 50 2,0086 2,6778 3,496 93 1,986 2,63 3,398

7 2,3646 3,5 5,4079 51 2,0076 2,6757 3,4918 94 1,986 2,629 3,397

8 2,306 3,355 5,0413 52 2,0066 2,6737 3,4877 95 1,985 2,629 3,396

9 2,2622 3,25 4,7809 53 2,0057 2,6718 3,4838 96 1,985 2,628 3,395

10 2,2281 3,169 4,5869 54 2,0049 2,67 3,48 97 1,985 2,628 3,394

11 2,201 3,106 4,437 55 2,004 2,6682 3,4764 98 1,985 2,627 3,393

12 2,1788 3,055 4,3178 56 2,0032 2,6665 3,4729 99 1,984 2,626 3,392

13 2,1604 3,012 4,2208 57 2,0025 2,6649 3,4696 100 1,984 2,626 3,391

14 2,1448 2,977 4,1405 58 2,0017 2,6633 3,4663 101 1,984 2,625 3,39

15 2,1314 2,947 4,0728 59 2,001 2,6618 3,4632 102 1,984 2,625 3,389

16 2,1199 2,921 4,015 60 2,0003 2,6603 3,4602 103 1,983 2,624 3,388

17 2,1098 2,898 3,9651 61 1,9996 2,6589 3,4573 104 1,983 2,624 3,387

18 2,1009 2,878 3,9216 62 1,999 2,6575 3,4545 105 1,983 2,624 3,386

19 2,093 2,861 3,8834 63 1,9983 2,6561 3,4518 106 1,983 2,623 3,385

20 2,086 2,845 3,8495 64 1,9977 2,6549 3,4491 107 1,982 2,623 3,384

21 2,0796 2,831 3,8193 65 1,9971 2,6536 3,4466 108 1,982 2,622 3,383

22 2,0739 2,819 3,7921 66 1,9966 2,6524 3,4441 109 1,982 2,622 3,382

23 2,0687 2,807 3,7676 67 1,996 2,6512 3,4417 110 1,982 2,621 3,381

24 2,0639 2,797 3,7454 68 1,9955 2,6501 3,4394 102 1,984 2,625 3,389

25 2,0595 2,787 3,7251 69 1,9949 2,649 3,4372 103 1,983 2,624 3,388

26 2,0555 2,779 3,7066 70 1,9944 2,6479 3,435 104 1,983 2,624 3,387

27 2,0518 2,771 3,6896 71 1,9939 2,6469 3,4329 105 1,983 2,624 3,386

28 2,0484 2,763 3,6739 72 1,9935 2,6459 3,4308 106 1,983 2,623 3,385

29 2,0452 2,756 3,6594 73 1,993 2,6449 3,4289 107 1,982 2,623 3,384

30 2,0423 2,75 3,646 74 1,9925 2,6439 3,4269 108 1,982 2,622 3,383

31 2,0395 2,744 3,6335 75 1,9921 2,643 3,425 109 1,982 2,622 3,382

32 2,0369 2,739 3,6218 76 1,9917 2,6421 3,4232 110 1,982 2,621 3,381

33 2,0345 2,733 3,6109 77 1,9913 2,6412 3,4214 111 1,982 2,621 3,38

34 2,0322 2,728 3,6007 78 1,9908 2,6403 3,4197 112 1,981 2,62 3,38

35 2,0301 2,724 3,5911 79 1,9905 2,6395 3,418 113 1,981 2,62 3,379

36 2,0281 2,72 3,5821 80 1,9901 2,6387 3,4163 114 1,981 2,62 3,378

37 2,0262 2,715 3,5737 81 1,9897 2,6379 3,4147 115 1,981 2,619 3,377

38 2,0244 2,712 3,5657 82 1,989 2,637 3,413 116 1,981 2,619 3,376

39 2,0227 2,708 3,5581 83 1,989 2,636 3,412 117 1,98 2,619 3,376

40 2,0211 2,705 3,551 84 1,989 2,636 3,41 118 1,98 2,618 3,375

41 2,0195 2,701 3,5442 85 1,988 2,635 3,409 119 1,98 2,618 3,374

43 2,0167 2,6951 3,5316 86 1,988 2,634 3,407 120 1,98 2,617 3,374

44 2,0154 2,6923 3,5258 87 1,988 2,634 3,406 >120 1,96 2,576 3,291

45 2,0141 2,6896 3,5203 88 1,987 2,633 3,405

Returnează inversul distribuției t Student bi-alternativă

IMPORTANT Această funcție a fost înlocuită cu una sau mai multe funcții noi, care pot oferi precizie îmbunătățită și ale căror nume reflectă mai bine utilizarea lor. Această funcție este disponibilă în continuare pentru compatibilitate cu versiunile anterioare de Excel. Însă, dacă nu este necesară compatibilitatea inversă, se recomandă să utilizați de acum înainte funcțiile noi, deoarece acestea își descriu mai precis funcționalitatea.

T.INV.2T sau funcția T.INV.

Fie dată o populaţie cu repartiţie normală având

media şi dispersia 2=1296. S-a extras o selecţie

de volum n=9 pe baza căreia s-a calculat =195.

Să se calculeze intervalul de încredere ale mediei a

populaţiei.

x

Rezolvare. nux

nux

129

1296

n

Pentru diferite nivele de încredere se obţine:

=0,05 167,33222,67 (p= 95%) marja de eroare 27,67

=0,01 154,73235,26 (p= 99%) marja de eroare 40,27

=0,001 134,5255,5 (p= 99,9%) marja de roare 60,5

u=tinv(0,05;8)=2,306 CONFIDENCE.NORM=24,94 Marja de eroare=27,672

Se consideră repartiţia procentuală de grăsime a laptelui la

rasa Roşia. Pentru o selecţie de n=93 s-a obţinut media

X=3,95 şi S2=0,07.

Să se estimeze procentul mediu de grăsime a laptelui de

vacă la această rasă de vacă.

Rezolvare. n<120

n

Stx

n

Stx 1n,1n, t0,05;93-1= t0,05,92=1,986

t0,01;92=2,631;t0,001;92=3,402

Se estimează cu o probabilitate de 95 % că 3,9053,995

Se estimează cu o probabilitate de 99 % că 3,894,01

Se estimează cu o probabilitate de 99,9 % că 3,87 4,03

Pentru un lot format din 50 de vaci din rasa Bălţata româneasca

s-au obţinut următoarele valori pentru producţia de lapte:

7 27 23 7 16

18 10 9 16 11

11 6 29 12 15

19 8 26 22 17

29 29 7 27 14

29 19 23 16 24

28 24 11 21 8

19 13 25 7 18

Considerând ca acest caracter are o repartiţie normala, sa se

estimeze cu probabilitatea de 95%, 99% şi 99,9% intervalul de

încredere al parametrului "producţia medie zilnica de lapte" la

vacile din aceasta rasa.

1. Media eşantionului

2. Eroarea standard a mediei

3. Determinarea valorii z pentru nivelul de încredere de 95%, 99% respectiv 99,9%.

4. Calculul efectiv a limitelor intervalelor de încredere

Cu probabilitatea de 95%, intervalul de încrede încredere al parametrului "producţia medie zilnica de lapte" la vacile din rasa Bălţată româneasca este cuprins între 15,08 şi 19,91.

Cu probabilitatea de 99%, intervalul de încrede încredere al parametrului "producţia medie zilnica de lapte" la vacile din rasa Bălţată româneasca este cuprins între 14,27 şi 20,72

Cu probabilitatea de 99,9%, intervalul de încrede încredere al parametrului "producţia medie zilnica de lapte" la vacile din rasa Bălţata româneasca este cuprins între 13,25 şi 21,741.

Intervalul de încredere al mediei estimează intervalul care include producţia medie zilnica de lapte, necunoscută a populaţiei de vaci din rasa Bălţata româneasca, cu un anumit nivel de încredere.

Putem afirma că producţia medie zilnica de lapte a populaţiei de vaci din rasa Bălţata româneasca se găseşte în intervalul [15,08;19,91]cu o eroare de 0,05 sau 5% sau cu probabilitatea de 95%.

Nouă sute de elevi(900) de liceu au fost selectați aleator

pentru un sondaj national. Pentru participanții la sondaj,

medie GPA (grade point average ) a fost de 2,7, iar deviația

standard a fost de 0,4. Care este marja de eroare,

presupunând un nivel de încredere de 95%?

(A) 0.013

(B) 0.025

(C) 0.500

(D) 1.960

(E) Niciunul.

Marja de eroare (ME) 𝑀𝐸 = 𝑣𝑎𝑙𝑜𝑎𝑟𝑒𝑎 𝑐𝑟𝑖𝑡𝑖𝑐𝑎 ∙ 𝑒𝑟𝑜𝑎𝑟𝑒𝑎 𝑠𝑡𝑎𝑛𝑑𝑎𝑟𝑑 𝑎 𝑚𝑒𝑑𝑖𝑒𝑖

Eroarea standard a mediei (𝑠𝑚)

𝑠𝑚 =𝑠

𝑛

𝑠𝑚 =0,4

900=

0,4

30= 0,013

ME = valoarea critică x Eroarea standard a mediei= 1.96 * 0.013 =0.02548

Să se afle numărul de observaţii ce trebuie efectuate pentru a estima talia medie a populaţiei bărbaţilor adulte dacă se ştie că S2=9 cm2 şi se cere o precizie =1 cm, care să fie asigurată cu probabilitatea 1-= 0.95

Volumul esantionului depinde de trei elemente:

1. Eroarea maxima admisa = Precizia (Dx);

2. Probabilitatea de garantare a rezultatelor (p);

3. Dispersia = Nivelul imprastierii populatiei studiate (s2).

Se citeste: "Cu o probabilitate p se garanteaza rezultatele cu o eroare

maxima admisa de +/-e%".

Probabilitatea de garantare a rezultatelor și eroarea maxima

admisa sunt alese in conformitate cu precizia pe care doreste sa o

aiba sondajul.

Probabilitatea se alege intre valorile 95% si 99%.

Eroarea maxima admisa poate lua valori acceptabile de la 1%

pana la 5%.

n

szm

n

szm

eroaremarja_

n

sz

2

szn

Exemplu. Să se afle numărul de observaţii ce trebuie efectuate pentru a estima talia medie a populaţiei bărbaţilor adulte dacă se ştie că S2=9 cm2 şi se cere o precizie (marja de roare) =1 cm, care să fie asigurată cu probabilitatea 1-= 0.95 =0.05 S=3 cm z=1,96

35574,35

1

396,1

2

n

pentru n=34 z0,05;34=2,033

37197,371

3033.2

2

n

Sunt necesare 37 de observaţii pentru estimarea taliei medii cu precizia de 1 cm.

Anderson-Darling Normality Test Calculator http://www.kevinotto.com/RSS/templates/Anderso

n-Darling Normality Test Calculator.xls

1,3964 AD test statistic

1,414741 AD* test statistic

0,001176 P-value