necesitatea estimării metode de estimare teorema …ileana.brudiu.ro/mvr/curs/13. estimarea...
Post on 27-Dec-2019
50 Views
Preview:
TRANSCRIPT
Ce înseamnă “estimare statistică”
Necesitatea estimării
Metode de estimare
Teorema limitei centrale
Eroarea standard a mediei
Intervale de încredere
Limite de încredere
Marjă de eroare
Prin estimaţie se înţelege operaţia de extindere, in limitele specificate de incertitudinea exprimată în termeni probabilistici, a rezultatelor obţinute în sondaj, asupra întregii populaţii.
Estimarea reprezintă procesul utilizării informaţiilor obţinute de la un eşantion ales la întâmplare în scopul obţinerii de concluzii referitoare la valori ale parametrilor ce caracterizează populaţia.
DEFINIȚII DEX
A estima = a aproxima. Estimare = aproximare. Estimaţie = aproximaţie.
POPULAȚIE
Toți indivizii care ne interesează
Eșantion
Eșantion grup de indivizi aleși din poplație care ne interesează pentru
studiu
Concluziile (rezultatele) obținute petru eșantion se folosesc ca o estimare pentru polulație.
(eșantionul trebuie să fie reprezentativ pentru populație)
Populație și eșantion
Populație
Estimarea
parametrului pentru eșantion
Parametrul populației
Eșantion
Intervalul de încredere pentru parametrul populației
Mecanismul de eșantionare
Indicatorii eșantionului se numesc STATISTICI
Indicatorii populației numesc PARAMETRI
Populație (idivizii luați în studiu)
Eșantion (idivizii supuși studiului (experimentului))
Parametru (valoarea indicatorului caracteristicii luate în studiu la nivelul populației)
Statistică (valoarea indicatorului caracteristicii luate în studiu calculată pe eșantion)
Variabilă (caracteristica luată în studiu)
Date (valorile măsurate pentru caracteristica luată în studiu din eșantion)
Indicatorul poate fi: medie, deviație standard, etc.
Din raţiuni economice şi de logistică
EXEMPLU
Pentru urmărirea unui anumit efect (terapeutic) nu se poate lua in studiu o întreagă populaţie.
Studiul se face pe un eşantion ales la întâmplare, pe o perioada determinata de timp.
Nivelul sangvin al calciului
Lotul 1
17,7 8,9 11,6 9,6 9,6 9,5 15,6 10,2
12,4 9,6 14,2 11,6 11,6 10,2 16,2 15,6 11,7 11,6 14,6 14,2 10,2 15,6 12,4 16,2 11,6 14,2 11,6 14,6 12,9 12,4 11,7 12,4 9,8 11,6 10,2 11,6 8,9 11,7 14,2 11,7 9,5 10,2 12,4 10,2 9,6 8,9 11,6 10,1
Estimare
Estimare interval Estimare
punctuală
Estimarea punctuală este atunci când parametrul al unei populații se estimează printr-o valoare izolată determinată de un estimator „e”.
Estimare interval este atunci când se stabilește un interval (e-, e+) care cu o probabilitate dată p, să includă valoarea adevărată a parametrului estimat
Estimaţie punctuală = o valoare care aproximează un parametru, fără a se cunoaşte precizia (respectiv, marja de eroare) a aproximării.
Estimaţie prin interval de încredere = două numere 1. marja de eroare (diferenţa celor 2 numere) saus, “precizia aproximării”) 2. o probabilitate care exprimă gradul de încredere ataşat intervalului.
Folosește o singură valoare.
Se bazează pe observarea unui singur eșantion.
Nu ne dă nici o informație legată de cât de aproape este această valoare de parametrul populației (care este necunoscut).
Exemplu: Media eșantionului (𝑥 =11,85 este o estimare punctuală pentru media populaței)
Extragem 3 eșantioane aleatoare:
› Eșantioan A: 20 pacienți din 200
› Eșantioan B: 50 pacienți din 200
› Eșantioan C: 100 pacienți din 200
Media valorilor (Hb A1c ) pentru cele 3 eșantioane sunt:
› Eșantioan A (20 pacienți) : 7,4
› Eșantioan B (50 pacienți) : 6,48
› Eșantioan C(100 pacienți): 6,65
Care dintre aceste estimări este cea mai bună pentru cei 200 de pacienți?
Repetăm experimentul pe mai multe eșantioane de
aceiași dimensiune.
OBSERVAȚII:
− Eșantioane diferite pot să dea estimări diferite pentru media populației.
− Există o dispersie a mediei eșantioanelor
Repetăm fiecare eșantion de 50 de ori și
avem următoarele rezulatate pentru medie:
20 eșantioane 50 eșantioane 100 eșantioane
1. Media tuturor mediilor eșantioanelor va fi aceiași cu media populației
2. Deviația standard (abaterea standard s) pentru toate mediile eșantioanelor este cunoscută ca
Eroarea standard (eroarera standard a mediei)
Populaţia Eşantioane Distribuţia
mediei de
eşantionare
1
2
3
4
1,2,3 M1=2.00
1,2,4 M2=2.33
3,4,1 M3=2.67
2,3,4 M4=3.00
μ=2.5
σ=1.29 Toate eşantioanele
posibile pentru N=3
Σ=10.00 m=10/4=2.5
1. Media tuturor mediilor eșantioanelor va fi aceiași cu media populației
media mediilor eşantioanelor extrase (denumită medie de eşantionare) este identică cu media populaţiei (în cazul dat: m=μ=2.5).
Media fiecărui eşantion variază în jurul mediei de eşantionare.
Media fiecărui eşantion pot fi considerată o ESTIMARE a mediei de eşantionare.
medie de eşantionare
Pentru exemplificare, se presupune o „populaţie” constituită din valorile 1,2,3,4
‒ Este expresia directă a variabilității (împrăștierii) valorilor eșantionului
‒ Este întotdeauna mai mică decât abaterea standard a valorilor populației.
Se calculează cu formula:
𝜎𝑥 =𝜎
𝑛 sau 𝑠𝑥 =
𝑠
𝑛 unde 𝑠2 =
𝑥𝑖−𝑥 𝑛𝑖=1
𝑛−1
𝜎𝑥 , 𝑠𝑥 : Eroarea standard a mediei
σ : abaterea standard a valorilor individuale la nivelul populației n : volumul eșantionului
cât de mult ar fluctua media dacă am calcula-o pentru eșantioane diferite, de aceeași mărime, extrase din aceeași populație
cât de precis/imprecis este estimată media populației de către media eșantionului
𝑠𝑚 … cu atât mai mare cu cât s este mai mare
𝑠𝑚 … cu atât mai mică cu cât n este mai mare
𝑠𝑚 =𝜎
𝑛
Dacă dimensiunea eșantionului crește și
se apropie de volumul populației
eroarea standard a mediei devine din
ce în ce mai mică.
Estimările sunt mai precise și valoarea
erorii standard scade pe măsură ce
crește dimensiunea eșantionului.
Eroarea standard a mediei=𝑠
𝑛
Deviația Standard
(s)
Eroarea standard a mediei
(𝒔𝒎)
− Măsoară dispersia între
valori individuale
− Măsoară dispersia mediei
− Se folosește în statistica
descriptivă și descrie
variabilitatea datelor
− Se folosește pentru
estimare și descrie
precizia medie
Deviație Standard DESCRIERE
Eroare Standard ESTIMARE
CONCLUZII: − Media de eșantionare este o variabilă aleatoare.
− Pentru un număr mare de eșantioane, această variabilă are o
distribuție normală.
− Media mediilor de eșantionare este egală cu media populației.
− Se poate calcula o deviație standard pentru acestă variabilă
aleatoare.
Eroarea de estimare este în legătură cu împrăștierea distribuției de eșantionare
Eșantion Populație ESTIMARE
Cât de buna este ESTIMAREA?
Teorema LIMITEI CENTRALE
Atunci când n (numarul de eșantioane) este suficient de mare:
𝑥 ~𝑁 𝜇,𝜎2
𝑛
Media are o distribuție normală.
Eșantion Populație ESTIMARE
Pe baza TLC
Distribuţia normală reprezintă o lege de distribuţie a unei mărimi aleatoare în jurul mediei sale.
Cea mai importantă distribuție continuă
Multe distribuții pot fi aproximate printr-o distribuție normală.
Distribuția normală este piatra de temelie a inferenței statistice.
Expresia analitică a legii lui Gauss
Este o curbă sub formă de clopot, cu următoarele proprietăţi:
Aria totală de sub curbă este egală cu 1
Este simetrică în jurul mediei
Cozile ei se întind la infinit, nu ating niciodată planul orizontal
Distribuţia normală are media μ şi variaţia σ2
Distribuţia normală standard este o distribuţie normală de medie 0 şi variaţie 1
26
Media ± 1 deviaţie standard: include ~ 68% din cazuri (34% din fiecare parte a distribuţiei)
Media ± 2 deviaţii standard: include ~ 95% din cazuri
Media ± 3 deviaţii standard: include ~ 99.7% din cazuri
27
0 1 2 3 -1 -2 -3
aria = 0.3413
media > 2 SD,
media > SD
comparare cu
graficul de clopot
(curba lui Gauss)
media = mediana =
modul
testul de normalitate Kolmogorov-Smirnov (p>0.10)
68% dintre valori sunt în intervalul ± 1 deviație standard de medie, iar 95% în intervalul ± 2 deviații standard de medie
30
Estimarea punctuală
› = o valoare pentru parametrul teoretic estimat
› Influenţată de fluctuaţiilor de eşantionare
› poate fi la o mare distanţă de valoarea reală a parametrului estimat
Se recomandă ca estimarea unui parametru teoretic să se realizeze prin intermediul unui interval nu a unei singure valori ▫ Acest interval se numeşte interval de încredere ▫ Parametrul estimat aparţine cu o probabilitate intervalului de încredere
Concurs. Câte oi sunt???
V1. Pentru a câștiga trebuie să spui exact câte oi sunt. Nu este loc pentru eroare. Intervalul de încredere este minim, de fapt nu există. Puțini concurenți. V2. Pentru a câștiga trebuie să spui câte oi sunt cu eroare de ±50. Câțiva concurenți. V3. Pentru a câștiga trebuie să spui câte oi sunt cu eroare de ±100. Mai mulți concurenți.
Există un compromis între eroare și interval de încredere. Cu cât se cere o precizie mai mare, siguranța răspunsului este mai mică.
Acesta este conceptul fundamental al intervalului de încredere!!!!
32
CI este un şir de valori al unui estimator de interes calculat
astfel încât pentru o probabilitate de eroare aleasă, să
includă valorile adevărate ale variabilei.
P [valoarea critică inferioară < estimatorul < valoarea critică superioară] =
1-α
unde α = prag de semnificație (0,05; 0,01; 0,001
sau procentual 5%, 1%, 0,1%)
Intervalul definit de valorile critice va cuprinde estimatorul
populaţiei cu nivelul de încredere (probabilitate) de 1-α.
Se aplică în cazul
variabilelor distribuite normal!
Inteval de incredere (CI) =Prag de semnificație 1- =Nivel de încredere
Un interval de încredere (Confidence interval) pentru un
parametru este un interval construit pe baza datelor observate în aşa fel încât probabilitatea ca valoarea adevărată a parametrului să aparţină intervalului de încredere.
Nivelul de încredere (Confidence level) sau siguranța statistică este probabilitatea ca un interval de încredere
al unui parametru să conţină valoarea adevărată a parametrului. Este notată uzual cu 1-, fiind pragul (nivelul) de
încredere al intervalului.
Estimare a plajei de valori pe care o poate lua parametrul
Se utilizează:
media
eroarea standard a mediei
un nivel de încredere convențional de 95% (0.95) (confidence level) pe curba normală delimitată de anumite valori z sau t specificate in tabele
𝑥 ± t95% * 𝜎
𝑛 sau cu formula: 𝑥 ± t95% * 𝑠𝑚
unde:
𝑥 = media eşantionului,
σ = deviaţia standard a eşantionului
𝑠𝑚eroarea standard, a mediei
n = volumul eşantionului
t95% = pragul teoretic pentru nivelul de confidență
de 95%(distribuţie t).
De unde obţinem valoarea lui t95%?
Marja de eroare Marja de eroare
n
sm
n
sm 96.1,96.1
n96.1m
n96.1m
m
95.0aria
limita
inferioară
limita
superioară
z=1.96 se numeşte z critic deoarece reprezintă un prag limită, de o parte şi de alta a mediei
CI
› Dacă deviaţia standard este mare, CI mare
› Dacă volumul eşantionului este mare, CI mic.
Sau
CI crește (↑) cu creșterea deviației standard
CI crește (↑) cu creșterea nivelului de încredere
CI scade (↓) cu creșterea volumului eșantionului
39
Media glicemiei la un eşantion de 121 pacienţi este de 105 iar variaţia de 36.
Care este intervalul de încredere al mediei glicemiei în populaţia din care s-a extras eşantionul cu un prag de semnificaţie α=0,05, considerând că glicemia este normal distribuită şi pentru acest prag Z = 1,96.
n = 121
s2 = 36
s = 6
Se obțin următoarele
intervale de încredere
[105-1.07, 105+1.07] =0,05
[103.93 – 106.07] =0,01
[104-106] =0,001
1,07 este marja de eroare (1,2%)
Intervalele estimate sunt numite intervale de încredere;
Extremităţile intervalului de încredere sunt numite limite de încredere (Class Boundary).
Intervalul de încredere are 2 limite:
limita inferioară θi
limita superioară θs .
Intervale de încredere se pot stabili pentru orice parametru
Intervalele de încredere sunt din ce în ce mai utilizate in literatura medicală
1. 1-0,05=0,95 (95%)
2. 1-0,01=0,99 (99%)
3. 1-0,001=0,999 (99,9%)
Intervalul ( x − ∂, x + ∂ ) acoperă parametrul media x (media) cu o
probabilitate dată P P(x − ∂ < m < x + ∂) =1−
1- este nivelul de încredere
(95%,99%,99,9%)
prag de semnificaţie. (0,05,
0,01, 0,001)
Etape:
1. Stabilirea eşantionului
2. Determinarea volumului eşantionului (n)
3. Determinarea mediei eşantionului (m)
4. Determinarea dispersiei eşantionului (s)
5. Determinarea erorii standard a mediei
6. Determinarea argumentului α z
7. Determinarea intervalului de încredere
zsmzsmm mm ;
nux
nux
=0,05 sau =5% u=1,96
=0,01 sau =1% u=2,58
=0,001 sau =0,1% u=3,29
n este volumul selecţiei extrase
X este media selecţiei extrase
2 este dat şi este dispersia populaţiei
Prag de semnificatie
Marja de eroare
I. N>120
n
Sux
n
Sux
reprezintă eroarea standard a mediei n
S
II. N<120
n
Stx
n
Stx 1n,1n,
unde t,n-1 se citeşte din tabelul cu distribuţia "t" la
nivelul şi n-1 grade de libertate
În EXCEL funcția T.INV.2T((probabilitate,grade_libertate)
GL 0,05 0,01 0,001 GL 0,05 0,01 0,001 GL 0,05 0,01 0,001
2 4,3027 9,925 31,599 46 2,0129 2,687 3,515 89 1,987 2,632 3,403
3 3,1824 5,841 12,924 47 2,0117 2,6846 3,5099 90 1,987 2,632 3,402
4 2,7764 4,604 8,6103 48 2,0106 2,6822 3,5051 91 1,986 2,631 3,401
5 2,5706 4,032 6,8688 49 2,0096 2,68 3,5004 92 1,986 2,63 3,399
6 2,4469 3,707 5,9588 50 2,0086 2,6778 3,496 93 1,986 2,63 3,398
7 2,3646 3,5 5,4079 51 2,0076 2,6757 3,4918 94 1,986 2,629 3,397
8 2,306 3,355 5,0413 52 2,0066 2,6737 3,4877 95 1,985 2,629 3,396
9 2,2622 3,25 4,7809 53 2,0057 2,6718 3,4838 96 1,985 2,628 3,395
10 2,2281 3,169 4,5869 54 2,0049 2,67 3,48 97 1,985 2,628 3,394
11 2,201 3,106 4,437 55 2,004 2,6682 3,4764 98 1,985 2,627 3,393
12 2,1788 3,055 4,3178 56 2,0032 2,6665 3,4729 99 1,984 2,626 3,392
13 2,1604 3,012 4,2208 57 2,0025 2,6649 3,4696 100 1,984 2,626 3,391
14 2,1448 2,977 4,1405 58 2,0017 2,6633 3,4663 101 1,984 2,625 3,39
15 2,1314 2,947 4,0728 59 2,001 2,6618 3,4632 102 1,984 2,625 3,389
16 2,1199 2,921 4,015 60 2,0003 2,6603 3,4602 103 1,983 2,624 3,388
17 2,1098 2,898 3,9651 61 1,9996 2,6589 3,4573 104 1,983 2,624 3,387
18 2,1009 2,878 3,9216 62 1,999 2,6575 3,4545 105 1,983 2,624 3,386
19 2,093 2,861 3,8834 63 1,9983 2,6561 3,4518 106 1,983 2,623 3,385
20 2,086 2,845 3,8495 64 1,9977 2,6549 3,4491 107 1,982 2,623 3,384
21 2,0796 2,831 3,8193 65 1,9971 2,6536 3,4466 108 1,982 2,622 3,383
22 2,0739 2,819 3,7921 66 1,9966 2,6524 3,4441 109 1,982 2,622 3,382
23 2,0687 2,807 3,7676 67 1,996 2,6512 3,4417 110 1,982 2,621 3,381
24 2,0639 2,797 3,7454 68 1,9955 2,6501 3,4394 102 1,984 2,625 3,389
25 2,0595 2,787 3,7251 69 1,9949 2,649 3,4372 103 1,983 2,624 3,388
26 2,0555 2,779 3,7066 70 1,9944 2,6479 3,435 104 1,983 2,624 3,387
27 2,0518 2,771 3,6896 71 1,9939 2,6469 3,4329 105 1,983 2,624 3,386
28 2,0484 2,763 3,6739 72 1,9935 2,6459 3,4308 106 1,983 2,623 3,385
29 2,0452 2,756 3,6594 73 1,993 2,6449 3,4289 107 1,982 2,623 3,384
30 2,0423 2,75 3,646 74 1,9925 2,6439 3,4269 108 1,982 2,622 3,383
31 2,0395 2,744 3,6335 75 1,9921 2,643 3,425 109 1,982 2,622 3,382
32 2,0369 2,739 3,6218 76 1,9917 2,6421 3,4232 110 1,982 2,621 3,381
33 2,0345 2,733 3,6109 77 1,9913 2,6412 3,4214 111 1,982 2,621 3,38
34 2,0322 2,728 3,6007 78 1,9908 2,6403 3,4197 112 1,981 2,62 3,38
35 2,0301 2,724 3,5911 79 1,9905 2,6395 3,418 113 1,981 2,62 3,379
36 2,0281 2,72 3,5821 80 1,9901 2,6387 3,4163 114 1,981 2,62 3,378
37 2,0262 2,715 3,5737 81 1,9897 2,6379 3,4147 115 1,981 2,619 3,377
38 2,0244 2,712 3,5657 82 1,989 2,637 3,413 116 1,981 2,619 3,376
39 2,0227 2,708 3,5581 83 1,989 2,636 3,412 117 1,98 2,619 3,376
40 2,0211 2,705 3,551 84 1,989 2,636 3,41 118 1,98 2,618 3,375
41 2,0195 2,701 3,5442 85 1,988 2,635 3,409 119 1,98 2,618 3,374
43 2,0167 2,6951 3,5316 86 1,988 2,634 3,407 120 1,98 2,617 3,374
44 2,0154 2,6923 3,5258 87 1,988 2,634 3,406 >120 1,96 2,576 3,291
45 2,0141 2,6896 3,5203 88 1,987 2,633 3,405
Returnează inversul distribuției t Student bi-alternativă
IMPORTANT Această funcție a fost înlocuită cu una sau mai multe funcții noi, care pot oferi precizie îmbunătățită și ale căror nume reflectă mai bine utilizarea lor. Această funcție este disponibilă în continuare pentru compatibilitate cu versiunile anterioare de Excel. Însă, dacă nu este necesară compatibilitatea inversă, se recomandă să utilizați de acum înainte funcțiile noi, deoarece acestea își descriu mai precis funcționalitatea.
T.INV.2T sau funcția T.INV.
Fie dată o populaţie cu repartiţie normală având
media şi dispersia 2=1296. S-a extras o selecţie
de volum n=9 pe baza căreia s-a calculat =195.
Să se calculeze intervalul de încredere ale mediei a
populaţiei.
x
Rezolvare. nux
nux
129
1296
n
Pentru diferite nivele de încredere se obţine:
=0,05 167,33222,67 (p= 95%) marja de eroare 27,67
=0,01 154,73235,26 (p= 99%) marja de eroare 40,27
=0,001 134,5255,5 (p= 99,9%) marja de roare 60,5
u=tinv(0,05;8)=2,306 CONFIDENCE.NORM=24,94 Marja de eroare=27,672
Se consideră repartiţia procentuală de grăsime a laptelui la
rasa Roşia. Pentru o selecţie de n=93 s-a obţinut media
X=3,95 şi S2=0,07.
Să se estimeze procentul mediu de grăsime a laptelui de
vacă la această rasă de vacă.
Rezolvare. n<120
n
Stx
n
Stx 1n,1n, t0,05;93-1= t0,05,92=1,986
t0,01;92=2,631;t0,001;92=3,402
Se estimează cu o probabilitate de 95 % că 3,9053,995
Se estimează cu o probabilitate de 99 % că 3,894,01
Se estimează cu o probabilitate de 99,9 % că 3,87 4,03
Pentru un lot format din 50 de vaci din rasa Bălţata româneasca
s-au obţinut următoarele valori pentru producţia de lapte:
7 27 23 7 16
18 10 9 16 11
11 6 29 12 15
19 8 26 22 17
29 29 7 27 14
29 19 23 16 24
28 24 11 21 8
19 13 25 7 18
Considerând ca acest caracter are o repartiţie normala, sa se
estimeze cu probabilitatea de 95%, 99% şi 99,9% intervalul de
încredere al parametrului "producţia medie zilnica de lapte" la
vacile din aceasta rasa.
1. Media eşantionului
2. Eroarea standard a mediei
3. Determinarea valorii z pentru nivelul de încredere de 95%, 99% respectiv 99,9%.
4. Calculul efectiv a limitelor intervalelor de încredere
Cu probabilitatea de 95%, intervalul de încrede încredere al parametrului "producţia medie zilnica de lapte" la vacile din rasa Bălţată româneasca este cuprins între 15,08 şi 19,91.
Cu probabilitatea de 99%, intervalul de încrede încredere al parametrului "producţia medie zilnica de lapte" la vacile din rasa Bălţată româneasca este cuprins între 14,27 şi 20,72
Cu probabilitatea de 99,9%, intervalul de încrede încredere al parametrului "producţia medie zilnica de lapte" la vacile din rasa Bălţata româneasca este cuprins între 13,25 şi 21,741.
Intervalul de încredere al mediei estimează intervalul care include producţia medie zilnica de lapte, necunoscută a populaţiei de vaci din rasa Bălţata româneasca, cu un anumit nivel de încredere.
Putem afirma că producţia medie zilnica de lapte a populaţiei de vaci din rasa Bălţata româneasca se găseşte în intervalul [15,08;19,91]cu o eroare de 0,05 sau 5% sau cu probabilitatea de 95%.
Nouă sute de elevi(900) de liceu au fost selectați aleator
pentru un sondaj national. Pentru participanții la sondaj,
medie GPA (grade point average ) a fost de 2,7, iar deviația
standard a fost de 0,4. Care este marja de eroare,
presupunând un nivel de încredere de 95%?
(A) 0.013
(B) 0.025
(C) 0.500
(D) 1.960
(E) Niciunul.
Marja de eroare (ME) 𝑀𝐸 = 𝑣𝑎𝑙𝑜𝑎𝑟𝑒𝑎 𝑐𝑟𝑖𝑡𝑖𝑐𝑎 ∙ 𝑒𝑟𝑜𝑎𝑟𝑒𝑎 𝑠𝑡𝑎𝑛𝑑𝑎𝑟𝑑 𝑎 𝑚𝑒𝑑𝑖𝑒𝑖
Eroarea standard a mediei (𝑠𝑚)
𝑠𝑚 =𝑠
𝑛
𝑠𝑚 =0,4
900=
0,4
30= 0,013
ME = valoarea critică x Eroarea standard a mediei= 1.96 * 0.013 =0.02548
Să se afle numărul de observaţii ce trebuie efectuate pentru a estima talia medie a populaţiei bărbaţilor adulte dacă se ştie că S2=9 cm2 şi se cere o precizie =1 cm, care să fie asigurată cu probabilitatea 1-= 0.95
Volumul esantionului depinde de trei elemente:
1. Eroarea maxima admisa = Precizia (Dx);
2. Probabilitatea de garantare a rezultatelor (p);
3. Dispersia = Nivelul imprastierii populatiei studiate (s2).
Se citeste: "Cu o probabilitate p se garanteaza rezultatele cu o eroare
maxima admisa de +/-e%".
Probabilitatea de garantare a rezultatelor și eroarea maxima
admisa sunt alese in conformitate cu precizia pe care doreste sa o
aiba sondajul.
Probabilitatea se alege intre valorile 95% si 99%.
Eroarea maxima admisa poate lua valori acceptabile de la 1%
pana la 5%.
Exemplu. Să se afle numărul de observaţii ce trebuie efectuate pentru a estima talia medie a populaţiei bărbaţilor adulte dacă se ştie că S2=9 cm2 şi se cere o precizie (marja de roare) =1 cm, care să fie asigurată cu probabilitatea 1-= 0.95 =0.05 S=3 cm z=1,96
35574,35
1
396,1
2
n
pentru n=34 z0,05;34=2,033
37197,371
3033.2
2
n
Sunt necesare 37 de observaţii pentru estimarea taliei medii cu precizia de 1 cm.
top related