cap4
DESCRIPTION
Cap4TRANSCRIPT
-
Notaii utilizate: R = numrul de uniti primare din populaie; r = numrul de uniti primare selectate n primul stadiu; Ni = numrul total de uniti simple (indivizi) din UPi; ni = numrul de uniti simple (indivizi) extrase din UP ;
=
=R
1iiNN numrul total de indivizi;
=
=iN
1jiji yT totalul variabilei pentru unitatea primar UPi;
=
=in
1jiji yT estimatorul totalului variabilei pentru unitatea primar UPi;
=
=iN
1jijyRT totalul variabilei pentru toate unitile primare;
=
==
in
1jij
i
ir
1i
ynN
rRT estimatorul totalului variabilei studiate.
iY estimatorul mediei caracteristicii calculat pentru unitatea primar UPi;
Y estimatorul mediei caracteristicii la nivelul populaiei studiate; )T(V reprezint variaia estimatorului totalului variabilei i st la baza calculrii
erorii de reprezentativitate. Este definit de urmtoarea relaie:
=
=R
1i
2i
21 )TT(R
1 variaia n populaie a totalurilor unitilor primare.
Deoarece aceasta nu se cunoate se va utiliza estimatorul acesteia:
=
=r
1i
2i
21 )TT(1r
1
Sondajul bistadial
i
2,i2
r
1i i
i2i
212
n
Nn
1NrR
r
Rr1 R)TV(
=
+
= unde:
variaia dintre UP variaia din interiorul UP
-
=
=iN
1j
2iij
i
2i,2 )yy(N
1 variaia din interiorul unitii primare UPi
=
=in
1j
2iij
i
2i,2 )yy(1n
1 estimatorul variaiei din interiorul unitii primare
UPi. Eroarea medie de reprezentativitate se va calcula pe baza estimaiei variaiei
estimatorului valorii totale dup relaia:
i
2,i2
r
1i i
i2i
212
T n
Nn1N
rR
r
Rr1 R )T(V
=
+
==
Probleme rezolvate
Problema 1 Se realizeaz un sondaj dup un plan bistadial ntr-o localitate care are populaia
de 18 ani peste de 48000 . Unitile primare sunt reprezentate de seciile de votare (27) i au fost selectate dup un procedeu aleator cu probabiliti egale fr revenire. n tabelul 4.1. sunt prezentate rezultatele obinute n urma prelucrrii datelor eantioanelor din fiecare unitate primar ce a fost selectat n eantion.
Tabelul 4.1
Secia nr. pers. din secia i nr. pers.
selectate din secia i
venitul mediu (mil lei)
dispersia dup variabila venit
nr. pers. care petrec la televizor mai mult de 3 h/zi
1 2116 43 2.8 0.04 20 2 2430 43 2.5 0.0576 25 3 2268 43 2.6 0.16 24 4 2346 52 3.8 0.09 28 5 1750 42 4.2 0.25 31 6 2386 52 4.1 0.16 36 7 2180 46 3.7 0.1089 28 8 1534 45 3.5 0.01 29 9 1598 42 3.4 0.09 33
10 2391 52 2.7 0.04 36 11 1295 52 2.9 0.0484 30
Se cere: 1. S se estimeze venitul mediu din localitate pentru o probabilitate de 0,95. 2. S se estimeze procentul celor care petrec la televizor mai mult de 3 h/zi pentru
aceeai probabilitate.
Rezolvare 1. Calculm estimatorul totalului variabilei studiate (venitul total) pe baza
calculelor sistematizate n tabelul 4.2.
====
==
=
r
1ii
r
1iii
n
1jij
i
ir
1i
TrRYN
rRy
nN
rRT
i
= 4,730231127 =179239,25 mil lei
-
Tabel 4.2
Secia Ni ni iY 22 ,i iT 2)( TTi
i
i
Nn
1 i
,i
i
ii n
Nn
N222 1
1 2116 43 2.8 0.04 5924.8 509354.714 0.98 4080.44 2 2430 43 2.5 0.0576 6075 317522.005 0.98 7769.85 3 2268 43 2.6 0.16 5896.8 550105.405 0.98 18776.93 4 2346 52 3.8 0.09 8914.8 5181583.08 0.98 9314.52 5 1750 42 4.2 0.25 7350 506245.186 0.98 17791.67 6 2386 52 4.1 0.16 9782.6 9885421.98 0.98 17135.15 7 2180 46 3.7 0.1089 8066 2037782.2 0.98 11013.39 8 1534 45 3.5 0.01 5369 1611607.17 0.97 507.58 9 1598 42 3.4 0.09 5433.2 1452726.18 0.97 5328.19
10 2391 52 2.7 0.04 6455.7 33412.5164 0.98 4301.96 11 1295 52 2.9 0.0484 3755.5 8311636.58 0.96 1498.25
Total 22294 512 73023.4 30397397 97517.92
Eroarea medie de reprezentativitate se va calcula pe baza estimaiei variaiei estimatorului valorii totale dup relaia:
i
2,i2
r
1i i
i2i
212
T n
Nn1N
rR
r
Rr1 R
=
+
=
unde =
=r
1i
2i
21 )TT(1r
1 = =10
30397397 3039739,7
=
=r
1iiTr
1T = =11
4,73023 6638,5 mil. lei
Calculm primul termen al erorii de reprezentativitate indus de selecia din primul stadiu al planului de sondaj.
Termen1=272
27111
117,3039739 =119378868,2
Al doilea termen al erorii de reprezentativitate este determinat de selecia ce a avut loc n al doilea stadiu, n interiorul unitilor primare ce au format eantionul.
Termen2= 92,975171127 =239362,8
Observm c primul termen al variaiei estimatorului are o contribuie substanial n determinarea mrimii erorii de reprezentativitate. Acesta este motivul pentru care planul de sondaj trebuie s se organizeze astfel nct s se reduc eroarea din primul stadiu. Se recomand stratificarea unitilor primare.
012,109378,239362119378868T =+= Intervalul de ncredere al totalului este:
TT 96,1TT96,1T + 8,200675T7,157802 mil. Lei
Venitul mediu estimat este:
734,3NTY == mil. Lei
-
Intervalul de ncredere al venitului mediu este :
)*96,1T(N1
NT)*96,1T(
N1
TT + 18,4Y287,3
Garantm cu o probabilitate de 95% c venitul mediu pe o persoan este de cel puin 3,287 mil. lei i cel mult 4,18 mil. lei.
2. Se pune problema estimrii unei variabile calitative. Calculele sunt prezentate n tabelul 4.3.
Tabelul 4.3
Secia Ni ni mi iw 22 ,i iT 2)( TTi
i
i
Nn
1 i
,i
i
ii n
Nn
N222 1
1 2116 43 20 0.4651 0.2488 984.2 75228.67524 0.98 25378.59 2 2430 43 25 0.5814 0.2434 1412.8 23816.57237 0.98 32829.62 3 2268 43 24 0.5581 0.2466 1265.9 54.70016007 0.98 28942.27 4 2346 52 28 0.5385 0.2485 1263.2 22.7172322 0.98 25720.57 5 1750 42 31 0.7381 0.1933 1291.7 1102.383243 0.98 13757.28 6 2386 52 36 0.6923 0.2130 1651.8 154749.1181 0.98 22813.07 7 2180 46 28 0.6087 0.2382 1327.0 4691.155746 0.98 24088.40 8 1534 45 29 0.6444 0.2291 988.6 72838.84794 0.97 11630.56 9 1598 42 33 0.7857 0.1684 1255.6 8.369917026 0.97 9967.70 10 2391 52 36 0.6923 0.2130 1655.3 157484.5118 0.98 22909.85 11 1295 52 30 0.5769 0.2441 747.1 261477.9275 0.96 7555.70
Total 22294 512 13843.11 751474.9792 225593.60
Calculm estimatorul totalului variabilei studiate (numrul persoanelor care petrec la televizor mai mult de 3 h/zi
==
==r
1ii
r
1iii Tr
RwNrRT = 11,13843
1127 = 33978,54 pers.
Eroarea medie de reprezentativitate se va calcula pe baza relaiei:
i
2,i2
r
1i i
i2i
212
T n
Nn1N
rR
r
Rr1 R
=
+
=
unde =
=r
1i
2i
21 )TT(1r
1 = =10
9792,751474 75147,49792
=
=r
1iiTr
1T = =11
11,13843 1258,465 pers.
Termen 1=272
27111
11275147,4979 =2951247,191
Termen 2= 225593,601127 =553729,7456
Observm c i n acest caz primul termen al variaiei estimatorului are o contribuie substanial n determinarea mrimii erorii de reprezentativitate. stadiu.
31872,158366553729,74512951247,19T =+=
-
Intervalul de ncredere al totalului este:
TT 96,1TT96,1T + 37648T30309 persoane
Cel puin 30309 persoane i cel mult 37648 persoane petrec cel puin 3 ore pe zi la televizor.
Procentul mediu estimat este:
0,70789NTw ==
Intervalul de ncredere al procentului mediu este :
)*96,1T(N1
NT)*96,1T(
N1
TT + 7843,0p6315,0
Se garanteaz cu o probabilitate de 95% c cel puin 63,15% i cel mult 78,43% din populaia ce vrsta de 18 ani i peste se uit cel puin 3 ore pe zi la televizor.
Probleme propuse
Problema 1 S-a organizat o cercetare n rndul unitilor sanitare(spitale) cu privire la
atitudinea personaluluimedical fa de reforma sistemului sanitar. Studiul s-a desfurat dup un plant de sondaj bistadial. n primul stadiu din 132 de spitale s-au selectat 12. Numrul de persoane intervievate din fiecare unitate primar ce a format eantionul, precum i informaiile obinute n urma prelucrrii datelor sunt prezentate n tabelul nr. 4.4.
Tabel 4.4
Pers. ce consider satisfctoare Unitatea primar
Personal medical
Personal medical selectat dotarea cu aparatur
medical asigurarea cu materiale
consumabile 1 102 42 38 32 2 245 58 55 50 3 56 30 45 47 4 67 32 27 25 5 98 35 30 28 6 76 33 30 29 7 112 44 40 37 8 145 47 40 38 9 160 50 42 38 10 189 53 48 45 11 79 33 27 25 12 87 34 26 28
Se cere: 1. S se estimeze cu o probabilitate de 95% procentul personalului medical ce
consider satisfctoare dotarea cu aparatur medical. 2. S se estimeze cu o probabilitate de 95% procentul personalului medical ce
consider satisfctoare asigurarea cu materiale consumabile.
-
Problema 2 n rndul studenilor studenilor Academiei de Studii Economice s-a realizat o
cercetare ce a avut ca obiectiv caracterizarea modului de petrecere a timpului liber. Studiul realizat a avut la baza un sondaj bistadial unitile primare fiind considerate seriile iar unitile secundare studenii. n toate facultile ASE sunt 125 de serii din care au fost selectate 12. n urma prelucrrii datelor s-au obinut inforiile din tabelul 4.5.
Tabel 4.5
Seria studeni n serie studeni n eantion
venit mediu pe lun (mil. Lei)
studeni care practic sport
studeni care merg frecvent n
excursii/drumeii
1 87 32 2.6 6 12 2 93 34 2.3 9 15 3 78 30 2.5 10 17 4 77 30 2.4 7 18 5 85 32 2.9 8 19 6 88 32 3 9 16 7 94 34 2.7 13 17 8 87 32 2.4 15 15 9 83 32 2.9 9 14
10 72 30 3 8 17 11 70 30 2.6 7 16 12 75 30 2.7 9 17
Se cere: 1. S se estimeze venitul mediu/student pentru o probabilitate de 95,45%. 2. S se estimeze procentul studenilor care practic sport si cel al studenilor
care merg frecvent n excursii pentru o probabilitate de 95%.
Capitolul 4 Sondajul bistadial