curs statistica extragerea esantionlui

Upload: lucianb12

Post on 01-Mar-2016

214 views

Category:

Documents


0 download

DESCRIPTION

curs statistica extragerea esantionlui

TRANSCRIPT

Curs 5

Curs 5

Extragerea eantionului

n aceast etap se stabilete planul de sondaj, procedeul de extracie, mrimea eantionului i precizia teoretic a estimatorilor.

La organizarea unei cercetri prin sondaj una din problemele principale de rezolvat este dimensionarea raional a eantionului. Pentru a stabili aceast mrime este necesar un studiu amnunit al populaiei supuse cercetrii.

Pornind de la ideea c un eantion trebuie s fie reprezentativ, n teoria i practica statistic se alege cu mult grij caracteristica n raport cu care se calculeaz volumul eantionului.

Orice cercetare prin sondaj include n planul observrii un numr mare de caracteristici ale populaiei. Pentru a determina gradul de reprezentativitate al eantionului trebuie aleas caracteristica populaiei cu cel mai mare grad de variaie. Deoarece dispersia este influenat de unitatea de mrime n care este exprimat caracteristica respectiv criteriul de alegere a caracteristicii reprezentative l constituie mrimea coeficientului de variaie.

n concluzie un eantion dimensionat n funcie de cel mai mare coeficient de variaie ofer estimaii cu precizie i siguran superioar pentru toate celelalte caracteristici.

n practic mrimea eantionului este determinat n mare msur de modul n care urmeaz s fie analizate rezultatele. Dac se are n vedere analiza pe subgrupe se va calcula volumul eantionului astfel nct s se obin precizia dorit pe fiecare subgrup.

Pe lng restriciile de ordin statistic exist ns i restricii de ordin financiar pornind de la costurile admisibile. Resursele financiare sunt totdeauna limitate i de multe ori mrimea necesar a eantioanelor nu poate fi realizat. Aici intervine ingeniozitatea i discernmntul n alegerea acelor subiecte care pot fi abordate cu resursele disponibile.

Dup determinarea volumului eantionului teoretic necesar trebuie s determinm care este volumul eantionului de pornire astfel nct n final s ajungem la numrul teoretic de uniti selectate.

Se pune problema s inem cont de imperfeciunea listei utilizate ca baz de sondaj. Considerm uniti non-valide acele uniti care n-ar trebui s figureze pe list dac aceasta ar corespunde perfect populaiei studiate. n practic, n ciuda eforturilor actualizrii bazelor de date utilizate ca baze de sondaj, exist n mod curent un numr de uniti non-valide. Trebuie estimat aceast proporie astfel nct s putem determina ct mai precis volumul de pornire al eantionului.

n funcie de modul de definire a populaiei supuse studiului este posibil ca unele uniti s fie considerate non-eligibile. De exemplu dac populaia de interes este format din totalitatea persoanelor cu vrsta cuprins ntre 15 i 64 ani (populaia n vrst de munc) iar unitatea de selecie este gospodria, persoanele ce nu ndeplinesc condiia de vrst sunt considerate non-eligibile.

Existena non-rspunsurilor este o problem ntlnit n orice sondaj. Din aceast cauz se recomand anticiparea ratei non-rspunsurilor nc din faza de proiectare a sondajului pentru a redimensiona eantionul.

Dac proporia de validitate i eligibilitate pot fi relativ uor controlate reducerea proporiei non-rspunsurilor constituie un obiectiv prioritar pe ntreaga perioad a derulrii unui sondaj deoarece dac proporia celor care rspund este mic ne putem gndi c cei ce nu rspund au caracteristici aparte ce ar putea modifica rezultatele.

Pentru a estima diferitele proporii (de validitate, eligibilitate sau de rspuns) putem recurge la informaiile disponibile din cercetri anterioare indiferent de obiectul studiului realizate asupra unor populaii similare.

Avnd aceste informaii putem calcula numrul de uniti pe care trebuie s le selectm iniial (volumul eantionului de pornire) astfel nct la terminarea sondajului s obinem volumul eantionului teoretic (determinat pe baza relaiilor de calcul n funcie de tipul sondajului aplicat, eroarea admis i probabilitatea de garantare a rezultatelor). Formula este urmtoarea:

unde:

np= volumul eantionului de pornire; nth= volumul eantionului teoretic; Pr=proporia de rspuns; Pe=proporia de eligibilitate; Pv=proporia de validitate

Culegerea i verificarea datelor

Odat cu recuperarea chestionarelor se trece la pregtirea acestora n vederea prelucrrii statistice a datelor.

Verificarea chestionarelor este o operaie obligatorie deoarece, orict de buni ar fi operatorii, greelile sunt inerente muncii omeneti. Aceast verificare const n urmrirea n principal a trei aspecte: completitudinea, exactitatea i uniformitatea.

1. Exactitatea i uniformitatea datelor

Cu aceasta se trece la o problem de mare adncime i dificultate. Principala modalitate de verificare a exactitii const n parcurgerea chestionarului n ansamblul su ncercnd s se vad dac rspunsurile sunt coerente sau se contrazic. n cazul ntrebrilor factologice verificarea este mai simpl dar dac este vorba despre o ntrebare de opinie logica rspunsurilor este mult mai lax. Subiectul poate s spun la un moment dat c nu are nici o opinie despre ceva iar la o ntrebare implicit s ii ofere o opinie chiar despre acel subiect. Astfel de situaii sunt interpretate ca o deficien n alctuirea chestionarului sau n conducerea interviului.

Pentru unele ntrebri din chestionar este foarte important de tiut dac operatorii sau subiecii le-au neles n acelai sens. De obicei, dup parcurgerea unui numr de chestionare se observ astfel de deosebiri de interpretare fapt care duce la rezultate inconsistente.

Aceste dou probleme pot fi evitate printr-o atent ntocmire a chestionarului, validarea acestuia printr-o anchet pilot i o instruire riguroas a operatorilor.2. Completitudinea datelor

n mod normal fiecrei ntrebri din chestionar i revine un rspuns. Dac exist omisiuni (exceptnd cazul ntrebrilor precedate de un filtru deoarece acestea se adreseaz doar unei categori din eantion) cel care face verificarea are dou soluii. Fie ncearc s atribuie un rspuns fie claseaz situaia la rubrica non-rspuns. Prima opiune presupune fie consultarea operatorului care ar putea reconstitui momentul anchetei amintindu-i rspunsul celui chestionat (chestie practic imposibil cnd chestionarul este anonim i numrul celor intervievai mare) fie deducerea acestui rspuns din analiza altor rspunsuri la ntrebri legate de aceeai cauz. Non-rspunsurile. Importana prevenirii acestora

Dac numrul de non-rspunsuri este mare vor afecta rezultatele sondajului. Ele reprezint o problem de care nici un investigator al colectivitilor umane nu poate scpa.

n sondajele statistice ntlnim dou tipuri de non-rspunsuri: non-rspuns parial (cnd pentru o unitate din eantion lipsesc valorile unora dintre variabile) i non-rspuns total (cnd pentru o unitate din eantion ne lipsesc valorile tuturor variabilelor). Unitile ncadrate la non-rspunsuri totale se numesc non-respondeni iar cauzele apariiei lor pot fi: unitatea a fost inaccesibil, refuzul sau incapacitatea de a rspunde, abandonul cooperrii n timpul interviului (prin distrugerea chestionarului) sau pur i simplu pierderea nregistrrilor pentru unitatea respectiv.

Deoarece non-rspunsurile produc distorsiuni care determin deformarea eantionului acesta nemaifiind reprezentativ este necesar luarea tuturor msurilor pentru reducerea acestora. Problema pe care o ridic non-rspunsurile nu este att de talie (mrimea eantionului format din respondeni este mai mic dect eantionul stabilit) ci de structur, non-respondenii formnd o subpopulaie aparte.

Surse ale non-rspunsurilor totale:

uniti care au disprut din baza de sondaj, case demolate, decese, adrese fictive sunt cteva exemple; numrul acestora trebuie sczut din mrimea eantionului chiar nainte de a se calcula proporia de non-rspunsuri;

diverse infirmiti ale celor inclui n eantioane prin selecia operat asupra bazei de sondaj, surdo-mui, oameni care au suferit comoii cerebrale;

schimbri de adrese; acestea se pot ntmpla chiar dac baza de sondaj a fost alctuit destul de recent, s spunem de la o alegere la alta;

absena de la domiciliu; n orice eantion pot fi cuprinse persoane a cror absen de la domiciliu este att de ndelungat, nct orice repetare a vizitei operatorului de interviu ar fi inutil, de exemplu plecri n strintate etc;

refuzul de a coopera; operatorii neavnd mijloace de coerciiune (n afar, poate, de cei care particip la recensminte de interes naional), trebuie s se dea btui; abseni n momentul vizitei; aceasta este o situaie ce se poate remedia printr-o nou vizit.

Alegerea i antrenarea complex a operatorilor de sondaj pot contribui n mod esenial la reuita colectrii datelor. Sunt foarte importante stabilirea metodelor de colectare a datelor, dimensionarea chestionarelor, evaluarea corect a timpului necesar unei persoane pentru a rspunde la ntrebri. Este posibil ca n sondajele repetate, indivizii pstrai prea mult timp s refuze s mai rspund.

Exist metode de prevenire ce pot fi utilizate chiar n timpul derulrii sondajului. n cazul absenei de la domiciliu se recomand repetarea vizitei operatorului. Dac la primul contact subiectul a refuzat s coopereze este util ca acesta s fie reabordat ntr-o alt manier de ctre un alt operator.

Durant C. Lchantillonnage et la gestion du terrain, Notes de cours, deuxim partie, Universit de Montral, pg.16

Durant C. op. cit. , pg.17

PAGE 2

_1154811564.unknown