tipuri de erori ÎntÂlnite În cercetarea selectivĂ

8
CURS 7 TIPURI DE ERORI ÎNTÂLNITE ÎN CERCETAREA SELECTIVĂ În toate etapele pregătirii şi realizării sondajelor statistice pot apărea erori determinate de diferite cauze. Erorile cercetării selective pot fi de observare şi erori de reprezentativitate care sunt specifice cercetării prin sondaj. Tipurile de erori sunt prezentate în schema din figura nr. 4.3. A. Erorile de observare sunt comune oricărei metode statistice de observare. Acestea sunt de patru tipuri: erori ale operatorului de interviu, erori ale respondentului, erori de măsurare şi erori de culegere a datelor. 1) Erorile determinate de operatorul de interviu . Acestea sunt rezultatul interacţiunii dintre operator şi subiect în timpul interviului. Mimica operatorului sau intonaţia acestuia în momentul în care citeşte întrebarea pot influenţa răspunsul mai ales dacă respondentul nu are o opinie fermă despre problematica abordată. 2) Erorile determinate de respondenţi . Acestea sunt determinate de capacităţile diferite ale respondenţilor de a răspunde la o anumită întrebare. Ele pot fi: neintenţionate „recall bias” (respondentul nu-şi mai aminteşte exact sau nu cunoaşte exact tema abordată) sau intenţionate (respondentul exagerează) „prestige bias”. 3) Erori de măsurare . Aceste erori se produc prin inexactitatea răspunsurilor cauzată de formularea incompletă sau ambiguă a întrebării. Erorile cercetării prin sondaj A. Erori de observare: erori ale operatorului de interviu erori ale respondentului erori de măsurare erori de culegere a datelor B. Erori de reprezentativitat e B1. Erori sistematice : cauzate de: nerespectarea principiului selecţiei aleatoare numărul mare de non-răspunsuri aria de acoperire B2. Erori întâmplăto are 1

Upload: lucianb12

Post on 23-Dec-2015

20 views

Category:

Documents


7 download

DESCRIPTION

TIPURI DE ERORI ÎNTÂLNITE ÎN CERCETAREA SELECTIVĂ

TRANSCRIPT

Page 1: TIPURI DE ERORI ÎNTÂLNITE ÎN CERCETAREA SELECTIVĂ

CURS 7

TIPURI DE ERORI ÎNTÂLNITE ÎN CERCETAREA SELECTIVĂ

În toate etapele pregătirii şi realizării sondajelor statistice pot apărea erori determinate de diferite cauze. Erorile cercetării selective pot fi de observare şi erori de reprezentativitate care sunt specifice cercetării prin sondaj. Tipurile de erori sunt prezentate în schema din figura nr. 4.3.

A. Erorile de observare sunt comune oricărei metode statistice de observare. Acestea sunt de patru tipuri: erori ale operatorului de interviu, erori ale respondentului, erori de măsurare şi erori de culegere a datelor.

1) Erorile determinate de operatorul de interviu . Acestea sunt rezultatul interacţiunii dintre operator şi subiect în timpul interviului. Mimica operatorului sau intonaţia acestuia în momentul în care citeşte întrebarea pot influenţa răspunsul mai ales dacă respondentul nu are o opinie fermă despre problematica abordată.

2) Erorile determinate de respondenţi . Acestea sunt determinate de capacităţile diferite ale respondenţilor de a răspunde la o anumită întrebare. Ele pot fi: neintenţionate „recall bias” (respondentul nu-şi mai aminteşte exact sau nu cunoaşte exact tema abordată) sau intenţionate (respondentul exagerează) „prestige bias”.

3) Erori de măsurare . Aceste erori se produc prin inexactitatea răspunsurilor cauzată de formularea incompletă sau ambiguă a întrebării.

4) Erori de culegere a datelor . Deoarece înregistrarea se face de un personal specializat pentru un număr mai mic de unităţi decât în cazul cercetării exhaustive, erorile de culegere a datelor apar în număr mai mic şi pot fi înlăturate printr-un control riguros.

B. Erorile de reprezentativitate specifice sondajului sunt de două feluri: erori sistematice şi erori întâmplătoare.

B1. Erorile de reprezentativitate sistematice sunt determinate de trei cauze principale:1) nerespectarea strictă a principiului de selecţie întâmplătoare , care cere ca unităţile să fie incluse în

eşantion fără nici un fel de preferinţă din partea celui care efectuează selecţia. Aceste erori pot fi evitate dacă se respectă principiile teoriei sondajului încercându-se înlăturarea cauzelor ce determină aceste erori.

Sursele acestor erori sistematice sunt:- alegerea deliberată a unor indivizi consideraţi în mod greşit ca fiind reprezentativi;

Erorile cercetării prin sondaj

A. Erori de observare:

erori ale operatorului de interviuerori ale respondentuluierori de măsurareerori de culegere a datelor

B. Erori de reprezentativitate

B1. Erori sistematice : cauzate de:nerespectarea principiului selecţiei aleatoarenumărul mare de non-răspunsuriaria de acoperire

B2. Erori întâmplătoare

1

Page 2: TIPURI DE ERORI ÎNTÂLNITE ÎN CERCETAREA SELECTIVĂ

- alegerea „la nimereală” fără a respecta principiul selecţiei aleatoare;- dorinţa preconcepută a cercetătorului de a obţine un anumit rezultat;- substituirea din comoditate a unor unităţi;- cuprinderea incompletă în sondaj a unităţilor selecţionate pentru cercetare, lipsa de seriozitate a

operatorilor, nerestituirea la timp a chestionarelor.2) erori cauzate de non-răspunsuri. Cu cât numărul lor este mai mare cu atât mai mult va fi afectată

reprezentativitatea eşantionului.3) erori de acoperire. Pentru a înţelege modul de apariţie al acestor erori trebuie să definim următoarele

noţiuni: populaţia ţintă ce cuprinde totalitatea unităţilor ce prezintă interes pentru studiul efectuat şi baza de sondaj formată doar din unităţile de la care se pot culege informaţii (vezi figura nr. 4.4.).

În general se utilizează ca baze de sondaj registre administrative. Informaţiile conţinute în aceste registre trebuie să fie actualizate periodic. Dacă utilizăm ca bază de sondaj un registru administrativ este posibil ca acesta să conţină şi unităţi ce nu fac parte din populaţia ţintă. Aceste unităţi pot fi de obicei identificate şi eliminate înainte de formarea eşantionului. Dacă există însă o arie neacoperită de registru administrativ aceasta este mult mai greu de estimat. În acest caz este necesar să determinăm cum putem să îmbunătăţim baza de sondaj

Fig. nr. 4.4 Formarea erorilor de acoperire

Schimbări majore ale populaţiilor au loc în special în mediul economic. Dacă se realizează un sondaj în domeniul industriei este foarte important ca registrul administrativ utilizat ca bază de sondaj să fie actualizat conţinând pe lângă toate întreprinderile existente şi informaţii recente în ceea ce priveşte mărimea întreprinderilor sau a cifrei de afaceri, acestea constituind de cele mai multe ori criterii de stratificare.

Pentru a reduce erorile de acoperire este necesar ca:- informaţiile cuprinse în baza de sondaj să corespundă cerinţelor sondajului realizat- baza de sondaj să conţină şi informaţii auxiliare necesare selectării metodei adecvate de

eşantionare (de exemplu informaţii necesare stratificării, utilizării sondajului cu probabilităţi inegale, sondajului pe cote).

B2. Erorile de reprezentativitate întâmplătoare nu se pot evita ca urmare a faptului că nu se poate reproduce identic colectivitatea generală. Pentru ca rezultatele sondajului să fie utile este necesar ca erorile introduse prin însuşi procedeul selecţiei să fie cât mai mici. Aceasta se realizează prin alegerea adecvată a tipului de sondaj şi mărimea volumului eşantionului.

În practica sondajului erorile de reprezentativitate se pot calcula ca erori efective şi erori probabile. Erorile efective se pot calcula pentru caracteristicile la care s-au obţinut date şi dintr-o observare totală.

Considerând că media este indicatorul sintetic cel mai reprezentativ, eroarea efectivă de sondaj se calculează ca diferenţă între media eşantionului şi media colectivităţii totale. La verificarea reprezentativităţii eşantionului se

BAZA DE SONDAJ

POPULAŢIA ŢINTĂ Arie neacoperită

Arie acoperită de baza de sondaj dar care nu face parte din populaţia ţintă

2

Page 3: TIPURI DE ERORI ÎNTÂLNITE ÎN CERCETAREA SELECTIVĂ

porneşte de la compararea structurii pe grupe a colectivităţii de selecţie cu cea a colectivităţii generale, denumită şi structură programată. În cazul în care aceste structuri nu diferă cu mai mult de ± 5% se acceptă eşantionul ca fiind reprezentativ.

Deşi nu pot fi evitate erorile de reprezentativitate întâmplătoare ele pot fi calculate cu anticipaţie dacă sondajul este probabilistic, obţinându-se erorile probabile. Estimaţia parametrilor din populaţia generală se va putea face pe baza indicatorilor obţinuţi din prelucrarea datelor de sondaj cu o eroare medie de reprezentativitate care se găseşte într-un interval probabilistic. Fiecărui indicator derivat sau sintetic trebuie să i se ataşeze şi eroarea sa de reprezentativitate pentru a putea fi generalizat la întreaga populaţie. Modul de calcul al acestor erori depinde de tipul de sondaj utilizat.

Tocmai posibilitatea unor astfel de calcule şi a analizelor respective face din metoda sondajului un instrument viabil de cercetare.

PROCEDEE DE EŞANTIONARE

Pentru asigurarea reprezentativităţii eşantionului este necesară respectarea cu stricteţe a următoarelor principii:

1) Caracterul obiectiv şi aleator al selecţiei unităţilor. Includerea unităţilor în eşantion trebuie realizată în mod obiectiv fără a favoriza unele dintre ele, fiecare fiind extrasă după principiul hazardului, cu o probabilitate calculabilă şi diferită de zero.

2) Eşantionul trebuie să fie suficient de mare pentru a se realiza redarea trăsăturilor esenţiale ale populaţiei astfel încât să permită obţinerea, pe baza datelor de sondaj a unor indicatori cu grad mare de stabilitate.

3) Includerea unei unităţi în eşantion trebuie să se facă independent de alte unităţi.În teoria şi practica sondajului pentru formarea eşantionului se folosesc mai multe procedee şi anume:

eşantionare aleatoare, eşantionare dirijată şi eşantionare mixtă.

A. Procedee de eşantionare aleatoare

Procedeele de eşantionare aleatoare sunt cele care acordă fiecărei unităţi din populaţie o probabilitate nenulă şi cunoscută de a face parte din eşantion. Rezultatele obţinute pe această bază pot fi apreciate în termeni probabilistici.

Eşantionarea aleatoare se poate face după planuri de sondaje simple (în cazul populaţiilor omogene şi care nu au dimensiuni foarte mari) sau după planuri de sondaj complexe, în mai multe etape cum ar fi: sondajul stratificat, sondajul multistadial, multifazic, sondajul de serii, sondajul secvenţial pentru populaţiile neomogene, repartizate pe diferite subansamble.

Metoda de eşantionare utilizată în cazul în care probabilităţile acordate fiecărei unităţi din populaţie de a intra în eşantion sunt egale se numeşte eşantionare aleatoare cu probabilităţi egale. Această metodă se recomandă atunci când nu există diferenţe semnificative în ceea ce priveşte dimensiunea unităţilor populaţiei. În caz contrar se recomandă utilizarea metodei de eşantionare cu probabilităţi inegale (unităţile populaţiei au şanse diferite de a intra în eşantion).

Dintre procedeele de extracţie cu probabilităţi egale cele mai folosite sunt: procedeul loteriei, procedeul numerelor aleatoare şi procedeul mecanic (sistematic).

Procedeul loteriei

Acest procedeu constă în extragerea dintr-o urnă a unor bile sau jetoane identice reprezentând unităţile populaţiei. Se vor extrage bile sau jetoane până se va obţine volumul eşantionului dorit. Aceasta se poate realiza în două variante: cu reintroducerea bilelor sau jetoanelor în urnă şi fără reintroducerea bilelor sau jetoanelor în urnă.

În prima variantă vom avea un sondaj repetat, volumul populaţiei rămânând acelaşi până când se extrage ultima unitate şi se obţine eşantionul dorit. La încheierea operaţiei, volumul populaţiei (N) este mai mic cu o

3

Page 4: TIPURI DE ERORI ÎNTÂLNITE ÎN CERCETAREA SELECTIVĂ

unitate, iar probabilitatea de includere în eşantion a oricărei unităţi din populaţie este constantă şi egală cu p=1/N.

În a doua variantă bila sau jetonul nu mai sunt reintroduse în urnă. În acest caz este vorba de un sondaj nerepetat. Pe măsură ce se extrag bilele şansele celor rămase în urnă de a fi introduse în eşantion cresc astfel:

Procedeul numerelor aleatoare

Există tabele de numere aleatoare utilizate pentru extragerea eşantioanelor. În aceste tabele numerele sunt aşezate în mod întâmplător pe coloane şi rânduri. Tot la întâmplare se stabileşte coloana şi rândul de unde începe atribuirea diferitelor numere. Unităţile ce au atribuite numerele corespunzătoare vor forma eşantionul.În condiţiile tehnicilor moderne de calcul tabelele cu numere aleatoare au fost abandonate în favoarea numerelor întâmplătoare obţinute cu ajutorul uni program de generare a numerelor aleatoare.

Generare de numere aleatoare.

Procedeul mecanic (sistematic)

Eşantionarea pe baza procedeului mecanic este considerată în teoria sondajelor ca un procedeu cvasi-aleator. Acesta presupune ordonarea unităţilor după o caracteristică oarecare (ordine alfabetică, numărul locuinţei) prin care să se asigure includerea pe cât posibil întâmplătoare a unităţilor în baza de sondaj. Pentru formarea eşantionului se va forma un pas de numărare care trebuie să fie un număr întreg calculat pe baza raportului dintre volumul populaţiei şi volumul eşantionului (N/n). Prin calculul pasului de numărare se obţine împărţirea populaţiei în grupe de volum egale. Pentru obţinerea eşantionului se procedează astfel: se selectează la întâmplare o unitate din prima grupă la care se adaugă succesiv pasul de numărare până la obţinerea volumului eşantionului.

Ceea ce se reproşează eşantionării cvasi-aleatoare este că pasul de numărare poate coincide cu anumite periodicităţi ce pot exista în baza de sondaj. Pentru a evita acest lucru trebuie aleasă cu grijă caracteristica după care se sortează unităţile asigurându-se astfel caracterul aleator. Procedeul este frecvent utilizat datorită uşurinţei de aplicare şi a bazelor de sondaj deja constituite (liste electorale, cărţi de telefon, cataloage de firme, numerotarea locuinţelor pe o stradă, etc).

Toate aceste procedee de eşantioane se pot aplica direct populaţiei totale sau pe grupe ceea ce înseamnă că se pot obţine sondaje simple sau stratificate. La aplicarea procedeului de selecţie se pot folosi unităţi simple numerotate de la 1 la N sau unităţi complexe, denumite serii numerotate de la 1 la R. În cel de-al doilea caz vom avea un sondaj de serii.

B. Procedee de eşantionare dirijată

Se numeşte eşantionare dirijată procedeul prin care includerea unităţilor populaţiei în eşantion se realizează în mod conştient de către o persoană cu experienţă. Oricât de bun cunoscător ar fi acesta, alegerea dirijată a unităţilor considerate reprezentative ne va îndepărta de caracterul cu adevărat aleator.

Faţă de eşantionarea aleatoare cea dirijată prezintă dezavantajul că nu există nici o metodă de a stabili gradul preciziei unei estimaţii făcute pe baza ei. În cazul eşantioanelor aleatore se cunoaşte probabilitatea fiecărei unităţi de a intra în eşantion ceea ce permite calcularea şi garantarea unei erori probabile.

Cu toate acestea în anumite cazuri este preferată eşantionarea dirijată şi anume:o este mult mai ieftină decât orice selecţie aleatoare;o dacă eşantioanele sunt foarte mici faţă de volumul populaţiei inferenţele făcute pe baza acestora

nu reprezintă decât o simplă apreciere;o datele existente sunt atât de nesigure încât aprecierea unui expert poate da rezultate mai bune

decât o selecţie aleatoare;o sondajele aleatoare presupun existenţa unor baze de sondaj actuale şi complete şi chiar

cunoaşterea unor informaţii auxiliare despre populaţia studiată. Dacă aceste informaţii nu există sau sunt inaccesibile statisticienii apelează la metode dirijate de eşantionare.

4

Page 5: TIPURI DE ERORI ÎNTÂLNITE ÎN CERCETAREA SELECTIVĂ

Datorită avantajelor pe care le oferă sunt cele mai utilizate de către institutele de sondare a opiniei publice. Precizia acestor metode neputând fi calculată reuşita lor nu este decât rezultatul unei practici îndelungate şi a unei abilităţi profesionale deosebite.

1) Cea mai folosită metodă de eşantionare dirijată este eşantionarea pe cote în special în sondajele de opinie. În acest caz structura populaţiei pe sexe, vârstă, categorii socio-profesionale este stabilită dinainte. În cadrul fiecărei categorii se precizează un anumit număr de persoane, alegerea lor fiind lăsată la latitudinea operatorului. Deci, cunoscând structura populaţiei pe diferite criterii se presupune că dacă eşantionul redă această structură va fi reprezentativ. Astfel sondajul pe cote apare ca o stratificare în care selecţia în cadrul stratului nu este aleatoare ci dirijată. Acest caracter al selecţiei este un dezavantaj al metodei, operatorul putând fi subiectiv în selectarea celor care să facă parte din eşantion.

Alegerea criteriilor de cotă se face ţinând seama de simplitatea şi uşurinţa de a le delimita corect dar şi de cerinţe psihologice (nu se va folosi venitul drept criteriu de cotă).

2) Metoda voluntariatului. Anchetele bazate pe voluntariat se aplică din ce în ce mai mult. Aceasta constă în publicarea chestionarului în presă (mai nou şi pe Internet) cu rugămintea adresată cititorilor de a răspunde. Eşantionul se formează deci din rândul cititorilor. Aceste anchete furnizează un volum mare de informaţii dar problema care se pune este de a aprecia în ce măsură se pot extrapola rezultatele.

3) Eşantionarea la faţa locului. Metoda aceasta vizează populaţii care se găsesc în anumite locuri: muzee, manifestaţii culturale, magazine, târguri şi expoziţii etc.

După ce s-a completat un chestionar se abordează cu un pas stabilit următoarea persoană. Pasul se stabileşte în funcţie de fluxul de persoane la diferite momente ale zilei.

Dezavantajul metodei constă în supraaprecierea ponderii vizitatorilor (clienţilor) frecvenţi în defavoarea celor ocazionali. Pentru aceasta chestionarul trebuie să cuprindă elemente necesare evaluării frecvenţei.

4) Metoda itinerariilor. Această metodă constă în impunerea unui itinerar de urmat operatorului având diferite puncte de oprire pentru realizarea interviurilor. Metoda este interesantă în unităţile dens populate unde este combinată cu metode de eşantionare pe cote. În acest caz operatorul trebuie să completeze chestionarele respectând criteriile de cotă şi urmând traseul stabilit. Dacă în unul din punctele traseului răspunsul este refuzat operatorul va trece la punctul următor din itinerar excluzându-se astfel problema non-răspunsurilor.

5) Eşantionarea tip bulgăre de zăpadă. Este un procedeu de eşantionare utilizat în situaţia în care nu există informaţii suficiente pentru a identifica toţi indivizii care compun o anumită populaţie fiind posibilă identificarea doar a câtorva astfel de indivizi. În această situaţie cercetarea populaţiei vizate va începe cu investigarea indivizilor cunoscuţi după care acestora li se cere să precizeze şi alte persoane despre care se presupune că întrunesc caracteristicile vizate de scopul studiului. Procedeul se desfăşoară în acest mod până când sunt identificaţi atâţia indivizi câţi sunt necesari formării eşantionului propus. Se utilizează acest procedeu în cazul în care populaţia vizată este formată din oameni care au anumite hobby-uri sau pasiuni, preocupări . De obicei în acest caz nu se dispune de informaţiile necesare aplicării unui alt procedeu de eşantionare. Este posibil să nu se cunoască nici din câţi indivizi este formată o astfel de populaţie.

C. Procedee de eşantionare mixtă

Procedeele de eşantionare mixtă combină principiile eşantionării dirijate cu cele ale eşantionării aleatoare profitând de avantajele fiecărei metode şi minimizându-se dezavantajele. Cel mai cunoscut tip de sondaj realizat pe baza eşantionării mixte este sondajul stratificat. Esenţa acestui tip de sondaj constă în divizarea întregii populaţii (grupe tipice în raport cu un o caracteristică prestabilită) şi apoi extragerea a câte unui eşantion aleator din fiecare strat. Tot pe baza de planuri de eşantionare mixtă se realizează şi sondajul multistadial, multifazic sau secvenţial.

5