teste neparametrice

45
Teste neparametrice Teste neparametrice

Upload: stefan85

Post on 01-Jul-2015

682 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Teste neparametrice

Teste neparametriceTeste neparametrice

Page 2: Teste neparametrice

• Metodele neparametrice sau de Metodele neparametrice sau de distributie libera in cadrul unei distributie libera in cadrul unei analize statistice,testeaza ipoteza analize statistice,testeaza ipoteza nula sau determina limitele de nula sau determina limitele de incredere pentru esantioane sau incredere pentru esantioane sau populatii fara a tine cont de populatii fara a tine cont de distribututia populatiei.distribututia populatiei.

Page 3: Teste neparametrice

Tipuri de teste neparametrice Tipuri de teste neparametrice (I)(I)

• Testul Wilcoxon al sumei rangurilor este Testul Wilcoxon al sumei rangurilor este un test pentru date neperechi sau un test pentru date neperechi sau imperechiate si este o alternativa a imperechiate si este o alternativa a testului t pentru esantioane perechi.testului t pentru esantioane perechi.

• Testul Wilcoxon pentru doua esantioane Testul Wilcoxon pentru doua esantioane este un test pentru date neimperechiate este un test pentru date neimperechiate si este o alternativa a testului t pentru si este o alternativa a testului t pentru esantioane independente.esantioane independente.

Page 4: Teste neparametrice

Tipuri de teste neparametrice Tipuri de teste neparametrice (II)(II)

• Testul U Mann- Whitney conduce la Testul U Mann- Whitney conduce la rezultate echivalente cu testul rezultate echivalente cu testul Wilcoxon pentru doua esantioane.Wilcoxon pentru doua esantioane.

• Testul exact Fisher se aplica pentru Testul exact Fisher se aplica pentru tabelele de contingenta de tip 2x2 in tabelele de contingenta de tip 2x2 in aceleasi conditii ca testul chi patrat, aceleasi conditii ca testul chi patrat, dar cand frecventele asteptate sunt dar cand frecventele asteptate sunt mai mici decat 5.mai mici decat 5.

Page 5: Teste neparametrice

Aplicatii si caracteristici (I)Aplicatii si caracteristici (I)

• Necesita cateva presupuneriasupra Necesita cateva presupuneriasupra distibutiilor esantioanelor si populatiei distibutiilor esantioanelor si populatiei supuse studiului, dar acestea sunt mult mai supuse studiului, dar acestea sunt mult mai usoare in comparatie cu conditiile de usoare in comparatie cu conditiile de validitate ale testului chi patrat sau ale validitate ale testului chi patrat sau ale testului t.testului t.

• Sunt folosite pentru a analiza esantioane Sunt folosite pentru a analiza esantioane sau populatii ce nu se distribuie normal sau sau populatii ce nu se distribuie normal sau aproximativ normal si pentru care testele aproximativ normal si pentru care testele parametrice sunt nepotrivite.parametrice sunt nepotrivite.

Page 6: Teste neparametrice

Aplicatii si caracteristici (II)Aplicatii si caracteristici (II)

• Sunt folosite pentru a analiza esantioane Sunt folosite pentru a analiza esantioane sau populatii pentru care parametrii, cum ar sau populatii pentru care parametrii, cum ar fi valoarea medie sau deviatia standard sunt fi valoarea medie sau deviatia standard sunt nereale sau nu pot fi determinate.nereale sau nu pot fi determinate.

• Pot fi folosite in locul testelor parametrice Pot fi folosite in locul testelor parametrice pentru a analiza populatii ce urmeaza pentru a analiza populatii ce urmeaza distributia normala sau aproximativ distributia normala sau aproximativ normala, dar testele neparametrice, normala, dar testele neparametrice, operand de cele mai multe ori nu cu valori operand de cele mai multe ori nu cu valori masurabile ci cu rangurile valorilor, au o masurabile ci cu rangurile valorilor, au o putere mult mai mica.putere mult mai mica.

Page 7: Teste neparametrice

RegresiaRegresia

• Analiza de regresie are ca scop obtinerea unei Analiza de regresie are ca scop obtinerea unei expresii matematice cu ajutorul careia valorile expresii matematice cu ajutorul careia valorile unei variabile (x) pot fi folosite pentru a prezice unei variabile (x) pot fi folosite pentru a prezice valorile altei variabile (y).valorile altei variabile (y).

• X=variabila independenta (sau X=variabila independenta (sau regresoare)careia ii atribuim valori in regresoare)careia ii atribuim valori in concordanta cu realitatea, este deci o variabila concordanta cu realitatea, este deci o variabila nealeatorie.nealeatorie.

• Y=variabila dependenta care ia valori in functie Y=variabila dependenta care ia valori in functie de variabila xde variabila x

Page 8: Teste neparametrice

• Cazul cel mai simplu este atunci cand intre Cazul cel mai simplu este atunci cand intre variabila x si variabila y exista o legatura variabila x si variabila y exista o legatura liniara; atunci potrivita pentru descrierea liniara; atunci potrivita pentru descrierea relatiei este ecuatia y=a+bxrelatiei este ecuatia y=a+bx

• a=ordonata de originea=ordonata de origine• b=coeficientul de regresie (panta dreptei) b=coeficientul de regresie (panta dreptei)

sau tangenta unghiului pe care dreapta il sau tangenta unghiului pe care dreapta il face cu axa OXface cu axa OX

Daca b>0, dreapta este crescatoare, iar daca Daca b>0, dreapta este crescatoare, iar daca b<0 dreapta este descrescatoare.b<0 dreapta este descrescatoare.

a indica valoarea lui y corespunzatoare lui a indica valoarea lui y corespunzatoare lui x=0x=0

b indica cresterea variabilei y la cresterea cu b indica cresterea variabilei y la cresterea cu o unitate a variabilei x. o unitate a variabilei x.

Page 9: Teste neparametrice

• Coeficientii b si a se estimeaza pe Coeficientii b si a se estimeaza pe baza metodei celor mai mici patrate baza metodei celor mai mici patrate care minimizeaza suma patratelor care minimizeaza suma patratelor abaterilor dintre valorile real abaterilor dintre valorile real observate yobservate yii, 1<i<n si cele asteptate , 1<i<n si cele asteptate yy**

II; 1<i<n, prin formulele:; 1<i<n, prin formulele:

bb**= n= n∑x∑xi i yyii- - ∑x∑xi i yyii/n /n ∑x∑xi i 22-(∑x-(∑xi i ))22

aa**=y-b.x=y-b.x

Pe baza valorilor lui Pe baza valorilor lui bb** si si aa** se se calculeaza dreapta de regresie ycalculeaza dreapta de regresie y**= = aa**+ + bb** . x . x

Page 10: Teste neparametrice

CorelatiaCorelatia

• Daca ambele variabile (x si y) sunt Daca ambele variabile (x si y) sunt cantitative si aleatoare, atunci relatia cantitative si aleatoare, atunci relatia statistica dintre ele apartine domeniului statistica dintre ele apartine domeniului corelatiei si un scop aici este sa se indice corelatiei si un scop aici este sa se indice gradul de asociere sau de legatura intre cele gradul de asociere sau de legatura intre cele 2 variabile. Asociatia este deci reciproca si 2 variabile. Asociatia este deci reciproca si nu intr-un singur sens ca in cazul regresiei.nu intr-un singur sens ca in cazul regresiei.

• Corelatia este indicata prin coeficientul de Corelatia este indicata prin coeficientul de corelatie.(r)corelatie.(r)

Page 11: Teste neparametrice

Aplicatii si caracteristici (I)Aplicatii si caracteristici (I)• Coeficientul de corelatie simpla numit coeficientul Coeficientul de corelatie simpla numit coeficientul

de corelatie Pearson este folosit pentru a indica de corelatie Pearson este folosit pentru a indica gradul asocierii liniare intre 2 variabile, asocierea gradul asocierii liniare intre 2 variabile, asocierea fiind reciproca.fiind reciproca.

• Coeficientul de corelatie variaza intre -1 si +1, Coeficientul de corelatie variaza intre -1 si +1, inclusiv:inclusiv:- Cand se apropie de -1 modificarea unei variabile - Cand se apropie de -1 modificarea unei variabile este puternic asociata cu inversul modificarii liniare este puternic asociata cu inversul modificarii liniare a celeilalte variabilea celeilalte variabile- Cand coeficientul de corelatie este egal cu 0, - Cand coeficientul de corelatie este egal cu 0, inseamna ca nu exista asociatie intre modificarile inseamna ca nu exista asociatie intre modificarile celor 2 variabile.celor 2 variabile.- Cand coeficientul de corelatie se apropie de +1, - Cand coeficientul de corelatie se apropie de +1, imseamna ca modificarea unei variabile este foarte imseamna ca modificarea unei variabile este foarte puternic asociata cu modificarea liniara directa a puternic asociata cu modificarea liniara directa a celeilalte variabile.celeilalte variabile.

Page 12: Teste neparametrice

Aplicatii si caracteristici (II)Aplicatii si caracteristici (II)

• Un coeficient de corelatie poate fi calculat Un coeficient de corelatie poate fi calculat corect numai cand datele ambelor variabile corect numai cand datele ambelor variabile se refera la esantioane si fiecare este ales se refera la esantioane si fiecare este ales independent.independent.

• Un coeficient de corelatie poate fi apropiat de Un coeficient de corelatie poate fi apropiat de ±1, deci ne va indica o corelatie puternica, ±1, deci ne va indica o corelatie puternica, dar ea poate fi nesemnificativa din cauza dar ea poate fi nesemnificativa din cauza volumului mic a esantionului studiat. volumului mic a esantionului studiat.

• Corelatia nu trebuie identificata cu Corelatia nu trebuie identificata cu cauzalitatea, in sensul ca observatiile a 2 cauzalitatea, in sensul ca observatiile a 2 variabile se pot corela foarte bine fara sa variabile se pot corela foarte bine fara sa avem motive logice si stiintifice ca una dintre avem motive logice si stiintifice ca una dintre variabile poate fi cauza celeilalte.variabile poate fi cauza celeilalte.

Page 13: Teste neparametrice

CalculCalcul

• r=r=∑x∑xiiyyii-(∑x-(∑xii)(∑y)(∑yii)/n/(SDx)(SDy))/n/(SDx)(SDy)

• Coeficientul de corelatie al rangurilor Coeficientul de corelatie al rangurilor (Spearman) testeaza gradul de corelare (Spearman) testeaza gradul de corelare intre 2 variabile calitative; este alternativa intre 2 variabile calitative; este alternativa neparametrica a “coeficientului de neparametrica a “coeficientului de corelatie Pearson”.corelatie Pearson”.

• Se calculeaza cu formula:Se calculeaza cu formula:

rrss=1-6∑d=1-6∑dii22/n(n/n(n22-1) unde n= nr. de indivizi -1) unde n= nr. de indivizi

ddii22 =patratul diferentelor celor 2 clasamente =patratul diferentelor celor 2 clasamente

Page 14: Teste neparametrice

• Acest coeficient variaza intre -1 si +1. O Acest coeficient variaza intre -1 si +1. O valoare apropiata de +1, inseamna ca valoare apropiata de +1, inseamna ca suma patratelor diferentelor este aproape suma patratelor diferentelor este aproape nula, deci avem clasamente identice.nula, deci avem clasamente identice.

• O valoare apropiata de 0, inseamna O valoare apropiata de 0, inseamna necorelarea variabilelor, iar valoarea necorelarea variabilelor, iar valoarea apropiata de -1 pune in evidenta apropiata de -1 pune in evidenta discordanta maxima a variabilelor.discordanta maxima a variabilelor.

• Pentru corealtia rangurilor poate fi calculat Pentru corealtia rangurilor poate fi calculat si coeficientul lui Kendall, pa baza formulei: si coeficientul lui Kendall, pa baza formulei: rrkk=2T/n(n-1) unde T=suma algebrica a nr. =2T/n(n-1) unde T=suma algebrica a nr. de ranguri superioare, respectiv inferioare de ranguri superioare, respectiv inferioare fiecarui rang al valorilor lui y, aranjate fiecarui rang al valorilor lui y, aranjate dupa deria valorilor lui x, in ordine dupa deria valorilor lui x, in ordine crescatoare sau descrescatoare. crescatoare sau descrescatoare.

Page 15: Teste neparametrice

• Ca si in cazul regresiei, cand avem in Ca si in cazul regresiei, cand avem in studiu un numar mai mare de studiu un numar mai mare de variabile, apare problema calcularii variabile, apare problema calcularii unor coeficienti de variatie multipla. unor coeficienti de variatie multipla. Acestia pot fi de tip partial sau total, Acestia pot fi de tip partial sau total, dupa cum unele variabile sunt dupa cum unele variabile sunt constante sau nu. constante sau nu.

Page 16: Teste neparametrice

EsantionajulEsantionajul

• Esantionul=colectivitate de Esantionul=colectivitate de selectie=colectivitate partial aleasa aleator selectie=colectivitate partial aleasa aleator dintr-o populatie.dintr-o populatie.

• Populatia de origine=colectivitate generalaPopulatia de origine=colectivitate generala

• Totalitatea elementelor individuale extrase Totalitatea elementelor individuale extrase din colectivitatea generala la care se din colectivitatea generala la care se studiaza caracterele lor principale si care studiaza caracterele lor principale si care compun esantionul poarta denumirea de compun esantionul poarta denumirea de unitati de observatie sau de selectie.unitati de observatie sau de selectie.

• Documentatia care permite gasirea unitatilor Documentatia care permite gasirea unitatilor de selectie se numeste baza de sondaj.de selectie se numeste baza de sondaj.

Page 17: Teste neparametrice

• Un esantion este reprezentativ atunci cand Un esantion este reprezentativ atunci cand el provine prin selectie aleatorie el provine prin selectie aleatorie (randomizata) din baza de sondaj.(randomizata) din baza de sondaj.

• Notiunea de reprezentativitate nu este Notiunea de reprezentativitate nu este legata de volumul esantionului, ci de legata de volumul esantionului, ci de modul de selectie al acestuia.modul de selectie al acestuia.

• Volumul esantionului determina precizia Volumul esantionului determina precizia acestuia, deci se vor selecta esantioane acestuia, deci se vor selecta esantioane mari atunci cand se doreste o eroare mica.mari atunci cand se doreste o eroare mica.

• De intelege prin eroare diferenta dintre De intelege prin eroare diferenta dintre valoarea caracteristicii studiate masurate valoarea caracteristicii studiate masurate in populatie si valoarea aceleiasi in populatie si valoarea aceleiasi caracteristici, masurata in esantion.caracteristici, masurata in esantion.

Page 18: Teste neparametrice

Avantajele si dezavantajele Avantajele si dezavantajele cercetarii prin esantionajcercetarii prin esantionaj

• Efortul depus in cercetare este mai mic, Efortul depus in cercetare este mai mic, existand un plus de operativitate si un cost mai existand un plus de operativitate si un cost mai mic.mic.

• Duce la o acuratete mai mare a rezultatelor Duce la o acuratete mai mare a rezultatelor deoarece poate fi angajat personal inalt deoarece poate fi angajat personal inalt calificat.calificat.

• Datorita alegerii intamplatoare esantionul Datorita alegerii intamplatoare esantionul reproduce populatia cu unele erori, numite si reproduce populatia cu unele erori, numite si aleatoare si care pot fi controlate de cercetator.aleatoare si care pot fi controlate de cercetator.

• Un esantion are erori cu atat mai mari cu cat el Un esantion are erori cu atat mai mari cu cat el este mai mic.este mai mic.

Page 19: Teste neparametrice

Erorile in cercetarea bazata pe Erorile in cercetarea bazata pe esantionajesantionaj

• Pentru o cercetare de succes este importanta Pentru o cercetare de succes este importanta asigurarea unei reprezentativitati a asigurarea unei reprezentativitati a esantionului si a unui nivel satisfacator de esantionului si a unui nivel satisfacator de precizie.precizie.

• Reprezentativitatea se asigura prin extragerea Reprezentativitatea se asigura prin extragerea sa intamplatoare din baza de sondaj.sa intamplatoare din baza de sondaj.

• Nerespectarea alegerii aleatorii face sa apara Nerespectarea alegerii aleatorii face sa apara erorile siatematice (biais), dificil de a fi erorile siatematice (biais), dificil de a fi cunoscute.cunoscute.

• Un esantion este reprezentativ daca nu este Un esantion este reprezentativ daca nu este insotit de erori sistematice.insotit de erori sistematice.

Page 20: Teste neparametrice

• Cea de-a doua conditie, precizia, este Cea de-a doua conditie, precizia, este determinata de volumul esantionului.determinata de volumul esantionului.

• Atunci cand volumul esantionului va Atunci cand volumul esantionului va creste, precizia va fi mai mare, adica creste, precizia va fi mai mare, adica structura si proprietatile populatiei structura si proprietatile populatiei originare vor fi mai fidel relevate.originare vor fi mai fidel relevate.

• In cercetarea selectiva se In cercetarea selectiva se inregistreaza erori de esantionaj si inregistreaza erori de esantionaj si erori care nu tin de esantionaj. Erorile erori care nu tin de esantionaj. Erorile de esantionaj pot fi cunoscute si astfel de esantionaj pot fi cunoscute si astfel cercetatorul poate modifica gradul de cercetatorul poate modifica gradul de precizie al studiului dupa necesitatile precizie al studiului dupa necesitatile practice.practice.

Page 21: Teste neparametrice

• Deoarece eroarea aleatorie apare ca efect al Deoarece eroarea aleatorie apare ca efect al hazardului, masura acestei erori este probabila si hazardului, masura acestei erori este probabila si niciodata certa. Unitatea de masura a erorilor de niciodata certa. Unitatea de masura a erorilor de esantionaj este eroarea standard.esantionaj este eroarea standard.

eexx==σσxx/√n≈S/√n≈Sxx/√n pentru caracteristicile cantitative/√n pentru caracteristicile cantitativeeepp= √PQ/ √n ≈ √= √PQ/ √n ≈ √ pq/√n pentru caraxcteristicile pq/√n pentru caraxcteristicile

calitativecalitativeeex x =eroarea standard a caracteristicii din esantion=eroarea standard a caracteristicii din esantionσσxx= abaterea standard a caracteristicii din populatia = abaterea standard a caracteristicii din populatia

de originede origineSSx x = abaterea standard a caracteristicii din esantion= abaterea standard a caracteristicii din esantioneep p = = eroarea standard a proportieieroarea standard a proportieiP=proportia populatiei din populatia generalaP=proportia populatiei din populatia generalaQ= prportia complementara=1-PQ= prportia complementara=1-Pp=proportia populatiei din esantionp=proportia populatiei din esantionq=proportia complementaraq=proportia complementaran=volumul esantionuluin=volumul esantionului

Page 22: Teste neparametrice

Erorile independente de Erorile independente de esantionajesantionaj

• Sistematice si intamplatoareSistematice si intamplatoare• Erorile sistematice tin de alegerea Erorile sistematice tin de alegerea

aleatoare. Ele dispar prin respectarea aleatoare. Ele dispar prin respectarea regulilor selectiei.regulilor selectiei.

• Erorile intamplatoare sunt generate de Erorile intamplatoare sunt generate de inexactitatea aparaturii si a observatorului inexactitatea aparaturii si a observatorului in general.in general.

• Cele mai grave sunt erorile sistematice ele Cele mai grave sunt erorile sistematice ele putand compromite cercetarea.putand compromite cercetarea.

• erer22tottot= er= er22

sissis+er+er22intampintamp

Page 23: Teste neparametrice

Determinarea volumului Determinarea volumului esantionuluiesantionului

• Pentru calcul se porneste de la eroarea standard Pentru calcul se porneste de la eroarea standard datorata numarului prestabilit de unitati de datorata numarului prestabilit de unitati de observare, prin formula:observare, prin formula:

ΔΔxx=t=tαα,,ννx.x.σσxx/√n se poate calcula eroarea limita /√n se poate calcula eroarea limita acceptata care va insoti determinarea.acceptata care va insoti determinarea.

Daca n≥30, coeficientul tDaca n≥30, coeficientul tαα,,νν se poate inlocui cu Use poate inlocui cu Uαα..

Cu ajutorul relatiei Cu ajutorul relatiei σσxx22=s=s22.n/n-1 in care s este .n/n-1 in care s este

varianta masurata, iar n este numarul de cazuri varianta masurata, iar n este numarul de cazuri din esantionul pilot.din esantionul pilot.

Volumul esantionului este dat de relatia:Volumul esantionului este dat de relatia:

n=Un=Uαα22

xxσσxx22//ΔΔxx

22

Page 24: Teste neparametrice

Alte consideratii in Alte consideratii in determinarea volumului determinarea volumului

esantionuluiesantionului• Determinarea volumului esantionului este Determinarea volumului esantionului este influentata de 2 presupuneri:influentata de 2 presupuneri:

1.1. Populatia din care provine esantionul este infinit Populatia din care provine esantionul este infinit de marede mare

2.2. Esantionul este selectat aleatoriu.Esantionul este selectat aleatoriu.Populatia din care provine esantionul nu va fi Populatia din care provine esantionul nu va fi niciodata infinita astfel se va aplica corectia niciodata infinita astfel se va aplica corectia populatiei finite. Acest indice se aplica daca populatiei finite. Acest indice se aplica daca volumul esantionului depaseste 5-10% din volumul esantionului depaseste 5-10% din populatie. populatie.

Indicele fpc se calculeaza astfel: fpc=n/1+n/NIndicele fpc se calculeaza astfel: fpc=n/1+n/Nn= volumul esantionului, N=volumul populatiei tintan= volumul esantionului, N=volumul populatiei tintaAplicarea fpc va reduce volumul esantionului.Aplicarea fpc va reduce volumul esantionului.Indicele fpc se aplica mai des pentru studiile Indicele fpc se aplica mai des pentru studiile

descriptive si pentru selectia persoanelor de descriptive si pentru selectia persoanelor de control in studiile caz-control.control in studiile caz-control.

Page 25: Teste neparametrice

Interpretarea puterii studiilor Interpretarea puterii studiilor publicatepublicate

• Puterea reprezinta probabilitatea ca datele studiului Puterea reprezinta probabilitatea ca datele studiului vor indica o diferenta intre tratamente sau expuneri, vor indica o diferenta intre tratamente sau expuneri, atunci cand aceasta diferenta intr-adevar exista.atunci cand aceasta diferenta intr-adevar exista.

• Daca puterea este mare, atunci nu avem nici un Daca puterea este mare, atunci nu avem nici un motiv sa punem la indoiala concluziile studiului.motiv sa punem la indoiala concluziile studiului.

• Daca studiul are o putere insuficienta atunci un Daca studiul are o putere insuficienta atunci un rezultat care indica lipsa unei diferente semnificative rezultat care indica lipsa unei diferente semnificative poate fi atribuit deficitului de putere si nu posibilitatii poate fi atribuit deficitului de putere si nu posibilitatii ca ipoteza nula este corecta.ca ipoteza nula este corecta.

• Un studiu cu o putere inadecvata nu permite Un studiu cu o putere inadecvata nu permite cercetatorului sa testeze ipoteza studiata.cercetatorului sa testeze ipoteza studiata.

• Puterea statistica se alege a priori de catre cercetator Puterea statistica se alege a priori de catre cercetator si de regula se recomanda sa fie intre0,80 si 0,95.si de regula se recomanda sa fie intre0,80 si 0,95.

Page 26: Teste neparametrice

Tipuri de esantionajTipuri de esantionaj

• Exista in principiu 2 mari modalitati Exista in principiu 2 mari modalitati de esantionaj si anume: de esantionaj si anume:

• Esantionajul probabilistic, aleatorEsantionajul probabilistic, aleator

• Esantionajul neprobabilistic, Esantionajul neprobabilistic, nealeator sau empiric.nealeator sau empiric.

Page 27: Teste neparametrice

Esantionajele probabilisticeEsantionajele probabilistice• Esantionul aleator, simplu sau elementar: Esantionul aleator, simplu sau elementar:

procedeul de obtinere consta din extragerea la procedeul de obtinere consta din extragerea la sorti a unitatilor ce vor compune esantionul si sorti a unitatilor ce vor compune esantionul si vor fi efectiv investigate dintr-o lista in care au vor fi efectiv investigate dintr-o lista in care au fost inscrise si numerotate toate elementele fost inscrise si numerotate toate elementele care compun populatia de referinta.care compun populatia de referinta.

• Fiecare unitate de selectie are sanse egale de Fiecare unitate de selectie are sanse egale de a intra in esantion .a intra in esantion .

• Tehnica de sondaj presupune mai intai Tehnica de sondaj presupune mai intai determinarea volumului esantionului pentru a determinarea volumului esantionului pentru a sti cate unitati trebuie selectionate din baza sti cate unitati trebuie selectionate din baza care contine un numar mult mai mare de care contine un numar mult mai mare de subiecti.n/N se numeste fractiune de subiecti.n/N se numeste fractiune de esantionaj si arata cat reprezinta esantionul esantionaj si arata cat reprezinta esantionul din populatia tinta.din populatia tinta.

Page 28: Teste neparametrice

• Exista 2 posibilitati de extragere probabilistica:Exista 2 posibilitati de extragere probabilistica:1.1. Sondaj fara repetitie (repunere)Sondaj fara repetitie (repunere)2.2. Sondaj cu repetitie (cu repunere)Sondaj cu repetitie (cu repunere)Sondajul fara repetitie consta in genul deSondajul fara repetitie consta in genul deselectare tip Loto. Unitatile care vorselectare tip Loto. Unitatile care vorcompune esantionul se extrag una cate una.compune esantionul se extrag una cate una.In acest caz nu toate unitatile statistice auIn acest caz nu toate unitatile statistice auaceeasi probabilitate de a fi selectate.aceeasi probabilitate de a fi selectate.Sonadjul cu repetitie inlatura acest inconvenient,Sonadjul cu repetitie inlatura acest inconvenient,mentinand aceeasi probabilitate de-a lungulmentinand aceeasi probabilitate de-a lungulintregii extrageri.intregii extrageri.O alta posibilitate de realizare practica a extragerii O alta posibilitate de realizare practica a extragerii

unitatilorunitatiloreste folosirea tabelelor cu numere aleatoare, in careeste folosirea tabelelor cu numere aleatoare, in carenumerele sunt dispuse haotic si se extrag primele 100 denumerele sunt dispuse haotic si se extrag primele 100 denumere.Extragerea unitatilor din lista se poate face si cu numere.Extragerea unitatilor din lista se poate face si cu

ununanumit pas de numarare dat de raportul k=N/n. In acestanumit pas de numarare dat de raportul k=N/n. In acestcaz schema se numeste esantionaj sistematic.caz schema se numeste esantionaj sistematic.

Page 29: Teste neparametrice

• Pentru toate tehnicile de esantionaj Pentru toate tehnicile de esantionaj calitatea esantionului depinde de calitatea calitatea esantionului depinde de calitatea bazei de sondaj.bazei de sondaj.

• Aceasta trebuie sa fie:Aceasta trebuie sa fie:• adecvata (sa contina toata populatia)adecvata (sa contina toata populatia)• Completa (sa contina toate categoriile Completa (sa contina toate categoriile

care intereseaza studiul)care intereseaza studiul)• Sa nu repete aceleasi unitati de mai multe Sa nu repete aceleasi unitati de mai multe

oriori• exacta (persoanele inscrise in lista sa si exacta (persoanele inscrise in lista sa si

existe in mod efectiv)existe in mod efectiv)• actualizataactualizata• Convenabila pentru nevoile sondajului Convenabila pentru nevoile sondajului

Page 30: Teste neparametrice

Esantionul stratificatEsantionul stratificat

• Se foloseste atunci cand datele nu sunt Se foloseste atunci cand datele nu sunt dispuse aleator, ci sunt clasate dupa dispuse aleator, ci sunt clasate dupa anumite caracteristici.anumite caracteristici.

• Se pot delimita mai multe subpopulatii Se pot delimita mai multe subpopulatii care nu se suprapun si care se numesc care nu se suprapun si care se numesc straturi.straturi.

• Caracteristic pentru un strat este Caracteristic pentru un strat este omogenitatea interna si neomogenitatea omogenitatea interna si neomogenitatea fata de celelalte straturi.fata de celelalte straturi.

Page 31: Teste neparametrice

• Se pot folosi 2 tipuri de selectie:Se pot folosi 2 tipuri de selectie:1.1. Selectia stratificata proportionala – folosita Selectia stratificata proportionala – folosita

atunci cand toate straturile sunt egale si atunci cand toate straturile sunt egale si cand caracteristica cercetata se intalneste cand caracteristica cercetata se intalneste cu frecvente relativ asemanatoare in fiecare cu frecvente relativ asemanatoare in fiecare strat sau dispersia este asemanatoare.strat sau dispersia este asemanatoare.

2.2. Selectia startificata cu volum optim – Selectia startificata cu volum optim – folosita atunci cand conditiile enuntate nu folosita atunci cand conditiile enuntate nu sunt respectate.sunt respectate.

Esantionajul stratificat permite obtinerea de Esantionajul stratificat permite obtinerea de datedate

precise pentru fiecare strat.precise pentru fiecare strat.Realizarea efectiva a esantionului depinde deRealizarea efectiva a esantionului depinde deexistenta unor baze de sondaj oraganizate peexistenta unor baze de sondaj oraganizate pestraturi.straturi.

Page 32: Teste neparametrice

Esantionajul in cuiburiEsantionajul in cuiburi

• Se foloseste atunci cand lipseste o Se foloseste atunci cand lipseste o baza de sondaj care sa contina baza de sondaj care sa contina unitatile de observatie, atunci cand unitatile de observatie, atunci cand intocmirea ei este costisitoare sau intocmirea ei este costisitoare sau dispersia populatiei este exagerata.dispersia populatiei este exagerata.

• Principiul de la care se porneste este Principiul de la care se porneste este ca populatia de investigat poate fi ca populatia de investigat poate fi imaginata ca fiind constituita din imaginata ca fiind constituita din unitati de selectie agregate si unitati de selectie agregate si ierarhizate.ierarhizate.

Page 33: Teste neparametrice

• Cuibul este o unitate de selectie heterogena Cuibul este o unitate de selectie heterogena in care sunt agregate mai multe unitati de in care sunt agregate mai multe unitati de observare.observare.

• Esantionajul in cuiburi se realizeaza in 3 Esantionajul in cuiburi se realizeaza in 3 etape:- se foloseste ca baza de sondaj lista etape:- se foloseste ca baza de sondaj lista cuiburilorcuiburilor- se extrag aleator cuiburile ce vor compune - se extrag aleator cuiburile ce vor compune esantionulesantionul- se investigheaza apoi toate unitatile de - se investigheaza apoi toate unitatile de observare din cuiburile extrase.observare din cuiburile extrase.

Esantionajul este mult mai precis cu catEsantionajul este mult mai precis cu catheterogenitatea cuiburilor este mai mare.heterogenitatea cuiburilor este mai mare.Pentru a ne asigura reprezentativitatea este Pentru a ne asigura reprezentativitatea este

dedepreferat sa se studieze mai multe cuiburi mici,preferat sa se studieze mai multe cuiburi mici,decat putine cuiburi de dimensiuni mari. decat putine cuiburi de dimensiuni mari.

Page 34: Teste neparametrice

Esantionajul multistadialEsantionajul multistadial

• Principiul este ierarhia unitatilor de Principiul este ierarhia unitatilor de selectie posibile, ca in esantionajul in selectie posibile, ca in esantionajul in cuiburi.cuiburi.

• Diferenta consta in aceea ca in timp ce Diferenta consta in aceea ca in timp ce in cazul cuiburilor se poate utiliza o in cazul cuiburilor se poate utiliza o singura extragere aleatoare urmata de singura extragere aleatoare urmata de investigarea tuturor unitatilor din cuiburi investigarea tuturor unitatilor din cuiburi , in esantionajul multistadial se fac mai , in esantionajul multistadial se fac mai multe extrageri.multe extrageri.

Page 35: Teste neparametrice

• Si in acest caz este bine sa se evite folosirea unui Si in acest caz este bine sa se evite folosirea unui numar mare de extrageri.numar mare de extrageri.

• De regula se foloseste esantionajul bi sau De regula se foloseste esantionajul bi sau tristadial, deoarece fiecare operatiune de tristadial, deoarece fiecare operatiune de extragere antreneaza cate o eroare de esantionaj.extragere antreneaza cate o eroare de esantionaj.

• Avantaje:flexibilitate mai mareAvantaje:flexibilitate mai mare• Indicatie: acele procese care implica teste Indicatie: acele procese care implica teste

chimice, biologice care pot fi efectuate intr-o chimice, biologice care pot fi efectuate intr-o cantitate mai mica de produs, prin extragerea de cantitate mai mica de produs, prin extragerea de subesantioane dintr-o cantitate mai mare, care subesantioane dintr-o cantitate mai mare, care este ea insasi un esantion.este ea insasi un esantion.

• Pentru acest procedeu sunt necesare mai multe Pentru acest procedeu sunt necesare mai multe baze de sondaj.baze de sondaj.

• Se mai numeste esantionaj multifazic, cand se Se mai numeste esantionaj multifazic, cand se cerceteaza intr-o prima faza anumite caracteristici cerceteaza intr-o prima faza anumite caracteristici si pe baza lor se determina un al doilea esantion si pe baza lor se determina un al doilea esantion care se cerceteaza in a doua faza.care se cerceteaza in a doua faza.

Page 36: Teste neparametrice

Metodele neprobabilisticeMetodele neprobabilistice

• Se bazeaza pe ideea ca Se bazeaza pe ideea ca reprezentativitatea poate fi asigurata reprezentativitatea poate fi asigurata prin alegere rationala.prin alegere rationala.

• Sondajul neprobabilistic nu implica Sondajul neprobabilistic nu implica selectie aleatoare.selectie aleatoare.

• Metodele nealeatoare pot fi:Metodele nealeatoare pot fi:

- bazate pe conventie- bazate pe conventie

- bazate pe atingerea unui scop.- bazate pe atingerea unui scop.

Page 37: Teste neparametrice

Esantionajul conventionalEsantionajul conventional

• Unitatea de observatie: omul de pe Unitatea de observatie: omul de pe strada.strada.

• Nu avem nici o dovada a Nu avem nici o dovada a reprezentativitatii.reprezentativitatii.

Page 38: Teste neparametrice

Esantionajul bazat pe Esantionajul bazat pe atingerea unui scopatingerea unui scop

• Selectia se face avand un scopSelectia se face avand un scop

• Cel care raspunde trebuie sa indeplineasca Cel care raspunde trebuie sa indeplineasca anumite criteriianumite criterii

• Subcategorii:- esantioane tipiceSubcategorii:- esantioane tipice

- esantionul expertilor- esantionul expertilor

- metoda cotelor- metoda cotelor

- esantionul in bulgare de zapada- esantionul in bulgare de zapada

- metoda esantioanelor fixe - metoda esantioanelor fixe

Page 39: Teste neparametrice

Esantioanele tipiceEsantioanele tipice

• Se imparte populatia in subansamble Se imparte populatia in subansamble omogene si alegem din fiecare o omogene si alegem din fiecare o unitate considerata de cercetator ca unitate considerata de cercetator ca fiind cea mai reprezentativa.fiind cea mai reprezentativa.

Page 40: Teste neparametrice

Esantionul expertilorEsantionul expertilor

• Include persoane cu experienta si Include persoane cu experienta si pregatire cunoscute intr-un anumit pregatire cunoscute intr-un anumit domeniu.domeniu.

• Motive de alegere: cunoaterea Motive de alegere: cunoaterea opiniei persoanelor cu experienta si opiniei persoanelor cu experienta si validarea unei alte metode de validarea unei alte metode de esantionare aleasa.esantionare aleasa.

Page 41: Teste neparametrice

Metoda cotelorMetoda cotelor

• Este procedeul cel mai utilizatEste procedeul cel mai utilizat• Se bazeaza pe ideea asigurarii unei Se bazeaza pe ideea asigurarii unei

reprezentativitati prin realizarea unui reprezentativitati prin realizarea unui esantion care sa aiba o structura esantion care sa aiba o structura asemanatoare cu a populatiei.asemanatoare cu a populatiei.

• Nu necesita existenta unei baze de Nu necesita existenta unei baze de sondaj, ci doar cunoasterea structurii sondaj, ci doar cunoasterea structurii populatiei.populatiei.

• Nu permite evaluarea preciziei Nu permite evaluarea preciziei estimatiilorestimatiilor

Page 42: Teste neparametrice

Esantionul in bulgare de Esantionul in bulgare de zapadazapada

• Se incepe cu identificarea celor care Se incepe cu identificarea celor care indeplinesc criteriile pentru a fi indeplinesc criteriile pentru a fi inclusi in studiu.inclusi in studiu.

• Aceste persoane sunt rugate sa Aceste persoane sunt rugate sa recomande alte persoane ce recomande alte persoane ce indeplinesc aceleasi criterii. indeplinesc aceleasi criterii.

Page 43: Teste neparametrice

Metoda esantioanelor fixeMetoda esantioanelor fixe

• Se colecteaza periodic date din Se colecteaza periodic date din acelasi esantion.acelasi esantion.

Page 44: Teste neparametrice

Surse de eori in studiile pe Surse de eori in studiile pe esantioaneesantioane

• 3 surse de erori:3 surse de erori:1.1. Neinvestigarea unor unitati selectionate in Neinvestigarea unor unitati selectionate in

esantion datorita imposibilitatii de a localiza esantion datorita imposibilitatii de a localiza indivizii sau datorita refuzului de a raspundeindivizii sau datorita refuzului de a raspunde

2.2. Erori in masurarea unitatilor datorita Erori in masurarea unitatilor datorita aparatului de masura care poate fi imprecisaparatului de masura care poate fi imprecis

3.3. Erori introduse in procesele de editare, Erori introduse in procesele de editare, codificare si tabelare a rezultatelorcodificare si tabelare a rezultatelor

Problema nonraspunsului este principala Problema nonraspunsului este principala problema.problema.

Page 45: Teste neparametrice

SolutiiSolutii

• Reducerea nonraspunsului prin educatia populatieiReducerea nonraspunsului prin educatia populatiei• Revizitarea persoanelor care nu au fost gasiteRevizitarea persoanelor care nu au fost gasite• Compararea populatiei refractare cu cea care a Compararea populatiei refractare cu cea care a

raspunsraspuns• Gasirea unui inlocuitor prin alcatuirea unei liste de Gasirea unui inlocuitor prin alcatuirea unei liste de

rezervarezerva• Estimarea nivelului nonraspunsurilor si marirea Estimarea nivelului nonraspunsurilor si marirea

volumului esantionului corespunzator. Pentru volumului esantionului corespunzator. Pentru aceasta volumul esantionului se inmulteste cu un aceasta volumul esantionului se inmulteste cu un factor q=1/1-f, unde f=rata estimata a factor q=1/1-f, unde f=rata estimata a nonraspunsuluinonraspunsului