compararea mediilor i

20
Compararea mediilor Cornelia Muresan Universitatea Babes-Bolyai

Upload: evi1304

Post on 30-Jun-2015

171 views

Category:

Documents


1 download

TRANSCRIPT

Page 1: Compararea mediilor I

Compararea mediilor

Cornelia MuresanUniversitatea Babes-Bolyai

Page 2: Compararea mediilor I

2

Structura cursului

Ipoteze care implica compararea mediilorCat de mare trebuie sa fie diferenta dintre doua medii?Testul z pentru esantioane mariTestul t pentru esantioane miciExempluProblema inegalitatii variantelorTestul FicherTestul t pentru esantioane perechiExempluRestrictii de utilizare a testului tLucrare de laborator

Page 3: Compararea mediilor I

3

Ipoteze care implica compararea mediilor

Examineaza daca diferentele dintre doua sau mai multe(sub)esantioane sunt suficient de mari ca sa nu se datorezeerorii de esantionare.

Cauta legatura dintre o variabila calitativa (de regula ceaindependenta) si una cantitativa (cea dependenta).

Ex1: Ipc: Elevii care participa la activitati interactive de preventie a infectarii cu virusul HIV capata cunostinte maisolide decat cei carora li se distribuie doar materialepromotionale.

Ex2: Ipc: Studentii care folosesc “Ghidul pentru redactarealucrarii de licenta” obtin note mai mari la examen decat cei care nu-l utilizeaza.

O diferenta statistic semnificativa nu sugereaza ca o variabilaeste cauza variatiei celeilalte.

Page 4: Compararea mediilor I

4

Ipoteze care implica compararea mediilor

Variabile independente categoriale des intalnite in asistenta sociala:

- tratament A si tratament B- grup experimental si grup de control- inainte si dupa interventie

Variabile dependente cantitative de interes in asistenta sociala:

Operationalizate cantitativ- stima de sine- aspiratia spre bunastare- adaptarea sociala- satisfactia maritala- solidaritatea familiala- cunostintele acumulate intr-un anume domeniu- rezultate scolare

Cantitative prin natura lor- numar de interventii reusite- numar comportamente violente indreptate impotriva sotiei /copilului- numar de absente de la scoala- venituri provenite din ajutoare sociale

Page 5: Compararea mediilor I

5

Ipoteze care implica compararea mediilor

Atuuri ale testelor de comparare a mediilor:

Se poate utiliza si pentru dimensiuni relativ mici a esantioanelor (20-30 cazuri)

Posibilitatea ca grupul experimental si cel de control saaiba dimensiuni diferite

Test parametric (puternic)

Testul Student sau Testul t (autor William Gosset)

Page 6: Compararea mediilor I

6

Cat de mare trebuie sa fie diferenta dintre doua medii?

Ex1: Ipc: Elevii care participa la activitati interactive de preventiea infectarii cu virusul HIV capata cunostinte mai solide decat ceicarora li se distribuie doar materiale promotionale.

Variabila dependenta: cunostinte depre HIV evaluate cu ajutorul unui test de cunostinte, notat de la 0 la 10Variabila independenta: metoda de tratament A (metodeinteractive, discutii, intalniri) si B (metode indirecte, brosuri, pliante)Diferente mici? Diferente mari? (credibilitate in functie de volumele esantioanelor)Cele doua esantioane sunt la fel de omogene / eterogene?E diferenta intamplatoare?E substantiala? Justifica costurile?

Page 7: Compararea mediilor I

7

Distributia ipotezei nule

Diferenţa dintre medii

Populatia 1

Elevii cu care se lucreazainteractiv la clasa sauextrascolar

Populatia 2

Elevii carora lise distribuiedoarmaterialescrise

Eş. 1 m11 - m21

Eş. 2

Eş. 1

Eş. 2

Eş. 3

m12 - m22

m13 - m23Eş. 3

Page 8: Compararea mediilor I

8

Distributia ipotezei nule

µ1-µ2 = 0

(m1-2 – m2-2) (m1-3 – m2-3)

(m1-1 – m2-1)

Problema de rezolvat: diferenta dintre mediile celor douaesantioane este suficient de mare sa nu se datoreze doarintamplarii?

Daca s-ar datora doar intamplarii (Ipo) cele doua medii (m1 si m2) ar face parte din aceeasi populatie diferenta dintre ele ar tindecatre 0

Va trebui sa comparam diferenta noastra cu marimi care s-arobtine prin extragerea aleatoare a doua esantioane dintr-oaceeasi populatie distribuita normal in jurul mediei 0

Page 9: Compararea mediilor I

9

Testul z pentru esantioane mari

Mediile de esantionare tind catre media populatiei, daca esantioanelesunt suficient de mari (teorema limitei centrale)

Mediile de esantionare au o distributie normala, daca volumulesantioanelor e mare (teorema limitei centrale)

Daca ambele esantioane apartin aceleiasi populatii (Ipo), atuncidiferenta dintre mediile de esantionare tinde catre 0

Distributia diferentelor dintre medii este o distributie normala cu media 0. Ea poate fi standardizata ( adica transformata in valori z )

z este raportul dintre diferenta mediilor si eroarea standard a diferenteiEroarea standard a diferentei = suma erorilor standard a celor douaesantioane

2

22

1

21

21

nn

mmzσσ

+

−=

Page 10: Compararea mediilor I

10

Testul z pentru esantioane mari

Nivelul de semnificatie p asociat testului z se afla cu ajutorultabelei cu ariile de sub curba normala si ±z (valoarea calculata)

Aria cuprinsă între curba normală, medie şi valoarea Z Z .00 .01 .02 .03 .04 .05 .06 .07 .08 .09

0.0 0.00 0.40 0.80 1.20 1.60 1.99 2.39 2.79 3.19 3.59 0.1 3.98 4.38 4.78 5.17 5.57 5.96 6.36 6.75 7.14 7.53 0.2 7.93 8.32 8.71 9.10 9.48 9.87 10.26 10.64 11.03 11.41 0.3 11.79 12.17 12.55 12.93 13.31 13.68 14.06 14.43 14.80 15.17 0.4 15.54 15.91 16.28 16.64 17.00 17.36 17.72 18.08 18.44 18.79

0.5 19.15 19.50 19.85 20.19 20.54 20.48 21.23 21.57 21.90 22.24 0.6 22.57 22.91 23.24 23.57 23.89 24.22 24.54 24.86 25.17 25.49 0.7 25.80 26.11 26.42 26.73 27.04 27.34 27.64 27.94 28.23 28.52 0.8 28.81 29.10 29.39 29.67 29.95 30.23 30.51 30.78 31.06 31.33 0.9 31.59 31.86 32.12 32.38 32.64 32.90 33.15 33.40 33.65 33.89

1.0 34.13 34.38 34.61 34.85 35.08 35.31 35.54 35.77 35.99 36.21

...

Pentru p=0.05, z critic este 1.64 si corespunde ariei 45.00% (ip directionala), respectiv z critic este 1.96,si corespunde ariei 47.50% (ip.non-directionala)

Page 11: Compararea mediilor I

11

Testul Student pentru esantioane mici (t )

Probleme pentru esantioanele mici:

1. Distributia diferentei dintre medii nu este normala(nu are forma de clopot) si este cu atat mai ascutita cu cat dimensiunile esantioanelor sunt mai mici

Marimea t (calculata dupa aceasi formula ca z) depinde de gradele de libertate (df)

df = n1 + n2 – 2

2

22

1

21

21

ns

ns

mmt+

−=

Obs. La esantioane mici la calculul variantei (s2 ) in loc de n se foloseste n-1

Page 12: Compararea mediilor I

12

Testul Student pentru esantioane mici (t )

Nivelul de semnificatie se determina din tabelele cu valori t

Tabel cu valori critice pentru testul t . Nivele de semnificaţie pentru test direcţional (one-tailed) . 0.10 0.05 0.025 0.01 0.005 0.0005 . Nivele de semnificaţie pentru test nedirecţional (two-tailed) . df 0.20 0.10 0.05 0.02 0.01 0.001 . 1 3.078 6.314 12.706 31.821 63.657 636.619 2 1.886 2.920 4.303 6.965 9.925 31.689 3 1.638 2.353 3.182 4.541 5.841 12.941 4 1.533 2.132 2.776 3.747 4.604 8.610 5 1.476 2.015 2.571 3.365 4.032 6.859 6 1.440 1.943 2.447 3.143 3.707 5.959 7 1.415 1.895 2.365 2.998 3.499 5.405 ...

Page 13: Compararea mediilor I

13

Testul Student pentru esantioane mici (t )

Probleme pentru esantioanele mici:

2. Daca variantele din cele doua populatii de provenienta a esantioanelor nu sunt egale, formula erorii standard a diferenteiintroduce distorsiuni mari

se foloseste formula variantei cumulate (s2cum)

2)1()1(

21

222

2112

−+−+−

=nn

snsnscum

Marimea t pentru variante egale:

)11(2

)1()1(

2121

222

211

21

nnnnsnsn

mmt+

−+−+−

−=

ο

Page 14: Compararea mediilor I

14

Exemplu: calcul manual

. Nivele de semnificaţie pentru testul direcţionat (one-tailed) . 0.10 0.05 0.025 0.01 0.005 0.0005 Nivele de semnificaţie pentru testul nedirecţionat (two-tailed) . df 0.20 0.10 0.05 0.02 0.01 0.001 … 14 1.345 1.761 2.145 2.624 2.977 4.140 …

Esantion 1: Esantion 2:Preventie cu metode interactive (discutii, activitati) Preventie cu metode indirecte (brosuri, pliante

X1 k1 x1*k1 x-m1 (x-m1)2 (x-m1)2* k1 X2 k2 x2*k2 x-m2 (x-m2)2 (x-m2)2* k2

6 1 6 -2.14 4.59 4.59 5 1 5 -2.33 5.44 5.447 1 7 -1.14 1.31 1.31 6 2 12 -1.33 1.78 3.568 2 16 -0.14 0.02 0.04 7 2 14 -0.33 0.11 0.229 2 18 0.86 0.73 1.47 8 2 16 0.67 0.44 0.89

10 1 10 1.86 3.45 3.45 9 1 9 1.67 2.78 2.7810 1 10 2.67 7.11 7.11

7 57 10.86 9 66 20.00media m1 = 8.14 media m2 = 7.33varianta s1

2=10.86/(n1 -1) = 1.81 varianta s22=20/(n2 -1) = 2.50

diferenta intre medii m1 - m2 = 0.81scom

2 = ((n1-1)*s12 +(n2-1)*s2

2 / (n1+n2-2)) = 2.20Es = sqrt (scom

2 * (1/n1+1/n2) ) = 0.75

t = (m1-m2) / Es = 1.08df = n1+n2-2=9+7-2=14t critic = 2,145 p > 0,20 > 0,05

Tabel cu valori t

Ip0 nu poate fi respinsa

Page 15: Compararea mediilor I

15

Exemplu: Prezentarea rezultatelor

1. Se prezinta mediile variabilei cantitative calculate pentru pentrucele doua esantioane si se fac comparatii directeEx: m1 = 8.14; m2 = 7.33 m1 > m2, diferenta de 0.8 puncte

2. Se prezinta valoarea testului t adecvat, numarul gradelor de libertate, si valoarea nivelului de semnificatieEx: t = 1.08; df = 14; p > 0.20 se accepta Ip0 si se respinge Ipc

3. Se trag concluziile in termenii ipotezei de cercetare de la care s-a pornit

Ex: Desi punctajul obtinut la testul de cunostinte privind riscurileinfectarii HIV a fost mai mare la elevii cu care s-a lucrat interactiv, diferenta nu este statistic semnificativa. Prin urmare nu putemspune ca metodele de preventie directe garanteaza rezultate maibune decat metodele indirecte.

Se pune intrebarea daca nu cumva s-au omis alte variabile, dacanu cumva esantionele au fost prea mici pentru obiectivul propus, daca …Chiar e adevarat ca orice metoda este la fel de buna.

Page 16: Compararea mediilor I

16

SPSS: COMPARE MEANS, Independet Sample T Test

T-TestGroup Statistics

Metoda preventie N Mean Std. DeviationStd. Error

Mean

Indirecte9 7.33 1.581

.527

Interactive 7 8.14 1.345 508

Nivel cunostinte HIV

Independent Samples Test

Levene's Test for Equality of Variances

t-test for Equality of Means

95% Confidence Interval of the Difference

F Sig. t dfSig. (2-tailed)

Mean Differen

ce

Std. Error

Difference Lower Upper

Equal variances assumed .338 .570 -1.082 14 .298 -.810 .748 -2.414

.795

Equal variances not assumed -1.105 13.839 .288 -.810 .732 -2.382 .763

Nivel cunostinteHIV

Page 17: Compararea mediilor I

17

Problema ne-egalitatii variantelor

Formula de calcul al erorii standard a diferentelor (numitorul din formula de calcul al lui t) este diferita pentru esantioaneprovenind din populatii cu variante ne-egale

nevoia testarii egalitatii variantelor in populatie

Ip0: Variantele sunt egale

Page 18: Compararea mediilor I

18

Testul Ficher (F)

Cum determinam daca cele doua esantioane provin din populatii cu acelasi grad de omogenitate (variante egale) ?

Testul Ficher de egalitate a variantelor:

22

21

ssF =

unde s12 este varianta mai mare si s2

2 varianta mai mica (de obicei)

Nivelul de semnificatie a lui F depinde de o pereche de grade de libertate:

df1 = n1 - 1 si df2 = n2 - 1Tabel cu valori critice pentru testul F A. Nivelul p = 0.05 B. Nivelul p = 0.01 df1 2 3 4 … df1 2 3 4 … df2 df2 . 2 19.00 19.16 19.25 2 99.00 99.17 99.25 3 9.55 9.28 9.12 3 30.81 29.46 28.71 4 6.94 6.59 6.39 4 18.00 16.69 15.98 5 5.79 5.41 5.19 5 13.27 12.06 11.39 6 5.14 4.79 4.53 5 10.91 9.78 9.15 7 4.74 4.35 4.12 7 9.55 8.45 7.85 ... …

Page 19: Compararea mediilor I

19

SPSS: COMPARE MEANS, Independet Sample T Test

T-TestGroup Statistics

Metoda preventie N Mean Std. DeviationStd. Error

Mean

Indirecte9 7.33 1.581

.527

Interactive 7 8.14 1.345 .508

Nivel cunostinte HIV

Independent Samples Test

Levene's Test for Equality of Variances

t-test for Equality of Means

95% Confidence Interval of the Difference

F Sig. t dfSig. (2-tailed)

Mean Differen

ce

Std. Error

Difference Lower Upper

Equal variances assumed .338 .570 -1.082 14 .298 -.810 .748 -2.414

.795

Equal variances not assumed -1.105 13.839 .288 -.810 .732 -2.382 .763

Nivel cunostinteHIV

Page 20: Compararea mediilor I

20

Laborator SPSS: exercitiu 1

Fisierul de date: “1991 US General Social Survey”

Ipc: Barbatii au un nivel de educatie mai inalt decat femeile

Variabila dependenta: nivelul de educatie, operationalizat in numarul anilor de scoala absolvitiVariabila independenta: sexul

Comanda SPSS: COMPARE MEANS, Independent Sample, T Test

Se cere: a) analiza datelor cu SPSSb) interpretarea rezultatelor (pe o foaie de hartie, semnata)