compararea mediilor i
TRANSCRIPT
Compararea mediilor
Cornelia MuresanUniversitatea Babes-Bolyai
2
Structura cursului
Ipoteze care implica compararea mediilorCat de mare trebuie sa fie diferenta dintre doua medii?Testul z pentru esantioane mariTestul t pentru esantioane miciExempluProblema inegalitatii variantelorTestul FicherTestul t pentru esantioane perechiExempluRestrictii de utilizare a testului tLucrare de laborator
3
Ipoteze care implica compararea mediilor
Examineaza daca diferentele dintre doua sau mai multe(sub)esantioane sunt suficient de mari ca sa nu se datorezeerorii de esantionare.
Cauta legatura dintre o variabila calitativa (de regula ceaindependenta) si una cantitativa (cea dependenta).
Ex1: Ipc: Elevii care participa la activitati interactive de preventie a infectarii cu virusul HIV capata cunostinte maisolide decat cei carora li se distribuie doar materialepromotionale.
Ex2: Ipc: Studentii care folosesc “Ghidul pentru redactarealucrarii de licenta” obtin note mai mari la examen decat cei care nu-l utilizeaza.
O diferenta statistic semnificativa nu sugereaza ca o variabilaeste cauza variatiei celeilalte.
4
Ipoteze care implica compararea mediilor
Variabile independente categoriale des intalnite in asistenta sociala:
- tratament A si tratament B- grup experimental si grup de control- inainte si dupa interventie
Variabile dependente cantitative de interes in asistenta sociala:
Operationalizate cantitativ- stima de sine- aspiratia spre bunastare- adaptarea sociala- satisfactia maritala- solidaritatea familiala- cunostintele acumulate intr-un anume domeniu- rezultate scolare
Cantitative prin natura lor- numar de interventii reusite- numar comportamente violente indreptate impotriva sotiei /copilului- numar de absente de la scoala- venituri provenite din ajutoare sociale
5
Ipoteze care implica compararea mediilor
Atuuri ale testelor de comparare a mediilor:
Se poate utiliza si pentru dimensiuni relativ mici a esantioanelor (20-30 cazuri)
Posibilitatea ca grupul experimental si cel de control saaiba dimensiuni diferite
Test parametric (puternic)
Testul Student sau Testul t (autor William Gosset)
6
Cat de mare trebuie sa fie diferenta dintre doua medii?
Ex1: Ipc: Elevii care participa la activitati interactive de preventiea infectarii cu virusul HIV capata cunostinte mai solide decat ceicarora li se distribuie doar materiale promotionale.
Variabila dependenta: cunostinte depre HIV evaluate cu ajutorul unui test de cunostinte, notat de la 0 la 10Variabila independenta: metoda de tratament A (metodeinteractive, discutii, intalniri) si B (metode indirecte, brosuri, pliante)Diferente mici? Diferente mari? (credibilitate in functie de volumele esantioanelor)Cele doua esantioane sunt la fel de omogene / eterogene?E diferenta intamplatoare?E substantiala? Justifica costurile?
7
Distributia ipotezei nule
Diferenţa dintre medii
Populatia 1
Elevii cu care se lucreazainteractiv la clasa sauextrascolar
Populatia 2
Elevii carora lise distribuiedoarmaterialescrise
Eş. 1 m11 - m21
Eş. 2
Eş. 1
Eş. 2
Eş. 3
m12 - m22
m13 - m23Eş. 3
8
Distributia ipotezei nule
µ1-µ2 = 0
(m1-2 – m2-2) (m1-3 – m2-3)
(m1-1 – m2-1)
Problema de rezolvat: diferenta dintre mediile celor douaesantioane este suficient de mare sa nu se datoreze doarintamplarii?
Daca s-ar datora doar intamplarii (Ipo) cele doua medii (m1 si m2) ar face parte din aceeasi populatie diferenta dintre ele ar tindecatre 0
Va trebui sa comparam diferenta noastra cu marimi care s-arobtine prin extragerea aleatoare a doua esantioane dintr-oaceeasi populatie distribuita normal in jurul mediei 0
9
Testul z pentru esantioane mari
Mediile de esantionare tind catre media populatiei, daca esantioanelesunt suficient de mari (teorema limitei centrale)
Mediile de esantionare au o distributie normala, daca volumulesantioanelor e mare (teorema limitei centrale)
Daca ambele esantioane apartin aceleiasi populatii (Ipo), atuncidiferenta dintre mediile de esantionare tinde catre 0
Distributia diferentelor dintre medii este o distributie normala cu media 0. Ea poate fi standardizata ( adica transformata in valori z )
z este raportul dintre diferenta mediilor si eroarea standard a diferenteiEroarea standard a diferentei = suma erorilor standard a celor douaesantioane
2
22
1
21
21
nn
mmzσσ
+
−=
10
Testul z pentru esantioane mari
Nivelul de semnificatie p asociat testului z se afla cu ajutorultabelei cu ariile de sub curba normala si ±z (valoarea calculata)
Aria cuprinsă între curba normală, medie şi valoarea Z Z .00 .01 .02 .03 .04 .05 .06 .07 .08 .09
0.0 0.00 0.40 0.80 1.20 1.60 1.99 2.39 2.79 3.19 3.59 0.1 3.98 4.38 4.78 5.17 5.57 5.96 6.36 6.75 7.14 7.53 0.2 7.93 8.32 8.71 9.10 9.48 9.87 10.26 10.64 11.03 11.41 0.3 11.79 12.17 12.55 12.93 13.31 13.68 14.06 14.43 14.80 15.17 0.4 15.54 15.91 16.28 16.64 17.00 17.36 17.72 18.08 18.44 18.79
0.5 19.15 19.50 19.85 20.19 20.54 20.48 21.23 21.57 21.90 22.24 0.6 22.57 22.91 23.24 23.57 23.89 24.22 24.54 24.86 25.17 25.49 0.7 25.80 26.11 26.42 26.73 27.04 27.34 27.64 27.94 28.23 28.52 0.8 28.81 29.10 29.39 29.67 29.95 30.23 30.51 30.78 31.06 31.33 0.9 31.59 31.86 32.12 32.38 32.64 32.90 33.15 33.40 33.65 33.89
1.0 34.13 34.38 34.61 34.85 35.08 35.31 35.54 35.77 35.99 36.21
...
Pentru p=0.05, z critic este 1.64 si corespunde ariei 45.00% (ip directionala), respectiv z critic este 1.96,si corespunde ariei 47.50% (ip.non-directionala)
11
Testul Student pentru esantioane mici (t )
Probleme pentru esantioanele mici:
1. Distributia diferentei dintre medii nu este normala(nu are forma de clopot) si este cu atat mai ascutita cu cat dimensiunile esantioanelor sunt mai mici
Marimea t (calculata dupa aceasi formula ca z) depinde de gradele de libertate (df)
df = n1 + n2 – 2
2
22
1
21
21
ns
ns
mmt+
−=
Obs. La esantioane mici la calculul variantei (s2 ) in loc de n se foloseste n-1
12
Testul Student pentru esantioane mici (t )
Nivelul de semnificatie se determina din tabelele cu valori t
Tabel cu valori critice pentru testul t . Nivele de semnificaţie pentru test direcţional (one-tailed) . 0.10 0.05 0.025 0.01 0.005 0.0005 . Nivele de semnificaţie pentru test nedirecţional (two-tailed) . df 0.20 0.10 0.05 0.02 0.01 0.001 . 1 3.078 6.314 12.706 31.821 63.657 636.619 2 1.886 2.920 4.303 6.965 9.925 31.689 3 1.638 2.353 3.182 4.541 5.841 12.941 4 1.533 2.132 2.776 3.747 4.604 8.610 5 1.476 2.015 2.571 3.365 4.032 6.859 6 1.440 1.943 2.447 3.143 3.707 5.959 7 1.415 1.895 2.365 2.998 3.499 5.405 ...
13
Testul Student pentru esantioane mici (t )
Probleme pentru esantioanele mici:
2. Daca variantele din cele doua populatii de provenienta a esantioanelor nu sunt egale, formula erorii standard a diferenteiintroduce distorsiuni mari
se foloseste formula variantei cumulate (s2cum)
2)1()1(
21
222
2112
−+−+−
=nn
snsnscum
Marimea t pentru variante egale:
)11(2
)1()1(
2121
222
211
21
nnnnsnsn
mmt+
−+−+−
−=
ο
14
Exemplu: calcul manual
. Nivele de semnificaţie pentru testul direcţionat (one-tailed) . 0.10 0.05 0.025 0.01 0.005 0.0005 Nivele de semnificaţie pentru testul nedirecţionat (two-tailed) . df 0.20 0.10 0.05 0.02 0.01 0.001 … 14 1.345 1.761 2.145 2.624 2.977 4.140 …
Esantion 1: Esantion 2:Preventie cu metode interactive (discutii, activitati) Preventie cu metode indirecte (brosuri, pliante
X1 k1 x1*k1 x-m1 (x-m1)2 (x-m1)2* k1 X2 k2 x2*k2 x-m2 (x-m2)2 (x-m2)2* k2
6 1 6 -2.14 4.59 4.59 5 1 5 -2.33 5.44 5.447 1 7 -1.14 1.31 1.31 6 2 12 -1.33 1.78 3.568 2 16 -0.14 0.02 0.04 7 2 14 -0.33 0.11 0.229 2 18 0.86 0.73 1.47 8 2 16 0.67 0.44 0.89
10 1 10 1.86 3.45 3.45 9 1 9 1.67 2.78 2.7810 1 10 2.67 7.11 7.11
7 57 10.86 9 66 20.00media m1 = 8.14 media m2 = 7.33varianta s1
2=10.86/(n1 -1) = 1.81 varianta s22=20/(n2 -1) = 2.50
diferenta intre medii m1 - m2 = 0.81scom
2 = ((n1-1)*s12 +(n2-1)*s2
2 / (n1+n2-2)) = 2.20Es = sqrt (scom
2 * (1/n1+1/n2) ) = 0.75
t = (m1-m2) / Es = 1.08df = n1+n2-2=9+7-2=14t critic = 2,145 p > 0,20 > 0,05
Tabel cu valori t
Ip0 nu poate fi respinsa
15
Exemplu: Prezentarea rezultatelor
1. Se prezinta mediile variabilei cantitative calculate pentru pentrucele doua esantioane si se fac comparatii directeEx: m1 = 8.14; m2 = 7.33 m1 > m2, diferenta de 0.8 puncte
2. Se prezinta valoarea testului t adecvat, numarul gradelor de libertate, si valoarea nivelului de semnificatieEx: t = 1.08; df = 14; p > 0.20 se accepta Ip0 si se respinge Ipc
3. Se trag concluziile in termenii ipotezei de cercetare de la care s-a pornit
Ex: Desi punctajul obtinut la testul de cunostinte privind riscurileinfectarii HIV a fost mai mare la elevii cu care s-a lucrat interactiv, diferenta nu este statistic semnificativa. Prin urmare nu putemspune ca metodele de preventie directe garanteaza rezultate maibune decat metodele indirecte.
Se pune intrebarea daca nu cumva s-au omis alte variabile, dacanu cumva esantionele au fost prea mici pentru obiectivul propus, daca …Chiar e adevarat ca orice metoda este la fel de buna.
16
SPSS: COMPARE MEANS, Independet Sample T Test
T-TestGroup Statistics
Metoda preventie N Mean Std. DeviationStd. Error
Mean
Indirecte9 7.33 1.581
.527
Interactive 7 8.14 1.345 508
Nivel cunostinte HIV
Independent Samples Test
Levene's Test for Equality of Variances
t-test for Equality of Means
95% Confidence Interval of the Difference
F Sig. t dfSig. (2-tailed)
Mean Differen
ce
Std. Error
Difference Lower Upper
Equal variances assumed .338 .570 -1.082 14 .298 -.810 .748 -2.414
.795
Equal variances not assumed -1.105 13.839 .288 -.810 .732 -2.382 .763
Nivel cunostinteHIV
17
Problema ne-egalitatii variantelor
Formula de calcul al erorii standard a diferentelor (numitorul din formula de calcul al lui t) este diferita pentru esantioaneprovenind din populatii cu variante ne-egale
nevoia testarii egalitatii variantelor in populatie
Ip0: Variantele sunt egale
18
Testul Ficher (F)
Cum determinam daca cele doua esantioane provin din populatii cu acelasi grad de omogenitate (variante egale) ?
Testul Ficher de egalitate a variantelor:
22
21
ssF =
unde s12 este varianta mai mare si s2
2 varianta mai mica (de obicei)
Nivelul de semnificatie a lui F depinde de o pereche de grade de libertate:
df1 = n1 - 1 si df2 = n2 - 1Tabel cu valori critice pentru testul F A. Nivelul p = 0.05 B. Nivelul p = 0.01 df1 2 3 4 … df1 2 3 4 … df2 df2 . 2 19.00 19.16 19.25 2 99.00 99.17 99.25 3 9.55 9.28 9.12 3 30.81 29.46 28.71 4 6.94 6.59 6.39 4 18.00 16.69 15.98 5 5.79 5.41 5.19 5 13.27 12.06 11.39 6 5.14 4.79 4.53 5 10.91 9.78 9.15 7 4.74 4.35 4.12 7 9.55 8.45 7.85 ... …
19
SPSS: COMPARE MEANS, Independet Sample T Test
T-TestGroup Statistics
Metoda preventie N Mean Std. DeviationStd. Error
Mean
Indirecte9 7.33 1.581
.527
Interactive 7 8.14 1.345 .508
Nivel cunostinte HIV
Independent Samples Test
Levene's Test for Equality of Variances
t-test for Equality of Means
95% Confidence Interval of the Difference
F Sig. t dfSig. (2-tailed)
Mean Differen
ce
Std. Error
Difference Lower Upper
Equal variances assumed .338 .570 -1.082 14 .298 -.810 .748 -2.414
.795
Equal variances not assumed -1.105 13.839 .288 -.810 .732 -2.382 .763
Nivel cunostinteHIV
20
Laborator SPSS: exercitiu 1
Fisierul de date: “1991 US General Social Survey”
Ipc: Barbatii au un nivel de educatie mai inalt decat femeile
Variabila dependenta: nivelul de educatie, operationalizat in numarul anilor de scoala absolvitiVariabila independenta: sexul
Comanda SPSS: COMPARE MEANS, Independent Sample, T Test
Se cere: a) analiza datelor cu SPSSb) interpretarea rezultatelor (pe o foaie de hartie, semnata)