Download - St1 14 Teste Ordinale
-
TESTE STATISTICE
PENTRU DATE ORDINALE
-
CONDIII FUNDAMENTALEpentru testele parametrice
VD msurat pe scal cantitativ (I/R)
Msurare fr erori (?!)
erorile de msurare afecteaz valoarea testului i, implicit, decizia statistic
exemplu: coeficientul r este afectat de fidelitatea msurrii
Distribuia datelor respect modelul teoretic de referin
normalitatea !! (simetrie, absena valorilor extreme)
volumul eantionului (N=30 nu mai mic de 20!)
omogenitatea (egalitatea) varianei distribuiilor grupurilor comparate
-
Miza respectrii condiiilor:
Meninerea nivelului acceptat pentru erorile statistice
exces de eroare de tip I
acceptare greit a H1
exces de eroare de tip II
neacceptare greit a H1
-
Soluii
Verificarea atent a condiiilor
statistici descriptive
Numerice
Grafice
teste statistice specializate (SPSS)
Teste de normalitate
Teste de omogenitate a varianei
Normalizarea datelor ( ?!)
Utilizarea testelor NON-PARAMETRICE
-
Cnd se utilizeaz teste neparametrice?
VD este msurat pe scal calitativ (nominal, ordinal)
VD este msurat pe scal cantitativ, dar...
nu respect condiiile pentru test parametric (normalitate, omogenitatea mprtierii)
transformare calitativ (grupare de frecvene, ordonare dup rang)
volum foarte mic al eantionului (30 20)
-
avantaje ale testelor neparametrice
nu presupun condiii la fel de restictive (normalitatea distribuiei, omogenitatea varianei, etc.) ceea ce reduce mult situaiile n care nu sunt aplicabile;
calcule sunt relativ simple i uor de efectuat manual
concepte i metode mai uor de neles;
se pot utiliza pe scale ale cror caliti de msurare sunt slabe (ordinale, nominale);
pot fi utilizate n cazul variabilelor afectate de valori extreme care nu pot fi eliminate.
-
dezavantaje ale testelor
neparametrice
se bazeaz pe msurri ordinale sau nominale
mai puin precise dect cele cantitative
au o putere mai redus dect testele parametrice;
tind sa fie utilizate i n situaii n care se pot utiliza teste parametrice
dei se bazeaz pe calcule elementare, adesea acestea pot fi destul de complexe i de laborioase
-
1) Testul Mann-Whitney (U) pentru diferena rangurilor a dou eantioane independente
2) Testul Kruskal-Wallis pentru diferena rangurilor a mai mult de dou eantioane independente
3) Testul Wilcoxon pentru diferena rangurilor a dou eantioane perechi
4) Testul Friedman pentru diferena rangurilor n cazul mai mult de 2 msurri (repeatedmeasures)
5) Coeficientul de corelaie pentru date ordinale (Spearman, Kendall)
Teste ordinale
-
Testul Mann-Whitney (U) pentru
dou eantioane independente
Exemplu: Un psiholog care lucreaz ntr-o mare banc dorete s vad dac exist o diferen ntre premiile bneti anuale primite de femeile i brbaii angajai ai bncii
2 eantioane
independenteMann-Whitney U
t
independent
Test parametric
parametric
?
-
2 3
1 9
2 17
2 26
2 32
1 34
1 35
2 36
1 43
2 43
2 44
2 47
2 51
1 56
2 59
1 61
1 62
1 64
1 67
1 67
1 70
1 75
1 80
1 87
1 88
1 110
1 200
-
MasculinPremiu
(mii lei)Feminin
Premiu
(mii lei)
1 9 2 3
1 34 2 17
1 35 2 26
1 43 2 32
1 56 2 36
1 61 2 43
1 62 2 44
1 64 2 47
1 67 2 51
1 67 2 59
1 70 nB=10
1 75
1 80
1 87
1 88
1 110
1 200
nA=17
-
Variabil independent ? Variabil dependent ?
Problema este una tipic pentru a fi rezolvat cu testul... ?
Dar...
-
Descriptives
58,0000 7,25659
43,0839
72,9161
54,3765
56,0000
1421,769
37,70636
3,00
200,00
197,00
35,00
2,033 ,448
7,073 ,872
Mean
Lower Bound
Upper Bound
95% Confidence
Interval for Mean
5% Trimmed Mean
Median
Variance
Std. Deviation
Minimum
Maximum
Range
Interquartile Range
Skewness
Kurtosis
premiu
Statis tic Std. Error
-
MasculinPremiu
(mil. lei)
Rang
PrimFeminin
Premiu
(mil. lei)
Rang
prim
1 9 26 2 3 27
1 34 22 2 17 25
1 35 21 2 26 24
1 43 18,5 2 32 23
1 56 14 2 36 20
1 61 12 2 43 18,5
1 62 11 2 44 17
1 64 10 2 47 16
1 67 8,5 2 51 15
1 67 8,5 2 59 13
1 70 7 nB=10 RB=198,5
1 75 6
1 80 5
1 87 4
1 88 3
1 110 2
1 200 1
nA=17 RA=179,5
-
Valori (a)
Medie
(b)
Rang mic
(b)
Rang
mare
(c)
Secvenial
10 1 1 1 1
15 3 2 4 2
15 3 2 4 2
15 3 2 4 216 5 5 5 3
20 6 6 6 4
modul de obinere a rangurilor ex-aequo
-
MasculinPremiu
(mil. lei)
Rang
PrimFeminin
Premiu
(mil. lei)
Rang
prim
1 9 26 2 3 27
1 34 22 2 17 25
1 35 21 2 26 24
1 43 18,5 2 32 23
1 56 14 2 36 20
1 61 12 2 43 18,5
1 62 11 2 44 17
1 64 10 2 47 16
1 67 8,5 2 51 15
1 67 8,5 2 59 13
1 70 7 nB=10 RB=198,5
1 75 6
1 80 5
1 87 4
1 88 3
1 110 2
1 200 1
nA=17 RA=179,5
A
AABAA R
nnnnU
2
1**
B
BBBAB R
nnnnU
2
1**
-
A
AABAA R
nnnnU
2
1**
B
BBBAB R
nnnnU
2
1**
Decizia statistic:
Se citete valoarea critic pentru U0.05;17:10
Se accept H0 dac valoarea U calculat este mai maredect valoarea critic tabelar.
Se respinge H0 dac valoarea U calculat este mai mic sau egal cu valoarea critic tabelar.
Valoarea testului
5,1435,1791531705,1792
18171017
AU
5,265,198551705,1982
11101017
BU
-
nA/nB 5 6 8 10 12 14 16 18 20
30.05 0 1 2 3 4 5 6 7 8
0.01 - - - 0 1 1 2 2 3
40.05 1 2 4 5 7 9 11 12 14
0.01 - 0 1 2 3 4 5 6 8
50.05 2 3 6 8 11 13 15 18 20
0.01 0 1 2 4 6 7 9 11 13
60.05 3 5 8 11 14 17 21 24 27
0.01 1 2 4 6 9 11 13 16 18
80.05 6 8 13 17 22 26 31 36 41
0.01 2 4 7 11 15 18 22 26 30
100.05 8 11 17 23 29 36 42 48 55
0.01 4 6 11 16 21 26 31 37 42
120.05 11 14 22 29 37 45 53 61 69
0.01 6 9 15 21 27 34 41 47 54
140.05 13 17 26 36 45 55 64 74 83
0.01 7 11 18 26 34 42 50 58 67
160.05 15 21 31 42 53 64 75 86 98
0.01 9 13 22 31 41 50 60 70 79
180.05 18 24 36 48 61 74 86 99 112
0.01 11 16 26 37 47 58 70 81 92
200.05 20 27 41 55 69 83 98 112 127
0.01 13 18 30 42 54 67 79 92 105
-
Decizia statistic:
UB (26.5) mai mic dect U0.05;17:10=48
Se respinge ipoteza de nul
Concluzia cercetrii:
Premiile acordate brbailor sunt statistic semnificativ mai mari dect cele acordate
femeilor (n respectiva instituie)
Este acest rezultat o dovad de discriminare?
-
Pentru grupuri suficient de mari(n1 i n2 20sau chiar 10)
Se calculeaz o valoare z, cu formula...
12/1**
1**5.0
Nnn
NnRz
BA
AA
Semnificaia se citete n tabelul curbei normale, pentru:
un prag alfa ales
unilateral sau bilateral
Mrimea efectului:N
zr
-
alt variant de calcul:
U
z Ce calculeaz z:
Unde:2
* 21 nn
12
)1(** 2121 nnnn
-
Publicarea rezultatului
La publicarea rezultatului pentru testul Mann-Whitney U se vor indica:
volumul grupurilor comparate (nA i nB)
valoarea testului (U)
pragul de semnificaie (p)
mrimea efectului
-
Testul Kruskal-Wallis
pentru mai mult de dou eantioane independente
S presupunem c avem trei categorii de subieci (piloi, controlori de trafic i navigatori de bord) crora le-a fost aplicat un test de reprezentare spaial Variabila independent?
Variabila dependent?
3+ eantioane
independenteKruskall-Wallis ANOVA?
Test parametric
parametric
-
Grup
prof.
Reprez.
spaialrang
1 23 2
1 16 6
1 15 7
1 10 11
1 9 12
1 21 3
2 18 5
2 14 8
2 11 10
3 25 1
3 19 4
3 13 9
3 7 13
1*3*
1*
12
1
2
Nn
T
NNH
k
i i
i
unde:
H este valoarea testului K-W N este volumul total al eantionului n este volumul grupurilor (N=n1+n2+n3+...+nk)
K este numrul grupurilor independente
T este suma rangurilor care va fi calculat pentru fiecare grup
0,112142638,74*06593.014*34
27
3
23
6
41*
14*13
12 222
H
-
Decizia statistic:
Valorile H urmeaz distribuia chi-ptrat cu k-1 grade de libertate
distribuia chi-ptrat va fi prezentat complet la testele nominale
multinomiale
df\aria .100 .050 .025 .010 .005
1 2.70554 3.84146 5.02389 6.63490 7.87944
2 4.60517 5.99146 7.37776 9.21034 10.59663
3 6.25139 7.81473 9.34840 11.34487 12.83816
4 7.77944 9.48773 11.14329 13.27670 14.86026
5 9.23636 11.07050 12.83250 15.08627 16.74960
6 10.64464 12.59159 14.44938 16.81189 18.54758
7 12.01704 14.06714 16.01276 18.47531 20.27774
8 13.36157 15.50731 17.53455 20.09024 21.95495
9 14.68366 16.91898 19.02277 21.66599 23.58935
10 15.98718 18.30704 20.48318 23.20925 25.18818
11 17.27501 19.67514 21.92005 24.72497 26.75685
... ... ... ... ... ...
-
H critic pentru alfa=0.05 i 2 grade de libertate este 5.99
H calculat=0.11
Decizia statistic?
Decizia cercetrii?
Concluzia cercetrii?
Mrimea efectului: 1
2
N
H
Decizia statistic:
-
Testul Wilcoxon
pentru dou eantioane perechi Condiii:
Aceiai subieci evaluai de dou ori, pe o scal ordinal
Aceiai subieci evaluai de dou ori, pe o scal de interval
variabilele nu ntrunesc condiiile pentru utilizarea testului t al diferenelor pentru eantioane dependente.
dei se aplic pe scale de interval/raport, utilizeaz proceduri de tip neparametric, apelnd la diferenele dintre valorile perechi i la ordonarea lor. Este, din acest punct de vedere, un test de date
ordinale.
Test parametric
parametric
2 eantioane
dependenteWilcoxon
t
dependent?
-
exemplu
Un psiholog dorete s evalueze efectul stimulilor subliminali asupra conduitelor agresive
Frecvena conduitelor agresive este msurat nainte i dup vizionarea unui film n care au fost plasai stimuli subliminali agresivi
Rezultatele sunt sintetizate n tabelul urmtor...
-
Cod
Subiectnainte Dup dup-nainte
Modulul
diferenei
Rangul
diferenei
Semnul
Diferenei
1 9 8 -1 1 7.5 -
2 14 17 3 3 5.5 +
3 10 17 7 7 2.0 +
4 11 12 1 1 7.5 +
5 12 15 3 3 5.5 +
6 9 13 4 4 3.5 +
7 10 14 4 4 3.5 +
8 14 2 -12 12 1.0 -
Se calculeaz: T(-) suma rangurilor diferenelor negative: T(-)=8.5 T(+) suma rangurilor diferenelor pozitive: T(+)=28.5 Valoarea cea mai mic dintre ele este rezultatul testului Wilcoxon Nivelul de semnificaie se afl prin compararea cu valorile critice dintr-o tabel special
Dac T calculat este mai mare dect T critic, se admite H0 Dac T calculat este mai mic dect T critic, se respinge H0
-
NNivel de semnificaie pentru test unilateral
0.025 0.01 0.005
Nivel de semnificaie pentru test bilateral
0.05 0.02 0.01
6 0 - -
7 2 0 -
8 4 2 0
9 6 3 2
10 8 5 3
... ... ... ...
-
Decizia statistic:
Valoarea calculat (8.5) este mai mare dect valoarea critic (4) pentru N=8 i alfa=0.5 bilateral.
Decizia statistic?
Decizia cercetrii?
Concluzia cercetrii?
-
Probleme...
Enunarea concluziei i interpretarea rezultatului vor ine cont de modul de atribuire a rangurilor
Diferene egale cu zero ntre rangurile perechi (valori de rang egal). Soluii
a) se elimin cazurile care dau diferene egale cu zero i, implicit, reducerea volumului eantionului cu aceste cazuri, sau...
b) atribuirea arbitrar a semnului + la jumtate dintre ele i semnul la cealalt jumtate.
c) dac exist un numr impar de diferene egale cu zero se va elimina una dintre ele (reducnd N cu 1), dup care se aplic regula b
-
Pentru eantioane mai mari de 20
distribuia de nul a testului Wilcoxon poate fi aproximat prin distribuia normal
formula de calcul n acest caz este urmtoarea:
Mrimea efectului:
24/12*1*
4/1*
nnn
nnTZ
N
zr
-
Testul Friedman
pentru msurri repetate(mai mult de dou eantioane perechi)
Exemplu: un psiholog dorete s studieze relaia dintre stilurile de conducere (laissez-faire, democratic i autoritar) asupra nivelului de satisfacie profesional
Variabila independent?
Variabila dependent? Test parametric parametric
3+ eantioane
dependenteFriedman
ANOVA pt.
msurri repetate
-
Democratic Laissez-faire Autocratic
1 1 2 3
2 2 1 3
3 1 2 3
4 1 2 3
5 1 2 3
6 2 1 3
N=6 T1=8 T2=10 T3=18
c
i
ir cNTccN
F1
21**3*
1**
12
unde:
c - numrul msurrilor repetateN - volumul seturilor de evaluri
perechi
Ti - suma rangurilor
corespunztoare fiecrui moment de msurare
3.972-488*0,16664*6*318108*4*3*6
12 222 rF
Distribuia de nul a testului Friedman urmeaz forma distribuiei chi-ptrat pentru df=c-1.
Valoarea critic tabelar (chi-ptrat) pentru df=3-1=2, este 5.99 Fr calculat > Fr critic
Decizia statistic? Decizia cercetrii? Concluzia cercetrii?
-
Mrimea efectului
SPSS: coeficientul de concordan Kendalls W, care indic intensitatea relaiei
ia valori ntre
0 (asociere minim)
1(asociere maxim)
-
Testul Friedman poate fi aplicat i n cazul a doar dou msurri, situaie n care devine similar testului semnului (nominal)
La fel ca i celelalte teste pentru date ordinale, el este afectat de existena rangurilor atribuite ex-aequo, pentru valori
identice.
n astfel de cazuri este recomandabil aplicarea unei corecii n formula de calcul (aplicat de programele automate de calcul)
-
Coeficientul de corelaie pentru date ordinale (Spearman) - rS
Testele Wilcoxon i Friedman sunt utilizate pentru a pune n eviden diferenele dintre dou sau mai multe eantioane perechi.
Atunci cnd avem dou variabile ordinale i suntem interesai n evaluarea gradului de asociere ntre ele, se utilizeaz un test de corelaie a rangurilor (Spearman).
Modalitatea de calcul a coeficientului de corelaie Spearman se bazeaz pe poziia relativ a unei valori fa de celelalte.
rS variaz ntre -1/+1 i se interpreteaz n acelai mod ca i r (Pearson)
Test parametric
parametric
2 eantioane
dependente
Corelaia rangurilor
Spearman (Kendall)
r
Pearson
-
exemplu
ntr-un studiu cu privire la ameliorarea sistemului de evaluare a personalului, doi instructori urmeaz un program special de armonizare a evalurii.
La sfritul programului ei sunt pui s ierarhizeze personalul unui compartiment de munc (N=10) din punctul de vedere al performanei profesionale
Ipoteza cercetrii: (pentru test bilateral) Evalurile celor doi instructori vor fi concordante.
Ipoteza de nul: ntre evalurile celor doi instructori nu exist nici o legtur
-
Criterii de decizie
alfa=0.05
bilateral
rS critic se citete ntr-un tabel special pentru coeficientul Spearman (fr grade de libertate)
-
Ntest unilateral
alfa=0.05 alfa=0.025 alfa=0.01 Alfa=0.005
test bilateral
alfa=0.10 alfa=0.05 alfa=0.02 alfa=0.01
5 0,900 - - -
6 0,829 0,886 0,943 -
7 0,714 0,786 0,893 -
8 0,643 0,738 0,833 0,881
9 0,600 0,683 0,783 0,833
10 0,564 0,648 0,745 0,794
11 0,523 0,623 0,736 0,818
12 0,497 0,591 0,703 0,780
13 0,475 0,566 0,673 0,745
... ... ... ... ...
-
AngajaiRANG
Instructor I
RANG
Instructor II
Diferena (D)
(R1-R2)D2
A 3 2 1 1
B 1 3 -2 4
C 7 5 2 4
D 6 4 2 4
E 10 10 0 0
F 5 8 -3 9
G 9 7 2 4
H 8 9 -1 1
I 4 6 -2 4
J 2 1 1 1
D2=32
)1(*
*61
2
2
NN
DrS
81.019.01990
1921
)1100(*10
32*61
Sr
rS calculat (0.81) > rS critic (0.684) Decizia statistic ? Decizia cercetrii? Concluzia cercetrii ?
-
rS= 0 Cele dou variabile nu variaz concomitent, deloc
0 > rS > 1Cele dou variabile tind s creasc sau s scad concomitent,
ntr-o anumit msur
rS = 1.0 Corelaie pozitiv perfect
-1 > rS > 0n timp ce o variabil tinde s creasc, cealalt tinde s
descreasc
rS = -1.0 Corelaie negativ perfect
Interpretare...
Calcularea coeficientului de determinare (rS2) nu este recomandabil,
dei exist autori care o accept.
-
Cnd se utilizeaz coeficientul de corelaie Spearman:
ambele variabile sunt de tip ordinal
una dintre variabile este de tip ordinal i cealalt este de tip interval/raport. variabila interval/raport se transform mai nti n
valori de ordine de rang
ambele variabile sunt de tip interval/raport dar una sau ambele, prezint valori extreme. prin transformarea n ordine de rang a celor dou
distribuii, valorile extreme sunt anihilate, ele urmnd s participe la corelaie prin simpla poziie n distribuie i nu prin nivelul lor absolut.
-
Testul Kendall tau
Un test alternativ pentru asocierea variabilelor ordinale
La fel ca i rS, Kendal tau ia valori ntre -1 i +1 i se interpreteaz similar
Statisticienii se afl n disput cu privire la cei doi coeficieni
Programele statistice le calculeaz pe amndou
Foarte rar se ntmpl s conduc la decizii diferite unul de altul...
-
Sinteza testelor neparametrice ordinale
2 eantioane
independente
3+ eantioane
independente
Mann-Whitney U
Kruskall-Wallis
2 eantioane
dependente
Corelaia rangurilor
Spearman (Kendall)
2 eantioane
dependenteWilcoxon
3+ eantioane
dependenteFriedman
Diferena
Asocierea
t
independent
ANOVA
t
dependent
ANOVA
msurri repetate
r
Pearson
Echivalent
parametric
-
ntrebri pregtitoare pentru evaluarea parial nr. 3 (14-16 ian.)
Care este coeficientul de determinare dac r=0.80?
n cazul testului t pentru eantioane dependente, pe ce scar se exprim valorile variabilei independente?
Care este numele celui care a introdus testul de corelaie pentru date parametrice?
Care este valoarea lui r pentru o corelaie perfect?
Care dintre urmtorii coeficieni de corelaie este semnificativ: r=-0.70 (r critic=0.66) sau r=+0.70 (r critic=0.75)?
n ce caz poat eexista o corelaie ntre dou variabile, chiar dac valoarea lui r este mic (sau chiar zero)?
Ce este distribuia binomial?
Care este probabilitatea lui P pentru un eveniment dihotomic aleator (DA/NU)?
Care este echivalentul parametric al testului z pentru proporii?
n cazul testului chi-ptrat, ce este frecvena ateptat?
Pentru ce se utilizeaz testul chi-ptrat goodness-of-fit?
Care sunt caracteristicile distribuiei chi-ptrat?