st1 14 teste ordinale

52
TESTE STATISTICE PENTRU DATE ORDINALE

Upload: anna-ana

Post on 03-Oct-2015

225 views

Category:

Documents


2 download

DESCRIPTION

Statistica teste ordinale

TRANSCRIPT

  • TESTE STATISTICE

    PENTRU DATE ORDINALE

  • CONDIII FUNDAMENTALEpentru testele parametrice

    VD msurat pe scal cantitativ (I/R)

    Msurare fr erori (?!)

    erorile de msurare afecteaz valoarea testului i, implicit, decizia statistic

    exemplu: coeficientul r este afectat de fidelitatea msurrii

    Distribuia datelor respect modelul teoretic de referin

    normalitatea !! (simetrie, absena valorilor extreme)

    volumul eantionului (N=30 nu mai mic de 20!)

    omogenitatea (egalitatea) varianei distribuiilor grupurilor comparate

  • Miza respectrii condiiilor:

    Meninerea nivelului acceptat pentru erorile statistice

    exces de eroare de tip I

    acceptare greit a H1

    exces de eroare de tip II

    neacceptare greit a H1

  • Soluii

    Verificarea atent a condiiilor

    statistici descriptive

    Numerice

    Grafice

    teste statistice specializate (SPSS)

    Teste de normalitate

    Teste de omogenitate a varianei

    Normalizarea datelor ( ?!)

    Utilizarea testelor NON-PARAMETRICE

  • Cnd se utilizeaz teste neparametrice?

    VD este msurat pe scal calitativ (nominal, ordinal)

    VD este msurat pe scal cantitativ, dar...

    nu respect condiiile pentru test parametric (normalitate, omogenitatea mprtierii)

    transformare calitativ (grupare de frecvene, ordonare dup rang)

    volum foarte mic al eantionului (30 20)

  • avantaje ale testelor neparametrice

    nu presupun condiii la fel de restictive (normalitatea distribuiei, omogenitatea varianei, etc.) ceea ce reduce mult situaiile n care nu sunt aplicabile;

    calcule sunt relativ simple i uor de efectuat manual

    concepte i metode mai uor de neles;

    se pot utiliza pe scale ale cror caliti de msurare sunt slabe (ordinale, nominale);

    pot fi utilizate n cazul variabilelor afectate de valori extreme care nu pot fi eliminate.

  • dezavantaje ale testelor

    neparametrice

    se bazeaz pe msurri ordinale sau nominale

    mai puin precise dect cele cantitative

    au o putere mai redus dect testele parametrice;

    tind sa fie utilizate i n situaii n care se pot utiliza teste parametrice

    dei se bazeaz pe calcule elementare, adesea acestea pot fi destul de complexe i de laborioase

  • 1) Testul Mann-Whitney (U) pentru diferena rangurilor a dou eantioane independente

    2) Testul Kruskal-Wallis pentru diferena rangurilor a mai mult de dou eantioane independente

    3) Testul Wilcoxon pentru diferena rangurilor a dou eantioane perechi

    4) Testul Friedman pentru diferena rangurilor n cazul mai mult de 2 msurri (repeatedmeasures)

    5) Coeficientul de corelaie pentru date ordinale (Spearman, Kendall)

    Teste ordinale

  • Testul Mann-Whitney (U) pentru

    dou eantioane independente

    Exemplu: Un psiholog care lucreaz ntr-o mare banc dorete s vad dac exist o diferen ntre premiile bneti anuale primite de femeile i brbaii angajai ai bncii

    2 eantioane

    independenteMann-Whitney U

    t

    independent

    Test parametric

    parametric

    ?

  • 2 3

    1 9

    2 17

    2 26

    2 32

    1 34

    1 35

    2 36

    1 43

    2 43

    2 44

    2 47

    2 51

    1 56

    2 59

    1 61

    1 62

    1 64

    1 67

    1 67

    1 70

    1 75

    1 80

    1 87

    1 88

    1 110

    1 200

  • MasculinPremiu

    (mii lei)Feminin

    Premiu

    (mii lei)

    1 9 2 3

    1 34 2 17

    1 35 2 26

    1 43 2 32

    1 56 2 36

    1 61 2 43

    1 62 2 44

    1 64 2 47

    1 67 2 51

    1 67 2 59

    1 70 nB=10

    1 75

    1 80

    1 87

    1 88

    1 110

    1 200

    nA=17

  • Variabil independent ? Variabil dependent ?

    Problema este una tipic pentru a fi rezolvat cu testul... ?

    Dar...

  • Descriptives

    58,0000 7,25659

    43,0839

    72,9161

    54,3765

    56,0000

    1421,769

    37,70636

    3,00

    200,00

    197,00

    35,00

    2,033 ,448

    7,073 ,872

    Mean

    Lower Bound

    Upper Bound

    95% Confidence

    Interval for Mean

    5% Trimmed Mean

    Median

    Variance

    Std. Deviation

    Minimum

    Maximum

    Range

    Interquartile Range

    Skewness

    Kurtosis

    premiu

    Statis tic Std. Error

  • MasculinPremiu

    (mil. lei)

    Rang

    PrimFeminin

    Premiu

    (mil. lei)

    Rang

    prim

    1 9 26 2 3 27

    1 34 22 2 17 25

    1 35 21 2 26 24

    1 43 18,5 2 32 23

    1 56 14 2 36 20

    1 61 12 2 43 18,5

    1 62 11 2 44 17

    1 64 10 2 47 16

    1 67 8,5 2 51 15

    1 67 8,5 2 59 13

    1 70 7 nB=10 RB=198,5

    1 75 6

    1 80 5

    1 87 4

    1 88 3

    1 110 2

    1 200 1

    nA=17 RA=179,5

  • Valori (a)

    Medie

    (b)

    Rang mic

    (b)

    Rang

    mare

    (c)

    Secvenial

    10 1 1 1 1

    15 3 2 4 2

    15 3 2 4 2

    15 3 2 4 216 5 5 5 3

    20 6 6 6 4

    modul de obinere a rangurilor ex-aequo

  • MasculinPremiu

    (mil. lei)

    Rang

    PrimFeminin

    Premiu

    (mil. lei)

    Rang

    prim

    1 9 26 2 3 27

    1 34 22 2 17 25

    1 35 21 2 26 24

    1 43 18,5 2 32 23

    1 56 14 2 36 20

    1 61 12 2 43 18,5

    1 62 11 2 44 17

    1 64 10 2 47 16

    1 67 8,5 2 51 15

    1 67 8,5 2 59 13

    1 70 7 nB=10 RB=198,5

    1 75 6

    1 80 5

    1 87 4

    1 88 3

    1 110 2

    1 200 1

    nA=17 RA=179,5

    A

    AABAA R

    nnnnU

    2

    1**

    B

    BBBAB R

    nnnnU

    2

    1**

  • A

    AABAA R

    nnnnU

    2

    1**

    B

    BBBAB R

    nnnnU

    2

    1**

    Decizia statistic:

    Se citete valoarea critic pentru U0.05;17:10

    Se accept H0 dac valoarea U calculat este mai maredect valoarea critic tabelar.

    Se respinge H0 dac valoarea U calculat este mai mic sau egal cu valoarea critic tabelar.

    Valoarea testului

    5,1435,1791531705,1792

    18171017

    AU

    5,265,198551705,1982

    11101017

    BU

  • nA/nB 5 6 8 10 12 14 16 18 20

    30.05 0 1 2 3 4 5 6 7 8

    0.01 - - - 0 1 1 2 2 3

    40.05 1 2 4 5 7 9 11 12 14

    0.01 - 0 1 2 3 4 5 6 8

    50.05 2 3 6 8 11 13 15 18 20

    0.01 0 1 2 4 6 7 9 11 13

    60.05 3 5 8 11 14 17 21 24 27

    0.01 1 2 4 6 9 11 13 16 18

    80.05 6 8 13 17 22 26 31 36 41

    0.01 2 4 7 11 15 18 22 26 30

    100.05 8 11 17 23 29 36 42 48 55

    0.01 4 6 11 16 21 26 31 37 42

    120.05 11 14 22 29 37 45 53 61 69

    0.01 6 9 15 21 27 34 41 47 54

    140.05 13 17 26 36 45 55 64 74 83

    0.01 7 11 18 26 34 42 50 58 67

    160.05 15 21 31 42 53 64 75 86 98

    0.01 9 13 22 31 41 50 60 70 79

    180.05 18 24 36 48 61 74 86 99 112

    0.01 11 16 26 37 47 58 70 81 92

    200.05 20 27 41 55 69 83 98 112 127

    0.01 13 18 30 42 54 67 79 92 105

  • Decizia statistic:

    UB (26.5) mai mic dect U0.05;17:10=48

    Se respinge ipoteza de nul

    Concluzia cercetrii:

    Premiile acordate brbailor sunt statistic semnificativ mai mari dect cele acordate

    femeilor (n respectiva instituie)

    Este acest rezultat o dovad de discriminare?

  • Pentru grupuri suficient de mari(n1 i n2 20sau chiar 10)

    Se calculeaz o valoare z, cu formula...

    12/1**

    1**5.0

    Nnn

    NnRz

    BA

    AA

    Semnificaia se citete n tabelul curbei normale, pentru:

    un prag alfa ales

    unilateral sau bilateral

    Mrimea efectului:N

    zr

  • alt variant de calcul:

    U

    z Ce calculeaz z:

    Unde:2

    * 21 nn

    12

    )1(** 2121 nnnn

  • Publicarea rezultatului

    La publicarea rezultatului pentru testul Mann-Whitney U se vor indica:

    volumul grupurilor comparate (nA i nB)

    valoarea testului (U)

    pragul de semnificaie (p)

    mrimea efectului

  • Testul Kruskal-Wallis

    pentru mai mult de dou eantioane independente

    S presupunem c avem trei categorii de subieci (piloi, controlori de trafic i navigatori de bord) crora le-a fost aplicat un test de reprezentare spaial Variabila independent?

    Variabila dependent?

    3+ eantioane

    independenteKruskall-Wallis ANOVA?

    Test parametric

    parametric

  • Grup

    prof.

    Reprez.

    spaialrang

    1 23 2

    1 16 6

    1 15 7

    1 10 11

    1 9 12

    1 21 3

    2 18 5

    2 14 8

    2 11 10

    3 25 1

    3 19 4

    3 13 9

    3 7 13

    1*3*

    1*

    12

    1

    2

    Nn

    T

    NNH

    k

    i i

    i

    unde:

    H este valoarea testului K-W N este volumul total al eantionului n este volumul grupurilor (N=n1+n2+n3+...+nk)

    K este numrul grupurilor independente

    T este suma rangurilor care va fi calculat pentru fiecare grup

    0,112142638,74*06593.014*34

    27

    3

    23

    6

    41*

    14*13

    12 222

    H

  • Decizia statistic:

    Valorile H urmeaz distribuia chi-ptrat cu k-1 grade de libertate

    distribuia chi-ptrat va fi prezentat complet la testele nominale

    multinomiale

    df\aria .100 .050 .025 .010 .005

    1 2.70554 3.84146 5.02389 6.63490 7.87944

    2 4.60517 5.99146 7.37776 9.21034 10.59663

    3 6.25139 7.81473 9.34840 11.34487 12.83816

    4 7.77944 9.48773 11.14329 13.27670 14.86026

    5 9.23636 11.07050 12.83250 15.08627 16.74960

    6 10.64464 12.59159 14.44938 16.81189 18.54758

    7 12.01704 14.06714 16.01276 18.47531 20.27774

    8 13.36157 15.50731 17.53455 20.09024 21.95495

    9 14.68366 16.91898 19.02277 21.66599 23.58935

    10 15.98718 18.30704 20.48318 23.20925 25.18818

    11 17.27501 19.67514 21.92005 24.72497 26.75685

    ... ... ... ... ... ...

  • H critic pentru alfa=0.05 i 2 grade de libertate este 5.99

    H calculat=0.11

    Decizia statistic?

    Decizia cercetrii?

    Concluzia cercetrii?

    Mrimea efectului: 1

    2

    N

    H

    Decizia statistic:

  • Testul Wilcoxon

    pentru dou eantioane perechi Condiii:

    Aceiai subieci evaluai de dou ori, pe o scal ordinal

    Aceiai subieci evaluai de dou ori, pe o scal de interval

    variabilele nu ntrunesc condiiile pentru utilizarea testului t al diferenelor pentru eantioane dependente.

    dei se aplic pe scale de interval/raport, utilizeaz proceduri de tip neparametric, apelnd la diferenele dintre valorile perechi i la ordonarea lor. Este, din acest punct de vedere, un test de date

    ordinale.

    Test parametric

    parametric

    2 eantioane

    dependenteWilcoxon

    t

    dependent?

  • exemplu

    Un psiholog dorete s evalueze efectul stimulilor subliminali asupra conduitelor agresive

    Frecvena conduitelor agresive este msurat nainte i dup vizionarea unui film n care au fost plasai stimuli subliminali agresivi

    Rezultatele sunt sintetizate n tabelul urmtor...

  • Cod

    Subiectnainte Dup dup-nainte

    Modulul

    diferenei

    Rangul

    diferenei

    Semnul

    Diferenei

    1 9 8 -1 1 7.5 -

    2 14 17 3 3 5.5 +

    3 10 17 7 7 2.0 +

    4 11 12 1 1 7.5 +

    5 12 15 3 3 5.5 +

    6 9 13 4 4 3.5 +

    7 10 14 4 4 3.5 +

    8 14 2 -12 12 1.0 -

    Se calculeaz: T(-) suma rangurilor diferenelor negative: T(-)=8.5 T(+) suma rangurilor diferenelor pozitive: T(+)=28.5 Valoarea cea mai mic dintre ele este rezultatul testului Wilcoxon Nivelul de semnificaie se afl prin compararea cu valorile critice dintr-o tabel special

    Dac T calculat este mai mare dect T critic, se admite H0 Dac T calculat este mai mic dect T critic, se respinge H0

  • NNivel de semnificaie pentru test unilateral

    0.025 0.01 0.005

    Nivel de semnificaie pentru test bilateral

    0.05 0.02 0.01

    6 0 - -

    7 2 0 -

    8 4 2 0

    9 6 3 2

    10 8 5 3

    ... ... ... ...

  • Decizia statistic:

    Valoarea calculat (8.5) este mai mare dect valoarea critic (4) pentru N=8 i alfa=0.5 bilateral.

    Decizia statistic?

    Decizia cercetrii?

    Concluzia cercetrii?

  • Probleme...

    Enunarea concluziei i interpretarea rezultatului vor ine cont de modul de atribuire a rangurilor

    Diferene egale cu zero ntre rangurile perechi (valori de rang egal). Soluii

    a) se elimin cazurile care dau diferene egale cu zero i, implicit, reducerea volumului eantionului cu aceste cazuri, sau...

    b) atribuirea arbitrar a semnului + la jumtate dintre ele i semnul la cealalt jumtate.

    c) dac exist un numr impar de diferene egale cu zero se va elimina una dintre ele (reducnd N cu 1), dup care se aplic regula b

  • Pentru eantioane mai mari de 20

    distribuia de nul a testului Wilcoxon poate fi aproximat prin distribuia normal

    formula de calcul n acest caz este urmtoarea:

    Mrimea efectului:

    24/12*1*

    4/1*

    nnn

    nnTZ

    N

    zr

  • Testul Friedman

    pentru msurri repetate(mai mult de dou eantioane perechi)

    Exemplu: un psiholog dorete s studieze relaia dintre stilurile de conducere (laissez-faire, democratic i autoritar) asupra nivelului de satisfacie profesional

    Variabila independent?

    Variabila dependent? Test parametric parametric

    3+ eantioane

    dependenteFriedman

    ANOVA pt.

    msurri repetate

  • Democratic Laissez-faire Autocratic

    1 1 2 3

    2 2 1 3

    3 1 2 3

    4 1 2 3

    5 1 2 3

    6 2 1 3

    N=6 T1=8 T2=10 T3=18

    c

    i

    ir cNTccN

    F1

    21**3*

    1**

    12

    unde:

    c - numrul msurrilor repetateN - volumul seturilor de evaluri

    perechi

    Ti - suma rangurilor

    corespunztoare fiecrui moment de msurare

    3.972-488*0,16664*6*318108*4*3*6

    12 222 rF

    Distribuia de nul a testului Friedman urmeaz forma distribuiei chi-ptrat pentru df=c-1.

    Valoarea critic tabelar (chi-ptrat) pentru df=3-1=2, este 5.99 Fr calculat > Fr critic

    Decizia statistic? Decizia cercetrii? Concluzia cercetrii?

  • Mrimea efectului

    SPSS: coeficientul de concordan Kendalls W, care indic intensitatea relaiei

    ia valori ntre

    0 (asociere minim)

    1(asociere maxim)

  • Testul Friedman poate fi aplicat i n cazul a doar dou msurri, situaie n care devine similar testului semnului (nominal)

    La fel ca i celelalte teste pentru date ordinale, el este afectat de existena rangurilor atribuite ex-aequo, pentru valori

    identice.

    n astfel de cazuri este recomandabil aplicarea unei corecii n formula de calcul (aplicat de programele automate de calcul)

  • Coeficientul de corelaie pentru date ordinale (Spearman) - rS

    Testele Wilcoxon i Friedman sunt utilizate pentru a pune n eviden diferenele dintre dou sau mai multe eantioane perechi.

    Atunci cnd avem dou variabile ordinale i suntem interesai n evaluarea gradului de asociere ntre ele, se utilizeaz un test de corelaie a rangurilor (Spearman).

    Modalitatea de calcul a coeficientului de corelaie Spearman se bazeaz pe poziia relativ a unei valori fa de celelalte.

    rS variaz ntre -1/+1 i se interpreteaz n acelai mod ca i r (Pearson)

    Test parametric

    parametric

    2 eantioane

    dependente

    Corelaia rangurilor

    Spearman (Kendall)

    r

    Pearson

  • exemplu

    ntr-un studiu cu privire la ameliorarea sistemului de evaluare a personalului, doi instructori urmeaz un program special de armonizare a evalurii.

    La sfritul programului ei sunt pui s ierarhizeze personalul unui compartiment de munc (N=10) din punctul de vedere al performanei profesionale

    Ipoteza cercetrii: (pentru test bilateral) Evalurile celor doi instructori vor fi concordante.

    Ipoteza de nul: ntre evalurile celor doi instructori nu exist nici o legtur

  • Criterii de decizie

    alfa=0.05

    bilateral

    rS critic se citete ntr-un tabel special pentru coeficientul Spearman (fr grade de libertate)

  • Ntest unilateral

    alfa=0.05 alfa=0.025 alfa=0.01 Alfa=0.005

    test bilateral

    alfa=0.10 alfa=0.05 alfa=0.02 alfa=0.01

    5 0,900 - - -

    6 0,829 0,886 0,943 -

    7 0,714 0,786 0,893 -

    8 0,643 0,738 0,833 0,881

    9 0,600 0,683 0,783 0,833

    10 0,564 0,648 0,745 0,794

    11 0,523 0,623 0,736 0,818

    12 0,497 0,591 0,703 0,780

    13 0,475 0,566 0,673 0,745

    ... ... ... ... ...

  • AngajaiRANG

    Instructor I

    RANG

    Instructor II

    Diferena (D)

    (R1-R2)D2

    A 3 2 1 1

    B 1 3 -2 4

    C 7 5 2 4

    D 6 4 2 4

    E 10 10 0 0

    F 5 8 -3 9

    G 9 7 2 4

    H 8 9 -1 1

    I 4 6 -2 4

    J 2 1 1 1

    D2=32

    )1(*

    *61

    2

    2

    NN

    DrS

    81.019.01990

    1921

    )1100(*10

    32*61

    Sr

    rS calculat (0.81) > rS critic (0.684) Decizia statistic ? Decizia cercetrii? Concluzia cercetrii ?

  • rS= 0 Cele dou variabile nu variaz concomitent, deloc

    0 > rS > 1Cele dou variabile tind s creasc sau s scad concomitent,

    ntr-o anumit msur

    rS = 1.0 Corelaie pozitiv perfect

    -1 > rS > 0n timp ce o variabil tinde s creasc, cealalt tinde s

    descreasc

    rS = -1.0 Corelaie negativ perfect

    Interpretare...

    Calcularea coeficientului de determinare (rS2) nu este recomandabil,

    dei exist autori care o accept.

  • Cnd se utilizeaz coeficientul de corelaie Spearman:

    ambele variabile sunt de tip ordinal

    una dintre variabile este de tip ordinal i cealalt este de tip interval/raport. variabila interval/raport se transform mai nti n

    valori de ordine de rang

    ambele variabile sunt de tip interval/raport dar una sau ambele, prezint valori extreme. prin transformarea n ordine de rang a celor dou

    distribuii, valorile extreme sunt anihilate, ele urmnd s participe la corelaie prin simpla poziie n distribuie i nu prin nivelul lor absolut.

  • Testul Kendall tau

    Un test alternativ pentru asocierea variabilelor ordinale

    La fel ca i rS, Kendal tau ia valori ntre -1 i +1 i se interpreteaz similar

    Statisticienii se afl n disput cu privire la cei doi coeficieni

    Programele statistice le calculeaz pe amndou

    Foarte rar se ntmpl s conduc la decizii diferite unul de altul...

  • Sinteza testelor neparametrice ordinale

    2 eantioane

    independente

    3+ eantioane

    independente

    Mann-Whitney U

    Kruskall-Wallis

    2 eantioane

    dependente

    Corelaia rangurilor

    Spearman (Kendall)

    2 eantioane

    dependenteWilcoxon

    3+ eantioane

    dependenteFriedman

    Diferena

    Asocierea

    t

    independent

    ANOVA

    t

    dependent

    ANOVA

    msurri repetate

    r

    Pearson

    Echivalent

    parametric

  • ntrebri pregtitoare pentru evaluarea parial nr. 3 (14-16 ian.)

    Care este coeficientul de determinare dac r=0.80?

    n cazul testului t pentru eantioane dependente, pe ce scar se exprim valorile variabilei independente?

    Care este numele celui care a introdus testul de corelaie pentru date parametrice?

    Care este valoarea lui r pentru o corelaie perfect?

    Care dintre urmtorii coeficieni de corelaie este semnificativ: r=-0.70 (r critic=0.66) sau r=+0.70 (r critic=0.75)?

    n ce caz poat eexista o corelaie ntre dou variabile, chiar dac valoarea lui r este mic (sau chiar zero)?

    Ce este distribuia binomial?

    Care este probabilitatea lui P pentru un eveniment dihotomic aleator (DA/NU)?

    Care este echivalentul parametric al testului z pentru proporii?

    n cazul testului chi-ptrat, ce este frecvena ateptat?

    Pentru ce se utilizeaz testul chi-ptrat goodness-of-fit?

    Care sunt caracteristicile distribuiei chi-ptrat?