note de curs analize complexe 2.doc

36
Analize complexe 2 Note de curs Relaţiile între variabile. Distingem între relaţii funcţionale şi relaţii statistice. Relaţia funcţională între două variabile este exprimată printr-o formulă matematică. Dacă X denotă variabila independentă şi Y variabila dependentă, relaţia funcţională este de forma Y = f(X). Relaţia statistică între două variabile. O relaţie statistică, spre deosebire de o relaţie funcţională, nu este una perfectă. În general, observaţiile pentru o relaţie statistică nu trebuie să cadă direct pe curba de relaţie. Două evaluări: evaluările de la sfârşitul anului sunt luate drept variabile dependente sau variabile răspuns Y şi evaluările de la mijlocul anului ca variabile independente, explicativă, sau predictori X. Figura practică care ia naştere din vizualizarea în plan a punctelor X şi Y este numită diagramă de împrăştiere sau plan(grafic) de împrăştiere. Deşi nu are exactitatea unei relaţii funcţionale, relaţia statistică este folosită de multe ori, ea exprimând o tendinţă generală de asociere a celor două variabile. Pe lângă relaţii liniare, există şi relaţii curbilinii . Alegerea formei funcţionale a relaţiei de regresie este legată de alegerea variabilei predictor. Uneori, teoria relevantă poate să indice forma funcţională adecvată. Mai frecvent, totuşi, forma funcţională a relaţiei de regresie nu este cunoscută în avans trebuie să fie decisă empiric după ce datele au fost culese. Funcţiile de regresie liniare sau pătratice sunt adesea folosite ca o 1

Upload: ana-maria-pop

Post on 08-Aug-2015

89 views

Category:

Documents


1 download

TRANSCRIPT

Page 1: Note de curs Analize complexe 2.doc

Analize complexe 2 Note de curs

Relaţiile între variabile.

• Distingem între relaţii funcţionale şi relaţii statistice.

• Relaţia funcţională între două variabile este exprimată printr-o formulă matematică. Dacă X denotă variabila independentă şi Y variabila dependentă, relaţia funcţională este de forma Y = f(X).

• Relaţia statistică între două variabile. O relaţie statistică, spre deosebire de o relaţie funcţională, nu este una perfectă. În general, observaţiile pentru o relaţie statistică nu trebuie să cadă direct pe curba de relaţie. Două evaluări: evaluările de la sfârşitul anului sunt luate drept variabile dependente sau variabile răspuns Y şi evaluările de la mijlocul anului ca variabile independente, explicativă, sau predictori X. Figura practică care ia naştere din vizualizarea în plan a punctelor X şi Y este numită diagramă de împrăştiere sau plan(grafic) de împrăştiere. Deşi nu are exactitatea unei relaţii funcţionale, relaţia statistică este folosită de multe ori, ea exprimând o tendinţă generală de asociere a celor două variabile. Pe lângă relaţii liniare, există şi relaţii curbilinii.

• Alegerea formei funcţionale a relaţiei de regresie este legată de alegerea variabilei predictor. Uneori, teoria relevantă poate să indice forma funcţională adecvată.

• Mai frecvent, totuşi, forma funcţională a relaţiei de regresie nu este cunoscută în avans trebuie să fie decisă empiric după ce datele au fost culese. Funcţiile de regresie liniare sau pătratice sunt adesea folosite ca o primă aproximare satisfăcătoare a funcţiilor de regresie de natură necunoscută. Într-adevăr, aceste tipuri simple de funcţii de regresie poate fi folosită egal când teoria furnizează formă funcţională relevantă, îndeosebi când forma cunoscută este extrem de complexă, însă poate fi rezonabil aproximată printr-o funcţie de regresie liniară sau pătratică.

• Scopul modelului. În formularea unui model de regresie, noi avem nevoie de obicei de a restricţiona riscurile modelului la câteva regiuni sau intervale de valori ale variabilei predictor (sau variabilelor predictor). Scopul este determinat fie cu designul investigaţiei, fie prin seria de date la îndemână.

1

Page 2: Note de curs Analize complexe 2.doc

Start

Analiza exploratorie a datelor

Dezvoltarea uneia sau mai multor modele de regresie

Este unul sau mai multe modele de regresie adecvat pentru datele la îndemână?

Revizia modelelor sau construcţia unui model nou

nou

NU

Se identifică mai multe modele adecvate

Se fac inferenţe pe baza modelului de regresie

Stop

Da

Strategia tipică pentru analiza de

regresie

Michael H. Kuthner, J ohn Netter, William Li

Christopher J . Nachtsheim, Applied Linear Statistical

Models, McGraw-HillInternational Edition, New

York ,2005). P. 14

Modelele în psihologie

• Ceea ce diferenţiază teoriile de modele este, în primul rând, gradul lor de generalitate: un model este o reprezentare logică-matematică a unui ansamblu limitat de fenomene în condiţii riguros definite; o teorie ştiinţifică se aplică la un ansamblu mult mai vast de fenomene

• Teoria ştiinţifică poate fi considerată ca un model de ordin superior din care pot fi derivate modele locale, adică realizări specifice, care se aplică la anumite obiecte particulare şi la anumite clase definite de situaţii

Modelul formal Un model formal rezultă din aplicarea unui sistem formal la un

subansamblu de obiecte ale realităţii în scopul de a permite o interpretare în termeni de valoare de adevăr. Astfel, un model trebuie să posede o sintaxă(aceea a sistemului formal şi o semantică(rezultând din proiecţia sistemului formal într-o realitate cu sens). Sintaxa sistemului formal este definită printr-un ansamblu de condiţii(un limbaj):

Definiţia simbolurilor elementare ale sistemului, a expresiilor sistemului, a regulilor de formare a expresiilor şi a expresiilor corect formate ale sistemului(formulele sistemului);

2

Page 3: Note de curs Analize complexe 2.doc

Un sistem formal trebuie, de asemenea, să definească un procedeu de demonstraţie formalizată(axiome, relaţii între formule şi reguli de inferenţă, teoreme)

Sintaxa sistemului formal include formalizarea limbajului şi formalizarea demonstraţiei. Elaborarea unui sistem formal este o activitate de tip logic sau matematic. Există sisteme formale logice(logica propoziţională) şi sisteme formale matematice(exemplu algebra) care au exercitat o mare influenţă asupra modelizării psihologice.

Funcţii

Indiferent care ar fi dificultăţile precedente, interesul unui model formal este incontestabil prin faptul că el utilizează o sintaxă, logic sau matematic încercată, pentru descrierea şi interpretarea unui sector din realitate. Dacă interfaţa între sintaxa sistemului formal şi semantica modelului este o sursă de probleme , o analiză „agramaticală” a realului va avea consecinţe încă mai grave. Modelul are funcţii pozitive, inutil de subestimat sau negat. În ciuda caracterului uneori semantic aproximativ, modelul are următoarele avantaje:

Este specific(în privinţa unei situaţii);

Este explicit(privitor la postulatele şi axiomele sale);

Este condensator( prin raport cu complexitatea datelor);

Uşor modificabil(prin modificarea postulatelor sale)

Un model formal poate fi definit ca un sistem relaţional, de formă, de structură şi de funcţii între două obiecte, dintre care unul este un sistem formal şi altul, ansamblul limitat de obiecte pe care cineva doreşte să le descrie şi să le interpreteze.

Remarcă

• Este frecventă situaţia de a compara două obiecte naturale între ele şi de a sugera că unul dintre ele este modelul altuia(model animal de învăţare umană, de exemplu). Este la fel de posibil de a compara un obiect artificial la un obiect natural(ex: modelul informatic al memoriei umane). Cele două tipuri de comparaţii nu sunt echivalente, deoarece în primul caz nu se dispune de

3

Page 4: Note de curs Analize complexe 2.doc

sisteme formale de referinţă pe când obiectul artificial al celei de-a doua comparaţii este, în mod precis, realizarea materială a unui sistem formal

Clasificare

• În fapt, un model ştiinţific poate fi construit în scopul de a da seama de funcţionare unui obiect complex sau în scopul de a descrie structura unui astfel de obiect. Autorul articolului califică primele modele drept funcţionaliste sau funcţionale şi pe cele secunde modele structuraliste sau structurale.. Este clar faptul că anumite modele sunt tentate de a descrie simultan structurile şi legile de funcţionare ale obiectelor studiate. A doua clasă o califică modele mixte

Explicaţii

• Estimarea lui Y

eligiozitateSchizotipiaCredY Re05,007,0psy int13,0.20,0.ˆ

• În ecuaţie se pot introduce valori pentru fiecare persoană a eşantionului cu volum de 401subiecţi, şi prin aceasta valori de

4

Page 5: Note de curs Analize complexe 2.doc

estimare a experienţei cu practici oculte. În coeficientul de regresie din ecuaţia anterioară se indică cum se transformă puternic variabila dependentă, când variabila independentă corespunzătoare creşte cu o unitate, în timp ce restul variabilelor independente corespunzătoare rămâne constant. În datele prezente ia naştere punctajul individual pentru cuprinderea tulburărilor schizotipice de personalitate în numărul itemilor răspunşi în sensul caracteristicii. În sensul ecuaţiei prezentate mai sus a coeficientului de regresie pentru această variabilă independentă se poate interpreta şi în aşa fel că experienţa creşte cu 0,07 practici, când un item următor al

scalei a fost răspuns în sensul caracteristicii.

Condiţiile necesare pentru a aplica ANOVA simplă

Există o singură variabilă dependentă cu consistenţă scalară de interval;

Există o singură variabilă independentă, având consistenţă scalară nominală sau ordinală cu cel puţin 3 modalităţi sau niveluri;

Variabila dependentă trebuie să fie normal distribuită pentru fiecare dintre modalităţile sau nivelurile. În cazul în care nu este normal distribuită sau grupele experimentale conţin un număr prea redus de subiecţi(sub 10) se recomandă aplicarea testelor non-parametrice, (exemplu Kruskal Wallis);

Varianţele trebuie să fie relativ egale pentru fiecare dintre grupele supuse comparaţiei(unii autori consideră că această exigenţă poate fi încălcată)

Fiecare subiect trebuie să fie măsurat o singură dată(independenţa măsurătorilor)

Ipoteze

• Ipoteza nulă H0 – vom testa, cu un risc de eroare de 5 %, dacă mediile provin din aceeaşi populaţie părinte. În acest caz: 6,87 = 9,20 = 8,87 =10,40 = 10,40.Ele sunt cu siguranţă diferite, dar se estimează că diferenţele rezultă din fluctuaţii „normale” de eşantionaj.

• Ipoteza alternativă H1 va spune că mediile nu sunt egale. În acest caz: 6,87≠ 9,20 ≠8,87 ≠10,40 ≠ 10,40. Mediile rezultă din

5

Page 6: Note de curs Analize complexe 2.doc

populaţii părinte diferite. Diferenţele observate nu sunt semnificative

Tabelul ANOVA

Sursa devariaţie

Variaţia Grade delibertate Varianţa

F

Intergrup 127,44 4 31,8612,16

Intragrup 183,49 70 2,62

Total 310,93 74 4,20

Observaţii asupra tabelului privind rezultatul testului ANOVA simplă

• Variaţia totală este egală cu variaţia intergrup şi variaţia intragrup;

• Se calculează sumele pătratelor variaţiilor ambelor situaţii(variaţia inter şi variaţia intra);

• Gradele de libertate sunt egale în cazul dispersiei intergrup cu numărul acestora minus unu (5-1), şi în cazul dispersei intragrup cu numărul total de subiecţi minus numărul grupelor(75-5);

• Raportul dintre cele două medii pătratice este rezultatul final F;

• F-ul se interpretează asemănător cu celelalte teste statistice . În cazul în care valoarea lui F este semnificativă statistic(p<0,05, atunci respingem ipoteza nulă conform căreia nu există diferenţe între populaţiile din care au fost extrase grupele implicate în desingn-ul experimental;

• Rezultatul lui F se scrie în felul următor: F, (4,70) = 12,16, p< 0,01. Se poate afirma că diferenţele între cele 5 grupe nu se datorează hazardului.

6

Page 7: Note de curs Analize complexe 2.doc

Etape în aplicarea ANOVA simplă

a) verificăm dacă există diferenţe la nivel global între grupuri(dacă respingem H0) prin intermediul testului F omnibuz.

b) dacă răspunsul este afirmativ(rezultatul testului F omnibuz este semnificativ statistic), pentru a afla care dintre grupuri diferă între ele aplicăm procedura comparaţiilor analitice, multiple.

Există două categorii de comparaţii:

1. comparaţii planificate, a priori numite contraste;

2. comparaţii post-hoc

Contrastele şi comparaţiile post-hoc

• Contrastele testează ipoteze pe care cercetătorul le-a lansat înaintea cercetării privind diferenţele de medii dintre anumite grupuri;

• comparaţiile post-hoc - cercetătorul nu are o ipoteză unidirecţionată lansată anterior(pe baza teoriei) privind diferenţele de medie între anumite grupuri, şi pur şi simplu exploatează toate diferenţele posibile între mediile grupurilor analizate;

Testele post-hoc(neplanificate

• Sunt acele teste pentru care nu există o ipoteză unidirecţionată şi care verifică existenţa unor diferenţe semnificative între toate perechile de grupuri.

• Presupun parcurgerea unei serii de paşi;

– Stabilirea valorii F pentru a evidenţia existenţa diferenţelor semnificative între grupe;

– Selectarea testelor post-hoc adecvate pentru a vedea cum diferă grupele între ele (Aceasta este necesară doar dacă ipoteza nulă a fost respinsă în primul pas)

Testele post-hoc

• Sunt în număr de 20, şi sunt diferenţiate în funcţie de puterea lor(puterea de a descoperi diferenţe semnificative atunci când acestea există) şi probabilitatea de a produce eroarea de tipul I. Sunt grupate după criteriul egalităţii varianţelor(în număr de 16 pentru varianţe egale şi 4 în cazul varianţelor inegale(

7

Page 8: Note de curs Analize complexe 2.doc

• Există două tipuri de proceduri post-hoc:

1. testează diferenţa dintre fiecare pereche de medii(care interesează în mod general);

2. identifică subseturi omogene de medii(care nu diferă unele de altele).

– Unele dintre teste au la bază doar primă procedură(LSD, Bonferoni, Sidak, Dunnet(trei variante), Tamhane, Dunette T3, Games-Howell, Dunette C), altele doar a doua procedură((R-E-G-W-F, R-E-G-W-Q, S-N-K, Tukey b, Duncan, Waller-Duncan) iar altele au la bază ambele proceduri(Scheffe, Tukey, Hochberg GT2, Gabriel).

• Caz special - testul Dunnett - aplicabil în cazul experimentelor cu grup de control - care compară toate grupurile cu unul dintre ele, considerat de control. Implicit, ultimul grup este considerat de control, însă această setare poate fi schimbată, şi se poate lua drept reper primul grup. Există trei variante de aplicare a acestui test:

1. în care mediile sunt comparate cu media grupului de control;

2. în care doar mediile mai mari vor fi comparate cu media grupului de control;

3. în care doar mediile mai mici vor fi raportate la media grupului de control;

• În primul caz, ipotezele vor fi bidirecţionate, în restul cazurilor fiind unidirecţionate.

• Întrebare frecventă: cea referitoare la modalitatea de alegere dintre toate aceste variante. În cazul egalităţii varianţelor, majoritatea autorilor recomandă utilizarea testelor Bonferoni şi Tukey. Dacă variabila independentă are un număr redus de categorii, se aplică testul Bonferoni(mai puternic în detectarea diferenţelor dintre medii atunci când numărul de comparaţii este redus), în caz contrar recomandându-se testul Tukey. Totuşi, în

8

Page 9: Note de curs Analize complexe 2.doc

ciuda acestor diferenţe, majoritatea cercetătorilor optează pentru Tukey.

Selecţie teste post-hoc(F.Sava)

Număr de subiecţi

Egal(10,10,10)

Uşor inegal(9,10,11)

Puternicinegal

(15,10,7)

Omogenitatea

dispersiei

Dispersiiegale

Tukey GabrielTukey b

Hochberg(GT2)

Dispersiiinegale

Dunnet T3 GamesHowell

Games-Howell

Testele de contrast sau comparaţiile planificate( numite şi a priori).

• Folosire - când ipotezele sunt unidirecţionale , stabilite anterior derulării cercetării. Contrastele sunt folosite pentru a testa relaţiile între medii. Un contrast C este o combinaţie liniară a mediilor Mi, având coeficienţi de contrast ai:

• C = a1M1+ a2M2 +…….aiMi, unde a1+a2+a3 +… ai =0.

• Prin intermediul contrastelor se pot realiza următoarele comparaţii:

• Media unui grup versus media altui grup (M1 şi M2);

• Media unui grup versus media generală a altor grupuri(exemplu M1 şi (M2+M3+M4)/3;

• Media generală unor grupuri versus media generală a altor grupuri. De exemplu: (M1+M2)/2 şi (M3+M4+M5)/3

Regulile de alocare pentru coeficienţi sunt următoarele:

9

Page 10: Note de curs Analize complexe 2.doc

1. Grupurile situate în stânga expresiei versus primesc fiecare acelaşi coeficient cu semnul pozitiv;

2. Grupurile situate la dreapta cuvântului versus primesc fiecare acelaşi coeficient cu semnul negativ; Condiţii : grupurile care au coeficienţi pozitivi vor fi comparate cu grupurile care au coeficienţi negativi.

3. Grupurile nemenţionate în comparaţie primesc toate coeficientul 0;4. Pentru regulile 1 şi 2, coeficientul este egal cu numărul de grupuri situate

în partea cealaltă a cuvântului versus;5. Suma coeficienţilor este egală cu 0.

Contraste

Exemplu

• Într-un experiment avem două grupuri experimentale, G1 şi G2, pe care vom testa două noi metode de optimizarea învăţării şi un grup de control(G3). În prima fază putem verifica dacă oricare din cele două metode dau rezultate mai bune comparative cu neaplicarea lor(grupul de control) iar în a doua fază verificăm dacă una dintre cele două noi metode este mai eficientă comparativ cu cealaltă. Primul contrast este(1,1,-2) iar al doilea(-1,+1,0). Dacă am avea 8 grupuri şi dorim să comparăm grupurile G1, G7 cu G2, G3,G4,G5, coeficienţi de contrast ar fi(4,-2,-2,-2,-2, 0,4,0).

Trei criterii de clasificare a testelor de contrast

• După criteriul complexităţii, există contraste simple şi contraste complexe;

• În cazul în care sunt implicate doar două medii, avem contraste simple sau contraste pereche. În cazul în care variabila independentă are 3 categorii, se compară media grupului 2 cu media grupului 3; coeficienţii de contrast vor fi 0,1,-1)Numărul de contraste simple este k(k-1)/2, unde k este numărul de grupuri.

• Dacă luăm în consideraţie comparaţiile care implică mai mult de două medii avem contraste complexe, care reprezintă o combinaţie liniară a mediilor grupelor semnificative din studiul realizat. Dacă avem de comparat de exemplu efectele unor tipuri de psihoterapii, am putea avea trei grupe experimentale(G1, G2 şi G3) şi un grup de control(G4). Vom compara toate cele trei grupe experimentale( de fapt media mediilor celor trei grupuri) cu grupul de control(cu media acestuia) în felul următor: 1*G1+1*G2+1*G3 v -3*G4, coeficienţii de contrast fiind (1,1,1,-3).

10

Page 11: Note de curs Analize complexe 2.doc

Criterii

După criteriul ortogonalităţii, există contraste ortogonale şi contraste neortogonale:

Contrastele ortogonale sunt contraste independente, neredundante. Un set de contraste este ortogonal dacă fiecare contrast este independent de oricare altul.

Două contraste C1 = (a1, a2 , a3….am) şi C2 = (b1, b2, b3 şi ….. bm) sunt ortogonale dacă a1b1+a2b2+a3b3 +……ambm = 0. Exemplu de verificare a două contraste, C1= (3,-2,-2,-2,3) şi C2 = (0,2,-1,-1,0). Se vor înmulţi coeficienţii pe coloană, apoi se va face suma(3)*(0) +(-2)*(2)+(-2)*(-1)+ (-2)*(-1)+(3)*(0) =0. Concluzia este c ă cele două contraste sunt ortogonale

Dacă avem un singur contrast nestandardizat, acesta este în mod obligatoriu ortogonal(pentru că suma coeficienţilor este întotdeauna zero) ;

Într-un set de contraste ortogonale, dacă un grup face parte dintr-un contrast, atunci el nu va mai face obiectul unei alte comparaţii;

Într-un set de 4 contraste, acest set este ortogonal dacă fiecare contrast este ortogonal în raport cu oricare altul

Numărul maxim de contraste nestandardizate ortogonale ce pot fi realizate este k-1, unde k este numărul de grupuri.

Avantajul contrastelor ortogonale este că acestea menţin constantă eroarea setului de comparaţii la nivelul standard de α=0,05. În schimb, contrastele nonortogonale cresc riscul de a produce eroarea de tipul I)

11

Page 12: Note de curs Analize complexe 2.doc

3 -2 -2 -2 3

0 2 -1 -1 0

0 -4 2 2 0

Criterii

Contrastele nonortogonale sunt acelea care nu respectă condiţiile enumerate anterior. În consecinţă, suma produselor a două contraste(pe coloană) va fi diferită de 0.

Un set de contraste va fi nonortogonal dacă va conţine cel puţin două contraste nonortogonale(suma produselor coeficienţilor este diferită de 0);

Numărul maxim de contraste nonortogonale este mai mare decât (k-1);

Dezavantajul contrastelor nonortogonale este că nu menţin constantă eroarea de tipul I, trebuind să ajustăm pragul de semnificaţie la care raportăm rezultatele în funcţie de numărul de contraste. Astfel, pentru cinci contraste nonortogonale, pragul de semnificaţie ajustat va fi p = 0,05/5=0,01.

După criteriul standardizării, există contraste standardizate şi contraste nestandardizate.

12

Page 13: Note de curs Analize complexe 2.doc

În cazul contrastelor standardizate, tipurile de comparaţii inter-grupuri sunt specificate în SPSS(menu: Analyse→General Liniar Model→Univariate. Tipurile principale sunt următoarele:

Deviation-contraste prin deviere(nonortogonale): compară media fiecărui grup(exceptând grupul de referinţă care poate fi primul sau ultimul) cu media generală a tuturor grupurilor;

Simple contraste (nonrtogonale): compară media fiecărui grup cu media unui grup specificat(de referinţă), care poate fi primul sau ultimul; Este util în situaţia în care avem un grup de control;

Difference – contraste prin diferenţă(ortogonale) compară media fiecărui grup(exceptându-l pe primul) cu media generală a grupurilor anterioare

Helmert.contrastele Helmert (ortogonale): compară media fiecărui grup(exceptându-l pe ultimul) cu media generală a grupurilor următoare;

Repetead – contraste repetate(non-ortogonale): compară media fiecărui grup(exceptându-l pe ultimul cu media generală a grupului următor;

Polynomial – contraste polinomiale(ortogonale): reprezintă creşteri(sau descreşteri) liniare, curbilinii, cubice, etc de-a lungul unui set ierarhizat de medii(în acest caz, coeficienţii au valori fixe în SPSS). Se poate testa, de exemplu, productivitatea unor studii cantitative(ca o creştere liniară) pentru trei grupuri de cercetători: unii care nu au urmat nici un training în analiză tranzacţională alţii care au beneficiat de un training de nivel mediu şi alţii care au beneficiat de un training la nivel de expert.

Observaţii

Toate condiţiile ,prezentate mai sus sunt specifice designurilor cu grupe egale de subiecţi(balanced design). În cazul designurilor cu grupe inegale de subiecţi(unbalanced design) apar cîteva modificări. Condiţia C = a1M1+ a2M2 +…….aiMi, unde a1+a2+a3 +… ai = 0 devine a1n1 + a2n2 +….+aini=0, iar condiţia a1b1+a2b2+a3b3 +……ambm = 0 devine

unde n1, n2….nm reprezintă cele m grupe de design

13

Page 14: Note de curs Analize complexe 2.doc

Contrastele standardizatepot fi ortogonale sau non-ortogonale. SPSS dispune de şapte contraste

standardizate, din care ultimele două sunt ortogonale Sinteză

Nume Descriere Contraste

Trei grupe Patru grupe

Deviation(first)

Compară fiecare grup(cuexcepţia primului) cu ocombinare a tuturorgrupelor

123

2 vs(1,2,3)3 vs(1,2,3)

2 vs (1,2,3,4)3 vs(1,2,3,4)4 vs (1,2,3,4)

Deviation(last)

Compară fiecare grup(cuexcepţia ultimului) cu ocombinare a tuturorgrupelor

123

1 vs (1,2,3)2 vs(1,2,3)

1 vs(1,2,3,4)2 vs(1,2,3,4)3 vs(1,2,3,4)

Simple(first)

Fiecare grupă estecomparată cu primacategorie

123

1 vs 31 vs 3

1 vs 21 vs 31 vs 4

Simple(last)

Fiecare grupă estecomparată cu primacategorie

123

1 vs 22 vs 3

1 vs 41 vs 41 vs 4

Contraste

Repeated Fiecare grupă(cuexcepţia primeicategorii)este comparată cugrupaimediat precedentă

123

1 vs 22 vs 3

1 vs 22 vs 33 vs 4

Helmert Fiecare categorie(cuexcepţia ultimei) estecomparată cu mediagrupelor ulterioare

123

1 vs (2,3)2 vs 3

1 vs(2,3,4)2 vs (3,4)3 vs 4

Diference(Helmertinvers)

Fiecare categorie(cuexcepţia primei) estecomparată cu mediagrupelor precedente

123

3 vs (2,1)2 vs 1

4 vs(3,2,1)2 vs (2,1)2 vs 1

Observaţii

Observaţiile privind design-urile cu grupe inegale pot fi ignorate de cele mai multe ori. Unii autori consideră că SPSS oferă rezultate corecte la testele statistice chiar în cazul inegalităţii grupelor, însă

14

Page 15: Note de curs Analize complexe 2.doc

doar pentru design-uri cu un singur factor. Se observă că rezultatele testelor de contrast tind să fie ceva mai optimiste(designu-rile cu grupe egale de subiecţi fiind mai puternice decât cele cu grupe inegale

Se pot aplica teste de contrast fără a lua în calcul testul F omnibuz. Rezultatul la testul F omnibuz poate să nu fie semnificativ (deoarece ia în calcul toate comparaţiile – pereche )

Mărimea efectului

ANOVA factorială

Utilizând acestui test factorial putem analiza efectele a două sau mai multe VI asupra unei VD, precum şi efectele de interacţiune ale VI asupra VD.

Condiţiile necesare pentru aplicarea ANOVA factorială sunt aceleaşi ca pentru ANOVA simplă. Sursele de varianţă în ANOVA factorială sunt:

varianţa corespunzătoare fiecărei VI;

varianţa corespunzătoare efectelor de interacţiune;

varianţa intragrupuri sau varianţa eroare;

Într-un design cu două variabile independente(X şi Y), varianţa totală poate fi descompusă în felul următor :

varianţa atribuită variabilei X ;

varianţa atribuită variabilei Y;

varianţa atribuită interacţiunii intre variabilele X şi Y;

varianţa intragrupuri sau varianţa eroare.

Ce testăm?

Se va putea testa :

15

Page 16: Note de curs Analize complexe 2.doc

efectul variabilei X asupra variabilei dependente( efectul principal al variabilei X) ;

efectul variabilei Y asupra variabilei dependente(efectul principal al variabilei Y)

efectul de interacţiune între variabila X şi variabila Y.

În cazul unui design cu trei VI vom testa trei efecte principale, trei efecte cu dublă interacţiune şi un efect cu tripla cţiune. Într-un design cu patru VI vom testa, patru efecte principale, 6 efecte de dublă interacţiune, 4 efecte de triplă acţiune şi 1 efect de quadruplă acţiune

Interacţiuni

În situaţia în care interacţiunea între variabile este semnificativă, este primordială interpretarea acesteia, interpretarea efectelor principale făcându-se cu precauţie şi doar când acestea sunt importante în contextul cercetării. Analizarea efectelor principale semnificative se face prin intermediul testelor de contrast sau a testelor post hoc, aşa cum s-a precizat la ANOVA ONE WAY. În cazul în care efectele de interacţiune sunt semnificative, atunci analiza acestora urmează două demersuri

1. Analiza efectelor simple;

2. Analiza contrastelor de interacţiune

Efecte

Dacă un efect principal este evidenţiat ca semnificativ statistic prin intermediul testului F, atunci este posibil ca acesta să nu fie în realitate semnificativ. Din acest motiv, se recomandă verificarea tuturor efectelor principale semnificative prin intermediul testelor t pentru eşantioane independente, atunci când variabila în cauză are doar două categorii   ;

Dacă un efect de interacţiune X*Y nu este semnificativ statistic, putem totuşi să verificăm efectele simple ale unei variabile(X sau Y) doar în anumite condiţii:

Dacă efectul principal al variabilei X este semnificativ, iar efectul principal al variabilei Y este nesemnificativ, atunci putem analiza efectele simple ale variabilei Y(în acest caz informaţii sunt datorate efectului principal al variabilei X ;

16

Page 17: Note de curs Analize complexe 2.doc

Reciproc, dacă efectul principal al variabilei Y este semnificativ, vom putea analiza doar efectele simple ale variabilei X ;

Dacă însă nici unul din efectele principale ale variabilelor X şi Y nu este semnificativ, atunci vom putea analiza oricare dintre efectele simple ale variabilelor X şi Y.

ANOVA simplă cu măsurători repetate

Condiţiile în care se poate aplica ANOVA simplă cu măsurători repetate sunt următoarele :

Variabila dependentă trebuie să satisfacă exigenţe de scalare de interval şi să fie normal distribuită(în fiecare din condiţiile variabilei independente),

condiţia de sfericitate, testată prin testul W al lui Mauchly, presupune omogenitatea varianţelor atât în cadrul condiţiiloe experimentale cât şi în cadrul diferenţei dintre două condiţii(de exemplu, pentru 4 condiţii experimentale, notate cu a1,a2, a3 şi a4, dacă am crea şase noi variabile reprezentând diferenţele dintre fiecare două condiţii, respectiv, a1-a2, a1 – a3, a1-a4, a2 - a3, a2 - a4, a3-a4, atunci varianţele variabilelor b1, b2, b3, b4, b5, b6 trebuie să fie de asemenea egale). Sfericitatea poate fi considerată şi ca o omogenitate a covarianţelor, respectiv a coeficienţilor de corelaţie dintre fiecare două condiţii experimentale. Dacă nu se respectă condiţia de sfericitate, creşte şansa de a comite o eroare de prima speţă.

fiecare subiect este testat în fiecare condiţie experimentală.

Sfericitatea

Condiţia de sfericitate este relativ rar întâlnită în cercetările realizare în domeniul psihologiei experimentale. Trebuie amintit faptul că încălcarea acesteia influenţează rezultatele în mod semnificativ. Dacă rezultatele la testul W al lui Mauchly sunt nesemnificative statistic(p>0,05), atunci condiţia de sfericitate este îndeplinită. În cazul în care nu se îndeplineşte condiţia de sfericitate, avem la dispoziţie două alternative:

ajustăm gradele de libertate în citirea valorillor F din ANOVA(folosind corecţiile Greenhouse-Geisser sau Huynh-Feldt;

fie folosim analiza de varianţă multivariată(MANOVA ).

17

Page 18: Note de curs Analize complexe 2.doc

În cadrul acestei tehnici vom apela la teste de contrast sau la teste post-hoc., deoarece testul F global testează doar dacă există diferenţe între diferitele condiţii experimentale. Testele de contrast disponibile sunt doar cele standardizate, iar testele post-hoc sunt LSD, Bonferroni şi Sidak(cel mai recomandat fiind testul Bonferroni.

Surse de variabilitate

Variabilitate intra-grup Variabilitate inter-grup

Eroare Eroare

Diferenţe individuale Diferenţe individuale

Variabile parazite Variabile parazite

Efectele de tratament.

Fără efect al tratamentului. Cele două variabilităţi sunt aproape identice.

Variabilitate VariabilitateIntra-grup inter-grup

Variabilitate Intra-grup

Variabilitatea Inter-grup

18

Page 19: Note de curs Analize complexe 2.doc

Efect al tratamentului. Variabilitatea intra-grup este slabă faţă de variabilitatea inter-

grup

Variabilitate VariabilitateIntra-grup inter-grup

Variabilitate Intra-grup

Variabilitatea Inter-grup

ANOVA factorială cu măsurători repetate

Exemplu. Un cercetător a fost interesat în studierea abilităţilor adulţilor în vârstă pentru a îmbunătăţi memoria lor verbală folosind tehnica mnemonică „method of loci” . Metoda presupune asocierea fiecărui item de memorat cu o locaţie specifică dintr-o secvenţă de locaţii extrem de familiare, precum camera unei case personale(exemplu pentru cuvântul pălărie, persoana poate să vizualizeze o pălărie atârnând pe cârligul din faţa holului). Din cauza faptului că metoda este legată cu uşurinţă de abilitatea de a manipula imagini vizuale, este de aşteptat ca persoanele în vârstă care sunt sau au fost implicate(incluse) în artele vizuale de desenare, pictură, sculptură, design-grafic vor fi mai bune în utilizarea unei astfel de metode. Pentru a examina această posibilitate, cercetătorii administrează un test de memorie verbală la 50 de artişti adulţi în vârstă şi la 50 de adulţi în vârstă ne-artişti, scorul de interes este exprimat prin procentajul corect. După o evaluare de bază, ambele grupe sunt antrenate cu metoda loci şi sunt retestate de patru ori la interval de o săptămână. Grup de medii la aceste cinci măsurători.

19

Page 20: Note de curs Analize complexe 2.doc

Tabelul 11.1 ilustrează o variabilă W-S(timp) şi o variabilă B-S(grup).

Saptamâna

Nr 0 1 2 3 4 Media

1 42 47 55 59 65 53,6

2 38 39 37 28 30 34,4

3 27 41 45 58 70 48,2

4 27 24 31 36 33 30,2

5 34 36 32 31 39 34.4

6 39 44 37 44 43 41,4

Etc …. …. ……. …… ….. …….

……… ….. …… …… …. …. …..

99 8 18 23 35 36 24,0

100 25 34 43 49 65 43,2

Media 34,06 36,97 40,48 43,48 47,30 40,46

Ab st. 14,57 13,74 14,94 17,45 22,04 14,39

Imaginea 11.1. Performanţele medii la memorie.

Variabile Whithin-Subjects şi Between-Subjects

Figura 11.1 ilustrează o variabilă W-S(timp) şi o variabilă B-S(grup). Există două ipoteze de cercetare a priori :

20

Page 21: Note de curs Analize complexe 2.doc

Metoda loci îmbunătăţeşte în timp memoria oamenilor în vârstă.;

Rata de ameliorare va fi mai mare pentru artiştii vizuali decât pentru participanţii în vârstă care nu sunt artişti vizuali.

Întrebări:

Diferă scorurile (cresc) pe parcursul celor 5 evaluări?

O examinarea mediilor din tabelul 11.1 sugerează că acestea sunt diferite de la una la alta, însă nu se ştie dacă sunt statistic semnificative.

Care este motivul pentru care nu se realizează un simplu ANOVA ONE WAY pentru a testa dacă mediile pentru fiecare punct diferă?

Sunt două răspunsuri la această întrebare.

1. ANOVA One W ay presupune că observaţiile sunt independente . Asumpţia este violată din cauza faptului că fiecare participant la studiu contribuie mai mult decât cu un scor corect la setul de date.

2. A doua raţiune constă în faptul că One way ignoră informaţia utilă setul de date, anume diferenţele sistematice între indivizi, cum arată coloana cea mai din dreapta. Aceste diferenţe între indivizi în scorurile lor medii sunt contate ca „erori” în One way ANOVA. Se poate asuma faptul că diferenţele de scoruri nu sunt simple erori întâmplătoare, mai degrabă ele se produc ca un rezultat al faptului că unii oameni au o memorie mai bună decât alţii. O cale de a acomoda violarea stării de independenţă şi prezenţa de diferenţe individuale în scorurile memoriei este de a folosi persoana ca o variabilă independentă de-a lungul timpului. A face aceasta , înseamnă că „persoana „ este considerată un efect întâmplător şi timpul un efect fixat. Efectele întâmplătoare sunt cele în care nivelurile variabilei sunt selectate la întâmplare dintr-o populaţie de niveluri. În cazul metodei de studiu loci, cei 100 de participanţi pot fi gândiţi ca selectaţi întâmplător dintr-o populaţie de oameni în vârstă.

Modelul

Pe această cale, 100 de participanţi reprezintă fiecare 100 de niveluri ale factorului întâmplător, persoana. Timpul este considerat un efect fix , din cauza faptului că experimentatorul are 5 puncte temporale pentru scopul acestui studiu. Dacă se pune problema replicării acestui studiu, se vor folosi aceleaşi puncte temporale pentru evaluare(din cauză că timpul este fixat) însă se vor folosi diferite eşantioane întâmplătoare de participanţi(din cauză că persoana este aleatorie). Modelul final ANOVA este cunoscut ca un model fix, din cauza faptului că el conţine o combinaţie de factori fixaţi şi factori aleatori

21

Page 22: Note de curs Analize complexe 2.doc

Calcularea testului statistic. Pentru a determina dacă mediile pentru fiecare nivel de timp diferă, s-a folosit un test F omnibuz(sau global) pentru a evalua H0 (după care mediile populaţiei nu diferă pe parcursul celor 5 puncte temporale). Testul F poate fi considerat şi prin raportare la varianţă. Varianţele sunt măsurători ale diferenţelor între scoruri, şi cercetătorii sunt interesaţi în explicarea acestor diferenţe. Exemplu: cineva poate să se întrebe dacă toate scorurile corecte în setul de date al metodei loci nu sunt aceleaşi. O posibilitate : există diferenţe între scorurile corecte din cauza faptului că există diferenţe între scorurile medii pentru fiecare din punctele temporale. Se determină dacă varianţa explicată prin factorul timp este semnificativ mai mare decât 0. Aceasta este însoţită prin compararea varianţei care este datorată efectului cu varianţa care este datorată erorii. În cazul măsurărilor repetate ANOVA, testul F pentru efectul timp este bazat pe următorul raport de varianţe: efectul timp/(persoana x interacţiunea). Acest raport capătă sens intuitiv dacă se consideră să aibă un total de varianţă semnificativ care este datorat interacţiunii persoană x timp.

Interacţiunea specifică că diferenţa între cele 5 puncte temporale poate să varieze în dependenţă de fiecare persoană.

Ex: scorul persoanei 1 pare să crească în timp, în timp ce scorul persoanei 2 pare să descrească. Deci diferenţele între punctele de timp sunt diferite pentru persoana 1 şi persoana 2. În alte cuvinte , interacţiunea persoană x timp evaluează inconsistenţe în efectul timp între oameni. Ideal, concluziile despre efectul timpului ar trebui să fie acelaşi pentru toţi subiecţii aflaţi sub studiu. În consecinţă, dacă creşterea varianţei care este datorată interacţiunii persoană x timp depinde mult de varianţa care este datorată efectului timp, cineva poate conchide că există prea multă variaţie de la persoană la persoană pentru a face inferenţe semnificative despre diferenţele mediilor de grup pentru cele cinci puncte temporale. Nu este cazul pentru aceste date din cauza faptului că testul pentru efectul timpului dă următoarea ecuaţie:

 F(4,496) = 28,77, p<.0001. Va fi respinsă ipoteza de nul a lipsei de diferenţă între mediile de grup de-a lungul timpului

Mărimea efectului

Testele de semnificaţie ne spun dacă varianţa în variabile dependentă explicată prin variabila independentă este semnificativ diferită de 0. Important: cât de multă varianţă este explicată? În limbaj statistic, acesta

22

Page 23: Note de curs Analize complexe 2.doc

este un exemplu de puterea efectului . Există două tipuri de mărime a efectului: brut(sau nestandardizat) şi standardizat

Nestandardizat: mărimea efectului este exprimată ca cea mai mare diferenţă între unele dintre medii. În exemplul nostru, ar fi diferenţa între timpul 4(47,30) şi mărimea de pornire (34,06), care este 13,24 Acesta este efectul brut sau nestandardizat din cauză că el este exprimat în metrica originală a variabilei dependente, scorul adevărat la memorie. Aceste scoruri sunt procentaje, aşa încât efectul detectat corespunde la 13,24 puncte percentile pe măsură. Similar poate fi ştiut că efectul este egal la 100 x (13,24/34,06 = 39%.

Mărimea efectului

Mărimea efectului brut este folositoare când variabila dependentă este măsurată pe o metrică binecunoscută ca punctele percentile, scoruri T, scoruri z

Calcul pentru mărimea standardizată a efectului. Repere:

0,01 – valoarea mică;

0,09 – Valoare medie;

0,25 – Valoare mare.

Semnificaţie eta pătrat

Cohen: 23% din variabilitatea scorurilor memoriei au fost legate în variabilitatea în timpii de măsurări. Efectul poate fi considerat relativ mare.

Teste de continuare

  Respingând ipoteza de nul, următorul pas este de a determina care medii sunt semnificativ diferite una de alta. Ca în ANOVA tradiţională, există două categorii de teste de continuare:

Comparaţii post-hoc între medii;

Contraste a priori

Teste post-hoc

23

Page 24: Note de curs Analize complexe 2.doc

Dacă un cercetător nu are o aşteptare specifică a priori privind diferenţele între mediile individuale, atunci o analiză post hoc va fi realizată pentru a compara toate perechile de medii. În metoda loci, cele 5 puncte temporale produc k(k-1)/2 =5(5-1)/2=10 comparaţii unice între medii, unde k este numărul de niveluri ale variabilei W-S. Interpretarea testele multiple de semnificaţie statistică crește şansele erorii de tip 1(uneori numită „inflaţie alfa” . Fiecare procedură post-hoc controlează erorile de tip I.

Teste de contrast.

Prima ipoteză: memoria se va îmbunătăţi în timp în urma aplicării metodei loci. Aceasta este cunoscută ca o ipoteză a priori din cauza faptului că cercetătorul prezice un pattern particular al mediilor înainte de a realiza analiza. Aşa cum este declarată, ipoteza este ambiguă. Prezice că media scorurilor adevărate va în creştere peste timp, însă nu specifică cum aceasta va creşte(exemplu: în linie dreaptă, în linie curbă sau o creştere ”bruscă”. Din punct de vedere tehnic, dacă pattern-urile mediilor sunt aşteptate să crească, ni se spune că mediile sunt în creştere monotonă funcţie de timp(creştere monotonă). Pentru a testa a priori ipotezele, cercetătorii folosesc contraste planificate. Concentrare pe două contraste folosite în mod comun pentru date cu măsurări repetate: repetate şi polinomiale.

Un contrast repetat compară fiecare nivel al variabilei W-S cu nivelul adiacent(învecinat). Metoda loci: aceasta va determina o examinare a diferenţelor între nivelul de bază şi T1, T1 şi T2, T2 şi T3, T3 şi T4. Numărul maxim de contraste pe care cineva la va putea examina este de data aceasta k-1, unde k este numărul de niveluri al variabilei W-S.

Contrastul polinomial

Un contrast polinomial, numit şi „analiză de tendinţă”, este realizat pentru a determina forma relaţiilor dintre nivelurile variabile W-S. Pentru variabila W-S cu k niveluri, sunt realizate k-1 contraste. Primul reprezintă o relaţie liniară(linie dreaptă) printre niveluri, al doilea reprezintă o relaţie pătratică(model U sau o parabolă: variabila W-S la puterea a doua), al treilea o relaţie cubică(model S: variabila W-S la puterea a treia) ş.a.m.d. Specificăm faptul că modelul de curbă polinomială poate fi determinat prin observarea puterii la care este ridicată variabila. Numărul minus 1 ne spune cât de multe „coturi”(înclinaţii, îndoituri) există în curbă. Deci timpul2 este reprezentat printr-o curbă cu 2-1 = 1 coturi(la modelul U) şi timp3 este reprezentat printr-o curbă cu 3-1=2 curbe(la modelul S).

Contraste polinomiale

24

Page 25: Note de curs Analize complexe 2.doc

În metoda loci există k-1=4 contraste polinomiale pentru timp. Această medie care este posibilă pentru a testa pentru un efect al timpului, un efect pătratic(timp2) un efect cubic(timp3) şi un efect quartic(timp4) Un test F separat este folosit pentru fiecare polinomial pentru a determina dacă fiecare trend particular(liniar, pătratic, cubic) explică o creştere semnificativă a varianţei în variabila dependentă. Pentru metoda datelor loci, doar primul termen polinomial corespunzând efectului liniar al timpului este semnificativ. F(1,99) = 30,96, p<.001, η2 = .24. Deci, se poate trage concluzia că scorurile la memorie a adulţilor bătrâni s-au îmbunătăţit în timp şi că forma acestei îmbunătăţiri este o creştere liniară în timp.

Asumpţii. ANOVA cu măsurări repetate are aceleaşi asumpţii de bază ca ANOVA standard cu o mică deformare. Independenţa observaţiilor cere ca fiecare scor al participanţilor să nu fie influenţat de către alte scoruri ale participanţilor.. Ex: În studiul care examinează efectul unei intervenţii educaţionale folosind grupuri de către 8-10 studenţi, performanţa fiecărui copil particular în grup poate fi influenţată de către ceilalţi copii din acel grup. În consecinţă, observaţiile nu sunt independente unele de altele. Această asumpţie nu poate fi violată sau în caz contrar testele F nu vor furniza estimări corecte ale măsurării erorii de tip I.(valorile p).

Normalitatea cere ca distribuţia variabilei dependente în populaţie să fie normală. În cazul ANOVA cu măsurări repetate, aceasta consideră ca valorile variabilei dependente la fiecare nivel al variabilei W-S sunt normal distribuite în populaţie. Când o variabilă B-S precum tratamentul de grup este cerută, VD trebuie să fie normal distribuită în populaţie pentru fiecare grup la fel. În general vorbind, ANOVA cu măsurători repetate este considerată robustă la violările asumpţiei normalităţii. Mediile sunt semnificativ distorsionate doar când distribuţia datelor este o deviaţie extremă de la normal. În schimb, cercetătorul poate să opteze de a transforma datele pentru a face distribuţia mai normală, sau el poate să aleagă o analiză non-parametrică care testează

Omogenitatea varianţelor Tehnic, asumpţia este cunoscută ca sfericitate şi descrie o formă a relaţiei între scoruri la toate nivele variabilei W-S. Cerinţe:

Varianţele măsurătorilor la fiecare nivel al factorului repetat sunt egale;

Covarianţele, şi în consecinţă corelaţiile, între măsurări şi fiecare nivel al factorului repetat sunt de asemenea egale.

Pentru studiul cu metoda loci, s-ar putea considera că varianţele scorurilor corecte la bază şi săptămânile 1-4 trebuie să fie egale şi că valoarea

25

Page 26: Note de curs Analize complexe 2.doc

corelaţiilor între scorurile oamenilor la fiecare două puncte de timp trebuie să fie egale. Când există doar două nivele ale variabilei W-S, asumpţia de sfericitate este în dificultate deoarece există doar un termen de covarianţă.

Într-un design factorial cu măsurători repetate care include variabile B-S cum ar fi grupul, o cerinţă adiţională este ca varianţele şi covarianţele măsurărilor repetate trebuie să fie aceleaşi pentru fiecare grup. Această asumpţie, cunoscută ca matrice de omogenitate a covarianţelor poate fi testată folosind testul M a lui Box . Dacă variabila dependentă nu este normal distribuită, cu toate acestea, M-ul lui Box tinde de a indica faptul că matricele de covariaţie sunt diferite, când de fapt acestea nu sunt. Combinarea asumpţiilor de sfericitate şi omogenitate a matricei covarianţelor este cunoscută sub numele de multisample sphericity .

Sfericitatea. Când asumpţia de sfericitate nu este întâlnită, testul F este distorsionat în direcţia indicării diferenţelor semnificative când ele nu apar în realitate. Din această raţiune, cercetătorii evaluează adesea gradul de sfericitate cu o valoare denumită „epsilon”(ε 2 ). Un ε de 1,0 indică faptul că sfericitatea este întâlnită, şi o valoare de a lui ε = 1/k-1) indică cea mai rea violare posibilă a sfericităţii, unde k este numărul de niveluri pentru variabila W-S. Există două moduri de calculare a lui ε: estimatorul Greenhouse-Geisser(1959) şi estimatorul Huynh-Feldt(1976). Primul o subestimează, al doilea o supraestimează.În exemplul nostru, aceştia sunt foarte compacţi G-G=.290 şi H.F=.291. Aceste valori sugerează o depărtare semnificativă de sfericitate.

Autorii de articole ştiinţifice în revistele ştiinţifice raportează rar valoarea lui ε, şi puţini indică metoda de a o calcula. Cel mai rău posibil ε cu trei niveluri este .50 şi pentru şase niveluri cu .20. Astfel, ce este o valoare „suficient de bună” a lui ε pentru a indica faptul că asumpţia sfericităţii nu este neîndoielnic violată? Pare să fie un consens între cercetători că ε>.90 este destul de sigură.

Testele F ajustate

 Două opţiuni când sfericitatea pare să fie violată. Una este de a folosi Măsurări repetate MANOVA, În cazul în care violarea sfericităţii nu este prea extremă (ε între .75 şi.90, un test F ajustat poate să fie folosit cu un cadru de model mixt. Testul ajustat este obţinut prin multiplicarea gradelor de libertate de la numitor şi numărător prin ε făcând posibil de a obţine o valoare F mai mare cu semnificaţie extinsă(când sfericitatea nu este întâlnită, atunci valoarea lui F este distorsionată, în sensul de a fi mai mare decât cea calculată. Fiecare din cele două formule poate fi folosită, rezultând o ajustare mai conservativă sau mai liberală. În 1996, Stevens recomandă efectuarea mediei între cele două estimări a lui ε, folosind corect

26

Page 27: Note de curs Analize complexe 2.doc

df. În metoda modelului loci, gradele de libertate pentru testul F(4,396) vor fi ajustate la(1.16,114,80) folosind GG şi (1,16, 115,31 folosind HF. În ambele cazuri se obţine un F de 28,76 care este înalt semnificativ, p <.0001 .

Sfericitate şi contrast

Ca şi cu testul F general pentru efectul W-S, analiza de contrast a priori şi post hoc este vulnerabilă la violarea asumpţiei de sfericitate. Validitatea valorii p obţinută din analizele de contrast este mai dependentă de asumpţia de sfericitate decât testul global F. Cel mai important lucru de cunoscut este că atunci când sfericitatea nu este întâlnită, acest test statistic poate fi distorsionat în direcţia indicării rezultatelor semnificative

care nu sunt de fapt semnificative.

ANOVA factorială

Exemplificare cercetare: Un cercetător vrea să cerceteze dacă anxietatea faţă de testare este influenţată de tipul de temperament, de stima de sine şi de interacţiunea dintre aceste două variabile independente:Nivelurile variabilelor independente vor fi:

Stima de sine: 1 – stimă de sine scăzută; 2 – stimă de sine ridicată;

Tip temperamental: 1- introvertit; 2 –ambivert 3 - extravertit;

Variabila dependentă: anxietatea faţă de examen determinată cu testul TAI al lui Spielberger

Design-ul cercetării

Introvertit Ambivert Extravertit

Stimă de sine scăzută

G1 G3 G5

Stimă de sine ridicată

G2 G4 G6

temp

Total 1,00 2,00 3,00

27

Page 28: Note de curs Analize complexe 2.doc

stima 1,00 15 20 20 55

2,00 29 19 17 65

Total 44 39 37 120

Redare rezultat

F df1 df2 Sig.,682 5 114 ,638

Interpretare ANOVA factoriala

Interpretare:tipul de temperament influenţează în mod diferit anxietatea faţă de examinare în funcţie de nivelul stimei de sine

Există două direcţii generale de analiză a efectelor de interacţiune:

• Analiza efectelor simple;

• Analiza contrastelor de interacţiune

Prin acest demers analizăm influenţa unei VI în fiecare din condiţiile alte VI. Designul experimental este de tipul 3x2 şi avem şase grupuri experimentale(G1 – G6) şi şase medii(M1 – M6)

• Analiza efectelor simple ale VI tip temperamental în fiecare din cele două condiţii ale variabilei independente stimei de sine(scăzută- ridicată):

28

Page 29: Note de curs Analize complexe 2.doc

1. Efectul simplu al tipului de temperament în condiţii de stimă de sine scăzută(verificăm dacă există diferenţe între mediile M1, M3, M5;

2. Efectul simplu al timpului de temperament în condiţii de stimă de sine ridicatăM2, M4 şi M6

• Analiza efectelor simple ale VI stimă de sine scăzută - stimă de sine ridicată în cele trei condiţii ale VI tip de temperament

1. Efectul simplu al stimei de sine în condiţia introvertit(compararea mediilor M1 şi M2);

2. Efectul simplu al stimei de sine în condiţie de ambivert(compararea mediilor M3 şi M4);

3. Efectul simplu al stimei de sine în condiţie de extravert(compararea mediilor M5 şi M6);

• Se recomandă analiza efectelor simple corespunzătoare doar uneia dintre VI , şi nu ambelor VI,deoarece informaţiile obţinute ar fi redundante

29