12 analiza bivariata

Post on 10-Aug-2015

193 Views

Category:

Documents

2 Downloads

Preview:

Click to see full reader

TRANSCRIPT

Analiza bivariată

Analiza bivariată

Constă în studierea datelor şi în testarea ipotezelor când cercetarea are în vedere investigarea simultană a relaţiilor dintre două variabile.

Cea mai simplă metodă de analiză o constituie tabelarea încrucişată (prin tabelele de contingenţă).

Realizarea tabelelor de contingentă în SPSS

Selectarea variabilelor pentru realizarea tabelelor de contingenţă

Pentru realizarea unor prezentări grafice

Pentru realizarea unor teste statistice

Pentru realizarea tabelelor de contingenta

Setarea tipului de frecvenţă

Frecvente absolute

Analiza bivariată

Teste pentru compararea diferenţelor dintre medii şi a diferenţelor dintre procente.

Teste pentru compararea diferenţelor dintre medii şi a diferenţelor dintre procente.

Au ca obiect cunoaşterea deosebirilor, deci a diferenţelor de atitudine, de comportament, de caracteristici, dintre indivizii care compun două grupuri care pot fi independente sau perechi(dependente).

Testul unei diferenţe reprezintă o cercetare a ipotezei care indică că două sau mai multe grupuri diferă sub aspectul mărimii unei variabile exprimată ca medie sau ca procent.

A. Teste de comparare a diferenţelor dintre două populaţii (grupuri)

Testul z şi testul t de comparare a mediilor provenite de la două eşantioane independente

Se are în vedere cunoaşterea semnificaţiei statistice a diferenţei existente între cele două medii, în cazul unei variabile măsurate metric.

Eşantioanele la nivelul cărora se calculează cele două medii pot fi:

de dimensiuni mari (>30), situaţie în care luăm în considerare distribuţia z

de dimensiuni mici (≤ 30) când trebuie să apelăm la distribuţia t

Situaţia 1: cele două eşantioane sunt de dimensiuni mari, respectiv n1 şi n2 > 30 iar varianţele populaţiilor sunt

cunoscute şi nu diferă semnificativ între ele. Se formulează ipoteza nulă şi se optează pentru

una din cele trei forme ale ipotezei alternative. Ipoteza nulă arată că între cele două medii

provenite de la cele două populaţii independente nu există nici o diferenţă; deci, populaţiile sunt identice din punct de vedere statistic având în vedere parametrul medie pentru variabila cercetată:

H0 : μ1 = μ2H1 : μ1 ≠ μ2H1 : μ1 > μ2H1 : μ1 < μ2

Se determină raportul critic:

Unde: reprezintă valorile medii ale primului şi

ale celui de al doilea eşantion abaterea standard comună a

diferenţelor mediilor.

2121

212121.xxxx

xxxxCR

deoarece μ1 - μ2 = 0 când H0 este adevărată

21 şi xx

21 xx

Dacă abaterile standard σ1 şi σ2 sunt cunoscute iar n1 şi n2 arată mărimea celor două eşantioane, ambele mai mari ca 30, atunci:

2

22

1

21

21 nnxx

Dacă abaterile standard nu sunt cunoscute, atunci abaterea standard a diferenţelor mediilor se aproximează prin:

1n

s

1n

2

2

2

1

2

1

2x1x

ˆ

Unde:

s1 şi s2 sunt abaterile standard calculate pe baza primului şi respectiv, celui de al doilea eşantion;

Regula de decizie

Dacă optăm pentru un nivel de semnificaţie α = 0,05 şi pentru un test bilateral, atunci valorile z care vor delimita regiunea de acceptare-respingere a ipotezei nule vor fi –1,96 şi +1,96.

se acceptă H0 dacă valoarea raportului critic se va situa între –1,96 şi +1,96 inclusiv;

se repige H0 dacă RC < -1,96 sau dacă RC > 1,96.

Dacă cele două eşantioane independente sunt de dimensiuni reduse (n1 ≤ 30 , n2 ≤30) se va folosi distribuţia t

Situatia 1: în ipoteza că cele două eşantioane provin de la populaţii repartizate normal

şi în ipoteza că varianţele celor două populaţii sunt egale.

21

21

xxobs

xxt

21

11ˆ

21 nnScxx

2

11

21

22

212

1

nn

nsnsSc

Unde:

În acest caz variabila definită mai sus urmează o repartiţie Student cu:

Raportul critic va fi:

d.f.= n1 + n2 - 2

Regula de decizie va fi:

se respinge ipoteza nulă dacă tobs > tα; df din tabelul distribuţiei t;

se acceptă ipoteza nulă dacă tobs ≤ tα; df

Situatia 2: Dacă cele două populaţii au varianţe diferite În acest caz abaterea standard a diferenţelor mediilor se va aproxima:

2

22

1

21

2x1x n

s

n

ˆ

1n

r1

1n

r

1

2

2

1

2

2

22

1

21

1

21

n

s

n

s

n

s

r

d.f.=

Numărul gradelor de libertate se va determina astfel:

21

21

xxobs

xxt

Raportul critic va fi:

Abaterea standard a diferenţelor mediilor se va aproxima:

TESTUL z DE COMPARARE A MEDIILOR A DOUĂ EŞANTIOANE INDEPENDENTEexemplu

Din două grupe de studenţi ai aceleiaşi specializări s-au constituit două eşantioane reduse (n1 = 6 şi n2 = 7) studenţii respectivi indicând în ore cât timp alocă fiecare în parte pentru studiul individual într-o săptămână normală de şcoală (nu în preajma sau în timpul sesiunii). Se doreşte a se cunoaşte dacă între studenţii celor două grupe se manifestă diferenţe semnificative în privinţa variabilei cercetate.

Prelucrarea cu SPSS Exemplul 1

Stabilirea ipotezelor

Nivelul de semnificaţie este de 0,05.

H0 : μ1 = μ2

media timpului alocat studiului individual de către studenţii primei grupe este egală cu cea a studenţilor din a doua grupă

H1 : μ1 ≠ μ 2

cele două medii nu sunt egale

Datele primare obţinute sunt următoarele (în ore):grupa 1 : 7; 9; 6; 11; 5; 8.grupa 2 : 10; 8; 7; 6; 9; 12; 9.

Se constată că media săptămânală a timpului individual de studiu este 7,7 ore la prima grupă şi 8,7 ore la a doua grupă.

Testul F ne indică faptul că varianţele la nivelul celor două grupe sunt egale deoarece nivelul de semnificaţie indicat (0,767) este mai mare decât nivelul de semnificaţie avut în vedere (0,05) şi, ca urmare, trebuie să acceptăm ipoteza nulă a varianţelor egale. În acest context testul t va avea valabilitate.

valorile t calculat sunt: –0,913 în condiţiile în care se presupune existenţa

varianţelor egale şi –0,906 în condiţiile în care se presupune inegalitatea

varianţelor.

Valoarea critică a lui t la nivelul de semnificaţie de 0,05 şi la 11 grade de libertate este ± 2,201

O alta posibilitate de a lua deciza

0,381, este mai mare decât nivelul de semificaţie α = 0,05, atunci se acceptă ipoteza nulă.

Dacă este mai mic, ipoteza nulă se respinge.

Prelucrarea cu SPSS Exemplu

Există diferenţe între bărbaţi şi femei în ceea ce priveşte aprecierea modului in care in prezent se realizeaza curatenia în oraş?

ipotezele sunt: H0 : μ1 = μ2 H1 : μ1 ≠ μ 2

SPSS-ul realizează totdeauna testul T (Student)

Sig.(2-tailed) mai mic decât 0.05, se respinge H0 si se accepta H1.

Exista diferente semnificative intre apreciarile facute de femei si barbati.

Testarea diferenţelor dintre medii în cazul eşantioanelor perechi.

Realizarea testului presupune:1. formularea ipotezei nule care arată

inexistenţa unei diferenţe între medii înainte de un anumit eveniment şi cele obţinute după :

H0 : µ1 = μ2 H1 : μ 1 ≠ μ2 ;

2. stabilirea diferenţei di dintre cele două scoruri corespunzătoare fiecărui cuplu de observări din cele n existente;

3. calculul mediei şi a dispersiei diferenţelor:

4. determinarea abaterii standard a

diferenţelor, sd , ca radical din dispersie;

n

dd

n

ii

1

1

1

2

2

n

dds

n

ii

d

calculul raportului critic pe baza relaţiei:

n

sd

n

sd

RCdd

21

deoarece μ1 - μ2 = 0 când H0 este adevărată

stabilirea regulii de decizie privind ipoteza nulă:

se acceptă ipoteza nulă dacă valoarea raportului critic determinată în contextul distribuţiei z sau t este mai mică decât valoarea teoretică din tabelul distribuţiei respective;

se respinge ipoteza nulă dacă valoarea RC este mai mare.

Exemplu:

In cazul unei firme se organizează un curs de perfecţionare pentru un număr de 16 persoane. Persoanele sunt supuse unui test înainte şi după curs. Rezultatele sunt următoarele:

n

dd

n

ii

1

1

1

2

2

n

dds

n

ii

d =234/15=15,6

sd=3,95

n

sd

n

sd

RCdd

21 =-2/3.95/4=-2,025

Tc=-2,131

RC>=Tc, se acceptă ipoteza nulă, diferenţa dintre scoruri este întâmplătoare

Prelucrarea cu SPSS

Sig. >0,05

se acceptă ipoteza nulă, diferenţa dintre scoruri este întâmplătoare

Testarea diferenţelor dintre două procente

a)stabilirea ipotezei nule şi a uneia din ipotezele alternative posibile:

H0 : 1 = 2

H1 : 1 ≠ 2

H1 : 1 > 2

H1 : 1 < 2

determinarea raportului critic:

2121

212121

pppp

ppppRC

unde: p1 = procentul din eşantionul grupului 1

p2 = procentul din eşantionul grupului 2

π1-π2 = procentul presupus al populaţiei 1 minus procentul presupus al

populaţiei 2

21 pp = abaterea standard a diferenţelor dintre procente

21

2121

11ˆ

nnqpSσ

pppp

Pentru a calcula estimatorul comun se foloseşte relaţia:

21

2211

nn

pnpnp

Regula de decizie: dacă se merge pe un test bilateral, în

condiţiile distribuţiei z, ipoteza nulă se va accepta dacă valoarea raportului critic se va încadra între limita pozitivă şi cea negativă a valorilor teoretice ale lui z în funcţie de nivelul de semnificaţie ales. Ipoteza nulă se va respinge dacă valoarea raportului critic va fi mai mică decât limita negativă sau mai mare decât limita pozitivă a valorilor critice z.

Exemplu

top related