introducere in spss - versiunea 19

164
UNIVERSITATEA “ANDREI ŞAGUNA” CONSTANŢA INTRODUCERE IN SPSS versiunea 19

Upload: iuliansever

Post on 02-Jan-2016

189 views

Category:

Documents


2 download

DESCRIPTION

Manual SPSS

TRANSCRIPT

Page 1: Introducere in Spss - Versiunea 19

UNIVERSITATEA “ANDREI ŞAGUNA” CONSTANŢA

INTRODUCERE IN SPSS versiunea 19

Page 2: Introducere in Spss - Versiunea 19

CUPRINS

INTRODUCERE........................................................................................................................5I. Noţiuni de bază despre introducerea.....................................................................................6şi analiza statistică folosind SPSS...............................................................................................6

I.2. Introducerea datelor..........................................................................................................7I.3. Salvarea datelor................................................................................................................8I.4. Folosirea „Variabilei View” pentru crearea şi etichetarea variabilelor............................8I.5. Exemplu de calcul statistic.............................................................................................11I.6. Concepte statistice esenţiale în analizele cu ajutorul SPSS-ului....................................12I.7. Alegeţi răspunsul corect.................................................................................................14I.8. Răspunsuri corecte..........................................................................................................16

II. Descrierea variabilelor.........................................................................................................17Tabele şi diagrame....................................................................................................................17

II.1. Frecvenţa procentuală...................................................................................................17II.2. Diagrama circulară pentru date categoriale...................................................................19II.3. Adăugarea etichetelor unei diagrame circulare.............................................................20II.4. Diagrama cu bare pentru date categoriale.....................................................................21II.5. Histograme....................................................................................................................23II.6. Exerciţii.........................................................................................................................25II.7. Alegeţi răspunsul corect................................................................................................26II.8. Răspunsuri corecte........................................................................................................28

III. Descrierea numerică a variabilelor.....................................................................................29- Medie, variaţie şi dispersie –..................................................................................................29

III.1. Introducerea datelor şi efectuarea analizei...................................................................29III.2. Interpretarea output-ului..............................................................................................30III.3. Alte caracteristici.........................................................................................................31III.4. Alegeţi răspunsul corect...............................................................................................32III.5. Răspunsuri corecte.......................................................................................................33

IV. Forme ale distribuţiei scorurilorIV. Forme ale distribuţiei scorurilor.........................................................................................34IV.1. Introducerea datelor.....................................................................................................35IV.2. Interpretarea Output-ului.............................................................................................36IV.3. Histograme...................................................................................................................36IV.4. Interpretarea output-ului..............................................................................................37IV.5. Modalitatea..................................................................................................................37IV.6. Simetria........................................................................................................................38IV.7. Boltirea (excesul).........................................................................................................40IV.8. Alegeţi răspunsul corect..............................................................................................43IV.9. Răspunsuri corecte.......................................................................................................44

V. Abaterea standard.................................................................................................................46V.1. Introducerea datelor......................................................................................................46V. 2. Interpretarea output-ului..............................................................................................47V.3. Scorurile Z.....................................................................................................................48V.4. Raportarea output-ului..................................................................................................48V.5. Alte caracteristici..........................................................................................................49V.6. Alegeţi răspunsul corect................................................................................................50V.7. Răspunsuri corecte........................................................................................................51

VI. Relaţiile dintre două sau mai multe variabile.....................................................................52Diagrame şi tabele.....................................................................................................................52

VI.1. Introducerea datelor.....................................................................................................52

2

Page 3: Introducere in Spss - Versiunea 19

VI.2. Ponderea datelor..........................................................................................................53VII. Coeficienţi de corelaţie......................................................................................................55Coeficienţi de corelaţie Pearson şi Spearman...........................................................................55

VII.1. Introducerea datelor....................................................................................................56VII.2. Corelaţia Pearson........................................................................................................56VII.3. Interpretarea output-ului.............................................................................................57VII.4. Raportarea output-ului................................................................................................57VII.5. Coeficientul de corelaţie Spearman............................................................................58VII.6. Interpretarea output-ului.............................................................................................58VII.7. Raportarea output-ului................................................................................................58VII.8. Diagrama scatter.........................................................................................................59VII.9. Interpretarea output-ului.............................................................................................60VII.10. Raportarea output-ului..............................................................................................60VII.11. Alegeţi răspunsul corect...........................................................................................61VII.12. Răspunsuri corecte...................................................................................................63

VIII. Regresia............................................................................................................................64Predicţia cu precizie..................................................................................................................64

VIII.1. Introducerea datelor..................................................................................................64VIII.2. Regresia simplă.........................................................................................................65VIII.3. Interpretarea output-ului...........................................................................................66VIII.4. Scatterplot-ul de regresie..........................................................................................66VIII.5. Interpretarea output-ului...........................................................................................67VIIII.6. Raportarea output-ului.............................................................................................68

IX. Eroarea standard.................................................................................................................69IX. 1. Introducerea datelor....................................................................................................69IX. 2. Eroarea standard estimată a mediei............................................................................69IX. 3. Interpretarea output-ului.............................................................................................70

X. Testul t..................................................................................................................................71Compararea a două eşantioane..................................................................................................71de scopuri corelate/relaţionate..................................................................................................71

X.1. Introducerea datelor......................................................................................................72X.2. Testul t pentru eşantioane perechi.................................................................................72X.3. Interpretarea output-ului...............................................................................................73X.4. Raportarea output-ului..................................................................................................73

XI. Testul t................................................................................................................................74Compararea a două eşantioane de.............................................................................................74scoruri necorelate/nerelaţionate................................................................................................74

XI.1. Introducerea datelor.....................................................................................................75XI.2. Efectuarea Testului t pentru eşantioane independente.................................................76XI.3. Interpretarea output-ului..............................................................................................77XI.4. Raportarea output-ului.................................................................................................78XI.5. Alegeţi răspunsul corect..............................................................................................78XI.6. Răspunsuri corecte.......................................................................................................80

XII. Testul Chi-Square..............................................................................................................81Diferenţe între frecvenţele eşantioanelor..................................................................................81

XII.1. Introducerea datelor din tabelul anterior....................................................................81folosind procedura „Weighing cases”...................................................................................81XII.2. Introducerea datelor din tabelul 1 caz cu caz.............................................................82XII.4. Interpretarea output-ului pentru Testul chi-square.....................................................84XII.5. Raportarea output-ului pentru Testul chi-square........................................................85

XIII. Recodificarea variabilelor................................................................................................87XIII.1. Recodificarea rezultatelor.........................................................................................87

3

Page 4: Introducere in Spss - Versiunea 19

XIII.2. Alegeţi răspunsul corect............................................................................................90XIII.3. Răspunsuri corecte....................................................................................................91

XIV. Calculul variabilelor noi..................................................................................................92XIV.1. Procedura unei variabile noi.....................................................................................93

XV. Testele rangurilor..............................................................................................................94Statistici nonparametrice...........................................................................................................94

XV.1. Scoruri relaţionate: testul semnului............................................................................95XV.2. Interpretarea output-ului pentru testul semnului........................................................95XV.3. Raportarea output-ului pentru testul semnului...........................................................96XV.4. Scoruri relaţionate: testul Wilcoxon...........................................................................96XV.6. Raportarea output-ului pentru Testul Wilcoxon........................................................97XV.7. Scoruri nerelaţionate: Testul U Mann-Whitney.........................................................97XV.8. Interpretarea output-ului pentru testul U Mann-Whitney..........................................99XV.9 Raportarea output-ului pentru Testul U Mann-Whitney.............................................99

XVI. Analiza de varianţă (ANOVA)......................................................................................100Introducere în metoda one-way ANOVA...............................................................................100cu scoruri nerelaţionate sau necorelate................................................................................100

XVI.1. Metoda one-way ANOVA pentru eşantioane independente...................................101XVI.2. Interpretarea output-ului.........................................................................................102XVI.3. Raportarea ouput-ului.............................................................................................103

XVII. Analiza de varianţă bifactorială pentru.........................................................................104scoruri nerelaţionate/necorelate.............................................................................................104

XVII.1. Metoda two-way ANOVA pentru scoruri nerelaţionate.......................................105XVII.2. Interpretarea output-ului........................................................................................106XVII.3. Raportarea output-ului...........................................................................................108

XVIII. Comparaţii multiple cu ANOVA................................................................................109XVIII.1. Interpretarea output-ului.......................................................................................110XVIII.2. Raportarea output-ului.........................................................................................112XIII.2. Alegeţi răspunsul corect..........................................................................................113XIII.3. Răspunsuri corecte..................................................................................................114

BIBLIOGRAFIE.....................................................................................................................115

4

Page 5: Introducere in Spss - Versiunea 19

INTRODUCERE_________________________________________________________________________________________________________________

Aplicaţia SPSS („Statistical Package for the Social Sciences” – „pachet

de programe statistice aplicate ştiinţelor sociale”) a fost elaborată în anul 1965

de către Universitatea Stanford din California.

 Programul SPSS (Statistical Package for the Social Sciences) este

unul dintre cele mai utilizate în analiza statistică a datelor şi a evoluat până la

versiunea 16, aria de aplicabilitate extinzându-se de la versiune la versiune,

odată cu modul de operare şi cu facilităţile oferite. Programul este utilizat în

foarte multe domenii: în marketing, cercetare experimentală, educaţie, sănătate

etc. În afară de analizele statistice posibile, programul are componente puternice

pentru managementul datelor (selectare, reconfigurare, creare de date noi) şi

pentru documentarea datelor (există un dicţionar metadata, care reţine

caracteristici ale datelor). Se mai poate adăuga flexibilitatea privind tipurile de

date acceptate ca şi modul de construire a rapoartelor.

Această carte prezintă un mod de abordare a analizei statistice folosind

SPSS for Windows şi este destinată studenţilor care doresc să analizeze date din

psihologie, sociologie, criminologie, sau date similare. Cartea se doreşte a fi un

îndrumător pentru analiza datelor, fiind o carte completă, de sine stătătoare care

satisface nevoile studenţilor la toate nivelele.

Manualul este structurat pe XVII capitole, oferind astfel posibilitatea

parcurgerii pas cu pas a informaţiilor prezentate dar şi o privire de ansamblu

asupra procedurilor de calcul din SPSS.

5

Page 6: Introducere in Spss - Versiunea 19

I. Noţiuni de bază despre introducerea şi analiza statistică folosind SPSS__________________________________________________________________________________________________________________________________________________________________________________________________________________________________

I.1. Accesarea SPSS-ului.

SPSS-ul for Windows este accesat în general prin folosirea butoanelor şi

meniurilor folosind pentru aceasta clicuri ale mouse-ului. Astfel, cea mai rapidă

modalitate de învăţare este de a urma paşii prezentaţi şi capturile de ecran.

Pasul 1: Se dă dublu clic pe imagine– dacă imaginea nu apare pe ecran atunci accesaţi „Start”→Programe→IBM SPSS Statistic 19.

Pasul 2:

Această fereastră va apărea după câteva momente şi se pot alege oricare dintre opţiunile din fereastră.

(Fereastra se numeşte „Data Editor”.Fereastra de editare (Data Editor) se deschide implicit la lansarea SPSS şi este folosită pentru introducerea, modificarea sau ştergereadatelor în format spreadsheet. Într-o fereastră de editare poate fi prezentat conţinutul unui fişier de date care a fost selectat dintr-o listă de fişiere creat anterior (în SPSS, Excel, Statistica etc.) sau poate fi creată o nouă foaie de lucru. Această fereastră recunoaşte fişierele de date care au extensia implicită .sav.În fereastra Data Editor sunt afişate datele de lucru. Acestea sunt aranjate în format tabel (spreadsheet), care conţine coloane şi linii. La intersecţia acestora sunt celulele (casetele, căsuţele) în care se introduc datele. La un moment dat este activă (curentă) o singură celulă, cea în care este plasat cursorul. Celula curentă este scoasă în evidenţă printr-un chenar îngroşat. Trecerea de la o celulă la alta se realizează prin clic de mouse în noua celulă sau de la tastatură cu ajutorul tastelor de control (taste săgeţi, Page Up, Page Down).

6

Page 7: Introducere in Spss - Versiunea 19

I.2. Introducerea datelor.

Pasul 3:Aceasta este fereastra Data Editor a SPSS-ului şi este un spaţiu de lucru

cu linii şi coloane în care pot fi introduse datele.

Coloanele sunt folosite pentru a desemna diferite variabile.

Liniile sunt cazurile sau indivizii despre care se deţin date.

Pasul 4:

Pentru a introduce date in SPSSse selectează una dintre celule şi se dăclic pe celula respectivă.

* În SPSS există întotdeauna o singură celulă selectată.

Pasul 5:

Se introduce un număr folosind tastatura calculatorului. La apăsarea tastei „Enter”sau la selectarea cu mouse-ul a unei alte celule numărul va fi introdus în foaia de lucru la fel cum este arătat în figură. Valoarea 5 este înregistrarea pentru primul rând (primul caz) al variabilei VAR00001.

Se observă că această variabilă a primit automat un nume standard. Pentru a efectua schimbarea se dă clic pe numele variabilei.

7

Page 8: Introducere in Spss - Versiunea 19

Pasul 6:

Corectarea erorilor se face folosind mouse-ul: se selectează celula unde este eroarea şi se introduce valoarea corectă.Atunci când este apăsată tasta „Enter” sau se deplasează cursorul pe o altă celulă, valoarea corectată va fi introdusă.

I.3. Salvarea datelor.

Pasul 7:Selectând „File”→ „Save As” datele se vor salva sub forma unui fişier. Fişierul salvat va primi automat de la SPSS extensia „.sav”. * Se recomandă folosirea unor nume de fişiere distincte (ex. date1) pentru a face conţinutul lor cât mai clar. Salvarea datelor este recomandat să se facă într-un fişier diferit de cel al SPSS-ului.

Pasul 8: Pentru a alege locaţia unde va fi salvat fişierul de date, se alege calea în mediul „Save In” (se foloseşte săgeata pentru a ajunge la locaţia dorită).Salvarea unui fişier se realizează prin pictograma Save din bara de instrumente Standard sau cu ajutorul comenzilor Save sau Save As şi meniul File. Aceste comenzi deschid fereastra Save Data As în care se pot stabili: numele fişierului (File name); tipul fişierului (Save as type); locaţia în care să aibă loc salvarea (Save In).

I.4. Folosirea „Variabilei View” pentru crearea şi etichetarea variabilelor

Pasul 9:Apăsarea meniului „Variable View”, situat în josul paginii, schimbă fereastra „Data View”(spaţiul de lucru pentru introducerea datelor) în altă fereastră încare pot fi introduse informaţii despre variabilele create.

8

Page 9: Introducere in Spss - Versiunea 19

Pasul 10: Acesta este spaţiul de lucru „Variable View”. În acest caz, o variabilă este

deja înscrisă fiind introdusă la pasul 8. Variabila poate fi redenumită şi pot fi adăugate alte variabile selectând celula corespunzătoare şi tastând numele variabilei.

Aici se modifică Aici se modifică lăţimea coloanei. numărul de zecimale.

Pasul 11:La versiunea SPSS 19 nu existălimită pentru lungimea numărului unei variabile.Se selectează o celulă din coloana „Name” şi se scrie un nume diferit de variabilă. Celelalte variabile vor primi valori care vor fi implicit

9

Page 10: Introducere in Spss - Versiunea 19

schimbate ulterior.

Acesta este numărul de zecimale care va apărea pe ecran.

*La editarea unei variabile trebuie să se ţină cont de următoarele restricţii: numele variabilei să fie unic, primul caracter să fie o literă, sa nu conţină simboluri speciale folosite în SPSS sau spaţii.

Pasul 12:Apare acest buton: se dă clic pe el.

Pasul 13:

Va apărea această fereastră. În continuare se vor urmări paşii care vor arăta cum genul biologic „masculin” şi „feminin” este introdus folosind codul „1” (masculin) respectiv „2” (feminin).

Pasul 14:

Se scrie „1” în dreptul câmpului „value” şi „masculin” în dreptul câmpului „value Label”.

Apoi se apasă „Add”.

10

Page 11: Introducere in Spss - Versiunea 19

Pasul 15:

Aceasta operaţie de adăugare transferă informaţia în câmpul aflat dedesubt.* La fel se procedează şi pentru introducerea celeilalte variabile (Ex. 2 - feminin).

* Cele mai frecvent utilizate ferestre in SPSS sunt „data Editor”, „Syntax Editor” şi „Output Viewer”, „Pivot Table (Pivot Table Editor)”, “Chart Editor”. Fereastra de sintaxă (Syntax Editor) este folosită pentru a genera programe de comenzi pe care le vom executa asupra datelor (exemplu: calculul unor noi variabile). Opţiunile selectate în casetele de dialog sunt afişate în fereastra de sintaxă sub formă de comenzi. Aceste ferestre îi sunt specifice fişierele de tip .sps. Fereastra de rezultate (Output Viewer) devine disponibilă automat după ce a fost efectuată o comandă de analiză a datelor. În această fereastră, sunt afişate rezultatele statistice, tabele şi grafice care au asociate ferestre distincte. Fereastra de editare a rezultatelor (Text Output Editor) este folosită pentru modificarea textului rezultat, care nu a fost afişat în tabele pivot.* Fereastra de rezultate (Output Viewer) devine disponibilă automat după ce a fost efectuată o comandă de analiză a datelor. În această fereastră, sunt afişate rezultatele statistice, tabele şi grafice care au asociate ferestre distincte. Fereastra de editare a rezultatelor (Text Output Editor) este folosită pentru modificarea textului rezultat, care nu a fost afişat în tabele pivot. Toate rezultatele obţinute din analizele statistice sunt afişate în fereastra Output Viewer. Această fereastră se aseamănă cu fereastra Windows Explorer şi se deschide doar dacă s-au lansat comenzi din meniurile Statistics sau Graphs.Fereastra Output Wiewer este structurată în două cadre/zone. Cadrul din stânga (cuprinsul/structura) prezintă, sub forma unei schiţe, obiectele conţinute în fereastră. Elementele din schiţă se referă la titlu, note şi denumirea rezultatelor statistice propriu-zise. Fereastra Pivot Table (Pivot Table Editor) oferă multiple posibilităţi de modificare a tabelelor pivot: editare text, schimbarea datelor din rânduri şi coloane, adăugarea de culori, crearea unor tabele multidimensionale, ascunderea sau afişarea selectivă a rezultatelor. Fereastra de editare a graficelor (Chart Editor) permite modificarea elementelor unui grafic (axe, scale, diagramă, legendă etc.)

I.5. Exemplu de calcul statistic.

Pasul 16:Pentru a calcula media de vârstă se urmăresc următoarele

11

Page 12: Introducere in Spss - Versiunea 19

etape:-se dă clic pe „Analyze”;-Se selectează „Descriptive statistics”;

-Se selectează „Descriptive…”

Pasul 17:

Se selectează „atenţie”. Se apasă butonul ► pentru a muta „atentie” în căsuţa „Variable(s)” cu ajutorul săgeţii.Se dă clic pe „OK”.

Pasul 18: Fereastra „Data Editor” este înlocuită de output-ul SPSS-ului. Acest tabel

apare pentru analiza realizată anterior.

Media scorului pentru atenţie este încercuită.

*Ferestrele în SPSS reprezintă zone de pe ecran tratate ca elemente de sine stătătoare,

cu caracteristici proprii, care determină acţiunile ce se pot executa în cadrul lor.

I.6. Concepte statistice esenţiale în analizele cu ajutorul SPSS-ului.

Elementele de statistică sunt foarte simple dar apar probleme la

asamblarea elementelor, abilităţile matematice având un mic rol în analiza

statistică a datelor.

Conceptele de bază pe care cercetătorii trebuie să le înţeleagă înainte de a

trece la analizele SPSS sunt:

Variabila.

12

Page 13: Introducere in Spss - Versiunea 19

Definiţie: O variabilă este orice concept care poate fi măsurat şi care

variază de la un studiu la altul.

Tipurile de variabile.

Variabilele pot fi clasificate ca fiind de două tipuri:

Scoruri: Vorbim despre scoruri atunci când o valoarea numerică este atribuită

unei variabile, pentru fiecare caz în parte din eşantion. Această valoare indică

cantitatea sau valoarea caracteristicii (variabilei) în cauză.

Exemplul. Vârsta, înălţimea, greutatea sunt variabile numerice deoarece

valoarea – scor indică o cantitate în creştere a variabilei respective.

Variabile nominale sau categoriale: Sunt variabile care se măsoară

clasificând cazurile în unul sau mai multe categorii.

Exemplul 1: Genul biologic are două categorii: masculin şi feminin

*Este foarte important să se hotărască pentru fiecare variabilă în parte dacă este variabilă nominală (categorială) sau variabilă cantitativă.

Definirea atributelor unei variabile este prima operaţie din procesul de pregătire a setului de date. Definirea presupune precizarea atributelor unei variabile: numele variabilei, tipul, lungimea (numărul de caractere), numărul de zecimale (pentru cele numerice), eticheta, valorile etichetei, valorile lipsă, alinierea şi modalităţile de măsurare a variabilei. Variabilele se definesc în coloanele foii Variabile View din fereastra Data Editor.Tipul variabilei – variabilele pot fi de mai multe tipuri: numerice (Numeric, Coma, Dot, Scientific notation), alfanumerice (String), date calendaristice, simbol monetar.

13

Page 14: Introducere in Spss - Versiunea 19

I.7. Alegeţi răspunsul corect

1. Fereastra de editare (Data Editor):a. se deschide implicit la lansarea SPSS;b. este folosită pentru introducerea, modificarea sau ştergerea datelor în

format spreadsheet;c. este folosită pentru a genera programe de comenzi pe care le vom

executa asupra datelor;d. este folosită pentru modificarea textului rezultat, care nu a fost afişat în

tabele pivot;

2. Fereastra de rezultate (Output Viewer):a. afişează rezultatele statistice, tabele şi grafice care au asociate ferestre

distincte;b. permite modificarea elementelor unui grafic (axe, scale, diagramă,

legendă etc.);c. este folosită pentru a genera programe de comenzi pe care le vom

executa asupra datelor.

3. Ferestrele în SPSS reprezintă:

14

Page 15: Introducere in Spss - Versiunea 19

a. zone de pe ecran tratate ca elemente de sine stătătoare, cu caracteristici proprii, care determină acţiunile ce se pot executa în cadrul lor;

b. elemente constitutive ale programului SPSS;c. elemente prin care i se conferă utilizatorului posibilitatea selectării unei

anumite opţiuni.

4. Care sunt cele mai frecvent utilizate ferestre în SPSSa. data editor;b. output editor;c. syntax editor;d. syntax viewer;e. output viewer.

5. În SPSS fereastra SPSS Output Viewer este utilizată pentru:a. afişarea rezultatelor;b. editarea de date;c. editarea de date şi tabele;

6. La editarea unei variabile trebuie să se ţină cont de următoarele restricţii:

a. să conţină spaţii sau simboluri folosite în SPSS;b. să conţină numai litere;c. să aibă cel puţin 8 caractere;d. primul caracter trebuie să fie o cifră;e. să fie unic.

7. Numele variabilei trebuie să ţină cont de câteva restricţii:a. să aibă cel mult 6 caractere;b. se poate repeta;c. primul caracter să fie literă;d. poate să conţină simboluri speciale folosite în SPSS sau spaţii.

8. Pentru a introduce date în SPSS se selectează:a. o celulă dând clic pe celula respectivă;b. meniul data, split file;c. meniul transform, compute.

9. Prin apăsarea butonului “Variable View”:a. se schimbă fereastra “Data View”;b. apare fereastra output;c. se poate introduce o variabilă diferită.

10. Care dintre următoarele afirmaţii este adevărată?

15

Page 16: Introducere in Spss - Versiunea 19

a. indicatorul “medie” reprezintă media aritmetică a unui scor şi se obţine prin însumarea valorilor şi înmulţirea cu numărul de valori;

b. modul este valoarea cu cea mai mare frecvenţă si este frecvenţa cu care apare cel mai frecvent scor;

c. mediana este valoarea din centrul distribuţiei, dacă variabilele numerice sunt ordonate după mărime, de la cea mai mică la cea mai mare.

11. Pentru a calcula media aritmetică alegema. SE Mean;b. Median;c. Mean;d. Rouge.

I.8. Răspunsuri corecte

1. a. se deschide implicit la lansarea SPSS;

2. a. afişează rezultatele statistice, tabele şi grafice care au asociate

ferestre distincte;

3. a. zone de pe ecran tratate ca elemente de sine stătătoare, cu

caracteristici proprii, care determină acţiunile ce se pot executa în

cadrul lor ;

4. a. data editor;

c. syntax editor;

e. output viewer;

5. a. afişarea rezultatelor;

6. e. să fie unic;

7. c. primul caracter să fie literă;

16

Page 17: Introducere in Spss - Versiunea 19

8. a. o celulă dând clic pe celula respectivă;

9. a. se schimbă fereastra “Data View”;

10. c. mediana este valoarea din centrul distribuţiei, dacă variabilele

numerice sunt ordonate după mărime, de la cea mai mică la cea mai

mare;

11. c. mean.

II. Descrierea variabilelor. Tabele şi diagrame.________________________________________________________

II.1. Frecvenţa procentuală.

Pentru realizarea unui tabel de frecvenţă este necesară o coloană căreia i

se va da un nume.

Pasul 1:

Se defineşte variabila.

Se etichetează valorile variabilei.

Valorile pentru specializare se definesc aşa cum este descris în paşii 13-15 din

17

Page 18: Introducere in Spss - Versiunea 19

capitolul I.

Pasul 2:

Se selectează: „Analize”, „Descriptive Statistics”„Frequencies…”

Pasul 3:

Se selectează specializare şi se mută în partea dreaptă a tabelului (procedeul a fost descris la pasul 17 din capitolul I).

Se apasă „OK”

Pasul 4:

1. Prima coloană a tabelului conţine eticheta celor 4 categorii de specializări.

18

Page 19: Introducere in Spss - Versiunea 19

2. A doua şi a treia coloană afişează Frecvenţa absolută şi relativă pentru 3. A patra coloană afişează

10 specializări.

4. A cincea coloană adună procentele în josul tabelului. (reprezintă frecvenţa relativă cumulată ascendent).

În ceea ce priveşte raportarea rezultatelor se prezintă numai etichetele categoriale, frecvenţele şi frecvenţele procentuale.

II.2. Diagrama circulară pentru date categoriale.

Pasul 1:

Se selectează:„Graphs”„Legacy dialogs”

19

Page 20: Introducere in Spss - Versiunea 19

„Pie”.

20

Page 21: Introducere in Spss - Versiunea 19

Pasul 2:

Se selectează „Define”.

Pasul 3:

Se selectează „specializarea” şi se transferă prin apăsarea butonului ►(◄) în rubrica „define slices by”.Se apasă „OK”.

Diagrama Pie este un cerc divizat în sectoare. Fiecare sector de cerc reprezintă o categorie, aria acestuia fiind proporţională cu numărul de cazuri din această categorie a variabilei nominale.

21

Page 22: Introducere in Spss - Versiunea 19

Pasul 4:

Acesta este felul în care apare o diagramă circulară folosind opţiunile din SPSS. Sectoarele din cerc sunt codate cu diferite culori.

* Caracteristicile din această diagramă pot fi modificate cu „Chart Editor”.

II.3. Adăugarea etichetelor unei diagrame circulare

Pasul 1:

Se dă dublu clic oriunde în dreptunghiul care conţine diagrama, pentru a selecta „Chart Editor”.

Se selectează:„Elements” „Show Data Labels”.

* Diagrama de structură „pie” este folosită pentru reprezentarea frecvenţelor absolute (numere) şi/sau relative (procente) pe categorii/grupe.

Pasul 2:Se selectează „Count” şi „X”-ul roşu pentru a nu afişa.

Se selectează „specializare” şi săgeata Verde curbată în sus pentru a afişa denumirile specializărilor.

Se procedează asemănător pentru „Procent” pentru a afişa procentajul fiecărei specializări în parte.

Se selectează „Apply” şi „Close”.

22

Page 23: Introducere in Spss - Versiunea 19

Pasul 3:

Pentru a înlătura legenda, se selectează „Options” şi „Hide Legend”.

Diagrama circulară cu sectoarele denumite şi frecvenţă procentuală afişată.

II.4. Diagrama cu bare pentru date categoriale.

Pasul 1:

Se selectează: „Graphs”„Legacy dialogs”

23

Page 24: Introducere in Spss - Versiunea 19

„Bar…”.

Pasul 2:

Selectaţi „Define”.„Simple” este preselectat.

*Selectare unei alte variante se face prin clic cu mouse-ul pe varianta respectivă.

Pasul 3:

Se selectează ocupaţia şi se apasă butonul ► de lângă „Category Axis” pentru a introduce acolo specializarea.

Se selectează „% of cases”.

Se apasă „OK”

24

Page 25: Introducere in Spss - Versiunea 19

Diagrama cu bare.

* Diagrama cu bare este folosită pentru a reprezenta grafic mediile diferitelor grupe dintr-o colectivitate (Summaries for groups of cases) sau valorile medii ale diferitelor variabile pentru aceeaşi colectivitate (Summaries of separate variables).Diagrama Bar este folosită pentru a ilustra categoriile unei distribuţii în formă convenabilă. Diagrama prezintă atâtea bare câte categorii are o variabilă. Barele au aceeaşi bază, egală cu unitatea, iar înălţimea proporţională cu frecvenţa categoriei astfel încât aria fiecărei bare reprezintă numărul cazurilor categoriei considerate.Pentru a fi interpretat un grafic trebuie să conţină următoarele elementele:- titlul graficului – oferă informaţii asupra fenomenului reprezentat (Titlul graficului

coincide cu titlul tabelului de date);- axele de coordonate sunt folosite pentru a reprezenta variabilele. Pe abscisă se

înscrie variabila de distribuţie, iar pe ordonată frecvenţa.- legenda – este folosită pentru a explica elementele din diagramă;- sursa – precizează originea datelor reprezentate.

II.5. Histograme.

Pentru a ilustra procesul de realizare a unei histograme vom folosi datele

obţinute din răspunsurile subiecţilor la întrebarea „Vă place statistica?”.

(răspunsuri: a. foarte mult; b. mult; c. puţin d. foarte puţin; e. deloc).

Pasul 1:

Se introduc datele în „Data Editor” (aşa cum a fost prezentat la începutul capitolului).

Se selectează: „Graphs”„Legacy Dialog”„Hitogram”

25

Page 26: Introducere in Spss - Versiunea 19

Pasul 2:Se selectează întrebarea „Vă place statistica?” şi se apasă butonul ►de lângă „Variable” pentru a duce întrebarea în căsuţa din dreapta.Se apasă „OK”.

Histograma

* Pentru a schimba denumirile axelor se dă clic pe ele şi se editează.* Histograma este folosită pentru a arăta forma unei distribuţii după o variabilă înregistrată asupra unei colectivităţi (frecvenţa de apariţie pentru diferite clase de valori ale variabilei observate).

Alte tipuri de grafice:Line – diagrama liniară este folosită pentru a reprezenta de regulă valori medii.Boxplot – diagrama „cutia cu mustăţi” este folosită pentru a prezenta amplitudinea, intervalul intercuartilic şi mediana unei distribuţii.Error Bar – diagrama „bara erorilor” este folosită pentru a arăta media şi intervalul de variabile.Scatter – diagrama „norul de puncte” este folosită pentru a reprezenta relaţiile dintre încredere de 95% pentru media respectivă.

26

Page 27: Introducere in Spss - Versiunea 19

II.6. Exerciţii

1. La o cercetare „percepţia socială asupra consumului de droguri” participă 10 persoane dintre care: 4 studenţi, 2 profesori şi 4 elevi. Aceştia au vârste cuprinse între 15 şi 35 de ani astfel: cei 4 studenţi au 21, 22, 25, 26 ani, elevii au 15, 16, 17, 17 ani şi profesorii au 34 de ani şi 35 de ani. (a se vedea figura 1).

Se cere:

1. să se realizeze un tabel de frecvenţe pentru variabila „subiecţi”;

2. să se realizeze tabel de frecvenţe pentru variabila „vârstă”;

3. să se realizeze diagrama de structură pentru variabila „subiecţi”;

4. să se adauge etichete diagramei;

5. să se realizeze diagrama de bare şi histograma pentru variabila „vârstă”.

6. să se calculeze media pentru variabila „vârstă şi să se interpreteze.

7. să se salveze fişierul creat pe „Desktop” cu denumirea „cercetare”;

27

Page 28: Introducere in Spss - Versiunea 19

II.7. Alegeţi răspunsul corect

1. Care sunt graficele folosite pentru o distribuţie după o variabilă calitativă?a. diagrama Bar si diagrama Pieb. diagrama Boxplotc. Scatter sau Line

2. Diagrama de bare este folosită pentru:a. a reprezenta valori medii;b. a reprezenta frecvenţe absolute (numere) şi/sau relative (procente);c. a reprezenta relaţiile dintre variabile;d. a reprezenta grafic mediile diferitelor grupe dintr-o colectivitate. 3. Diagrama de structură este folosită pentru:a. a reprezenta frecvenţele absolute (numere) şi/sau relative (procente);b. a arăta forma unei distribuţii după variabila înregistrată asupra unei colectivităţi;c. a prezenta amplitudinea şi mediana unei distribuţii;d. a reprezenta relaţia dintre variabile.

4. Histograma este folosită pentru:a. a reprezenta grafic valorile medii ale diferitelor variabile pentru aceeaşi colectivitate;b. a arăta forma unei distribuţii după o variabilă înregistrată asupra unei colectivităţi;c. a reprezenta relaţia dintre variabile;d. a reprezenta intervalul intercuartilic.

5. Pentru o distribuţie după o variabilă cantitativă se folosesc următoarele grafice:a. scatter (norul de puncte) şi histograma;b. pie (diagrama de structută) şi line (diagrama liniară);c. histograma şi curba frecvenţelor;d. bar (diagrama de bare) şi curba frecvenţelor.

28

Page 29: Introducere in Spss - Versiunea 19

6. Media aritmetică se calculează pentru:a. variabile categorialeb. variabile categoriale şi cantitativec. variabile cantitative.

7. Prima coloană a tabelului de frecvenţe conţine:a. etichetele categoriilor introduse;b. procentul de frecvenţă pentru fiecare categorie;c. valorile lipsă.

8. Pentru a realiza o diagramă circulară se selectează:a. analize/ descriptive statistics/descriptives;b. graphs/ pie;c. graphs/ area.

9. Indicatorii tendinţei centrale sunt:a. modul, mediana, abaterea standardb. medie, mod, medianăc. dispersie, abaterea standard

10. Care dintre următoarele afirmaţii este adevărată?a. indicatorul “medie” reprezintă media aritmetică a unui scor şi se obţine prin însumarea valorilor şi înmulţirea cu numărul de valori;b. modul este valoarea cu cea mai mare frecvenţă si este frecvenţa cu care apare cel mai frecvent scor;c. mediana este valoarea din centrul distribuţiei, dacă variabilele numerice sunt ordonate după mărime, de la cea mai mică la cea mai mare.

29

Page 30: Introducere in Spss - Versiunea 19

II.8. Răspunsuri corecte

1. a. diagrama Bar şi diagrama Pie

2. d. a reprezenta grafic mediile diferitelor grupe dintr-o colectivitate.

3. a. a reprezenta frecvenţele absolute (numere) şi/sau relative (procente);

4. b. a arăta forma unei distribuţii după o variabilă înregistrată asupra unei

colectivităţi;

5. c. histograma şi curba frecvenţelor;

6. c. variabile cantitative.

7. a. etichetele categoriilor introduse;

8. b. graphs/ pie;

9. b. medie, mod, mediană

10. c. mediana este valoarea din centrul distribuţiei, dacă variabilele

numerice sunt ordonate după mărime, de la cea mai mică la cea mai mare.

30

Page 31: Introducere in Spss - Versiunea 19

III. Descrierea numerică a variabilelor - Medie, variaţie şi dispersie – _________________________________________________________________________________________________________________

III.1. Introducerea datelor şi efectuarea analizei

Pentru realizarea acestui exemplu am selectat un număr de 0 subiecţi cu vârste

cuprinse între 15-35 ani.

Pasul 1:

În „Variable View” din „Data Editor” se denumeşte prima coloană „Vârstă”. * Se îndepărtează cele 2 zecimale şi se scrie 0.

Pasul 2: Pasul 3:

În “Data View” Se selectează “Analize” → din “Data Editor” “Descriptives statistics” şi se introduc vârstele “Frequencies...”în prima coloană.

31

Page 32: Introducere in Spss - Versiunea 19

Pasul 4:

Se selectează „vârsta” şi butonul ► pentru a introduce în lista de variabile.

Se deselectează butonul „Display frequencys tables” şi se ignoră mesajul de avertizare.

Se dă clic pe „Statistics…”

Pasul 5:

Se selectează „Mean”; „Median”; „Mode”.

Se dă clic pe „Continue”.

Se apasă „OK” din ecranul anterior, care reapare.

III.2. Interpretarea output-ului.

Există 10 cazuri cu date valide pe care se

bazează analiza. Nu sunt date lipsă (0). Media de vârstă, media aritmetică =26,9 ani. Mediana de vârstă (vârsta persoanei

aflate la mijlocul liniei de vârste de la cea mai mică la cea mai mare) este de 28.5 ani. Valoarea mod de vârstă este 34.

Statistics

varsta

N Valid 10

Missing 0

Mean 26,90

Median 28,50

Mode 34

32

Page 33: Introducere in Spss - Versiunea 19

III.3. Alte caracteristici.

În căsuţele de dialog de la pasul 5 se pot observa mai multe valori

statistice adiţionale care pot fi calculate:

1. centilele – indică punctele de separaţie pentru procentajele scorurilor.

Exemplu: Al 90-lea centil este valoarea numerică care separă cele 90%

de valori de dedesubt, din punct de vedere al mărimii.

2. Cvartilele – sunt valorile distribuţiei care indică punctele de separare

pentru cele ai mici 20%, cele mai mici 50% şi cele mai mici 75% dintre scoruri.

3. Suma – indică totalul scorurilor pentru o variabilă.

4. Skewness – Este un indicator de asimetrie sau înclinare a distribuţiei

scorurilor pentru o variabilă. Valoarea este pozitivă dacă valorile sunt asimetrice

spre stânga, sau negativă dacă valorile sunt asimetrice spre dreapta.

5. Kurtosis – este un index care arată cât de ascuţită sau turtită este

distribuţia scorurilor pentru o variabilă, comparativ cu distribuţia normală. Va fi

cu semnul „+” pentru curbe de frecvenţe ascuţite şi cu semnul „-” pentru curbe

de frecvenţe „turtite”.

6. Abaterea standard (estimată) – este o evaluare a măsurii în care

scorurile diferă în medie faţă de media scorurilor pentru o variabilă particulară.

7. Variaţia (estimată) – este o evaluare a măsurii în care scorurile

variază în medie faţă de media scorurilor pentru variabila respectivă.

8. Rang – diferenţa dintre cel mai mare şi cel mai mic scor obţinut

pentru o variabilă.

9. Minim (scor) – valoarea celui mai mic scor al datelor pentru o

variabilă particulară.

10. Maxim (scor) – valoarea celui mai mare scor al datelor pentru o

variabilă particulară.

11. Eroarea standard (ES medie) – valoarea medie cu care mediile

eşantioanelor extrase dintr-o populaţie, diferă faţă de media populaţiei.

33

Page 34: Introducere in Spss - Versiunea 19

III.4. Alegeţi răspunsul corect

1. Cum putem calcula mediana?a. alegând din meniul Transform / Compute;b. statistics / summarize / case summaries / statistics;c. statistics / Compare Means / Means;

2. Pentru a calcula eroarea medie de selecţie alegem:a. Mean;b. Std Deviation;c. S.E. mean;d. Range;

3. Pentru a calcula asimetria alegem una din opţiunile:a. Range;b. Std Deviation;c. Skewness;d. Kurtosis;e. Variance;

4. Într-un calcul statistic, media reprezintă:a. valoarea cu cea mai mare frecvenţă;b. valoarea din centrul distribuţiei;c. media aritmetică a unui set de scoruri, care se obţine prin însumarea valorilor şi împărţirea rezultatului la numărul de valori;d. media aritmetică a unui set de scoruri, care se obţine prin diferenţa valorilor şi împărţirea rezultatului la numărul de valori.

5. Într-un calcul statistic, abaterea standard este:a. valoarea a măsurii în care scorurile diferă în medie faţă de media scorurilor pentru o variabilă particulară;b. diferenţa numerică între cel mai mare şi cel mai mic scor obţinut pentru o variabilă;c. valoarea cu frecvenţa cea mai mare

34

Page 35: Introducere in Spss - Versiunea 19

6. Kurtosis, ca indicator al formei distribuţiei, indică:a. cât de ascuţită sau turtită este distribuţia scorurilor pentru o variabilă, comparativ cu distribuţia normală;b. simetria sau asimetria unei distribuţii de frecvenţe faţă de medie;c. distribuţia scorurilor pentru 2 variabile comparative;

7. Eroarea standard este:a. diferenţa numerică între cel mai mare şi cel mai mic scor obţinut pentru o variabilă;b. valoarea medie cu care mediile eşantioanelor extrase dintr-o populaţie, diferă faţă de media populaţiei;c. diferenţa scorurilor a 2 variabile.

8. Pentru a calcula boltirea alegem:a. Range;b.Variance;c. Skewness;d. Kurtoses.

III.5. Răspunsuri corecte

1. c. statistics / Compare Means / Means;

2. c. S.E. mean;

3. c. Skewness;

4. c. media aritmetică a unui set de scoruri, care se obţine prin însumarea

valorilor şi împărţirea rezultatului la numărul de valori;

5. a. valoarea a măsurii în care scorurile diferă în medie faţă de media

scorurilor pentru o variabilă particulară;

6. a. cât de ascuţită sau turtită este distribuţia scorurilor pentru o variabilă,

comparativ cu distribuţia normală;

7. b. valoarea medie cu care mediile eşantioanelor extrase dintr-o

populaţie, diferă faţă de media populaţiei;

8. d. Kurtoses.

35

Page 36: Introducere in Spss - Versiunea 19

IV. Forme ale distribuţiei scorurilorIV. Forme ale distribuţiei scorurilor_________________________________________________________________________________________________________________

Este foarte important de studiat forma distribuţiilor scorurilor pentru o

variabilă. Este bine ca o distribuţie să fie simetrică şi cu o formă normală (formă

de clopot).

Distribuţia normală, a fost descrisă prima dată de Ch. Fr. Gauss (1777-

1855) şi de aceea distribuţia normală se mai numeşte şi distribuţie gaussiană.

Deoarece la demonstrarea acestui concept a participat şi P.S. Laplace (1749-

1827), în literatura de specialitate se va întâlni şi termenul de distribuţie Gauss-

Laplace.

Pentru ca o distribuţie să fie considerată normală, trebuiesc îndeplinite

simultan următoarele condiţii:

Să fie unimodală – adică să existe un singur modul, o singură categorie

cu frecvenţă maximă;

Să fie simetrică faţă de medie – adică să nu fie deplasată spre stânga

sau spre dreapta;

Să fie normal boltită – adică să nu fie nici ascuţită şi nici „turtită”;

Toţi aceşti termeni se referă la acelaşi lucru, distribuţia normală.

De asemenea, limitele din stânga şi din dreapta ale unei distribuţii

normale tind spre valoarea zero, pe care însă nu o întâlnesc niciodată. O

distribuţie perfect normală are aceeaşi valoare pentru toţi cei trei indicatori ai

tendinţei centrale (media, mediana şi modulul), adică media = mediana =

modulul. În practică, acest lucru se întâlneşte extrem de rar şi, de aceea, ne

punem problema între ce limite putem considera o distribuţie ca fiind normală.

În exemplul următor este elaborat un tabel de frecvenţă şi o histogramă cu

scorurile obţinute la evaluarea coeficientului de inteligenţă pentru 20 de jurişti.

36

Page 37: Introducere in Spss - Versiunea 19

IV.1. Introducerea datelor.

Pasul 1:

În „Variable View” din„Data Editor” se denumeşte prima coloană „Atenţie”.

Se înlătură cele două zecimale.*Datele se salvează ca fişier deoarece vor fi folosite şi la capitolul 9.

Pasul 2:În „Data View” din „Data Editor” se introduc scorurile obţinute la „Atenţie” în prima coloană.

Pasul 3:Se selectează „Analyze”, „Descriptives Statistics” şi Frequencies…”

Pasul 4: Se selectează „atenţie” şi apoi se apasă butonul ►pentru aintroduce în lista de variabile. Se apasă „OK”.

37

Page 38: Introducere in Spss - Versiunea 19

IV.2. Interpretarea Output-ului

Prima coloană arată scorurile obţinute la testul de „atenţie”.

A doua coloană arată frecvenţa acestor valori.Exemplu: este 1 caz în care scorul obţinut are valoarea 56.

A treia coloană exprimă aceste frecvenţe ca un procent al numărului total A patra coloană A cincea coloanăincluzând şi datele care exprimă aceste frecvenţe cumulează aceste lipsesc. ca un procent al numărului procentaje în josulExemplu: Din totalul cazurilor, total excluzând datele lipsă. tabelului.10% au obţinut scorul 56.

IV.3. Histograme.

Histograma este un grafic, folosit în statistica descriptivă şi arată o distribuţie de

frecvenţă. Distribuţia de frecvenţă se referă la numărul de evenimente statistice pe clase

(grupe) de evenimente. Pentru o serie de date statistice cu o distribuţie de frecvenţă după o

variabilă numerică continuă (sau continuă pe porţiuni), reprezentările grafice care ne permit să

vizualizăm distribuţia de frecvenţe sunt histograma şi poligonul frecvenţelor.

Se reiau paşii de la capitolul II.5.

atentieFrequency Percent Valid Percent

Cumulative

Percent

Valid 56 1 10,0 10,0 10,0

57 1 10,0 10,0 20,0

58 2 20,0 20,0 40,0

64 1 10,0 10,0 50,0

65 2 20,0 20,0 70,0

66 1 10,0 10,0 80,0

69 2 20,0 20,0 100,0

Total 10 100,0 100,0

38

Page 39: Introducere in Spss - Versiunea 19

IV.4. Interpretarea output-ului

Axa verticală arată frecvenţa cazurilor de la 0 la 3.

Înălţimea barelor arată cât de frecvent apare fiecare scor la atenţie.

Axa orizontală arată scorurile diferite ale „Atenţiei”.

*Media scorului la atenţie este 62,7.*Abaterea standard este 4,99.*Numărul cazurilor este 10.

IV.5. Modalitatea.

O distribuţie normală (figura 1) este o distribuţie unimodală, adică există

doar o singură categorie cu frecvenţa maximă. Prezenţa a două sau mai multe

valori mod determină distribuţii bimodale, trimodale, în general polimodale,

distribuţii ce nu pot fi considerate ca fiind distribuţii normale.

Figura nr. 1.

39

Înălţimea subiecţilor.

Fre

cven

ţa d

e ap

ariţ

ie

Page 40: Introducere in Spss - Versiunea 19

O distribuţie similară distribuţiei din

figura 1, este o distribuţie bimodală

(figura 2), deoarece observăm existenţa a

două categorii cu frecvenţa egală şi

maximă.

Figura nr. 2.

Normalitatea distribuţiei, sub aspectul modalităţi, se verifică prin

calcularea valorii modul. Dacă există o singură valoare cu frecvenţa maximă,

atunci distribuţia poate fi considerată normală sub acest aspect. În condiţiile în

care sunt două sau mai multe valori cu frecvenţa maximă şi, evident, egală,

distribuţia este polimodală (multimodală) şi nu poate fi considerată ca fiind

normală.

IV.6. Simetria.

O distribuţie este

simetrică, dacă valorile sunt

egal (simetric) răspândite în

jurul tendinţei centrale. Atunci

când rezultatele tind către valori

mici, sunt aglomerate în partea

stângă a distribuţiei, avem de a

Figura nr. 3 face cu o distribuţie asimetrică

spre dreapta (sau distribuţie skewness pozitiv). Când rezultatele tind către valori

mari, se aglomerează în partea dreaptă a distribuţiei, vorbim despre o distribuţie

asimetrică la stânga (skewness negativ). Iată că, asimetria este dată de panta

distribuţiei şi nu de vârful acesteia, aşa cum tratează şi consideră unii.

40

Page 41: Introducere in Spss - Versiunea 19

În figura nr. 3, distribuţia „B” este o distribuţie simetrică. Distribuţia „A”

este o distribuţie asimetrică la dreapta (skewness pozitiv) unde predomină

scorurile scăzute (mici), în timp ce distribuţia „C” este o distribuţie asimetrică la

stânga (skewness negativ) în care predomină scorurile mari.

Nu ne putem limita la o apreciere pur vizuală a simetriei; acest lucru necesită

demonstrarea statistică a simetriei sau asimetriei distribuţiei. În acest scop, există mai mulţi

coeficienţi care pot fi calculaţi.

Atunci când discutăm de asimetrie, trebuie să precizăm o serie de relaţii

care apar între indicatorii tendinţei centrale, media, mediana şi modul.

Într-o distribuţie simetrică, media, mediana şi modul au exact aceleaşi

valori. Caracteristica acestei distribuţii o reprezintă coincidenţa absolută a celor

trei indicatori ai tendinţei centrale.

După cum puteţi observa în figura

de mai sus, atât media, cât şi

mediana şi modulul, se află în

acelaşi punct, la mijlocul

distribuţiei. Grupa subiecţilor cu

scoruri Figura nr. 4

mai mici decât media este perfect simetrică cu grupa subiecţilor cu scoruri mai

mari decât media. Acest aspect este menţionat din raţiuni teoretice. În practică

nu vom întâlni o distribuţie perfect normală, ci o distribuţie care poate fi

acceptată ca fiind normală.

Într-o distribuţie asimetrică la dreapta (distribuţie skewness pozitiv,

vezi figura alăturată), predomină

scorurile mici. În acest caz,

modulul este valoarea situată cel

mai la stânga în şirul de date, iar

mediana este mai mică decât

media. Evident, mediana fiind

41

Page 42: Introducere in Spss - Versiunea 19

valoarea care împarte şirul ordonat de date în două părţi egale, Figura

nr. 5

iar dacă în distribuţie predomină scorurile mici, atunci scorurile mari sunt

considerate ca scoruri extreme. Ştim de la analiza preciziei indicatorilor

tendinţei centrale, că într-o serie de date în care întâlnim scoruri extreme mari,

media tinde să le pună în valoare. Iată că acest fapt este ilustrat grafic în figura

de mai sus. Observaţi relaţia existentă într-o asemenea distribuţie: Mo<Me<m.

Această relaţie este relaţia caracteristică a unei distribuţii asimetrice pozitiv.

Într-o distribuţie asimetrică la stânga (distribuţie skewness negativ,

vezi figura alăturată), predomină

scorurile mari. În acest caz,

modulul este valoarea situată cel

mai la dreapta în şirul de date, iar

mediana este mai mare decât

media. Evident, mediana fiind

valoarea care împarte şirul

ordonat de date în două părţi egale, Figura nr. 6

iar dacă în distribuţie predomină scorurile mari, atunci scorurile mici sunt

considerate ca scoruri extreme. Ştim, de la analiza preciziei indicatorilor

tendinţei centrale, că într-o serie de date în care întâlnim scoruri extreme mici,

media tinde să le pună în valoare. Iată că acest fapt este ilustrat grafic în figura

de mai sus. Observaţi relaţia existentă într-o asemenea distribuţie: Mo>Me>m.

Această relaţie este relaţia caracteristică a unei distribuţii asimetrice negativ.

IV.7. Boltirea (excesul).

Asimetria pe orizontală, presupune, după cum am văzut, o deplasare a

tendinţei centrale spre stânga sau spre dreapta, către scoruri mici sau către

scoruri mari. Dar, aceasta nu este singura asimetrie posibilă. Există şi un fel de

42

Page 43: Introducere in Spss - Versiunea 19

„asimetrie verticală” sau boltire. Termenul folosit generic pentru acest concept

este termenul de kurtosis (din limba greacă, kurtos = „cocoşat”).

Practic, boltirea se referă la aspectul „cocoaşei” distribuţiei rezultatelor.

Cocoaşa poate fi ascuţită şi atunci vorbim de o distribuţie ascuţită sau

leptocurtică, poate fi turtită, distribuţia turtită, plată sau platicurtică sau

normală, distribuţie mezocurtică. O distribuţie normală este întotdeauna o

distribuţie mezocurtică.

În figura alăturată,

distribuţia „C” este o distribuţie

leptocurtică, ascuţită. Distribuţia

„B” este o distribuţie platicurtică,

turtită, iar distribuţia „A” este o

distribuţie normală sub aspectul

boltirii, sau mezocurtică.

Figura nr. 7

Se observă că boltirea nu este altceva decât simetria pe axa verticală (OY),

spre deosebire de simetria propriu zisă, deplasarea valorilor pe axa orizontală

(OX). Dacă la simetrie se vorbeşte de frecvenţe (care sunt cele mai frecvente

scoruri obţinute, unde se concentrează acestea? În eşantionul sunt mai degrabă

subiecţi scunzi sau subiecţi înalţi? Ori poate există un echilibru între subiecţii

scunzi şi cei înalţi), la boltire se discută de valori, de modul în care aceste valori

se grupează în jurul tendinţei centrale (sunt mai grupate valorile în jurul mediei

sau, din contra, foarte împrăştiate.)

La fel ca şi simetria, boltirea nu poate fi apreciată pur „ochiometric” ci

avem nevoie şi aici de anumiţi coeficienţi de boltire. Pearson a discutat despre

boltire în termeni de momente, la fel ca şi simetria, rezultând astfel coeficientul

de boltire sau coeficientul kurtosis.

O distribuţie leptocurtică, ascuţită, arată că datele sunt foarte grupate şi

apropiate de medie, lotul de subiecţi având un mare grad de omogenitate a

43

Page 44: Introducere in Spss - Versiunea 19

scorurilor. Această distribuţie nu ridică nici un fel de probleme atunci când

trebuie să diferenţiem subiecţii care obţin scoruri mici sau mari. Avem însă

dificultăţi atunci când trebuie să diferenţiem subiecţii din zona medie a

distribuţiei.

De exemplu, dacă într-o clasă de 30 de elevi, 27 obţin medii anuale între

7,9 şi 8,1. Iată că, doar două zecimi diferenţiază între aproape întreg efectivul de

elevi. Nu avem nici o problemă cu repartizarea celorlalţi trei elevi. Pe aceia îi

vom considera ori foarte buni, ori foarte slabi, în funcţie de media obţinută – sub

7,9 sau peste 8,1. Ce putem face însă cu cei 27 de subiecţi? Suntem, iată, în

imposibilitatea de ai-i ierarhiza în vreun fel. Dacă presupunem că cei trei

subiecţi au note mai mici de 7,9, atunci cine va lua, dintre cei 27 de elevi,

premiul I, cine va lua premiul II şi cine va lua premiul III. Decizia ar fi, după

cum se poate vedea, extrem de dificilă, dacă nu chiar imposibilă. Singura

variantă în acest caz, ar putea fi creşterea preciziei. Nu calculăm media cu o

singură zecimală, ci cu 2, 3 sau 4 zecimale. Totuşi, sunt situaţii în care un

asemenea nivel de precizie este ridicol. O evaluare în care distribuţia rezultatelor

este leptocurtică, este o evaluare ce nu poate diferenţia între subiecţii de nivel

mediu, iar o curbă leptokurtică nu este o distribuţie normală;

O distribuţie platicurtică, plată, este o distribuţie în care rezultatele sunt

foarte împrăştiate faţă de medie şi indică un grad ridicat de eterogenitate a

scorurilor. Problema generală a acestei distribuţii, în opoziţie cu distribuţia

leptokurtică, este aceea că diferenţiază greu la extreme şi destul de bine în zona

mediei. Va fi greu, utilizând o asemenea distribuţie, să facem diferenţieri între

elevii slabi şi între elevii buni, deşi putem diferenţia relativ uşor elevii medii.

Datorită acestui fapt, o distribuţie platicurtică nu este nici ea o distribuţie

normală.

O distribuţie normală este o distribuţie mezocurtică.

Analiza unei distribuţii sub aspectul normalităţii este primul pas pe care îl

facem în orice prelucrare de date. Deoarece, în funcţie de rezultatul acestei

44

Page 45: Introducere in Spss - Versiunea 19

analize, vom putea alege tehnicile şi procedeele statistice pe care le putem

folosi, această etapă o întâlnim, de obicei, la începutul oricărui raport de

cercetare, imediat după descrierea eşantionului.

IV.8. Alegeţi răspunsul corect

1. Histograma:a. este un grafic folosit în statistica descriptivă;b. arată o distribuţie de frecvenţă;c. se foloseşte pentru date calitative.

2. Valid procent:a. exprimă aceste frecvenţe ca un procent al numărului total excluzând datele lipsă.b. frecvenţe ca un procent al numărului total lipsesc incluzând şi datele carelipsesc.

c. frecvenţa valorilor.

3. Pentru a obţine un tabel de frecvenţe accesăm:a. analyze/ descriptive statistics/frequences;b. analyze/ descriptive statistics/descriptives;c. analyze/ descriptive statistics/frequences/descriptives.

4. Pentru a crea o histogramă accesăm:a. graphs/histogram;b. graphs/interactve;c. graphs/control.

5. O distribuţie poate fi:a. unimodală;b. bimodală;c. trimodală.

6. Într-o distribuţie simetică:a. media < mdiana< modul;b. media = mediana = modul;c. media >mediana>modul.

45

Page 46: Introducere in Spss - Versiunea 19

7. Într-o distribuţie asimetrică la dreapta:a. modul <mediana<media;b. modul>mediana>modul;c. modul=mediana=modul.

8. Într-o distribuţie asimetrică la dreapta: a. modul=mediana=media; b. modul <mediana>modul; c. modul>mediana>modul.

9. O distribuţie poate fi:a. leptocurtică;b. platicurtică;c. asimetrică pozitiv;d. asimetrică negativ;e. mezocurtică.f. toate variantele de mai sus.

10. O distribuţie leptocurtică arată că:a. datele sunt foarte grupate şi apropiate de mediană iar lotul de subiecţi are

un grad mare de omogenitate;b. datele sunt foarte împrăştiate de mediană iar lotul de subiecţi are un grad

mare de eterogenitate;c. distribuţia este normală.

8. O distribuţie platicurtică arată că:d. datele sunt foarte grupate şi apropiate de mediană iar lotul de subiecţi are

un grad mare de omogenitate;e. datele sunt foarte împrăştiate de mediană iar lotul de subiecţi are un grad

mare de eterogenitate;f. distribuţia este normală.

IV.9. Răspunsuri corecte

1. a. este un grafic folosit în statistica descriptivă;

46

Page 47: Introducere in Spss - Versiunea 19

b. arată o distribuţie de frecvenţă;

2. a. analyze/ descriptive statistics/frequences;

3. a. analyze/ descriptive statistics/frequences;

4. a. graphs/histogram;

5. a. unimodală;

b. bimodală;

c. trimodală.

6. b. media = mediana = modul;

7. b. modul <mediana<media;

8. c. modul>mediana>modul.

9. f. toate variantele de mai sus.

10. a. datele sunt foarte grupate şi apropiate de mediană iar lotul de subiecţi

are un grad mare de omogenitate;

11. b. datele sunt foarte împrăştiate de mediană iar lotul de subiecţi are un

grad mare de eterogenitate;

47

Page 48: Introducere in Spss - Versiunea 19

V. Abaterea standard.________________________________________________________________________________________________________________

Abaterea standard este un indice care arată cât de mult deviază (diferă)

unele scoruri „în medie” faţă de media setului de scoruri din care acestea fac

parte.

Abaterea standard poate fi folosită şi pentru a transforma scoruri pentru

variabile foarte diferite în scoruri Z (sau standard), care sunt uşor de comparat şi

însumat.

Calcularea abaterii standard şi a scorurilor Z este prezentată în exemplul

următor:

Vârstă 20 22 25 26 35 38 28 24 23 24

V.1. Introducerea datelor.

Pasul 1:

În „Variable View” din „Data Editor” se denumeşte prima coloană „Vârsta”.

Se înlătură cele două zecimale.

Pasul 2: În „Data View” din „Data Editor” se introduc vârstele în prima

48

Page 49: Introducere in Spss - Versiunea 19

coloană.

Pasul 3:Se selectează:„Analyze”„Descriptive Statistics”„Descriptives…”

Pasul 4: Se selectează „vârsta” şi apoi se apasănbutonul ► pentru a o introduce în lista de variabile.

Se selectează „Options…”

Pasul 5:

Se deselectează „Mean”,„Minimum”, „Maximum”.

Se selectează „Continue”.

Se selectează „OK” din ecranul precedent care reapare.

V. 2. Interpretarea output-ului.

Descriptive Statistics

N Std. Deviation

varsta 10 5,740

Valid N (listwise) 10

49

Page 50: Introducere in Spss - Versiunea 19

Numărul 10 reprezintă numărul de cazuri.Abaterea standard pentru vârstă este de 5,740.

V.3. Scorurile Z

Pasul 1:La pasul 4 selectaţi „Save standardized values as variables”.

Se apasă „OK”.

Pasul 2:

Scorurile Z sau standard sunt în a doua coloană din „Data View” în „Data Editor” şi sunt numite „ZVârstă”.

V.4. Raportarea output-ului.

Abaterea standard pentru o variabilă este uşor de menţionat în textul

raportului: „A fost determinată abaterea standard a vârstei ca fiind 5,74 ani (N=

10)”.

*Este posibil ca abaterea standard să fie înregistrată împreună cu alte statistici, cum ar

fi media, rangul, etc.

Notele „z” reprezintă diferenţa dintre scorul observat şi medie, în

termeni de abatere standard. Cu alte cuvinte, notele „z” nu sunt altceva decât

distanţele la care se situează scorurile particulare în raport cu media grupului iar

această distanţă este exprimată standardizat.

50

Page 51: Introducere in Spss - Versiunea 19

Teoretic, notele „z” sunt note obţinute pe o „curbă” cu media 0 şi abaterea

standard 1. În acest caz, o distribuţie normală are practic notele „z” cuprinse

între -3 şi +3, între aceste note regăsindu-se peste 99% din populaţie, după cum

observaţi în figura de mai jos.

Notele „z” au şi ele o serie de proprietăţi cu aplicabilitate practică

deosebită, dintre care menţionăm (Popa, 2006):

Media unei distribuţii „z” este egală cu zero, afirmaţie ce rezultă din

proprietatea acestui indicator de a se diminua atunci când scădem o

constantă din fiecare scor particular. Deoarece din formulă rezultă această

diferenţă (se scade fiecare scor particular din medie), în final media va

ajunge la valoarea zero

Abaterea standard a unei distribuţii „z” este întotdeauna 1. Şi această

afirmaţie rezultă din proprietăţile abaterii standard. Ştim că dacă împărţim

abaterea standard cu o constantă, valoarea acesteia se divide corespunzător.

Din formulă, observăm că acea constantă cu la care împărţim este chiar

abaterea standard iar împărţirea a două numere egale are ca rezultat 1

Notele „z” sunt note direct calculabile, utilizându-se media şi abaterea

standard şi reprezintă „temelia” oricărui proces de standardizare. Totuşi,

principalul dezavantaj al notelor „z” este acela că sunt puţin intuitive. Trebuie să

ştim bine ce înseamnă distribuţia normală pentru a înţelege corect semnificaţia

acestor note. În plus, au valori pozitive şi negative, ceea ce le face, iarăşi, greu

de utilizat.

V.5. Alte caracteristici.

În meniul „Descriptives Statistics sunt conţinute mai multe calcule statistice care pot fi selectate:

Mean (media); Sum (suma); Standard deviation (estimate) (abaterea standard); Range (amplitudinea); Minimim;

51

Page 52: Introducere in Spss - Versiunea 19

Maximum; Kurtosis; Skewness.* Aceste concepte sunt explicate pe scurt la sfârşitul capitolului 3.

V.6. Alegeţi răspunsul corect

1. Abaterea standard:a. este un indice care arată cât de mult deviază (diferă) unele scoruri „în

medie” faţă de media setului de scoruri din care acestea fac parte.b. este un indice care arată cât de simetrică sau asimetrică este o

distribuţie;c. este un indice care arată cât de turtită sau boltită este o distribuţie.

2. Media este o mărime generalizată , adică, înlocuind fiecare nivel individual al caracteristicii de distribuţie cu nivelul mediu:a) suma seriei rămâne aceeaşib) suma termenilor seriei se modificăc) suma termenilor seriei este nulă.

3. Media aritmetică reprezintă:a) valoarea pe care ar purta-o fiecare unitate statistică dacă distribuţia ar

fi eterogenăb) valoarea pe care ar purta-o fiecare unitate statistică dacă distribuţia ar

fi omogenăc) valoarea pe care ar purta-o fiecare variabilă statistică dacă distribuţia

ar fi omogenă.

4. Media aritmetică, ca indicator fundamental al tendinţei centrale:a) reprezintă valoarea care modifică nivelul totalizator;b) se foloseşte cel mai frecvent şi reprezintă suma valorilor raportată la

numărul lor;c) se calculează adunând valorile existente;d) nu poate determina numărul de unităţi din colectivitate.

52

Page 53: Introducere in Spss - Versiunea 19

53

Page 54: Introducere in Spss - Versiunea 19

V.7. Răspunsuri corecte

1. a. este un indice care arată cât de mult deviază (diferă) unele scoruri „în medie” faţă de media setului de scoruri din care acestea fac parte.

2. a) suma seriei rămâne aceeaşi

3. b) valoarea pe care ar purta-o fiecare unitate statistică dacă distribuţia ar fi omogenă

4. b. se foloseşte cel mai frecvent şi reprezintă suma valorilor raportată la numărul lor;

54

Page 55: Introducere in Spss - Versiunea 19

VI. Relaţiile dintre două sau mai multe variabile. Diagrame şi tabele.________________________________________________________________________________________________________________

În foarte multe cercetări se studiază relaţiile dintre două sau mai multe

variabile. Procedurile statistice univariate (cu o singura variabilă) care au fost

descrise până acum pot fi utilizate pentru analiza oricăror date. Dar, cercetarea

poate necesita ca relaţiile şi corelaţiile dintre diferitele variabile să fie studiate.

La fel ca statistica univariată, statistica bivariată a datelor necesită

studierea tendinţelor fundamentale ale datelor utilizând tabele şi diagrame.

Modelele de prezentare a relaţiilor bivariate includ crearea tabelelor scatter.

O condiţie esenţială o constituie etichetarea tabelelor şi diagramelor şi

denumirea acestora.

În continuare se va ilustra elaborarea unui tabel de asociere şi a unei

diagrame cu bare.

VI.1. Introducerea datelor.

În studiu sunt introduşi 11 copii instituţionalizaţi şi 9 copii

neinstituţionalizaţi. Dintre aceştia 9 au fost fete şi 11 au fost băieţi.

Pasul 1:În „Variable View” din „Data Editor” se denumeşte:

- prima coloană „Instituţionalizare”- a doua coloană „Genul biologic”;- A treia coloană „Frecvenţa”.

Se înlătură cele două zecimale.

55

Page 56: Introducere in Spss - Versiunea 19

Pasul 2:

Se etichetează cele două valori ale instituţionalizării:1 - instituţionalizat;2 - neinstituţionalizat.Şi genul biologic:

1. Feminin;2. Masculin

*Paşii acestei proceduri au fost explicaţi în capitolul 1.

Pasul 3: Se introduc aceste numere în „Data View” din „Data Editor”. Primul rând se referă la fetele care au fost instituţionalizate: sunt în număr de 5. Al doilea rând se referă la băieţii care au fost instituţionalizaţi: sunt în număr de 6. Al treilea rând se referă la fetele neinstituţionalizate: sunt în număr de 4. Al patrulea rând se referă la băieţii neinstituţionalizaţi: sunt în număr de 5.

VI.2. Ponderea datelor

Pasul 4:

Pentru a pondera datele cu scopul ca cele patru celule să conţină numărul de cazuri corespunzător, se selectează: „Data” „Weight Cases…”

Pasul 5:

56

Page 57: Introducere in Spss - Versiunea 19

Se selectează „Frecvenţa”, „Weight cases by” şi apoi se apasă butonul pentru transfer în căsuţa variabilei„Frequency Variable”.Se apasă ►

„OK”

VI.3. Crearea tabelelor de asociere (Crosstabs).

Pasul 6:

Se selectează:„Analize”„Descriptivesc statistics”„Crosstabs…”.

Pasul 7:Pentru a pune „instituţionalizare” pe rândurile tabelului, se selectează şi apoi se apasă butonul ►de lângă eticheta „Row(s)”.

Pentru a pune „genul biologic” pe coloanele tabelului, se selectează şi apoi se apasă butonul ► de lângă eticheta „Column(s).

Se apasă „OK”.

Pasul 8:

57

Page 58: Introducere in Spss - Versiunea 19

În tabel sunt prezentate valorile celor două variabile.Se observă că sunt 5 fete şi 6 băieţiinstituţionalizaţi (în total 11) şi 4 fete şi 5 băieţi neinstituţionalizaţi (în total 9). (N=20).

Tabelul de asociere este folosit pentru prezentarea relaţiilor dintre două variabile categoriale. În fiecare celulă a tabelului este prezentată frecvenţa parţială (adică efectivul care poartă simultan o valoare a fiecărei variabile).

Observaţie: 1. Dacă într-un crosstabs numărul categoriilor unei variabile este mai mare decât al

alteia, atunci categoriile acelei variabile se plasează pe rânduri.2. O celulă din crosstabs oferă informaţia despre intersecţia celor două variabile. Pentru

aceasta alegem din fereastra Crosstabs butonul de comandă Cell ce are ca efect afişarea ferestrei Crosstabs Cell Display.

VII. Coeficienţi de corelaţie. Coeficienţi de corelaţie Pearson şi Spearman._________________________________________________________________________________________________________________

Corelaţia este o metodă statistică utilizată pentru a determina relaţiile

dintre două sau mai multe variabile. Există mai multe tipuri de corelaţii atât

parametrice cât şi neparametrice.

Coeficientul de corelaţie este o valoare cantitativă ce descrie relaţia

dintre două sau mai multe variabile. El variază între (-1 si +1), unde valorile

extreme presupun o relaţie perfectă între variabile în timp ce 0 înseamnă o lipsa

totala de relaţie liniară. O interpretare mai adecvată a valorilor obţinute se face

prin compararea rezultatului obţinut cu anumite valori prestabilite în tabele de

corelaţii în funcţie de numărul de subiecţi, tipul de legătură şi pragul de

semnificaţie dorit.

Cel mai comun şi cel mai folositor este coeficientul de corelaţie Pearson

şi coeficientul de corelaţie Spearman.

Corelaţia Pearson(r) evaluează gradul de asociere dintre două variabile

măsurate pe scală de interval/raport. Aceasta se referă la intensitatea şi sensul de

variaţie concomitentă a valorilor unei variabile în raport cu cealaltă, după un

58

Page 59: Introducere in Spss - Versiunea 19

model de tip liniar. Dacă valorile unei variabile urmează, în sens direct,

crescător, sau invers, descrescător, valorile celeilalte variabile, atunci cele două

variabile corelează între ele. Domeniul de variaţie a coeficientului de corelaţie

Pearson(r) este între r = -1 (corelaţie perfectă negativă: ceea ce înseamnă că în

timp ce scorurile unei variabile cresc, scorurile pentru cealaltă variabilă

descresc) şi r = +1 (corelaţie perfectă pozitivă: ceea ce înseamnă că scorurile

unei variabile se măresc odată cu creşterea scorurilor celeilalte variabile).

Absenţa oricărei legături (corelaţii) dintre variabile se traduce prin r =0.

O corelaţie de 1,00 indică o asociere perfectă între cele două variabile.

Cu alte cuvinte, o diagramă scatter a celor două variabile va arăta că toate

punctele sunt conţinute de o singură dreaptă. O valoare de 0,00 indică faptul că

toate punctele din diagrama scatter sunt dispersate aleatoriu în jurul oricărei

drepte desenate pe această diagramă a datelor sau sunt aranjate într-o manieră

curbilinie.

În continuare vom ilustra calculul corelaţiei Pearson, o diagramă scatter

şi coeficientul de corelaţie Spearman, folosind pentru aceasta datele din tabelul

următor, care reprezintă scoruri ale abilităţilor muzicale şi matematice pentru 10

copii.

muzica 3 7 8 9 9 6 4 3 4 7matematică 7 5 4 4 5 8 9 9 7 6

VII.1. Introducerea datelor.

Pasul 1: În „Variable „View” din „Data Editor” se denumeşte primul rând „muzică” şi al doilea rând „matematică”. * Se înlătură cele două zecimale.

Pasul 2:

În „Data View” din „Data editor”

59

Page 60: Introducere in Spss - Versiunea 19

se introduc datele pentru:- muzică în prima coloană;

- matematică în a doua

-

VII.2. Corelaţia Pearson.

Pasul 1:

Se selectează: „Analyze”, „Corelate”, „Bivariate…”

Pasul 2:Se selectează „Muzică” şi „Matematică” şi apoi se apasă butonul ►pentru a le introduce în lista de variabile aşa cum este arătat în figura din dreapta.

Se apasă „OK”.

VII.3. Interpretarea output-ului.Corelaţia dintre „matematică” şi „muzică” este - 0,845 La un test de semnificaţie, two-tailed la nivelul de probabilitate 0,01 sau mai mic, corelaţia este statistic semnificativă.

Numărul cazurilor pe care este bazată corelaţia este 10. Informaţia apare şi în această celulă.

60

Page 61: Introducere in Spss - Versiunea 19

*One tailed – dacă distribuţia este unidirecţională. Two-tailed – dacă distribuţia este bidirecţională.

VII.4. Raportarea output-ului.

Corelaţia dintre abilităţile muzicale şi cele matematice este – 0,845.

* Se obişnuieşte să se rotunjească corelaţia cu două zecimale, deci aceasta va deveni 0,90,

acesta fiind un rezultat mult mai precis pentru majoritatea măsurătorilor psihologice.

Nivelul de semnificaţie exact, cu trei zecimale, este 0,002. Înseamnă că

nivelul de semnificaţie este mai mic decât 0,01.

Interpretarea psihologică va fi: „Există o relaţie negativă semnificativă între

abilităţile muzicale şi cele matematice , ceea ce înseamnă că, copii cu nivel

ridicat al abilităţilor muzicale au un nivel scăzut al abilităţii matematice”.

Un coeficient de corelatie poate fi calculat corect numai când datele ambelor variabile se refera la esantioane si fiecare este ales independent. Un coeficient de corelatie poate fi apropiat de ą1, deci ne va indica o corelatie puternica, dar ea poate fi nesemnificativa din cauza volumului mic a esantionului studiat. Corelatia nu trebuie identificata cu cauzalitatea, in sensul ca observatiile a 2 variabile se pot corela foarte bine fara sa avem motive logice si stiintifice ca una dintre variabile poate fi cauza celeilalte.

VII.5. Coeficientul de corelaţie Spearman.

Pasul 1:Identic corelaţiei Pearson se selectează „Analyze”, „Correlate”, „Bivariate” şi variabilele care se doresc pentru corelaţie.Se selectează „Spearman” şi se deselectează Pearson (dacă nu se doreşte ca şi corelaţie).

61

Page 62: Introducere in Spss - Versiunea 19

Se apasă „OK”.

VII.6. Interpretarea output-ului.

Coeficientul de corelaţie Spearman Numărul cazurilor este 10. între muzică şi matematică este – 0,842. Nivelul de semnificaţie este 0,001 sau mai mic, deci corelaţia este statistic semnificativă.

VII.7. Raportarea output-ului. Corelaţia raportată cu două zecimale este – 0,84. Interpretarea psihologică va fi: „Există o corelaţie negativă semnificativă între abilităţile muzicale şi cele matematice, ceea ce semnifică faptul că, cei cu un nivel ridicat al abilităţii muzicale au abilităţi matematice scăzute şi viceversa”. Coeficientul de corelatie al rangurilor (Spearman) testeaza gradul de corelare intre 2

variabile calitative; este alternativa neparametrica a “coeficientului de corelatie Pearson”. Acest coeficient variaza intre -1 si +1. O valoare apropiata de +1, inseamna ca suma

patratelor diferentelor este aproape nula, deci avem clasamente identice. O valoare apropiata de 0, inseamna necorelarea variabilelor, iar valoarea apropiata de -1

pune in evidenta discordanta maxima a variabilelor.

VII.8. Diagrama scatter.

Pasul 1:Se selectează:„Graphs”„Legacy Dialogs”„Scatter Dot”

Pasul 2:

62

Page 63: Introducere in Spss - Versiunea 19

Se selectează „define” din moment ce „simple” este deja selectat.

Pasul 3:

Pentru a avea variabila „muzică” ca axă verticală, se selectează şi apoi se apasă butonul ►de lângă căsuţa „Y Axis”

Pentru a avea variabila „matematică” ca axă orizontală, se selectează apoi se apasă butonul ◄ de lângă căsuţa „X Axis”.

Se apasă „OK”.

VII.9. Interpretarea output-ului.

În diagrama scatter, răspândirea punctelor este relativ îngustă, ceea ce indică o corelaţie mare.

Forma împrăştierii rezultatelor este relativ în linie dreaptă, indicând mai degrabă o relaţie în linie dreaptă decât o relaţie curbilinie.

Linia este de la colţul stânga sus până în dreapta jos, ceea ce indică o corelaţie negativă.*Dacă relaţia este curbilinie atunci corelaţiile Pearson şi Spearman pot fi

63

Page 64: Introducere in Spss - Versiunea 19

înşelătoare.

VII.10. Raportarea output-ului.

Despre diagrama scatter s-ar putea scrie următoarele afirmaţii: „ A fost

examinată o diagramă scatter pentru relaţia dintre abilităţile muzicale şi

matematice. Nu există nicio dovadă privind o relaţie curbilinie sau asupra

influenţei avute de rezultatele atipice”.

VII.11. Alegeţi răspunsul corect

1. Corelaţia:a. măsoară variaţia concomitentă a doi factorib. măsoară parametria distribuţiei între două eşantioanec. măsoară rangul unei distribuţii trihotomice

2. Corelaţia Pearson(r):a. evaluează gradul de asociere dintre două variabile măsurate pe scală de

interval/raport.

64

Page 65: Introducere in Spss - Versiunea 19

b. evaluează gradul de asociere dintre două variabile măsurate pe scală nominală;

c. evaluează gradul de asociere dintre două variabile măsurate pe scală ordinală.

3. O corelaţie de 1,00 indică:a. o asociere perfectă între cele două variabile;b. faptul că toate punctele din diagrama scatter sunt dispersate aleatoriu în

jurul oricărei drepte desenate pe această diagramă a datelor;c. absenţa oricărei legături (corelaţii) dintre variabile.

4. Pearson este un indicator de corelaţie:a. parametric;b. neparametric;c. ambele variante de mai sus.

5. Spearman este un indice de corelaţie:a. parametric;

b. neparametric; c. ambele variante de mai sus.

6. O corelaţie negativă semnifică faptul că:a. în timp ce scorurile unei variabile cresc, scorurile pentru cealaltă variabilă

descresc;b. că scorurile unei variabile se măresc odată cu creşterea scorurilor

celeilalte variabile). c. nu există nicio legătură între variabile.

7. O corelaţie pozitivă semnifică faptul că:d. în timp ce scorurile unei variabile cresc, scorurile pentru cealaltă variabilă

descresc;e. că scorurile unei variabile se măresc odată cu creşterea scorurilor

celeilalte variabile). f. nu există nicio legătură între variabile.

8. Norul de puncte este folosit pentru:a. a reprezenta relaţia dintre variabile;b. a arăta frecvenţa de apariţie pentru diferite clase de valori ale variabilei observate;c. a arăta intzervalul de încredere de 95% pentru media respectivă.

9. Pentru a realiza un tabel de asociere selectăm:a. Analyze/Descrisptiv statistics/crosstabs;

65

Page 66: Introducere in Spss - Versiunea 19

b. Analyze/Descrisptiv statistics/Explore;c. Statistics / Corelate / Crosstabsd. Statistics / Custom tables / Crosstabs

10. Tabelul de asociere este folosit pentru:a. selectarea unor subiecţib. prezentarea relaţiilor dintre două variante categoriale c. recodificarea variabilelor d. modificarea unui tabel

VII.12. Răspunsuri corecte

1. a. măsoară variaţia concomitentă a doi factori

2. a. evaluează gradul de asociere dintre două variabile măsurate pe scală de

interval/raport.

3. a. o asociere perfectă între cele două variabile;

4. b. neparametric;

66

Page 67: Introducere in Spss - Versiunea 19

5. b. neparametric;

6. a. în timp ce scorurile unei variabile cresc, scorurile pentru cealaltă

variabilă descresc;

7. e. că scorurile unei variabile se măresc odată cu creşterea scorurilor

celeilalte variabile).

8. a. a reprezenta relaţia dintre variabile;

9. a. Analyze/Descrisptiv statistics/crosstabs;

10. b. prezentarea relaţiilor dintre două variante categoriale

VIII. Regresia. Predicţia cu precizie._________________________________________________________________________________________________________________

Dacă există o relaţie între două variabile atunci sunt posibile estimarea

sau predicţia scorului unei persoane la o variabilă pornind de la scorul obţinut la

cealaltă variabilă. Cu cât este mai puternică corelaţia cu atât este mai bună

predicţia. Variabila independentă este variabila folosită pentru a realiza

predicţia, aceasta fiind cunoscută şi ca variabilă predictor sau variabila X.

*Este foarte important a nu se confunda variabila independentă cu cea dependentă. Cel

mai bun mod de a evita aceste probleme este de a examina scatterplot-ul sau diagrama scatter

a relaţiei dintre cele două variabile. Axa orizontală X este variabila independentă şi axa

67

Page 68: Introducere in Spss - Versiunea 19

verticala Y este variabila dependentă. Se poate investiga şi punctul de tăiere, acesta fiind

punctul în care panta se intersectează cu axa verticală.

Regresia devine o tehnică mult mai importantă atunci când sunt folosite

mai multe variabile pentru predicţia valorilor unei alte variabile.

În continuare este ilustrată procesarea unei regresii simple şi a unei

diagrame de regresie folosind datele din tabelul următor.

Scor muzica 3 7 8 9 9 6 4 3 4 7Scor matematică

7 5 4 4 5 8 9 9 7 6

Unul din principalele capitole ale statisticii are în vedere posibilitatea de a face predictii. Desi nu se gasesc relatii perfecte în lumea reala, prin intermediul regresiei se pot face predictii ale unei variabile, în functie de valoarea alteia. Predictia este procesul de estimare a valorii unei variabile cunoscând valoarea unei alte variabile.

Regresia se leaga foarte mult de conceptul de corelatie. O asociere puternica între doua elemente conduce la cresterea preciziei predictiei unei variabile pe seama alteia. Daca am avea o corelatie perfecta (+1 sau –1) estimarea ar fi extrem de precisa

VIII.1. Introducerea datelor.Pasul 1:

În „Variable „View” din „Data Editor” se denumeşte primul rând „muzică” şi al doilea rând „matematică”. * Se înlătură cele două zecimale.

Pasul 2:

În „Data View” din „Data editor” se introduc datele pentru:

- muzică în prima coloană;- matematică în a doua coloană.

VIII.2. Regresia simplă.

Pasul 1:Se selectează: „Analyze”„Regression”„Linear…”

68

Page 69: Introducere in Spss - Versiunea 19

Pasul 2:

Se selectează „Muzică” şi apoi se apasă butonul ► de lângă eticheta „Dependent”, pentru a introduce această variabilă în căsuţa variabilei dependente.

Se selectează „matematica” şi apoi se apasă butonul ◄ de lângă eticheta „Independent(s) pentru a introduce această variabilă în căsuţa variabilei (lor) independente.Se selectează „Statistics…”

Pasul 3:

Se selectează „Confidence Intervals”.

Se selectează „Continue”.Se apasă „OK” din ecranul precedent care reapare.

VIII.3. Interpretarea output-ului. Acest tabel conţine datele esenţiale pentru analiza regresiei.

Constanta este 12,716. Acesta este punctul în care linia de regresie intersectează axa verticală.

Coeficientul nestandardizat Coeficientul standardizat Intervalul de al regresiei este – 1,049. al regresiei este – 0,845. încredere ia valori Acesta semnifică faptul că, Acesta este mai mult sau de la -1,591 la -0,507. pentru fiecare creştere cu 1 mai puţin coeficientul de a variabilei “matematică” corelaţie Pearson dintre valoarea variabilei “muzică” abilităţile muzicale şi

69

Page 70: Introducere in Spss - Versiunea 19

descreşte cu – 1,049.

Intervalul de încredere de 95% pentru aceşti coeficienţi este de la -1,59 la -0,50. Intervalul de încredere de 95% arată intervalul pantelor de regresie în care putem fi siguri într-o proporţie de 95% că panta pentru populaţie se va găsi. Cota denumită „Beta” are valoarea -0,845. Aceasta este de fapt corelaţia Pearson între cele două variabile.Regresia simplă - o variabila dependenta si una independent

VIII.4. Scatterplot-ul de regresie. Atunci când se realizează o regresie este recomandabilă cercetarea diagramei scatter pentru cele două variabile.

Pasul 1:Se selectează:„Graphs”„Legacy Dialog”„Scatter/Dot”

Pasul 2:

Se selectează „define”; „simple” este deja selectat.

Pasul 3:

Pentru a avea variabila „muzică” ca axă verticală, se selectează şi apoi se apasă butonul ►de lângă căsuţa „Y Axis”

Pentru a avea variabila „matematică” ca axă orizontală, se selectează apoi se apasă butonul ◄ de lângă căsuţa „X Axis”.Se apasă „OK”

70

Page 71: Introducere in Spss - Versiunea 19

Pasul 4:

Pentru a încadra o linie de regresie în scatterplot, se dă dublu clic oriunde în interior şi se va deschide „Chart Editor”.

Se selectează „Elements” şi„Fit Line at Total”.

VIII.5. Interpretarea output-ului.

Punctele de pe scatterplot sunt apropiate de linia de regresie. În plus, punctele par să formeze o linie dreaptă (relaţia nu este curbilinie).În regresie, axa verticală este variabila-criteriu sau dependentă (în cazul nostru = muzica).

Linia de regresie are o pantă negativă în acest caz; de exemplu: de la stânga sus spre dreapta jos. În consecinţă B are valoare negativă.

În regresie axa orizontală este variabila predictor sau independentă (în cazul nostru „matematică”).

* Linia de regresie oblică, de la stânga sus spre dreapta jos, indică o relaţie negativă între cele două variabile.

Punctele par relativ apropiate de line, ceea ce sugerează că beta (corelaţia)

ar trebui sa fie un număr mare (negativ) şi că intervalul de încredere este relativ

mic.

Regresia liniară - relatia dintre cele doua variabile poate fi descrisa printr-o dreapta în cadrul norului de puncte.

VIIII.6. Raportarea output-ului.

Interpretarea diagramei se poate realiza în felul următor:

71

Page 72: Introducere in Spss - Versiunea 19

„Diagrama scatterplot a relaţiei dintre abilităţile matematice şi muzicale

sugerează o relaţie liniară negativă între cele două variabile. Este posibilă

predicţia cu acurateţe a abilităţii muzicale a unei persoane cunoscând abilitatea

sa matematică.

IX. Eroarea standard__________________________________________________________________________________________________________________________________________________________________________________________________________________________________

Eroarea standard este un indice pentru variabilitatea mediilor mai multor

eşantioane extrase din populaţie; cu alte cuvinte este media măsurii cu care

media eşantioanelor diferă faţă de media populaţiei din care au fost extrase.

Eroarea standard poate fi folosită ca un pas intermediar în alte tehnici

statistice, cum ar fi Testul t şi este un concept important pentru calculul

intervalelor de încredere.

Calcularea erorii standard estimate pentru medie este ilustrată cu un set

de şase scoruri ale stimei de sine, prezentate în tabelul următor.

Stima de sine 5 7 3 6 4 5

72

Page 73: Introducere in Spss - Versiunea 19

IX. 1. Introducerea datelor.

Pasul 1:

Se introduc datele în „Data Editor”.

Se etichetează variabila „Stima”.

IX. 2. Eroarea standard estimată a mediei.

Pasul 1:Se selectează:„Analyze”„Descriptive Statistics”„Descriptive…”

Pasul 2:

Se selectează „stima de sine” şi apoi se apasă butonul ◄pentru a introduce variabila „Stima de sine” în „variable(s)”. Se selectează „Options…”

Pasul 3:

Se selectează „ S-E mean”.

Se selectează „continue”.

Se apasă „OK” din ecranul anterior care reapare.

73

Page 74: Introducere in Spss - Versiunea 19

IX. 3. Interpretarea output-ului.

Eroarea standard (estimată) pentru medie a acestui eşantion este 0,577.

este o indicaţie a mediei cu care mediile eşantioanelor diferă de media populaţiei

din care au fost extrase.

testul oferă valoarea erorii standard a mediilor eşantioanelor ca fiind 0,58

(suma este rotunjită la două zecimale) aceasta fiind valoarea medie cu care

mediile eşantioanelor (N=6) diferă faţă de media populaţiei.

tabelul include şi alte informaţii cum ar fi media (5,00), abaterea standard

estimată a populaţiei bazată pe acest eşantion, valorile minime şi maxime ale

datelor.

ultima coloană oferă abaterea standard (estimată) a celor şase scopuri, care

este 1,41.

X. Testul t. Compararea a două eşantioane de scopuri corelate/relaţionate._________________________________________________________________________________________________________________

Testul t este folosit pentru evaluarea semnificaţiei statistice a diferenţei

dintre mediile pentru două seturi de scoruri. Cu ajutorul testului t se pune în

evidenţă dacă valoarea medie pentru un set de scoruri diferă în medie de

valoarea medie pentru alt set de scoruri.

Testul t are două variante:

1. prima variantă este folosită atunci când cele două seturi de scoruri

ce trebuie comparate provin dintr-un singur eşantion sau când

74

Page 75: Introducere in Spss - Versiunea 19

coeficientul de corelaţie între cele două seturi este mare – testul t

pentru eşantioane perechi;

2. a doua variantă a testului t este utilizată în momentul în care două

seturi diferite de valori provin din grupe diferite de participanţi. –

testul t pentru eşantioane independente.

* Testul t pentru eşantioane perechi este optim dacă distribuţia diferenţelor dintre

cele două seturi de valori se prezintă (aproximativ) sub formă de clopot (atunci când

distribuţia este normală). Dacă distribuţia este foarte diferită de forma de clopot ar trebui luată

în considerare utilizarea unei tehnici statistice relaţionate nonparametrică pentru eşantioane

perechi, cum ar fi testul de perechi Wilcoxon.

Procesarea unui Test t este ilustrată cu datele din tabelul următor unde

sunt prezentate numărul de cuvinte pe care aceeaşi copii le-au verbalizat cu

mamele lor la 18 luni şi la 24 luni.

Numărul de cuvinte verbalizate într-un minut la vârste diferite.

Alina Cristina Raluca Carmen Simona Radu Cristi Dan 18 luni 3 2 4 5 2 3 2 424 luni 5 4 7 8 3 4 4 6

75

Page 76: Introducere in Spss - Versiunea 19

X.1. Introducerea datelor.

Pasul 1:În „Variable View” din „Data

Editor” se etichetează primul rând cu „optsprezece” şi al doilea rând cu „douăzeci şi patru”.

Pasul 2:

În „Data View” din „Data Editor”se introduc datele în primele două coloane.

X.2. Testul t pentru eşantioane perechi

Pasul 1:

Se selectează: „Analyze”„Compare Means”„Paired-Samples T Test…”

Pasul 2:Se selectează „optsprezece”

76

Page 77: Introducere in Spss - Versiunea 19

şi se pune această variabilă lângă eticheta „Variable1” sub „Curent Selections”. Se selectează „douăzeci şi patru” şi se pune această variabilă lângă eticheta „Variable2” sub „Curent Selections”.Se apasă butonul ►pentru a pune aceste două variabile în lista variabilelor relaţionale.Se apasă „OK”.

X.3. Interpretarea output-ului.

Primul tabel arată media, numărul de cazuri şi abaterea standard pentru cele două grupuri. Media pentru „optsprezece” este 3,13 şi abaterea standard este 1,126.

Al doilea tabel arată gradul în care cele două seturi de valori sunt corelate.

Corelaţia dintre ele 0,94. Aceasta este o corelaţie mare, nivelul de semnificaţie

fiind de 0,00.

Primele trei coloane care conţin cifre sunt componentele fundamentale ale

calcului unui Test t relaţionat. Media de -2,000 este de fapt diferenţa dintre

mediile pe 18 şi 24 luni, deci în realitate este media diferenţei. Valoarea lui t

este bazată pe această medie a diferenţei (-2,00), divizată cu eroarea standard a

mediei (0,267). Calculul oferă valoarea lui t (-7,483).

77

Page 78: Introducere in Spss - Versiunea 19

X.4. Raportarea output-ului.

Rezultatele obţinute ar putea fi prezentate astfel: „Media numărului de

cuvinte verbalizate la 18 luni diferă semnificativ de media cuvintelor verbalizate

la 24 de luni.

XI. Testul t. Compararea a două eşantioane de scoruri necorelate/nerelaţionate._________________________________________________________________________________________________________________

Atunci cînd o investigaţie de tip statistic se efectuează pe un eşantion,

orice rezultat obţinut are o valoare relativă, în sensul că datele respective nu

numai că nu coincid cu cele referitoare la populaţie, dar nici măcar nu se poate

şti cu certitudine care este diferenţa dintre cele două genuri de date, de vreme ce

starea populaţiei este, de regulă, necunoscută. Teoria matematică a

probabilităţilor oferă însă proceduri pentru evaluarea rezultatelor studiilor

selective, permiţînd o estimare, în termeni de probabilitate, a marjei maxime de

eroare ce se poate comite prin utilizarea mărimilor din eşantion în locul celor

care caracterizează populaţia.

Testul t este în esenţă o procedură de testare a semnificaţiei diferenţei

dintre două medii.

Ca urmare, el este potrivit atunci când variabila dependentă este

măsurată pe scală cantitativă (interval-raport). Distribuţia teoretică de referinţă

(distribuţia de nul) este cea normală, pentru eşantioane mai mari de 30 de subiec

ţi, şi distribuţia t (Student), pentru eşantioane mai mici de 30 de subiecţi. Chiar

78

Page 79: Introducere in Spss - Versiunea 19

dacă formulele de calcul sunt diferite, forma de prezentare a rezultatelor şi ra

ţionamentul decizional sunt similare pentru ambele situaţii.

Testul t pentru eşantioane independente este utilizat pentru a calcula

dacă mediile pentru două seturi de variabile sunt diferite semnificativ una faţă de

cealaltă.

* Testul t pentru eşantioane independente este cel mai des folosit.

Testul t pentru eşantioane independente este utilizat atunci când cele

două seturi de variabile provin din două eşantioane diferite de oameni.

Procesarea unui Test t pentru eşantioane independente este ilustrată cu

datele din tabelul următorcare arată valorile la un test de emotivitate pentru 10

copii care provin din familii biparentale şi 10 copii care provin din familii

monoparentale. Scopul analizei este de a aprecia dacă valorile emotivităţii sunt

diferite la copii care provin din familii cu doi părinţi faţă de copii care provin

din familii monoparentale.

Familii biparentale

12 18 14 10 19 8 15 11 10 13

monoparentale 6 9 4 13 14 9 8 12 11 9

XI.1. Introducerea datelor

Pasul 1:În „Variable View” din „Data Editor”, se etichetează pe rând „Familii”.

Aceasta va defini cele două tipuri de familii.

Se etichetează al doilea rând „Emotivitate” (aici vor fi introduse rezultatele la testul de emotivitate).

Se înlătură cele două zecimale.

79

Page 80: Introducere in Spss - Versiunea 19

Pasul 2:

În „Data View” din „Data Editor” se introduc valorile pentru cele două variabile în primele două coloane.* Se observă că sunt două coloane

de date: A doua coloană conţine

cele 20 de valori ale testului de

emotivitate de la ambele grupe de

copii. Datele nu sunt păstrate

separat pentru cele două grupe;

valorile 1 din prima coloană indică copii proveniţi din familiile biparentale şi valorile 2 indică

copii proveniţi din familiile monoparentale. Astfel, este utilizată o singura variabilă

dependentă (în cazul nostru „emotivitatea”) şi altă coloană pentru variabila independentă

(familia). Cu alte cuvinte, fiecare rând în parte reprezintă un anumit copil şi variabilele sale

dependente şi independente sunt introduse separat în „Data Editor”.

80

Page 81: Introducere in Spss - Versiunea 19

XI.2. Efectuarea Testului t pentru eşantioane independente.

Se selectează: „Analyze”„Compare Means”„Independent Samples T test…”

Pasul 2:Se selectează „Emotivitate” şi apoi se apasă butonul ► pentru a introduce această variabilă în lista variabilelor de test.

Se selectează „Familie” şi apoi se apasă butonul ◄pentru a introduce această variabilă în căsuţa „Grouping Variable”.

Se selectează „Define Groups…” pentru a defini cele două grupuri.

Pasul 3: Se introduce:

81

Page 82: Introducere in Spss - Versiunea 19

- valoarea 1 (codul pentru familiile - biparentale) lături de eticheta- „Group 1” - valoarea 2 (codul pentru familiile - monoparentale) alături de eticheta- „Group 2”.

Se selectează „Continue”

Se apasă „OK” din ecranul precedent, care reapare.

XI.3. Interpretarea output-ului.

Primul tabel arată , pentru fiecare grup în parte, numărul de cazuri, media

şi abaterea standard. Media pentru familiile biparentale este 13,00. După cum se

observă există o diferenţă între cele două tipuri de familii, dar, întrebarea este

dacă mediile diferă semnificativ.

Valoarea lui t este media diferenţei (3,500) divizată cu eroarea standard a

diferenţei (1,493), diviziune ce produce valoarea 2,345.

Dacă valoarea semnificaţiei pentru Pentru varianţe egale, t este 2,345, Testul Levene este mai mare de 0,05, care la 18 grade de libertate este

82

Page 83: Introducere in Spss - Versiunea 19

lucru care se întâmplă aici (0,642) semnificativ la 0,031 pentru nivelul se foloseşte informaţia de pe acest two-tailed.prim rând.Dacă valoarea semnificaţiei pentru Testul Levene este mai mică de 0,05, se foloseşte informaţia de pe al doilea rând (al doilea rând oferă cifrele pentrucazul în care varianţele sunt diferitesemnificativ).

XI.4. Raportarea output-ului.

Rezultatele obţinute se pot raporta astfel: „Media pentru valorile testelor

de emotivitate ale copiilor ce provin din familii cu doi părinţi este semnificativ

mai mare decât cea a copiilor proveniţi din familiile cu un singur părinte”.

Dacă se preferă folosirea intervalelor de încredere , se poate scrie:

„Diferenţa dintre valorile testelor de emotivitate ale copiilor ce provin din

familii cu doi părinţi (M=13,00, SD=3,55) şi cei proveniţi din familii cu un

singur părinte (M=9,50, SD=3,10) este de 3,50. Intervalul de încredere de 95%

pentru această diferenţă este de la 0,36 la 6,63.Deoarece intervalul nu conţine

punctul 0,00 diferenţa este statistic semnificativă la nivelul de semnificaţie two-

tailed de 5%.

XI.5. Alegeţi răspunsul corect

1. Independent – Samples T Test se aplică în cazul:a. aceluiaşi eşantionb. eşantioanelor independente

83

Page 84: Introducere in Spss - Versiunea 19

c. eşantioanelor dependente

2. Independent – Samples T Test testează:a. dacă mediile a două grupe sunt egale;b. dacă mediile a două grupe diferă;c. dacă se compară mediile pentru un singur grup observat la momente diferite;

3. Testul „t” se foloseşte pentru:a. compararea a două seturi de date pentru identificarea diferenţelor;b. identificarea predictorilor pentru o variabilă numerică;c. compararea datelor de frecvenţă.

4. One sample T Test este un procedeu prin care:a. se compară mediile pentru un singur grup observat în momente diferiteb. se testează dacă mediile a două grupe sunt egalec. se testează dacă media unei variabile este egală cu o constantă specificatăb. se testează dacă mediile a două grupe diferă

5. Paired – Samples T test:a. testează dacă mediile a două grupe sunt egaleb. testează dacă media unei variabile este egală cu o constantă specificatăc. compară mediile pentru un singur grup observat în momente diferited. compară mediile pentru mai multe medii observate în momente diferite

6. Testul t pentru eşantioane independente este utilizat atunci când:a. cele două seturi de scoruri ce trebuie comparate provin dintr-un singur eşantion

b. coeficientul de corelaţie între cele două seturi este mare c. cele două seturi de variabile provin din două eşantioane diferite de oameni.

7. Testul t pentru eşantioane perechi este utilizat atunci când:a. cele două seturi de scoruri ce trebuie comparate provin dintr-un singur eşantion

b. coeficientul de corelaţie între cele două seturi este mare c. cele două seturi de variabile provin din două eşantioane diferite de oameni.

8. Testul t:

84

Page 85: Introducere in Spss - Versiunea 19

a. este folosit pentru evaluarea semnificaţiei statistice a diferenţei dintre mediile pentru două seturi de scoruri;b. este potrivit atunci când variabila dependentă este măsurată pe scală cantitativă (interval-raport). c. este utilizat pentru a calcula dacă mediile pentru două seturi de variabile sunt diferite semnificativ una faţă de cealaltă.

XI.6. Răspunsuri corecte

1. b. eşantioanelor independente;

2. a. dacă mediile a două grupe sunt egale;

3. a. compararea a două seturi de date pentru identificarea diferenţelor;

4. c. se testează dacă media unei variabile este egală cu o constantă

specificată;

5. c. compară mediile pentru un singur grup observat în momente

diferite

6. c. cele două seturi de variabile provin din două eşantioane diferite de

oameni.

7. a. cele două seturi de scoruri ce trebuie comparate provin dintr-un

singur eşantion

b. coeficientul de corelaţie între cele două seturi este mare

8. a. este folosit pentru evaluarea semnificaţiei statistice a diferenţei

dintre mediile pentru două seturi de scoruri;

85

Page 86: Introducere in Spss - Versiunea 19

b. este potrivit atunci când variabila dependentă este măsurată pe

scală cantitativă (interval-raport).

c. este utilizat pentru a calcula dacă mediile pentru două seturi de

variabile sunt diferite semnificativ una faţă de cealaltă.

XII. Testul Chi-Square. Diferenţe între frecvenţele eşantioanelor.__________________________________________________________________________________________________________________________________________________________________________________________________________________________________

În general Testul chi-square este folosit pentru evaluarea existenţei unei

diferenţe semnificative între două eşantioane formate din date de frecvenţă (date

nominale). Acesta, analizează tabelele de asociere sau contingenţă pe baza a

două variabile categoriale nominale.

*Testul chi-square analizează frecvenţe. Niciodată acestea nu trebuie să fie

transformate în procente pentru a fi introduse în SPSS, deoarece vor da rezultate eronate

atunci când se vor calcula valoarea şi semnificaţia chi-square.

* O analiză chi-square trebuie să includă datele fiecărui individ o singură dată, astfel

încât frecvenţele totale să fie egale cu numărul persoanelor folosite în analiză.

Tabel 1. Relaţia dintre site-urile accesate şi genul biologic.Respondenţi Site-uri

matrimonialeanunţuri muzică

Feminin 27 14 19Masculin 17 33 9

XII.1. Introducerea datelor din tabelul anterior folosind procedura „Weighing cases”.

Procesarea Testului chi-square folosind două sau mai multe eşantioane

este exemplificată cu datele din tabelul anterior, care arată care dintre cele trei

86

Page 87: Introducere in Spss - Versiunea 19

tipuri de site-uri este preferat de către un eşantion de 119 adolescenţi de ambele

sexe.

Pasul 1:

În meniul „Variable View” Se îndepărtează cele Se etichetează valoriledin „Data Editor” se etichetează două zecimale. „gen” şi „program”.primele trei coloane cu „gen biologic”, „Site” şi „Frecvenţă”.

87

Page 88: Introducere in Spss - Versiunea 19

Pasul 2:Se introduc valorile adecvate în meniul „Data View” din meniul „Data Editor”. Fiecare rând reprezintă una dintre cele şase celule din tabelul prezentat anterior.

88

Page 89: Introducere in Spss - Versiunea 19

Paul 3:

Pentru a pondera aceste celule se selectează: „Data”„Weight Cases…”

Pasul 4:

Se selectează „Frecvenţa”, „Weight cases by” şi apoi se apasă butonul ◄.

Se apasă „OK”.

XII.2. Introducerea datelor din tabelul 1 caz cu caz.

Se introduc valorile pentru cele două variabile în fiecare dintre cele 119 cazuri.

XII.3. Efectuarea Testului chi-square pe baza tabelului 1.

89

Page 90: Introducere in Spss - Versiunea 19

Pasul 1:

Se selectează:„Analyze”„descriptives statistics”„Crosstabs…”(tabele de asociere)

90

Page 91: Introducere in Spss - Versiunea 19

Pasul 2:

Se selectează „Gen” şi se apasă butonul ► pentru „Row(s)”: pentru a-l introduce în caseta respectivă.

Se selectează „Site” şi se apasă butonul ◄ pentru „Column(s)”: pentru a-l introduce în caseta respectivă.

Se selectează „Statistics…”

Pasul 3:

Se selectează „Chi-square”.Se selectează „Continue”.

Pasul 4:

Se selectează „Cells..”

Pasul 5:În secţiunea „Counts” se selectează „Expected”. Se selectează„Unstandardized” în secţiunea „Residuals”. Se selecteaze „Continue”, apoi se apasă „OK în ecranul anterior care reapare.* Termenul „rezidual” se referă la diferenţe.

91

Page 92: Introducere in Spss - Versiunea 19

XII.4. Interpretarea output-ului pentru Testul chi-square.

Acest al doilea tabel din output indică frecvenţa (Count), frecvenţa aşteptată (Expected Count” şi diferenţa (Residual) dintre cele două pentru fiecare dintre cele şase celule ale tabelului.

De exemplu: Frecvenţa sau numărul de

fete care spun că preferă site-rile de matrimoniale este de 17, iar numărul anticipat de probabilitate este 21,8, diferenţa dintre cele două valori fiind de – 4,8.

Al treilea tabel, şi ultimul indică valoarea coeficientului (Pearson) chi-square (13,518), gradele de libertate (2) şi semnificaţia two-tailed (0,001). Din moment ce această valoare este mai mică de 0,05, coeficientul chi-square este semnificativ.

Al doilea tabel indică frecvenţele observate şi cele aşteptate ale cazurilor şi

diferenţa (valoarea reziduală) dintre acestea pentru fiecare celulă. Frecvenţa

observată (numită „Count”) este prezentată prima, apoi frecvenţa aşteptată

(numită „Expected Count”. Frecvenţele observate sunt întotdeauna numere

întregi, astfel încât să fie uşor de localizat.

92

Page 93: Introducere in Spss - Versiunea 19

Coloana finală din tabel etichetată „Total” conţine numărul de cazuri din

respectivul rând, urmat de numărul aşteptat de cazuri din tabel.

Astfel primul rând are 60 de cazuri, urmat de numărul aşteptat de cazuri

din tabel. Astfel, primul rând are 60 de cazuri, număr care va fi identic

numărului de cazuri aşteptate (adică 60).

În mod similar, rândul final din acest tabel (etichetat „Total) prezintă mai

întâi numărul de cazuri din respectiva coloană urmat de numărul aşteptat de

cazuri din tabel pentru coloana respectivă. Astfel, prima coloană are 44 de

cazuri, număr care ca fi întotdeauna egal cu numărul aşteptat de cazuri (adică

44,0).

Valoarea chi-square, gradul său de liberate şi nivelul său de semnificaţie sunt

afişate în al treilea tabel care începe cu „Pearson” (cel care a elaborat acest test).

Valoarea chi-square este de 13,518, care, rotunjită la un număr cu două

zecimale, devine 13,52. Gradul său de libertate este 2, iar probabilitatea two-

tailed exactă este 0,001.

Sub acest tabel se mai poate vedea şi mărimea „minimum expected count” a

oricărei celule din tabel, care este 13,88 pentru ultima celulă (fetele care preferă

site-urile cu muzică). Dacă diferenţa minimă aşteptată este mai mică decât 5.0,

atunci trebuie să se acorde foarte multă atenţie Testului chi-square.

* Dacă se foloseşte un tabel 2x2 de tip chi-square şi apar frecvenţe anticipate reduse, este

recomandat să se folosească testul Fisher, pe care aplicaţia SPSS îl include în output în astfel

de situaţii.

XII.5. Raportarea output-ului pentru Testul chi-square.

Există două modalităţi de descriere a rezultatelor.

* Pentru o persoană neexperimentată aceste două posibilităţi de interpretare pot părea

foarte diferite, dar, practic, ele înseamnă acelaşi lucru.

93

Page 94: Introducere in Spss - Versiunea 19

Rezultatele se pot descrie astfel: „A existat o diferenţă semnificativă

între frecvenţele observate şi cele aşteptate în cazul adolescenţilor băieţi şi fete

în ceea ce priveşte preferinţa lor pentru cele trei tipuri de site-uri ( χ2 =

13,51. DF = 2, p = 0,001)”.

O altă posibilitate de interpretare a rezultatelor obţinute ar putea fi:

„ Există o asociere semnificativă între genul biologic şi tipul de site

preferat ( χ2 = 13,51. DF = 2, p = 0,001)”.

Raportarea şi direcţia rezultatelor se poate face astfel: „ Fetele tind mai

mult decât băieţii să prefere site-urile cu anunţuri (de toate genurile) şi preferă

mai puţin site-urile despre matrimoniale sau pe cele cu muzică”.

94

Page 95: Introducere in Spss - Versiunea 19

XIII. Recodificarea variabilelor.

Aplicaţia SPSS poate recodifica valori în mod rapid şi cu uşurinţă, ceea ce

îi oferă cercetătorului o mare libertate de recodificare a datelor.

*Nu se modifică variabilele decât în cazul în care este absolut sigur că se doreşte

modificarea permanentă a datelor originare.

Scorurile abilităţilor muzicale şi matematice obţinute de către un număr de 10 copii

Scor muzică Scor matematică Gen biologic Vârstă3 7 1 107 5 1 98 4 2 129 4 1 89 5 2 116 8 2 134 9 2 73 9 1 104 7 2 97 6 1 11

* Scorurile abilităţilor muzicale şi matematice sunt aceleaşi care au fost prezentate anterior în capitolul VIII.1.

Dorim să se realizeze corelaţia dintre valorile abilităţilor muzicale şi a

celor matematice, în cazul copiilor mici şi a celor mari. Pentru a realiza această

corelaţie este important să se stabilească numărul de grupe de vârstă dorite. În

acest caz se vor alege două grupe de vârstă: copii mai mici de 10 ani şi copii mai

mari de 10 ani.

XIII.1. Recodificarea rezultatelor.

Pasul 1:

Se introduc datele aşa cum este prezentat în tabelul alăturat.(Paşii de introducere a datelor sunt prezentaţi în capitolele anterioare).

95

Page 96: Introducere in Spss - Versiunea 19

Pasul 2:

Se selectează „Transform”, „recode” Şi „Into Different Variables”

Pasul 3:

Se selecteaă „Vârstă” şi se apasă butonul ◄ pentru a introduce „Vârsta” în caseta „Numeric Variable – Output variable”.Se introduce numele noii variabile.Se selectează „Change” pentru a adăuga acest nume Se selectează „Old and New values”.nou în caseta „Numeric variable – Output Variable”.

Pasul 4:

Se selectează „Lowest through” şi se scrie 9 în caseta alăturată.

Se selectează „Value” din meniul „new value” şi se scrie 1 în căsuţa alăturată.

Se selectează „Add” şi se introduce „lowest throught 9→1 „ în caseta „Old→New”.

96

Page 97: Introducere in Spss - Versiunea 19

Pasul 5:

Se selectează „Range: through highest” şi se scrie 10 în caseta de lângă el.Se selectează „value” şi se scrie 2 în caseta alăturată.

Se selectează „Add” şi se introduce „10 through Highest→2” în caseta „Old→New”. Se apasă „OK” în ecranul care va reapărea.Pasul 6:Noua variabilă şi valorile sale sunt afişate în meniul „Data View”.

1 semnifică copii cu vârste mai mici de 10 ani

2 semnifică copii cu vârste mai mari de 10 ani.

Pentru o astfel de recodificare se deschide fereastra Recode into Different Variables (din meniul Transform comanda Recode) în care:

- se selectează variabila pe care dorim să o recodificăm din lista variabilelor din partea stângă şi se mută în lista variabileor de recodat;

- se scrie numele noii variabile în caseta Name din zona Output Variable;- se scrie în caseta Label eticheta noii variabile;- se acţionează butonul de comandă Change pentru a se realiza modificarea.Pentru a defini categoriile variabilei numerice acţionăm butonul de comandă Old and

New Values ce are ca efect deschiderea unei ferestre de dialog în care pentru a schimba o valoare particulară într-o valoare nouă se introduce valoarea veche în caseta Old Value şi valoarea nouă în caseta New Value şi se acţionează butonul Add.

De regulă se schimbă o valoare reală cu altă valoare reală. În acest scop selectăm butonul de opţiuni Range. Casetele de editare sunt folosite pentru a stabili limita inferioară şi respectiv limita superioară a intervalului dorit. Apoi se selectează butonul de opţiuni Value din zona New Value în care se introduce noua valoare şi acţionăm butonul Add.

97

Page 98: Introducere in Spss - Versiunea 19

Prin clic pe butonul de comandă Continue se revine în fereastra Record into Different Variables în care acţionăm OK pentru recodificarea variabilei.

XIII.2. Alegeţi răspunsul corect

1. Comanda RECODE permite:a. recodificarea într-o variabilă diferită sau în aceeaşi variabilă;b. tranformarea unei variabile prin divizarea valorilor acesteia într-un număr mai mare de categorii;c. combinarea valorilor acestei variabile cu scopul creării unei alte serii;

2. Comanda RECODE se găseşte în meniul:a. transform/recode/into different variables;b. transform/recode/into same variables;c. ambele variante de mai sus.

3. Chi – Square a. testează egalitatea a două sau mai multe proporţiib. testează egalitatea unei proporţii cu o valoare specificatăc. testează egalitatea mediilor a două eşantioane independented. testează egalitatea mediilor a două eşantioane perechi

4. Pentru recodificarea în aceeaşi variabilă se selectează:a. transform/recode/into different variables;b. transform/recode/into same variables;

c. nicio variantă de mai sus.

5. Pentru recodificarea într-o variabilă diferită se selectează:a. transform/recode/into different variables;b. transform/recode/into same variables;

c. nicio variantă de mai sus.

98

Page 99: Introducere in Spss - Versiunea 19

XIII.3. Răspunsuri corecte

1. a. recodificarea într-o variabilă diferită sau în aceeaşi variabilă;

2. c. ambele variante de mai sus.

3. a. testează egalitatea a două sau mai multe proporţii

4. b. transform/recode/into same variables;

5. a. transform/recode/into different variables;

99

Page 100: Introducere in Spss - Versiunea 19

XIV. Calculul variabilelor noi.__________________________________________________________________________________________________________________________________________________________________________________________________________________________________

Calculul variabilelor noi permite adunarea, scăderea, etc. a valorilor

câtorva variabile pentru a obţine o nouă variabilă.

Exemplu: Se doreşte să se adune câteva întrebări dintr-un chestionar, pentru a

obţine un indice general al ceea ce măsoară chestionarul.

Atunci când sunt măsurate variabilele psihologice, se folosesc mai multe

întrebări pentru a măsura mai mult sau mai puţin acelaşi lucru.

De exemplu, următoarele afirmaţii pot fi folosite pentru evaluarea satisfacţiei

profesională:

a. În general mă bucură profesia mea.

b. Uneori stresul de la serviciu devine insuportabil.

c. Unii colegi sunt enervanţi câteodată.

d. Viitorul pare promiţător la locul de muncă.

Participanţilor li se cere să afirme în ce măsură sunt de acord cu fiecare

dintre aceste afirmaţii, pe următoarea scală de la 1 la 4:

1. întru totul de acord; 2. de acord;

3. dezacord; 4. total dezacord.

Aceşti itemi se pot folosi pentru a determina nivelul de satisfacţie

profesională a angajaţilor, prin adunarea răspunsurilor date tuturor celor patru

afirmaţii.

Întru totul de acord

De acord dezacord Total dezacord

Respondent 1Respondent 2Respondent 3

Deoarece este nevoie de scoruri mari pentru a indica satisfacţia

profesională, se va inversa evaluarea, astfel:

4. total de acord; 3. de acord;

100

Page 101: Introducere in Spss - Versiunea 19

2. dezacord; 1. total dezacord.

XIV.1. Procedura unei variabile noi.Pasul 1:Se scrie un nume pentru noua variabilă în caseta de sub „Target Variable” (ex. scor total.Se scrie sau se selectează termenii expresiei şi se introduc în caseta „Numeric Expression”.Se apasă „OK”.Se selectează „Paste” pentru a salva această procedură sub formă de sintaxă.

Pasul 4: Pentru a salva această procedură sub formă de fişier de sintaxă, se selectează „Paste” în caseta principală. Această comandă de sintaxă va apărea în fereastra „Syntax”.

101

Page 102: Introducere in Spss - Versiunea 19

XV. Testele rangurilor. Statistici nonparametrice._________________________________________________________________________________________________________________

Testele nonparametrice sunt folosite atunci când nu este îndeplinită

condiţia ca scorurile fiecărei variabile să fie cât de cât normal distribuite (în

formă de clopot). Aceste teste fac mai puţine presupuneri referitoare la

caracteristicile populaţiei de la care provin datele, trăsătură care nu este

caracteristică testelor parametrice (cum ar fi Testul t). Metodele statistice

nonparametrice nu testează diferenţele dintre medii, deoarece acestea folosesc

scoruri transformate în ranguri. De obicei, prin aceste metode se verifică dacă

rangurile dintr-un grup sunt mai mari sau mai mici decât rangurile din celălalt

grup.

În acest capitol vom vorbi despre Testul semnului şi Testul Wilcoxon

pentru date corelate (eşantioane perechi). Cu alte cuvinte, aceste teste sunt

echivalentele nonparametrice ale Testului t pentru eşantioane perechi.

Testul U Mann-Witney se foloseşte pentru date nerelaţionate, acesta

fiind echivalentul nonparametric al Testului pentru eşantioane independente.

Procesarea a două teste nonparametrice pentru scoruri relaţionate este

exemplificată folosind datele din tabelul următor, care a fost folosit şi în

capitolul X şi care indică numărul de cuvinte pe care aceeaşi copii le-au

verbalizat cu mamele lor la 18 luni şi la 24 luni.

Numărul de cuvinte verbalizate într-un minut la vârste diferite.

Alina Cristina Raluca Carmen Simona Radu Cristi Dan 18 luni 3 2 4 5 2 3 2 424 luni 5 4 7 8 3 4 4 6

102

Page 103: Introducere in Spss - Versiunea 19

XV.1. Scoruri relaţionate: testul semnului.

Pasul 1:

În „Data View” din „Data Editor”se introduc datele în primele două coloane.

Pasul 2:

Se selectează:„Analyze”„Nonparametric Tests”

„Legacy dialog”

„2 Related Samples…”

Pasul 3: Se selectează „Optsprezece” şi „douăzecisipatru” şi se apasă butonul ◄ pentru a introduce aceste două variabile în caseta „Test Pair(s) List”.Se deselectează „Wilcoxon”.Se selectează „Sign”.

Se apasă „OK”.

XV.2. Interpretarea output-ului pentru testul semnului.Se poate ignora primul dintre cele

două tabele care indică numărul de

diferenţe negative (0), pozitive (8)

103

Page 104: Introducere in Spss - Versiunea 19

şi inexistente (0) în ceea ce priveşte numărul de cuvinte verbalizate la cele două

vârste.

Al doilea tabel indică nivelul de semnificaţie al acestui test. Probabilitatea two-tailed este de 0,008 ceea ce este semnificativ la nivelul de 5%.

XV.3. Raportarea output-ului pentru testul semnului.

Rezultatele obţinute pot fi raportate astfel: „Există o schimbare

semnificativă la nivelul numărului de cuvinte verbalizate de la 18 luni la 24 de

luni (Testul semnului: N=0,008).

XV.4. Scoruri relaţionate: testul Wilcoxon.Testul Wilcoxon reprezintă opţiunea predefinită în caseta de dialog a

testelor cu două eşantioane perechi. Dacă s-a deselectat anterior, se selectează

din nou.

104

Page 105: Introducere in Spss - Versiunea 19

Se poate ignora primul dintre cele două tabele de output. Acestea indică

numărul de diferenţe negative (0), pozitive (8) şi inexistente (0) în ceea ce

priveşte datele ordonate după cele două vârste, şi media şi suma catalogate

negative şi pozitive. Valorile pentru „două zeci şi patru „ de luni sunt mai mari

decât cele pentru „optsprezece” luni.

Al doilea tabel indică nivelul de

semnificaţie al acestui test. În loc să

folosească tabelul valorilor critice,

computerul utilizează o formulă care

stabileşte o conexiune cu distribuţia Z.

Scorul Z este de – 2,558, care are o

probabilitate two-tailed de 0,011. Aceasta înseamnă că diferenţele dintre cele

două variabile sunt semnificative din punct de vedere statistic la un nivel de 5%.

XV.6. Raportarea output-ului pentru Testul Wilcoxon.

Rezultatele obţinute pot fi raportate astfel: „Există o diferenţă

semnificativă între numărul de cuvinte verbalizate de copii între 18 şi 24 de luni

(Wilcoxon: N=8, z =2,56, two-tailed p = 0,011)”.

XV.7. Scoruri nerelaţionate: Testul U Mann-Whitney.

Pentru procesarea unui test nonparametric pentru scoruri necorelate, vom

folosi datele din tabelul următor, care indică scoruri ale emotivităţii obţinute de

10 copii care provin din familii biparentale şi 10 copii care provin din familii

monoparentale.

Familii biparentale

12 18 14 10 19 8 15 11 10 13

monoparentale 6 9 4 13 14 9 8 12 11 9

Pasul 1:

105

Page 106: Introducere in Spss - Versiunea 19

- este acelaşi ca şi cel prezenta la capitolul XI.

Pasul 2:

Se selectează:„Analyze”„Nonparametric tests”„Legacy dialog”„2 Independent Samples…

Pasul 3:

Se selectează „Emotivitate” şi se apasă butonul ►pentru a introduce parametrul „Emotivitate” în caseta „Test Variable List”.

Se selectează „Familie” şi se apasă butonul ◄pentru a introduce „Familie” în caseta „Grouping Variables”.

Se selectează „Define Groups…”

Pasul 4:

Se scrie 1 (pentru un singur părinte) în c aseta de lângă „Group 1”. Se scrie 2 (pentru 2 părinţi) în caseta de lângă „Group 2”.Se selectează „Continue”.Se apasă „OK” din ecranul anterior care va reapărea.

106

Page 107: Introducere in Spss - Versiunea 19

XV.8. Interpretarea output-ului pentru testul U Mann-Whitney.

Se poate ignora primul dintre cele două tabele de output. Acest tabel

indică faptul că rangul mediu dat parametrului „Emotivitate” pentru primul grup

(adică valoarea 2) este 13,15, iar rangul mediu pentru al doilea grup (adică

valoarea 1) este de 7,85. Aceasta înseamnă că valorile din grupul 2 (biparentale)

au tendinţa să fie mai mari decât cele din grupul 1 (monoparentale).

Al doilea tabel indică statistica de bază mann-

Whitney, valoarea U fiind de 23,500, ceea ce

este semnificativ din punct de vedere statistic

la un nivel de 0,043.

Computerul a listat şi un scor Z de -2,011, care

este semnificativ la nivel de 0,044.

Aceasta este valoarea Testului Mann-Whitney

atunci când se aplică o corecţie pentru ranguri înrudite. După cum se poate

vedea, aceasta a modificat nivelul de semnificaţie doar marginal, de la 0,44 la

0,44.

XV.9 Raportarea output-ului pentru Testul U Mann-Whitney.

Rezultatele obţinute în urma acestei analize se pot raporta astfel: „ Testul

U Mann-Whitney a concluzionat că scorurile emotivităţii la copii din fa,iliile cu

107

Page 108: Introducere in Spss - Versiunea 19

doi părinţi sunt semnificativ mai mari decât la cei din familiile cu un singur

părinte (U=23,5, N1,2=10, p two-tailed p= 0,044)”.

XVI. Analiza de varianţă (ANOVA). Introducere în metoda one-way ANOVA cu scoruri nerelaţionate sau necorelate._________________________________________________________________________________________________________________

Analiza de varianţă cu scoruri nerelaţionate/necorelate indică măsura în

care câteva (două sau mai multe) grupuri au medii foarte diferite.

*Grupurile diferite aparţin variabilei independente iar valorile numerice corespund

variabilei dependente.

Analiza de varianţă calculează variaţia dintre scoruri şi pe cea dintre

mediile eşantioanelor.

One – way ANOVA este folosit pentru testare pentru diferenţele între

două sau mai multe grupe independente. ANOVA este utilizat pentru a testa

diferenţe între cel puţin trei grupuri, deoarece cele două grupuri de caz pot fi

acoperite de u un T-test.

De fapt, testul t independent este un tip special de ANOVA simpla în

care sunt implicate doar doua grupe. ANOVA simpla permite evaluarea ipotezei

nule între mediile a doua sau mai multe serii de date cu restricţia ca acestea sa

fie trepte ale aceleiaşi variabile independente.

ANOVA simpla permite compararea simultana a trei sau mai multe

grupe menţinând nivelul la valoarea dorita, de maxim 0,05.

Procesarea analizei one-way de varianţă cu scoruri nerelaţionate este

exemplificată folosind datele din tabelul următor, care indică rezultatele obţinute

de către diferiţi participanţi în condiţii diferite. Este vorba despre un studiu

asupra efectului unor tratamente hormonale şi placebo asupra depresiei.

Astfel, medicamentul este variabila independentă şi depresia este

variabila dependentă.

108

Page 109: Introducere in Spss - Versiunea 19

Date studiu

XVI.1. Metoda one-way ANOVA pentru eşantioane independente.

Pasul 1:

Se introduc datele. Se codifică cele trei condiţii cu valorile 1, 2, 3. Se etichetează „Hormon 1”, „Hormon 2” şi „Placebo”.

Pasul 2:

Se selectează:„Analyze”„Comparea Means”„One-Way ANOVA”.

Pasul 3:Se selectează „depresie” şi se apasă butonul ►de lângă caseta „Dependent List” – pentru a introduce parametrul în casetă.

Se selectează „Condiţie” şi se apasă butonul ◄ de lângă caseta „Factor” – pentru a introduce parametrul acolo.

Grup 1Tratament hormonal

Grup 2Tratament hormonal

Grup 3Placebo

8 4 411 2 68 4 4

109

Page 110: Introducere in Spss - Versiunea 19

Se selectează „Options…

Pasul 4: Se selectează metodele statistice „descriptive” şi „Homogenity of variance test”.

Se selectează „Continue…”.Se apasă „OK” din ecranul anterior, care va reapărea.

XVI.2. Interpretarea output-ului.

Primul tabel oferă diferite statistici descriptive, cum ar fi numărul de cazuri, media şi abaterea standard în cele trei condiţii şi pe eşantionul total.

Al doilea tabel oferă rezultatele Testului Levene al similarităţii varianţelor. Acest test nu este semnificativ deoarece are o semnificaţie de 0,441.

110

Page 111: Introducere in Spss - Versiunea 19

Al treilea tabel indică rezultatele analizei de varianţă. Raportul F este

semnificativ la nivel de 0,00, acesta fiind mai mic decât 0,05.

Raportul F se calculează prin împărţirea „sum of square” (suma

pătratelor abaterilor de la medie) dintre grupe, este împărţită suma pătratelor de

la media din interiorul grupelor (sum of squares groups)m ceea ce dă un Raport

F de 13,941 (20,333/0,889 = 13,941).

Aceasta înseamnă că există o diferenţă semnificativă între cele trei

grupuri.

XVI.3. Raportarea ouput-ului.

Rezultatele obţinute pot fi raportate astfel: „Per total, efectul tratamentului

cu medicamente a fost semnificativ (F2,6 = 13,94, p= 0,00). În schimb, nu a

existat nicio diferenţă semnificativă între media controlului placebo şi media

tratamentului hormonal 2.

111

Page 112: Introducere in Spss - Versiunea 19

XVII. Analiza de varianţă bifactorială pentru scoruri nerelaţionate/necorelate._________________________________________________________________________________________________________________

Analiza two-way de varianţă permite compararea mediilor unei variabile

dependente atunci când există două variabile independente.

Dacă există mai mult de o variabilă dependentă, atunci analiza se

realizează separat pentru fiecare variabilă.

Realizarea unei analize two-way pentru scoruri nerelaţionate de varianţă

este exemplificată în tabelul următor, care indică scorurile obţinute de către

diferiţi participanţi în şase condiţii, reflectând cei doi factori ai privării de somn

şi alcool. Scopul acestei analize este acela de a aprecia dacă diferitele combinaţii

de cafea şi deprivare de somn afectează diferenţiat numărul mediu de greşeli

făcute.

Datele pentru un experiment referitor la privarea de somn:Numărul de erori în cazul unui test video.

privare de somn3 ore 6 ore 9 ore

Consum alcool 14 16 2010 14 2215 23 30

Fără alcool 9 11 109 8 1412 11 12

112

Page 113: Introducere in Spss - Versiunea 19

XVII.1. Metoda two-way ANOVA pentru scoruri nerelaţionate.

Se introduc datele. Cele ouă coduri pentru „Alcool” (1=alcool; 2= fără alcool) – în prima coloană.

Cele trei coduri pentru „Privare de somn” se regăsesc în a doua coloană (1= 3 ore, 2= 6 ore, 3= 9 ore).

Greşelile sunt prezentate în a treia coloană.

Se elimină cele două zecimale din mediul „Variable View”.

Pasul 2:

Se selectează:„Analyze”„General Linear Model”„Univariate…”

Pasul 3:

Se selectează „Erori” şi se apasă butonul ► de lângă caseta „Dependent Variable”pentru a introduce parametrul acolo. Se selectează „Alcool” şi „Privare de somn” fie împreună, fie separat, şi se apasă butonul „Fixed factor(s)” pentru a le introduce în casetă.

113

Page 114: Introducere in Spss - Versiunea 19

Se selectează „Options…”

Pasul 4:

Se selectează „Descriptives statistics” şi „Homogeneity test”.

Se selectează „Continue”.

În ecranul anterior, care va reapărea, se selectează „Plots…”.Pasul 5:

Se selectează „Alcool” şi se apasă butonul ► de lângă caseta „Horizontal axis” – pentru a introduce parametrul acolo.

Se selectează „Privare de somn” şi se apasă butonul ◄ de lângă caseta „Separate Lines” - pentru a introduce opţiunea în casetă.

Se selectează „Add”.Se selectează „Continue”. Se apasă „OK” din ecranul anterior

care va reapărea-

114

Page 115: Introducere in Spss - Versiunea 19

XVII.2. Interpretarea output-ului.

Acest tabel conţine mediile , abaterile standard şi numărul (N) de cazuri pentru cele două variabile „Alcool” şi „Privare de somn”. Luate separat sau împreună.Media pentru condiţia „Alcool” este comparată cu „Totalul” pentru„Privare de somn” (adică 18,22). Media pentru privare de 3 ore de somn este comparată cu „Total” pentru „Alcool” (adică 11,50).

Al treilea tabel de oferă informaţii referitoare la Testul Levene, care verifică similaritatea varianţelor. Din moment ce semnificaţia acestui test este 0,085 (valoarea care este mai mare decât 0,05), varianţele sunt similare

Al patrulea tabel indică nivelele de semnificaţie pentru cele două variabile „Alcool” şi „Privare de somn”, şi interacţiunea dintre acestea.

115

Page 116: Introducere in Spss - Versiunea 19

În tabelul de analiză a varianţei, raportul F pentru cele două efecte principale

(Alcool şi Privare de somn) este prezentat primul.

Pentru prima variabilă, cea a alcoolului, Raportul F este 22,891, ceea ce este

semnificativ la nivelul 0,000. Deoarece sunt numai două condiţii pentru ca acest

efect să se producă, se poate conhide că scorul mediu al uneia dintre condiţii

este mult mai mare decât pentru cealaltă.

Pentru a doua variabilă a privării de somn, aceasta este egală cu 5,797,

valoare care are un nivel exact de semnificaţie de 0,017. Astfel, Raportul f este

semnificativ din punct de vedere statistic la un nivel de 0,05, ceea ce înseamnă

că mediile celor trei condiţii legate de somn nu sunt similare.

Mediile care diferă de celelalte pot fi determinate ulterior prin folosirea

testelor de comparaţii multiple, cum este Testul t pentru eşantioane

independente.

raportul F pentru interacţiunile dintre cele două variabile (Alcool şi Privare

de somn) este de 2,708 → nivelul de semnificaţie al acestui raport este de

0,107→ nu este nicio interacţiune semnificativă.

Acest grafic este realizat pentru mediile celor şase condiţii. El a fost editat

cu ajutorul comenzii “Chart Editor”.

116

fara alcoolalcool

alcool

22,50

20,00

17,50

15,00

12,50

10,00

Est

imat

ed M

arg

inal

Mea

ns

9 ore

6 ore

3 ore

privare de somn

Estimated Marginal Means of erori

Page 117: Introducere in Spss - Versiunea 19

XVII.3. Raportarea output-ului.

Rezultatele din output se pot raporta astfel: „O analiză de varianţă two-way ANOVA demonstrează obţinerea unor efecte semnificative în cazul alcoolului (F = 22,981, p< 0,001) şi al privării de somn (F=5,80, p = 0,017), dar nu şi în cazul interacţiunii celor două variabile (F =2,70, p= 0,107).

117

Page 118: Introducere in Spss - Versiunea 19

XVIII. Comparaţii multiple cu ANOVA.__________________________________________________________________________________________________________________________________________________________________________________________________________________________________

Acest capitol extinde aria de acoperire a Testelor t multiple prezentate în

capitolele anterioare şi explică modul în care se decide care perechi de medii

sunt diferite în mod semnificativ între ele, în cazul analizei de varianţă.

Această tehnică se foloseşte atunci când sunt mai mult de două medii.

Pentru a prezenta această procedură vor fi folosite informaţiile prezentate

la capitolul XV.

Date studiu

Pasul 1:

Se introduc datele. Se codifică cele trei condiţii cu valorile 1, 2, 3. Se etichetează „Hormon 1”, „Hormon 2” şi „Placebo”.

Pasul 2:

Se selectează:„Analyze”„Comparea Means”„One-Way ANOVA”.

Grup 1Tratament hormonal

Grup 2Tratament hormonal

Grup 3Placebo

8 4 411 2 68 4 4

118

Page 119: Introducere in Spss - Versiunea 19

Pasul 3:Se selectează „depresie” şi se apasă butonul ►de lângă caseta „Dependent List” – pentru a introduce parametrul în casetă.

Se selectează „Condiţie” şi se apasă butonul ◄ de lângă caseta „Factor” – pentru a introduce parametrul acolo. Se selectează „Post Hoc…”

Pasul 4:

Se selectează:„Tukey”„Duncan”„Scheffe”.

Se apasă „Continue”.

Se selectează „OK” în ecranul care va apărea din nou.

XVIII.1. Interpretarea output-ului.

Primul tabel reprezintă rezultatele analizei de varianţă. Raportul F pentru efectul dintre grupuri (adică efectul hormonilor) este 13,941, care are un nivel

119

Page 120: Introducere in Spss - Versiunea 19

exact de semnificaţie de 0,006. Acest lucru înseamnă că efectul dintre grupuri este semnificativ; per total, mediile pentru cele trei grupuri diferă.

Al doilea tabel şi ultimul oferă rezultatele celor trei teste de comparaţii multiple.

Dacă se foloseşte Testul Tukey al diferenţei semnificative oneste (HSD), media de la grupul hormonului 1 este semnificativ diferită de media de la grupul hormonului 2 (semnificaţia=0,06) şi semnificaţia de la media grupului Controlului placebo (semnificaţia=0,020).

Subgrupele omogene.

Grupul hormonului 2 şi al controlului Placebo aparţin aceleiaşi subgrupe, ceea ce înseamnă că nu sunt semnificativ diferite.

Grupul hormonului 1 este singurul din această a doua subgrupă, motiv pentru care aceasta este semnificativ diferită de mediile celorlalte două grupe. * Sunt reprezentate mediile grupelor din subgrupele omogene.

a. Foloseşte Media armonică a dimensiunilor eşantioanelor =3,000.

120

Page 121: Introducere in Spss - Versiunea 19

Tabelul final, numit „Subgrupele omogene”, enumeră grupurile de medii care

nu sunt semnificativ diferite între ele.

Dacă se ia în calcul aceste două rânduri pentru a se folosi în Testul Tukey HSD,

în acest caz există două subgrupe de medii. Subgrupa 1 indică faptul că mediile

grupelor hormonului 2 şi ale controlului placebo cu valorile 3,33 şi 4,67 nu

diferă semnificativ. Subgrupa 2 conţine doar media grupei hormonului 1, în

valoare de 9,00. Astfel, media grupului hormonului 1 este semnificativ diferită

atât de media grupei hormonului 2, cât şi de cea a gupelor de control placebo.

Toate cele trei teste prin comparaţii multiple sugerează acelaşi lucru: faptul

că există diferenţe semnificative între grupele hormonului 1 şi hormonului 2 şi

între grupele hormonului 1 şi cele ale controlului placebo. Alte diferenţe nu mai

există.

XVIII.2. Raportarea output-ului.

Rezultatele output-ului pot fi raportate astfel: „O analiză de varianţă

unifactorială pentru scoruri necorelate a demonstrat producerea unui efect

general semnificativ pe tip de tratament medicamentos (F=13,94, p= 0,06). Prin

Metoda Scheffe de analiză a intervalului s-a descoperit că grupul hormonului 1

era diferit de grupul hormonului 2 (p= 0,07) şi de grupul controlului placebo

(p=0,24), dar nu s-au mai găsit alte diferenţe semnificative”.

121

Page 122: Introducere in Spss - Versiunea 19

XIII.2. Alegeţi răspunsul corect

1. Calculul variabilelor noi:a. adunarea şi scăderea;b. înmulţirea şi împărţirea;c. ambele variante de mai sus.

2. Analiza de varianţă (ANOVA):a. indică măsura în care două sau mai multe grupuri au medii foarte

diferite;b. calculează variaţia dintre două scoruri;c. calculează variaţia dintre mediile eşantionului.

3. ANOVA este utilizată pentru:a. a testa diferenţa între cel puţin 2 grupuri;b. a testa diferenţa între cel puţin 3 grupuri;c. a testa diferenţa între cel puţin 4 grupuri;

4. Analiza two-way de varianţă permite:a. compararea mediilor unor variabile independente;b. compararea mediilor dintre două grupuri;c. compararea mediilor unei variabile dependente atunci când există

două variabile independente.

5. Comparaţiile multiple cu ANOVA:a. explică modul în care se decise care perechi de medii sunt diferite

în mod semnificativ între ele;b. se foloseşte atunci când sunt mai mult de două medii;c. indică scorurile obţinute de respondenţi.

122

Page 123: Introducere in Spss - Versiunea 19

XIII.3. Răspunsuri corecte

1. c. ambele variante de mai sus.

2. a. indică măsura în care două sau mai multe grupuri au medii foarte

diferite;

3. b. testa diferenţa între cel puţin 3 grupuri;

4. c. compararea mediilor unei variabile dependente atunci când există

două variabile independente.

5. a. explică modul în care se decise care perechi de medii sunt diferite

în mod semnificativ între ele;

b. se foloseşte atunci când sunt mai mult de două medii;

123

Page 124: Introducere in Spss - Versiunea 19

BIBLIOGRAFIE

1. Clocotici Vasile, Stan Aurel, 2000 – Statistica aplicată în psihologie, Ed.

Polirom, Iaşi;

2. Dennis Howitt, Duncan Cramer, 2006 – Introducere în SPSS pentru

psihologie, Ed. Polirom, Iaşi;

2. Howell, D, (2002), Statistical Methods for Psychology, Ediţia a v-a,

Duxbury Press Boston;

3. Jaba Elisabeta, Gramma Ana, (2004) – Analiza statistică cu SPSS sub

Windows, Ed. Polirom, Iaşi;

4. Radu Ioan şi alţii, (1993) – Metodologie psihologică şi analiza datelor,

Ed. Sincrom, Cluj – Napoca;

5. Rotariu T şi alţii, (2006) – Metode statistice aplicate în ştiinţele sociale,

Ed. Polirom, Iaşi;

6. Sava, Florin Alin., (2004) - Analiza datelor în cercetarea psihologică.

Metode statistice complementare. Cluj-Napoca : ASCR;

124