analiza computerizata a datelor (spss)

Upload: geo-bursuc

Post on 17-Oct-2015

237 views

Category:

Documents


9 download

DESCRIPTION

Curs

TRANSCRIPT

  • SCOPUL UNITII DE CURS ofer noiuni, explicaii i aplicaii pentru a nelege i opera eficient cu programul SPSS 10.0 n

    scopul prelucrrii statistice a datelor. OBIECTIVE OPERAIONALE

    n urma studierii acestei uniti de curs, studenii: vor putea s defineasc variabilele i s conceap o baz de date adecvat; vor redefini i transforma variabile; vor prelucra datele statistice la nivel descriptiv; vor realiza analiza corelaional a datelor i vor interpreta rezultatele obinute; vor folosi testul t pentru compararea unui eantion cu o populaie i a dou eantioane (perechi sau

    independente) i vor interpreta rezultatele obinute; vor utiliza analiza de varian pentru analiza efectului unui singur factor i vor interpreta rezultatele

    obinute; vor utiliza analiza de varian pentru analiza efectelor de interaciune; vor utiliza metode non-parametrice de analiz a datelor. EVALUARE 40% din nota final examen practic care presupune prelucrarea i interpretarea datelor; 60% din nota final evalurile de pe parcursul seminariilor, care vor presupune prelucrri i analize

    statistice ale datelor. OBSERVAIE !!! Cursul nu epuizeaz opiunile programului SPSS i nu suplinete lipsa informaiilor statistice teoretice.

  • ANALIZA COMPUTERIZAT A DATELOR

    251

    I. FAMILIARIZAREA CU PROGRAMUL SPSS 10.0

    I.1. TIPURI DE VARIABILE. DIFERENA DINTRE VARIABILE, VALORI I SCORURI Variabile sunt definite ca proprieti ale fenomenelor, obiectelor sau proceselor, care pot lua

    diferite valori. Exist mai multe criterii n funcie de care se pot clasifica variabilele: dup natura msurii variabilele pot fi: cantitative (variaz cantitativ, cum ar fi de exemplu greutatea sau vrsta subiecilor) sau calitative (sunt cele care variaz calitativ, cum ar fi genul sau etnia subiecilor); dup felul variaiei, variabilele pot fi: continui (teoretic pot lua orice valoarea, ntre dou valori ale variabilei putnd s apar o a treia valoare; vrsta subiecilor este un exemplu de variabil continu) sau discrete (pot avea numai anumite valori, ntre care nu mai apar altele; religia, tipurile temperamentale sunt exemple de variabile discontinui); dup scopul folosirii lor n studii experimentale: independente (sunt variabilele manipulate de experimentator i care se presupune c influeneaz variabila dependent) sau dependente (reprezint rspunsurile subiecilor).

    O variabil poate lua diferite valori. Valoarea reprezint o msur calitativ sau cantitativ a unui fenomen. Spre exemplu, pentru variabila nota colar valorile acesteia sunt toate notele de la 1 la 10. Pentru variabila zilele sptmnii valorile sunt toate cele apte zile ale sptmnii. n psihologie se face distincia ntre valori i scoruri. Scorul este valoarea obinut de o persoan, fenomen sau obiect atunci cnd ne referim la o anume variabil. Spre exemplu, nota pe care o obine un elev la o materie (s zicem 7) reprezint scorul subiectului la variabila nota colar.

    I.2. PREZENTAREA APLICAIEI SPSS SPSS (n traducere Pachet statistic pentru tiinele sociale) este numele unui pachet de

    programe care ajut la analiza datelor obinute n cercetrile din domeniul tiinelor sociale. Deschiderea programului se poate face cu ajutorul mouse-ului, cu dublu-click asupra

    pictogramei programului de pe desktop. Aplicaia mai poate fi deschis de la butonul START/PROGRAME, opiunea SPSS FOR WINDOWS, ca n imaginea de mai jos:

    Oricare ar fi metoda de deschidere a programului, pe ecran va aprea urmtoarea fereastr:

  • LOREDANA GHERASIM

    252

    Prima bar din partea de sus a ferestrei ofer informaii despre denumirea aplicaiei i numele

    fiierului cu care se lucreaz. Urmeaz bara de meniuri a programului i cea cu butoane. Foia cu date este organizat tabelar. ntotdeauna coloanele tabelului reprezint variabilele

    studiului, n timp ce liniile, rndurile numerotate ale tabelului reprezint subiecii cercetrii. n partea de jos a ferestrei sunt dou opiuni: DATA VIEW i VARIABLE VIEW. Putem vizualiza datele brute ale subiecilor, dac este activ opiunea DATA VIEW sau putem vizualiza descrierea variabilelor introduse n baza de date, dac este activat opiunea VARIABLE VIEW. De obicei, atunci cnd deschidem programul, este activ opiunea DATA VIEW, cum se poate observa i n imaginea de mai sus. Printr-un simplu click stnga pe opiunea VARIABLE VIEW, pe ecran apare un alt tabel care permite definirea variabilelor din baza de date:

    Din meniul FILE putem alege comanda deschidere a unei noi baze de date (opiunea NEW DATA) sau a unei noi foi de rezultate (NEW OUTPUT):

    Acest program prezint rezultatele prelucrrilor statistice ntr-o pagin separat, numit OUTPUT. Comenzile care sunt colorate n gri sunt comenzi inactive pentru c baza de date nu conine, deocamdat, nici o informaie.

    Din acest meniu putem deschide, folosind opiunea OPEN, o baz de date care a fost creat anterior (DATA) sau un fiier cu rezultatele prelucrrilor statistice anteriore (OUTPUT).

  • ANALIZA COMPUTERIZAT A DATELOR

    253

    Comanda SAVE permite salvarea obinuit a fiierului cu date sau cu rezultate, comanda SAVE AS permite salvarea unui fiier modificndu-i numele. Opiunile RECENTLY USED DATA i RECENTLY USED FILES deschid bazele de date i foile cu rezultate recent create sau utilizate n programul SPSS.

    Din meniul EDIT, comenzile COPY, CUT i PASTE sunt folosite pentru copierea sau mutarea datelor din celule, rnduri sau coloane. Copierea sau mutarea datelor presupune selectarea datelor, activarea comenzii COPY/CUT din meniul EDIT, plasarea cursorului n noua locaie i apoi activarea comenzii PASTE.

    I.3. DESCHIDEREA UNEI BAZE DE DATE

    Pentru deschiderea unei baze de date create anterior se activeaz meniul FILE/OPEN opiunea

    DATA. Dup activarea comenzii pe ecran apare o caset de dialog care permite selectarea directorului i respectiv fiierului care conine baza de date. Vom deschide fiierul opinii.sav (n aplicaia SPSS, fiierele cu baze de date au ntotdeauna extensia sav) care se gsete la adresa C:\MY DOCUMENTS\EXEMPLE SPSS. n momentul ncrcrii bazei de date pe ecran va aprea urmtoarea imagine:

    Valorile din baza de date reprezint rspunsurile brute ale subiecilor. Pe coloane sunt definite variabilele. n aceast baz de date avem pe coloan variabile (ca de exemplu, gr_mult, prezent, viitor, directie, guv, parlam), valorile numerice din fiecare coloan reprezentnd scorurile subiecilor la aceste variabile. Rndurile conin rspunsurile subiecilor la diferii itemi. De exemplu, subiectul de pe rndul 9 are valoare 3 la variabila gr_mult, valoarea 3 la variabila prezent, 4 la variabila viitor etc.

    Pentru a vedea ce nseamn fiecare dintre aceste variabile trebuie activat opiunea VARIABLE VIEW:

  • LOREDANA GHERASIM

    254

    Variabilele sunt aezate pe rnduri, coloanele reprezentnd diferite caracteristici ale variabilelor. De exemplu, variabila gr_mult este o variabil de tip numeric, cu 20 de caractere la partea ntreaga i 0 zecimale, reprezentnd itemul Ct de mulumit suntei n general de felul n care trii?.

    I.4. CREAREA UNEI NOI BAZE DE DATE Pentru a crea o nou baz de date trebuie activat opiunea DATA VIEW. Vom crea o baza de

    date care s conin rezultatele la anxietate obinute de un numr de subieci, nainte i dup intervenia terapeutic (anxietatea a fost msurat cu ajutorul unei scale de anxietate). La studiu au participat subieci de gen feminin i masculin. Baza de date va conine patru variabile: numrul subiecilor (nrsub), nivelul anxietii subiecilor naintea terapiei (ANX1) i nivelul anxietii subiecilor dup terapie (ANX2) i genul subiecilor (1-subieci de gen masculin i 2-subieci de gen feminin).

    Pentru introducerea datelor se plaseaz cursorul n celul i se introduce valoarea cu ajutorul tastelor. Spre exemplificare, vom introduce prima valoare (1) a primei variabile. Dup introducerea primei valori automat programul a denumit prima variabil (var0001), iar indicativul primei linii devine activ.

    La fel se vor introduce i celelalte valori ale primei variabile. Pentru a utiliza cu uurin datele

    este indicat definirea sau redenumirea variabilelor cu care lucrm. Definirea variabilelor presupune activarea cmpului VARIABLE VIEW, prin executarea unui

    dublu click pe numele variabilei (n cazul nostru var0001) sau prin activarea butonului VARIABLE VIEW din partea de jos a cmpului. Rezultatul va fi urmtorul:

    Numele variabilei poate s cuprind maxim opt caractere, fr spaiu sau semne de

    punctuaie. Pentru a defini o variabil, trebuie plasat cursorul n celula n care este trecut numele (NAME) generic al variabilei (var0001), apoi se introduce numele variabilei NRSUB folosind tastatura.

    Opiunea TYPE permite specificarea tipului de date. Aceast opiune poate fi activat cu ajutorul mouse-ului cu un click stnga pe butonul gri din celula corespunztoare variabilei.

  • ANALIZA COMPUTERIZAT A DATELOR

    255

    Tipul NUMERIC permite introducerea valorilor cu sau fr zecimale. Tipurile COMMA i DOT

    permit introducerea valorilor cu orice numr de zecimale (mai mare de 16), reinnd ntreaga valoare. Tipul SCIENTIFIC NOTATION transform logaritmic valorile introduse, DATE permite folosirea spaiilor, punctelor, virgulelor, a barelor de separarea pentru a delimita zilele, lunile i anii, respectiv orele i minutele. Tipul DOLLAR insereaz n faa valorilor simbolul dolarului, iar CUSTOM CURRENCY permite introducerea de valorilor pozitive dar i a celor negative, cu sau fr separator pentru mii. Ultima opiune STRING permite introducerea variabilelor alfanumerice.

    Este posibil alegerea numrului de cifre pentru partea ntreag (WIDTH) i a numrului de zecimale (DECIMAL PLACES). Dei sunt mai multe tipuri de variabile, n psihologie se utilizeaz dou tipuri de variabile, NUMERIC i STRING (foarte rar). Automat la crearea unei noi baze de date, apare selectat tipul NUMERIC, presupunndu-se c noile variabile vor fi numerice. Opiunea TYPE este de obicei folosit pentru modifica acest tip de date.

    Caracteristica LABELS permite definirea detaliat a variabilei (pot fi folosite pn la maxim 256 caractere, inclusiv spaiul). Definirea detaliat a variabilei apare n pagina de rezultate.

    VALUE LABEL permite descrierea valorile pe care le poate lua o variabil. Opiunea este folosit pentru variabile care folosesc coduri numerice pentru a reprezenta categorii (de exemplu, se pot folosi valorile 1 i 2 pentru a codifica genul feminin i masculin).

    MISSING VALUES permite stabilirea valorilor care nu vor fi luate n seam la prelucrarea datelor.

    COLUMN permite specificarea numrului de caractere pentru o coloan, afectnd vizualizarea datelor.

    ALIGNMENT permite modificarea modului n care sunt prezentate datele pe ecran, aliniate la stnga, dreapta sau central. n exemplu nostru, vom defini numele variabilei NRSUB i vom detalia eticheta la opiunea LABEL ca n imaginea de mai jos:

    Vom introduce valorile i vom defini i urmtoarele variabile, ANX1, ANX2 i Gen. Variabila Gen este de tip categorial, n funcie de aceast caracteristic subiecii fiind mprii n dou categorii distincte, femei i brbai. Din acest motiv trebuie precizat semnificaia valorilor variabilei. Acest lucru presupune atribuirea de valori i etichete celor dou grupuri de subieci. Astfel, subiecii de sex masculin i vom codifica cu valoarea 1, iar pe cei de gen feminin cu valoarea 2. n acest scop vom activa opiunea VALUE:

  • LOREDANA GHERASIM

    256

    Se trece valoarea n cmpul VALUE i numele grupului sau categoriei n cmpul VALUE

    LABEL, dup care se apas butonul ADD. Astfel, vom scrie 1 n cmpul VALUE i subieci de gen masculin n cmpul VALUE LABEL i activm butonul ADD, apoi vom scrie 2 n cmpul VALUE i subieci de gen feminin n cmpul VALUE LABEL i activm butonul ADD.

    Se activeaz butonul OK pentru a salva modificrile i nchide caseta de dialog.

    Aceast opiune se folosete numai pentru variabilele categoriale, care mpart subiecii n

    grupuri distincte.

    Salvarea fiierelor se face fie acionnd butonul SAVE care se gsete n bara de instrumente, fie din meniul FILE se alege opiunea SAVE. Reamintim c trebuie ales mai nti directorul n care vream s salvm fiierul si apoi scriem numele fiierului. Vom salva fiierul cu numele Baza1.sav n subdirectorul EXEMPLE SPSS care se gsete n directorul MY DOCUMENTS.

  • ANALIZA COMPUTERIZAT A DATELOR

    257

    II. ELEMENTE DE STATISTIC DESCRIPTIV II.1. ANALIZA FRECVENELOR Tabelele de frecven ajut la descrierea unui grup de scoruri, fiind cele mai simple procedee

    ale statisticii descriptive, care permit nelegerea tendinei unui grup de scoruri. Tabelele de frecvena grupeaz scorurile subiecilor, informaia devenind, astfel, mai comprehensibil. Histogramele, reprezentri grafice ale tabelelor de frecven permit o mai bun nelegere a tendinei grupului de rezultate. Acestea presupun transformarea intervalelor de frecven n bare, nlimea barelor corespunznd frecvenei fiecrui interval de frecven din tabelul de frecven. Poligoanele de frecven sunt o alt modalitate de reprezentare grafic a datelor din tabelele de frecven. Acestea se obin, prin unirea mijloacelor prilor superioare ale barelor histogramelor.

    Tabelul de frecven, histograma i poligonul de frecven descriu o distribuie de frecven, prezentnd modul n care se distribuie sau se mprtie cazurile sau frecvenele. Modalitatea, nclinarea i turtirea sunt indicatori care descriu forma distribuie scorurilor. Modalitatea indic cte vrfuri are o distribuie, cu alte cuvinte, arat valorile n jurul crora se grupeaz rezultatele subiecilor. Din aceast perspectiv, distribuiile pot fi unimodale (au un singur vrf), bimodale (au dou vrfuri) sau multimodale (au mai multe vrfuri). nclinarea arat dac n distribuie apar mai multe valori mari sau mai multe valori mici. Cele mai multe aspecte msurate n psihologie prezint un numr aproximativ egal de cazuri de o parte i de alta a mijlocului, distribuiile fiind aproximativ simetrice (nu prezint tendin de nclinare). O distribuie este nclinat atunci cnd are o extrem (o parte) mai mprtiat i mai lung. Atunci cnd curba este nclinat spre dreapta, distribuia este nclinat pozitiv, iar cnd curba este nclinat spre stnga, distribuia este nclinat negativ. Spre exemplu, notele colare au o distribuie nclinat spre dreapta, adic elevii au tendina de a obine mai multe note mari. Turtirea unei distribuii se raporteaz la curba normal. Fa de curba normal o distribuie poate fi mai turtit (scorurile din cadrul ei variaz foarte mult de la medie) sau mai ascuit (scorurile variaz foarte puin de la medie).

    Analiza de frecven cu ajutorul programului SPSS Opiunea FREQUENCIES permite realizarea tabelului de frecven i a distribuiei de frecven

    a rezultatelor. Aceasta se gsete la meniul ANALYZE DESCRIPTIVE STATIASTICS:

  • LOREDANA GHERASIM

    258

    Dup activarea opiunii pe ecran apare urmtoarea caset de dialog: n cmpul din stnga al casetei

    FREQUENCIES sunt afiate toate variabilele din baza de date, n ordinea introducerii lor n baza de date, mpreun cu denumirea extins a variabilei. Cmpul din dreapta reprezint cmpul de analiz. Astfel, analiza statistic se realizeaz doar pentru variabilele trecute n acest cmp. Trecerea variabilelor n cmpul de analiz se realizeaz cu ajutorul butonului cu sgeat care se gsete ntre cmpuri. Se selecteaz din cmpul din stnga variabila pe care vrem s analizm apoi se activeaz butonul de trecere. Acest mod de organizare n dou cmpuri apare la aproape toate opiunile de prelucrare a datelor.

    Bifarea opiunii DISPLAY FREQUECY TABLES are ca efect afiarea n foaia de rezultate a tabelul de frecven. Opiunea STATISTICS deschide o fereastr cu opiuni de prelucrare statistic, butonul CHARTS permite afiarea histogramei de frecven. Opiunea FORMAT permite modificarea formei de prezentare a datelor n foia cu rezultate (OUTPUT).

    Pentru exemplul nostru, dorim realizarea tabelului de frecven i histogramei pentru variabila nivelul anxietii nainte de terapie (ANX1). Se selecteaz variabila ANX1 din cmpul din stnga i se activeaz butonul de trecere:

    Pentru ca n foaia de rezultate s apar tabelul de frecven se selecteaz opiunea DISPLAY FREQUECY TABLES. Pentru afiarea histogramei de frecven se activeaz butonul CHARTS:

    Opiunea CHART TYPE permite alegerea unui tip de grafic (cu bare, plcint sau histogram).

    CHART VALUES permite alegerea tipului de valori afiate n grafic (Frecvene sau Procentaje). Pentru exemplul nostru se selecteaz opiunea HISTOGRAMS, se bifeaz afiarea curbei

    normale (WITH NORMAL CURVE), apoi se activeaz butonul CONTINUE. Opiunea FORMAT permite modificarea formei OUTPUT-ului. Activarea acestui buton are ca

    efect apariia urmtoarei casete de dialog:

  • ANALIZA COMPUTERIZAT A DATELOR

    259

    Cmpul din stnga al ferestrei conine opiuni de aranjare a rezultatelor (n ordine

    descresctoare sau cresctoare a valorilor sau cantitilor), iar cel din dreapta conine opiuni de prezentare comparativ a rezultatelor i de organizare separat a foii de rezultate, pentru fiecare variabil. Pentru exemplu nostru, vom pstra opiunile selectate automat.

    Dup selectarea opiunilor de realizare a tabelului de frecven i histogramei, se activeaz butonul OK al casetei FREQUENCIES. Pe ecran apare o fereastra cu rezultate, numit OUTPUT:

    Fereastra OUPUT este organizat n dou cmpuri, cel din stnga, afieaz structura sau

    cuprinsul OUPUT-ului, iar cel din dreapta arat coninutul foii cu rezultate. Rezultatele sunt organizate n dou tabele. n primul tabel se precizeaz numrul de subieci i numrul de rspunsuri. Pentru exemplul nostru, avem 20 de subieci care au rspuns la chestionar (nu lipsete nici o valoare).

    Al doilea tabel este organizat n cinci coloane. Coloana VALID prezint valorile variabilei, prezentate n ordine cresctoare (fr a ine seama de cazurile lips). Coloana FREQUENCY prezint frecvena, adic numrul de subieci care obin o anumit valoare.

    Coloana PERCENT transform frecvena obinut pentru fiecare valoare n procentaj innd cont de numrul total de subieci luai n calcul, indiferent dac acetia au sau nu scoruri la aceast variabil. Spre exemplu, doi subieci au obinut scorul 103, ceea ce reprezint 10% din totalul numrului de rspunsuri obinute. VALID PERCENT prezint procentajul lund n calcul doar subiecii care au rspuns la aceast variabil. n cazul nostru coloanele PERCENT i VALID PERCENT sunt identice deoarece toi subiecii au scoruri la aceast variabil. Dac unii subieci nu ar fi rspuns la chestionarul de anxietate, atunci cele dou coloane ar fi coninut valori diferite.

    Coloana CUMULATIVE PERCENT prezint procentajul cumulat, de la cel mai mic scor la pn la cel mai mare. De exemplu, 60% dintre subieci au note mai mici sau egale cu 106. Derulnd pagina cu rezultate sau selectnd HISTOGRAM n cmpul din stnga, putem vizualiza reprezentarea grafic a frecvenei scorurilor:

  • LOREDANA GHERASIM

    260

    Histograma de frecven se mai poate obine folosind meniul GRAPHS HISTOGRAM. Activarea opiunii duce la apariia urmtoarei casete de dialog:

    Elementele principale ale ferestrei sunt:

    1. cmpul n care sunt prezentate toate variabilele din baza de date 2. cmpul n care se introduce variabila pentru care dorim s realizm histograma de frecven 3. selectarea acestei opiuni va duce la afiarea curbei normal de distribuie a rezultatelor.

    Pentru exemplificare introducem variabila ANX1, cu ajutorul butonului cu sgeat, n cmpul VARIABLE i bifm opiunea DISPLAY NORMAL CURVE. Se obine aceeai reprezentare grafic ca i n cazul folosirii butonului CHART al ferestrei FREQUENCIES.

    Vizualizarea ferestrei OUTPUT sau DATE (baza1.sav) se poate face folosind meniul WINDOW, marcnd opiunea dorit (baza de date sau foaia de rezultate):

    II.2. IDENTIFICAREA TENDINEI CENTRALE I A VARIABILITII SCORURILOR Metodele descriptive pentru identificarea tendinei centrale i de mprtiere indic tendina

    central a unui grup de scoruri, folosind ca indicatori media, mediana i modul i tendina de mprtiere a grupului de scoruri, folosind ca indicatori variana i abaterea standard.

    Media aritmetic descrie tendina central ntr-un grup de rezultate, arat valoarea tipic, reprezentativ a unui grup de scoruri. Media este punctul fa de care scorurile sunt egal deprtate, deoarece abaterile de la medie ntr-o direcie (abaterile scorurilor mici de la medie) sunt egale cu

    1

    2

    3

  • ANALIZA COMPUTERIZAT A DATELOR

    261

    abaterile n cealalt direcie (abaterile scorurilor mari de la medie). Mediana mparte distribuia n dou pri egale, jumtate dintre scorurile distribuie avnd valori mai mici ca mediana, iar cealalt jumtate valori mai mari. Modul reprezint valoarea cu frecvena cea mai mare. Este indicatorul care este cel mai puin afectat de schimbrile structurii (modificri ale numrului de scoruri sau mrimii scorurilor distribuiei). Mediana este i ea destul de puin afectat de modificrile structurii distribuiei. Media, ns, este cea mai sensibil la modificarea numrului de scoruri sau mrimii scorurilor, fiind indicatorul cel mai descriptiv (deoarece indic orice modificare survenit n distribuie). Se recomand utilizarea mediei n distribuiile simetrice i unimodale. Mediana i modulul, care sunt mai stabile sunt recomandate pentru descrierea distribuiilor asimetrice i multimodale. Cu toate acestea, media aritmetic rmne metoda cel mai des utilizat pentru descrierea tendinei grupului de scoruri, acest indicator intrnd n componena multor metodele statistice. Exist ns metode statistice (cum a fi testele neparametrice) n care se utilizeaz doar mediana i modul.

    Cunoaterea acestor indicatori nu este suficient pentru a descrie complet o distribuie. Trebuie s cunoatem gradul de variabilitate a scorurilor noastre. Mai precis, trebuie s tim ct de mult (sau cu ct) se mprtie scorurile n jurul valorii medii.

    Variana (SD2=( (X-M)2/N) unei distribuii arat ct de mprtiate sunt scorurile n jurul valorii centrale, indic gradul de variabilitate a unui grup de rezultate. Este o msur a gradului de variabilitate a scorurilor i arat ct de mult se abat scorurile de la tendina central. Cu ct este mai mare aceast valoare, cu att mai mult se mprtie scorurile n jurul valorii centrale. Pentru a cunoate exact cu ct variaz scorurile n medie este nevoie s calculm deviaia standard. Abaterea standard ne arat cu ct se mprtie scorurile n jurul valorii centrale i se msoar n aceleai uniti de msur ca i scorurile iniial. Abaterea standard este rdcina ptrat a varianei (SD = 2SD ).

    n intervalul cuprins ntre medie i o abatere standard la stnga i dreapta mediei gsim aproximativ 2/3 din totalul scorurilor. Aceste rezultate sunt considerate tipice sau normale pentru o distribuie. Ilustrm grafic acest lucru: Scorurile care sunt mai mari dect media cu o abatere standard sunt considerare scoruri mari iar cele mai mici dect media cu mai mult de o abatere standard sunt considerate ca fiind scoruri slabe.

    Calculul tendinei centrale i a variabilitii folosind SPSS Meniul din SPSS care permite calculul indicatorilor tendinei centrale i ai mprtierii se

    gsete la ANALYZE DESCRIPTIVE STATISTICS FREQUENCIES. Pentru analiz vom folosi baza de date realizat anterior, Baza1.sav.

    Vom calcula parametrii tendinei centrale i ai variabilitii pentru variabila ANX1 (nivelul anxietii naintea terapiei). Se trece variabila n cmpul din dreapta apoi se activeaz butonul STATISTICS. Dup cum se poate vede i n imaginea de mai jos, caset de dialog care se deschide cuprinde patru cmpuri cu opiuni:

    m m-SD m+SD

    scoruri medii, tipice, normale scoruri mici scoruri mari

  • LOREDANA GHERASIM

    262

    Cmpul PERCENTILE VALUES conine opiuni care permit calculul valorilor corespunztoare

    mpririi subiecilor n grupuri egale, prin afiarea valorilor care delimiteaz aceste grupuri. Aceast opiune permite calculul cuartilelor (QUARTILES) sau altor cuartile (de exemplu CUT POINTS FOR 10 EQUAL GROUPS) sau centile (PERCENTILE).

    Opiunile din cmpul DISPERSION permit calcularea diferiilor parametri referitori la dispersia (mprtierea) scorurilor n jurul valorii centrale: abatere standard (STD. DEVIATION), varian (VARIANCE), amplitudine (RANGE), valori minime (MINIMUM) i maxime (MAXIMUM) i eroare standard (S.E. MEAN care reprezint abaterea standard a distribuii tuturor mediilor posibile calculate pentru eantioane aleatoare repetate).

    CENTRAL TENDENCY conine opiunile folosite pentru calculul indicatorilor tendinei centrale ale distribuiei: media (MEAN), mediana (MEDIAN), mod (MODE) i suma valorilor seriei (SUM).

    Cmpul DISTRIBUTION ofer posibilitatea aflrii indicatorilor de turtire (KURTOSIS)i nclinare ai unei distribuii n comparaie cu cea normal (SKEWNESS).

    Pentru exemplu nostru ne intereseaz calculul parametrilor tendinei centrale ai distribuiei i de mprtiere. n consecin se bifeaz (cu un simplu click stnga al mouse-ului) opiunile MEAN, MEDIAN, MODE din cmpul CENTRAL TENDENCY i opiunile STD DEVIATION i VARIANCE din cmpul DISPERSION:

    Activm butonul CONTINUE i apoi cel OK al casetei FREQUENCIES. Valorile indicatorilor

    sunt grupate n tabelul Statistics:

  • ANALIZA COMPUTERIZAT A DATELOR

    263

    Astfel, M=107,90, Med=105,5, Mod=104, ceea ce nsemn c distribuia este unimodal (apare o singur valoare la mod) i uor nclinat spre dreapta spre valorile mai mari ale variabilei (valoarea mediei este mai mare dect a medianei). Reprezentarea grafic indic apariia unui singur vrf (distribuie unimodal) i o alungire i mprtiere a extremei drepte a distribuiei (distribuie nclinat spre dreapta).

    La fel se calculeaz indicatorii tendinei centrale i de mprtiere pentru variabila ANX2 (nivelul anxietii subiecilor dup terapie). Rezultatele obinute sunt urmtoarele:

    Astfel, M=107,95, Med=109,5, Mod=102, Mod=110 (a doua valoare a modul se extrage din tabelul de frecven). Distribuia scorurilor este bimodal (apar dou valori cu frecvena cea mai mare) i nclinat spre valorile mici ale variabilei (media este mai mic dect mediana). Distribuia scorurilor subiecilor la aceast variabil indic aceeai form.

  • LOREDANA GHERASIM

    264

    Comparnd reprezentrile histogramele de frecven pentru variabilele ANX1 i ANX2, putem analiza variabilitatea rezultatelor la cele dou variabile. Astfel, distribuia scorurilor pentru prima variabil este mai ascuit, valorile fiind mai grupate n jurul medie (i variana i abaterea standard au valori mai mici). La variabila ANX2 se constat o mai mare variabilitate a rezultatelor, distribuia fiind mai turtit (n acest caz variana i abaterea standard au valori mai mari).

    II.3. SCORURILE Z Nota Z indic deviaia unui scor (x) de la medie (m) exprimat n deviaii standard. Nota

    standard Z arat cu cte deviaii standard se abate un scor de la medie (Z=(X-M)/SD). Distribuia n note Z este o distribuie ideal n care media are ntotdeauna valoarea 0, iar abaterea standard valoarea 1.

    Schema de mai jos prezint notele standard Z corespunztoare mediei i limitelor de variaie maxim i minim. Mediei i corespunde ntotdeauna mereu scorul standard 0, limitei minime de variaie tipic i corespunde scorul standard -1, iar limitei maxime de variaie normal i corespunde nota standard +1.

    Aceasta distribuie ne permite s stabilim cum este scorul x n raport cu media (care este 0) i

    abaterea standard (care are valoarea 1). Trebuie inut seama de o serie de reguli. Astfel, un scor x raportat la distribuia Z este considerat mic, dac scorul su Z are valoare mai mic dect 1; un scor x este considerat mediu dac scorul su Z este cuprins n intervalul [1, +1]; un scor x este considerat mare raportat la distribuia Z, dac scorul su Z va fi mai mare dect +1.

    Scorurile Z ndeplinesc o serie de funcii. Permit compararea unui scor cu o distribuie la care cunoatem parametrii (media i deviaia standard), astfel, ne ajut s precizm dac un scor este mic, mediu sau mare. De asemenea, notele Z arat de cte ori acel scor este mai mare sau mai mic dect media (innd cont de variabilitate). Spre exemplu, dac scorurile la un test de inteligen ntr-o populaia sunt descrise de media m=100 i deviaia standard SD=15, o persoan cu scorul brut 130 este de dou ori mai detept ca media celorlali, deoarece acestui scor i corespunde un scor Z de +2 (ceea ce nseamn c scorul este mai mare ca media cu dou deviaii standard). O alt funcie a notelor z este aceea c permit compararea scorurilor obinute de aceeai persoan la probe diferite, ntruct notele Z arat raporturi i sunt adimensionale (nu depind de ceea ce msurm).

    m m-SD m+SD

    scoruri medii, tipice normale

    x

    Z 0 +1 -1 scorurimari scorurimici

  • ANALIZA COMPUTERIZAT A DATELOR

    265

    Calculul notelor Z folosind SPSS Comanda DESCRIPTIVES care se gsete n meniul ANALYZE DESCRIPTIVE

    STATISTICS, permite calculul notelor Z cu ajutorul SPSS. Vom folosi baza de date creat anterior (Baza1.sav).

    Activarea comenzii duce la apariia pe ecran a casetei de dialog urmtoare:

    Prezentm principalele elemente ale ferestrei DESCRIPTIVES:

    1. cmpul n care sunt prezentate variabilele din baza de date 2. cmpul n care se introduc variabilele care vor fi analizate 3. opiunea SAVE STANDARDIZED VALUES AS VARIABLES permite salvarea n baza de date

    a scorurilor standard sub forma unei noi variabile. 4. cuprinde opiuni de calcul ai parametrilor distribuiei.

    Pentru exemplificare, vom calcula notele Z pentru variabila ANX1. Se bifeaz opiunea SAVE STANDARDIZED VALUES AS VARIABLES. Se activeaz butonul OPTIONS, care deschide urmtoarea fereastr:

    Automat sunt selectate de computer opiunile de calcul al mediei, abaterii standard i al valorii

    minime i maxime. Vom activa butonul CONTINUE i apoi butonul OK al ferestrei pentru a putea face

    1

    3

    2

    4

  • LOREDANA GHERASIM

    266

    analiza statistic. Rezultatele obinute n urma comenzii DESCRIPTIVES sunt mai sumare i prezentate ntr-un singur tabel.

    Vom vizualiza baza de date pentru a vedea dac apare noua variabil care conine rezultatele

    subiecilor transformate n note Z.

    Se observ apariia unei noi variabile, pe ultima coloan, cu numele ZANX1. Putem analiza rezultatele obinute. Se constat c cel mai mare scor z este 2,6 care

    corespunde unui scor standard 124 obinut de subiectul 15, iar cea mai mic valoare la anxietate a obinut-o subiectul 8, care are un scor z0,98 pentru o valoare brut de 102. Scorul primului subiect este atipic, nivelul anxietii acestuia fiind de 2 ori i jumtate mai mare dect media, ceea ce semnific faptul c subiectul are un nivel ridicat al anxietii raportat la ceilali subieci. Subiectul al doilea are un nivel normal al anxietii, rezultatul fiind aproape cu o unitate mai mic dect media, dar plasndu-se n limita (1 - +1).

    II.4. COEFICIENTUL DE CORELAIE PEARSON Notele Z fac posibil analiza legturii dintre dou variabile. De exemplu, putem analiza legtura

    dintre nivelul stresului unui manager i numrul de subordonai. Prin transformarea notelor brute obinute de subieci la cele dou variabile putem s identificm dac exista sau nu o legtur ntre aceste dou variabile.

    Corelaia este o metod statistic descriptiv, ntruct ea descrie ce se petrece ntr-un grup de rezultate (r=( NZZ /)2*1( ). Corelaia indic existena unei legturi ntre variabile, legtur care poate fi pozitiv (cnd scorurile slabe la prima variabil se asociaz cu scoruri slabe la a doua variabil, scorurile medii la prima variabil se asociaz cu scoruri medii la a doua variabil i scorurile mari la

  • ANALIZA COMPUTERIZAT A DATELOR

    267

    prima variabil se asociaz cu scoruri mari la a doua variabil), negativ (cnd scorurile slabe la prima variabil se asociaz cu scoruri mari la a doua variabil, scorurile medii la prima variabil se asociaz cu scoruri medii la a doua variabil i scorurile mari la prima variabil se asociaz cu scoruri mici la a doua variabil). Bineneles c ntre variabile poate s nu apar nici o legtur.

    Coeficientul de corelaie (r) indic gradul n care apare paternul unei relaii ntre cele dou variabile. Acest coeficient poate lua valori de la -1 la +1, corelaia pozitiv poate lua valori de la 0 la 1, iar corelaia negativ poate lua valori la de -1 la 0.

    Analiza corelaiei dintre dou variabile nu permite stabilirea relaiei de cauzalitate ntre aceste variabile. Exist trei modaliti de interpretare a unui coeficient de corelaie obinut ntre dou variabile (x i y): fie x poate fi cauz pentru y, fie y poate fi cauz pentru x, fie a aprut a o treia variabil care a determinat apariia simultan a celor doua variabile.

    Pragul de semnificaie (p) n psihologie este necesar generalizarea concluziile studiilor. Astfel, dup analiza rezultatelor

    corelaiei ne intereseaz s vedem dac legtura gsit (la un grup de oameni) poate fi extins la ntreaga populaie. Mai precis, ne intereseaz s tim n ce msur rezultatele se datoreaz ntmplrii. Pragul de semnificaie, p, indic n ce msur ne nelm atunci cnd afirmm ceva. n cazul corelaiei, pragul de semnificaie, indic dac exist o legtur ntre dou sau mai multe variabile.

    n cercetarea tiinific se lucreaz de obicei cu dou praguri de semnificaie, corespunztoare procentajului de eroare: pragul de 0,01 (1% eroare) i pragul de 0,05 (5% eroare). n general, cnd se fac predicii pot s apar patru situaii, prezentate n tabelul de mai jos:

    Evenimentul Apare Nu apare

    Apare Corect Eroarea I Predicia Evenimentului Nu apare Eroarea II Corect

    Sunt dou situaii n care se poate grei: cnd afirmm c un eveniment se va produce i n

    realitate acesta nu va aprea (eroare de tip I) sau cnd afirmm c un eveniment nu se va produce i aceste va apare (Eroare de tip II). Situaia I corespunde minciunii, iar situaia II corespunde ignoranei. Dac vrem s evitm primul tip de greeal care are consecine mai grave (de a demonstra ceva ce nu exist n realitate), alegem pragul de semnificaie de 0,010 (prag de eroare de 1%). Dac dorim ns s avem mai multe anse n a demonstra ceva i consecinele nu sunt grave n caz de greeal, atunci se prefer pragul de eroare de 5% (deci un p=0,050). n concluzie, vom considera un test statistic ca fiind semnificativ dac pragul de semnificaie este mai mic sau cel mult egal cu valoarea 0,050.

    n psihologie se lucreaz cu dou modaliti de formulare a ipotezelor (non-direcionale sau direcional). Ipotezele non-direcionale sunt cele n care nu se precizeaz tipul de relaie dintre variabile. n testarea acestor ipoteze probabilitatea de eroare de 1% sau 5% se mparte la cele extremiti (cozi) ale distribuiei scorurilor. Testul de semnificaie pentru verificarea acestui tip de ipotez este TWO-TAILED. n cazul nostru ipoteza ar putea fi formulat non-direcional astfel: exist o legtur ntre salariul iniial i final al subiecilor. Ipotezele direcionale sunt cele n care se precizeaz tipul de modificare, cercettorul se ateapt la un anumit rezultat. Pentru aceste ipoteze probabilitatea de eroare se stabilete la una dintre extremitile distribuiei. Testul de semnificaie pentru verificarea acestui tip de ipotez este ONE-TAILED. Ipoteza din exemplul nostru ar putea fi formulat direcional,

  • LOREDANA GHERASIM

    268

    astfel: legtura dintre salariul iniial i final este pozitiv, cu ct salariul iniial este mai mare cu att i salariul final va fi mai mare.

    Calcularea corelaiei Pearson cu ajutorul SPSS Pentru a calcula acest coeficient de corelaie cu ajutorul aplicaiei SPSS vom crea o nou baz

    de date Baza2.sav, care va cuprinde 3 variabile: STUDII (nivelul de studii al subiecilor) cu trei valori 1 (studii generale), 2 (studii medii) i 3 (studii superioare), Sal_in (salariul iniial al subiecilor) i sal_fin (salariul final al subiecilor). aceste variabile au urmtoarele valori:

    studii:1, 1, 1, 1, 1, 1, 1, 1, 2, 2, 2, 2, 2, 2, 2, 2, 3, 3, 3, 3, 3, 3, 3, 3 sal_in: 189, 198, 197, 168, 201, 185, 156, 175, 201, 220, 210, 214, 205, 301, 332, 341, 221,

    206, 298, 301, 654, 214, 258, 245 sal_fin: 201, 220, 205, 203, 185, 168, 178, 260, 280, 274, 298, 305, 582, 542, 392, 445, 401,

    502, 403, 954, 425, 725, 625, 199 Pentru calculul corelaiei se activeaz opiunea BIVARIATE din meniul ANALIZE-

    CORRELATE:

    Activarea comenzii va deschide urmtoarea fereastr:

    Elementele principale ale ferestrei sunt: 1. cmpul care prezint lista variabilelor din baza de date; 2. cmpul de analiz, unde se introduc variabilele ce vor fi analizate; se pot introduce mai multe

    variabile, calculatorul afind corelaiile ntre variabilele luate dou cte dou; 3. n cmpul CORRELATION COEFFICIENTS se alege tipul de corelaie: coeficientul Pearson

    se folosete pentru date parametrice (variabile cantitative i continui), coeficienii KENDALL i SPEARMAN se folosesc pentru date categoriale i ordinale.

    1 2

    3

    4

    5

    5

  • ANALIZA COMPUTERIZAT A DATELOR

    269

    4. cmpul TEST OF SEGNIFICANCE permite selectarea modului de testate a ipotezei (TWO-TAILED sau ONE-TAILED); de obicei se folosete pragul TWO-TAILED n testarea ipotezelor de cercetare cu ajutorul SPSS.

    5. opiunea FLAG SIGNIFICANCE CORRELATIONS are ca efect apariia unui asterisc (*) n dreptul corelaiilor semnificative;

    6. butonul OPTIONS este urmat de apariia unei casete de dialog.

    Aceasta permite realizarea unei analize descriptive a datelor (STATISTICS) i precizarea

    modalitii de tratament a datelor lips MISSING VALUES, prin excluderea din analiz a perechilor de rezultate n care avem doar una dintre valori (EXCLUDE CASES PAIRWISE) sau de a exclude din analiz un rnd ntreg dac doar una dintre valori lipsete (EXCLUDE CASES LISTWISE). Se recomand utilizarea primei variante selectat implicit.

    Pentru baza de date creat vom analiza legtura dintre variabilele salariu iniial i final al subiecilor. Vom introduce variabilele SAL_INI i SAL_FIN n cmpul din dreapta.

    Coeficientul de corelaie Pearson este selectat implicit de ctre calculator, la fel ca i celelalte

    opiuni test de semnificaie TWO-TAILED i marcarea cu asterisc a corelaiilor semnificative FLAG SIGNIFICANCE CORRELATIONS. Dup activarea butonului OK, n foaia OUTPUT sunt afiate urmtoarele rezultate:

  • LOREDANA GHERASIM

    270

    Se observ c cele dou variabile apar pe coloane da i pe linii.

    Pe rndul 1 - PEARSON CORRELATION se gsesc valorile coeficienilor de corelaie dintre dou variabile

    Pe rndul 2 - SIG. (2-TAILED) apare probabilitatea de eroare la respingerea ipotezei de nul i acceptare a ipotezei de cercetare

    Rndul 3 - N conine numrul de subieci care au scoruri la ambele variabile n tabel apare legtura dintre fiecare variabil i ea nsi (ANX1 i ANX1 i respectiv ntre

    ANX2 i ANX2) dar i legtura dintre cele dou variabile (ntre ANX1 i ANX2 dar i ntre ANX2 i ANX1).

    Prima celul din stnga (notat cu 4) prezint coeficientul de corelaie ntre variabila salariul iniial i salariul iniial (ANX1 i ANX1). ntre o variabil i ea nsi apare o corelaie perfect pozitiv (r=1,0), dar lipsit de semnificaie (nu apare nici un prag de semnificaie). Acest coeficient de corelaie nu aduce nici un fel de informaie i n consecin nu se analizeaz. La fel nu se analizeaz corelaia dintre variabila salariul final i salariul final (ANX2 i ANX2).

    n celula din dreapta sus apare coeficientul de corelaie dintre salariul iniial i salariul final (ANX1 i ANX2), semnificaia acestuia i numrul de perechi de scoruri. Acelai rezultate apar i n celula din stnga jos care prezint coeficientul de corelaie dintre salariul final i salariul iniial (ANX2 i ANX1). Rezultatele sunt identice deoarece corelaie este bidirecional (corelaia dintre variabilele A i B este acelai lucru cu cea dintre variabilele B i A). n consecin rezultatul poate fi extras din oricare din cele dou celule.

    Vom extrage datele pentru legtura dintre salariul iniial i salariul final al subiecilor: Interpretarea corelaiei: r=0,81 (coeficientul de corelaie), p

  • ANALIZA COMPUTERIZAT A DATELOR

    271

    mare de 0,50. n exemplul nostru, tria legturii este ridicat (r=0,81) coeficientul avnd valoare mi mare de 0,50

    pragul de semnificaie dac este mai mic de 0,05, atunci putem considera c exist o relaie ntre variabilele studiate. n exemplu nostru, valoarea este 0,000. n aceste situaii se raporteaz un p

  • LOREDANA GHERASIM

    272

    Se selecteaz variabila n funcie de cre se face selecia i se trece n cmpul dintre dreapta

    sus. n cazul nostru se selecteaz variabila STUDII i se trece n cmpul din dreapta:

    Se adug condiia. Pentru exemplul nostru, variabila Studii trebuie s aib numai valoarea 1

    (STUDII=1). Se poate folosi tastatura sau se pot activa butoanele cu cifre i semne ce se gsesc sub acest cmp. Condiia va arta astfel:

    Se apas apoi butonul CONTINUE pentru a salva condiia:

    Se activeaz butonul OK, baza de date modificndu-se, cum se poate observa i n imaginea

    de mai jos:

  • ANALIZA COMPUTERIZAT A DATELOR

    273

    La sfritul bazei de date apare o nou variabil, intitulat FILTER_$, care indic rezultatul

    seleciei. Cazurile neselectate sunt tiate, adic ele vor fi ignorate de la analiz. n partea din dreapta-jos a ecranului apare anunul FILTER ON, care avertizeaz utilizatorul cu privire la activarea unei

    comanzi de selecie Atenie! Selectarea datelor nu implic i efectuarea analizei statistice. Dup selecie

    trebuie fcut prelucrarea statistic a datelor. n cazul nostru trebuie utilizat comanda de analiz a corelaiei dintre salariul iniial i cel final. Se obine urmtorul tabel n fereastra cu rezultate:

    Rezultatul obinut este urmtorul: r=0,69, p=0,056. n continuare vom interpreta aceste

    rezultate: semnul corelaiei: corelaie pozitiv, legtura este direct proporional. n cazul subiecilor cu studii

    generale se constat c nivelul mic al salariului iniial se asociaz cu un nivel mic al salariului final, salariul iniial mediu se asociaz cu un salar final mediu, salariul iniial mare se asociaz cu un salar final mare.

    mrimea absolut a coeficientului: puterea legturii dintre cele dou variabile este ridicat, valoarea lui r depete valoarea de 0,50.

    pragul de semnificaie: valoarea pragului de semnificaie este mai mare de 0,050, deci nu exist o legtur semnificativ ntre salariul iniial i final al subiecilor care au studii generale.

    proporia de varian explicat de relaia este r2=0,47, deci relaia gsit apare la 47% dintre subiecii cu studii generale. Explicaia lipsei de semnificaie a corelaiei dintre cele dou variabile (n condiiile n care coeficientul de corelaie are valoare ridicat) este numrul mic de subieci. Numrul de subieci din analiz influeneaz valoarea pragului de semnificaie al corelaiei dar nu i puterea legturii dintre variabile.

  • LOREDANA GHERASIM

    274

    Dup folosirea acestui filtru este indicat dezactivarea. Pentru dezactivarea seleciei, se deschide din nou n meniul iniial DATA - SELECT CASES. n partea de jos a ferestrei se gsete buton RESET. Se activeaz apoi butonul OK, astfel, comanda de filtrare a datelor dispare.

    Comanda SPLIT FILE

    Uneori ns dorim s vedem ce se ntmpl pentru fiecare subgrup de subieci n parte. Pentru baza de date BAZA2.sav, vom analiza legtura dintre variabilele salariul iniial i salariul final pentru toate categoriile de subieci n funcie de variabila STUDII (nu numai pentru subiecii cu studii generale dar i pentru cei cu studii medii i superioare). Pentru a nu repeta comanda SELECT CASES de multe ori se poate utiliza o alt comand din meniul DATA, i anume comanda SPLIT FILE. Activarea comenzii SPLIT FILE deschide urmtoarea fereastr:

    Dintre opiunile din dreapta alegem ORGANIZE OUTPUT BY GROUPS i apoi, cu ajutorul

    sgeii, introducem variabila de grupare (STUDII) n cmpul care se activeaz sub aceast opiune:

    Dup apsarea butonului OK, n partea dreapt-jos a bazei de date apare anunul SPLIT FILE

    ON, care avertizeaz utilizatorii c baza de date este mprit n funcie de condiiile (nivelurile)

    variabilei de grupare . La fel ca i n cazul comenzii SELECT CASES, simpla mprire a bazei de date nu asigur prelucrarea statistic. De aceea, trebuie folosit comanda CORRELATIOS pentru a analiza legtura dintre variabilele salariu iniial i final al subiecilor.

    Rezultatele analizei statistice sunt prezentate separat, n fiierul OUTPUT, pentru fiecare condiie a variabilei independente: studii generale, medii i superioare:

  • ANALIZA COMPUTERIZAT A DATELOR

    275

    nivelul de studii al subiecilor = studii generale

    nivelul de studii al subiecilor = studii medii

    nivelul de studii al subiecilor = studii superioare

    Graficul corelaiei

    Relaia dintre dou variabile poate fi reprezentat grafic sub forma unui nor de puncte. Practic, graficul l alegem din meniul GRAPHS, comanda SCATTER, care deschide fereastra:

    Vom alege un grafic simplu, care s ilustreze relaia dintre dou variabile, deci vom selecta

    opiunea SIMPLE. Se activeaz apoi butonul DEFINE, care deschide urmtoarea fereastr:

  • LOREDANA GHERASIM

    276

    Se introduc cele dou variabile n cmpurile axei X i axei Y (nu conteaz ordinea n care se

    introduc variabilele deoarece corelaia este bidirecional) i apoi se apas butonul OK.

    Reprezentarea grafic a corelaiei este urmtoarea:

    Reprezentarea grafic a corelaiei apare sub forma unui nor de puncte. Pentru exemplul nostru

    norul de puncte este ascendent cresctor (din stnga-jos spre dreapta-sus) deoarece relaia dintre variabile este pozitiv, iar punctele sunt apropiate, grupate deoarece coeficientul de corelaie are valoare ridicat (r=0,81). Dac relaia ar fi fost invers proporional, norul de puncte ar fi fost orientat

  • ANALIZA COMPUTERIZAT A DATELOR

    277

    descresctor (din stnga-sus spre dreapta-jos). n cazul n care nu ar fi nici o relaie, punctele ar fi fost distribuite uniform pe grafic.

    II.5. COEFICIENTUL DE CORELAIE KENDALL'S TAU-B Reprezint o msur non-parametric a asocierii variabilelor ordinale sau rangate care

    presupun cantiti. La fel ca i n cazul corelaiei Pearson, semnul coeficientului de corelaie Kendall's tau-b indic direcia relaiei, iar valoarea absolut a coeficientului indic puterea relaiei. Cu ct valoarea coeficientului este mai mare cu att relaia dintre variabile este mai mare. Acest coeficient de corelaie poate lua valori doar intre -1 i 1.

    Calcularea corelaiei Kendall cu ajutorul SPSS Pentru a calcula acest coeficient de corelaie cu ajutorul aplicaiei SPSS vom crea o nou baz

    de date Baza3.sav, care va cuprinde 3 variabile: elevi (codul de identificare al elevilor), Prof_1 (evaluarea interesului elevilor fa de coal de ctre primul profesorul) i Prof_2 (evaluarea interesului elevilor fa de coal realizat de al doilea profesor). n tabelul urmtor prezentm valorile acestor variabile.

    Pentru a analiza legtura dintre evaluarea fcut de primul profesorul i evaluarea realizat de al doilea profesor (prof_1 i prof_2), trebuie s folosim coeficientul de corelaie Kendall's.

    Pentru calculul acestei corelaii se activeaz opiunea BIVARIATE din meniul ANALIZE- CORRELATE, apoi se introduc variabilele prof_1 i prof_2 n cmpul din dreapta. Din cmpul CORRELATION COEFFICIENTS se bifeaz coeficientul de corelaie Kendall's:

    Dup confirmarea comenzii n foaia cu rezultate apare urmtorul tabel:

  • LOREDANA GHERASIM

    278

    Se constat c apare o asociere pozitiv ntre variabile (r=0,60), elevii clasai pe primele locuri de ctre primul profesor ocup tot o poziie frunta din perspectiva celui de al doilea profesor. Asocierea nu este ns semnificativ, p=0,091 posibila explicaie fiind numrul mic de subieci din baza de date. Dac ar fi aprut o asociere negativ dintre variabile (coeficientul de corelaie ar fi fost negativ) s-ar fi interpretat astfel: elevii plasai pe primele locuri de ctre primul profesor s-ar fi plasat n coada clasamentului din perspectiva celui de al doilea profesor.

    II.6. COEFICIENTUL DE CORELAIE SPEARMAN Este o msurare non-parametric a corelaiei dintre dou variabile ordinale. Pentru toate

    cazurile, valorile fiecrui tip de variabil sunt rangate, de la cele mai mici la cele mai mari. Se folosete atunci cnd nu este posibil msurarea caracteristicilor analizate ci doar evaluarea lor, n asemenea manier nct indivizii statistici s fie ordonai n funcie de dou criterii X i Y. Aceast evaluare presupune atribuirea de valori care indic ierarhia subiecilor (cum ar fi primul, al doilea, al treilea). Modalitatea de calcul a corelaiei Spearman este similar coeficientului Pearson (de fapt de aplic formula coeficientului Pearson). Acest coeficient de corelaie mai este denumit i coeficient de corelaie a rangurilor.

    Calcularea corelaiei Spearman cu ajutorul SPSS Pentru a calcula acest coeficient de corelaie cu ajutorul aplicaiei SPSS vom crea o nou baz

    de date Baza4.sav, care va cuprinde 3 variabile: elevi (codul de identificare al elevilor), eval_i (evaluarea de ctre profesori a interesul pentru coal) i eval_re (evaluarea de ctre profesori a relaiilor cu ceilali elevi).

    Pentru a analiza legtura dintre evaluarea interesului fa de coal al elevilor i evaluarea relaiilor cu ceilali colegi (eval_i i eval_re) se folosete coeficientul de corelaie Spearman.

    Pentru calculul acestei corelaii se activeaz opiunea BIVARIATE din meniul ANALIZE- CORRELATE. Se introduc variabilele eval_i i eval_re n cmpul din dreapta. Din cmpul CORRELATION COEFFICIENTS se bifeaz coeficientul de corelaie Spearman:

  • ANALIZA COMPUTERIZAT A DATELOR

    279

    Dup confirmarea comenzii n foaia cu rezultate apare urmtorul tabel:

    Se constat c apare o inversare a clasamentului, corelaia avnd semn negativ, ceea ce semnific faptul c elevii plasai pe primele locuri ale variabilei interes pentru coal ocup ultimele locuri dup cel de al doilea criteriu, relaii bune cu ceilali elevi. Inversarea clasamentului nu este semnificativ, pragul de semnificaie fiind mai mare de 0,050 (p=0,260).

    II.7. RECODIFICAREA I TRANSFORMAREA VARIABILELOR

    Uneori este necesar ca scorurile brute obinute de subiecii unui studiu s fie transformate pentru a putea verifica ipoteza studiului. Aplicaia SPSS are o serie de comenzi care permit transformarea sau recodificarea unei variabile cantitative ntr-o variabil calitativ, prin crearea unei noi variabile n baza de date sau modificarea valorilor unei variabile existente n baza de date.

    Pentru a exemplifica utilizarea comenzilor de recodificare vom crea o nou baz de date (baza5.sav) care conine mediile obinute de elevi la sfritul anului colar. Valorile variabilei sunt:

    Media: 8,03, 8,73, 9,19, 8,81, 7,88, 9,06, 9,04, 6,86, 7,69, 7,80, 8,06, 9,06, 7,71, 7,16, 8,88, 8,49, 7,78, 9,76, 8,10, 7,49, 7,79, 6,91, 6,81, 7,54

    Vom mpri elevii n dou grupe (grupul elevilor cu performane bune i grupul elevilor cu performane slabe). mprirea elevilor n dou grupe se realizeaz n funcie de median, acest indicator statistic mprind irul de scoruri n dou pari egale (proba medianei). Deci vom calcula mai nti valoarea medianei i apoi vom mpri subiecii n grupe n funcie de valoarea acestui indicator. Pentru calculul medianei vom folosi comanda DESCRIPTIV STATISTICS FREQUENCIES:

  • LOREDANA GHERASIM

    280

    Pentru exemplul nostru mediana are valoare 7,95. Subiecii care au valori mai mici ca mediana (7,95) vor forma grupul celor cu performane sczute, iar subiecii care au valori mai mari dect mediana vor forma grupul celor cu performane ridicate. Pentru recodificarea variabilei MEDIA se utilizeaz opiunea RECODE care se gsete la meniul TRANSFORM:

    Comanda RECODE are dou opiuni de recodificare. Se poate pstra variabila ce urmeaz s

    fie recodificat (INTO SAME VARIABLES) sau se poate crea o nou variabil (INTO DIFFERENT VARIABLES).

    Comanda RECODE INTO DIFFERENT VARIABLES Selectm opiunea de creare a unei noi variabile care s cuprind grupele obinute n urma

    recodificrii. Se selecteaz opiunea INTO DIFFERENT VARIABLES, ceea ce are ca urmare apariia urmtoarei casete de dialog:

    1. cmpul care conine variabilele din baza de date; 2. n cmpul NAME de la OUT VARIABLE se introduce numele variabilei create; 3 n cmpul INPUT VARIABLE OUTPUT VARIABLE se introduce att variabila ce urmeaz

    s fie recodificat ct i numele noii variabile; 4. butonul OLD AND NEW VALUE permite recodificarea variabilei iniiale 5 butonul IF permite crearea unei noi variabile doar prin selecia anumitor valori ale variabilei

    iniiale Pentru exemplul nostru vom trece

    variabila pe care dorim s o recodificm, MEDIA, n cmpul din mijloc al ferestrei cu ajutorul butonului de trecere. Vom denumi noua variabil NIVPERF. Noul nume se tasteaz n cmpul NAME al cmpului OUTPUT VARIABLE:

    1

    23

    4

    5

  • ANALIZA COMPUTERIZAT A DATELOR

    281

    Pentru ca noul nume al variabilei s apar n cmpul din mijloc INPUT VARIABLE OUTPUT VARIABLE i astfel s aib loc recodificarea, se activeaz butonul CHANGE din cmpul OUTPUT VARIABLE:

    Se activeaz butonul OLD AND NEW VALUE pentru a defini valorile noii variabile. Activarea

    acestui buton deschide urmtoarea caset de dialog:

    Aceast fereastr prezint mai multe cmpuri: 1. cmpul OLD VALUE se refer valorile variabilei iniiale 2. cmpul NEW VALUE face referire la valorile noii variabile 3. n cmpul OLDNEW se reunesc opiunile de recodificarea a variabilelor n exemplul nostru, trebuie ca valorile variabilei MEDIA (variabila iniial) s le redefinim,

    formnd o nou variabil. Astfel, subiecii care au obinut scoruri mai mici dect mediana (7,95) vor forma grupul subiecilor cu performana sczut, care va reprezenta valoarea 1 a variabilei NIVPERF (ce va fi creat). n consecin, vom activa opiunea RANGE, LOWEST THROUGH din cmpul OLD VALUE i vom trece n cmpul activat valoarea medianei (7,95). Cu alte cuvinte aceast opiune va nsemna c toate valorile variabilei MEDIA mai mici de 7,95 vor fi recodificate, prind valoarea n cadrul noii variabile NIVPERF. n cmpul NEW VALUE, n cmpul de lng opiunea VALUE, vom tasta valoarea 1:

    1

    2

    3

  • LOREDANA GHERASIM

    282

    Se apas apoi butonul ADD al cmpului OLDNEW, pentru a putea recodifica urmtoarele valori. Apoi se activeaz opiunea RANGE, THROUGH HIGHEST din cmpul OLD VALUE i se trece n cmpul activat valoarea medianei (7,95). Aceast opiune va nsemna c valorile mai mari de 7,95 ale variabilei MEDIA vor fi recodificate n variabila NIVPERF primind valoarea 2. n consecin, n cmpul NEW VALUE, n cmpul de lng opiunea VALUE, vom tasta valoarea 2, dup cum se poate observa i n imaginea din dreapta.

    Pentru a fi reinut i aceast a doua condiie de recodificare, se acioneaz din nou butonul ADD din cmpul OLDNEW. n concluzie, scorurile mai mici de 7,95 ale variabilei MEDIA vor primi valoarea 1 n cadrul variabilei NIVPERF, iar valorile mai mari de 7,95 ale variabilei MEDIA vor

    reprezenta valoarea 2 al variabilei NIVPERF, imaginea din stnga.

    Se activeaz apoi butonul CONTINUE i butonul OK al ferestrei RECODE INTO A DIFFERENT VARIABLES, ceea ce duce la modificarea bazei de date, cum se poate observa i n imaginea din mai jos.

    Se observ c n baza de date apare noua variabil NIVPERF, cu dou valori. Putei verifica dac recodificarea a fost corect realizat.

    Exist posibilitatea de a mpri valorile unei variabile n mai mult de dou grupe. Pentru exemplificare vom mpri scorurile la variabila MEDIA n trei pari egale. Prima treime va alctui grupul subiecilor cu performan sczut, a doua treime grupul subiecilor cu performan medie, iar ultima treime grupul subiecilor cu performan ridicat. Pentru a putea face mprirea, mai nti trebuie s calculm valorile corespunztoare percentilelor care mpart irul de scoruri n 3 pari egale (fiecare parte reprezentnd 33,33% din total). Se folosete comanda DESCRIPTIV STATISTICS FREQUENCIES. Din cmpul PERCENTILE VALUES se bifeaz opiunea PERCENTILE i se introduc centilele care mpart irul de scoruri n 3 pari egale (adic 33,33% i 66,66%).

    Subiecii cu valori mai mici de 7,73 vor forma grupul celor cu performana sczut (grupul 1), cei cu valori cuprinse ntre 7,73 i 8,64 vor forma grupul subiecilor cu performan de nivel mediu (grupul 2), iar cei cu medii mai mari de 8,64 vor reprezenta grupului cu performana ridicat (grupul 3).

  • ANALIZA COMPUTERIZAT A DATELOR

    283

    Pentru a crea aceast nou variabil se activeaz meniul TRANSFORM RECODE - INTO DIFFERENT VARIABLES. Vom denumi noua variabila NIVPERF2, tastnd noul nume n cmpul NAME al cmpului OUT VARIABLE i apoi activnd butonul CHANGE.

    n acest exemplu, scorurile mai mici de 7,73 ale variabilei MEDIA vor forma primul grupului 1, adic nivelul 1 al noii variabile NIVPERF2. Vom activa opiunea RANGE, LOWEST THROUGH din cmpul OLD VALUE i vom trece n cmpul activat valoarea 7,73, iar n cmpul NEW VALUE vom trece valoarea 1. Se activeaz apoi butonul ADD al cmpului OLDNEW, pentru a putea introduce urmtoarea condiie.

    Valorile variabilei MEDIE cuprinse ntre 7,73 i 8,64 vor reprezenta nivelul 2 al variabilei NIVPERF2. Se activeaz prima opiune RANGE THROUGH i se tasteaz valorile minime i maxime. n cmpul NEW VALUE se trece valoarea 2, cum se poate observa i n imaginea alturat.

    Activm apoi butonul ADD al cmpului OLDNEW. Pentru crearea ultimului grup, care cuprinde valori mai mari de 8,64 se activeaz opiunea RANGE, THROUGH HIGHEST din cmpul OLD VALUE. n cmpul NEW VALUE se trece valoarea 3, apoi se activeaz butonul ADD.

    Se activeaz apoi butonul CONTINUE i butonul OK al ferestrei RECODE INTO A DIFFERENT VARIABLES, ceea ce duce la modificarea bazei de date, cum se poate observa i n imaginea alturat:

    Se observ c n baza de date apare noua variabil NIVPERF2, cu trei valori.

    Comanda RECODE INTO SAME VARIABLES Rezultate similare se obin dac se utilizeaz comanda RECODE

    opiunea INTO SAME VARIABLES, cu excepia faptului c se pstreaz numele iniial al variabilei recodificate. Pentru exemplificare vom utiliza aceeai baz de date (baza5.sav) i vom mpri n dou scorurile subiecilor. Activarea comenzii duce la apariia casete de dialog:

  • LOREDANA GHERASIM

    284

    n cmpul din stnga apar toate variabilele din baza de date, n cmpul din dreapta se introduc

    variabilele pe care dorim s le recodificm. n exemplu nostru vrem s recodificm variabil Media. Trecem variabila n cmpul din dreapta:

    Se activeaz butonul OLD AND NEW VALUES, care are aceleai opiuni ca n cazul opiunii

    anteriore de transformare ntr-o variabil diferit:

    Recodificare se realiz la fel ca n exemplu anterior, cnd am utilizat opiunea de recodificare

    ntr-o alt variabil:

  • ANALIZA COMPUTERIZAT A DATELOR

    285

    Dup confirmarea recodificrii s vedem modificrile din baza de date. Se constat c s-au

    modificat valorile variabilei MEDIA, aceasta avnd acum aceleai valori ca i variabila NIVPERF. Acest lucru demonstreaz c cele dou opiuni duc la acelai rezultat.

    Inversarea valorilor variabilelor Comanda de recodificare poate fi utilizat i pentru recodificarea valorilor scorurilor obinute la

    diferii itemi. Pentru a exemplifica utilizarea acestor comenzi de

    recodificare vom crea o nou baz de date (baza6.sav) care conine patru variabile: NRCHEST (codul de identificare), PRES (Ct ncredere avei n preedinte?), GUV (Ct ncredere avei n guvern?), PARLAM (Ct ncredere avei n parlament?). Prezentm scorurile obinute de 16 dintre subieci.

    Pentru itemii 1 i 3 subiecii au rspuns pe o scal de la 1 (foarte puin) la 4 (foarte mult). La itemul 2, ns, subiecii au rspuns pe o scal de la 1 (foarte mult) la 4 (foarte puin). Pentru a vedea atitudinea subiecilor fa de instituiile statului ar trebui s nsumm rspunsurile subiecilor de la cei 3 itemi. Pentru a putea face

  • LOREDANA GHERASIM

    286

    acest lucru ar trebui ca rspunsurile de la itemul 2 s fie transformate, pentru ca scala de evaluare s aib aceeai semnificaie cu a ceilali doi itemi (valoarea 1 s nsemne foarte puin iar valoare 4 s nsemne foarte mult).

    Recodificarea n acest caz presupune inversarea scalei de evaluare pentru itemul 2, adic valoarea 1 a itemului s devin 4 (ceea ce nseamn foarte mult), valoarea 2 s devin 3, valoarea 3 s devin 2, iar valoarea 4 a itemului s devin 1 (ceea ce nseamn foarte puin).

    Pentru recodificare ar putea fi utilizat oricare dintre cele dou opiuni prezentate anterior RECODE INTO SAME VARIABLES sau INTO DIFFERENT VARIABLES. Vom folosi comanda RECODE INTO DIFFERENT VARIABLES pentru a putea verifica dac recodificarea a fost realizat. Vom redenumi variabila recodificat GUV_R:

    Vom activa butonul OLD AND NEW VARIABLES. Pentru inversarea scalei de evaluare a

    itemului vom folosi numai opiunile VALUE din cmpul OLD VALUE i NEW VALUE. Astfel, valoarea 1 a vechii variabile devine 4 pentru noua variabil, deci se tasteaz 1 n dreptul opiunii VALUE din cmpul OLD VALUE i cifra 4 n dreptul opiunii VALUE din cmpul NEW VALUE.

    Se activeaz butonul ADD din cmpul OLDNEW. Apoi se tasteaz 2 n cmpul de la opiunea VALUE din cmpul OLD VALUE i cifra 3 n cmpul de la opiunea VALUE din cmpul NEW VALUE:

    La fel se procedeaz i pentru celelalte valori care trebuie recodificate. n final trebuie s avem

    urmtoarele transformri n cmpul OLDNEW:

  • ANALIZA COMPUTERIZAT A DATELOR

    287

    Dup activarea butonului CONTINUE i butonului OK al ferestrei principale, baza de date va

    conine o nou variabil (GUV_R) care conine valorile inversate ale itemului 2:

    Comanda TRANSFORM COMPUTE Pentru a calcula scorul total la atitudinea fa de instituiile statului, trebuie s nsumm

    scorurile subiecilor obinute la cei trei itemi. Pentru a putea face acest lucru se folosete meniul TRANSFORM, opiunea COMPUTE:

    Prezentm caracteristicile principale ale acestei ferestre: 1. n cmpul TARGET VARIABLE se tasteaz numele noii variabile 2. n acest cmp sunt prezentate variabilele din baza de date

    1

    2

    3

  • LOREDANA GHERASIM

    288

    3. n cmpul NUMERIC EXPRESSION se introduce formula de calcul a noii variabile; sub acest cmp se gsesc butoane cu cifre i semne, dar i un cmp cu funcii complexe care pot fi utilizate pentru calculul noilor variabile.

    Pentru exemplu nostru vom numi noua variabila ATIT, deci vom tasta numele noii variabile n cmpul TARGET VARIABLE:

    Apoi vom scrie formula de calcul care va consta n nsumarea scorurilor obinute la cele trei

    variabile: PRES, GUV_R i PARLAM. Variabile sunt trecute n cmpul NUMERIC EXPRESSION folosind butonul de trecere. Semnul plus se introduce de la tastatur sau folosind butoanele care se gsesc sub cmpul NUMERIC EXPRESSION:

    Dup activarea butonului OK n baza de date apare o nou variabila, cu numele ATIT.

    Aceast nou variabil reprezint atitudinea subiecilor fa de instituiile statului i reprezint suma rspunsurilor la cei trei itemi.

  • ANALIZA COMPUTERIZAT A DATELOR

    289

    III. ELEMENTE DE STATISTIC INFERENIAL

    III.1. DISTRIBUIA NORMAL Variabilitatea rezultatelor urmeaz reguli care pot fi modelate matematic. Dac un fenomen

    social observat este urmrit o perioad de timp mai ndelungat, distribuia rezultatelor se va face dup o curb normal, iar acest lucru poate fi demonstrat matematic.

    Exist trei parametri ai unei distribuii: modalitatea (indic valorile n jurul crora se grupeaz scorurile subiecilor), nclinarea (indic tendina scorurilor de a fi mai mari sau mai mici) i turtirea (arat ct de mult variaz scorurile distribuiei). Din perspectiva celor trei parametri, curba normal este unimodal, simetric i mediu turtit. n plus, curba normal mai posed anumite proprieti speciale. Astfel, matematicienii au pus la punct formule care permit calcularea diferitelor suprafee ale curbei.

    Pentru a nelege mai uor despre ce este vorba, s lum drept exemplu distribuia rezultatelor la un test de inteligen. La acest test media rezultatelor este 100, iar deviaia standard este 16. n imaginea de mai jos ilustrm grafic aceast distribuie:

    Dac urmrii cu atenie forma curbei normale vei constata prezena unor puncte de

    inflexiune, puncte n care linia curb i modific forma. Aceste puncte corespund deviaiilor standard. ntruct distribuia normal este simetric, exact 50% din cazuri vor avea scoruri sub valoarea medie. Aproximativ 34% din cazuri se vor afla ntre medie i o abatere standard la stnga sau la dreapta mediei. Astfel, vom ti c 34% dintre subieci au scoruri cuprinse ntre medie (100) i o deviaie standard. Avnd o deviaie standard de 16, vom ti c 34% dintre indivizi vor avea scorul cuprins ntre 100 i 116 (cei cu IQ situat deasupra mediei) sau ntre 84 i 100 (cei cu IQ situat dedesubtul mediei). Observai, de asemenea, c i mai puine cazuri sunt mai deprtate de medie. Abia 16% din populaie vor avea scoruri mai mici sau mai mari de o deviaie standard. Cu alte cuvinte, numai 16% dintre oameni au coeficientul de inteligen mai sczut de 84 sau mai ridicat de 116. Mai mult, doar aproximativ 2% dintre indivizi vor avea scoruri i mai extreme, mai mici sau mai mari dect dou deviaii standard fa de medie (adic sub valoarea 68 sau peste valoarea 132).

    Exist o strns legtur ntre scorurile standard (notele z) i diferite procentaje sau frecvene relative. Cunoscnd nota Z a unui subiect putem ti cu precizie ci indivizi din populaie au scoruri mai

    100 116 84 132 68

    34%

    14%

    2%

    34%

    14%

    2%

    -2 0 -1 +2 +1 Scoruri brute Scoruri z

  • LOREDANA GHERASIM

    290

    mici sau mai mari dect al subiectului investigat. Orice manual de statistic are la sfrit un tabel care permite calcularea acestor procentaje cu precizie. n acel tabel, pentru fiecare not Z, este precizat un procent, care arat ci subieci au scorurile cuprinse ntre medie i nota Z. S presupunem c o persoan obine la testul de inteligen scorul 125, putem calcula nota Z a acestui subiect, care are valoarea 1,56 (dup formula: (125-100)/16). Dac vom consulta unul din tabelele de care aminteam anterior, vom vedea n dreptul lui 1,56 valoarea 44,06%. Aceasta nseamn c de la medie (100) i pn la scorul nostru (125) sunt 44,06% dintre subieci. Aceasta arat c doar 5,94% dintre indivizi vor avea scoruri mai mari (50%-44,06%) i 94,06% (50%+44,06%) vor avea scoruri mai mici dect subiectul ales de noi.

    III.2. ETAPELE TESTRII UNEI IPOTEZE. TESTUL Z Pentru a vedea cum se realizeaz inferena statistic, vom analiza cel mai simplu test, testul z,

    n care se compar un eantion format dintr-un singur caz cu o populaie a crei parametri sunt cunoscui. Ca exemplu vom folosi un studiu (Aron & Aron, 1995), n care un grup de farmaciti a sintetizat o vitamin care accelereaz procesele de asimilaie la copii nou-nscui, acetia dezvoltndu-se mai rapid. Unul dintre efecte este scderea vrstei la care copii ncep s mearg. Farmacitii au dorit s omologheze vitamina, dar pentru aceasta ei trebuie s demonstreze c ntr-adevr vitamina accelereaz mersul copiilor. Farmacitii au primit dreptul s administreze vitamina unui singur copil nou-nscut, ales aleatoriu din populaie. Copilul respectiv, dup administrarea vitaminei, a nceput s mearg de la vrsta de 8 luni. Pot farmacitii s susin c vrsta precoce la care a mers copilul se datoreaz vitaminei, tiind c vrsta la care merg copii prima dat, n populaia normal este de 14 luni, cu o abatere standard de 3 luni?

    Pentru a rspunde cu dovezi statistice la o astfel de ntrebare, trebuie s facem apel la distribuia normal a variabilei alese n cadrul populaiei i s respectm anumite etape pentru verificarea raionamentului. Prezentm n continuare curba normal corespunztoare vrstei de debut de la care copiii ncep s mearg:

    Pentru testarea ipotezei trebuie s parcurgem mai multe etape:

    Etapa I: Reformularea problemei n termenii populaiilor de comparaie. Dei avem doar un singur caz pe care trebuie s l comparm cu o populaie ai crei parametri sunt cunoscui, ipotezele trebuie reformulate n termenii generali ai populaiilor de comparat pentru a putea face generalizarea ulterioar. Astfel, n exemplul nostru avem de comparat dou populaii: P0 populaia copiilor

    14 luni 17 luni 11 luni 20 luni 8 luni

    34%

    14% 2%

    34%

    14% 2%

  • ANALIZA COMPUTERIZAT A DATELOR

    291

    normali care nu iau vitaminele i P1 - populaia copiilor normali care iau vitaminele. Vom formula dou ipoteze: Ipoteza de lucru (experimental): afirm c noii nscui care iau vitamina vor merge mai repede dect cei care nu iau vitamina (H1: P0 < P1) Ipoteza de nul: Este ipoteza care descrie situaia n care intervenia noastr (vitamina) nu are nici un efect. Dac vitamina nu ar avea nici un efect, cele dou populaii de copii ar merge la aceeai vrst. H0: P0 = P1 ntr-o cercetare se testeaz de fapt ipoteza de nul pentru c ea descrie situaia deja existent nainte interveniei sau situaia n care nu am obine nici un efect. Dac ipoteza de nul este respins, atunci putem accepta ipoteza de lucru.

    Etapa II: Stabilirea parametrilor populaiei de comparaie i a distribuiei de comparaie. Aceast etap presupune cunoaterea parametrilor (media i abaterea standard) populaiei la care ne raportm (n cazul nostru distribuia copiilor care nu iau vitamina). n mod obinuit, fr nici o alt intervenie, copiii din populaia normal merg la vrsta de 14 luni, cu o abatere standard de 3 luni. Distribuia acestei variabile este normal.

    Etapa III: Stabilirea pragului de semnificaie i a notei z a punctului de tiere. Orice ipotez, mai ales n domeniul tiinelor sociale, este testat la un anumit prag de semnificaie. Acest prag de semnificaie arat probabilitatea de eroare cu care noi testm ipoteza. Pragul de semnificaie poate fi de 1% (cnd dorim s fim mai precii) sau de 5% (atunci cnd putem fi mai puin exaci).

    Pentru aceast cercetare vom stabili un prag de semnificaie de 1% ntruct efectele ei sunt importante. Dup stabilirea pragului, trebuie s vedem care este nota Z corespunztoare acestuia. Am precizat anterior c fiecrui punct de pe curba de distribuie normal i corespunde o anumit not standard i o anume distribuie a cazurilor din populaie fa de acel punct. De exemplu, la o valoare Z de 1 (adic 17 luni) se constat c 84% dintre copii merg la vrste mai mici de 17 luni, abia 16% mergnd mai trziu de aceast vrst.

    Exist dou de valori Z de corespunztoare pragului 1%, una referitoare la scorurile mici (n partea stng a distribuiei), care arat cei 1% dintre copii care merg cel mai timpuriu i o alt valoare referitoare la scorurile mari (n partea dreapt a distribuiei) care arat acei 1% dintre copii care merg cel mai trziu. Pe noi ne intereseaz prima dintre aceste valori.

    n tabelele statistice gsim valoarea scorului z (z=2,33) corespunztoare probabilitii de 1%

    (numit i punct de tiere). n cazul nostru ea va fi 2,33 pentru c ne referim la scorurile mai mici dect media, aflate n partea stng a curbei de distribuie.

    Etapa IV: Colectarea datelor i transformarea lor n scoruri z. n cazul nostru colectarea datelor nseamn a observa vrsta la care va merge copilul pentru prima dat (8 luni). Vom transforma scorul

    14 luni 17 luni 11 luni 20 luni 8 luni

    34%

    14%

    2%

    34%

    14%

    2%

    0 +1 +2 -1 -2 Note z

    -2,33

  • LOREDANA GHERASIM

    292

    subiectului la variabila vrst n scor Z, prin raportare la distribuia populaiei normale de comparat folosind formula notei Z (X-M)/SD), adic pentru exemplu nostru: Z=(8-14)/3)=-2

    Etapa V: Compararea notei z astfel obinut cu nota z a punctului de tiere. Dup obinerea scorul Z corespunztor datelor colectate, acesta trebuie comparat cu scorul Z corespunztor punctului de tiere. n cazul nostru, nota Z (-2) corespunztoare scorului brut este mai mare dect a notei Z a punctului de tiere (2,33). n ipoteza noastr experimental ne ateptam ca nota Z corespunztoare scorului brut s fie mai mic dect valoare Z a punctului de tiere. n consecin, acceptm ipoteza de nul, ipoteza experimental neconfirmndu-se. Cu alte cuvinte, farmacitii nu au reuit s dovedeasc, la un prag de probabilitate de 1% c vitamina lor are efectul scontat.

    Am prezentat testul Z pentru a nelege logica testrii ipotezelor i nelesul pragului de semnificaie. Vom prezenta n continuare, succint testele de comparaie cele mai frecvent folosite.

    III.3. TESTUL T PENTRU COMPARAREA UNUI EANTION CU MEDIA POPULAIEI Acest test se aplic atunci cnd dorim s comparm rezultatele unui eantion cu media

    populaiei (fr s avem informaii despre variana rezultatelor populaiei). Pentru a vedea cum anume se folosete programul SPSS n aceast situaie vom crea o nou

    baz de date (baza7.sav), care conine trei variabile: regiune (zona geografic, cu valorile: 1-european, 2-asiatic i 3-african), ind_d (procentul anual de cretere a populaiei) i dens (densitatea populaiei pe km2). Prezentm n continuare valorile acestor variabile:

    dens: 94, 800, 87, 79, 36, 216, 55, 27, 2,8, 5, 124, 36, 47, 39, 105, 4,2, 86, 81, 227, 80, 54, 94, 111, 2,5, 283, 102, 51, 188, 330, 49, 40, 29, 58, 63, 189, 102, 143, 221,

    ind_d: 0,2, 2,4, 0,7, -0,2, 2,8, 2,3, 2,9, 2,9, 0,7, 2,4, 1,1, 0,5, 3,1, 0,3, 0,5, 1,5, 3,1, 0,8, 0,4, 0,8, -0,1, -0,3, 1,1, 1,9, 1,6, 0,3, 0,2, 0,3, 3,1, 0,5, 3,3, 2,3, 2,1, 1,8, 3,1, 2,8, 1,9

    reg: 1, 2, 1, 1, 3, 3, 2, 3, 1, 3, 2, 1, 3, 1, 1, 3, 3, 1, 1, 1, 2, 1, 1, 2, 2, 1, 1, 2, 3, 1, 3, 2, 3, 2, 3, 2, 2 Dorim s comparm scorurile eantionului la variabila indice demografic cu media populaiei,

    care are valoarea 2,3. Media eantionului nostru este mai mare sau mai mic comparativ cu cea a populaiei cu valoarea 2,3? Deoarece nu avem acces la ali parametri ai populaiei, n afar de medie va trebui s estimm variabilitatea sa. Vom aplica testul t pentru a compara un eantion cu o populaie la care cunoatem media.

    Ipoteza de cercetare: Indicele demografic al eantionul nostru va avea o avea o valoare diferit de indicele demografic al populaiei

    Ipoteza de nul: indicele demografic al eantionului va avea aceeai valoare cu cel al populaiei Folosirea SPSS pentru compararea unui eantion cu media unei populaii Aplicarea testului t se face activnd din meniul ANALYZE-COMPARE MERANS opiunea ONE

    SIMPLE T TESTS:

  • ANALIZA COMPUTERIZAT A DATELOR

    293

    Dup activarea acestei comenzi pe ecran apare urmtoarea fereastr:

    Aceast fereastr are trei elementele importante: 1. cmpul cu toate variabilele din baza de date; 2. cmpul unde vom introduce variabilele pe care vrem s le analizm 3. cmpul n care se introduce valoarea medie a populaiei cu care comparm eantionul (cu

    valoarea 2,3 pentru exemplul nostru). Activare butonului OPTIONS duce la deschiderea urmtoarei ferestre:

    Se observ c automat calculatorul a ales un interval de ncredere (CONFIDENCE INTERVAL)

    de 95%, ceea ce implic un prag de semnificaie de 5%. Nu vom modifica pragul de semnificaie. Dup activarea butonului CONTINUE i apoi a butonului OK al ferestrei principale, pe ecran va apare fereastra de OUTPUT:

    One-Sample Statistics

    37 1,489 1,149 ,189procentul de crestereanuala a populatiei

    N Mean Std. DeviationStd. Error

    Mean

    12

    3

    1 2

    3

  • LOREDANA GHERASIM

    294

    One-Sample Test

    -4,294 36 ,000 -,811 -1,195 -,428procentul de crestereanuala a populatiei

    t df Sig. (2-tailed)Mean

    Difference Lower Upper

    95% ConfidenceInterval of the

    Difference

    Test Value = 2.3

    Rezultatele sunt grupate n dou tabele. Primul tabel, ONE SAMPLE STATISTICS, conine

    elemente de statistic descriptiv. Al doilea tabel, ONE SAMPLE TEST, conine date despre testul t propriu-zis. n continuare vom analiza elementele OUTPUT-ului: 1. n aceast celul este afiat media eantionului, n cazul nostru m=1,49 2. n aceast celul este afiat abaterea standard a eantionului, SD=1,1 3. celula cuprinde eroarea standard a mediei, mai precis deviaia standard a populaiei de eantioane

    de aceeai mrime cu al nostru (37), populaie din care provine eantionul nostru, m=0,19 4. nota t a eantionului nostru comparat la populaia de eantioane care are media (m) 2,3 i abaterea

    standard (m) de 0,19. Valoarea lui t este obinut dup formula t=(m- m )/ m =(1,49-2,3)/0,19-4,26. Valoarea nu este identic cu cea din tabel datorit aproximrilor fcute.

    5. cuprinde gradele de liberate pentru care a fost calculat valoarea lui t i probabilitatea de respingere a ipotezei de nul; n cazul nostru df=36

    6. prezint pragul de semnificaie real, care ne spune care este probabilitatea cu care greim dac respingem ipoteza de nul i acceptm ipoteza de cercetare. n exemplu nostru valoarea pragului de semnificaie este 0,000, dar se raporteaz ca un p

  • ANALIZA COMPUTERIZAT A DATELOR

    295

    procentul de cretere a populaie eantionului nostru este mai mic semnificativ n comparaie cu cel al populaiei.

    S analizm acum dac scorurile la variabila densitate din eantionul nostru difer de cea a populaiei cu valoarea de 0,9. Rezultatele testului ONE SIMPLE T TEST indic urmtoarele rezultate:

    One-Sample Statistics

    37 261,797 895,096 147,153Numar de oameni/kilometru patrat

    N Mean Std. DeviationStd. Error

    Mean

    One-Sample Test

    1,167 36 ,251 171,797 -126,643 470,237Numar de oameni/kilometru patrat

    t df Sig. (2-tailed)Mean

    Difference Lower Upper

    95% ConfidenceInterval of the

    Difference

    Test Value = 90

    Mediile: Me=261,7, Mpop=90 Valoarea lui t i pragul de semnificaie: t(36)=1,16, p=0,251. Rezultatele indic faptul c nu exist diferene semnificative ntre densitatea medie a

    eantionului i cea a populaie, cu valoarea 90 (dac am accepta ipoteza de cercetare am grei n 25,1% din cazuri). Putem spune c avem densitatea eantionului studiat de noi este aceeai cu cea a populaiei.

    III.4. TESTUL T PENTRU COMPARAREA A DOU EANTIOANE PERECHI n psihologia experimental se face distincie ntre grupele independente i dependente de

    subieci. Atunci cnd cercettorul mparte subiecii n grupe n funcie de variabila independent, fiecrui grup prezentndu-i un grad de intensitate al variabilei independente, avem de a face cu grupe independente de subieci. Pentru fiecare nivel al variabilei independente vom avea cte un grup de subieci. Astfel, dac variabila independent are dou grade de intensitate, subiecii vor fi mprii n dou grupe, n final comparndu-se rezultatele subiecilor. Fiecare subiect va face parte dintr-un singur grup experimental. S presupunem c variabila independent este tipul de feed-back, cu dou grade de intensitate, pozitiv i negativ. Subiecii vor fi mprii n dou grupe, condiia de feed-back pozitiv i respectiv condiia de feed-back pozitiv.

    Exist posibilitatea ca toate nivelurile variabilei independente s fie prezentate aceluiai eantion de subieci. Aceeai subieci vor trece prin toate condiiile experimentale. n aceast situaie vom avea grupe perechi sau dependente de subieci. Subiecii crora le msurm anxietatea nainte i dup intervenia terapeutic formeaz eantioane perechi. Cea mai simpl situaie de comparare a eantioanelor este n situaia de test-retest. De exemplu, msurm nivelul anxietii subiecilor nainte i dup terapie, pentru a vedea schimbrile care apar ca urmare a interveniei terapeutice.

    Nu cunoatem nivelul mediu anxietii populaie de subieci anxioi nainte de a veni la terapie i nici nivelul mediu al anxietii dup terapie. Ceea ce tim este nivelul anxietii subiecilor care au

  • LOREDANA GHERASIM

    296

    venit la terapie, nainte i dup intervenia terapeutic. Ceea ce ne intereseaz pe noi este de fapt diferena dintre cele dou msurtori ale anxietii, nainte i dup terapie.

    Ipoteza de cercetare: susine c vor fi diferene ntre cele dou msurtori; ne ateptm ca nivelul anxietii dup terapie s fie mai mic dect cel iniial.

    Ipoteza de nul: diferenele dintre cele dou msurtori sunt nule, nu exist nici o diferen ntre nivelul iniial i cel final al anxietii.

    Diferenele dintre mediile celor dou eantioane vor forma un eantion de comparaie. Acest eantion al diferenelor se compar cu o populaie la care cunoatem media (media are valoarea 0 conform ipotezei de nul).

    Folosirea SPSS pentru compararea a dou eantioane perechi Pentru a demonstra modul de utilizare a testului t pentru eantioane perechi, vom folosi baza

    de date Baza1.sav. Se utilizeaz testul t pentru eantioane perechi, pentru c avem rezultatele acelorai subieci nainte i dup terapie.

    Aplicarea testului t se face activnd din meniul ANALYZE COMPARE MEANS opiunea PAIRED-SAMPLES T TEST:

    Odat activat comanda va apare fereastra de mai jos:

    Prezentm principalele opiuni ale ferestrei:

    1. cmpul din stnga cuprinde variabilele din baza de date 2. indic selecia curent, variabilele selectate pentru analiz; pentru acest tip de test se

    selecteaz o pereche de variabile; 3. cmpul n care se introduc cele dou variabile pereche Dup introducerea variabilelor n cmpul de analiz fereastra ar trebui s arate astfel:

    1

    3 2

  • ANALIZA COMPUTERIZAT A DATELOR

    297

    Butonul OPTIONS este identic cu cel de la testul t care permite compararea unui eantion cu o

    populaie. Vom pstra intervalul de ncredere de 95%. Dup apsarea butonului OK fereastra OUTPUT ne va prezenta urmtoarele rezultate:

    Paired Samples Statistics

    107,9000 20 6,0166 1,3454

    107,9500 20 5,3062 1,1865

    nivelul anxietatiiinainte de terapienivelul anxietatiidupa terapie

    Pair1

    Mean N Std. DeviationStd. Error

    Mean

    Paired Samples Correlations

    20 -,259 ,270nivelul anxietatii inaintede terapie & nivelulanxietatii dupa terapie

    Pair1

    N Correlation Sig.

    Paired Samples Test

    -0.05 8,9940 2,0111 -4,2593 4,1593 -,025 19 ,980nivelul anxietatii inade terapie - nivelulanxietatii dupa tera

    Pair1

    Mean Std. DeviationStd. Error

    Mean Lower Upper

    95% ConfidenceInterval of the

    Difference

    Paired Differences

    t df Sig. (2-tailed)

    Rezultatele sunt organizate n trei tabele, pentru fiecare dintre acestea vom analiza celulele.

    Tabelul PAIRED SAMPLES STATISTICS: 1. conine perechea de variabile analizat; variabilele trebuie s fie perechi, adic s provin de la

    aceeai subieci i fie cuantificate cu aceeai unitate de msur 2. conine mediile celor dou grupe analizate: Mini=107,9, Mfin=107,95 3. prezint numrul de subieci din fiecare eantion, N=20 4. conine deviaiile standard a scorurilor fiecrui eantion: Sini=60,1, Sfin=5,3

    1

    2

    3 4

    5

    6

    7

    8 9

    10 11 12

    13

    14 15

  • LOREDANA GHERASIM

    298

    5. conine abaterile standard ale populaiilor de eantioane de N subieci din care provin eantioanele noastre

    Tabelul PAIRED SAMPLES CORRELATIONS 6. coeficientul de corelaie dintre cele dou variabile pereche 7. pragul de semnificaie al corelaiei, adic probabilitatea de eroare dac am afirma c exist o

    legtur ntre cele dou variabile Tabelul PAIRED SAMPLES TESTS

    8. conine numele perechii de variabile i precizeaz diferena dintre variabile, n cazul nostru anx1-anx2

    9. cuprinde diferena medie dintre cele dou grupe de subieci. Valoarea negativ indic faptul c anxietatea iniial este mai mic comparativ cu cea final

    10. cuprinde abaterea standard a eantionului rezultat din diferenele celor dou eantioane 11. indic abaterea standard a populaiei de eantioane care cuprinde toate eantioanele de

    aceeai mrime 12. indic intervalul de ncredere de 95%al diferenei dintre mediile celor dou grupe 13. valoarea lui t, adic nota t a eantionului de diferene n cadrul populaiei de eantioane:

    t(19)=-0,02 14. gradele de libertate pentru care este calculat nota t, df=19 15. pragul de semnificaie sau probabilitatea de eroare atunci cnd respingem ipoteza de nul:

    p=0,980 n continuare prezentm rezultatele obinute n urma analizei realizat anterior: Mediile iniiale i finale ale subiecilor: Mini=107,9, Mfin=107,95 Valoarea lui t i a pragului de semnificaie: t(19)=-0,02, p=0,980. Interpretarea se face n funcie de valoarea lui t i pragul de semnificaie. Reamintim c pentru

    a respinge ipoteza de nul trebuie s avem cel mult 5% erori (p0,05). n cazul nostru se constat c nu apare o diferen semnificativ ntre nivelul iniial i cel final al anxietii (dac am respinge ipoteza de nul am grei n 98% din cazuri sau cu alte cuvinte valoarea lui t se plaseaz n zona de ncredere a ipotezei de nul). Subiecii au acelai nivel al anxietii dup intervenia terapeutic, astfel c putem spune c terapia nu a avut efect, nu a mbuntit starea subiecilor.

    Corelaia ne arat dac subiecii i schimb ierarhia unii fa de alii, nu numai nivelul variabilei dependente. Avem trei situaii posibile: lipsa corelaiei semnificative: n acest caz nu exist o legtur ntre ierarhia subiecilor la prima cu

    cea de al dou msurare. Putem afirma c diferenele ntre msurtori nu sunt sistematice, intervenia acionnd oarecum haotic.

    corelaie pozitiv semnificativ: indic faptul c ierarhia subiecilor se pstreaz de la o msurare la alta. Cei care aveau rezultate mici la prima msurare au rezultate mici i la a doua, iar cei care aveau rezultate mari la prima msurare au rezultate mari i la a doua msurare.

    corelaie negativ, semnificativ: indic faptul c ierarhia subiecilor se inverseaz de la o msurare la alta. Cei care aveau rezultate mici la prima msurare au rezultate mari la a doua, iar cei care aveau rezultate mari la prima msurare au rezultate mici la a doua msurare.

    n exemplu nostru avem prima situaie corelaie nesemnificativ, r=-0,25, p=0,270, ceea ce indic faptul c cele dou variabile sunt independente una de cealalt, deoarece diferenele nu sunt sistematice.

  • ANALIZA COMPUTERIZAT A DATELOR

    299

    III.5. TESTUL T PENTRU COMPARAREA A DOU EANTIOANE INDEPENDENTE Acest test se folosete cnd dorim s analizm influena unei variabile independente, care

    presupune eantioane independente de subieci. Pentru a demonstrat modul de utilizare a testului vom folosi datele din baza de date baza1.sav. Vom analiza dac genul subiecilor influeneaz nivelul iniial al anxietii pacienilor. n acest caz variabila independent este genul subiecilor (cu dou grade de intensitate, 1 - subieci de sex masculin i 2 subieci de gen feminin), variabila dependent fiind nivelul iniial al anxietii. n funcie de variabila independent se creeaz dou grupe de subieci independeni sau diferii (grupul 1 va fi format numai din subiecii de gen masculin, iar grupul 2 numai din subieci de gen feminin). Fiecare subiect va putea face parte doar dintr-un singur grup.

    Ipoteza de cercetare: subiecii de sex masculin vor avea un nivel al anxietii iniiale diferit de cel al subiecilor de gen feminin

    Ipoteza de nul: subiecii de gen masculin i feminin vor avea acelai nivel al anxietii iniiale. Folosirea SPSS pentru compararea a dou eantioane independente

    Aplicarea testului t pentru eantioane independente se face activnd meniul ANALYZE COMPARE MEANS, opiunea INDEPENDENT SAMPLES T TEST:

    Vom introduce variabila dependent (nivelul anxietii nainte terapiei) n cmpul TEST

    VARIABLE i variabila independent n cmpul GROUPING VARIABLE:

    Sunt trei cmpurile importante pe care trebuie s le avem n vedere: 1. cmpul cu variabilele din baza de date 2. cmpul n care vom introduce variabila dependent, adic variabila asupra creia dorim s

    analizm influena variabilei independente.

    1

    2

    3

    4

  • LOREDANA GHERASIM

    300

    3. cmpul unde introducem variabila independent sau variabila de grupare (cea dup care grupm subiecii).

    4. butonul care permite precizarea celor dou niveluri ale variabilei independente; chiar dac variabila independent are mai multe grade de intensitate, se pot preciza doar dou dintre acestea.

    Activarea butonului DEFINE GROUPS deschide o fereastr unde vom trece valorile corespunztoare celor dou grupuri alese pentru comparaie (n acest caz variabila independent are doar dou niveluri 1 i 2):

    n fereastra OUTPUT sunt prezentate urmtoarele rezultate:

    Group Statistics

    9 104,8889 2,5712 ,857111 110,3636 6,9753 2,1031

    sexul subiectilorsubiecti de gen masculinsubiecti de gen feminin

    nivelul anxietatiiinainte de terapie

    N Mean Std. DeviationStd. Error

    Mean

    Independent Samples Test

    6,683 ,019 -2,225 18 ,039 -5,4747 2,4605 -10,6442 -,3053