lab2 spss

7
M. Popa – Aplicaţii SPSS (Transformarea variabilelor) 1/7 Operaţii de transformare a variabilelor Dupa modul de creare, in SPSS, variabilele pot fi: variabile initiale , introduse, direct de la tastatură. variabile prelucrate , obtinute prin transformarea variabilelor initiale. Proceduri de transformare: (meniul Transform). EXEMPLE: 1. Însumarea valorilor variabilelor Rezulta o variabila noua (prelucrata) prin adunarea valorilor din două sau mai multe variabile initiale. Fie date scorurile la trei examene parţiale (scor_1, scor_2 si scor_3). Dorim să realizăm o variabilă care să cuprindă un scor general, prin însumarea celor trei variabile. (punctele pe cele trei scoruri reprezinta valori lipsă de sistem (subiectii nu au note). Coloana „total” a fost inserata pentru a depune in ea suma celor trei scoruri (altfel SPSS-ul ar fi creat o noua variabila pe care ar fi depus-o ca ultima coloana a bazei de date). Meniul Transform, comanda Compute, se deschide caseta de dialog:

Upload: aaron-witt

Post on 17-Jan-2016

212 views

Category:

Documents


0 download

DESCRIPTION

spss - statistica

TRANSCRIPT

Page 1: lab2 SPSS

M. Popa – Aplicaţii SPSS (Transformarea variabilelor) 1/5

Operaţii de transformare a variabilelor

Dupa modul de creare, in SPSS, variabilele pot fi: variabile initiale , introduse, direct de la tastatură. variabile prelucrate , obtinute prin transformarea variabilelor initiale.

Proceduri de transformare: (meniul Transform).

EXEMPLE:

1. Însumarea valorilor variabilelorRezulta o variabila noua (prelucrata) prin adunarea valorilor din două sau mai multe variabile initiale.

Fie date scorurile la trei examene parţiale (scor_1, scor_2 si scor_3). Dorim să realizăm o variabilă care să cuprindă un scor general, prin însumarea celor trei variabile. (punctele pe cele trei scoruri reprezinta valori lipsă de sistem (subiectii nu au note).

Coloana „total” a fost inserata pentru a depune in ea suma celor trei scoruri (altfel SPSS-ul ar fi creat o noua variabila pe care ar fi depus-o ca ultima coloana a bazei de date). Meniul Transform, comanda Compute, se deschide caseta de dialog:

În caseta de mai sus se efectuează următoarea succesiune de operaţii:1. la Target Variable se introduce numele variabilei (in cazul de fata „total”). 2. la Numeric Expression se scrie expresia de însumare prin una din metodele:

a. de la Functions click funcţia SUM (expresie numerică, expresie numerică, ...) si apoi click pe butonul ▲, sau se scrie de la tastatură . Variabilele numerice se scriu între paranteze, cu virgulă între ele, de la tastatura, sau se muta din lista de variabile dand click pe butonul ►.

Page 2: lab2 SPSS

M. Popa – Aplicaţii SPSS (Transformarea variabilelor) 2/5

Dacă variabilele sunt consecutive se foloseste SUM (prima_variabilă TO ultima_variabilă).

b. Prin adunarea fiecărei variabile care se însumează (scor_1+scor_2+scor_3). 3. apoi OK4. Daca variabila in care se depune rezultatul (in cazul nostru total) există, SPSS ne întreabă dacă

dorim să modificăm conţinutul acesteia. Dacă variabila nu exista rezultatul este pus într-o variabilă creată automat si plasata la sfarsitul bazei de date.

Răspundem OK, deoarece ştim că am creat această variabilă tocmai pentru a depune în ea suma.

Rezultatul operaţiei se vede în imaginea de mai jos:

2. Calcularea mediei a două sau mai multe variabileCalcul mediei se face cu functia MEAN (expresie_numerică, expresie_numerică, ...), unde ... arată că putem pune oricâte variabile (sau valori) numerice, cu virgulă între ele. Ca şi la suma, daca variabilele se afla una după alta în tabela SPSS se poate folosi clauza TO.

Funcţia MEAN se scrie de la tastatură sau se selecteaza din lista de funcţii, si se actioneaza butonul ▲.Direct, fără a folosi funcţia MEAN, media se poate calcula dupa formula: (scor_1+scor_2+scor_3)/3Observatie. emnificaţia functiilor se află usor din Help-ul casetei Compute.

3. Extragerea valorii anului dintr-o variabilă de tip cronologic (date) SPSS oferă funcţii de transformare cu variabilele de tip cronologic. Dintre acestea vom exemplifica cu realizarea unei variabile care să conţină anul naşterii, extras dintr-o variabilă care conţine data naşterii.

Variabila bdate, conţine data naşterii. Vârsta se calculeaza facand diferenţa dintre anul curent (să zicem, 2000) şi anul naşterii.

Page 3: lab2 SPSS

M. Popa – Aplicaţii SPSS (Transformarea variabilelor) 3/5

Pentru a avea variabila ce urmează a fi creată în apropierea variabilei bdate, vom insera variabila „virsta”, de tip numeric, cu doi întregi). Apoi meniul Transform comanda Compute :

La Target variable se scrie numele noii variabile (virsta). La Numeric Expression se scrie expresia de transformare, folosind funcţia XDATE.YEAR() care are ca rezultat extragerea valorii anului dintr-o variabilă de tip dată calendaristică (pe exemplu - XDATE.YEAR(bdate) va extrage valoarea anului din variabila cronologică bdate, adica 2000-XDATE.YEAR(bdate), rezultand:

4. Recodificarea variabilelorRecodificarea unei variabile înseamnă convertirea valorilor acesteia, cu scopul obţinerii unei distribuţii bazată pe frecvenţe cumulate. Limitele claselor de grupare nu sunt stabilite automat de SPSS ci se aleg de către utilizator. Procesul este similar cu crearea unei tabele de frecvenţe grupate şi ne reamintim că poate fi derulat în maniera descrisă mai jos:

Paşi pentru grupării de frecvenţe (Spatz): Se face diferenţa dintre valoarea cea mai mare şi valoarea cea mai mică a unei distribuţii Se împarte valoarea obţinută la mărimea posibilă (estimată) a intervalului Se selectează mărimea intervalului care conduce la un număr de clase cuprins între 5 şi 15 Se determină limita inferioară a primului interval (trebuie să fie un multiplu al mărimii

intervalului) Se determină limita superioară a primului interval Se construiesc intervalele de clasă pentru fiecare interval, fiind atenţi să nu avem clase

„suprapuse” sau „intervale neacoperite”

În principiu, deşi este recomandabilă obţinerea unei grupări de frecvenţe pe 5-15 clase, se poate opta pentru un număr de clase care serveşte cel mai bine interesul de cercetare. De exemplu, în cazul unei distribuţii de vârstă exprimată în ani, este preferabil să se opteze pentru clase „cincinale” sau „decade”, acestea având şi o anumită semnificaţie psihologică.

Page 4: lab2 SPSS

M. Popa – Aplicaţii SPSS (Transformarea variabilelor) 4/5

În urma transformării de mai sus, am obţinut variabila virsta. Utilizarea ei ca atare în analize statistice este improprie, de aceea ar fi foarte utilă obţinerea unei variabile care să asocieze anumite valori convenţionale pentru categorii de virsta. Pentru aceasta putem efectua „recodificarea” variabilei virsta pentru a obţine o distribuţie grupată de frecvenţe, astfel: Meniul Transform, procedura Recode - Into Different Variables (Daca se alege opţiune Into Same

Variables în cazul unei erori, nu nu se poate reveni la variabila iniţială pentru o nouă recodificare). se trece variabila virsta în zona Numeric Variable Output Variable. Semnul întrebării arată că se

aşteaptă numele variabilei ce urmează să fie creată prin recodificare (c_clase – pe exemplu). Acest nume se scrie în zona: Name, după care se apasă butonul Change. În zona Label se introduce eticheta variabilei nou create

Se scriu apoi limitele claselor de recodificare: butonul Old and New Values

Explicatii: În zona Old value, se alege una dintre variantele de definire a valorilor de la care se pleacă. Să zicem că am ales soluţia să recodificăm anii pe intervale de zece ani, primul interval fiind 30-39, al doilea 40-49, ş.a.m.d.Pentru aceasta activăm opţiunea Range şi scriem valorile limite al intervalului dorit. După aceasta, în zona New value oValue, scriem care este valoarea convenţională pe care o atribuim acestei clase. Apoi click Add pentru a definitiva operaţiunea şi trecem la definirea următoarei clase, până terminăm.La OldNew apare lista recodificărilor definite.Se acţionează butonul Continue şi, la revenirea în caseta anterioară, butonul OK. Rezultatul operaţiuni este:

Page 5: lab2 SPSS

M. Popa – Aplicaţii SPSS (Transformarea variabilelor) 5/5

Se observă corespondenţa dintre valoarea din variabila virsta, cu valoarea din variabila v_clase. Pentru valoarea 71, avem missing value în variabila v_clase, deoarece nu am definit un interval care să cuprindă această vârstă. (De regulă, această situaţie este determinată de o eroare de definire a intervalelor de clasă. Pentru a o repara, ar trebui să intrăm din nou în procedura Recode şi să redefinim clasele). Atenţie, la declararea intervalelor de grupare în clase, sau categorii, trebuie avut grijă ca intervalele să nu se suprapună şi să nu aibă „distanţe” între ele.

5. Ordonarea după rang a valorilor unei variabileFie o variabilă cantitativă ale cărei valori nu respectă condiţiile unei statistici parametrice (figura din stânga, unde valoarea 250 este excesivă). Într-o situaţie de acest gen, una din soluţiile posibile este transformarea de rang, cu procedura Transform-Rank cases (caseta din dreapta):

Variabila vizată (scor) este trecută în lista Variable(s), se setează modul de ordonare (am ales atribuirea rangului 1 valorii celei mai mari) iar apoi am acţionat butonul OK. Procedura permite fixarea unor parametri de transformare cu ajutorul butoanelor Rank şi Ties, asupra cărora nu insistăm aici.