spss-prezentare generale

Upload: toma-claudia

Post on 20-Jul-2015

125 views

Category:

Documents


0 download

TRANSCRIPT

SPSS PREZENTARE GENERAL INTRODUCERE SPSS for Windows este un program specializat n analiza statistic a datelor. Prin comparaie cu alte programe de acest gen, destul de numeroase, acesta se distinge nu att prin gradul de acoperire a funciilor statistice, ct prin structurarea riguroas i uurina utilizrii. Cea mai recent versiune disponibil este SPSS 10.0 (aprut n 1999). Autorul acestui manual a avut acces doar la versiunea 8.0. n linii generale ns, informaiile din acest manual acoper toate versiunile sub Windows (ncepnd cu SPSS 5.0). Atunci cnd va fi necesar, se vor face precizri pentru diferene ntre versiuni. O sesiune de lucru n SPSS se desfoar n mai multe domenii distincte, intercorelate. Pentru comparaie, editarea unui document n MS WORD, presupune un singur domeniu de lucru, fereastra de editare. Dei pot exista mai multe documente n lucru, dar toate se supun acelorai funcii. n SPSS domeniile acoper functionaliti diferite ale tratrii datelor aflate n lucru. Domeniile de operare se prezint sub forma unor ferestre independente care se afl deschise simultan, fiecare avnd funcii i meniuri specifice. Trecerea de la o fereastr la alta se face ntrunul din urmtoarele moduri: a. Din meniul Windows, prin alegerea ferestrei dorite; b. Utiliznd butoanele din bara de butoane a ferestrei SPSS; c. Utiliznd butoanele care de bara de sarcini Windows (din josul ecranului); Principalele domenii de lucru ale unei sesiuni SPSS sunt: 1. Domeniul bazei de date (DATA EDITOR) Se prezint sub forma ferestrei DATA EDITOR care are asociat numele bazei de date. Bara de titlu

Bara de meniuri

Bara de butoane

Pe coloane, variabilele

Pe linii, cazuri (nregistrri)

O sesiune de lucru cu SPSS presupune n mod necesar existena unei baze de date deschise. Aceasta poate fi creat direct cu ajutorul structurii (ferestrei) DATA EDITOR sau poate fi deschis cu ajutorul comenzii (File) Open. De reinut: SPSS ine deschis o singur baz de date n timpul unei sesiuni de lucru. Pentru a deschide o alt baz de date, cea aflat n lucru va fi nchis automat. Programul solicit salvarea ei prealabil dac acest lucru nu a fost deja efectuat. Dac vrem s prelucrm date aflate n baze de date diferite, este necesar aducerea lor n aceeai baz de date (Procedura DATA-Merge files, care va fi descris mai trziu). 2. Domeniul afirii rezultatelor (Fereastra Output): Fereastra Output prezint un mediu (n parte asemntor cu meniul din DATA EDITOR), i butoane de comenzi. Funciile acesteia sunt: a. afiarea rezultatelor diverselor tipuri de prelucrri; b. editarea rezultatelor pentru a fi aduse la o form mai potrivit cu necesitile;

Butonul de trecere pe fereastra bazei de date

Zona de navigare

Zona de afiare a rezultatelor

La versiunile de SPSS 5 i 6, rezultatul prelucrrilor este prezentat n dou ferestre distincte:

Fereastra Output, pentru rezultate numerice. Este un editor de tip ASCII in care rezultatele sunt aranjate intr-o form ordonat, fr a fi puse n tabele de tip Word.

Fereastra Chart Carousel: Este un catalog de prelucrri grafice care permite doar vizualizarea fiecrei imagini n parte, prin alegerea acestei din list. Dac se trece n regim de editare (butonul Edit) pentru un anumit grafic, acesta este deschis ntr-o fereastra individual (Chart) care are propriul meniu i care permite modificarea proprietilor graficului i, eventual, salvarea acestuia.

La versiunile dup 7.0 SPSS Viewer: Are caracteristici de editor grafic i include att rezultatele numerice ct prelucrrile grafice. Are asociat un NAVIGATOR care faciliteaz inspectarea rezultatelor. De la SPSS 8.0 n sus exist posibilitatea alegerii de afiare a rezultatelor i ntr-o fereastr de tip ASCII (DRAFT Viewer) De reinut: Spre deosebire de fereastra DATA EDITOR care nu poate ine deschis dect o singur baz de date deschista care nu poate avea dect o singur baz de date, SPSS VIEWER poate fi deschis n mai multe variante simultan (dei posibil, acest lucru este destul de puin utilizat n practic) 3. Domeniul procedurilor (Fereastra SYNTAX). Se prezint ntr-o fereastr cu caracteristici de editare n regim ASCII, dar are funcii de lansare a unor proceduri create special de utilizator.

Butonul de trecere pe fereastra bazei de date

Butonul (RUN) de lansare a procedurii SPSS din fereastra Syntax

Exemple de proceduri SPSS (syntax)

Pentru nceptori, cele mai utilizate domenii sunt DATA EDITOR i Output sau SPSS Viewer, SPSS SYNTAX fiind destul de complicat de utilizat n aceast faz. Vom prezenta mai trziu o situaie n care utilizarea acestui domeniu este forate practic.

Setri uzuale ale programului SPSSCa orice program, i SPSS permite o serie de setri preliminare, n funcie de opiunile utilizatorului. Comenzile de setare se gsesc n meniul EDIT-Options. Dintre opiunile mai importante, reinem: - Memoria de lucru, care trebuie setat la o dimensiune adecvat memoriei RAM disponibil pe calculator; - Numele i locul fisierului jurnal, un fisier de tip ASCII n care sunt nscrise toate procedurile efectuate cu SPSS. Atenie, printre opiuni se afl i aceea de a rescrie jurnalul la fiecare deschidere a SPSS sau de a aduga fiecare sesiune de lucru alturi de

-

cele anterioare. n acest caz, fiierul jurnal va crete cu fiecare sesiune de lucru. Utilitatea acestui fiier const n posibilitatea de a regsi proceduri deja rulate, copierea lor, trecerea ntr-o fereastr Syntax, i rularea lor direct. Fonturile de afiare a rezultatelor, caracteristici ale graficelor, dimensiunea implicit a variabilelor noi, etc. (etc.)

Paii analizei statistice cu SPSS1 Introducerea datelor (sau deschiderea unui fiier existent) Opiuni: (a) Introducerea direct a datelor n DATA EDITOR (b) Deschiderea unui fiier de date SPSS (extensia .SAV) (c) Importarea unui fiier de format diferit (se alege din caseta File of type deschis cu File open) Corecia erorilor, selecii, recodificri, transformarea variabilelor prin calcule, declararea valorilor lips, combinarea datelor din dou fiiere diferite (meniurile DATA, TRANSFORM) Meniurile Statistics i Graphs Conform casetei de dialog care este afiat la fiecare procedura (a) Se acioneaz butonul OK din macheta procedurii (butonul devine activ numai atunci cnd sunt ntrunite condiiile) Rezultatele prelucrrilor sunt afiate ntr-o fereastr specific (Output), cu funciuni de editare grafic sau de tip text, n funcie de versiune.

2 3 4 5 6

Pregtirea datelor Selectarea procedurii satistice Selectarea variabilelor ce urmeaz a fi supuse prelucrrii Rularea procedurii Analiza rezultatelor

CREAREA UNEI BAZE DE DATE SPSS Pentru crearea unei baze de date proprii n SPSS, se procedeaz astfel: a) Se lanseaz SPSS b) Se definesc variabilele bazei de date c) Se introduc datele d) Se salveaz baza de date (extensia specific este *.sav) Definirea variabilelor: - se poziioneaz cursorul pe coloana dorit - se actioneaz Define variable din meniul Data - o soluie mai direct este dublu clic pe capul de coloan

Caseta principal de definire a variabilei:Se introduce numele variabilei (nerecomandabil pstrarea numelui implicit VAR00003)

Butoane de comenzi

Zona de descriere a variabilei

Butoane de opiuni: TIPUL VARIABILEI ETICHETE VALORI LIPS FORMAT COLOAN

Definirea tipului de variabil: Se acioneaz butonul Type de pe caseta Define Variable. Se deschide caseta Define Variable Type, unde se marcheaz tipul variabilei i se declar caracteristicile acesteia (Width, Decimal Places, n cazul variabilelor numerice) Se acioneaz butonul Continue, pentru a se reveni la caseta Define Variable.

Se recomand utilizarea preponderent a tipului Numeric, cu un numr adecvat de ntregi i zecimale. Observaie: Opiunile din zona Measurement (Scale, Ordinal, Nominal), care se regsesc doar la versiuni SPSS de la 7.0 n sus, nu au o utilitatea practic direct, marcarea lor avnd doar un rol de contientizare a tipului de msurare specific respectivei variabile. EXEMPLE: - Pentru o variabil n care vom introduce vrsta n ani ntregi, vom defini Type Numeric cu Width 2 (presupunnd c nu avem subeici cu vrsta peste 100 de ani) i Decimal Places 0. - Pentru o variabil n care vom introduce rezultatul al un test de inteligen n valori QI, definim Type Numeric cu Width 3 i Decimal Places 0. - Pentru o variabil n care nregistrm sexul subiecilor, putem utiliza Type Numeric cu Width 1 i Decimal Places 0. Etichetarea variabilelor: Etichetarea este o form de descriere explicit a coninutului variabilei (avnd n vederea c numele variabilei nu poate fi mai mare de 8 caractere). Etichetarea se poate practica att la nivelul variabilei dar i la valorile pe care le conine. Pentru etichetare se apas butonul Labels de pe caseta Define Variable. Se deschide o nou caset (Define Labels), care conine spaii pentru eticheta variabilei (Variable Label) i pentru etichetele valorilor (Value labels).

numele variabilei (maxim 8 caractere)

Caseta DEFINIRE ETICHETE

Butonul ETICHETE

Eticheta variabilei

Eticheta valorilorEticheta variabilei nu se supune restriciilor pentru nume, putnd conine oricte caractere, ar i spaii sau alte semne grafice tipribile. Etichetele pentru valori vor fi introduse una cte una, prin plasare valorii n zona Value, apoi prin introducerea etichetei corespunztoare n zona Value label i, n fine, prin acionarea butonului Add. Operaiunea se reia pentru toate valorile pe care dorim s le etichetm. Imaginea prezint etichetarea valorilor unei variabile care se refer la calificativul la un examen. Se observ c valoarea 1 are eticheta SLAB, valoarea 2, eticheta MEDIU iar valoarea 3, eticheta BUN (nc nu a fost acionat butonul Add pentru a fi finalizat declaraia etichetei acestei valori). Important: Dei nimic nu ne oblig s aplicm etichete variabilelor i valorilor, este foarte recomandabil ca ele s fie atribuite. Etichetele ajut la citirea mai uoar a rezultatelor (deoarece apar alturi de acestea). n plus, etichetele sunt asociate prelucrrilor grafice (histograme, bare, etc.) fapt care reduce necesitatea de a le introduce ulterior prin editarea respectivelor grafice. De altfel, pentru a ti cum s declarm etichetele, este bine s ni le imaginm ca fiind plasate pe axele de referin ale unui grafic.

Declararea valorilor lips (missing values)Valorile lips sunt de dou tipuri: a. valori lips de sistem (system missing values) adic valori care lipsesc din baza de date (nu au fost introduse). Forma lor de evideniere pe ecran este un punct plasat n celula respectiv. b. valori lips declarate de utilizator (user missing values) adic valori pe care utilizatorul le declar ca atare. Acestea pot exista n baza de date dar utilizatorul, din diverse motive, nu dorete s fie luate n calcul. Atenie, odat declarate, aceste valori nu sunt terse i nici nu sunt marcate n mod evident pe ecran.

Pentru declararea valorilor lips se acioneaz butonul Missing Values din caseta Define Variables:

Caseta Define Missing Values

Se observ c exist mai multe opiuni: - declararea a trei valori distincte ca fiind lips (Discrete missing values) - declarea unui domeniu de valori lips (Range of missing values) - declararea unui domeniu la care se poate aduga i o valoare distinct (Range plus one discrete missing value) Dei nu pare foarte evident acum, utilitatea funciei de declarare a valorilor lips nu trebuie subestimat. Foarte adesea suntem nevoii s scoatem din prelucrri anumite valori (care nu pot fi totui, pur i simplu, terse). S ne gndim numai la valorile extreme ale unei distribuii, a cror meninere n anumite prelucrri poate determina moidifcri semnificative a rezutlatelor. n concluzie, declararea variabilelor se compune din urmtoarele operaiuni: - Atribuirea numelui (maxim 8 caractere) - Definirea tipului (numeric, caracter, data) - Atribuirea etichetei variabilei - Atribuirea etichetei valorilor, n cazul variabilelor msurate pe scale nominale sau ordinale - Declararea valorilor lips (care nu au fost recoltate n procesul de msurare, din diferite motive)

EXEMPLU PRACTIC S ne imaginm c am aplicat testul Eysenck Personality Inventory, care vizeaz urmtoarele caracteristici de personalitate: extraversiunea, nevrozismul i atitudinea defensiv (scala Lie). Pentru analiza datelor suntem interesai s raprtm rezultatele la o serie de caracteristic demografice ale subiecilor, s zicem: sexul i vrsta. n plus, pentru a avea controlul datelor dorim s inregistrm i identitatea subiecilor. Pentru fiecare dintre informaiile pe care dorim s le introducem n baza de date vom crea cte o variabil.

VariabilaIdentitatea subiecielor (esentiala pentru a asigura identitatea fiecarei inregistrari inparte si pentru realizarea corespondentelor cu alte baze de date in care avem informatii cu privire la aceiai subieci) Sexul

Numele variabileiCOD (optm pentru un cod numeric dac nu avem nevoie de numele subeicilor)

Tipul variabilei

Eticheta variabilei

Etichetele valorilorNu se aplic etichete dect la valorile variabilelor de tip categorial (nominale sau ordinale )

numeric, Width 2, Decimal Identitate Places 0 (presupunem c nu avem mai mult de 99 subieci)

SEX

Vrsta (n ani VIRSTA mplinii; sau n luni dac dorim mai mult precizie) Extraversiune EXTRAV

Nevrozism

NEVRO

Lie

LIE

Numeric, Width 1, Decimal Places 0 Numeric, Width 2, Decimal Places 0 (presupunem c nu avem subeici cu vrsta peste 99 de ani) Numeric, Width 2, Decimal Places 0 (nu se poate obine o valoare mai mare de 100 i nu exist zecimale) Numeric, Width 2, Decimal Places 0 (nu se poate obine o valoare mai mare de 100 i nu exist zecimale) Numeric, Width 1, Decimal Places 0 (nu se poate obine o valoare mai mare de 9 i nu exist zecimale)

Sex Vrsta

1=feminin 2=masculin

Extraversiune

Nevrozism

Minciun

Se observ faptul c pentru variabile ale cror nume exprim exact coninutul (SEX, VRSTA) se poate utiliza fr nici un inconvenient numele i ca etichet. Pentru a fi mai explicii, s spunem c numele variablei este util n primul rnd SPSS-ului pentru a manipula variabilele, n timp ce etichetele sunt necesare mai ales utilizatorului pentru a nelege cu uurin la ce se refer o variabil al crui nume prea scurt

Avem alturat, imaginea DATA EDITOR pentru primii trei subieci introdui cu variabilele de mai sus:

Cteva precizri suplimentare Declararea, cu precdere, a variabilelor de tip numeric: SPSS este un program de prelucrare statistic ceea ce implic date numerice. Dei el poate opera i cu date de tip caracter, acestea nu sunt acceptate pentru toate tipurile de proceduri statistice. Pentru a nu avea surprize, este recomandabil s fie utilizate variabile de tip numeric n toate cazurile. De exemplu, variabila sex, poate fi declarat de tip caracter (cu valorile M si F) dar, la fel de bine, de tip numeric (cu valorile convenionale 1 i, respectiv, 2). n acest din urma caz, pentru explicitarea valorilor se vor folosi etichetele de valoare (value label). Introducerea unei variabile pentru Numele subiecilor poate fi necesar doar dac ne propunem realizarea unor liste ale subiecilor din baza de date. Altfel, identificarea numeric a fiecrei nregistrri este suficient, scutind un mare volum de munc pe care l-ar implica introducerea numelor. Vom avea grij ns, ca pe documentul original s scriem codul numeric aferent fiecrui subiect, astfel nct, la nevoie, s se poat identifica numele (pentru corecii, de ex.) Variabile multiple pentru ntrebri cu rspuns multiplu: De obicei, o ntrebare prezint un singur rspuns, dar pot fi situaii n care o ntrebare prezint rspunsuri multiple care pot fi alese n acelai timp. De exemplu: Ce activiti preferai pentru timpul liber? 1. sport; 2. filme; 3. petreceri cu prieteni..., etc. ntr-un asemenea caz ne putem atepta s avem mai multe rspunsuri la aceeai ntrebare. Soluia pentru introducerea datelor este, de aceea, crearea mai multor variabile, cte una pentru fiecare variant de rspuns. Astfel, vom avea variabila SPORT care poate primi doua valori, sa zicem 1 dac este aleas i 0 dac nu este aleas, i aa mai departe. n acest mod vom putea analiza frecvena alegerilor pentru fiecare variant de rspuns n parte. Evitarea variabilelor redundante: Dac la un test nu sunt posibile, de exemplu, dect rspunsuri corecte sau greite, atunci nu este necesar s declarm o variabil pentru corecte i una pentru greite deoarece ele reflect exact acelai lucru (suma lor este ntotdeauna egal cu numrul itemilor testului respectiv.)

Salvarea bazei de date din DATA EDITOR O baz de date aflat n lucru nu are un corespondent ntr-un fiier dect dup ce se execut o salvare a acesteia. Acest lucru nu trebuie niciodat uitat. Spre deosebire de WORD de exemplu, SPSS nu are o funcie de salvare automat dup un interval de timp prestabilit. Cu alte cuvinte, indiferent ce modificri facem n DATA EDITOR pe ecran, datele respective vor fi salvate numai la comanda explicit a operatorului. Pentru o baz de date nou creat, salvarea se face n mod similar cu orice alt program cunoscut: File-Save as, care deschide urmtoarea caset de dialog: - Se alege locaia dd salvare (Save in) - Se d un nume fiierului (File name) - Se verific tipul de fiier (formatul implicit pentru baze de date SPSS are extensia .sav) - Se acioneaz Save

De precizat c SPSS poate salva i n alte formate, dintre cele mai importante fiind: Dbase sau FoxPro, Lotus 1-2-3, Excel. Salvarea n aceste formate poate fi util pentru transferul datelor pentru prelucrri ulterioare n alte programe. Deschiderea unei baze de date SPSS O baz de date creat cu SPSS se deschide cu comanda File-Open, care activeaz urmtoarea caset de dialog: - Se alege locaia de citire (Look in) - Se indic fiierul dorit (selectarea cu mouse-ul) n fereastra de cutare - Se indic tipul de fiier ce urmeaz a fi deschis (implicit este de tip SPSS cu extensia .sav) - Se acioneaz Open

De precizat c, n cazul deschiderii unui fiier de alt tip dect SPSS se va alege tipul respectiv din lista Files of type. n cazul n care SPSS nu recunoate tipul de fiier n care se afl datele noastre, putem ncerca transformarea lor prealabil din formatul original ntr-un format recunoscut de SPSS. Dei exist riscul pierderii unor aspecte ce in de formatul de reprezentare a datelor, operaiunea scutete totui un mare volum de munc.