document3_

10
Analiza datelor 1 ORGANIZAREA DATELOR PENTRU ANALIZĂ Pentru a răspunde cât mai bine cerinţelor, SPSS pune la dispoziţie proceduri pentru efectuarea multor operaţii de organizare a datelor astfel încât să poată fi realizate analize cât mai diverse şi complexe. Astfel, în cazul în care se doreşte efectuarea unor analize la nivelul unei părţi din cazurile înregistrate devine necesară ordonarea după anumite criterii a bazei de date sau împărţirea acesteia în subgrupuri. Dacă se doreşte extinderea analizei prin includerea altor variabile înregistrate în alte fişiere sau prin includerea altor cazuri înregistrate în alte fişiere, cu ajutorul SPSS sunt posibile aceste lucruri. Aceste proceduri sunt prezentate în continuare. Sortarea bazei de date Sortarea este operaţia de aranjare a bazei de date fie în funcţie de numele fiecărei variabile, fie în funcţie de ordinea crescătoare/descrescătoare a valorilor unei variabile. Cea mai utilă dintre cele două variante este sortarea cazurilor după a numite criterii. Acesta este utilă atunci când se face vizualizarea valorilor în vederea identificării valorilor excesive, când se doreşte identificarea unei anumite valori tipice vizual sau atunci când se doreşte listarea ordonată a bazei de date. Comanda utilizată este Sort cases din meniul Data. Acesta determină afişarea ferestrei Sort Cases: Din lista variabilelor incluse în baza de date se aleg variabila sau variabilele care vor constitui criteriile de ordonare şi se vor aduce în caseta Sort by folosind butonul . În imaginea de mai sus se realizează sortarea bazei de date, crescător (Ascending), după valorile variabilei Curent salary. În cazul sortării simultane după mai multe variabile, se poate stabili sensul operaţiei (ascendent sau descendent) separat pentru fiecare variabilă în parte. Trebuie reţinut că sortarea bazei de date nu are efecte asupra rezultatelor obţinute cu diversele proceduri de analiză statistică. În cazul sortării variabilelor se utilizează comanda Sort variables din meniul Data care va afişa fereastra:

Upload: sandoi-ionut

Post on 27-Sep-2015

2 views

Category:

Documents


0 download

DESCRIPTION

xxxxxxx

TRANSCRIPT

  • Analiza datelor

    1

    ORGANIZAREA DATELOR PENTRU ANALIZ

    Pentru a rspunde ct mai bine cerinelor, SPSS pune la dispoziie proceduri pentru

    efectuarea multor operaii de organizare a datelor astfel nct s poat fi realizate analize ct mai diverse i complexe. Astfel, n cazul n care se dorete efectuarea unor analize la nivelul unei pri din cazurile nregistrate devine necesar ordonarea dup anumite criterii a bazei de date sau mprirea acesteia n subgrupuri. Dac se dorete extinderea analizei prin includerea altor variabile nregistrate n alte fiiere sau prin includerea altor cazuri nregistrate n alte fiiere, cu ajutorul SPSS sunt posibile aceste lucruri.

    Aceste proceduri sunt prezentate n continuare. Sortarea bazei de date

    Sortarea este operaia de aranjare a bazei de date fie n funcie de numele fiecrei variabile, fie n funcie de ordinea cresctoare/descresctoare a valorilor unei variabile. Cea mai util dintre cele dou variante este sortarea cazurilor dup a numite criterii. Acesta este util atunci cnd se face vizualizarea valorilor n vederea identificrii valorilor excesive, cnd se dorete identificarea unei anumite valori tipice vizual sau atunci cnd se dorete listarea ordonat a bazei de date.

    Comanda utilizat este Sort cases din meniul Data. Acesta determin afiarea ferestrei Sort Cases:

    Din lista variabilelor incluse n baza de date se aleg variabila sau variabilele care vor

    constitui criteriile de ordonare i se vor aduce n caseta Sort by folosind butonul . n imaginea de mai sus se realizeaz sortarea bazei de date, cresctor (Ascending), dup

    valorile variabilei Curent salary. n cazul sortrii simultane dup mai multe variabile, se poate stabili sensul operaiei

    (ascendent sau descendent) separat pentru fiecare variabil n parte. Trebuie reinut c sortarea bazei de date nu are efecte asupra rezultatelor obinute cu

    diversele proceduri de analiz statistic. n cazul sortrii variabilelor se utilizeaz comanda Sort variables din meniul Data care va afia fereastra:

  • Analiza datelor

    2

    Variabilele pot fi sortate dup oricare dintre caracteristicile lor ascendent sau descendent. mprirea bazei de date n subgrupuri

    Baza de date SPSS poate fi mprit n subgrupuri, pentru analiza separat a fiecrui grup n parte. Atunci cnd datele sunt organizate pe subgrupuri, orice procedur de analiz efectuat se aplic automat separat pentru fiecare subgrup n parte, ca i cum ar fi mai multe baze de date analizate n paralel. Procedura este Data-Split File, apelarea sa permite deschiderea ferestrei de mai jos:

    Fereastra pune la dispoziie mai multe opiuni: 1. Analyze all cases, do not create groups permite analiza complet a datelor din baza de

    date curent, fr a crea grupuri. 2. Compare groups permite crearea de grupuri i afiarea rezultatelor prelucrrilor pe

    grupuri n aa fel nct s fie uor de comparat. 3. Organize output by groups permite crearea de grupuri iar rezultatele se afieaz separat

    pe grupuri. Dup apelarea procedurii Split File nu vei observa nici o modificare vizibil asupra bazei de date. Efectul procedurii va fi vizibil n fereastra SPSS Viewer a rezultatelor atunci cnd vor fi afiate rezultatele prelucrrilor ulterioare. Selectarea anumitor cazuri

    Selectarea doar a cazurilor care respect anumite criterii n vederea aplicrii procedurilor de prelucrare numai asupra acestora este o operaie care apare uzual n cazul unei cercetri. Fereastra care se deschide dup apelarea acestei comenzi este:

  • Analiza datelor

    3

    Prin activarea opiunii If condition is satisified i acionarea butonului If... se pot selecta

    doar cazurile care ndeplinesc anumite condiii. Dup apsarea butonului If... se deschide fereastra urmtoare:

    n imaginea de mai sus s-a dorit selectarea cazurilor pentru care variabila gender (sex)

    are valoarea m, adic selectarea cazurilor care se refer la brbai. Cazurile neselectate pot fi terse dup finalizarea procedurii de selectare prin bifarea

    opiunii Delete unselected cases din fereastra Select Cases. Se poate selecta un eantion aleator din toat baza de date dac se utilizeaz opiunea

    Random sample of cases caz n care se deschide o fereastr secundar care permite specificarea unui procent din totalul cazurilor sau unui numr exact de cazuri din toat baza de date.

  • Analiza datelor

    4

    Exist i alte variante de a selecta cazurile ce trebuiesc analizate. n fereastra Select

    Cases n zona Output se stabilete modul n care vor fi tratate cazurile selectate n sensul utilizrii lor n analiz sau copierii lor n alt baz de date.

    Odat activat opiunea de selectare a cazurilor se va observa marcarea cu o linie diagonal a cazurilor neselectate respectiv apariia n baza de date a unei variabile noi filter_$, variabil de sistem care va avea valoarea 1 pentru cazurile selectate i 0 pentru cazurile neselectate. Agregarea cazurilor multiple

    Putem avea situaii n care, n aceeai baz de date, s existe, din diverse motive, mai multe nregistrri care vizeaz subieci cu unele caracteristici identice.

    De exemplu, baza de date din imaginea alturat cuprinde mai multe informaii despre subieci care au acelai sex sau acelai mediu de provenien. Dac dorim s agregm informaiile coninute n baza de date pe medii sau sexe se poate apela aceast procedur. La finalul derulrii sale se vor obine doar attea nregistrri cte valori are variabila dup care se face agregarea n acelai fiier sau ntr-un fiier nou. Dac agregarea se va face dup variabila mediu vom obine dou nregistrri, una pentru valoarea 1 mediu urban i una pentru valoarea 2 mediu rural.

    Procedura de agregare se lanseaz din meniul Data-Aggregate, care deschide urmtoarea fereastr:

  • Analiza datelor

    5

    Se plaseaz n lista Break Variable(s) variabila dup care se face agregarea datelor. n lista Aggregate variable(s) se trec variabilele care urmeaz s fie agregate. Se observ c vor rezulta mai multe variabile (cte o variabil nou pentru fiecare variabil ce va fi agregat) denumite automat (de exemplu pentru Alte_venituri va fi creat variabila Alte_venituri_mean) care vor fi egale n cazul de fa cu media valorilor variabilelor iniiale (Alte_venituri_mean= MEAN(Alte_venituri)). Din acest motiv este uor de neles de ce sunt acceptate dect variabile numerice pentru aceast procedur.

    Dac agregarea va fi fcut nu prin determinarea mediei valorilor variabilelor iniiale, ci prin alte funcii, atunci se poate apela la butonul Functions care deschide fereastra de mai jos i n care se poate face alegere dintre mai multe variante de agregare.

    First value prima valoare Last value ultima valoare Number of cases numrul de nregistrri

  • Analiza datelor

    6

    Standard deviation abaterea standard Minimum value valoarea minim Maximum valoarea maxim Sum of values suma valorilor

    Opiunile din zona inferioar a casetei permit alegerea unor funcii de agregare bazate pe

    procentajul valorilor Oricum, nu se poate alege dect o singur funcie de agregare, celelalte putnd fi folosite doar

    pentru o agregare ulterioar. Dac se dorete redenumirea variabilelor rezultate n urma agregrii se poate aciona butonul

    Name&Label care deschide fereastra de mai jos, n care se pot face operaiile necesare.

    Tot n fereastra de agregare, n zona Save, se mai pot specifica variantele de pstrare a variabilelor

    rezultate, fie n acelai fiier (Add aggregate variabiles in the active dataset) cu variabilele iniiale fie ntr-un fiier nou (Create new dataset containing onlz the aggregated variables) pentru care trebuie specificat numele n caseta Dataset name. Rezultatul operaiei de agregare se poate observa n imaginea de mai jos.

    Concatenarea bazelor de date

    Operaia de concatenare a bazelor de date poate urmri: 1) adugarea unor variabile din alt baz de date 2) adugarea unor cazuri din alt baz de date Prima operaie se poate realiza folosind succesiunea de comenzi

    Data Merge files Add variables iar a doua prin Data Merge files Add cases Adugarea unor variabile din alt baz de date Folosirea comenzilor descrise mai sus va avea ca rezultat deschiderea urmtoarei ferestre

  • Analiza datelor

    7

    n aceasta se va selecta din care fiiere deschise vor fi adugate noile variabile n fiierul activ. n exemplul de fa se vor aduga variabile din fiierul Exemplu_1.sav n fiierul activ Test.sav .

    Se apas dup aceea Continue i se deschide alt fereastr

    n lista New Active Dataset vei observa coninutul fiierului activ Test.sav, dup

    adugarea variabilelor noi. n list variabilele adugate sunt cele care au dup nume (+), iar acela care au (*) sunt variabilele care existau n fierul activ nainte de concatenare.

    Dac o variabil cu acelai nume exist n ambele fiiere atunci ea nu va fi adugat automat, dar va fi trecut n lista Excluded variables unde poate fi utilizat pentru alte operaii de actualizare.

    Rezultatul operaiei arat astfel:

  • Analiza datelor

    8

    Adugarea unor cazuri din alt baz de date Adugarea de cazuri noi se face dup aceleai principii ca i adugarea de noi

    variabile. Dup succesiunea de comenzi menionat mai sus se deschide fereastra

    n care se selecteaz fiierul din care se face adugarea de noi cazuri la fiierul activ, apoi dup apsarea butonului Continue, prin fereastra urmtoare

  • Analiza datelor

    9

    se precizeaz modul n care se adaug noile cazuri. n lista din stnga Unpaired Variables sunt trecute automat variabilele din fiierul activ care nu au corespondent n fiierul din care se vor introduce cazurile noi. n lista Variables in New Active Dataset sunt trecute variabilele care au corespondent n fiierul din care se vor introduce noile cazuri.

    Restricii i condiii la adugarea cazurilor: Variabilele cu acelai nume trebuie s fie de acelai tip. Nu pot fi adugate valori de tip ir

    de caractere n continuarea unor valori de tip numeric, sau invers. Variabilele de tip ir de caractere trebuie s fie definite pe aceeai lungime. Dac nu sunt,

    se vor redefini. Inversarea liniilor cu coloanele

    n mod normal, ntr-o baz de date liniile reprezint cazuri iar coloanele reprezint variabile. Uneori se poate dovedi necesar ca acestea s fie inversate, astfel nct cazurile s se afle pe coloane ar variabilele pe linii. Unul dintre motive, l-ar putea constitui, de exemplu, posibilitatea de a aplica proceduri statistice la nivel intrasubiect, pe coloane, care nu disponibile la nivel intersubiect, pe variabile. S lum ca exemplu baza da date:

    Se lanseaz procedura Transpose... din meniul Data:

    Se deschide fereastra Traspose n care mutm variabilele n lista Variable(s), iar variabila n zona Name Variable.

  • Analiza datelor

    10

    Astfel, valorile variabilei ID_Chestionar vor da numele variabilelor din noul fiier rezultat prin transpunere, aa cum se vede n imagine: