suport curs curatare

Upload: mihaela-stanescu

Post on 29-Feb-2016

56 views

Category:

Documents


4 download

DESCRIPTION

Spss

TRANSCRIPT

  • SCURTA INTRODUCERE IN SPSS (Statistic Package Social Sciences)

    Programul se compune din trei module principale :

    editorul de date (.sav) - Afiseaza setul de date pe care urmarim sa facem prelucrari ; baza de date se prezinta ca un tabel bidimensional, avand pe linii cazurile sau inregistrarile (care in

    general reprezinta respondenti ai unui chestionar), iar pe coloane variabilele (respectiv

    intrebarile din chestionar si raspunsurile aferente)

    fisierul de sintaxa (.sps)- prin intermediul caruia pot fi efectuate prelucrari folosind instructiuni specifice SPSS-ului. Acest fisier este folosit pentru pastrarea comenzilor de sintaxa ale SPSS

    (daca sintaxa se face direct din meniu-ul SPSS-ului, acesta se va copia (Paste) in fisierul de

    sintaxe

    fisierul de output (.spo) - modulul in care sunt afisate toate rezultatele prelucrarilor sub forma de statistici, grafice, tabele si de asemenea diferitele mesaje de avertizare (warnings) venite din

    partea programului; Good to know: modul de prezentare al tabelelor se poate modifica cu

    ajutorul unor sabloane predefinite (table looks) care se pot apela din meniul Format/ Table

    Looks

    Comenzi si meniuri

    Transformarea datelor si prelucrarea statistica a acestora se pot realiza in doua moduri: prin intermediul

    comenzilor din meniuri si alternativ cu ajutorul comenzilor din sintaxa. Indiferent de metoda folosita, in

    fisierul de sintaxa va trebui sa existe sintaxa facuta manual, sau copiata din meniu.

    Prezentare meniuri

    SPSS are patru meniuri principale, care grupeaza comenzi inrudite; meniul Data contine comenzi care

    realizaeaza manipulari ale setului de date in ansamblu; meniul Transform grupeaza comenzi prin care

    se realizeaza crearea si transformarea variabilelor individuale; prelucrarile statistice se realizeaza prin

    intermediul meniului Statistics iar

    comenzile grafice se gasesc sub

    meniul Graphics

    Configurarea programului in submeniul Edit/ Options se gasesc principalele comenzi prin care programul poate fi configurat

  • 1. CREAREA FISIERULUI DE DATE

    Fisierul de date poate fi realizat prin introducerea directa a datelor prin editorul de date sau prin

    importul datelor din alte formate

    1.1 Preluarea datelor din alte formate

    Fisiere in format Excel SPSSul poate citi fisiere in format nativ Excel. Pentru a citi un fisier Excel acesta trebuie salvat in versiunea 4; apoi se deschide in mod obisnuit din SPSS

    Fisiere de date de alt tip (Acess, FoxPro, etc.) Pentru importul de astfel de fisiere se foloseste comanda Open Database New Query - si se alege programul din care importam datele.

    Nu se poate importa mai mult de o baza de data, la o singura accesare a meniului. Daca in Access

    avem mai multe tabele, fiecare se importa separat, urmand sa se faca concatenarea tabelelor

    rezultate in SPSS.

    Fisiere ASCII (Flat ASCII sau MultiCard ASCII=Quantum)

    1.2 Concatenare tabelelor (bazelor de date)

    Uneori este necesara concatenarea a doua sau mai multe baze de date ; in acest caz se pot intalni doua

    situatii :

    Adaugarea unor noi cazuri (inregistrari) (Ex: S-au mai introdus cateva chestionare care trebuie adaugate la Baza mare din SPSS ) trebuie verificat ca cele doua baze au aceeasi structura (aceleasi variabile) si ca au un acelasi cod unic de identificare (de obicei nr_chest) si

    care nu se repeta in cele 2 baze. Dupa concatenare se verifica numarul inregistrarilor (=suma

    inregistrari baze initiale).

    Comanda utilizata: Data Merge Files Add Cases In cazul in care una din baze are variabile in plus fata de cealalta, se poate opta fie ca acestea sa

    intre in comanda de merge, fie ca acestea sa se regaseasca si in baza finala, caz in care ele vor

    lua valoarea sysmis pentru inregistrarile din baza in care aceste variabile nu existau.

    Adaugarea unor variabile suplimentare (ex. Baza de selectiii si cu Baza (-ele) de chestionar principal) este necesar sa existe cel putin o variabila comuna (cheie unica de identificare de obicei aceasta este numarul chestionarului) care reprezinta elementul de legatura si care trebuie

    sa se regaseasca in ambele baze cu acelasi nume si cu aceleasi inregistrari; de asemenea bazele

    trebuie sortate in aceeasi ordine dupa cheia unica de identificare. Toate tabelele care urmeaza a

    fi concatenate trebuie sa aiba acelasi numar de inregistrari (si aceleasi inregistrari) . Verificarea

    operatiei se va face confruntand inregistrarile din baza cu chestionarul fizic; aceasta verificare

    se va face pentru 2-3 chestionare, in vederea eliminarii riscului de concatenare desincronizata.

    Comanda utilizata: Data Merge Files Add Cases Exista, de asemenea, optiunea de a selecta doar anumite variabile pe care vrem sa le concatenam

    la o baza de date.

    Se selecteaza

    variabilele de

    care nu avem

    nevoie in noua

    baza de date

    Aici se muta

    variabilele

    selectate

    Se bifeaza

    aici (pt

    stabilirea

    cheii de

    concatenar

    e)

    Din Excluded

    Variables se

    alege variabila

    care e cheia de

    concatenare si se

    muta aici

  • 2. RESPECTAREA PARAMETRILOR PROIECTULUI

    Imediat ce avem baza unita, se verifica daca numarul chestionarelor respecta esantionul clientului

    (Verificarea se face cu datele din Ariadna sau cu cele din fisa de esantionare). Totodata numarul

    inregistrarilor din bazatrebuie sa corespunda numarului de chestionare receptionate si validate de catre

    Coordonatorul de proiect (in caz contrar se poate ca unele chestionare sa nu fi fost date la introducere

    sau sa nu se fi luat toate bazele de pe severul de date).

    Se fac, de asemenea, verificari pe cote (daca acestea exista) sau pe principalele demografice (in vederea

    identificarii eventualelor probleme ex: exista prea putine inregistrari pe un anumit oras, nu sunt acoperite toate straturile conform carora s-a facut esantionarea, sunt prea multi utilizatori Orange si prea

    putini Connex in situatia in care se stie ca au cote aproximativ egale pe piata, etc) precum si alte

    variabile de interes (in functie de tipul studiului) . Acestea se pot stabili impreuna cu PD-ul sau PM-ul.

    Eliminarea/ stergerea din baza a chestionarelor invalidate in urma verificarilor telefonice/ pe

    teren

    Comanda utilizata este: USE ALL.

    SELECT IF (nr_chest35 or nr_chest135 ).

    EXECUTE .

    Comanda este preluata din meniu: Data Select Cases, iar dupa ce se scrie conditia (pentru inregistrarile care vor ramane in baza) se bifeaza Deleted (in loc de filtered cum se face pentru filtre)

    Daca au fost sterse chestionare din baza de date se mai verifica inca o data parametrii proiectului.

    FM si PM trebuie informati asupra chestionarelor scoase din baza si motivelor pentru care a fost luata

    aceasta decizie.

    Pentru orice neregula aparuta (numar prea mic de inregistrari, dezechilibrare cote, etc.) se anunta PM ul sau responsabilul de proiect (pt cele nonDaedalus), in vederea luarii unei decizii.

    3. ETICHETAREA

    Etichetele reprezinta asocierea variabilelor din baza cu un text explicativ care, la efectuarea unei analize

    pe variabila respectiva va fi afisat in output in locul numelui variabilei.

    Analog pot fi atribuite si etichete pentru valorile unei variabile; lungimea acestora nu poate depasi 60 de

    caractere (inclusiv spatii, virgule etc.), in aceasta situatie ele vor fi trunchiate. Pentru etichetele mai

    lungi de 60 de caractere se reformuleaza afirmatia (fara a-i schimba sensul sau a omite anumite chestii

    importante) astfel incat aceasta sa se incadreze in lungimea de 60 char.

    Etichetele usureaza citirea unui output in SPSS dar nu au nici o influenta asupra variabilelor.

    Etichetarea se face in limba engleza. Pentru etichetarea valorilor, input-ul este chestionarul tradus in

    limba engleza, etichetele fiind de fapt optiunile de raspuns la fiecare intrebare. Pentru etichetarea

    variabilelor input-ul este fisierul de specificatii de raport / etichetare (realizat de catre AD); Etichetarea

    variabilelor corespunde de fapt unui titlu care se da pentru fiecare intrebare. Pentru variabilele

    dihotomice, eticheta fiecarei variabile din cadrul intrebarii este de fapt identificata cu optiunile din

    chestionar; valorile pentru astfel de variabile (0 si 1) nu se eticheteaza. Etichetele pentru grupuri de

    variabile multiplu raspuns se vor prelua din specificatiile de raport.

    Pentru etichetarea variabilelor se foloseste sintaxa: var lab q05 Unaided Awareness.

    iar pentru etichetarea valorilor se foloseste sintaxa:

  • val lab q05

    1Prigat 2Cappy .

    .

    99DK/NA.

    Daca, o data definite etichetele pentru o variabila, mai descoperim noi valori (pe care nu le-am etichetat

    inainte) sau cream noi valori (ex. cele de DK/NA) pentru etichetarea acestora se foloseste sintaxa add

    val lab in loc de val lab. Daca am folosi val lab fara add in fata, in urma sintaxei se vor sterge toate

    etichetele definite inainte si vor ramane doar cele scrise ultimele.

    !! La etichetarea valorilor variabilelor de venit/ cheltuieli..., se trec doar sumele in Euro/ $ nu si cele in

    lei, iar moneda in care acestea se evalueaza se trece doar in eticheta variabilei (Personal Monthly Net

    Income (EURO)) nu si in etichetele de valori: val lab d01

    1 "Less than 75"

    2 "75 - 250 "

    3 "250 - 450 "

    4 " 450 - 650 "

    5 "650 - 850"

    6 "More than 850 "

    99 "DK/ NA".

    Iata o sintaxa de etichetare gresita, nu atat din punc de vedere al functionarii, cat al textului etichetelor: val lab d01

    1 "Less than 2,7 mil lei (75 EURO)"

    2 "2,7 - 9 mil lei (75 - 250 EURO)"

    3 "9 - 16,2 mil lei (250 - 450 EURO)"

    4 "16,2 - 23,4 mil lei (450 - 650 EURO)"

    5 "23,4 - 30,6 mil lei (650 - 850 EURO)"

    6 "More than 30,6 mil lei ( 850 EURO)"

    99 "DK/ NA".

    Pentru etichetarea demograficelor exista standarde predefinite astfel incat, indiferent de studiu,

    etichetarea acestora se face pe baza template-ului de demografice.

    Modul de scriere a etichetelor pentru variabile respectiv seturi (grupuri multiplu raspuns) urmeaza

    standardele folosite in scrierea titlurilor in limba engleza (inceputul fioecarui cuvant se scrie cu CAPS,

    mai putin prepozitiile) : Breakdown by Age; Consumption Frequency in the Past 12 Months. Etichetele

    pentru valori se scriu normal, cu litera mare doar la inceputul primului cuvant. La preluarea etichetelor

    din chestionar sau din specificatiile de etichetare/ raport si aducearea lor in Excel/ SPSS trebuie urmarit

    ca acestea sa nu inceapa cu spatii.(ex: 11 Less than 1000 . Daca exista asemenea spatii, acestea trebuie sterse. Dupa ghilimeaua care marcheaza inceputul etichetei nu trebuie sa fie spatii)

    Verificarile care se fac dupa etichetarae bazei de date sunt:

    - toate variabilele/ valorile variabilelor au fost etichetate conform standardelor - etichetele nu au fost trunchiate.

    Setari legate de afisare

    Afisarea etichetelor in listele de variabile cu Options/General; pentru afisarea in tabele Options/Output

    labeling; pentru afisarea etichetelor valorilor in editorul de date in meniul View se bifeaza optiunea

    Labels.

  • 4. CURATARE/ VALIDARE (General)

    4.1 Filtrarea datelor

    Filtrarea datelor reprezinta selectia temporara a unui subset de cazuri bazat pe anumite conditii criteriu;

    in aceasta situatie cazurile care nu indeplinesc conditia respectiva sunt ascunse; se pot realiza astfel analize numai pe subsetul respectiv, apoi sa se revina la setul complet .

    Structura unui filtru

    Variabila filtru Blocul DA Blocul NU

    Q 5. Intentionati sa incheiati o polita de asigurare de viata in viitor?

    1 Da Q 6. In ce orizont de timp? 1 mai putin de 6 luni 2 6 - 12 luni 3 1 - 2 ani 4 2 - 3 ani 5 peste 3 ani

    2 Nu Q 7. De ce? ............................................................................................................................. .....|____| ............................................................................................................................. ......................|____|

    .....................................................................................................................................................|____|

    blocul DA: q06 conditie DA: q05=1

    blocul NU: q07 conditie NU: q05=2

    Obs: Multe filtre nu au decat un singur bloc(cel de da)

    Verificarea filtrelor

    Se verifica situatiile in care filtrul a fost aplicat incorect, deci daca exista persoane care au raspuns la

    intrebarile dintr-unul din blocuri fara sa indeplineasca conditia de filtru. Prin urmare la intrebarile cu

    doua blocuri vom avea de verificat doua situatii posibile de nerespectare a filtrului. In exemplul de mai

    sus: Q051 si q06>0

    Q052 si q07>0

    Pentru a filtra datele, SPSS-ul calculeaza o noua variabila dihotomica, avand valoarea 1 pentru cazurile

    care indeplinesc conditia si 0 pentru celelalte, denumita automat filter$.Numele acesteia se poate modifica (putem sa ii dam noi un nume) daca filtrarea se face direct din sintaxa si nu din meniu.

    Comanda utilizata pentru filtrarea cu ajutorul meniului:

    Data Select Cases , se bifeaza If condition is satisfied si se scrie conditia:

    Se scrie conditia in

    functie de care

    cream filtrul

  • Sintaxa folosita pentru a scrie acest filtru de mana este:

    compute filtru=((q35=1 or q36=4) and s02f=4).

    exe.

    filter by filtru.

    Pentru a scoate un filtru de pe baza ( pentru a reveni la toate cazurile din baza), comanda utilizata este:

    use all sau filer off.

    Daca in conditia pe care o punem la crearea filtrului se au in vedere mai multe variabile intre care exista

    o anumita relatie se utilizeaza operatori logici (and, or etc.). Atunci cand utilizam astfel de operatori

    logici trebuie acordata mare atentie ordinii in care acestia apar si modului in care folosim parantezele

    pentru a determina prioritatile.

    Important: Comenzile de transformarea a datelor (de ex recode) nu tin cont de filtru si actioneaza pe

    toata baza de date. Filtrele sunt folosite doar pentru a scoate din baza anumiti respondenti (care nu

    indeplinesc o conditie) si a observa datele pe o baza mai mica.

    4.2 Recodificarea

    Codificare este operatia prin care i se asociaza fiecarui raspuns un numar ; in general mai multor

    raspunsuri asemanatoare li se asociaza acelasi cod .

    Recodificarea se refera la modificarea categoriilor de valori pe care le poate lua o anumita variabila.

    Aceasta operatie este realizata mai ales la restrangerea numarului de valori pe care le poate lua o

    variabila intr-un numar mic de categorii relevante care sa usureze analiza. (De exemplu daca

    transformam varsta care este o variabila continua intr-o variabila cu cateva categorii de varsta). De

    asemenea, recodificarea este utilizata la tratarea valorilor lipsa (recode (sysmis=99)).

    Recodificarea se poate face prin modificarea valorilor variabilei initiale sau prin crearea unei noi

    variabile cu codurile respective Transform Recode Into same variables sau Into Different variables Exemple si comentarii

    In general la restrangeri ( recodificari) este indicat sa se creeze o variabila noua, variabila veche

    ramanand cu valorile originale, pentru a putea fi folosita la o eventuala recodificare diferita ; numai in

    masura in care suntem siguri ca nu vom mai avea nevoie de valorile variabilei initiale se alege

    recodificarea pentru aceeasi variabila (de ex la curatare transformarea zerourilor in valori missing)

    valorile din variabila initiala care nu sunt specificate in ce se transforma li se atribuie automat

    valoarea missing

    Folosirea comenzii copy old value (else = copy) pentru valorile care raman neschimbate

    Pentru a aplica recodificari numai asupra unei selectii de cazuri se foloseste optiunea If sau do if,

    punerea unui filtru nu functioneaza in cazul recodificarilor: if q05=8 q06=4.

    exe.

    sau do if q05=8.

    recode q06 (6=4) (3=4).

    end if.

    exe.

    Se creaza variabila dihotomica de filtare , pe care am

    numit-o filtru ( ea poate avea orice alt nume)

    Se aplica filtrul asupra bazei de date

  • Iata o sintaxa gresita: Compute filtru=( q05=8).

    Exe.

    Filter by filtru.

    recode q06 (6=4) (3=4).

    Exe.

    Ex de sintaxa de recodificare pentru varsta(15 50 ani): recode d_age (17 throu lower =1) (18 throu 24=2) (25 thro 34 =3) (35 thro highest=4) intro d_agec.

    exe.

    O situatie aparte de recodificare este aceea in care respondentul poate da o valoare exprimata in orice unitate de masura (Unitatile de masura sunt variabile controlabile in chestionar fie predefinite, fie codificate ulterior) Ex: Q 1. Cat intentionati sa platiti pentru aceste pachete de servicii, incluzand TVA?

    .......................... 1 USD 2 EURO 3 ROL (lei vechi) 4 RON (lei noi)

    Pentru prelucrarea acestui tip de intrebare este necesar ca suma sa fie exprimata intr-o singura unitate de

    masura; astfel vom avea nevoie de o serie de recodificari.

    Presupunem 1USD=30.000lei si 1 Euro=36.000lei 1USD=0.83EURO Daca variabila de cheltuieli este q15 iar q15_moneda este variabila in care se trece moneda in care este

    exprimata suma., sintaxa este urmatoarea:

    Cream o noua variabila Q15r (suma finala trebuie exprimata in EURO): if q15_moneda=1 q15r=q15*0.83.

    if q15_moneda=2 q15r=q15.

    if q15_moneda=3 q15r=q15/36000.

    if q15_moneda=3 q15r=q15/3.6.

    exe.

    Astfel am obtinut o noua variabila in care toate sumele sunt exprimate in euro. Pentru aceasta, PD

    trebuie sa informeze SD asupra tipului de moneda in care se vrea variabila finala; tot astfel se trateaza si

    sumele cu/ fara TVA. Trebuie sa verificam cum a fost intrebarea in chestionar (daca e sau nu inclus

    TVA-ul) si sa ne informam cu se vrea prelucrata aceasta intrebare (cu/ fara TVA); si dupa caz, variabila

    se imparte sau se inmulteste cu 1,19.

    4.3 Tratarea valorilor missing/ Nonraspunsurilor

    Valorile missing sau sysmis sunt nonraspunsurile, sau apar codificate initial cu valorile 0 sau 1 dupa caz. Tratarea acestora se face in mod diferit in functie de tipul de varibila la care acestea apar:

    pentru variabilele categoriale cu un singur raspuns , daca avem valori sysmis, acestea se vor recodifica in DK/ NA ( se verifica mai intai daca aceasta categorie este predefinita in chestionar si i

    se da valoarea acestea; daca nu i se da 99). Ex 1:Q01 Care este principalul dumneavoastra operator de telefonie mobila?

    1. Connex 2. Orange 3. Zapp 9. Nu stiu

    Daca avem cazuri fara inregistrari (sysmis sau 0) pe aceasta intrebare, acestea se recodifica in 9: recode q01 (0 sysmis=9). Ex 2:Q01 Care este principalul dumneavoastra operator de telefonie mobila?

    1. Connex

    2. Orange

    3. Zapp

    Utilizarae unei astfel de sintaxe va avea ca effect recodificarae

    tuturor valorilor lui q06 din 6 si 3 in 4, fara a tine cont de filtru.

    Mare atentie: Nu folositi niciodata recodificari in cadrul filtrelor.

    Nu functioneaza!!!

  • Daca avem cazuri fara inregistrari (sysmis) pe aceasta intrebare, acestea se recodifica in 9 sau 99

    (teoretic putem alege orice valoare care nu e deja predefinita ca si optiune de raspuns la aceasta intrebare, dar e de preferat ca aceasta sa fie 9 daca valorile optiunilor sunt mai mici decat 9, sau 99

    daca avem mai mult de 9 optiuni predefinite. Ideal ar fi ca in toata baza de data DK/ NA ul sa aiba o aceeasi valoare.) si etichetam aceasta valoare cu DK/NA: recode q01 (sysmis=99).

    exe.

    add val lab q01

    999DK/ NA.

    Variabilele de medii sunt singurele in care sysmis-ul ramane sysmis nu se trateaza De ce? Pentru ca daca il facem 99 (DK/ NA) sau 0 aceste valori (care de fapt nu inseamna nimic si nu se

    incadreaza in scala de masurare a indicatorului) vor influenta media- o vor face fie mai mare (cazul

    cu 99) fie mai mica (0). De aceea, pentru variabilele pentru care se calculeaza medii, sysmis=ul

    ramane la fel. Ex1: Acum v-as ruga sa evaluati Calitatea serviciilor dintre operatorii Connex, Orange si Zapp. Dati o nota de la 1 la 10

    unde 1 inseamna foarte prost, iar 10 inseamna foarte bine.

    Aceasta intrebare nu poate fi prelucrata decat ca si medie, o insiruire a tuturor valorilor cu

    frecventele fiecareia nu ar aduce nici o valoare, astfel ca, chiar daca nu vom avea toata baza ( sunt

    responenti care nu au raspuns) sysmis-ul va ramane sysmis. Ex2: Acum v-as ruga sa evaluati Calitatea serviciilor dintre operatorii Connex, Orange si Zapp. Pentru fiecare dintre acestia, dati o nota de la 1 la 7 pentru fiecare dintre urmatoarele atribute, dupa cum urmeaza: 1 dezacord total; 2 dezacord; 3 dezacord partial; 4 nici acord nici dezacord; 5 acord partial; 6 acord; 7 acord total.

    Aceasta intrebare poate fi prelucrata atat ca si medie (caz in care se trateaza ca si in Ex1.) cat si ca

    frecvente simple, caz in care va trebui sa recodificam sysmis-ul in DK/ NA (pentru a avea toti

    respondentii in baza de calcul a frecventelor) . In variabila initiala se va face urmatoarea modificare: recode qx (sysmis=99).

    exe.

    add val lab qx 99DK/ NA.

    si se va mai realiza o variabila noua pentru medii: compute qx_m=qx.

    recode qxm (99=sysmis).

    exe.

    In ce priveste valorile de zero intalnite in cadrul unui bloc (filtru) trebuie facuta distinctia intre nonraspunsuri deci persoane care trebuiau sa raspunda la intrebari dar nu au facut-o si filtre persoanele care NU trebuiau sa raspunda la intrebare datorita conditiei anterioare de filtru.

    - daca respondentul nu trebuia sa raspunda la intrebare ( i s-a aplicat un filtru), sysmis ramane sysmis

    - daca in urma aplicarii filtrului exista respondenti care trebuiau sa raspunda dar nu au facut-o sysmis-ul se face DK/ NA.

    Pentru variabilele cu raspuns multiplu (dihotomice), care se vor constitui intr-un grup, sysmis inseamna ca suma tuturor variabilelor care au intrat in grup este 0. Adica nu s-a bifat nimic la nici

    una dintre optiuni. In acest caz se constituie o noua variabila ( care ia valoarea 1 atunci cand suma

    celorlalte este 0) si care se va eticheta cu DK/NA.

    EX: Q 67.1. Presupunand ca saptamana viitoare veti achizitiona un telefon mobil cu conectare, care sunt sursele de

    informare la care apelati?

    1 Sfaturile prietenilor/ cunostintelor 6 Pliante, brosuri primite pe strada, in locuri publice

    2 Reclama TV 7 Pliante, brosuri primite in magazin

    3 Pliante, brosuri primite prin posta 8 Reclama radio

    4 Informatii primite in magazin 9 Internet

    5 Reclama in presa scrisa 10 Altele (care?)...|____| If q67_01+q67_02+ q67_03+q67_04+ q67_05+q67_06+ q67_07+q67_08+ q67_09+q67_10=0 q67_99=1.

    Exe.

  • Var lab q67_99 DK/NA. * Multiple Response Sets.

    MRSETS

    /MCGROUP NAME=$Q67 LABEL='Surse de informare VARIABLES= q67_01 q67_02 q67_03 q67_04 q67_05 q67_06 q67_07 q67_08 q67_09 q67_10 q67_99=1

    /DISPLAY NAME=[$Q67].

    Ca sa intelegem mai usor, trebuie sa ne gandim ca numarul de respondenti este intotdeauna acelasi.

    Daca la o intrebare avem mai putini respondenti inseamna fie ca acea intrebare e filtrata ( si atunci nr.

    Respondenti= nr. Respondenti care indeplinesc conditia din filtru), fie ca nu au raspuns toti si in acest

    caz sysmis=DK/NA.

    Cand se face o curatare, intotdeauna trebuie verificate bazele ( count-urile din linia de total) pentru a

    nu pierde vreun respondent.

    Uneori, in cazurile in care avem valori lipsa acestea se pot inlocui cu anumite extrapolari realizate pe

    baza celorlalte valori din set; formula folosita poate implica media celorlalte variabile valide, media sau

    mediana punctelor alaturate. Aceasta se aplica insa doar in anumite situatii cand, spre exemplu, exista

    unul-2 respondenti care nu au raspuns la o intrebare si nu vrem sa cream o noua categorie (de DK/ NA)

    doar pentru acestia. Pentru astfel de situatii, decizia se ia impreuna cu PD-ul.

    4.4 Lucrul cu variabilele cu raspuns multiplu

    Pentru codificarea acestor variabile se folosesc mai multe variabile pentru o intrebare. Pentru obtinerea

    frecventelor pentru fiecare categorie, se construiesc seturi de variabile. Variabilele cu raspuns multiplu

    pot fi de doua feluri, in functie de numarul de alternative de raspuns posibile :

    1. Variabile multiplu-dihotomice Se refera la situatiile cand teoretic subiectul poate alege oricate raspunsuri din numarul total de

    raspunsuri posibile; in acest caz vom avea un set de variabile egal cu numarul de raspunsuri posibile,

    fiecare variabila putand lua numai valoarea zero (daca nu a fost bifata optiunea) sau unu (atunci cand

    respondentul a ales acea optiune).

    Variabila dummy Datorita faptului ca la stabilirea bazei de raportare programul ia in calcul numai cazurile cu cel putin un raspuns valid, se creaza o variabila noua care ii ia in calcul pe cei care nu au

    bifat nimic si se adauga la setul initial. Ex :Q01 Ce furnizori de telefonie mobila utilizati?

    1. Connex 2. Orange 3. Zapp

    Sintaxe pentru compunerea variabilei dummy: if sum(q01_01, q01_02,q01_03)=0 q01_09=1.

    sau if q01_01+ q01_02+q01_03=0 q01_09=1.

    exe.

    var lab q01_09 DK/ NA.

    Realizarea grupului: * Multiple Response Sets.

    MRSETS

    /MCGROUP NAME=$Q01 LABEL='Mobile Phone Providers Used VARIABLES= q01_01 q01_02 q01_03 q01_99=1

    /DISPLAY NAME=[$Q01].

  • 2. Variabile multiplu-categoriale Se obtine atunci cand la o anumita intrebare subiectul poate alege mai multe variante de raspuns insa

    numarul de alegeri este mai mic decat numarul total al alternativelor de raspuns; de exemplu dintr-un

    numar total de 10 optiuni respondentul poate alege maxim 3 (In acest caz vom avea un set de 3

    variabile, fiecare variabila putand lua diferite valori). Ex 1 : Q 2. Care au fost principalele 3 surse de informare de unde ati aflat de oferta Romtelecom ADSL/ClickNet Express ?

    [BIFATI MAXIM 3 OPTIUNI]

    1 TV 2 Radio 3 Presa (ziare, reviste etc.)

    4 Internet 5 Brosuri, fluturasi 6 Notificari aduse prin factura

    7 Prieteni, cunostinte, rude etc. 8 Alte surse. 9 Dk na

    Vom avea 3 variabile q01_01, q01_02, q01_03 fiecare putand lua valori intre 1 si 8. Prima verificare

    care se face este ca o optiune sa nu se repete in cele 3 variabile. do if q01_01=q01_02.

    recode q01_02 (else = sysmis).

    end if.

    exe.

    Teoretic aceasta verificare nu trebuie facuta, intrucat SPSS-ul numara o singura data fiecare raspuns al

    respondentului (indiferent daca acesta apare de mai multe ori); dar desi aceasta nu ne afecteaza

    prelucrarile, trebuie totusi sa verificam ca fiecare respondent sa dea raspunsuri unice (sa nu fie

    duplicate)pentru ca bazade data ajunge la client si trebuie sa fie intr-adevar curata. Inainte de constituirea grupului se creaza variabila dummy:

    If q01_01=0 and q01_02=0 and q01_03=0 q01_01=99.

    Exe.

    Recode q01_02 q01_03 (0=sysmis).

    Se constituie grupul: * Multiple Response Sets.

    MRSETS

    /MCGROUP NAME=$q01q LABEL='Surse de informare' VARIABLES=q01_01 q01_02 q01_03

    /DISPLAY NAME=[$q01q].

    Dupa constituirea grupului, se scoate o frecventa pe grup (custom tables) pentru a verifica ca in q01 au intrat toti respondentii * Custom Tables.

    CTABLES

    /VLABELS VARIABLES=$q01q DISPLAY=DEFAULT

    /TABLE $q01q [COUNT F40.0]

    /CATEGORIES VARIABLES=$q01q ORDER=A KEY=VALUE EMPTY=EXCLUDE TOTAL=YES

    POSITION=AFTER.

    Variabile multiplu-categoriale sunt considerate si intrebarile deschise pentru care respondentul nu are

    nici o lista de optiuni, raspunsurile sale fiind libere (deschise). Acestea se trateaza ca si in exemplul de mai sus.

    Problema cel mai des aparuta (cu care ne confruntam cu totii la inceput) este atunci cand lucram cu

    variabile dihotomice (care se constituie ulterior intr-un grup) si nu stim ce sa facem cu optinile de genul:

    Nu stiu, Nici una/ Nimic. Logic, cei care au cel putin o bifa la oricare dintre optiuni nu pot avea ca si

    raspuns nici una din optiunile Nu stiu, Nici una/ Nimic. Atunci cand facem validarea intrebarilor de

    acest gen, optiunile Nu stiu,respectiv, Nici una/ Nimic sunt tratate ca si raspunsuri individuale, distincte de calupul celorlalte optiuni.

    Ex: Q 3. Care au sursele de informare de unde ati aflat de oferta Romtelecom ADSL/ClickNet Express ?

  • 1 TV 2 Radio 3 Presa (ziare, reviste etc.)

    4 Internet 5 Brosuri, fluturasi 6 Notificari aduse prin factura

    7 Prieteni, cunostinte, rude etc. 8 Alte surse.Care? .....

    98 Nici una dintre acestea. 99 Nu stiu

    Verificarile care trebuie facute in aceasta situatii sunt:

    Respondentii care au cel putin o bifa (1 > 8 ) nu trebuie sa aiba bifata si optiunea 98 Nici una. if any(1, q01_01, q01_02,q01_03, q01_04, q01_05,q01_06,q01_07,q01_08) q01_98=0.

    exe.

    Sintaxa se poate scrie si cu sum: if sum( q01_01, q01_02,q01_03, q01_04, q01_05,q01_06,q01_07,q01_08)>=1 q01_98=0.

    exe.

    Respondentii care au cel putin o bifa nu trebuie sa aiba bifata si optiunea 99 Nu stiu. if any(1, q01_01, q01_02,q01_03, q01_04, q01_05,q01_06,q01_07,q01_08,q01_98) q01_99=0.

    exe.

    Sintaxa se poate scrie si cu sum: if sum( q01_01, q01_02,q01_03, q01_04, q01_05,q01_06,q01_07,q01_08)>=1 or q01_98=1 q01_99=0.

    exe.

    Toti respondentii au raspuns la aceasta intrebare: if sum( q01_01, q01_02,q01_03, q01_04, q01_05,q01_06,q01_07,q01_08, q01_98)=0 q01_99=1. exe.

    Abia dupa ce au fost facute toate aceste verificari, se constituie grupul pe care se da o frecventa pentru a

    verifica ca avem toata baza. Grupul se va eticheta intotdeauna conform specificatiilor de raport si

    folosind litera mare la inceputul fiecarui cuvant.

    4.5 Sumele

    Intrebarile cu suma fixa sunt intrebari in care respondentului i se cere sa distribuie o suma (fixa) intre

    mai multe optiuni (ex: structura cheltuielilor din gospodarie). In cazul unor astfel de variabile

    verificarea principala care se face este ca suma sa fie n (valoarea din chestionar ) pentru fiecare

    respondent. In aceste situatii, intotdeauna 0 are valoare, deci valorile default ale acestor variabile vor fi

    -1 (in faza de introducere Access) Ex: Q 1. Din 10 dati cand cumparati bauturi racoritoare necarbonatate, de cate ori le luati la ? 1. Sticle de 2 sau 2,5 l ______

    2. Sticle de 1 sau 1,5 l ______

    3. Sticle de 500 ml ______

    4. Sticle de 250-330 ml ______

    5. Cutii de carton ______

    TOTAL 10 [VERIFICATI SUMA]

    Prima verificare care se face este ca fiecare variabila sa aiba doar valori in intervalul [0, 10]. Aceasta se

    poate face

    fie dand o frecventa pe fiecare dintre acestea, ceea ce este cam incomod (mai ales daca avem mai multe variabile) intrucat trebuie sa urmarim un sir lung de tabele (in Output), fiecare cu multe valori

    fie prin afisarea valorilor maxima si minima pentru fiecare variabila in parte utilizand comanda Analyze Descriptive Statistics Descriptives din meniul SPSS-ului. Se aleg variabile pentru care vrem sa calculam un min si un max, se apasa butonul de options, dupa care

    se deschide o noua fereastra in care bifam ce vrem sa ne calculeze.:

  • Output-ul obtinut va avea urmatoarea forma: Descriptive Statistics

    N Minimum Maximum Mean Std. Deviation

    q01_01 Aloha 21 1.00 10.00 8.777000 0.78590

    q01_02 Bravo 6 0.00 9.00 3.4560 1.35200

    q01_03 Carotella 8 1.00 8.00 1.0000 .00000

    q01_04 Cappy (unsepecified) 182 1.00 10.00 1.0000 .00000

    Valid N (listwise) 0

    Sintaxa scrisa direct in editor este: DESCRIPTIVES

    VARIABLES=q01_01 q01_02 q01_03 q01_04

    /STATISTICS=MEAN STDDEV MIN MAX .

    Daca gasim valori care nu apartin intervalului, se verifica chestionarul fizic si se corecteaza cu valoarea

    reala; daca si in chestionar este gresit, toate variabilele (de la intrebarea gresita) pentru respondentul

    respectiv se vor face sysmis. Odata reparata aceasta eroare se compune o noua variabila egala cu suma variabilelor de la intrebarea respectiva: Compute q01_sum = q01_01+ q01_02+ q01_03+ q01_04.

    Exe.

    Fre q01_sum.

    Daca aceasta suma este diferita de 10 inseamna ca undeva avem o greseala ; se verifica chestionarele cu

    probleme si se corecteaza si aceasta eroare. Daca era greseala in chestionar nu se modifica valorile

    astfel incat suma sa dea 10 ci se fac toate sysmis. If q01_sum10.

    Recode q01_01 q01_02 q01_03 q01_04 (else=sysmis).

    End if.

    Exe.

    Se ruleaza din nou sintaxa de compunere a variabilei de suma si se verifica inca o data suma.

  • Pentru o verificare suplimentara, se face media pentru fiecare din cele 4 variabile (care intra in calcului

    sumei), se exporta tabelul in Excel si acolo se calculeaza suma mediilor. Aceasta trebuie sa fie = 10:

    altfel inseamna ca mai avem inca probleme in baza. (se reiau pasii de mai sus pentru identificarea

    erorii).

    Sintaxa pentru medii: mean q01_01 q01_02 q01_03 q01_04.

    sau * Custom Tables.

    CTABLES

    /VLABELS VARIABLES=q01_07 q01_08 q01_09 q01_10 q01_11 DISPLAY=DEFAULT

    /TABLE q01_07 [MEAN] + q01_08 [MEAN] + q01_09 [MEAN] + q01_10 [MEAN] + q01_11 [MEAN]

    /SLABELS POSITION=ROW.

    Pentru orice variabila pentru care se calculeaza medii (pentru care media are sens: note, sume, evaluari... ) o cheie de verificare este urmarirea indicatorului Standard Deviation (= Media abaterilor de la medie). Abaterea trebuie sa fie mai mica decat media cu aprox 40% (max) altfel inseamna ca undeva exista o problema (ex: avem valori prea mari..)

    Intrebari cu suma variabila

    Ex: Cheltuielile lunare in gospodarie repartizate pe cateva tipuri de cheltuieli, din care noi trebuie sa calculam o suma totala. Aceasta se face foarte simplu, insumand valorilor tuturor variabilelor care o

    compun ( ase verifica inainte ca toate au o valoare - nu sunt sysmis; altfel, variabila de suma nu va fi

    creata corect).

    4.7. Tratarea valorilor extreme

    Valorile extreme sunt valori foarte mari raportat la majoritatea valorilor din esantion; pot aparea numai

    la variabile de tip raport; La acest tip de variabile inainte de calculul mediei trebuie eliminate valorile

    extreme care deformeaza media.

    Exista doua tipuri distincte de valori extreme:

    valori aberante - care sunt teoretic imposibile sau sfideaza limitele bunului simt si care se datoreaza probabil unor erori aparute la introducerea datelor

    Ex: De cate ori calatoriti in strainitate pe an ? - avem 1 persoana cu 365. In acest caz la

    calcularea mediei aceasta nu se ia in considerare (se face sysmis).

    valori neobisnuite dar posibile, care caracterizeaza unele cazuri atipice Ex: De cate ori calatoriti in strainitate pe an ? Majoritatea valorilor sunt pana in 50 si avem 1

    persoana cu 100. In acest caz la calcularea mediei aceasta nu se ia in considerare (se face sysmis).

    Cum identificam aceste valori (outliars):

    - bun simt; - comparatie cu celelalte valori; - pastrarea comparabilitatii cu celelalte studii (daca a vem o baza de comparatii: studii repetitive,

    alte studii cu aceeasi structura a esantionului in care existatu astfel de intrebari);

    - identificare cu ajutorul SPSS: din boxplot sau cu explore (neajunsuri). Meniu SPSS: Analyze Descriptives Explore

  • Cum arata oputput-ul rezultat in SPSS?:

    Pe langa tot felul de alte tabelase si grafice ce ne intereseaza este:

    Cod Stem-and-Leaf Plot

    Frequency Stem & Leaf

    20.00 0 . 11111222223333333444

    32.00 0 . 55566666667777777888888888999999

    27.00 1 . 000000000001111222333344444

    26.00 1 . 55556666666677777888889999

    20.00 2 . 00001111112233344444

    21.00 2 . 556667777788888899999

    10.00 3 . 0002233344

    13.00 3 . 5556666678899

    15.00 4 . 000111111233344

    12.00 4 . 555666677889

    9.00 5 . 012223334

    4.00 5 . 6899

    4.00 6 . 1134

    2.00 6 . 57

    2.00 7 . 23

    4.00 7 . 5788

    3.00 8 . 224

    4.00 8 . 5569

    6.00 9 . 112444

    2.00 9 . 55

    18.00 Extremes (>=102)

    Stem width: 10.00

    Each leaf: 1 case(s)

    Nu intodeauna aceste valori sunt cele mai mari; mai putem sa ne uitam si pe frecvente inainte de a

    decide ce valori eliminam. Ar fi bine sa se discute cu PD-ul despre acestea.

    Cum se trateaza?: in functie de situatie se transforma in missinguri; sau se inlocuiesc cu media sirului;

    sau cu cea mai mare (sau mica) valoare permisa

    Valorile mai mari ca 102 sunt cele

    pe care SPSS-ul le considera out of

    range

  • 5. INTREBARILE DEMOGRAFICE

    Orice baza de data trebuie sa aiba toate variabilele demografice completate.

    Nu se accepta baze cu missing-uri sau DK/ NA pe demografice (exceptie fac intrebarile referitoare la

    venit dar daca venitul este variabila de cote, nici aici nu se accepta non-raspunsuri).

    Curatare si validare demografice (vezi template sintaxa).

    Pentru a verifica ca toate varibilele de demografice sunt completate, iar valorile nu sunt in afara

    intervalelor prestabilite (in chestionar) dam cate o frecventa pe fiecare dintre ele.

    Validari pe demografice - Overall Rules:

    Varsta reala vs. Varsta categoriala varsta intreaga (reala) trebuie sa fie corespunzatoare categoriei (daca exista ambele variabile)

    Varsta vs. Educatia (Ultimul nivel de educatie absolvit) Daca educatia e 10 clase sau scoala profesionala varsta >= 16 ani Daca educatia e liceu varsta >= 17 ani Daca educatia e postliceala/ facultate/ studii postuniversitare varsta >= 20 ani

    Verificarea diferitelor nivele de ocupatie La d_ocuwork vor raspunde doar cei cu d_ocu=2 sau 3 La d_ocunotwork vor raspunde doar cei cu d_ocu=3 sau 4

    Educatia vs. Ocupatia (d_ocuwork cei care au un loc de munca) Standardele Daedalus, impun realizarea urmatoarele validari intre educatia respondentului si

    ocupatia (pentru cei care lucreaza; in aceste rules nu se includ somerii, casnicele, elevii, pensionarii

    pentru care nu se face validarea cu ultimul nivel de educatie absolvit):

    Daca educatia e 8 -10 clase (primele dou nivele de educatie) ocupatia nu poate fi la un nivel mai mare decat muncitor

    Daca educatia e liceu/ postliceala ocupatia ocupatia nu poate fi la un nivel mai mare decat angajat cu studii medii

    Manager/ director pot fi doar persoanele cu studii universitare. Daca respondent avand un alt nivel de educatie se declara manager se va muta bifa la intreprinzator/patron

    D_ocu D_ocuwork

    OCUPATIA EDUCATIA

    1. Intreprinzator/

    patron/ Liber

    profesionist (am

    propria mea afacere)

    1. Manager/ director (top sau

    middle

    management)

    2. Profesionist,

    angajat cu studii

    superioare (fara

    functie de conducere)

    3. Angajat cu studii

    medii/ functionar 4.Muncitor

    8 clase sau mai putin OK - - - OK

    10 clase/ profesionala OK - - - OK

    Liceu OK - - OK OK

    Postliceala OK - - OK OK

    Colegiu/ Facultate OK OK OK OK OK

    Post-universitara OK OK OK OK OK

  • Sex vs Ocupatie (barbatii nu pot fi casnici- se transfera bifa la somer/fara loc de munca)

    Varsta vs Ocupatie angajatii trebuie sa aiba min 15 ani

    Venitul Net Lunar Personal vs. Ocupatia Daca respondentul lucreaza (ocupatia=1,2,3,4,5) si declara ca nu are venit, se muta

    bifa la DK/ NA (la venit)

    Daca respondentul nu lucreaza (casnica sau elev) si declara ca are un venit foarte mare (peste 3 400 euro) se se muta bifa la DK/ NA (la venit) - optional

    Venitul Net Lunar Personal vs. Venitul Net Lunar Total in Gospodarie vs. Venitul pe Membru de Familie

    Daca in gospodarie exista un singur membru Venitul Net Lunar Personal nu poate fi 0 (daca e asa, se face DK/ NA)

    Daca in gospodarie exista un singur membru, cele trei variabile de venit trebuie sa fie identice

    Daca gospodaria e compusa din cel putin doi membrii Venitul Net Lunar Total in Gospodarie trebuie sa fie mai mare decat Venitul Net Lunar Personal.

    Numarul de Membrii in Gospadarie vs. Numarul de copii Numarul de copii trebuie sa fie mai mic decat numarul total de membrii in gospodarie.

    Starea civila vs. Varsta se fac crossuri intre cele doua variabile si se curata dupa bunul simt (Respondentul nu poate fi casatorit/divortat/vaduv daca are sub 16 ani femei, 18 ani barbati)

    Numarul de Membrii in Gospadarie vs. Varsta Este putin probabil ca persona sub 18 sa locuiasca singure.

    Toate aceste verificari/ corelatii (enumerate mai sus) se fac pe variabilele initiale (d_edu_ini....._ si nu

    pe cele recodificate care presupun si o restrangere a categoriilor in prealabil.

    Abia dupa toate aceste verificari (cross-uri intre ele) si curatari se face restrangerea in variabilele

    demografice standard

    Structura gospodariei D_MEM. Cati membri sunt in gospodaria dumneavoastra, inclusiv dumneavoastra? _______

    D_MEMCATEG. Din ce membri este formata gospodaria dumneavoastra? [BIFATI TOT CE SE APLICA IN COLOANA

    D_MEMCATEG]

    D_MEMROL. Care este rolul dumneavoastra in gospodarie? [BIFATI O SINGURA OPTIUNE PE COLOANA

    D_MEMROL]

    D_MEMNUM. Cate persoane din fiecare din urmatoarele categorii sunt la dvs. in gospodarie? [CITITI CATEGORIILE

    BIFATE LA D_MEM] [NOTATI IN COLOANA D_MEMNUM]

  • Membrii in gospodarie D_MEMCATEG

    Membri gospodariei

    D_MEMROL

    Rolul respondentului

    D_MEMNUM

    Numar de persoane

    1. Sot/ partener 1 1

    2. Sotie/ partenera 2 2

    3. Copii peste 18 ani 3 3 _______

    4. Copii intre 12 18 ani 4 4 _______

    5. Copii intre 7 12 ani 5 5 _______

    6. Copii sub 7 ani 6 6 _______

    7. Parinti (bunic, bunica) 7 7 _______

    8. Alte persoane 8 8 _______

    Pentru d_memcateg vom avea 8 variabile dihotomice din care se va constitui un grup numit

    d_memcateg. Se verifica numarul total de membrii (d_mem) cu numarul bifeleror de la d_memcateg

    (d_mem nu poate fi mai mic decat numarul bifeleror de la d_memcateg).

    D_memrol trebuie sa se regaseasca in bifele de la d_memcateg.

    La d_memnum vom avea 6 variabile (numerotarea incepe de la 3) care trebuie validate cu d_memcateg

    (dupa ce sa scoate un tabel cu grupul d_memcateg) se verifica ca numarul respondentilor de la fiecare

    d_memnum_0x... sa fie egal cu cel de la d_memcateg (Ex: Daca avem 5 respondenti care au in

    gospodarie COPII SUB 7 ANI tot 5 persona etrebuie sa ne raspunda si la intrebare Cati copii sub 7 ani aveti????) Daca acestea nu se valideaza, se verifica chestionarul si se ia o deciizie (ex: daca un respondent a spus ca are 2 copii sub 7 ani dar nu a bifat ca ar avea copii sub 7 ani, se pune bifa la

    d_memcateg_06 dar nu inainte de a verifica, ca pentru toate celelalte bife de la d_memcateg a si raspuns

    la d_memnum)

    Pentru d_memnum se va calcula o suma care trebuie sa fie egala cu d_mem:

    compute d_memnum_sum=d_memnum_03+ d_memnum_04+ d_memnum_05+ d_memnum_06+

    d_memnum_07+ d_memnum_08.

    In functie de esantion (populatia tinta) s verifica ca d_memrol sa se incadreze in acel esantion (daca

    target-ul nostru sunt personae de peste 18 ani, d_memrol4,5,6.

  • 6. CORELATII LOGICE INTRE VARIABILE

    Orice chestionar/ baza de date trebuie vazuta ca un tot unitar si nu ca un sir de intrebari/ variabile intre

    care nu exista nici o legatura. Spre exemplu, exista situatii cand o intrebare de la inceputul

    chestionarului se valideaza cu o intrebare (sau o sectiune de intrebari) de la sfarsitul chestionarului (sau

    care nu urmeaza imediat prima intrebare):

    Q 3. Mai departe voi enumera o lista cu bunuri de folosinta indelungata. Va rog sa ne spuneti daca aveti in

    gospodaria dvs. cel putin una dintre urmatoarele: [BIFATI TOT CE SE APLICA]

    1 combina muzicala 2 telefon mobil 3 autoturism

    4 PC (computer personal) 5 masina de spalat 6 frigider

    . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

    . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

    Q 98. Ati utilizat Internetul in ultima luna?

    1 Da Q98.1. Cu ce frecventa ati utilizat Internetul in ultima luna? 1 zilnic 2 de 4 -5 ori pe saptamana 3 de 2-3 ori pe saptamana 4 o data pe saptamana 5 de 2-3 ori pe luna 6 o data pe luna

    Q98.2 De unde obisnuiti sa accesati Internetul?

    1 De acasa 2 De la scoala/ serviciu 3 De la un prieten/ cunostinta/ ruda 4 De la Internet cafe 5 De altundeva (unde) ................................................................|____| 2 Nu

    In acest caz, trebuie verificat ca cei care au raspuns ca acceseaza internetul de acasa (Q98_2_01=1) sa

    aiba calculator acasa (Q3=4). Aceasta verificare se face facand un cross intre cele doua variabile, sau

    punand un filtru pe Q98_2_01=1si pe urma o frecventa pe q03. Daca apar neconcordante se verifica

    chestionarul si se recodifica variabila cu valoarea corespunzatoare.

    Intrucat pot sa apara astfel de erori (198 respondenti au calculator acasa; 203 respondenti acceseaza

    internetul de acasa) chestionarul trebuie citit cu foarte mare atentia pentru a nu trece cu vederea anumite

    validari/ corelatii care pot duce la greseli in prelucrare/ raportare.

    Pentru studiile Daedalus, verificarea acestor corelatii trebuie trecuta in specificatiile de curatare de catre

    PD. Pentru studiile contractate direct de catre Eurodata sau care nu necesita prelucrare, SD trebuie sa

    identifice singur existenta unor astfel de intrebari si sa valideze datele intre ele . Pentru aceasta este

    necesara citirea cu foarte mare atentie a chestionarului astfel incat sa se identifice toate corelatiile/

    validarile posibile.

    Corelatiile mai simple, de genul Q98 q98.1/2 (acestea nu se vor trece in specificatiile de curatare), se verifica cu un cros sau filtru simplu. Daca numarul de respondenti de la Q98.1 este mai mare decat

    cei care au spus Da (1) la q98, modificarea care se face in baza de date este q98=1. Deci nu aplicam sintaxa if q98=2 recode q981 (elese=sysmis) intrucat e mai probabil ca aceasta eroare sa apara datorita

    neatentiei la introducere decat in faza de aplicare a chestionarului. Sintaxa utilizata este: cross q98_1 by q98. se verifica tabelul rezulatat si se identifica problemele if sum (q98_1_01, q98_1_02, q98_1_03, q98_1_04, q98_1_05, q98_1_06)>0 q98=1. se bifeaza Da la q98 exe.

    O alta corelaie care se poate face pe aceasta intrebare este verificarea faptului ca, cei care au spus ca

    acceseaza internetul de la scoala/ serviciu chiar au un serviciu sau sunt elevi/ studenti. Pentru aceasta, se

    face un cros intre variabila q98_2 si ocupatie.

    De asemenea, de multe ori in chestionarul de selectie apar unele intrebari care se repeta si in

    chestionarul principal fie in aceeasi forma , fie sub forme diferite . Evident, raspunsurile la aceste

    intrebari trebuie sa fie identice; iar aceasta verificare trebuie facuta intotdeauna.

  • 6.1 Curatarea ATUP

    ATUP = Awareness Trial Usage Preference Intrebari specifice ATUP: Q1. Ce marci de bauturi racoritoare necarbonatate (suc, nectar, suc natural 100%) va vin acum in minte? Ce alte marci de

    bauturi racoritoare necarbonatate (suc, nectar, suc natural 100%) mai cunoasteti? Alte marci mai cunoasteti?

    Si aici avem 2 variabile: Q1 AF: Prima optiune = Top of Mind (UNAIDED AWARENESS)

    Q1 A: Celelalte optiuni (inclusiv cea de la TOM) = Unaided Awareness

    Sau pot fi doua intrebari: Creeste prima... care va vine in minte? [BIFATI O SINGURA OPTIUNE]si Ce alte.... mai cunoasteti? [BIFATI TOT CE SE APLICA]

    Q2A. Va rog sa va uitati la acest cartonas si sa imi spuneti de care dintre aceste marci ati auzit, indiferent daca le-ati

    mentionat si la intrebarea anterioara sau nu? [BIFATI TOT CE SE APLICA] = Aided Awareness

    Q2B. Dar despre care dintre aceste marci ati auzit multe lucruri in ultima vreme? [BIFATI TOT CE SE APLICA]

    Heard a Lot About

    Q2C. Ce marci de bauturi racoritoare necarbonatate (suc, nectar, suc natural 100%) ati consumat vreodata? Mai sunt si

    altele ? [BIFATI TOT CE SE APLICA] = Ever Used/ Tried

    Q2D. Dintre marcile pe care ati spus ca le-ati consumat cel putin o data, pe care le consumati si in prezent, in mod regulat ?

    [BIFATI TOT CE SE APLICA] = Used Regularly

    Q2E. Dar pe care le consumati ocazional? [BIFATI TOT CE SE APLICA] = Used Occasionally

    Q2F. Pe care dintre aceste marci o consumati cel mai des? [BIFATI O SINGURA OPTIUNE] = Used Most Often

    Q2G. Pe care dintre aceste marci ati consumat-o in ultimele 12 luni, cel putin o data? [BIFATI TOT CE SE APLICA] Used Past 12 Months (Sau Past Year)

    Q2H. Pe care dintre aceste marci ati consumat-o in ultimele 4 saptamani, cel putin o data? [BIFATI TOT CE SE APLICA]

    Used Past 4 Weeks (Sau Past Month)

    Q2I. Pe care dintre aceste marci ati consumat-o in ultimele 7 zile, cel putin o data? [BIFATI TOT CE SE APLICA]]

    Used Past 7 Days (Sau Past Week)

    Q2I-3. Pe care dintre aceste marci ati consumat-o in ultimele 24 de ore? [BIFATI TOT CE SE APLICA]

    Used Past 24 Hours (Sau Past Day)

    Q2J. Pe care dintre aceste marci ati consumat-o ultima data cand ati consumat bauturi racoritoare necarbonatate(suc, nectar,

    suc natural 100%)? [BIFATI O SINGURA OPTIUNE] = Used Last

    Q2K. Care dintre aceste marci este marca dumneavoastra favorita? [BIFATI O SINGURA OPTIUNE]

    Favourite Brand (Preferred)

    Reguli de curatare (cum se transfera bifele? si in ce ordine se face aceasta?)

    Top of Mind (q01af) Unaided Awareness (q01a)

    Unaided Awareness (q01a)

    Usage all (Toate intrebarile de usage) Aided Awareness Heard a lot about (q02b)

    Favourite Brand (q02k)

    Various levels of consumption Ever consumed (q02c) (Orice varianta de consum Q2d, q2j intra in

  • q2c Consumate vreodata)

    Used Last (q02j) Used Past 24 Hours (q02i_3) doar daca are ceva bifat la q2i_3 Used Past 24 Hours (q02i_3) Used Past Week (q02i) Used Past Week (q02i) Used Past Month (q02h) Used Past Month (q02h) Used Past 12 Month (q02g) Used most Often (q02f) Used Regularly (q02d)

    Used Regularly (q02d) nu poate fi bifat in acelasi timp cu Used Occasionally (q02e). In cazul in care

    aceasta se intampla, se sterge bifa de la Occasionally si se lasa doar cea de la Regularly.

    Used Regularly (q02d) Used Most Often (q02f)

    De asemenea, foarte importanta este ORDINEA in care facem transferul bifelor, pe de o parte pentru a

    elimina sintaxele redundante (in care transferam o bifa din x in y iar apoi din y in z), iar pe de alta parte

    pentru a nu facem niste transferuri care ulterior nu mai ajung in variabila finala (din y in z si apoi din x

    in y, fara a mai face din x in z).

    Dupa realizarea acestor corelatii (transferuri de bife) se creaza grupurile multiplu raspuns (daca este

    cazul) si se verifica aceastea intre ele pentru a identifica eventuale erori. Ex: O marca bifata la Used

    Past 12 Months (q02h) trebuie sa se regaseasca in Ever Used (q02c); dupa transferul bifelor (dupa

    efectuareatuturor validarilor/ corelatiilor existente intre aceste variabile) nu trebuie sa mai gasim cazuri

    in care avme bifa la Used Past 12 Months (q02h) dar nu si la Ever Used (q02c)).

    Vezi Template sintaxa.

    6.2 Tratarea cazurilor Alta. Care?........

    Aceasta situatie e foartedes intalnita in foarte multe intrebari. Exemplu: Q5 De unde obisnuiti sa accesati Internetul? [BIFATI TOT CE SE APLICA] 1 De acasa 2 De la scoala/ serviciu 3 De la un prieten/ cunostinta/ ruda 4 De la Internet cafe 5 De altundeva (unde) ................................................................|____|

    In acest caz avem 5 variabile dihotomice (cate una pentru fiecare raspuns posibil: q05_01 ... q05_05)si

    inca una categoriala in care se va nota raspunsul pentru alta q05_05c.

    Numarul respondentilor de la q05_05c trebuie sa fie egal cu cel de la q05_05. Dupa ce dam o frecventa

    pe q05 si aflam care este numarul celor care au spus Alta (q05_05=1), vom da o frecventa pe q05_05c

    (dupa ce, in prealabil, am recodificat 0-urile in sysmis: recode q05_05c (0=sysmis).) si comparam bazele.

    if q05_05c>0 q05_05=1. -- Avem persoane care au rapuns la q05_05c dar nu au bifa la q05_05. exe. (transferam bifa)

    Verificarile care se fac pentru astfel de variabile, avand ca si input pe langa baza SPSS si codurile

    trecute de asistentii de proiect in excel-ul de coduri, sunt urmatoarele:

    codificarea unor raspunsuri aberante (care nu au nici o legatura cu intrebarea) caz in care acestea se fac sysmis (nu se lasa in baza)

    codurile folosite isi au un echivelent in lista de optiuni din chestionar (ex: 17 de la bunica/ cineva = 3 De la un prieten/ cunostinta/ ruda). Daca avem astfel de situatii, va trebui mutata bifa in categoria

    corespunzatoare: if q05_05c=17 q05_03=1.

    if q05_05c=17 q05_05=0.

    recode q05_05c (17=sysmis).

    exe.

    coduri dublate (acelasi lucru a fost codificat de 2 ori sub coduri diferite) in acest caz in baza se va

  • lasa doar unul dintre ele

    In categoria de Other avem ca si raspuns si 99 Nu stiu. Raspunsul Nu stiu este o categorie distincta si trebuie tratata ca atare . Nu stiu nu poate fi un raspuns la intrebarea Alta Care?, motiv pentru care in astfel de cazuri 99 va fi scos din aceasta categorie, si se va constitui o noua variabila q05_99 care va intra in grupul q05:

    if q05_05c=99 q05_99=1.

    var lab q05_99 DK/ NA if q05_05c=99 q05_05=0.

    recode q05_05c (99=sysmis).

    exe.

    Daca toti respondentii care au bifat alta au data un acelasi raspuns la intrebarea Alta Care? Atunci putem renunta la optiunea alta si fie sa o reetichetam (cu explicatia codului de la alta) fie sa cream o

    noua variabila q05_06 etichetata cu aceasta explicatie si sa debifam raspunsurile de la q05_05.

    La fel se procedeaza si in situatia in care avem foarte multi respondenti (poate chiar mai multi de cat

    cei de la categoriile predefinite) care au raspunsuri identice la Alta Care? Pentru ei se vor crea

    variabile noi, cu eticheta corespunzatoare raspunsului si se vor scoate atat din q05_05 cat si din q05_05c. Pentru aceasat este necesar acordul PD-ului.

    6.3 Intrebari deschise

    Intrebarile deschise sunt acele intrebari pentru care nu exista o lista predefinita de raspunsuri,

    respondentul fiind liber sa dea orice raspuns. Acestea vor fi ulterior codificate de catre asistentii de

    proiect, in baza de date ajungand doar niste coduri, fiecare avand un corespondent (care va lua forma

    etichetelor).

    Ex: Q7.Ce va place la acest produs?.........................................................................................................................................|____|

    ...............................................................................................................................................................................................|____|

    ...............................................................................................................................................................................................|____|

    ...............................................................................................................................................................................................|____|

    Vom avea 4 variabile (q07_01...q07_04), pentru un respondent putand fi completate oricate dintre ele.

    Pentru studiile Daedalus prelucrarea/ restrangerea deschiselor se face in Daedalus dar cateva verificari

    trebuie facute si pentru acest tip de variabile:

    Toti respondentii au raspuns la aceasta intrebare do if sum(q07_01,q07_02, q07_03,q07_04)=0.

    recode q07_02, q07_03,q07_04.

    end if.

    exe.

    recode q07_01 (0=ysmis).

    Nu exista aceleasi raspunsuri pentru acelasi raspensent: q07_01 q07_02q07_03q07_04 Exemplu de sintaxa

    Intre raspunsurile valide ale respondetului nu se gasesc optini gen 99Nu stiu, 98Nimic,97Totul aceste pot exista doar ca raspunsuri unice.

    6.4 Overall evaluation vs evaluari pe atribute

    Q1: V-as ruga sa dati o nota de la 1 la 10 unde 1 inseamna foarte prost, iar 10 inseamna foarte bine pentru operatorul

    Connex.

    Q2: Acum v-as ruga sa evaluati urmatoarele atribute pentru operatorul de telefonie mobila Connex. Pentru fiecare

    dintre acestia, o nota de la 1 la 10 unde 1 inseamna foarte prost, iar 10 inseamna foarte bine:

    1. Calitatea serviciilor 2. Calitatea semnalului

  • 3. Corectitudinea facturari . 10. Relatia cu clientii

    Avem de-a face cu variabile de medii, fiecare cu valori intre 1 si 10. Este evident ca evaluarea generala

    a operatorului (q01) depinde in mare masura de evaluarile specifice pe atribute (q02_01, q02_10), de aceea media evaluarii generale ar trebui sa fie aproximativ egala cu media ponderata pe evaluarile pe

    atribute. Daca intre acestea exista diferente mari, inseamna ca avem o problema (ex: q01=9 iar

    atributele de la q02 sunt toate sub 9). In acest caz, se verifica chestionarul iar daca nu ese greseala de

    introducere, valorile acestor intrebari se vor face sysmis; este putin probabil ca nota generala obtinuta

    sa nu fie influentata de nici unul din atributele enumerate la q02 (de obicei chestionarul este astfel

    conceput incat sa cuprinda principalele attribute).

    Astfel de corelatii trebuie facute si la studiile Blind/ Concept Test in care respondentului i se cere pe de

    o parte sa evalueze diverse atribute (gust, aspect) dupa care sa dea o nota generala produsului si sa-si manifeste preferinta pentru unul dintre produsele testate. Daca un respondent a dat evaluari foarte

    proaste pentru produsul A si evaluari mai bune pentru produsul B, dar la preferinta a iesit ca prefera

    produsul B, inseamna ca avem o problema. (problema poate aparea de la introducere, din faptul ca

    respondentul nu-si mai amintea exact care era primul respectiv al doilea produs testat, variabila de

    preferinta a fost compusa gresit, etc.) Asemenea erori nu pot ramane in baza.

    6.4 Consideration

    Q 4. [ARATATI CARTONASUL Q 4] Cat de probabil este sa luati in considerare achizitia marcii.. [ROTITI ORDINEA MARCILOR] data viitoare cand veti cumpara bauturi racoritoare necarbonatate (suc, nectar, suc natural

    100%)? Va rog sa va uitati la acest cartonas si sa alegeti una dintre aceste optiuni. [BIFATI O SINGURA OPTIUNE

    PE COLOANA] Si cat de probabil este sa luati in considerare achizitia marcii.[CITITI URMATOAREA MARCA DIN TABEL] [VERIFICATI CA ATI APLICAT INTREBAREA PENTRU TOATE MARCILE]

    [ROTITI MARCILE] [MARCATI

    MARCA CU CARE INCEPETI]

    Cappy Duo

    Fruo

    Frutti/

    Fruttia Pfanner Prigat Santal Tedi

    1. Este prima mea optiune

    FIRST CHOICE 1 1 1 1 1 1 1

    2. Este o marca pe care m-as gandi in

    mod serios sa o cumpar

    SERIOUSLY CONSIDER 2 2 2 2 2 2 2

    3. Este o marca pe care m-as putea

    gandi sa o cumpar

    MIGHT CONSIDER 3 3 3 3 3 3 3

    4. Este o marca pe care nu m-as

    gandi sa o cumpar

    REJECTED 4 4 4 4 4 4 4

    0. Nu stiu/ Non-raspuns [NU CITITI] 0 0 0 0 0 0 0

    La aceasta intrebare, trebuie urmarite urmatoarele:

    Nu avem mai mult de o marca bifata la First Choice in cazul in care se intampla sa avem bifate mai multe marci ca prima optiune, se muta toate aceste bife la Seriously Consider

    Nu avem in acelasi timp bife si la First Choice si la Seriously Consider in cazul in care se intampla asa ceva , pentru toti cei care au bifat Seriously Consider , se muta bifa la Might

    Consider.

  • Transpuneri

    Transpunerea este operatiunea prin care una sau mai multe variabile dintro baza de data, se pun una sub

    alta, pentru a putea fi prelucrate impreuna. In urma transpunerii, fiecare respondent va fi dublat, triplat

    etc, in functie de cate evaluari avem. Situatiile in care utilizam transpunerea sunt:

    - Blind Test-ele caz in care toate variabilele de evaluare al celui de-al doilea produs se transpun astfel incat vom avea o noua baza cu doar jumatate din variabile (atat pentru produsul A cat si pt

    produsul B) si o variabila de identificare a ordinii in care s-a facut transpunerea (1=variabilele

    initiale, carevorbesc pentru primul produs evaluat, 2= variabilele rename-uite care vorbesc

    pentru al doilea produs evaluat).

    - Diferite evaluari care pot fi facute pentru oricare x brand-uri dintro lista predefinita. Ex: Q 5. Mai departe va voi citi o serie de afirmatii care descriu o reclama oarecare. Gandindu-va la reclamele companiilor de

    asigurari de viata pe care le-ati vazut in ultimele 6 luni, as dori sa-mi spuneti in ce masura sunteti de acord cu urmatoarele

    afirmatii? Aveti urmatoarele optiuni: 1 dezacord total; 2 dezacord; 3 dezacord partial; 4 nici acord nici dezacord; 5 acord partial; 6 acord; 7 acord total. [SCRIETI IN SPATIILE PUNCTATE NUMELE COMPANIILOR DE ASIGURARI DE VIATA LA CARE RESPONDENTUL A VAZUT RECLAME OPTIUNILE BIFATE LA ERROR! REFERENCE SOURCE NOT FOUND.. SE VA EVALUA RECLAMA NEDERLANDEN/ ING - NEDERLANDEN

    DACA A VAZUT-O - VEZI ERROR! REFERENCE SOURCE NOT FOUND. = 9, 10] [ARATATI CARTONASUL C

    9] [ROTITI AFIRMATIILE]

    Reclama

    S1 ....|____|

    S2

    ....|____|

    S3

    ....|____|

    1. Este usor de retinut 1 2 3 4 5 6 7 1 2 3 4 5 6 7 1 2 3 4 5 6 7

    2. Este deosebita 1 2 3 4 5 6 7 1 2 3 4 5 6 7 1 2 3 4 5 6 7

    3. Este emotionanta 1 2 3 4 5 6 7 1 2 3 4 5 6 7 1 2 3 4 5 6 7

    4. Este convingatoare 1 2 3 4 5 6 7 1 2 3 4 5 6 7 1 2 3 4 5 6 7

    5. Contine informatii utile 1 2 3 4 5 6 7 1 2 3 4 5 6 7 1 2 3 4 5 6 7

    6. Este credibila 1 2 3 4 5 6 7 1 2 3 4 5 6 7 1 2 3 4 5 6 7

    7. Este potrivita pentru o companie de

    asigurari de viata 1 2 3 4 5 6 7 1 2 3 4 5 6 7 1 2 3 4 5 6 7

    8. Are un impact puternic 1 2 3 4 5 6 7 1 2 3 4 5 6 7 1 2 3 4 5 6 7

    9. Are un mesaj clar 1 2 3 4 5 6 7 1 2 3 4 5 6 7 1 2 3 4 5 6 7

    10. Imi starneste interesul pentru a afla

    mai multe informatii 1 2 3 4 5 6 7 1 2 3 4 5 6 7 1 2 3 4 5 6 7

    11. Ma face sa am incredere in compania

    de asigurari de viata 1 2 3 4 5 6 7 1 2 3 4 5 6 7 1 2 3 4 5 6 7

    Exemplu sintaxa de transpunere :

    match files file="\\Server\cantitative\Team 3\SFBT - 4 snacks - Oct05\Baze_date\3_Intermediare\Curatare\baza_ini.sav"

    /keep= cod d01 d02_01 d02_02 d02_03 d02t d03 d04 d05 datasiora denloca f04 f04c f05 f06 f07_01 f07_02 f07_03 f07_04

    f07_05 f07_06 f08_01 f08_02 f08_03 f08_04 f08_05 f08_06 f08_07 f09 f10 id_oi marca oper_c prod_01 prod_02 q01_01

    q01_02 q01_03 q01_04 q01_05 q01_06 q01_07 q01_07c q02 q03 q04 q05 q06 q07 q08 q11 q12 q13 q13_01 q14 q15 q16

    q17 q18_01 q18_02 q19a q19b q19c q19d q20 q21 q22 q22_01 q23 q23_01 q24 q26 q27_01 q27_02 q27_03 q27_04

    q27_05 q27c q31 q32 q33 q34_01 q34_02 q34_03 q34_04 q34_05 q34_06 q34_07 q34_08 q34_08c q35 q36 q37 q38 q39

    q40 q80 q81 q82 q83 q84 resp_nume resp_tel tip.

    compute d_ord=1.

    exe.

    save outfile="\\Server\cantitative\Team 3\SFBT - 4 snacks - Oct05\Baze_date\3_Intermediare\Curatare\P_1.sav".

    Se scrie sursa bazei pe care vrem sa o transpunem

    Se trec toate variabilele pe care vrem sa le pastram

    (variabile din selectie, demograficele, preferinta si alte

    variabile care nu se refera la produsul testat +variabilele

    pentru primul produs evaluat

    Se compune variabila d_ord care ne

    spune sursa variabileleor transpuse (este

    vorba despre primul produs evaluat)

    Se salveaza baza

  • match files file="\\Server\cantitative\Team 3\SFBT - 4 snacks - Oct05\Baze_date\3_Intermediare\Curatare\baza_ini.sav"

    /keep= cod d01 d02_01 d02_02 d02_03 d02t d03 d04 d05 datasiora denloca f04 f04c f05 f06 f07_01 f07_02 f07_03 f07_04

    f07_05 f07_06 f08_01 f08_02 f08_03 f08_04 f08_05 f08_06 f08_07 f09 f10 id_oi marca oper_c prod_02 q01_01 q01_02

    q01_03 q01_04 q01_05 q01_06 q01_07 q01_07c q41 q42 q43 q44 q45 q46 q47 q50 q51 q52 q52_01 q53 q54 q55 q56

    q57_01 q57_02 q58a q58b q58c q58d q59 q60 q61 q61_01 q62 q62_01 q63 q65 q66_01 q66_01c q66_02 q66_03 q66_04

    q66_05 q70 q71 q72 q73_01 q73_02 q73_03 q73_04 q73_05 q73_06 q73_07 q73_08 q73_08c q74 q75 q76 q77 q78 q79

    q80 q81 q82 q83 q84 resp_nume resp_tel tip.

    rename var

    (prod_02=prod_01)

    ( q41=q02 )

    ( q42 = q03 )

    ( q43 = q04 )

    ( q44 = q05 )

    ( q45 = q06 )

    ( q46 = q07 )

    ( q47 = q08 )

    ( q50 = q11 )

    ( q51 = q12 )

    ( q53 = q14 )

    ( q54 = q15 )

    ( q55 = q16 )

    ( q56 = q17 )

    ( q52 = q13 )

    ( q52_01 = q13_01 )

    ( q57_01 = q18_01 )

    ( q57_02= q18_02 )

    ( q58a = q19a )

    ( q58b = q19b )

    ( q58c = q19c )

    ( q58d = q19d )

    ( q59 = q20 )

    .. exe.

    compute d_ord=2.

    exe.

    SORT CASES BY

    cod (A) .

    save outfile="\\Server\cantitative\Team 3\SFBT - 4 snacks - Oct05\Baze_date\3_Intermediare\Curatare\P_2.sav".

    add files file= "\\Server\cantitative\Team 3\SFBT - 4 snacks - Oct05\Baze_date\3_Intermediare\Curatare\P_1.sav"

    /file="\\Server\cantitative\Team 3\SFBT - 4 snacks - Oct05\Baze_date\3_Intermediare\Curatare\P_2.sav".

    exe.

    save outfile="\\Server\cantitative\Team 3\SFBT - 4 snacks - Oct05\Baze_date\3_Intermediare\Curatare\Transpusa.sav".

    Din meniul SPSS aceasta se poate face din: Data Restructure --- Restructure selected variables into cases

    Pentru a doua baza, se pastreaza toate variabile de la pc.1

    doar ca cele referitoare la produsul evaluat sunt inlocuita

    cu variabilele pentru al doilea produs evaluat

    Variabilele pentru al doilea produs evaluat se redenumesc

    identic cu variabilele primului produs evaluat.

    Se compune variabila d_ord care ne

    spune sursa variabileleor transpuse (este

    vorba despre al doilea produs evaluat)

    Se salveaza baza

    Se unesc cele 2 baze si se salveaza sub o noua denumire.

    La prelucrari d_ord ne va ajuta sa facem distinctia intre

    monadic (d_ord=1) si consolidat (d_ord=2)

  • Detranspuneri - este operatiunea prin care baza de date transpusa este readusa la forma initiala (fiecare

    respondent va aparea o singura data cu toate variabilele)

    Din meniul SPSS aceasta se poate face din: Data Restructure --- Restructure selected variables into cases

    Variabila dupa care se face detranspunerea este d_ord-ul

    Sintaxa folosita

    SORT CASES BY cod d_ord .

    CASESTOVARS

    /ID = cod

    /INDEX = d_ord

    /GROUPBY = VARIABLE .

    Compunere d_pref

    Pentru Blind Teste, o variabila foarte importanta este d_pref care specifica preferinta respondentului

    pentru unul din produsele testate.

    Intrebarea din chestionar este: Q 6. [ARATATI CARTONASUL C 1] Dintre cele doua produse pe care tocmai le-ati gustat, care dintre ele v-a placut mai

    mult?

    [O SINGURA BIFA PE COLOANA]

    Afirmatii Q 80

    1. Imi place mai mult primul produs testat 1

    2. Imi place mai mult cel de-al doilea produs testat 2

    3. Imi plac la fel ambele produse testate 3

    4. Nu imi place nici unul din produse 4

    Presupunem ca au fost testate 4 produse (doua cate doua) : A, B, C si D. Avem variabila tip care ne

    arata produsele testate si ordinea in care au fost testate cele 2 produse

    Sintaxa de compunere a preferintei este:

    compute d_pref=0.

    if tip="A/B" and q80=1 d_pref=1.

    if tip="A/B" and q80=2 d_pref=2.

    if tip="A/C" and q80=1 d_pref=1.

    if tip="A/C" and q80=2 d_pref=3.

    if tip="A/D" and q80=1 d_pref=1.

    if tip="A/D" and q80=2 d_pref=4.

    if tip="B/A" and q80=1 d_pref=2.

    if tip="B/A" and q80=2 d_pref=1.

    if tip="C/A" and q80=1 d_pref=3.

    if tip="C/A" and q80=2 d_pref=1.

    if tip="D/A" and q80=1 d_pref=4.

    if tip="D/A" and q80=2 d_pref=1.

    if tip="B/C" and q80=1 d_pref=2.

    if tip="B/C" and q80=2 d_pref=3.

    Variabila de grupare/ identificare este codul

    (nr_chest), iar compunerea noilor variabile se face

    in fc de d_ord. Se vor crea mai multe variabile

    pastrand numele variabilelor initiale si care vor

    trebui redenumite cf chestionarului

  • if tip="B/D" and q80=1 d_pref=2.

    if tip="B/D" and q80=2 d_pref=4.

    if tip="C/B" and q80=1 d_pref=3.

    if tip="C/B" and q80=2 d_pref=2.

    if tip="D/B" and q80=1 d_pref=4.

    if tip="D/B" and q80=2 d_pref=2.

    if tip="C/D" and q80=1 d_pref=3.

    if tip="C/D" and q80=2 d_pref=4.

    if tip="D/C" and q80=1 d_pref=4.

    if tip="D/C" and q80=2 d_pref=3.

    IF Q80=3 d_pref=5.

    IF Q80=4 D_pref=6.

    EXE.

    var lab d_pref Preferrence val lab d_pref

    1Product A 2Product B 3Product C 4Product D 5Both 6None. exe.