proiect
TRANSCRIPT
Student:Leanca Roxana-Mirela, an 1, MC Zi
CUPRINS
I. Introducere . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
I.1. Definirea problemei . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
I.2. Obiectivul proiectului . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
II. Crearea bazei de date . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4
II.1. Identificarea variabilelor . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4
II.2. Definirea variabilelor si introducerea datelor in SPSS . . . . . . . . . . . . . . . . . . . . . . . . . . 4
II.3. Verificarea datelor introduce (outlieri, greseli, valori lipsa) . . . . . . . . . . . . . . . . . . . . . . 7
III. Descrierea statistica a variabilelor . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
III.1. Descrierea variabilelor categoriale . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
III.2. Descrierea variabilelor numerice . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15
IV. Inferenta statistica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18
IV.1. Estimarea statistica prin interval de incredere a unei medii . . . . . . . . . . . . . . . . . . . . . . 18
4.1.1. Estimarea statistica prin interval de incredere a unei proportii . . . . . . . . . . . . . . . . . . . . 21
4.2. Testarea unei valori medii cu o valoare fixa . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23
4.2.1. Testarea unei proportii cu o valoare fixa . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .24
V. Analiza statistica a legaturilor dintre variabile . . . . . . . . . . . . . . . . . . . . . . . 26
V.1. Analiza variantei ( ANOVA) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26
V.2. Analiza de regresie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . 27
V.3. Analiza de corelatie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33
VI. Concluzii . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35
Bibliografie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36
Anexa 1 , Anexa 2– Chestionar, Rezultatele chestionarului
2
I. Introducere
1.1. Definirea problemei
Compania Bit Computers S.R.L. este una dintre firmele care comercializeaza o gama larga de
produse si servicii IT: monitoare, tastaturi, unitati centrale si mouse-uri, desfasurand-si activitatea
in localitatea Botosani, Str. Balcescu Nicolae, Nr.6. Firma a luat fiinta in anul 2002 si este
inregistrata in Registrul Comertului din data de 22 Martie 2002 cu Nr. J7/84/2002, avand cifra de
afaceri de 1,866,149 lei. Numarul angajatilor acestei firme este de 5. In compania Bit Computers
este promovata o cultura organizationala puternica, avand ca valoare fundamentala orientarea catre
client.
Produsele si serviciile acestei firme au ca piata principala de desfacere Romania, firma
ocupandu-se cu vanzarea de produse si servicii hardware/software si echipamente IT: placi de
sunet, placi video, componente, retelistica, laptopuri, notebook-uri, table, servere, dar ofera si
consultanta tehnica de specialitate si servicii IT.
Obiectivul firmei este de a mentine legatura cu companiile cu care colaboreaza – atat clienti
cat si parteneri- si sa isi integreze propriile activitati si principii de actiune cu acestia, promovandu-
le in acelasi timp imaginea si interesele, castigand in acest fel increderea si parteneriatul celor mai
prestigioase companii.
1.2. Obiectivul proiectului
In cadrul acestui proiect am realizat o analiza statistica in urma aplicarii unui chestionar
(Anexa 1) clientilor magazinului Bit Computers. Esantionul analizat vizeaza un numar de 40 de
persoane si a fost aplicat clientilor in perioada ianuarie-aprilie 2011.
Obiectivul realizarii proiectului il reprezinta verificarea existentei unei relatii intre 2 variabile
categoriale (sexul si nivelul studiilor) si verificarea existentei unei relatii intre 3 variabile
numerice (varsta , venitul lunar al individului si valoarea medie lunara acordata produselor IT).
In vederea prelucrarii datelor s-au folosit diferiti indicatori pentru verificarea bazei de date in
vederea depistarii si eliminarii erorilor, avand in vedere tipurile de variabile si gradul de asociere a
variabilelor; analizarea tipurilor de colectivitati atat individual cat si in functie de
interdependentele dintre ele, ca apoi sa fie prelucrate si analizate datele, iar in final sa fie estimati
si testati parametrii
3
II. CREAREA BAZEI DE DATE 2.1. Identificarea variabilelor analizate
Cu ajutorul programului SPSS s-au analizat raspunsurile date de clientii magazinului.
Intrebarile din chestionar se referă la: nivelul studiilor, sexul persoanei, vârsta persoanei, venitul
lunar si valoarea medie lunara acordata cumpararii produselor/ serviciilor IT. Fiecare întrebare
reprezintă o variabilă ce a fost introdusă în programul SPSS. Răspunsurile clientilor la aceste
întrebări constituie valori ale variabilelor definite anterior.
2.2. Definirea variabilelor si introducerea datelor in SPSS
Pentru alcatuirea bazei de date s-a pregatit setul de date in asa fel incat sa permita organizarea
si efectuarea analizei. Pentru a realiza analizele propuse în obiectivul acestui proiect, am început
prin a creea baza de date. Aceasta presupune prezentarea datelor într-o formă care să permită
organizarea şi efectuare analizei lor şi constă în două etape:definirea variabilelor şi introducerea
datelor
Atributele acestor variabile sunt definite in fereastra Data Editor – Foaia VariableView:
Figura 1. Fereastra Data Editor – Foaia Variable View pentru baza de date: BIT COMPUTER.sav
Atributele variabilelor sunt introduse in fereastra Data Editor – Foaia Variable View
4
Figura 2. Fereastra Data Editor – Foaia Data View pentru baza de date BIT COMPUTERS.sav
Prelucrarea datelor are ca obiectiv centralizarea si gruparea statistica. Prin centralizare s-a
urmarit obtinerea de indicatori totalitari la nivelul esantionului, iar prin grupare s-au obtinut siruri
de date dupa mai multe variabile de grupare.
Categoriile ordonate ale variabilelor observate si frecventele asocialte acestora au format
distributii statistice. Am obtinut in acest mod tabele de frecventa in care sunt reprezentate pentru
fiecare variabila selectata urmatoarele elemente: - valorile variabilelor
- procentele
- procentele cumulate corespunzator
Tabel 1: Distributia dupa nivelul de studii a esantionului de clienti
nivel de studii efectuate/ in curs
Frequency Percent Valid PercentCumulative
PercentValid elev 15 37.5 37.5 37.5
universitar 15 37.5 37.5 75.0
postuniversitar 10 25.0 25.0 100.0
Total 40 100.0 100.0
5
Tabel 2: Distributia dupa varsta persoanei
varsta persoanei
Frequency Percent Valid PercentCumulative
PercentValid 14-18 ani 11 27.5 27.5 27.5
19-25 ani 17 42.5 42.5 70.0
26-30 ani 7 17.5 17.5 87.5
>30 ani 5 12.5 12.5 100.0
Total 40 100.0 100.0
Tabel 3: Distributia dupa sexul persoanei
sexul persoanei
Frequency Percent Valid PercentCumulative
PercentValid masculin 19 47.5 47.5 47.5
feminin 21 52.5 52.5 100.0
Total 40 100.0 100.0
Tabel 4: Distributia dupa venitul lunar
venitul lunar al persoanei
Frequency Percent Valid PercentCumulative
PercentValid <300 13 32.5 32.5 32.5
301-700 15 37.5 37.5 70.0
>700 12 30.0 30.0 100.0
Total 40 100.0 100.0
Tabel 5: Distributia dupa valoarea cumparaturilor lunare a produselor/serviciilor IT
valoare medie produse IT
Frequency Percent Valid PercentCumulative
PercentValid < 50 15 37.5 37.5 37.5
51-100 10 25.0 25.0 62.5
101-200 7 17.5 17.5 80.0
201-500 4 10.0 10.0 90.0
>500 4 10.0 10.0 100.0
Total 40 100.0 100.0
6
2.3. Verificarea datelor introduse (outlieri, greseli, valori lipsa)
Inainte de a incepe procesul de inferenta statistica este necesar ca variabilele sa respecte
conditia de normalitate si apoi sa verificam daca sunt valori extreme,ca apoi sa se realizeze
eliminarea acestora.
Pentru a verifica dacă distribuţia valorilor unei variabile prezintă asimetrie accentuată, dacă
sunt outlieri sau alte anomalii se pot utiliza diagramele Boxplot care se pot obtine folosind
optiunea Boxplot a comenzii Interactive din meniul Graphs.
Outlierii se depisteaza in cazul variabilelor numerice , valorile depistandu-se urmand
demersul Analyze – Descriptive Statistics – Explore – Plots, outlierile fiind depistate implicit.
Figura 3. Selectarea opţiunii Analyze – Descriptive Statistics – Explore
Figura 3.1. Otinerea Diagramei Boxplot
7
Figura 3.2. Crearea diagramei Boxplot
8
În output-ul opţiunii, opţiunea Explore a comenzii Descriptive Statistics din meniul Analyze
am obţinut valorile extreme cele mai mari şi cele mai mici pentru cele două variabile numerice:
venitul lunar al persoanei si sexul persoanei.
Descriptives
sexul persoanei venitul lunar al persoanei masculin Mean 1.6842 .17189
95% Confidence Interval for Mean
Lower Bound 1.3231
Upper Bound2.0453
5% Trimmed Mean 1.6491
Median 2.0000
Variance .561
Std. Deviation .74927
Minimum 1.00
Maximum 3.00
Range 2.00
Interquartile Range 1.00
Skewness .616 .524
Kurtosis -.856 1.014
feminin Mean 2.2381 .16768
95% Confidence Interval for Mean
Lower Bound 1.8883
Upper Bound2.5879
5% Trimmed Mean 2.2646
Median 2.0000
Variance .590
Std. Deviation .76842
Minimum 1.00
Maximum 3.00
Range 2.00
Interquartile Range 1.00
Skewness -.453 .501
Kurtosis -1.095 .972
In urma utizilarii diagramelor Boxplot ( numai pentru variabilele numerice) am obtinut urmatoarele diagrame:
9
Figura 3.3. Diagramele privind a).varsta persoanei b). valoare medie cumparaturi produse IT c). Venitul lunar al persoanei
a.
b.
varsta persoanei
4.0
3.5
3.0
2.5
2.0
1.5
1.0
valoare medie produse IT
5
4
3
2
1
c.
venitul lunar al persoanei
3.0
2.5
2.0
1.5
1.0
Interpretarea diagramelor: Asa cum se observa, in nici una dintre aceste 3 diagrame nu exista outlieri ( valori aberante).III. Descrierea statistică a variabilelor
10
3.1.Descrierea statistica a variabilelor categoriale
Pentru variabile categoriale: proporţii, valoarea dominantă, diagrama de structură, diagrama
Pareto
Cele doua variabile categoriale ce vor fi analizate sunt ‘sexul’ si ‘nivelul studiilorefectuate/
in curs ’ magazinului BIT Computers.
In fereastra Frequencies vom lucra pe rand cu amandoua variabilele nominale; astfel, din
lista sursa selectam una dintre variabilele nominale pe care o mutam in caseta Variabile(s).
Din caseta Frequencies: Charts deschisa prin apasarea butonului de comanda Charts, optam
pentru graficul Pie si de asemenea selectam Frequencies pentru a obtine tabelele de frecvente,
dupa care prin butonul de comanda OK vom obtine in output graficul si tabelul de frecventa atat
pentru variabila „sexul”, cat si pentru variabila ‚nivelul studiilor efectuate/ in curs’.
Figura 4. – Optiunea Analyze – Frequencies
Figura 4.1. - Selectarea variabilelor si a indicatorilor
11
In figura 4.2 si 4.3 sunt prezentate diagramele variabilelor „sexul persoanei”, respectiv
„nivelul studiilor efectuate/ in curs”.
Figura 4.2. Diagrama pie a variabilei nivelul de studii efectuate/ in curs
postuniversitar
universitar
elev
nivel de studii efectuate/ in curs
Figura 4.3. Diagrama pie a variabilei sexul persoanei
12
feminin
masculin
sexul persoanei
Pentru variabilele chestionate se obţin rezultatele:
Tabel 4.1. Frecventa variabila sexul persoanei:
sexul persoanei
Frequency Percent Valid PercentCumulative
PercentValid masculin 19 47.5 47.5 47.5
feminin 21 52.5 52.5 100.0
Total 40 100.0 100.0
Tabel 4.2. Frecventa variabila nivelul de studii effectuate/ in curs:
nivel de studii efectuate/ in curs
Frequency Percent Valid PercentCumulative
PercentValid elev 15 37.5 37.5 37.5
universitar 15 37.5 37.5 75.0
postuniversitar 10 25.0 25.0 100.0
Total 40 100.0 100.0
Interpretare: Asadar, outputul frecventelor pentru fiecare variabila impreuna cu diagrama
corespunzatoare, ne indica procentajul categorii de consumator din cei intervievati, in functie de
studiile efectuate/ in curs si in functie de sexul persoanei. Din tabel putem observa ca 47,5% sunt
13
consumatori de sex masculin si 52,5% sunt cei de sex feminin. De asemenea se observa din
Tabelul 4.2. ca din totalul clientilor intervievati 37,5% sunt elevi, 37,5% sunt cu studii
universitare si 25% postuniversitare.
Diagrama Pareto
postuniversitaruniversitarelev
nivel de studii efectuate/ in curs
40
30
20
10
0
Co
un
t
100%
80%
60%
40%
20%
0%
Percen
t
10
1515
3.2. Descrierea statistica a variabilelor numerice
Pentru variabile numerice: nivelul mediu (media aritmetică, modul, mediana), dispersia
(varianţa, intervalul mediu de variaţie, coeficientul de variaţie), forma distribuţiei (asimetrie,
14
boltire), concentrare, grafice specifice (histograma, curba frecvenţelor, box-plot, curba de
concentrare)
Pentru a realiza o descriere numerica in SPSS vom folosi cele doua variabile numerice
„varsta” si „valoare medie acordata cumparaturilor produselor IT” cu ajutorul carora vom calcula
indicatorii tendintei centrale, dispersiei si formei distributiei.
In SPSS ca optiune de calcul am ales Descriptives din comanda Descriptives Statistics,
subordonata meniului Analyze la fel ca in figura 5, dupa care in fereastra de dialog Descriptives
selectam cele doua variabile numerice pentru care urmeaza sa calculam parametrii distributiei pe
care ii selectam din fereastra Descriptives: Options activata in urma apasarii pe butonul Options,
acestea fiind media, suma, abaterea medie patratica, varianta, valoarea minima si valoarea maxima
a variabilelor, precum si boltirea si asimetria.
Figura 5. Optiunea Analyze-descriptive
Figura.5.1. Selectarea optiunilor
15
Statistics
varsta
persoaneivaloare medie
produse ITN Valid 40 40
Missing 0 0Mean 2.1500 2.3000Std. Error of Mean .15421 .21243Median 2.0000 2.0000Mode 2.00 1.00Std. Deviation .97534 1.34355Variance .951 1.805Skewness .558 .752Std. Error of Skewness .374 .374Kurtosis -.553 -.578Std. Error of Kurtosis .733 .733Range 3.00 4.00Minimum 1.00 1.00Maximum 4.00 5.00
Figura 5.2. Histograma pentru variabila varsta persoanei
16
5.004.003.002.001.000.00
varsta persoanei
20
15
10
5
0
Fre
qu
ency
Mean = 2.15Std. Dev. = 0.97534N = 40
varsta persoanei
Figura 5.3. Histograma pentru variabila valoare medie produse IT
6.005.004.003.002.001.000.00
valoare medie produse IT
15
12
9
6
3
0
Fre
qu
ency
Mean = 2.30Std. Dev. = 1.34355N = 40
valoare medie produse IT
Interpretare: Pentru ambele variabile se citesc în tabel principalii indicatori: media, mediana, varianţa, modul, valorile minime şi valorile maxime.
IV. Inferenta statistica
17
Estimarea este procedeul prin care se generalizează rezultatele observate pe un eşantion, la
nivelul populaţiei din care este extras, adică se află valoarea unui parametru al unei populaţii pe
baza datelor înregistrate la nivelul unui eşantion extras din aceasta.
Estimarea poate fi punctuală sau prin interval de încredere. În acest caz se va estima prin
interval de încredere.
4.1. Estimarea statistica prin interval de incredere a unei medii
În cazul mediei SPSS calculează valoarea tipică de sondaj, scorul Z corespunzător, eroarea
standard a mediei, limita inferioară şi limita superioară a intervalului de încredere. Pentru baza de
date Bit Computers.sav se va calcula media produselor IT vandute intr-o perioada de un an de zile
şi intervalul de încredere corespunzător. Pentru aceasta se parcurge demersul: meniul Analyze –
Descriptives Statistics – Explore. Se stabileşte nivelul de încredere de 95%, şi apoi de 99%.
Figura 6: Prezentarea demersului
18
Se obtin rezultatele cu intervalul de incredere 95%:
Case Processing Summary
Cases
Valid Missing Total
N Percent N Percent N Percent
valoare medie produse IT 40 100.0% 0 .0% 40 100.0%
Descriptives
valoare medie produse IT Mean 2.3000 .21243
95% Confidence Interval for Mean
Lower Bound 1.8703
Upper Bound2.7297
5% Trimmed Mean 2.2222
Median 2.0000
Variance 1.805
Std. Deviation 1.34355
Minimum 1.00
Maximum 5.00
Range 4.00
Interquartile Range 2.00
Skewness .752 .374
Kurtosis -.578 .733
19
Interpretare: Se poate spune cu o incredere de 95% ca valoarea medie lunara acordata de clienti
pentru achizitionarea produselor si/sau serviciilor IT este cuprins intre 1,87 si 2,72 .
Se obtin rezultatele cu intervalul de incredere de 99%:
Case Processing Summary
Cases
Valid Missing Total
N Percent N Percent N Percentvaloare medie produse IT 40 100.0% 0 .0% 40 100.0%
Descriptives
valoare medie produse IT Mean 2.3000 .21243
99% Confidence Interval for Mean
Lower Bound 1.7247
Upper Bound2.8753
5% Trimmed Mean 2.2222
Median 2.0000
Variance 1.805
Std. Deviation 1.34355
Minimum 1.00
Maximum 5.00
Range 4.00
Interquartile Range 2.00
Skewness .752 .374
Kurtosis -.578 .733
Interpretare: Se poate spune cu o încredere de 99% ca valoarea medie lunara acordata de clienti
pentru achizitionarea produselor si/sau serviciilor IT este cuprins intre 1,72 si 2,87 .
4.1.1. Estimarea statistica prin interval de incredere a unei proportii
20
SPSS nu calculează direct intervalul de încredere pentru o proporţie. Estimarea intervalului
de încredere presupune efectuarea mai multor operaţii, şi anume:
- calculul estimaţiei proporţiei, prin demersul Analyze – Descriptive Statistics – Frequencies. După
selectarea variabilei se bifează Display frequency tables;
- se află valoarea variabilei Z pentru intervalul de încredere considerat. Pentru un nivel de
încredere de 95%, Z = 1.96; pentru un nivel de încredere de 99%, Z = 2.55;
- se calculează eroarea standard Sp = s/n, unde s= f(1 – f) este abaterea standard, iar n este volumul
eşantionului;
- se calculează limitele intervalului folosind formula f ± 1.96Sp, respectiv f ± 2.55Sp.
Urmând aceşti paşi se va estima proporţia persoanelor de sex feminin care cumpără
produse IT: Figura 7: Prezentarea demersului Analyze-Descriptive Statistics-Frequencies
Frequencies
21
Statistics
sexul persoanei N Valid 40
Missing 0
sexul persoanei
Frequency Percent Valid PercentCumulative
PercentValid masculin 19 47.5 47.5 47.5
feminin 21 52.5 52.5 100.0
Total 40 100.0 100.0
Interpretare: Se observa ca proportia persoanelor de sex feminin este de 52,5%.
Calculul erorii: Sp: pentru f = 52,5%, înlocuind în formula prezentată mai sus se obţine
valoarea 0.006.
Calculul limitelor intervalului de încredere:
pentru z = 1.96, se obţine:
Li = f – 1.96*SP = 0.525 – 1.96*0.006 = 0.513
Ls = f + 1.96*Sp = 0.525 + 1.96*0.006 = 0.536
Interpretare: Ne putem aştepta, cu o încredere de 95%, ca procentul persoanelor de sex feminin
care cumpara produse/ servicii IT sa fie cuprins între 51.3% şi 53,6%.
pentru z = 2.55, se obţine:
Li = f – 2.55*0.006 = 0.525 – 2.55*0.006 = 0.509
Ls = f + 2.55*0.006 = 0.525 + 2.55*0.006 = 0.540
Interpretare: Ne putem aştepta, cu o încredere de 99%, ca procentul persoanelor de sex feminin
care cumpara produse/ servicii IT fie cuprins între 50.9% şi 54%.
4.2. Testarea statistica a unei valori medii cu o valoare fixa
22
Testarea mediei cu o valoare fixa se realizeaza utilizand procedeul One-Sample T Test.
Acest lucru presupune parcurgerea demersului: Analyze – Compare Means – One-Sample T Test.
Se va analiza daca valoarea medie a produselor/ serviciilor IT cumparate de o persoana in decurs
de un an difera sau nu de 0.
Figura 8: Prezentarea demersului Analyze-Compare Means-One-Sample T Test
23
Se obţine outputul:
One-Sample Statistics
N Mean Std. DeviationStd. Error
Meanvaloare medie produse IT 40 2.3000 1.34355 .21243
One-Sample Test
Test Value = 0
t df Sig. (2-tailed)Mean
Difference
95% Confidence Interval of the Difference
Lower Uppervaloare medie produse IT 10.827 39 .000 2.30000 1.8703 2.7297
Interpretare: Valoarea medie observată este2.30; valoarea specificată este 0; diferenţa dintre
valoarea medie observată şi valoarea ipotetică este 2.30. Având în vedere că valoarea Sig. < 0.05,
între valoarea medie observată şi valoarea ipotetică există diferenţe semnificative.
4.2.1. Testarea unei proportii cu o valoare fixa
Pentru realizarea acestui lucru se foloseste Binomial Test. Acesta este un procedeu prin
care se testeaza ipoteze cu privire la o variabila cu distributie binomiala, variabila care poate lua
doar doua valori, cum ar fi sexul persoanelor.Binomial Test este folosit pentru a compara o
proporţie cu o valoare specificată şi presupune parcurgerea demersului: Analyze – Nonparametric
Tests – Binomial. Se va verifica dacă proporţia uneia din cele două grupe de persoane definite prin
variabila „sexul persoanei”, masculin şi feminin diferă semnificativ de 0.50. În Test Variable List
se introduce variabila „sexul persoanei”.
24
Figura 9: Prezentarea demersului Analyze-Nonparametric Tests-Binomial
Interpretare: Proporţia observată în eşantion pentru grupa 1 (feminin) este de 53%, proporţia
specificată este 50%. Valoarea Sig. asociată testului este mai mare decât 0.05; astfel se poate
concluziona cu o încredere de 95% că proporţia persoanelor de sex feminin în eşantion nu diferă
semnificativ de proporţia specificată de 50%.
25
V. Analiza statistica a legaturilor dintre variabile
5.1. Analiza varianţei (ANOVA)
Analiza dispersională este un procedeu statistic, cunoscut sub denumirea de ANOVA, care
poate fi utilizat în analiza variaţiei unei variabile în raport cu factorii de influenţă.
Principiul de bază: variaţia totală este descompusă în suma variaţiei dintre grupe şi a
variaţiei din interiorul grupelor
Pentru o distribuţie bivariată cu variabile de natură diferită, o variabilă nominală şi una
exprimată cantitativ se poate aplica analiza variaţiei prin ANOVA. Procedeul ANOVA măsoară
impactul valorilor unor variabile nominale asupra dispersiei valorilor unei variabile cantitative.
Variabilele utilizate în cadrul analizei ANOVA sunt: valoarea medie acordata cumpararii
produselor IT (numerica) şi sexul persoanei(categoriala). În SPSS, am ales opţiunea One-Way
ANOVA din comanda Compare Means a meniului Analyze.
Figura 10: Prezentarea demersului Analyze-Compare Means- One-Way ANOVA
26
ANOVA
valoare medie produse IT
Sum of
Squares df Mean Square F Sig.Between Groups .009 1 .009 .005 .945Within Groups 70.391 38 1.852Total 70.400 39
Cu o probabilitate de 95% ca valoarea medie a produselor IT sa depinda de sexul persoanelor care
cumpara aceste produse.
5.2. Analiza de regresie
Analiza de regresie presupune aproximarea modelului de regresie, estimarea şi testarea
parametrilor modelului de regresie. Între cele două variabile numerice se poate stabili o legătură
liniară dată prin ecuaţia de regresie liniară simplă, care are forma:
Yi = α + Βxi + εi
în care:
Y – variabila dependentă (valoarea medie cheltuita pentru produse IT)
X – variabila independentă (varsta individului)
ε – variabila aleatorie eroare sau reziduu
Aproximarea modelului de regresie se realizează prin Scatterplot (din meniul Graphs -
Interactive
Figura 11: Prezentarea demersului Graphs-Interactive-Scatterplot
27
28
Se obtine outputul:
Linear Regression
1.00 2.00 3.00 4.00
varsta persoanei
1.00
2.00
3.00
4.00
5.00
valo
are
med
ie p
rod
use
IT
valoare medie produse IT = 1.36 + 0.44 * varstaR-Square = 0.10
29
Estimarea parametrilor modelului de regresie presupune parcurgerea demersului:
Analyze – Regession – Linear, prin care se deschide fereastra de dialog Linear Regession. Urmând
paşii necesari, în output se analizează Model Summary, ANOVA, Coefficients.
Figura 12: Prezentarea demersului Analyze-Regression-Linear
30
Tabelul Model Summary prezintă valoarea coeficientului de corelaţie R, valoarea raportului de
determinaţie R2 şi eroarea standard a estimaţiei.
Model Summary
Model R R SquareAdjusted R
SquareStd. Error of the Estimate
Change Statistics
R Square Change F Change df1 df2 Sig. F Change
1 .317(a) .100 .077 1.29092 .100 4.245 1 38 .046
a Predictors: (Constant), varsta persoanei
Interpretare: Valoarea lui R este 0.317, ceea ce indică faptul că între cele două variabile există o
legătură directă. Valoarea lui R2 este 0.10, ceea ce indică faptul că 10% din variaţia variabilei Y
este explicată prin variaţia variabilei X. Aceasta este o valoare destul de mică, ceea ce înseamnă că
modelul ales nu explică foarte bine legătura dintre variabile.
Tabelul Regression ANOVA prezintă rezultatele analizei varianţei variabilei dependente sub
influenţa factorului de regresie şi a factorului reziduu. Prezintă informaţii asupra sumei pătratelor
abaterilor variabilei dependente, gradele de libertate, estimaţiile varianţelor datorate celor două
surse de variaţie, raportul F şi Sig.
ANOVA(b)
Model Sum of
Squares df Mean Square F Sig.1 Regression 7.074 1 7.074 4.245 .046(a)
Residual 63.326 38 1.666
Total 70.400 39
a Predictors: (Constant), varsta persoaneib Dependent Variable: valoare medie produse IT
31
Interpretare: Aici ne sunt prezentate informatii despre suma patratelor abaterilor variabilei
dependente (Sum of Square), gradele de libertate (df), estimatiile datorate celor doua surse de
variatie, adica regresie si reziduu (Mean Square), statistica testului F si valoarea nivelului de
semnificatie Sig. Deoarece testul F ia o valoare mica F = 4,245, iar valoarea nivelului de
semnificatie Sig = 0.46 ,corespunzatoare statistici F este mare, rezulta ca valoarea medie cheltuita
nu depinde de varsta individului, iar relatia liniara dintre cele doua variabile nu este una
semnificativa.
Un tabel important in analiza regresiei il reprezina cel al coeficientilor. Aceasta arata cu cat se
modifica variabila „valoare medie cheltuita” in functie de modificarea variabilei varstei precum si
daca modificarea este semnificativa, prin valoarea lui Sig
Coefficients(a)
Model Unstandardized
CoefficientsStandardized Coefficients t
Sig. B Std. Error Beta1 (Constant) 1.361 .499 2.726 .010
varsta persoanei .437 .212 .317 2.060 .046
a Dependent Variable: valoare medie produse IT
Interpretare: In acest tabel avem prezentati coeficientii nestandardizati ai modelului de regresie
estimat, erorile standard ale acestora, coeficientii de regresie standardizati cu erorile standard
corespunzatoare, precum si valorile statisticii t si valorile Sig corespunzatoare.
5.3. Analiza de corelatie
32
Analiza de corelaţie presupune măsurarea gradului de intensitate a legăturii dintre variabilele
numerice, precum şi testarea semnificaţiei legăturii. Acest lucru se realizează urmând paşii:
Analyze – Correlate – Bivariate. În cazul celor două variabile numerice studiate (varsta si venitul
lunar) se obţine următorul output:
Figura 13: Prezentarea demersului Analyze-Correlate-Bivariate
33
Interpretare: Se observă că s-a obţinut un coeficient de corelaţie Pearson egal cu 0.662, ceea ce înseamnă că între cele două variabile există o corelaţie directa, valoarea coeficientului fiind apropiata de unu.
34
VI. CONCLUZII
In urma analizei chestionarului aplicat unui esantion de 40 de clienti ai magazinului
care comercializeaza produse si servicii IT s-a constatat ca achizitionarea acestor produse este
relativ constanta, depinzand intr-o oarecare masura de venitul lunar al acestora.
De asemenea, s-a observat ca nu exista proportii semnificative intre persoanele de sex feminin
si cele de sex masculin care cumpara produse IT. Cu toate acestea, femeile sunt cele care cumpara
mai mult: in proportie de 52,5% fata de barbati, care cumpara in proportie de 47,5%..
De asemenea s-a observat ca 37,5% sunt elevi, 37,5% sunt cu studii universitare si 25%
postuniversitare. In concluzie, atat elevii cu varstele cuprinse intre 14-18 ani, cat si studentii cu
varsta cuprinsa intre 18-25 ani achizitioneaza in decursul unei luni un numar egal de produse IT.
Indivizii cu studii postuniversitare achizitioneaza aceste produse in proportie de doar 25%.
35
BIBLIOGRAFIE
1. Jaba Elisabeta, Grama Ana - Analiza statistica cu SPSS sub Windows, Editura Polirom,
Iasi 2004
2. Jaba Elisabeta – Statistica , editia a treia, Editura Economica, Bucuresti 2002
ANEXA 1
36
1. Care este varsta dumneavoastra?
14 - 18 25 - 30 18 - 25 > 30
2. Sexul persoanei:
M F
3. Nivelul de studii:
liceal universitar postuniversitar
4. De ce venit lunar dispuneti?
< 300 RON 301 – 700 RON > 700 RON
5. Ce venit acordati in medie in decursul unei luni pentru achizitionarea de produse si/ sau servicii IT?
< 50 RON 50 – 100 RON 100 – 200 RON 200 – 500 RON > 500 RON
ANEXA 2
Rezultatele chestionarului
Nr. Crt.
Nivel de studii Sex Categorie Varsta
Venit lunar Valoare medie lunara cumparaturi produse/ servicii IT
1 elev f 14-18 < 300 < 50
37
2 universitare f 18-25 300 - 700 < 503 universitare m 18-25 300 - 700 50 - 1004 elev m 18-25 < 300 50 - 1005 postuniversitare f 25-30 > 700 < 506 elev m 14-18 300 - 700 200 - 5007 elev m 14-18 < 300 50 - 1008 postuniversitare m >30 300 - 700 < 509 postuniversitare f 25-30 > 700 100 - 20010 elev m 14-18 < 300 < 5011 universitare f >30 < 300 < 5012 universitare f 25-30 300 - 700 < 5013 universitare m 18-25 300 - 700 50 - 10014 universitare f 18-25 < 300 < 5015 elev m 14-18 < 300 50 - 10016 elev f 14-18 < 300 < 50 17 elev m 18-25 300 - 700 100 - 20018 universitare f >30 >700 < 5019 elev m 14-18 <300 50 - 10020 postuniversitare m 25-30 > 700 200 - 50021 universitare f 18-25 > 700 100 - 20022 postuniversitare m 25-30 >700 >50023 postuniversitare f 18-25 300 - 700 < 5024 postuniversitare f >30 > 700 200 - 50025 elev m 14-18 < 300 50 - 10026 elev f 18-25 300 - 700 < 5027 universitare m 25-30 > 700 > 50028 universitare m 18-25 300 - 700 50 - 10029 universitare f 18-25 300 - 700 100 - 20030 elev f 18-25 300 - 700 < 5031 postuniversitare f >30 > 700 > 50032 universitare f 18-25 > 700 100 - 20033 elev m 14-18 < 300 < 5034 universitare m 18-25 300 - 700 200 - 50035 universitare f 25-30 >700 < 5036 postuniversitare f 18-25 300 - 700 100 - 20037 elev m 14-18 < 300 <5038 elev m 14-18 < 300 50 - 10039 postuniversitare f 18-25 300 - 700 100 – 20040 universitare f 18-25 > 700 > 500
38
Explicatii tabel
Nr. Crt. Interval varsta Data corespondenta1 14- 18 12 19-25 23 26-30 34 > 30 4
Nr. Crt. Suma acordata lunar pentru achizitionare produse / servicii IT
Data corespondenta
1 < 50 12 51 – 100 23 101 – 200 34 201 – 500 45 > 500 5
Nr. Crt. Venit lunar Data corespondenta1 < 300 12 301 – 700 23 > 700 3
Nr. Crt. Nivel studii Data corespondenta1 Elev 12 Universitar 23 postuniversitar 3
39