proiect

52

Upload: roxana

Post on 05-Jul-2015

1.160 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: proiect

Student:Leanca Roxana-Mirela, an 1, MC Zi

Page 2: proiect

CUPRINS

I. Introducere . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3

I.1. Definirea problemei . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3

I.2. Obiectivul proiectului . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3

II. Crearea bazei de date . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4

II.1. Identificarea variabilelor . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4

II.2. Definirea variabilelor si introducerea datelor in SPSS . . . . . . . . . . . . . . . . . . . . . . . . . . 4

II.3. Verificarea datelor introduce (outlieri, greseli, valori lipsa) . . . . . . . . . . . . . . . . . . . . . . 7

III. Descrierea statistica a variabilelor . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11

III.1. Descrierea variabilelor categoriale . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11

III.2. Descrierea variabilelor numerice . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15

IV. Inferenta statistica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18

IV.1. Estimarea statistica prin interval de incredere a unei medii . . . . . . . . . . . . . . . . . . . . . . 18

4.1.1. Estimarea statistica prin interval de incredere a unei proportii . . . . . . . . . . . . . . . . . . . . 21

4.2. Testarea unei valori medii cu o valoare fixa . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23

4.2.1. Testarea unei proportii cu o valoare fixa . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .24

V. Analiza statistica a legaturilor dintre variabile . . . . . . . . . . . . . . . . . . . . . . . 26

V.1. Analiza variantei ( ANOVA) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26

V.2. Analiza de regresie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . 27

V.3. Analiza de corelatie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33

VI. Concluzii . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35

Bibliografie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36

Anexa 1 , Anexa 2– Chestionar, Rezultatele chestionarului

2

Page 3: proiect

I. Introducere

1.1. Definirea problemei

Compania Bit Computers S.R.L. este una dintre firmele care comercializeaza o gama larga de

produse si servicii IT: monitoare, tastaturi, unitati centrale si mouse-uri, desfasurand-si activitatea

in localitatea Botosani, Str. Balcescu Nicolae, Nr.6. Firma a luat fiinta in anul 2002 si este

inregistrata in Registrul Comertului din data de 22 Martie 2002 cu Nr. J7/84/2002, avand cifra de

afaceri de 1,866,149 lei. Numarul angajatilor acestei firme este de 5. In compania Bit Computers

este promovata o cultura organizationala puternica, avand ca valoare fundamentala orientarea catre

client. 

Produsele si serviciile acestei firme au ca piata principala de desfacere Romania, firma

ocupandu-se cu vanzarea de produse si servicii hardware/software si echipamente IT: placi de

sunet, placi video, componente, retelistica, laptopuri, notebook-uri, table, servere, dar ofera si

consultanta tehnica de specialitate si servicii IT.

Obiectivul firmei este de a mentine legatura cu companiile cu care colaboreaza – atat clienti

cat si parteneri- si sa isi integreze propriile activitati si principii de actiune cu acestia, promovandu-

le in acelasi timp imaginea si interesele, castigand in acest fel increderea si parteneriatul celor mai

prestigioase companii.

1.2. Obiectivul proiectului

In cadrul acestui proiect am realizat o analiza statistica in urma aplicarii unui chestionar

(Anexa 1) clientilor magazinului Bit Computers. Esantionul analizat vizeaza un numar de 40 de

persoane si a fost aplicat clientilor in perioada ianuarie-aprilie 2011.

Obiectivul realizarii proiectului il reprezinta verificarea existentei unei relatii intre 2 variabile

categoriale (sexul si nivelul studiilor) si verificarea existentei unei relatii intre 3 variabile

numerice (varsta , venitul lunar al individului si valoarea medie lunara acordata produselor IT).

In vederea prelucrarii datelor s-au folosit diferiti indicatori pentru verificarea bazei de date in

vederea depistarii si eliminarii erorilor, avand in vedere tipurile de variabile si gradul de asociere a

variabilelor; analizarea tipurilor de colectivitati atat individual cat si in functie de

interdependentele dintre ele, ca apoi sa fie prelucrate si analizate datele, iar in final sa fie estimati

si testati parametrii

3

Page 4: proiect

II. CREAREA BAZEI DE DATE 2.1. Identificarea variabilelor analizate

Cu ajutorul programului SPSS s-au analizat raspunsurile date de clientii magazinului.

Intrebarile din chestionar se referă la: nivelul studiilor, sexul persoanei, vârsta persoanei, venitul

lunar si valoarea medie lunara acordata cumpararii produselor/ serviciilor IT. Fiecare întrebare

reprezintă o variabilă ce a fost introdusă în programul SPSS. Răspunsurile clientilor la aceste

întrebări constituie valori ale variabilelor definite anterior.

2.2. Definirea variabilelor si introducerea datelor in SPSS

Pentru alcatuirea bazei de date s-a pregatit setul de date in asa fel incat sa permita organizarea

si efectuarea analizei. Pentru a realiza analizele propuse în obiectivul acestui proiect, am început

prin a creea baza de date. Aceasta presupune prezentarea datelor într-o formă care să permită

organizarea şi efectuare analizei lor şi constă în două etape:definirea variabilelor şi introducerea

datelor

Atributele acestor variabile sunt definite in fereastra Data Editor – Foaia VariableView:

Figura 1. Fereastra Data Editor – Foaia Variable View pentru baza de date: BIT COMPUTER.sav

Atributele variabilelor sunt introduse in fereastra Data Editor – Foaia Variable View

4

Page 5: proiect

Figura 2. Fereastra Data Editor – Foaia Data View pentru baza de date BIT COMPUTERS.sav

Prelucrarea datelor are ca obiectiv centralizarea si gruparea statistica. Prin centralizare s-a

urmarit obtinerea de indicatori totalitari la nivelul esantionului, iar prin grupare s-au obtinut siruri

de date dupa mai multe variabile de grupare.

Categoriile ordonate ale variabilelor observate si frecventele asocialte acestora au format

distributii statistice. Am obtinut in acest mod tabele de frecventa in care sunt reprezentate pentru

fiecare variabila selectata urmatoarele elemente: - valorile variabilelor

- procentele

- procentele cumulate corespunzator

Tabel 1: Distributia dupa nivelul de studii a esantionului de clienti

nivel de studii efectuate/ in curs

Frequency Percent Valid PercentCumulative

PercentValid elev 15 37.5 37.5 37.5

universitar 15 37.5 37.5 75.0

postuniversitar 10 25.0 25.0 100.0

Total 40 100.0 100.0

5

Page 6: proiect

Tabel 2: Distributia dupa varsta persoanei

varsta persoanei

Frequency Percent Valid PercentCumulative

PercentValid 14-18 ani 11 27.5 27.5 27.5

19-25 ani 17 42.5 42.5 70.0

26-30 ani 7 17.5 17.5 87.5

>30 ani 5 12.5 12.5 100.0

Total 40 100.0 100.0

Tabel 3: Distributia dupa sexul persoanei

sexul persoanei

Frequency Percent Valid PercentCumulative

PercentValid masculin 19 47.5 47.5 47.5

feminin 21 52.5 52.5 100.0

Total 40 100.0 100.0

Tabel 4: Distributia dupa venitul lunar

venitul lunar al persoanei

Frequency Percent Valid PercentCumulative

PercentValid <300 13 32.5 32.5 32.5

301-700 15 37.5 37.5 70.0

>700 12 30.0 30.0 100.0

Total 40 100.0 100.0

Tabel 5: Distributia dupa valoarea cumparaturilor lunare a produselor/serviciilor IT

valoare medie produse IT

Frequency Percent Valid PercentCumulative

PercentValid < 50 15 37.5 37.5 37.5

51-100 10 25.0 25.0 62.5

101-200 7 17.5 17.5 80.0

201-500 4 10.0 10.0 90.0

>500 4 10.0 10.0 100.0

Total 40 100.0 100.0

6

Page 7: proiect

2.3. Verificarea datelor introduse (outlieri, greseli, valori lipsa)

Inainte de a incepe procesul de inferenta statistica este necesar ca variabilele sa respecte

conditia de normalitate si apoi sa verificam daca sunt valori extreme,ca apoi sa se realizeze

eliminarea acestora.

Pentru a verifica dacă distribuţia valorilor unei variabile prezintă asimetrie accentuată, dacă

sunt outlieri sau alte anomalii se pot utiliza diagramele Boxplot care se pot obtine folosind

optiunea Boxplot a comenzii Interactive din meniul Graphs.

Outlierii se depisteaza in cazul variabilelor numerice , valorile depistandu-se urmand

demersul Analyze – Descriptive Statistics – Explore – Plots, outlierile fiind depistate implicit.

Figura 3. Selectarea opţiunii Analyze – Descriptive Statistics – Explore

Figura 3.1. Otinerea Diagramei Boxplot

7

Page 8: proiect

Figura 3.2. Crearea diagramei Boxplot

8

Page 9: proiect

În output-ul opţiunii, opţiunea Explore a comenzii Descriptive Statistics din meniul Analyze

am obţinut valorile extreme cele mai mari şi cele mai mici pentru cele două variabile numerice:

venitul lunar al persoanei si sexul persoanei.

Descriptives

sexul persoanei venitul lunar al persoanei masculin Mean 1.6842 .17189

95% Confidence Interval for Mean

Lower Bound 1.3231

Upper Bound2.0453

5% Trimmed Mean 1.6491

Median 2.0000

Variance .561

Std. Deviation .74927

Minimum 1.00

Maximum 3.00

Range 2.00

Interquartile Range 1.00

Skewness .616 .524

Kurtosis -.856 1.014

feminin Mean 2.2381 .16768

95% Confidence Interval for Mean

Lower Bound 1.8883

Upper Bound2.5879

5% Trimmed Mean 2.2646

Median 2.0000

Variance .590

Std. Deviation .76842

Minimum 1.00

Maximum 3.00

Range 2.00

Interquartile Range 1.00

Skewness -.453 .501

Kurtosis -1.095 .972

In urma utizilarii diagramelor Boxplot ( numai pentru variabilele numerice) am obtinut urmatoarele diagrame:

9

Page 10: proiect

Figura 3.3. Diagramele privind a).varsta persoanei b). valoare medie cumparaturi produse IT c). Venitul lunar al persoanei

a.

b.

varsta persoanei

4.0

3.5

3.0

2.5

2.0

1.5

1.0

valoare medie produse IT

5

4

3

2

1

c.

venitul lunar al persoanei

3.0

2.5

2.0

1.5

1.0

Interpretarea diagramelor: Asa cum se observa, in nici una dintre aceste 3 diagrame nu exista outlieri ( valori aberante).III. Descrierea statistică a variabilelor

10

Page 11: proiect

3.1.Descrierea statistica a variabilelor categoriale

Pentru variabile categoriale: proporţii, valoarea dominantă, diagrama de structură, diagrama

Pareto

Cele doua variabile categoriale ce vor fi analizate sunt ‘sexul’ si ‘nivelul studiilorefectuate/

in curs ’ magazinului BIT Computers.

In fereastra Frequencies vom lucra pe rand cu amandoua variabilele nominale; astfel, din

lista sursa selectam una dintre variabilele nominale pe care o mutam in caseta Variabile(s).

Din caseta Frequencies: Charts deschisa prin apasarea butonului de comanda Charts, optam

pentru graficul Pie si de asemenea selectam Frequencies pentru a obtine tabelele de frecvente,

dupa care prin butonul de comanda OK vom obtine in output graficul si tabelul de frecventa atat

pentru variabila „sexul”, cat si pentru variabila ‚nivelul studiilor efectuate/ in curs’.

Figura 4. – Optiunea Analyze – Frequencies

Figura 4.1. - Selectarea variabilelor si a indicatorilor

11

Page 12: proiect

In figura 4.2 si 4.3 sunt prezentate diagramele variabilelor „sexul persoanei”, respectiv

„nivelul studiilor efectuate/ in curs”.

Figura 4.2. Diagrama pie a variabilei nivelul de studii efectuate/ in curs

postuniversitar

universitar

elev

nivel de studii efectuate/ in curs

Figura 4.3. Diagrama pie a variabilei sexul persoanei

12

Page 13: proiect

feminin

masculin

sexul persoanei

Pentru variabilele chestionate se obţin rezultatele:

Tabel 4.1. Frecventa variabila sexul persoanei:

sexul persoanei

Frequency Percent Valid PercentCumulative

PercentValid masculin 19 47.5 47.5 47.5

feminin 21 52.5 52.5 100.0

Total 40 100.0 100.0

Tabel 4.2. Frecventa variabila nivelul de studii effectuate/ in curs:

nivel de studii efectuate/ in curs

Frequency Percent Valid PercentCumulative

PercentValid elev 15 37.5 37.5 37.5

universitar 15 37.5 37.5 75.0

postuniversitar 10 25.0 25.0 100.0

Total 40 100.0 100.0

Interpretare: Asadar, outputul frecventelor pentru fiecare variabila impreuna cu diagrama

corespunzatoare, ne indica procentajul categorii de consumator din cei intervievati, in functie de

studiile efectuate/ in curs si in functie de sexul persoanei. Din tabel putem observa ca 47,5% sunt

13

Page 14: proiect

consumatori de sex masculin si 52,5% sunt cei de sex feminin. De asemenea se observa din

Tabelul 4.2. ca din totalul clientilor intervievati 37,5% sunt elevi, 37,5% sunt cu studii

universitare si 25% postuniversitare.

Diagrama Pareto

postuniversitaruniversitarelev

nivel de studii efectuate/ in curs

40

30

20

10

0

Co

un

t

100%

80%

60%

40%

20%

0%

Percen

t

10

1515

3.2. Descrierea statistica a variabilelor numerice

Pentru variabile numerice: nivelul mediu (media aritmetică, modul, mediana), dispersia

(varianţa, intervalul mediu de variaţie, coeficientul de variaţie), forma distribuţiei (asimetrie,

14

Page 15: proiect

boltire), concentrare, grafice specifice (histograma, curba frecvenţelor, box-plot, curba de

concentrare)

Pentru a realiza o descriere numerica in SPSS vom folosi cele doua variabile numerice

„varsta” si „valoare medie acordata cumparaturilor produselor IT” cu ajutorul carora vom calcula

indicatorii tendintei centrale, dispersiei si formei distributiei.

In SPSS ca optiune de calcul am ales Descriptives din comanda Descriptives Statistics,

subordonata meniului Analyze la fel ca in figura 5, dupa care in fereastra de dialog Descriptives

selectam cele doua variabile numerice pentru care urmeaza sa calculam parametrii distributiei pe

care ii selectam din fereastra Descriptives: Options activata in urma apasarii pe butonul Options,

acestea fiind media, suma, abaterea medie patratica, varianta, valoarea minima si valoarea maxima

a variabilelor, precum si boltirea si asimetria.

Figura 5. Optiunea Analyze-descriptive

Figura.5.1. Selectarea optiunilor

15

Page 16: proiect

Statistics

varsta

persoaneivaloare medie

produse ITN Valid 40 40

Missing 0 0Mean 2.1500 2.3000Std. Error of Mean .15421 .21243Median 2.0000 2.0000Mode 2.00 1.00Std. Deviation .97534 1.34355Variance .951 1.805Skewness .558 .752Std. Error of Skewness .374 .374Kurtosis -.553 -.578Std. Error of Kurtosis .733 .733Range 3.00 4.00Minimum 1.00 1.00Maximum 4.00 5.00

Figura 5.2. Histograma pentru variabila varsta persoanei

16

Page 17: proiect

5.004.003.002.001.000.00

varsta persoanei

20

15

10

5

0

Fre

qu

ency

Mean = 2.15Std. Dev. = 0.97534N = 40

varsta persoanei

Figura 5.3. Histograma pentru variabila valoare medie produse IT

6.005.004.003.002.001.000.00

valoare medie produse IT

15

12

9

6

3

0

Fre

qu

ency

Mean = 2.30Std. Dev. = 1.34355N = 40

valoare medie produse IT

Interpretare: Pentru ambele variabile se citesc în tabel principalii indicatori: media, mediana, varianţa, modul, valorile minime şi valorile maxime.

IV. Inferenta statistica

17

Page 18: proiect

Estimarea este procedeul prin care se generalizează rezultatele observate pe un eşantion, la

nivelul populaţiei din care este extras, adică se află valoarea unui parametru al unei populaţii pe

baza datelor înregistrate la nivelul unui eşantion extras din aceasta.

Estimarea poate fi punctuală sau prin interval de încredere. În acest caz se va estima prin

interval de încredere.

4.1. Estimarea statistica prin interval de incredere a unei medii

În cazul mediei SPSS calculează valoarea tipică de sondaj, scorul Z corespunzător, eroarea

standard a mediei, limita inferioară şi limita superioară a intervalului de încredere. Pentru baza de

date Bit Computers.sav se va calcula media produselor IT vandute intr-o perioada de un an de zile

şi intervalul de încredere corespunzător. Pentru aceasta se parcurge demersul: meniul Analyze –

Descriptives Statistics – Explore. Se stabileşte nivelul de încredere de 95%, şi apoi de 99%.

Figura 6: Prezentarea demersului

18

Page 19: proiect

Se obtin rezultatele cu intervalul de incredere 95%:

Case Processing Summary

Cases

Valid Missing Total

N Percent N Percent N Percent

valoare medie produse IT 40 100.0% 0 .0% 40 100.0%

Descriptives

valoare medie produse IT Mean 2.3000 .21243

95% Confidence Interval for Mean

Lower Bound 1.8703

Upper Bound2.7297

5% Trimmed Mean 2.2222

Median 2.0000

Variance 1.805

Std. Deviation 1.34355

Minimum 1.00

Maximum 5.00

Range 4.00

Interquartile Range 2.00

Skewness .752 .374

Kurtosis -.578 .733

19

Page 20: proiect

Interpretare: Se poate spune cu o incredere de 95% ca valoarea medie lunara acordata de clienti

pentru achizitionarea produselor si/sau serviciilor IT este cuprins intre 1,87 si 2,72 .

Se obtin rezultatele cu intervalul de incredere de 99%:

Case Processing Summary

Cases

Valid Missing Total

N Percent N Percent N Percentvaloare medie produse IT 40 100.0% 0 .0% 40 100.0%

Descriptives

valoare medie produse IT Mean 2.3000 .21243

99% Confidence Interval for Mean

Lower Bound 1.7247

Upper Bound2.8753

5% Trimmed Mean 2.2222

Median 2.0000

Variance 1.805

Std. Deviation 1.34355

Minimum 1.00

Maximum 5.00

Range 4.00

Interquartile Range 2.00

Skewness .752 .374

Kurtosis -.578 .733

Interpretare: Se poate spune cu o încredere de 99% ca valoarea medie lunara acordata de clienti

pentru achizitionarea produselor si/sau serviciilor IT este cuprins intre 1,72 si 2,87 .

4.1.1. Estimarea statistica prin interval de incredere a unei proportii

20

Page 21: proiect

SPSS nu calculează direct intervalul de încredere pentru o proporţie. Estimarea intervalului

de încredere presupune efectuarea mai multor operaţii, şi anume:

- calculul estimaţiei proporţiei, prin demersul Analyze – Descriptive Statistics – Frequencies. După

selectarea variabilei se bifează Display frequency tables;

- se află valoarea variabilei Z pentru intervalul de încredere considerat. Pentru un nivel de

încredere de 95%, Z = 1.96; pentru un nivel de încredere de 99%, Z = 2.55;

- se calculează eroarea standard Sp = s/n, unde s= f(1 – f) este abaterea standard, iar n este volumul

eşantionului;

- se calculează limitele intervalului folosind formula f ± 1.96Sp, respectiv f ± 2.55Sp.

Urmând aceşti paşi se va estima proporţia persoanelor de sex feminin care cumpără

produse IT: Figura 7: Prezentarea demersului Analyze-Descriptive Statistics-Frequencies

Frequencies

21

Page 22: proiect

Statistics

sexul persoanei N Valid 40

Missing 0

sexul persoanei

Frequency Percent Valid PercentCumulative

PercentValid masculin 19 47.5 47.5 47.5

feminin 21 52.5 52.5 100.0

Total 40 100.0 100.0

Interpretare: Se observa ca proportia persoanelor de sex feminin este de 52,5%.

Calculul erorii: Sp: pentru f = 52,5%, înlocuind în formula prezentată mai sus se obţine

valoarea 0.006.

Calculul limitelor intervalului de încredere:

pentru z = 1.96, se obţine:

Li = f – 1.96*SP = 0.525 – 1.96*0.006 = 0.513

Ls = f + 1.96*Sp = 0.525 + 1.96*0.006 = 0.536

Interpretare: Ne putem aştepta, cu o încredere de 95%, ca procentul persoanelor de sex feminin

care cumpara produse/ servicii IT sa fie cuprins între 51.3% şi 53,6%.

pentru z = 2.55, se obţine:

Li = f – 2.55*0.006 = 0.525 – 2.55*0.006 = 0.509

Ls = f + 2.55*0.006 = 0.525 + 2.55*0.006 = 0.540

Interpretare: Ne putem aştepta, cu o încredere de 99%, ca procentul persoanelor de sex feminin

care cumpara produse/ servicii IT fie cuprins între 50.9% şi 54%.

4.2. Testarea statistica a unei valori medii cu o valoare fixa

22

Page 23: proiect

Testarea mediei cu o valoare fixa se realizeaza utilizand procedeul One-Sample T Test.

Acest lucru presupune parcurgerea demersului: Analyze – Compare Means – One-Sample T Test.

Se va analiza daca valoarea medie a produselor/ serviciilor IT cumparate de o persoana in decurs

de un an difera sau nu de 0.

Figura 8: Prezentarea demersului Analyze-Compare Means-One-Sample T Test

23

Page 24: proiect

Se obţine outputul:

One-Sample Statistics

N Mean Std. DeviationStd. Error

Meanvaloare medie produse IT 40 2.3000 1.34355 .21243

One-Sample Test

Test Value = 0

t df Sig. (2-tailed)Mean

Difference

95% Confidence Interval of the Difference

Lower Uppervaloare medie produse IT 10.827 39 .000 2.30000 1.8703 2.7297

Interpretare: Valoarea medie observată este2.30; valoarea specificată este 0; diferenţa dintre

valoarea medie observată şi valoarea ipotetică este 2.30. Având în vedere că valoarea Sig. < 0.05,

între valoarea medie observată şi valoarea ipotetică există diferenţe semnificative.

4.2.1. Testarea unei proportii cu o valoare fixa

Pentru realizarea acestui lucru se foloseste Binomial Test. Acesta este un procedeu prin

care se testeaza ipoteze cu privire la o variabila cu distributie binomiala, variabila care poate lua

doar doua valori, cum ar fi sexul persoanelor.Binomial Test este folosit pentru a compara o

proporţie cu o valoare specificată şi presupune parcurgerea demersului: Analyze – Nonparametric

Tests – Binomial. Se va verifica dacă proporţia uneia din cele două grupe de persoane definite prin

variabila „sexul persoanei”, masculin şi feminin diferă semnificativ de 0.50. În Test Variable List

se introduce variabila „sexul persoanei”.

24

Page 25: proiect

Figura 9: Prezentarea demersului Analyze-Nonparametric Tests-Binomial

Interpretare: Proporţia observată în eşantion pentru grupa 1 (feminin) este de 53%, proporţia

specificată este 50%. Valoarea Sig. asociată testului este mai mare decât 0.05; astfel se poate

concluziona cu o încredere de 95% că proporţia persoanelor de sex feminin în eşantion nu diferă

semnificativ de proporţia specificată de 50%.

25

Page 26: proiect

V. Analiza statistica a legaturilor dintre variabile

5.1. Analiza varianţei (ANOVA)

Analiza dispersională este un procedeu statistic, cunoscut sub denumirea de ANOVA, care

poate fi utilizat în analiza variaţiei unei variabile în raport cu factorii de influenţă.

Principiul de bază: variaţia totală este descompusă în suma variaţiei dintre grupe şi a

variaţiei din interiorul grupelor

Pentru o distribuţie bivariată cu variabile de natură diferită, o variabilă nominală şi una

exprimată cantitativ se poate aplica analiza variaţiei prin ANOVA. Procedeul ANOVA măsoară

impactul valorilor unor variabile nominale asupra dispersiei valorilor unei variabile cantitative.

Variabilele utilizate în cadrul analizei ANOVA sunt: valoarea medie acordata cumpararii

produselor IT (numerica) şi sexul persoanei(categoriala). În SPSS, am ales opţiunea One-Way

ANOVA din comanda Compare Means a meniului Analyze.

Figura 10: Prezentarea demersului Analyze-Compare Means- One-Way ANOVA

26

Page 27: proiect

ANOVA

valoare medie produse IT

Sum of

Squares df Mean Square F Sig.Between Groups .009 1 .009 .005 .945Within Groups 70.391 38 1.852Total 70.400 39

Cu o probabilitate de 95% ca valoarea medie a produselor IT sa depinda de sexul persoanelor care

cumpara aceste produse.

5.2. Analiza de regresie

Analiza de regresie presupune aproximarea modelului de regresie, estimarea şi testarea

parametrilor modelului de regresie. Între cele două variabile numerice se poate stabili o legătură

liniară dată prin ecuaţia de regresie liniară simplă, care are forma:

Yi = α + Βxi + εi

în care:

Y – variabila dependentă (valoarea medie cheltuita pentru produse IT)

X – variabila independentă (varsta individului)

ε – variabila aleatorie eroare sau reziduu

Aproximarea modelului de regresie se realizează prin Scatterplot (din meniul Graphs -

Interactive

Figura 11: Prezentarea demersului Graphs-Interactive-Scatterplot

27

Page 28: proiect

28

Page 29: proiect

Se obtine outputul:

Linear Regression

1.00 2.00 3.00 4.00

varsta persoanei

1.00

2.00

3.00

4.00

5.00

valo

are

med

ie p

rod

use

IT

valoare medie produse IT = 1.36 + 0.44 * varstaR-Square = 0.10

29

Page 30: proiect

Estimarea parametrilor modelului de regresie presupune parcurgerea demersului:

Analyze – Regession – Linear, prin care se deschide fereastra de dialog Linear Regession. Urmând

paşii necesari, în output se analizează Model Summary, ANOVA, Coefficients.

Figura 12: Prezentarea demersului Analyze-Regression-Linear

30

Page 31: proiect

Tabelul Model Summary prezintă valoarea coeficientului de corelaţie R, valoarea raportului de

determinaţie R2 şi eroarea standard a estimaţiei.

Model Summary

Model R R SquareAdjusted R

SquareStd. Error of the Estimate

Change Statistics

R Square Change F Change df1 df2 Sig. F Change

1 .317(a) .100 .077 1.29092 .100 4.245 1 38 .046

a Predictors: (Constant), varsta persoanei

Interpretare: Valoarea lui R este 0.317, ceea ce indică faptul că între cele două variabile există o

legătură directă. Valoarea lui R2 este 0.10, ceea ce indică faptul că 10% din variaţia variabilei Y

este explicată prin variaţia variabilei X. Aceasta este o valoare destul de mică, ceea ce înseamnă că

modelul ales nu explică foarte bine legătura dintre variabile.

Tabelul Regression ANOVA prezintă rezultatele analizei varianţei variabilei dependente sub

influenţa factorului de regresie şi a factorului reziduu. Prezintă informaţii asupra sumei pătratelor

abaterilor variabilei dependente, gradele de libertate, estimaţiile varianţelor datorate celor două

surse de variaţie, raportul F şi Sig.

ANOVA(b)

Model Sum of

Squares df Mean Square F Sig.1 Regression 7.074 1 7.074 4.245 .046(a)

Residual 63.326 38 1.666

Total 70.400 39

a Predictors: (Constant), varsta persoaneib Dependent Variable: valoare medie produse IT

31

Page 32: proiect

Interpretare: Aici ne sunt prezentate informatii despre suma patratelor abaterilor variabilei

dependente (Sum of Square), gradele de libertate (df), estimatiile datorate celor doua surse de

variatie, adica regresie si reziduu (Mean Square), statistica testului F si valoarea nivelului de

semnificatie Sig. Deoarece testul F ia o valoare mica F = 4,245, iar valoarea nivelului de

semnificatie Sig = 0.46 ,corespunzatoare statistici F este mare, rezulta ca valoarea medie cheltuita

nu depinde de varsta individului, iar relatia liniara dintre cele doua variabile nu este una

semnificativa.

Un tabel important in analiza regresiei il reprezina cel al coeficientilor. Aceasta arata cu cat se

modifica variabila „valoare medie cheltuita” in functie de modificarea variabilei varstei precum si

daca modificarea este semnificativa, prin valoarea lui Sig

Coefficients(a)

Model Unstandardized

CoefficientsStandardized Coefficients t

Sig. B Std. Error Beta1 (Constant) 1.361 .499 2.726 .010

varsta persoanei .437 .212 .317 2.060 .046

a Dependent Variable: valoare medie produse IT

Interpretare: In acest tabel avem prezentati coeficientii nestandardizati ai modelului de regresie

estimat, erorile standard ale acestora, coeficientii de regresie standardizati cu erorile standard

corespunzatoare, precum si valorile statisticii t si valorile Sig corespunzatoare.

5.3. Analiza de corelatie

32

Page 33: proiect

Analiza de corelaţie presupune măsurarea gradului de intensitate a legăturii dintre variabilele

numerice, precum şi testarea semnificaţiei legăturii. Acest lucru se realizează urmând paşii:

Analyze – Correlate – Bivariate. În cazul celor două variabile numerice studiate (varsta si venitul

lunar) se obţine următorul output:

Figura 13: Prezentarea demersului Analyze-Correlate-Bivariate

33

Page 34: proiect

Interpretare: Se observă că s-a obţinut un coeficient de corelaţie Pearson egal cu 0.662, ceea ce înseamnă că între cele două variabile există o corelaţie directa, valoarea coeficientului fiind apropiata de unu.

34

Page 35: proiect

VI. CONCLUZII

In urma analizei chestionarului aplicat unui esantion de 40 de clienti ai magazinului

care comercializeaza produse si servicii IT s-a constatat ca achizitionarea acestor produse este

relativ constanta, depinzand intr-o oarecare masura de venitul lunar al acestora.

De asemenea, s-a observat ca nu exista proportii semnificative intre persoanele de sex feminin

si cele de sex masculin care cumpara produse IT. Cu toate acestea, femeile sunt cele care cumpara

mai mult: in proportie de 52,5% fata de barbati, care cumpara in proportie de 47,5%..

De asemenea s-a observat ca 37,5% sunt elevi, 37,5% sunt cu studii universitare si 25%

postuniversitare. In concluzie, atat elevii cu varstele cuprinse intre 14-18 ani, cat si studentii cu

varsta cuprinsa intre 18-25 ani achizitioneaza in decursul unei luni un numar egal de produse IT.

Indivizii cu studii postuniversitare achizitioneaza aceste produse in proportie de doar 25%.

35

Page 36: proiect

BIBLIOGRAFIE

1. Jaba Elisabeta, Grama Ana - Analiza statistica cu SPSS sub Windows, Editura Polirom,

Iasi 2004

2. Jaba Elisabeta – Statistica , editia a treia, Editura Economica, Bucuresti 2002

ANEXA 1

36

Page 37: proiect

1. Care este varsta dumneavoastra?

14 - 18 25 - 30 18 - 25 > 30

2. Sexul persoanei:

M F

3. Nivelul de studii:

liceal universitar postuniversitar

4. De ce venit lunar dispuneti?

< 300 RON 301 – 700 RON > 700 RON

5. Ce venit acordati in medie in decursul unei luni pentru achizitionarea de produse si/ sau servicii IT?

< 50 RON 50 – 100 RON 100 – 200 RON 200 – 500 RON > 500 RON

ANEXA 2

Rezultatele chestionarului

Nr. Crt.

Nivel de studii Sex Categorie Varsta

Venit lunar Valoare medie lunara cumparaturi produse/ servicii IT

1 elev f 14-18 < 300 < 50

37

Page 38: proiect

2 universitare f 18-25 300 - 700 < 503 universitare m 18-25 300 - 700 50 - 1004 elev m 18-25 < 300 50 - 1005 postuniversitare f 25-30 > 700 < 506 elev m 14-18 300 - 700 200 - 5007 elev m 14-18 < 300 50 - 1008 postuniversitare m >30 300 - 700 < 509 postuniversitare f 25-30 > 700 100 - 20010 elev m 14-18 < 300 < 5011 universitare f >30 < 300 < 5012 universitare f 25-30 300 - 700 < 5013 universitare m 18-25 300 - 700 50 - 10014 universitare f 18-25 < 300 < 5015 elev m 14-18 < 300 50 - 10016 elev f 14-18 < 300 < 50 17 elev m 18-25 300 - 700 100 - 20018 universitare f >30 >700 < 5019 elev m 14-18 <300 50 - 10020 postuniversitare m 25-30 > 700 200 - 50021 universitare f 18-25 > 700 100 - 20022 postuniversitare m 25-30 >700 >50023 postuniversitare f 18-25 300 - 700 < 5024 postuniversitare f >30 > 700 200 - 50025 elev m 14-18 < 300 50 - 10026 elev f 18-25 300 - 700 < 5027 universitare m 25-30 > 700 > 50028 universitare m 18-25 300 - 700 50 - 10029 universitare f 18-25 300 - 700 100 - 20030 elev f 18-25 300 - 700 < 5031 postuniversitare f >30 > 700 > 50032 universitare f 18-25 > 700 100 - 20033 elev m 14-18 < 300 < 5034 universitare m 18-25 300 - 700 200 - 50035 universitare f 25-30 >700 < 5036 postuniversitare f 18-25 300 - 700 100 - 20037 elev m 14-18 < 300 <5038 elev m 14-18 < 300 50 - 10039 postuniversitare f 18-25 300 - 700 100 – 20040 universitare f 18-25 > 700 > 500

38

Page 39: proiect

Explicatii tabel

Nr. Crt. Interval varsta Data corespondenta1 14- 18 12 19-25 23 26-30 34 > 30 4

Nr. Crt. Suma acordata lunar pentru achizitionare produse / servicii IT

Data corespondenta

1 < 50 12 51 – 100 23 101 – 200 34 201 – 500 45 > 500 5

Nr. Crt. Venit lunar Data corespondenta1 < 300 12 301 – 700 23 > 700 3

Nr. Crt. Nivel studii Data corespondenta1 Elev 12 Universitar 23 postuniversitar 3

39