analiza univariata a datelor - orzanm.ase.roorzanm.ase.ro/spss/pdf/1.pdf · analiza datelor •...

24
Analiza univariata a datelor

Upload: hadien

Post on 06-Feb-2018

231 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Analiza univariata a datelor - orzanm.ase.roorzanm.ase.ro/spss/pdf/1.pdf · Analiza datelor • Surse de date : – Cercetari cantitative: • Sondaje; • Observari; – Surse secundare

Analiza univariata a datelor

Page 2: Analiza univariata a datelor - orzanm.ase.roorzanm.ase.ro/spss/pdf/1.pdf · Analiza datelor • Surse de date : – Cercetari cantitative: • Sondaje; • Observari; – Surse secundare

Chestiuni organizatorice • Nota:

– Examen final (marti, 13 mai): 70% – Proiect seminar: 30%

• Suport curs: – Cătoiu I. (coord.), Bălan C., Dăneţiu T., Orzan Gh., Popescu I., Vegheş C., Vrânceanu D. ­ "Cercetări de marketing", Ed. Uranus, 2002

• Suport semiar: – Howitt, D. si Cramer, D., “Introducere in SPSS pentru psihologie”, Ed. Polirom, 2006.

Page 3: Analiza univariata a datelor - orzanm.ase.roorzanm.ase.ro/spss/pdf/1.pdf · Analiza datelor • Surse de date : – Cercetari cantitative: • Sondaje; • Observari; – Surse secundare

Analiza datelor • Analiza datelor reprezinta un proces complex si sistematic de aplicare a tehnicilor statistico­ matematice, in scopul extragerii din colectia de date constituita a informatiilor necesare procesului decizional

Page 4: Analiza univariata a datelor - orzanm.ase.roorzanm.ase.ro/spss/pdf/1.pdf · Analiza datelor • Surse de date : – Cercetari cantitative: • Sondaje; • Observari; – Surse secundare

Analiza datelor • Surse de date:

– Cercetari cantitative: • Sondaje; • Observari;

– Surse secundare de date: • interne; • externe;

– Cercetari calitative: • focus grupuri; • clientul misterios; • interviuri in profunzime; • teste de utilitate;

Page 5: Analiza univariata a datelor - orzanm.ase.roorzanm.ase.ro/spss/pdf/1.pdf · Analiza datelor • Surse de date : – Cercetari cantitative: • Sondaje; • Observari; – Surse secundare

Clasificare tipurilor de analiza • Tipul de scala utilizata

Nominala Ordinala Interval Proportionala

Page 6: Analiza univariata a datelor - orzanm.ase.roorzanm.ase.ro/spss/pdf/1.pdf · Analiza datelor • Surse de date : – Cercetari cantitative: • Sondaje; • Observari; – Surse secundare

Clasificare tipurilor de analiza • Numarul esantioanelor cercetate

Un singur esantion Doua esantioane Mai mult de doua esantioana

Page 7: Analiza univariata a datelor - orzanm.ase.roorzanm.ase.ro/spss/pdf/1.pdf · Analiza datelor • Surse de date : – Cercetari cantitative: • Sondaje; • Observari; – Surse secundare

Clasificare tipurilor de analiza • Natura relatiei dintre esantioane

Esantioane independente Esantioane dependente

• Numarul variabilelor utilizate O singura variabila (analiza univariata) Doua variabile (analiza bivariata) Mai mult de doua variabile (analiza multivariata)

Page 8: Analiza univariata a datelor - orzanm.ase.roorzanm.ase.ro/spss/pdf/1.pdf · Analiza datelor • Surse de date : – Cercetari cantitative: • Sondaje; • Observari; – Surse secundare

Obiectivele analizei Determinarea tendintei centrale

Caracterizarea variatiei si dispersiei

Masurarea gradului de asociere

Realizarea de estimari si previziuni

Evaluarea semnificatiei diferentelor dintre variabile si grupuri de variabile

Evidentierea legaturilor cauzale

Page 9: Analiza univariata a datelor - orzanm.ase.roorzanm.ase.ro/spss/pdf/1.pdf · Analiza datelor • Surse de date : – Cercetari cantitative: • Sondaje; • Observari; – Surse secundare

Obiectivele analizei Analiza primara a datelor

Masurarea tendintei centrale Analiza variatiei Stabilirea normalitatii distributiei

Analiza diferentiala Identificarea existentei unor diferente statistice intre esantioane (grupuri) de respondenti

Analiza asociativa Identificarea existentei unor asemanari (asocieri) semnificative statistic variabile demografice si psiho­ comportamentale

Page 10: Analiza univariata a datelor - orzanm.ase.roorzanm.ase.ro/spss/pdf/1.pdf · Analiza datelor • Surse de date : – Cercetari cantitative: • Sondaje; • Observari; – Surse secundare

Obiectivele analizei

Analiza inferentiala Identificarea gradului in care valorile identificate la nivel de esantion sunt reprezentative la nivelul populatiilor investigate

Analiza predictiva Identificarea evolutiei ulterioare a fenomenelor investigate

Analiza complexa a datelor Analiza canonica, analiza discriminantului, analiza structurilor latente Modelare

Page 11: Analiza univariata a datelor - orzanm.ase.roorzanm.ase.ro/spss/pdf/1.pdf · Analiza datelor • Surse de date : – Cercetari cantitative: • Sondaje; • Observari; – Surse secundare

Masurarea tendintei centrale Grupul modal (modulul)

Grupul care cuprinde cele mai multe componente comparativ cu celelalte grupuri

Mediana Valoarea care imparte numarul de observatii in doua grupuri egale

Media aritmetica

Media geometrica

n

x x

n

i i ∑

= = 1

n n

1 i i G x x ∏

=

=

Page 12: Analiza univariata a datelor - orzanm.ase.roorzanm.ase.ro/spss/pdf/1.pdf · Analiza datelor • Surse de date : – Cercetari cantitative: • Sondaje; • Observari; – Surse secundare

Masurarea tendintei centrale

X X X X Proportionala

­ X X X Interval

­ ­ X X Ordinala

­ ­ ­ X Nominala

Media geometrica

Media aritmetica

Mediana Modulul

Indicatori ai tendintei centrale Tipuri de scale

Page 13: Analiza univariata a datelor - orzanm.ase.roorzanm.ase.ro/spss/pdf/1.pdf · Analiza datelor • Surse de date : – Cercetari cantitative: • Sondaje; • Observari; – Surse secundare

Analiza variatiei

Distributia frecventelor (absolute si relative)

Amplitudinea variatiei (X max ­X min )

Varianta

Abaterea medie patratica (standard)

Coeficientul de variatie (variatia relativa)

∑ = −

− =

n

1 i

2

i 2

1 n

) x (x σ

x

σ CV =

Page 14: Analiza univariata a datelor - orzanm.ase.roorzanm.ase.ro/spss/pdf/1.pdf · Analiza datelor • Surse de date : – Cercetari cantitative: • Sondaje; • Observari; – Surse secundare

Distributia frecventelor

Perceptia gustului pentru berea Redd’s

100,0 13,8 13,3 4 7 Cel mai placut

0,0 0,0 0,0 0 1 Cel mai neplacut

100 100 30 Total

3,3 1 9 Valori lipsa

86,2 27,6 26,7 8 6 Foarte placut

58,6 10,3 10,0 3 5 Placut 48,3 20,7 20,0 6 4 Nici/Nici

27,6 20,7 20,0 6 3 Neplacut

6,9 6,9 6,7 2 2 Foarte neplacut

Frecvente cumulate

Procent valid Frecventa (%)

Frecventa Codificare Eticheta

Page 15: Analiza univariata a datelor - orzanm.ase.roorzanm.ase.ro/spss/pdf/1.pdf · Analiza datelor • Surse de date : – Cercetari cantitative: • Sondaje; • Observari; – Surse secundare

Analiza variatiei

X X ­ ­ Abaterea standard

X X ­ ­ Varianta

X X ­ ­ Abatere medie

X X X ­ Amplitudine X X X X Frecvente

Proportionale Interval Ordinale Nominale Tipuri de scale Indicatori ai

dispersiei

Page 16: Analiza univariata a datelor - orzanm.ase.roorzanm.ase.ro/spss/pdf/1.pdf · Analiza datelor • Surse de date : – Cercetari cantitative: • Sondaje; • Observari; – Surse secundare

Distributia normala

Este constituita dintr­o familie de distributii care au reprezentari grafice asemanatoare unui clopot)

Page 17: Analiza univariata a datelor - orzanm.ase.roorzanm.ase.ro/spss/pdf/1.pdf · Analiza datelor • Surse de date : – Cercetari cantitative: • Sondaje; • Observari; – Surse secundare

Distributia normala

Este importanta pentru ca majoritatea instrumentelor statistice utilizate in analiza primara au ca premisa existenta unei distributii normale (ex.: testul Student, Mann­Whitney, ANOVA, Pearson, regresia, nivelarea exponentiala Brown, etc.).

Ipoteza distributiei normale: Pentru δ ales, 100­ δ procente dintre valorile inregistrate ale variabilei se vor afla in intervalul:

) σt x ; σt x ( δ δ + −

Page 18: Analiza univariata a datelor - orzanm.ase.roorzanm.ase.ro/spss/pdf/1.pdf · Analiza datelor • Surse de date : – Cercetari cantitative: • Sondaje; • Observari; – Surse secundare

Distributia normala

Aplatizarea: reprezinta o masura a inaltimii relative a “clopotului” definit de distributia frecventelor variabilei.

Asimetria: tendinta variatiilor valorilor observate fata de medie de a fi mai mari catre unul dintre capetele intervalului de valori.

2 3 n

1 i

2

i

n

1 i

3

i

) ) x (x (

) x (x n

2 n

1) n(n G

=

=

− ×

− −

=

3

) ) x (x (

) x (x n

K 2

n

1 i

2

i

n

1 i

4

i

− −

− =

=

=

Page 19: Analiza univariata a datelor - orzanm.ase.roorzanm.ase.ro/spss/pdf/1.pdf · Analiza datelor • Surse de date : – Cercetari cantitative: • Sondaje; • Observari; – Surse secundare

Distributia normala

Inaltimea curbei este data de formula:

Testarea normalitatii distributiei: variabile parametrice: testul Kolmogorov­Smirnov variabile ordinale: testul Shapiro­Wilk variabile nominale: testul χ 2

2

n

1 i

i

) x (x (

2 e

1 h

= =

− −

σ

Page 20: Analiza univariata a datelor - orzanm.ase.roorzanm.ase.ro/spss/pdf/1.pdf · Analiza datelor • Surse de date : – Cercetari cantitative: • Sondaje; • Observari; – Surse secundare

Testul Kolmogorov­Smirnov

Utilizat pentru estimarea normalitatii distributiei acolo unde se poate (are sens) calcula media si abaterea medie patratica.

De fapt, determina care dintre ipoteze va fi adoptata: H 0 : NU exista diferente semnificative statistic intre distributia variabilei investigate si distributia normala. H 1 : Exista diferente semnificative statistic intre distributia variabilei investigate si distributia normala.

Page 21: Analiza univariata a datelor - orzanm.ase.roorzanm.ase.ro/spss/pdf/1.pdf · Analiza datelor • Surse de date : – Cercetari cantitative: • Sondaje; • Observari; – Surse secundare

Testul Kolmogorov­Smirnov

Se calculeaza utilizand:

∑ =

< = n

1 i

) x (x n i I

n

1 (x) F

) F(x n

i;

n

i ) F(x ( K i i

n

1 i S max − − =

=

Page 22: Analiza univariata a datelor - orzanm.ase.roorzanm.ase.ro/spss/pdf/1.pdf · Analiza datelor • Surse de date : – Cercetari cantitative: • Sondaje; • Observari; – Surse secundare

Testul Kolmogorov­Smirnov

H 0 este acceptata daca:

unde:

α c n n ≤ + + ) 11 , 0 12 , 0 (

1,628 1,480 1,358 1,224 1,138 c α

0,99 0,975 0,95 0,9 0,85 α

Page 23: Analiza univariata a datelor - orzanm.ase.roorzanm.ase.ro/spss/pdf/1.pdf · Analiza datelor • Surse de date : – Cercetari cantitative: • Sondaje; • Observari; – Surse secundare

Testul Shapiro­Wilk

Utilizabil atat pentru variabile non­parametrice, cat si pentru variabile parametrice (aici insa testul Kolmogorov­Smirnov este mai puternic).

Determina daca va fi adoptata ipoteza nula sau ipoteza alternativa:

H 0 : NU exista diferente semnificative statistic intre distributia variabilei investigate si distributia normala. H 1 : Exista diferente semnificative statistic intre distributia variabilei investigate si distributia normala.

Page 24: Analiza univariata a datelor - orzanm.ase.roorzanm.ase.ro/spss/pdf/1.pdf · Analiza datelor • Surse de date : – Cercetari cantitative: • Sondaje; • Observari; – Surse secundare

Testul Shapiro­Wilk

Se calculeaza utilizand:

a i reprezina parametrii dati, obtinuti din tabele statistice pe baza medianei, numarului de valori distincte si dimensiunii esantionului investigat.

p(W)>0,05 => H 0 este acceptata

altfel => H 1 este acceptata

=

=

− =

n

1 i

2 i

2 n

1 i

i i

μ) (x

) x a (

W