statistica_proiect
DESCRIPTION
Statistica facultate proiectTRANSCRIPT
- VATRA DORNEI 2007 –
1. SCOPUL PROIECTULUI:
Ne propunem sa caracterizam esantionul extras, sa analizam din punct de vedere socio-
economic relatiile dintre variabilele de interes: sex, rasa, viata, nivel fericire. Analiza se
efectueaza asupra unui numar de 11 persoane, alese aleator, dintre persoanele unei populatii la
data 12.12.2006.
Vom urmarii daca exista legaturi semnificative intre sex si fericire.
Pentru aceasta vom utiliza software-ul statistic SPSS.
2. CONSTRUIREA BAZEI DE DATE:
a) Alegerea variabilelor:
Pentru analiza am selectat variabilele: sex, rasa, fericire, viata.
Variabila „sex” variabila nominala, modalitatile introduse sunt: 1 masculin si 2 feminin
Variabila „rasa” variabila numerica cu valori: 1 – alb, 2 – negru, 3 – altele
Variabila „fericire” variabila numerica cu valori: 1- fericit, 2 – nefericit, 3 – nu stiu
Variabila „ viata” variabila numerica cu valori: 1 – excitanta, 2 – rutina, 3 – neplacuta
Dupa definirea variabilelor se introduc datele preluate din esantionul de 11 chestionare si
s-a analizat pe tema „ Nivelul de fericire al populatiei”.
b) Datele preluate din esantionul de 11 chestionare se prezinta astfel:
Nr. Crt.
sex rasa fericire viata
1 1.00 1.00 1.00 1.00
2 2.00 1.00 2.00 1.00
3 1.00 2.00 1.00 2.00
4 9.00 1.00 9.00 2.00
5 2.00 3.00 2.00 1.00
6 2.00 2.00 2.00 3.00
7 1.00 2.00 1.00 1.00
1
8 2.00 3.00 2.00 3.00
9 2.00 2.00 2.00 2.00
10 2.00 1.00 2.00 1.00
11 1.00 1.00 9.00 1.00
3. a) sa se caracterizeze numeric structura esantionului dupa variabila nominala: nivel de
fericire (tabel 1,2,3,4)
b) sa se caracterizeze legea de distributie a populatiei observate dupa variabilele
nominale: nivelul de fericire, viata prin indicatorii: media, mediana, modulul, varianta,
asimetria, boltirea (tabelele 1,2,3,4,5,6)
c) grafic, situatia este prezentata in fig. 10,11,12,13.
Apreciem ca distributiile nu sunt simetrice, au grad de asimetrie.
2
a) ANALIZA DESCRIPTIVA A VARIABILEI „NIVEL DE FERICIRE”
Tab.1 Frequencies Statistic
N Mean Median Mode Std.
Deviationvalid mising
statistic statistic statistic Std. Error statistic statistic statistic
Nivelul
de fericire
11 0 3.0000 .9045 2.0000 2.00 3.0000
Din tabelul 1 se observa urmatoarele aspecte cu privire la variabila „nivel de fericire”:
Nivelelul de fericire mediu este de 3.0000
Valoarea mediana a variabilei „nivel de fericire” este de 2.0000
Abaterea standard este de 3.0000
Prin compararea medianei cu media se observa ca distributia variabilei „nivel de
fericire” este asimetrica.
Tab. 2 Frequencies Statistic
Variance Skewness kurtosis Range Minimum
statistic statistic Std. Error statistic Std. Error statistic statistic
Nivelul
de fericire
9.0000 1.820 .661 1.822 1.299 8.00 1.00
Analizand datele din tabelul 2 se pot observa urmatoarele aspecte cu privire la variabila
”nivel de fericire”:
Skewness (asimetria) variabilei „nivel de fericire” are o valoare de 1.820, fapt care
ne arata ca distributia este asimetrica la dreapta (skewness > 0)
Valoarea Kurtosis (boltirea) este 1.822 deci < 3, fapt ce ne arata ca distributia este
platicurtica.
3
Valoarea amplitudinii variatiei (Range) este 8.00
Tab. 3 Frequencies Statistic
Maximum Sum Percentiles
25.0000 50.0000 75.0000
statistic statistic statistic statistic statisticNivelul de
fericire
9.00 33.00 1.0000 2.0000 2.0000
Daca analizam datele din tabelul 3 putem observa urmatoarele aspecte:
Suma tuturor observatiilor este 33.00
Valoarea minima si valoarea maxima a variabilei „nivel de fericire” este 1.00
respectiv 9.00, de unde rezulta o amplitudine de 8.00
Tab. 4: Frequencies Nivelul de fericire
Frequency Percent Valid Percent Cumulative
Percent
Valid fericit
nefericit
nu stiu
Total
Total
3
6
2
11
11
27.3
54.5
18.2
100.0
100.0
27.3
54.5
18.2
100.0
27.3
81.8
100.0
Din analiza frecventelor, rezulta ca dupa variabila nominala „nivel de fericire” cei
chestionati se declara astfel: 27.3% sunt fericiti iar cei mai multi , respectiv 54.5% se considera
nefericiti. Restul de 18.2% sunt indecisi.
4
b) ANALIZA LEGII DE DISTRIBUTIE A POPULATIEI OBSERVATE DUPA
VARIABILELE NOMINALE: NIVEL DE FERICIRE SI VIATA
Estimarea parametrilor folosind SPSS
ESTIMAREA MEDIEI
Tab. 8 Independent samples test
t-test for Equality of Means
t df Sig. Mean
Difference
Std. Error
Difference
95% Confidence
Interval of the Mean
Lower Upper
Sex Equal variances assumed
- 1.488 7 .180 -2.5000 1.6797 -6.47.19 1.4719
Equal variances not assumed
-.990 2.032 .425 -2.5000 2.5265 -13.2101 8.2101
Pe baza rezultatelor din output se poate considera ca nivelul de fericire mediu a celor doua
categorii de populatie (de sex masculin si feminin) este acoperit de intervalul ( - 13.2101:
8.2101), in conditiile unui risc de 5%.
ESTIMAREA PROPORTIEI
Folosind datele din tabelul 4 observam ca cei chestionati se declara astfel: 27.3% sunt
fericiti iar cei mai multi , respectiv 54.5% se considera nefericiti. Restul de 18.2% sunt indecisi.
Calculul erorii Sp
5
Pentru f = 27.3%, n = 11 aflam:
Sp = = 0.1343
Calculul limitelor I.C. (intervalului de incredere)
Considerand un scor z = 1.96, obtinem:
Li = f - 1.96 x 0.1343 = 0.0097
Ls = f + 1.96 x 0.1343 = 0.5362
Interpretare . Putem spune cu o incredere de 95% ca procentul populatiei fericite din
totalul celor chestionati la 12.12.2006, sa fie cuprins intre 0.97% si 53,62%.
Analiza Variantei pentru variabila „viata”
Aceasta analiza se face cu ajutorul tabelului One Way Anova (tab. 9)
Tabelul 9: ONE WAY ANOVA.......Sum of
Squares
df Mean
Square
F Sig.
Viata Groups Between
.545 2 .273 .364 .706
Groups Within
6.000 8 .750
Total 6.545 10
Din acest tabel reiese ca statistica testului F este mica (0.364), cu o probabilitate asociata
Sig. (0.706) mai mare decat 0.05 – ceea ce evidentiaza ca ipoteza de egalitate a mediilor de grupe
nu se respinge, deci se poate garanta cu o probabilitate de 0.95% ca factorul de grupare „nivel de
fericire” nu are o influenta semnificativa asupra variabilei viata.
c) GRAFICELE
Graficul 10
6
Reprezinta diagrama de structura ( Pie Chart). Aceasta ne arata frecventele la nivelul
fiecarei categorii ale variabilei nominale „nivel de fericire”. Astfel observam ca majoritatea din
cei chestionati (54.5%) sunt nefericiti si doar 27.3% sunt fericiti, restul de 18.2% sunt indecisi.
Graficul 11
Ne arata frecventa persoanelor de sex masculin (4) si celor de sex feminin (6). Un raspuns
nu este valid, astfel s-a notat cu cifra 9.
Graficul 12
Ne arata frecventa celor care au considerat viata excitanta (6), a celor care au considerat
viata o rutina (3) si a celor care au considerat viata ca fiind neplacuta.
Graficul 13
Ne arata distributia celor chestionati in functie de variabila nivel de fericire
Diagrama Q –Q Plot
Cele 2 diagrame ne arata asimetria distributiilor in functie de variabila sex. Pentru ca
distributiile sa fie simetrice ar fi trebuit ca graficele sa aiba o tendinta liniara.
7
BIBLIOGRAFIE
1) ELISABETA JABA – STATISTICA, EDITURA ECONOMICA, BUCURESTI, 2002
2) ELISABETA JABA, ANA GRAMA – ANALIZA STATISTICA CU SPSS SUB
WINDOWS, EDITURA POLIROM, IASI, 2004
3) ELISABETA JABA, CARMEN PINTILESCU, F. IOSUB – STATISTICA
DESCRIPTIVA, TESTE SI PROBLEME, SEDCOM LIBRIS, IASI, 2001
8