1. 2. 3. 4. 5

28
1.Obiectivul proiectului. In prima parte a acestui proiect am lucrat asupra problemelor descriptive ale statisticii,iar in a doua parte,asupra problemelor statisticii inferential,si anume:am sistematizat si prezentat datele in tabele si grafice;am calculat indicatori ai tendintei central,ai dispersiei,ai asimetriei,boltirii si concentrarii;am estimat parametrii unei populatii;am testat ipoteze;ANOVA,anliza de regresie si corelatie,toate cu scopul obtinerii de informatii necesare fundamentarii unor decizii asupra fenomenului studiat. Precizez ca am cules datele din Anuarul Statistic al Romaniei 2008,domeniul Educatie,si anume Invatamantul prescolar pe regiuni de dezvoltare si judete,in anul 2007/2008. Am ales aceasta tema deoarece reprezinta o problema actuala din cauza insuficientei de locuri in gradinite,mamele fiind nevoite din timp sa solicite un loc,iar obtinerea lui ramanand totusi nesigura. Pentru a evita obtinerea unei medii nereprezentative pentru populatie am eliminat macroregiunea Bucuresti- Ilfov. Datele le-am prezentate in Tebelul 1. Cu scopul observarii si prelucrarii ulterioare,din colectivitatea totala am extras aleator simplu nerepetat un esantion de 20 de inregistrari pe care l- am prezentat in Tabelul 2.

Upload: valeria-cojocaru

Post on 30-Jun-2015

291 views

Category:

Documents


3 download

TRANSCRIPT

Page 1: 1. 2. 3. 4. 5

1.Obiectivul proiectului.

In prima parte a acestui proiect am lucrat asupra problemelor descriptive ale statisticii,iar in a doua parte,asupra problemelor statisticii inferential,si anume:am sistematizat si prezentat datele in tabele si grafice;am calculat indicatori ai tendintei central,ai dispersiei,ai asimetriei,boltirii si concentrarii;am estimat parametrii unei populatii;am testat ipoteze;ANOVA,anliza de regresie si corelatie,toate cu scopul obtinerii de informatii necesare fundamentarii unor decizii asupra fenomenului studiat.

Precizez ca am cules datele din Anuarul Statistic al Romaniei 2008,domeniul Educatie,si anume Invatamantul prescolar pe regiuni de dezvoltare si judete,in anul 2007/2008.Am ales aceasta tema deoarece reprezinta o problema actuala din cauza insuficientei de locuri in gradinite,mamele fiind nevoite din timp sa solicite un loc,iar obtinerea lui ramanand totusi nesigura.

Pentru a evita obtinerea unei medii nereprezentative pentru populatie am eliminat macroregiunea Bucuresti-Ilfov. Datele le-am prezentate in Tebelul 1.

Cu scopul observarii si prelucrarii ulterioare,din colectivitatea totala am extras aleator simplu nerepetat un esantion de 20 de inregistrari pe care l-am prezentat in Tabelul 2.

Ca prima variabila categoriala am ales “Regiuni de dezvoltare”,iar pe a doua am obtinut-o prin deducere,efectuand urmatorii pasi:

Am ales variabila numerica “Copii inscrisi”; Am calculat media copiilor inscrisi:

x=∑ x i

n=308417

20=154421 ;

Am recodificat “Copii inscrisi” in doua categorii : { ¿medie ;peste medie ;

Ca variabile numerice am ales “Gradinite de copii” si “Copii inscrisi”,intre ele existand o relatie directa,in sensul ca o crestere a numarului de gradinite determina o crestere a numarului de copii inscrisi.

Page 2: 1. 2. 3. 4. 5

Tabel 1.INVATAMANTUL PRESCOLAR PE REGIUNI DE DEZVOLTARE SI JUDETE,IN ANUL 2007/2008

Nr. Judetul Regiune de dezvoltare Gradinite de copii Copii inscrisi1. Bihor Nord-Vest 52 197522. Bistrita-Nasaud Nord-Vest 20 118603. Cluj Nord-Vest 59 201704. Maramures Nord-Vest 41 169555. Satu Mare Nord-Vest 25 134576. Salaj Nord-Vest 26 94717. Alba Centru 43 117438. Brasov Centru 69 158149. Covasna Centru 11 866810. Harghita Centru 40 1325411. Mures Centru 80 2176012. Sibiu Centru 50 1459413. Bacau Nord-Est 41 1392014. Botosani Nord-Est 27 1623715. Iasi Nord-Est 64 1871416. Neamt Nord-Est 10 1555017. Suceava Nord-Est 29 2528118. Vaslui Nord-Est 21 1751119. Braila Sud-Est 32 1074320. Buzau Sud-Est 25 1442721. Constanta Sud-Est 104 2072022. Galati Sud-Est 70 1730323. Tulcea Sud-Est 9 845824. Vrancea Sud-Est 19 1088425. Arges Sud-Muntenia 40 1947526. Calarasi Sud-Muntenia 28 924327. Dambovita Sud-Muntenia 20 1479628. Giurgiu Sud-Muntenia 6 716029. Ialomita Sud-Muntenia 21 849730. Prahova Sud-Muntenia 55 2134231. Teleorman Sud-Muntenia 54 1128832. Dorj Sud-VestOltenia 39 2039133. Gorj Sud-VestOltenia 7 1308134. Mehedinti Sud-VestOltenia 14 869835. Olt Sud-VestOltenia 30 1428836. Valcea Sud-VestOltenia 29 1272537. Arad Vest 31 1301438. Caras-Severin Vest 27 955739. Hunedoara Vest 40 1235240. Timis Vest 67 19699- TOTAL: - 1731 650324

Page 3: 1. 2. 3. 4. 5

2.Crearea bazei de date.

Din colectivitatea totala,cu scopul observarii ,am extras un esantion de 20 de inregistrari pe care l-am prezentat in tabelul de mai jos.

“Regiune de dezvoltatre” si “Nr.copii inscrisi categorial” reprezinta variabilele categoriale,iar “Gradinite de copii” si “Copii inscrisi” variabile numerice.

Tabel 2. INVATAMANTUL PRESCOLAR PE REGIUNI DE DEZVOLTARE SI JUDETE, IN ANUL 2007/2008

Judetul Regiune de dezvoltare

Gradinite de copii

Copii inscrisi

Nr.copii inscrisi categorial

Bihor NV 52 19752 peste medieBistrita-Nasaud NV 20 11860 sub medieCluj NV 59 20170 peste medieMaramures NV 41 16955 peste medieHarghita C 40 13254 sub medieAlba C 43 11743 sub medieSibiu C 50 14594 sub medieBacau NE 41 13920 sub medieBotosani NE 27 16237 peste medieIasi NE 64 18714 peste medieVaslui NE 21 17511 peste medieBuzau SE 25 14427 sub medieArges S 40 19475 peste medieDambovita S 20 14796 sub mediePrahova S 55 21342 peste medieTeleorman S 54 11288 sub medieOlt SV 30 14288 sub medieValcea SV 29 12725 sub medieArad V 31 13014 sub medieHunedoara V 40 12352 sub medieTOTAL: - 782 308417 -

**Datele le-am introdus in editorul de date folosind programul statistic Excell.

Page 4: 1. 2. 3. 4. 5

3.Descrierea statistica a variabilelor.

a.1) Pentru prima variabila categoriala ‘Regiune de dezvoltare’ determinam proportiile,valoarea dominanta,diagram de structura,giagrama Pareto.

Tabelul de mai jos preznta efectivul ‘n’ dupa variabila categoriala ‘regiune de dezvoltare’(col.2)

Calculam frecventele relative dupa formula:

f i =n i

∑ ni , ∑ f i=1 ,(col.3)

Introducem datele in table. Observam ca valoarea dominanta e 4.

Mai jos am reprezentat diagram de structura.

20%

15%

20%5%

20%

10%

10%

Diagrama de structura 1.

Nord-VestCentruNord-EstSud-EstSud-MunteniaSud-VestVest

Regiune de dezvoltare

Efectivulni

frecventa relativa fi

Nord-Vest 4 0.2Centru 3 0.15Nord-Est 4 0.2Sud-Est 1 0.05Sud-Muntenia 4 0.2Sud-Vest 2 0.1Vest 2 0.1TOTAL: 20 1

Page 5: 1. 2. 3. 4. 5

Pentru diagrama Pareto,urmam urmatorii pasi:a) Intr-un nou table,sortam dupa frecventa de aparitie in ordine

descrescatoare.(col.2)b) In col.4 calculam efectivul cumulat.

c) In col.3 aplicam formula: N i

∑ N i

∗100;

d) Tabelul ia forma:e)f)

g) Diagrama

Pareto am reprezentat-o mai jos:

Nord-Vest

Nord-Es

t

Sud-M

untenia

Centru

Sud-Vest Vest

Sud-Es

t02468

101214161820

0%10%20%30%40%50%60%70%80%90%100%

Diagrama Pareto 1.

Efectivul niFrecventa cumulata%

Regiune de dezvoltare

Efectivul ni

Frecventa cumulata%

Efectivul cumulate Ni

Nord-Vest 4 20% 4Nord-Est 4 40% 8Sud-Muntenia 4 60% 12Centru 3 75% 15Sud-Vest 2 85% 17Vest 2 95% 19Sud-Est 1 100% 20TOTAL: 20 - -

Page 6: 1. 2. 3. 4. 5

a.2) Pentru a doua variabila categoriala ‘nr de copii inscrisi categorial’ determinam proportiile,valoarea dominanta,diagram de structura,giagrama Pareto.

Tabelul de mai jos preznta efectivul ‘n’ dupa variabila categoriala ‘Nr de copii inscrisi,categorial’(col.2)

Calculam frecventele relative dupa formula:

f i =n i

∑ ni , ∑ f i=1 ,(col.3)

Introducem datele in tabel. Observam ca valoarea dominanta e 12.

Mai jos am reprezentat diagrama de structura:

40%

60%

Diagrama de structura 2.

peste mediesub medie

Nr de copii inscrisi categorial

Efectivul ni

Frecventa relative fi

peste medie 8 0.4sub medie 12 0.6TOTAL: 20 1

Page 7: 1. 2. 3. 4. 5

Pentru diagrama Pareto,urmam urmatorii pasi:a) Intr-un nou table,sortam dupa frecventa de aparitie in ordine

descrescatoare.(col.2)b) In col.4 calculam efectivul cumulat.c) In col.3 aplicam formula:

N i

∑ N i

∗100;

d) Tabelul ia forma:

Nr de copii inscrisi categorial

Efectivul ni

Frecventa cumulata%

Efectivul cumulate Ni

peste medie 8 40% 8sub medie 12 100% 20TOTAL: 20 - -

e) Diagrama Pareto am reprezentat-o mai jos:

Frecventa de aparitie Frecventa cumulata%13579

1113151719

0102030405060708090100

Diagrama Pareto 2.

peste mediesub medie

Page 8: 1. 2. 3. 4. 5

3.b)Pentru variabila numerica ‘nr de gradinite’ calculam nivelul mediu,dispersia,forma distributiei,concentrare si graficele specifice.

1) Pentru sistematizarea datelor,cu scopul prelucrarii,am grupat datele pe 5 intervale egale.Marimea intervalului am stabilit-o urmand urmatorii pasi:

Calculam amplitudinea de variatie:A=xmax-xmin=¿ 64-20=44

Calculam marimea intervalului:

l= Ak =

445 =8.8 ≈ 9

2) Media e valoarea ce ar purta-o fiecare unitate statistica daca distributia ar fi omogena.

Pentru calculul mediei,vom calcula mai intai xi’ dupa formula:

x1’=xi−1+x i

2=20+29

2=24.5

Calculam ¿¿) ; Calculam media dupa formula:

x=∑ x i'∗ni

∑ ni

=80520

=40.25

Interpretare: In medie fiecare judet are 40 de gradinite.

3) Modul este valoarea cea mai frecvent observata in distributie,adica valoarea ce corespunde frecventei maxime

Aflam frecventa maxima: nmax=6 ;

Citim intervalul care-I corespunde: [38;47) Determinam modul prin interpolare in interval:

Mo=x i−1+d∆1

∆1+∆2

unde: x i−1−limita inferioaraa intervalului ;

d – marimea intervalului modal: d=29-20=9 ∆1=ni−ni−1; ∆1=6−3=3 ; ∆2=ni−ni+1 ; ∆2=6−4=2 ;

Mo=38+9* 33+2=43.40

Page 9: 1. 2. 3. 4. 5

Interpretare:Numarul de gradinite cel mai frecvent intalnit este 43.

Histograma si curba frecventelor.

4) Mediana e acea valoare a caracteristicii unei serii ordonate,pana la care si peste care sunt distribuite in numar egal unitatile colectivitatii: jumatate au valori mai mici ca mediana,iar jumatate din unitati au valori mai mari.

Calculam unitatea mediana:

U Me=∑ ni+12

, pentru (n=20 )<100 ;

Calculam frecventa cumulata crescator Ni↓; Aflam prima frecventa mai mare ca U Me :

(Ni↓=14)>(U Me=10.5) Citim din tabel intervalul ce corespunde (Ni↓=14): [38;47) Calculam media prin interpolare:

Me=x i−1+dU Me−N i−1

ni

;

unde: x i−1−limita inferioaraa intervalului ;

d – marimea intervalului median:

Page 10: 1. 2. 3. 4. 5

47-38=9;

Me=38+910.5−86=41.75

Interpretare: 50 la suta din regiuni au un numar de gradinite mai mic de 41.75,cealalta jumatate au peste .

5) Quartilele sunt in numar de trei Q1,Q2,Q3 si se defines ca valori ale caracteristicii ce impart volumul colectivitatii in patru parti egale. Se determina dupa relatiile:

Q1=x i−1+dUQ1−N i−1

nQ 1; unde : UQ1=

∑ ni

4;

Q2=Me;

Q3=x i−1+dUQ3−N i−1

nQ3

; unde: UQ3=3∑ ni

4;

Obtinem: Q1=29.75; Q2=41.75; Q3=50.94;

Diagrama box-plot.

20 64

Page 11: 1. 2. 3. 4. 5

Interpretare: 25 la suta dintre judete au un nr de gradinite de pana la 29.75;jumatate din judete au pana la 41.75;75 la suta dintre judete au un numar de gradinite de pana la 50.94.

6) Mediala este un indicator de pozitie egal cu acel nivel al caracteristicii xi care imparte suma termenilor seriei in doua parti egale.

Calculam unitatea mediala:

U Ml=∑ x i∗¿ni

2=8052

=402.5¿

Aflam (Li=475)>(U Me=402.5¿ ;

Citim intervalul corespunzator : [38;47) Calculam medial prin interpolare:

Ml=x i−1+dU Me−Li−1

x i'∗ni

=38+9 402.5−223255

=44.33

Interpretare:Valoarea care imparte suma termenilor in doua parti egale este 44.33.

7) Dispersia ne arata gradul de imprastiere a valorilor individuale ale unei distributii in jurul valorii central si este datorata influientelor factorilor aleatori.

Se calculeaza ca media aritmetica a patratelor abaterilor individuale fata de media lor:

S2=∑ d i2∗ni

∑ ni

=∑ (x i'¿−x)2∗ni

∑ ni

;¿

S2=2733.7520

=136.69 ;

Interpretare: Nu se interpreteaza!

8) Intervalul mediu de variatie are urmatoarele limite :

x± s={x−sx+s

;

Page 12: 1. 2. 3. 4. 5

unde: s=√s2=√136.69=11.69

x± s={40.25−11.69=28.5640.25+11.69=51.94

Interpretare: 68.27 la suta dintre judete au in medie intre 28.56 si 51.94 de gradinite.

9) Coeficientu de variatie se calculeaza dupa formula:

γ= sx∗100 ;

γ=11.6940.25

=29.04

Interpretare: Am obtinut (γ=29.04%¿∈ [17% ;35% ] , decimedia este moderat reprezentativa.

10) Asimetria reprezinta o deviatie de la forma simetrica de distributie. Pentru aprecierea asimetriei folosim : x ,Me , Mo :

x=40.25 ;Me=41.75 ;Mo=43.40;

Avem relatia: x<Me<Mo→asimetrie la stinga; Calculam asimetria dupa formula:

As=x−Mo=40.25−43.40=−3.15

Interpretare: Deoarece x este cea mai mica,avem asimetrie negative (As<0),adica o extindere a frecventelor spre stinga.

Coeficientul Yule (Cay) masoara asimetria in functie de pozitia quartilelor(Q1,Q2,Q3). Se calculeaza dupa formula:

Cay=q2−q1q2+q1

=Q1+Q 3−2MeQ 3−Q 1 =

29.75+50.94−2∗41.7550.94−29.75

=−0.13

Interpretare: Am obtinut Cay<0,deci distributia e asimetrica la stinga. Deoarece Cay se apropie de 0.1 reiese ca distributia e moderat asimetrica.

Coeficientul empiric de asimetrie Pearson (Cas) se calculeaza dupa formula:

Page 13: 1. 2. 3. 4. 5

Cas=Ass

=−3.1511.69

=−0.27

Interpretare: Am obtinut Cas<0,deci distributia e asimetrica la stinga.

11) Boltirea se defineste prin raportatrea unei distributii empirice la distributia

normala sub aspectul variatiei variabilei de distributie x si a frecventei f i¿¿ .

Coeficientul de boltire Pearson(β2):

β2=μ4μ22=

μ4s4

;

μ4=714431.39

20=35721.57

s4=18684.16

β2=35721.5718684.16

=1.91

Interpretare: Am obtinut β2<3,deci distributia e platicurtica.

Coeficientul de boltire Fisher (Y 2) masoara excesul fata de boltire a unei distributii normale:

Y 2=β2−3=1.91−3=−1.09

Interpretare: daca β2<3 ,Y 2<0 ,atunci distributia e platicurtica.

12) Concentrarea arata aglomerarea unitatilor unei colectivitati a unei distributii in jurul unii valori a unei caracteristici de grupare.

Coeficientul de concentrare ∆ M%:

∆ M%= Ml−MeAx

=44.33−41.7565−20

=2.5845

=0.0573

Interpretare: In cazul considerat,mediana fiind egala cu 41.75,iar medial egala cu 44.33,rezulta o abatere mediana-mediala de 2.58. In comparative cu amplitudinea de variatie a carateristicii egala cu 45,∆ M%arata o concentrare slaba a numarului de gradinite pe regiuni si anume de 5.73% din marimea acesteia.

Curba de concentrare Se calculeaza pi si qi dupa formulele:

pi=¿

∑ ¿ ;. qi=Li

∑ xi∗¿ ;

Page 14: 1. 2. 3. 4. 5

Reprezentam grafic:

13) Calculele le-am prezentat in tabelul de mai jos:

xi ni xi' xi'*ni Ni↓ Li↓ (xi'-x) (x¿¿ i'−x)2∗¿¿ (x¿¿ i'−x)4∗¿¿ pi qi

[20-29) 5 24.5 122.5 5 122.5 -15.75 1240.31 307675.01 0.25 0.15[29-38) 3 33.5 100.5 8 223 -6.75 136.68 6227.82 0.4 0.28[38-47) 6 42.5 255 14 478 2.25 30.37 153.77 0.7 0.60[47-56) 4 51.5 206 18 684 11.25 506.25 64072.26 0.9 0.85[56-65) 2 60.5 121 20 805 20.25 820.12 336302.50 1 1TOTAL: 20 - 805 - - - 2733.75 714431.39 - - media

40.25 Distributia dupa numarul de gradinite a unui esantion de 20 de judete din Romania.

4.Inferenta statistica.

Page 15: 1. 2. 3. 4. 5

4.a) Estimarea prin interval de incredere a unei medii presupune aflarea limitelor de incredere ale intervalului care acopera valoarea adevarata a mediei populatiei.

Pentru un esantion (n=20)<30 ,in cazul unui sondaj aleator simplu repetat,aplicam formula:

(x± t a2;n−i

s√n

∗√ N−nN

)

t a2;n−i este valoarea statisticii t care urmeaza o distributie de probabilitate

Student cu (n-1)grade de libertate. Pentru un risc a=0.10 si (n-1)=20-1=19 obtinem: t teor=¿ t 0.05 ;19=1.729;

Calculamintervalul de incredere :

(40.25±1.72911.69√20

∗√ 40−2040)=(37.08;43.42)

Interpretare: Cu o probabilitate de 0.90 se poate considera ca numarul mediu de gradinite la nivelul populatiei din care s-a extras esantionul e acoperit de intervalul(37.08;43.42). Ne asumam un risc de 0.10 sau 10 % ca valoarea adevarata a numarului de gradinite sa fie acoperit de acest interval.

4.b) Estimarea prin interval de incredere a unei proportii. Constat ca numarul de copii inscrisi la gradinite aflat peste medie este de 8.Vreau sa estimez prin interval de incredere proportia acestei categorii,la nivelul intregii populatii N=40,considerand un risc de a=0.10.

Pentru un esantion (n=20)<30 ,in cazul unui sondaj aleator simplu repetat,aplicam formula:

(f± t a2; n−i√ f (1−f )

n∗√ N−n

N)

t a2;n−i este valoarea statisticii t care urmeaza o distributie de probabilitate

Student cu (n-1)grade de libertate. Pentru un risc a=0.10 si (n-1)=20-1=19 obtinem: t 0.05 ;19=1.729;

Calculam proportia la nivelul esantionului: f=nA

n= 820

=0.4

Calculam intervalul de incredere:

Page 16: 1. 2. 3. 4. 5

(0.4±1.729√ 0.4 (1−0.4 )20∗√ 40−2040

)=(0.27;0.53);

Interpretare: Cu o probabilitate de 0.90 se poate considera ca proportia numarului aflat peste medie,la nivelul populatiei este acoperit de intervalul (27%;53%). Ne asumam un risc de 0.10 sau 10 % ca valoarea adevarata a numarului aflat peste medie sa fie acoperit de acest interval.

4.c)Testarea unei valori medii cu valoare fixa. Dispunem de urmatorele informatii:n=20,x=40.25,s=11.69,a=0.10,μ0=43.28 ;

Ipoteze statistice: H 0 : μ=μ0; H 1: μ≠ μ0

Statistica t Student: t calc=x−μ0s /√n

=40.25−43.2811.69 /√20

=−1.16

Valoarea teoretica a statisticii test:t 0.05 ;19=1.729

Decizie:|t calc=−1.16|<(t 0.05 ;19=1.729) in acest caz se accepta ipoteza H o ;

Interpretare: In aceste conditii ,se poate garanta cu o probabilitate de 0.90 ca nu exista diferente semnificative intre numarul mediu de gradinite la nivel de esantion si nr mediu la nivel de populatie.

4.d)Testarea unei proportii cu valoare fixa.Dispunem de urmatoarele informatii: proportia numarului de copii inscrisi la gradinite aflat peste medie f=0.4; a=0.10;p0=0.33 ;

Ipoteze statistice: H 0 : p=p0 ; H 1: p≠ p0

Statistica t Student: t calc=f−p0

√ f (1− f ) /√n= 0.4−0.33

√0.4(1−0.4)/√20=0.7

Valoarea teoretica a statisticii test: t 0.05 ;19=1.729

Decizie:|t calc=0.7|<(t 0.05 ;19=1.729) in acest caz se accepta ipoteza H o

Interpretare: In aceste conditii ,se poate garanta cu o probabilitate de 0.90 ca nu exista diferente semnificative intre proportia numarul de gradinite aflat peste medie la nivel de esantion si proportia lui la nivel de populatie.

Page 17: 1. 2. 3. 4. 5

5.Analiza statistica a legaturilor dintre variabile.

a) Analiza variantei(ANOVA).

Anova consta in descompunerea variatiei totale ,inregistrate pentru variabila x,in component definite dupa sursa variatiei si compararea aestora pentru a stabili daca factorul considerat cauza(in cazul meu Regiunea) are influienta semnificativa asupra variabilei x.

Cu ajutorul programului Excell,am introdus datele intr-un tabel de forma:

Nord-Vest CentruNord-Est Sud-Est Sud

Sud-Vest Vest

52 40 41 25 40 30 3120 43 27   20 29 4059 50 64   55    41   21   54    

Demersul:Tools→Data Analysis→ANOVA:single factor→OK→in fereastra deschisa,la Imput range→selectam tabelul;bifam Lables in firs row→OK, obtinem:

Anova: Single Factor

SUMMARY

Groups Count Sum AverageVarianc

eNord-Vest 4 172 43 290

Centru 3 13344.3333

326.3333

3

Nord-Est 4 153 38.25364.916

7Sud-Est 1 25 25 #DIV/0!

Sud 4 169 42.25266.916

7Sud-Vest 2 59 29.5 0.5Vest 2 71 35.5 40.5

ANOVASource of Variation SS df MS F P-value F crit

Between Groups

594.6333 6

99.10556

0.450611

0.832126

2.915272

Within Groups2859.16

7 13219.935

9

Page 18: 1. 2. 3. 4. 5

Total 3453.8 19        

Pentru interpretarea rezultatului consideram un risc a=0.05.

Ipoteze statistice:H 0 : μ1=μ2=μ3=…=μ7

H 1: numarulmediude gradinite din cel putindouaregiuni difera .

Raportul F este:

F=SE2

SR2=

99.106219.936

=0.451

Valoarea teoretica a statisticii F o citesc din Tabela Fisher pentru un risc a=0.05 si v1=6 , v2=13 grade de libertate:

F0.05 ;6 ;13=2.915 .

Decizie:Deoarece (F calc=0.451)<(Fa;v 1 ;v 2 ;=2.915) sau (Sig.=0.832)>(a=0.05) se accepta ipoteza H 0 .

Interpretare: Se poate garanta cu o probabilitate de 0.95 ca factorul “Regiune” nu are o influienta semnificativa asupra numarului de gradinite.

b) Analiza de corelatie si asociere.

Analiza de corelatie e o metoda statistica prin care se masoara intensitatea legaturii dintre variabile.

Demersul:Tools→Data Analysis→Correlation→OK→in fereastra deschisa,la Imput range→selectam ambele variabile numerice; bifam Lables in firs row→OK, obtinem:

  Gradinite de copii Copii inscrisiGradinite de copii 1Copii inscrisi 0.427774216 1

Observam din table ca coeficientul de corelatie: r yx=0.428

Pentru interpretarea rezultatului consideram un risc a=0.05. Ipoteze statistice:

H 0 : ρ=0H 1: ρ≠0

Valoarea calculate a statisticii test t Student este:

Page 19: 1. 2. 3. 4. 5

t calc=r yx√n−2

√1−r yx2=0.428√20−2

√1−0.4282=2.008

Valoarea teoretica a statisticii t o citesc din Tabela Student pentru un risc a=0.05 si v=n−2=18 gradede libertate:

t 0.025; 18=2.101

Decizie:Deoarece (t calc=2.008)< (t 0.025; 18=2.101), se accepta ipoteza H 0 .

Interpretare: Coeficientul de corelatie nu este semnificativ diferit de zero,intre variabilele X si Y exista o legatura slaba.Se poate garanta acest rezultat cu o probabilitate de 0.95.

c) Analiza de regresie.

Analiza de regresie e o metoda statistica prin care se incearca,pe baza datelor din esantion,sa se estimeze relatia matematica dintre doua sau mai multe variabile.

Demersul:Tools→Data Analysis→Regression→OK→in fereastra deschisa,la Imput Y range→selectam variabila dependent,iar la Imput X range cea depandenta; bifam Lables ; la Confidence level 95%→

OK, obtinem:

SUMMARY OUTPUT

Regression StatisticsMultiple R 0.427774216R Square 0.18299078Adjusted R Square 0.137601379Standard Error 2914.170866Observations 20

ANOVA

  df SS MS FSignificance

F

Regression 134237715.5

5 34237716 4.031575 0.05990638Residual 18 152863053 8492392

Total 19187100768.

6      

Page 20: 1. 2. 3. 4. 5

  Coefficients Std Error t Stat P-value Lower 95%Upper 95%

Intercept 11527.8845 2045.41952 5.635951 2.4E-05 7230.61423 15825.15

Gradinite de copii 99.5643349449.5868384

4 2.007878 0.059906 -4.6138275 203.7425

Din tabel oservam ca:

Raportul de determinatie R square=0.183; Intervalul de increder pentru β0 este(7230.61 ;15825.15); Intervalul de incredere pentru β1 este (−4.61 ;203.74 ) ;

Pentru interpretarea rezultatului consideram un risc a=0.05. Ipoteze statistice:

H 0 : β0=0H 1: β0≠0

Valoarea calculata a statisticii test t Student este:

t calc=bsβ̂

=5.64 ;

Valoarea teoretica a statisticii test o citesc din Tabela Student pentru un risc de a=0.05 si v=n-2=18 grade de libertate: t 0.025; 18=¿2.101;

Decizie pentru β0:Deoarece (t calc=5.64)> (t 0.025; 18=2.101), se respinge ipoteza H 0 , se acceptaipotezaH 1 ;

Interpretare: Cu o probabilitate de 0.95 se poate garanta ca valoarea parametrului β0este acoperita de intervalul (7230.61;15825.15),precum si ca parametrul e semnificativ diferit de zero,iar intre cele doua variabile exista o legatura directa.

Bibliografie:

Page 21: 1. 2. 3. 4. 5

Anuarul Statistic al Romaniei 2008. www.insse.ro ; Jaba,Elisabeta -Statistica,Ed.a 3-a,rev-Bucuresti;

Editura economica,2002; Jaba,Elisabeta,Pintilescu,Carmen –Statistica:teste grile si

problem.Ed.a 2-a rev.-Iasi:Sedcom Libris,2007. Jaba,Elisabeta,Grama,Ana, -Analiza statistica cu SPSS sub

Windows,Ed.Polirom,Iasi,2004.