proiect statistica anul 1

43
UNIVERSITATEA “ALEXANDRU IOAN CUZA” IASI PROIECT PRACTICA IN STATISTICA Coordonatori: Conf. univ. dr. Danut Jemna Lect. univ. dr. Dana Viorica Studenta: Ciridariu Andreea-Catalina Anul I, Stiinte Economice Grupa 1315

Upload: andreea-catalina

Post on 24-Jul-2015

4.645 views

Category:

Documents


23 download

TRANSCRIPT

UNIVERSITATEA “ALEXANDRU IOAN CUZA” IASI

PROIECT

PRACTICA IN STATISTICA

Coordonatori:

Conf. univ. dr. Danut Jemna

Lect. univ. dr. Dana Viorica

Studenta:

Ciridariu Andreea-Catalina

Anul I, Stiinte Economice

Grupa 1315

IASI, 2012

Structura proiectului

1. Introducere

Se va enunta obiectivul specific al cercetarii.

2. Analiza statistica a unei serii de date inregistrate la un moment dat

2.1 Alegerea variabilelor statistice

Se vor identifica patru variabile statistice, doua variabile cantitative si doua variabile calitative.

Datele vor fi introduse in Excel.

2.2 Analiza statistica univariata a variabilelor statistice

2.2.1 Analiza statistica univariata a variabilelor cantitative

2.2.2 Analiza statistica univariata a variabilelor calitative

2.3 Analiza statistica bivariata a varibilelor statistice

2.3.1 Analiza statistica bivariata pentru doua variabile cantitative

2.3.2 Analiza statistica bivariata pentru doua variabile calitative

2.4 Estimarea prin interval de incredere a mediei

2.5 Testarea statistica

2.5.1 Testarea ipotezelor asupra unui esantion

2.5.2 Testarea ipotezelor asupra a doua esantioane independente

2.5.3 Testarea ipotezelor asupra a trei si mai multe esantioane independente

3. Analiza statistica descriptiva a unei serii de timp

3.1 Alegerea variabilei statistice

Se va alege o variabila cantitativa, pentru care se vor inregistra valorile pentru 10 perioade de timp (ani, semestre, trimestre, luni sau zile).

3.2 Analiza statistica folosind indici statistici simpli

3.2.1 Indici absoluti

3.2.2 Indici relativi

3.2.3 Indici exprimati prin valori medii

4. Concluzii

Bibliografie

1. Introducere

Statistica este, conform definitiei date de matematicianul roman Grigore Constantin Moisil (1906-1973), „mijlocul cel mai puternic de cercetare a faptelor sociale”, iar Herbert George Wells (1866-1946), un celebru scriitor englez, spunea despre aceasta: „Intr-o zi gandirea statistica va fi la fel de necesara, oricarui cetatean folositor societatii, ca si scrisul si cititul.”.

Principalul obiectiv urmarit in cadrul acestui proiect este redarea anumitor informatii din domeniul educatiei, din Anuarul statistic 2010 al Romaniei, cu scopul evidentierii legaturilor statistice intre variabile , acestea din urma reprezentand insusiri, trasaturi esentiale purtate de unitatile statistice ale unei colectivitati.

Scopul acestei lucrari este de a realiza o cercetare asupra facultatilor si studentilor din fiecare judet, dar si asupra absolventilor pe nivel de invatamant.

Rezultatul numeric al numararii, al masurarii statistice a fenomenelor si proceselor de masa sau al calculelor asupra datelor obtinute prin inregistrarea statistica poarta denumirea de indicator statistic. Dupa modul de determinare, indicatorii statistici pot fi primari sau derivati, dupa gradul de cuprindere acestia se clasifica in indicatori statistici sintetici si indicatori statistici analitici, iar dupa forma de exprimare, ei pot fi sub forma de marimi absolute, relative sau medii. Indicatorii statistici au un continut real, adica reflecta fenomene si procese concrete.

2. Analiza statistica a unei serii de date inregistrate la un moment dat

2.1 Alegerea variabilelor statistice

In sprijinul cercetarii am ales distributia judetelor Romaniei, inclusiv Municipiul Bucuresti, dupa numarul facultatilor si numarul studentilor inscrisi (cele doua variabile cantitative) si distributia absolventilor din Romania dupa sex si dupa nivelul de educatie (cele doua variabile calitative).

2.2 Analiza statistica univariata a variabilelor statistice

2.2.1 Analiza statistica univariata a variabilelor cantitative

Distributia judetelor din Romania dupa numarul de facultati, in anul universitar 2009-2010

Nr. Crt Judet Facultati1 Alba 92 Arad 253 Arges 164 Bacau 95 Bihor 256 Bistrita-

Nasaud3

7 Botosani 18 Braila 39 Brasov 23

10 Bucuresti 16511 Buzau 112 Calarasi 113 Caras-Severin 214 Cluj 5015 Constanta 2916 Covasna 217 Dambovita 1018 Dolj 2319 Galati 1920 Giurgiu 021 Gorj 722 Harghita 423 Hunedoara 524 Ialomita 225 Iasi 5126 Ilfov 127 Maramures 1128 Mehedinti 529 Mures 1630 Neamt 431 Olt 232 Prahova 533 Salaj 234 Satu Mare 635 Sibiu 2136 Suceava 10

37 Teleorman 338 Timis 4739 Tulcea 040 Valcea 541 Vaslui 042 Vrancea 1

Descriptive Statistics Mean 14,85714286Median 5Mode 1Standard Deviation 27,26524763Sample Variance 743,3937282Kurtosis 22,98669017Skewness 4,381519106Range 165Minimum 0Maximum 165Sum 624Count 42

Media

Mediile sunt marimi statistice care exprima, in mod sintetic si generalizant, ceea ce este normal, esential, tipic pentru unitatile unei colectivitati distribuite dupa o anumita caracteristica.

x=x1+x2+…+xn

n=1

n∑i=1

n

x i

In medie, aproximativ 15 facultati sunt distribuite in fiecare judet al Romaniei, conform datelor culese din Anuarul statistic 2010.

Mediana

Mediana reprezinta acea valoare a caracteristicii unei serii ordonate, crescator sau descrescator, pana la care si peste care sunt distribuite in numar egal unitatile colectivitatii observate.

U Me=¿ n2

sau UMe=n+1

2 , n<100

50% dintre judetele Romaniei au pana in 5 facultati inclusiv, iar 50% au peste 5 facultati inclusiv.

Modul

Modul reprezinta valoarea caracteristicii cea mai frecvent intalnita intr-o distributie, adica valoarea ce corespunde frecventei dominante.

Cel mai frecvent, numarul facultatilor din Romania, distribuite pe judet, este egal cu 1.

Deviatia standard (abaterea medie patratica)

Deviatia standard reprezinta media patratica a abaterilor individuale.

σ=√∑i=1

n

( xi−x ) n i

∑i=1

n

ni

=√σ 2

In medie, numarul de facultati distribuite pe judete se abate de la medie cu 27,26.

Varianta (dispersia)

Varianta reprezinta media aritmetica a patratelor valorilor abaterilor individuale fata de media lor.

σ 2=∑i=1

n

(x i−x)ni

∑i=1

n

ni

Coeficientul de boltire Pearson

Coeficientul de boltire masoara excesul fata de boltirea unei distributii normale Gauss-Laplace.

β2=μ4

μ22 =

μ4

σ4

μm=∑i=1

n

(x¿¿ i−x)m ni

∑i=1

n

ni

¿ moment centrat

Distributia judetelor dupa numarul de facultati este leptocurtica, deoarece coeficientul de boltire Pearson depaseste valoarea 3, iar astfel curba frecventelor prezinta boltire in jurul valorii medii.

Coeficientul de asimetrie Pearson

Indicatorii de asimetrie dau informatii asupra modului de repartizare a frecventelor de o parte sau alta a valorii centrale a unei serii, asimetria reprezentand deviatia de la forma simetrica de distribuitie.

β1=μ3

2

μ23

Coeficientul de asimetrie Pearson are valoare pozitiva, de unde reiese faptul ca distributia facultatilor pe judete este o distributie asimetrica.

Valoarea mediei depaseste valoarea medianei, care la randul ei este mai mare decat valoarea modului, rezultand o asimetrie la dreapta.

Amplitudinea variantei

Amplitudinea variantei reprezinta diferenta dintre valoarea maxima si valoarea minima in care se incadreaza numarul facultatilor distribuite pe judet.

Numarul minim de facultati distribuite pe judetele Romaniei este 0, in timp ce numarul maxim de facultati este de 165, iar in total, pe teritoriul tarii s-au inregistrat ca fiind 624 facultati.

Coeficientul de variatie

Coeficientul de variatie se calculeaza ca raport procentual intre abaterea medie patratica si media aritmetica.

v=σx

∙100

v=¿183,56% , de unde rezulta ca media facultatilor pe judet este nereprezentativa.

Distributia judetelor din Romania dupa numarul de studenti inscrisi, in anul universitar 2009-2010

Nr. Crt Judet Studenti inscrisi1 Alba 72592 Arad 195373 Arges 179824 Bacau 74685 Bihor 191826 Bistrita-Nasaud 16517 Botosani 2938 Braila 18309 Brasov 58976

10 Bucuresti 28572011 Buzau 22412 Calarasi 46713 Caras-Severin 341514 Cluj 6037115 Constanta 3686016 Covasna 87017 Dambovita 821418 Dolj 3566719 Galati 2011720 Giurgiu 021 Gorj 574922 Harghita 138823 Hunedoara 590724 Ialomita 31525 Iasi 5841826 Ilfov 25127 Maramures 5883

28 Mehedinti 296029 Mures 1168230 Neamt 96931 Olt 55732 Prahova 856933 Salaj 42834 Satu Mare 193935 Sibiu 2421136 Suceava 991737 Teleorman 60738 Timis 4326539 Tulcea 040 Valcea 606041 Vaslui 042 Vrancea 141

Descriptive Statistics Mean 18459,97619Median 5816Mode 0Standard Deviation 45554,65417Sample Variance 2075226516Kurtosis 30,29080983Skewness 5,20069816Range 285720Minimum 0Maximum 285720Sum 775319Count 42

Media

In medie, aproximativ 18.460 de studenti au fost inscrisi in fiecare judet al Romaniei, conform datelor culese din Anuarul statistic 2010.

Mediana

50% dintre judetele Romaniei au pana in 5.816 studenti inscrisi inclusiv, iar 50% au peste 5.816 studenti inscrisi inclusiv.

Modul

Cel mai frecvent, numarul studentilor inscrisi in Romania, distribuiti pe judet, este egal cu 0.

Deviatia standard

In medie, numarul de studenti inscrisi pe judete se abate de la medie cu aproximativ 45.554 .

Coeficientul de boltire Pearson

Distributia judetelor dupa numarul de studenti inscrisi este leptocurtica, deoarece coeficientul de boltire Pearson depaseste valoarea 3, iar astfel curba frecventelor prezinta boltire in jurul valorii medii.

Coeficientul de asimetrie Pearson

Coeficientul de asimetrie Pearson are valoare pozitiva, de unde reiese faptul ca distributia studentilor inscrisi pe judete este o distributie asimetrica.

Valoarea mediei depaseste valoarea medianei, care la randul ei este mai mare decat valoarea modului, rezultand o asimetrie la dreapta.

Numarul minim de studenti inscrisi pe judetele Romaniei este 0, in timp ce numarul maxim de studenti inscrisi este de 285.720, iar in total, pe teritoriul tarii s-au inregistrat ca fiind inscrisi 775.319 studenti in anul universitar 2009-2010.

Coeficientul de variatie

v=¿246,77% , de unde rezulta ca media studentilor inscrisi pe judet este nereprezentativa.

2.2.2 Analiza statistica univariata a variabilelor calitative

Distributia absolventilor din Romania, in anul scolar / universitar 2008-2009, dupa sex

Sex AbsolventiFeminin 381.639Masculin 357.793TOTAL 739.432

52%48%

Absolventi in anul scolar/univer-sitar 2008-2009

FemininMasculin

Distributia absolventilor din Romania, in anul scolar / universitar 2008-2009, dupa nivelul de educatie

Nivelul educatiei AbsolventiInvatamant gimnazial 204.018Invatamant liceal 202.113Invatamant profesional si de ucenici

100.901

Invatamant postliceal si de maistri 17.574Invatamant superior 214.826

.000

50000.000

100000.000

150000.000

200000.000

250000.000

Absolventi in anul scolar/universitar 2008-2009

Invatamant gimnazialInvatamant licealInvatamant profesional si de uceniciInvatamant postliceal si de maistriInvatamant superior

2.3 Analiza statistica bivariata a varibilelor statistice

2.3.1 Analiza statistica bivariata pentru doua variabile cantitative

Distributia judetelor din Romania dupa numarul de facultati si dupa numarul de studenti inscrisi, in anul universitar 2009-2010

Nr. Crt Judet Facultati Studenti inscrisi1 Alba 9 72592 Arad 25 195373 Arges 16 179824 Bacau 9 74685 Bihor 25 191826 Bistrita-Nasaud 3 16517 Botosani 1 2938 Braila 3 18309 Brasov 23 58976

10 Bucuresti 165 28572011 Buzau 1 22412 Calarasi 1 46713 Caras-Severin 2 341514 Cluj 50 6037115 Constanta 29 3686016 Covasna 2 87017 Dambovita 10 821418 Dolj 23 3566719 Galati 19 2011720 Giurgiu 0 021 Gorj 7 574922 Harghita 4 138823 Hunedoara 5 590724 Ialomita 2 31525 Iasi 51 5841826 Ilfov 1 25127 Maramures 11 588328 Mehedinti 5 296029 Mures 16 1168230 Neamt 4 96931 Olt 2 55732 Prahova 5 856933 Salaj 2 42834 Satu Mare 6 193935 Sibiu 21 2421136 Suceava 10 991737 Teleorman 3 60738 Timis 47 4326539 Tulcea 0 040 Valcea 5 606041 Vaslui 0 042 Vrancea 1 141

Coeficientul de corelatie Pearson

r yx=

cov (x , y )sx sy

=∑i=1

n

( x i−x ) ( y i− y )

ns xs y

sx2−¿ dispersia

-1 < r < 1

0 20 40 60 80 100 120 140 160 1800

50000

100000

150000

200000

250000

300000

350000

Legatura dintre numarul de facultati si numarul de studenti inscrisi, pe judete, in anul universitar 2009-

2010

Coeficientul de corelatie Pearson este egal cu 0,978 , de unde rezulta ca exista o legatura directa intre x (numarul de facultati) si y (numarul studentilor inscrisi), deoarece r>0, iar pentru ca r>0,7 si tinde spre 1, x are o influenta pozitiva asupra lui y, existand o corelatie intre cele doua variabile cantitative.

2.3.2 Analiza statistica bivariata pentru doua variabile calitative

Distributia absolventilor din Romania, in anul scolar / universitar 2008-2009, dupa sex si dupa nivelul de educatie

Sex Invatamant gimnazial

Invatamant liceal

Invatamant profesional si de

ucenici

Invatamant postliceal si de

maistri

Invatamant superior

Feminin 100346 103574 38303 11406 128010Masculin 103672 98539 62598 6168 86816TOTAL 204018 202113 100901 17574 214826

Invatamant gimnazial

Invatamant liceal

Invatamant profesional si de ucenici

Invatamant postliceal si de maistri

Invatamant superior

0

50000

100000

150000

200000

250000

Absolventi in anul scolar/universitar 2008-2009

MasculinFeminin

2.4 Estimarea prin interval de incredere a mediei

Inferenta statistica permite trecerea de la o valoare statistica calculate pe baza datelor dintr-un esantion, la valoarea adevarata necunoscuta.

Esantionul este un subansamblu de unitati extrase dintr-o colectivitate pe care dorim sa o cunoastem, observarea fiind partial in cazul cand volumul esantionului este mai mic decat volumul colectivitatii totale, aceasta din urma purtand numele si de populatie mama.

Estimarea reprezinta procedeul prin care se afla valoarea unui paramtru al populatiei, pe baza datelor inregistrate la nivelul unui esantion extras din aceasta.

Estimatorul este statistica utilizata pentru a estima un parametru al populatiei.

Estimatia este valoarea unui estimator al unui parametru, si este calculate pe baza a n observatii obtinute la nivelul esantionului, purtand si numele de valoare tipica de sondaj.

Estimarea prin interval de incredere inseamna aflarea limitelor de incredere ale unui interval care acopera valoarea adevarata a unui parametru al populatiei, tinand seama de fluctuatiile distributiei de selectie a estimatorului parametrului considerat.

O reprezentativitate satisfacatoare a esantionului pentru populatie presupune asumarea unui risc de cel mult ± 5 %.

Din totalul judetelor Romaniei se extrage un esantion de volum mic n=21 de judete, care au fost observate dupa numarul de facultati. Folosind procedeul esantionarii aleatoare mecanice cu pas de

numarare, rezulta fractia de selectie Nn

=¿ 4221

=¿ 2, pasul de numarare putand lua valoarea 1 sau 2.

In continuare, alegem pasul de numarare egal cu 1, de unde va rezulta urmatorul tabel:

Nr. Crt Judet Facultati1 Alba 92 Arges 163 Bihor 254 Botosani 15 Brasov 23

6 Buzau 17 Caras-Severin 28 Constanta 299 Dambovita 10

10 Galati 1911 Gorj 712 Hunedoara 513 Iasi 5114 Maramures 1115 Mures 1616 Olt 217 Salaj 218 Sibiu 2119 Teleorman 320 Tulcea 021 Vaslui 0

La nivelul esantionului s-au obtinut ∑ x i=¿ 253, x=12,04 , s2=¿163. Se cere sa se estimeze prin

interval de incredere numarul mediu de facultati la nivelul tuturor judetelor din Romania, pentru un risc asumat α=¿ 5%.

Cand varianta la nivelul populatiei nu este cunoscuta, folosim statistica Student (t) in scopul determinarii intervalului de incredere al mediei, t fiind recomandat si in cazul esantioanelor de volum mic (n<30).

t= μ̂−μσ̂ '

√n

t (n−1)

t= x−μs '

√n

IC=[x ± t α2

,n−1∙

s '

√n ]Cu o incredere de 95%, se poate afirma ca numarul mediu de facultati la nivelul tuturor judetelor Romaniei este acoperit de intervalul [ 6,25 ;17,83 ].

2.5 Testarea statistica

2.5.1 Testarea ipotezelor asupra unui esantion

Ne propunem sa aflam, la nivelul aceluiasi esantion , daca numarul mediu de facultati este egal cu valoarea numarului mediu de facultati din totalul judetelor Romaniei, si daca ponderea numarului de facultati mai mare decat media acestora este egala cu ponderea numarului de facultati mai mare decat media la nivelul tuturor judetelor.

a) Testarea mediei

Pentru aceleasi date de la problema estimarii prin interval de incredere a mediei, se cere sa se verifice daca exista diferente semnificative intre numarul mediu de facultati la nivelul esantionului si numarul mediu de facultati la nivelul intregii tarii, egal cu 14,85.

Etapele testarii:

1) Formularea ipotezelor

H 0: μ=μ0 presupune ca nu exista diferente intre cele doua populatii (partiala si totala)

H 1: μ≠ μ0

μ0=14,85

2) Alegerea statisticii test

Deoarece n=21(¿30)volumul esantionului, vom alege statistica t.

t=x−μ0

s '√n

3) Alegerea unui prag de semnificatie αpentru test

Alegem α=5% .

4) Stabilirea regulilor de decizie

|t calc|> tα /2 :se respinge H 0

|t calc|< tα /2 :se accepta H 0

5) Calcularea valorii statisticii test

t calc=−1,01

6) Aflarea valorii teoretice a statisticii test

t α2

,n−1=2,086

7) Comparare, decizie si interpretare

|t calc|< tα /2 ,de unde rezulta decizia de acceptare a ipotezei nule.

Cu o incredere de 95%, se poate afirma ca nu exista diferente semnificative intre numarul mediu de facultati la nivelul esantionului si numarul mediu de facultati la nivelul intregii tari.

b) Testarea proportiei

La nivelul esantionului, se observa ca proportia judetelor cu un numar de facultati mai mare decat media aritmetica este de 38,09%. Pentru un risc asumat de 5%, se cere sa se testeze daca exista diferente semnificative intre ponderea numarului de facultati mai mare decat media acestora si ponderea numarului de facultati mai mare decat media la nivelul tuturor judetelor, de 30,95%.

Etapele testarii:

1) Formularea ipotezelor

H 0: π=π0 presupune ca nu exista diferente intre cele doua populatii (partiala si totala)

H 1: π ≠ π0

π0=0,31

2) Alegerea statisticii test

Deoarece n=21(¿30)volumul esantionului, vom alege statistica t.

t=w−π0

√w (1−w)n

3) Alegerea unui prag de semnificatie αpentru test

Alegem α=5% .

4) Stabilirea regulilor de decizie

|t calc|> tα /2 :se respinge H 0

|t calc|< tα /2 :se accepta H 0

5) Calcularea valorii statisticii test

t calc=0,33

6) Aflarea valorii teoretice a statisticii test

t α2

,n−1=2,086

7) Comparare, decizie si interpretare

|t calc|< tα /2 ,de unde rezulta decizia de acceptare a ipotezei nule.

Cu o incredere de 95%, se poate afirma ca nu exista diferente semnificative intre ponderea numarului de facultati mai mare decat media acestora si ponderea numarului de facultati mai mare decat media la nivelul tuturor judetelor Romaniei.

2.5.2 Testarea ipotezelor asupra a doua esantioane independente

Ne propunem sa aflam, la nivelul celor doua esantioane de volum egal, rezultate in urma folosirii procedeului esantionarii aleatoare mecanice cu pas de numarare, daca exista dieferente semnificative intre numarul mediu de facultati din primul esantion de judete si valoarea numarului mediu de facultati din cel de-al doilea esantion de judete, pe teritoriul Romaniei.

Nr. Crt Judet Facultati Nr. Crt Judet Facultati1 Alba 9 1 Arad 252 Arges 16 2 Bacau 9

3 Bihor 25 3 Bistrita-Nasaud

3

4 Botosani 1 4 Braila 35 Brasov 23 5 Bucuresti 1656 Buzau 1 6 Calarasi 17 Caras-Severin 2 7 Cluj 508 Constanta 29 8 Covasna 29 Dambovita 10 9 Dolj 23

10 Galati 19 10 Giurgiu 011 Gorj 7 11 Harghita 412 Hunedoara 5 12 Ialomita 213 Iasi 51 13 Ilfov 114 Maramures 11 14 Mehedinti 515 Mures 16 15 Neamt 416 Olt 2 16 Prahova 517 Salaj 2 17 Satu Mare 618 Sibiu 21 18 Suceava 1019 Teleorman 3 19 Timis 4720 Tulcea 0 20 Valcea 521 Vaslui 0 21 Vrancea 1

Se cunosc n1=n2=n=21 , x1=12,04 , x2=17,66 , s '12=163, s '2

2=1344,33 ,iar σ 12≠ σ2

2 .

Etapele testarii:

1) Formularea ipotezelor

H 0: μ1=μ2 presupune ca nu exista diferente intre cele doua populatii

H 1: μ1 ≠ μ2

2) Alegerea statisticii test

Deoarece n=21(¿30)volumul esantionului, vom alege statistica t.

t=x1−x2

√ s '12

n1

+s '2

2

n2

3) Alegerea unui prag de semnificatie αpentru test

Alegem α=5% .

4) Stabilirea regulilor de decizie

|t calc|> tα /2 :se respinge H 0

|t calc|< tα /2 :se accepta H 0

5) Calcularea valorii statisticii test

t calc=0,66

6) Aflarea valorii teoretice a statisticii test

t α2

,n−1=2,086

7) Comparare, decizie si interpretare

|t calc|< tα /2 ,de unde rezulta decizia de acceptare a ipotezei nule.

Cu o incredere de 95%, se poate afirma ca nu exista diferente semnificative intre mediile facultatilor celor doua esantioane de judete, la nivelul Romaniei.

2.5.3 Testarea ipotezelor asupra a trei si mai multe esantioane independente

Analiza dispersionala ANOVA consta in descompunerea variatiei totale a unui ansamblu de date, inregistrate pentru o variabila x, in componente definite dupa sursa variatiei si compararea acestora pentru a stabili daca factorii considerati cauza au influenta semnificativa asupra variabilei x.

Pentru un esantion de 42 de judete din totalul judetelor Romaniei, observate dupa regiuni si dupa numarul de facultati, s-au inregistrat datele de mai jos. Pentru un risc asumat de 5%, sa se testeze daca numarul de facultati este influentat de regiune.

Nr. Crt Regiune Facultati pe judete

1 Nord-Vest 25 3 50 11 6 22 Centru 9 23 2 4 16 213 Nord-Est 9 1 51 4 10 04 Sud-Est 3 1 29 19 0 15 Sud (Muntenia) 16 1 10 0 2 5 36 Bucuresti-Ilfov 1 1657 Sud-Vest (Oltenia) 23 7 5 2 58 Vest 25 2 5 47

Nr. Crt Regiune Count Sum Average Variance

1 Nord-Vest 6 97 16,16667 345,36672 Centru 6 75 12,5 77,93 Nord-Est 6 75 12,5 372,34 Sud-Est 6 53 8,833333 148,96675 Sud (Muntenia) 7 37 5,285714 33,23816 Bucuresti-Ilfov 2 166 83 134487 Sud-Vest (Oltenia) 5 42 8,4 69,88 Vest 4 79 19,75 434,25

Source of Variation

SS df MS F P-value F crit

Between Groups 10527,09762 7 1503,87109

2,562726

0,031129

2,293832

Within Groups 19952,04524 34 586,82486 Total 30479,14286 41

Etapele testarii:

1) Formularea ipotezelor

H 0: μ1=μ2=…=μ8 presupune ca nu exista diferente intre cele 8 populatii

H 1: μi ≠ μ j ,∀ i≠ j , i , j=1 ,8

2) Alegerea statisticii test

Pentru verificarea ipotezei nule, in ANOVA se foloseste statistica test F (raportul Fisher), calculat ca raport intre doi estimatori ai variantei:

F=SE

2

SR2 F (k−1 , n−k )

ϑ1=k−1 , ϑ2=n−k grade de libertate

SE2 −¿estimatorul variantei intergrupe

SR2 −¿estimatorul variantei intragrupe

k−¿numarul de grupe

n−¿volumul esantionului

SE2 =

V E

k−1

V E=∑j=1

k

(x j−x )2n j

V E−¿variatia intergrupe (masoara variatia mediilor grupelor fata de media lor) – componenta efect

SR2 =

V R

n−1

V R=∑i=1

n j

∑j=1

k

(x ij−x j)2

V R−¿variatia intragrupe (masoara variatia in interiorul fiecarei grupe) – componenta eroare

V T=V E+V R

V T=∑i=1

n

( xi−x)2

V T−¿variatia totala

ST2 =

V T

n−1

ST2 −¿estimatorul variantei totale

3) Alegerea unui prag de semnificatie αpentru test

Alegem α=5% .

4) Stabilirea regulilor de decizie

F calc>Fα :se respinge H 0

F calc<Fα :se accepta H 0

5) Calcularea valorii statisticii test

F calc=2,56

6) Aflarea valorii teoretice a statisticii test

Fα ,k−1 ,n−k=2,29

7) Comparare, decizie si interpretare

F calc>Fα ,de unde rezulta decizia de respingere a ipotezei nule.

Cu o incredere de 95%, se poate afirma ca regiunea influenteaza numarul de facultati, pe teritoriul Romaniei. Din tabel, se observa ca P-value =0,03 este mai mic decat α=0,05 , rezultand, de asemenea, decizia de respingere a ipotezei nule.

3. Analiza statistica descriptiva a unei serii de timp

3.1 Alegerea variabilei statistice

Studierea seriilor cronologice presupune caracterizarea variatiei in timp a unui fenomen, prin masurarea cresterilor sau descresterilor de nivel si a modificarilor de structura si prin determinarea influentei factorilor sub incidenta carora are loc evolutia fenomenelor.

O metoda specifica pentru observarea si analiza seriilor cronologice este cea a indicatorilor statistici ai dinamicii, in marimi absolute, relative si medii, folosita si in cadrul acestui proiect, in scopul redarii nivelului si a modificarii de nivel in timp a unui fenomen.

Din Anuarul statistic 2010 al Romaniei, au fost extrase date cu privire la numarul de licee pe profiluri, pe o perioada de 10 ani scolari.

Seriile de timp de intervale descriu nivelul unui fenomen in diferite interval de timp, cum este si cazul distributiei liceelor la nivelul tarii, pe o perioada de 10 ani scolari.

Distributia liceelor din Romania, in perioada 2000-2010

An scolar Numar de licee

2000-2001 14062001-2002 14182002-2003 14272003-2004 14362004-2005 14522005-2006 14492006-2007 14602007-2008 14662008-2009 14862009-2010 1677

Distributia liceelor pe profiluri, pe teritoriul Romaniei, in perioada 2000-2010

Tipuri de licee 2000/2001

2001/2002

2002/2003

2003/2004

2004/2005

2005/2006

2006/2007

2007/2008

2008/2009

2009/2010

Licee si colegii teoretice

530 529 529 548 555 554 557 558 560 554

Licee industriale

434 437 450 451 456 455 469 483 487 605

Licee agricole 100 92 74 61 49 44 35 23 22 53Licee silvice 14 21 20 19 17 17 15 12 10 10

Licee agromontane

4 5 6 5 4 3 3 3 3 4

Licee veterinare

6 11 17 18 17 17 14 15 18 20

Licee economice,

administrative si de servicii

78 85 94 102 117 125 130 136 150 171

Licee de informatica

15 15 15 15 15 15 15 15 15 15

Licee de metrologie

1 1 1 1 1 1 1 1 1 1

Scoli normale 39 39 37 33 31 30 30 28 27 25Licee de arta 44 44 44 43 45 45 45 45 45 45

Licee cu program de

educatie fizica

31 30 31 30 32 32 33 34 34 33

Licee militare 5 5 5 5 4 4 4 4 4 3Seminarii teologice

73 73 72 72 74 73 74 73 73 74

Licee speciale 9 8 9 10 12 11 12 13 14 41Licee sanitare 23 23 23 23 23 23 23 23 23 23

TOTAL 1406 1418 1427 1436 1452 1449 1460 1466 1486 1677

2000-2001

2001-2002

2002-2003

2003-2004

2004-2005

2005-2006

2006-2007

2007-2008

2008-2009

2009-2010

1250

1300

1350

1400

1450

1500

1550

1600

1650

1700

Evolutia numarului de licee de pe teritorul Romaniei, pe o perioada de 10 ani scolari

2000-2001

2001-2002

2002-2003

2003-2004

2004-2005

2005-2006

2006-2007

2007-2008

2008-2009

2009-2010

1250

1300

1350

1400

1450

1500

1550

1600

1650

1700

Evolutia numarului de licee de pe teritorul Romaniei, pe o perioada de 10 ani scolari

3.2 Analiza statistica folosind indici statistici simpli

Indicele reprezinta un indicator obtinut ca raport intre nivelul fenomenului la un moment dat si nivelul aceluiasi fenomen pentru o alta perioada.

3.2.1 Indici absoluti

Indicatorii absoluti exprima in unitati concrete de masura, nivelul sau modificarile de nivel ale unui fenomen privit in evolutia sa in timp.

Nivelul absolut

Nivelul absolut reprezinta valoarea y i a fiecarui termen al seriei cronologice.

Nivelul absolut1406141814271436145214491460146614861677

Volumul absolut

In cazul seriilor de timp de intervale, volumul absolut se obtine prin insumarea nivelurilor absolute.

y=∑i=1

n

y i=∑i=1

n

y1+ y2+… yn

y=¿ 14.677

Sporul absolut

Modificarea absoluta (cresterea sau descresterea absoluta) arata cu cat s-a modificat un fenomen intr-o perioada, fata de o alta perioada considerata baza de comparare.

Sporul cu baza fixa se calculeaza ca diferenta intre oricare termen al seriei si termenul initial.

∆ t /0y = y t− y0

Sporul absolut cu baza fixa0

1221304643546080

271

Din tabel reiese faptul ca, fata de anul scolar 2000-2001, luat ca baza comparabila, in toti ceilalti s-a inregistrat o crestere a numarului de licee la nivelul Romaniei.

Sporul cu baza mobila se calculeaza ca diferenta intre doi termeni consecutivi.

∆ t /t−1y = y t− y t−1

Sporul absolut cu baza in lant-

1299

16-311

620

191

Din tabel se observa ca exista un singur spor negativ, calculat pentru perioada anilor scolari 2004-2005, 2005-2006. De aici rezulta ca numarul de licee de pe teriroriul tarii a fost intr-o continua crestere, dar de la anul scolar 2004-2005 la anul scolar 2005-2006 s-a inregistrat o scadere a acestora, egala cu 3. Tot din tabel reiese faptul ca cea mai mare crestere inregistrata la nivelul tarii, a fost in perioada anilor scolari 2008-2009 si 2009-2010, cu un numar de 191 de licee.

3.2.2 Indici relativi

Indicatorii relativi se obtin prin raportarea a doua nivele comparate si se exprima sub forma de coeficient sau procente.

Ritmul de variatie

Indicele de variatie arata de cate ori a crescut sau a scazut nivelul unui fenomen intr-o anumita perioada, fata de nivelul aceluiasi fenomen dintr-o alta perioada considerata ca baza.

Ritmul variatiei cu baza fixa :

it /0y =

y t

y 0

sauit /0y =

y t

y0

∙100

Ritmul variatiei cu baza fixa1

1,0085351,0149361,0213371,0327171,0305831,0384071,0426741,0568991,192745

In toti anii scolari, fata de cel luat ca baza comparabila 2000-2001, s-a inregistrat o crestere a numarului de licee pe teritoriul Romaniei, cea mai mare crestere fiind in anul scolar 2009-2010.

Ritmul variatiei cu baza mobila :

it /t−1y =

y t

y t−1

sauit /t−1y =

y t

y t−1

∙100

Ritmul variatiei cu baza mobila-

1,0085351,0063471,0063071,0111420,9979341,007591

1,004111,0136431,128533

Singura valoare mai mica decat 1 corespunde perioadei dintre anii scolari 2004-2005 si 2005-2006, ceea ce inseamna ca atunci s-a inregistrat o scadere a numarului de licee la nivelul tarii.

Ritmul sporului

Rata de crestere arata cu cat s-a modificat, in marime relativa, nivelul fenomenului in perioada raportata fata de nivelul din perioada de raportare.

Ritmul sporului cu baza fixa :

rt /0y =

∆ t /0y

y0

=y t− y0

y0

=y t

y0

−1=it /0y −1

rt /0y =

∆ t /0y

y0

∙100=y t− y0

y0

∙100=y t

y0

∙100−100=it /0y −100

Ritmul sporului cu baza fixa0

0,0085350,0149360,0213370,0327170,0305830,0384070,0426740,0568990,192745

Fata de anul scolar 2000-2001 luat ca baza de comparare, anul scolar 2009-2010 inregistreaza cea mai mare rata de crestere a numarului de licee la nivelul Romaniei, de 19,27%.

Ritmul sporului cu baza mobila :

rt / t−1y =

∆ t /t−1y

y t−1

=y t− y t−1

y t−1

=y t

y t−1

−1=it / t−1y −1

rt / t−1y =

∆ t /t−1y

y t−1

∙100=y t− y t−1

y t−1

∙100=y t

y t−1

∙100−100=it /t−1y −100

Ritmul sporului cu baza mobila-

0,0085350,0063470,0063070,011142-0,002070,007591

0,004110,0136430,128533

Fata de anul scolar 2004-2005, in anul scolar 2005-2006 se inregistreaza o scadere a numarului de licee din Romania, cu 0,207%. Cea mai mare rata de crestere a liceelor la nivelul tarii s-a inregistrat intre anii scolari 2008-2009 si 2009-2010, de 12,85%.

3.2.3 Indici exprimati prin valori medii

Nivelul mediu

In cazul seriilor de timp de intervale, nivelul mediu este calculat ca medie aritmetica a termenilor seriei.

y=∑i=1

n

y i

n

y=¿1467,7

La nivelul tarii, pe o perioada de 10 ani scolari, nivelul mediu de licee inregistrat este de aproximativ 1.468 .

Sporul mediu

Sporul mediu reflecta modificarea medie pe unitate de timp inregistrata de un fenomen, intr-o perioada. El se calculeaza ca medie aritmetica a sporului cu baza mobila

∆ y=∑t=2

n

∆ t /t−1y

n−1

∆ y=¿30,11

In medie, in fiecare an scolar s-a inregistrat o crestere a numarului de licee fata de anul precedent scolar, de aproximativ 30 de licee.

Ritmul mediu al variatiei

Ritmul mediu arata de cate ori s-a modificat in medie pe o perioada de timp, nivelul unui fenomen. El se calculeaza ca medie geometrica a indicilor de variatie cu baza mobila.

i y=n−1√∏t=2

n

it / t−1y

i y=¿1,0197

In medie, in fiecare an scolar s-a inregistrat o crestere a numarului de licee fata de anul precedent de aproximativ 1,02 ori.

4. Concluzii

Scopul acestei lucrari practice a fost cel de realizare a unor cercetari asupra numarului de facultati si a numarului de studenti din fiecare judet din anul universitar 2009-2010, asupra absolventilor pe nivel de invatamant si sex de pe intreg teritoriul tarii in anul scolar/universitar 2008-2009, dar si asupra numarului de licee din Romania, pe o perioada de 10 ani scolari.

In urma prelucrarii datelor culese din Anuarul statistic 2010 al Romaniei, s-a ajuns la urmatoarele cateva concluzii: exista o legatura directa si pozitiva intre numarul de facultati si numarul d studenti inscrisi la nivelul judetelor Romaniei, regiunea influenteaza numarul facultatilor de pe teritoriul tarii, iar numarul de licee din Romania a cunoscut o crestere semnificativa in ultimii 10 ani, mai ales in anul scolar 2009-1010.

Majoritatea calculelor si analizelor au fost realizate cu ajutorul programului de calcul tabelar Excel din pachetul Microsoft Office, folosindu-se chiar programul de completare “Pachet de instrumente pentru analiza -VBA”, in scopul finalizarii cu usurinta a acestui proiect.

Bibliografie

Jaba, Elisabeta, Statistica, ed. a3-a rev., Bucuresti, Editura Economica, 2002

Jaba,Elisabeta, Pintilescu, Statistica:teste grila si probleme, ed. a2-a rev., Iasi, Editura Sedcom Libris, 2007

www.insse.ro , Institutul National de Statistica