proiect statistica

30
Proiectul de statistică “Utilizarea sondajului în caracterizarea fenomenelor economico-sociale” Sandu Daniela Sorina Universitatea Creștină Dimitrie Cantemir Facultatea Management Turistic și Comercial TEMA POIECT UTILIZAREA SONDAJULUI ÎN CARACTERIZAREA FENOMENELOR ECONOMICO-SOCIALE Titular disciplină: Conf. univ. dr. Emilia Gogu Numele și prenumele Pag. 1 din 30

Upload: sori-sor

Post on 16-Sep-2015

222 views

Category:

Documents


1 download

DESCRIPTION

Dragu

TRANSCRIPT

Proiectul de statistic Utilizarea sondajului n caracterizarea fenomenelor economico-sociale

Proiectul de statistic Utilizarea sondajului n caracterizarea fenomenelor economico-socialeSandu Daniela Sorina

Universitatea Cretin Dimitrie CantemirFacultatea Management Turistic i Comercial

Tema poiectUTILIZAREA SONDAJULUI N CARACTERIZAREA FENOMENELOR ECONOMICO-SOCIALE

Titular disciplin:Conf. univ. dr. Emilia Gogu

Numele i prenumele

Sandu Daniela Cornelia Sorina

Bucuresti, 2015

Proiectul de statistic UTILIZAREA SONDAJULUI N CARACTERIZAREA FENOMENELOR ECONOMICO-SOCIALE

Tema proiectului:

Un agent economic dispune de o reea de uniti economice cu profilul alimentaie public n care sunt angajai 500 de vnztori. Pentru cei 500 de vnztori, considerai ca o colectivitate general s-a ntocmit o baz de sondaj (vezi Baza de Sondaj din Anexa Nr.1). nscrierea n baza de sondaj a vnztorilor s-a fcut n ordine alfabetic, ceea ce constituie un criteriu aleator i li s-a dat un cod (nr. crt.)Considernd cei 500 de vnztori ca formnd o colectivitate statistic, se cere:1. s se extrag printr-un procedeu de sondaj un eantion de 60 de uniti i s se centralizeze nivelurile individuale ale fiecreia din variabilele prezentate potrivit coninutului lor;2. s se grupeze datele nregistrate la punctul precedent folosind gruprile simple pentru toate caracteristicile nregistrate pe intervale egale i neegale (se vor folosi minim 8 grupe pentru intervale egale i minim 3 grupe pentru intervale neegale) i s se centralizeze datele condiionate de gruprile folosite. S se reprezinte grafic seriile obinute;3. s se calculeze toate mrimile relative posibile;4. s se calculeze indicatorii tendinei centrale, indicatorii variaiei i ai asimetriei pentru variabilele nregistrate;5. s se aplice metoda corelaiei i regresiei pentru datele din eantion. S se msoare gradul de intensitate al corelaiei. Pentru date negrupate se vor lua n calcul primele 10 uniti din eantion, la care se vor calcula i coeficienii de corelaie a rangurilor.

NOT: Proiectul se preda cu 10 zile naintea sesiunii.

Rezolvare:1. Din baza de sondaj (Anexa 1) s se extrag un eantion format din 60 de vnztori[footnoteRef:1]. [1: Se cere:s se stabileasc proporia de sondaj i pasul de eantionarefolosind ca prima unitate de sondaj ultimele dou numere a numrului matricol, s se formeze eantionul de 60 de uniti.]

Pasul de eantionare se obine conform relaiei:

n care: N - volumul colectivitii generale n volumul eantionului

Astfel, la extragere s-a folosit procedeul seleciei mecanice cu pas de numrare egal cu 8. Pentru individualizarea proiectului, fiecare student va folosi ca prim unitate de eantionare ultime dou cifre a numrului matricol personal, de ex. 2703 atunci eantionul extras va fi 3; 11; 19 etc. pn se completeaz cele 60 de extrageri). S-au nregistrat datele privind sexul, vrsta (ani), zile lucrate, ore lucrate, Valoarea ncasrilor lunare (lei ) i salariul brut lunar (lei) din luna mai 2014 (vezi Tabelul 1).

Nr. CrtSexVrsta(ani)Zile lucrateOre lucrateValoarea ncasrilor (lei)Salariul brut lunar(lei)

A123456

1. 19F2323187148353272

2. 27F2222169162802957

3. 35M2119151149152642

4. 43F2720163132002852

5. 51F2221190156453325

6. 59F1917140123252200

7. 67F1918146144002555

8. 75M2521173155403027

9. 83F2019166125402905

10. 91M2219151149152642

11. 99M2523184138003220

12. 107F2222169162802957

13. 115F2523180172503150

14. 123M2318141131402467

15. 131F2422158154002765

16. 139F2023170184002975

17. 147M2122196165003430

18. 155M2224211189603692

19. 163F2323187148353272

20. 171M2122181173803167

21. 179 F2324183168003202

22. 187F2221190156453325

23. 195F2321174117602784

24. 203F2020158148202765

25. 211M2318166125102905

26. 219F2421175147603062

27. 227M2418141131402467

28. 235F2423193155253377

29. 243F2523180172503150

30. 251F2421175147603062

31. 259F2523180172503150

32. 267M2024201192003517

33. 275F2721168147002940

34. 283F2422158154002765

35. 291M2422192156203360

36. 299M2523184138003220

37. 307F2617135110502362

38. 315F2619188135502962

39. 323F2620165113002762

40. 331F2322182171603185

41. 339M2121184141753220

42. 347F2422158154002765

43. 355F1919146144002555

44. 363M2020153130002677

45. 371M2224211189603692

46. 379M2319142118802485

47. 387F2623170160502897

48. 395F2523178181703115

49. 403M2220151149152642

50. 411F2423188184803008

51. 419F2123191179403342

52. 427M2422179163903132

53. 435M2322187149603272

54. 443F2317147119002572

55. 451M2123185181703237

56. 459F252318818480 3008

57. 467F2322169162802957

58. 475M2320151149152642

59. 483M2521173155403027

60. 491F2423193155253377

Total 1382127410345918070179416

Interpretare: Cei 60 de vnztori extrai din baza de sondaj ne ofer pentru nceput urmtoarele informaii: au lucrat n total ntr-o lun 1.274 de zile 10.345 de ore; realiznd o valoare a ncasrilor de 918.070 lei. Iar fondul de salariu n aceast lun pentru cei 60 de vnztori a fost 179.416 lei.

2. Gruparea datelor nregistrate 2.1. Gruparea pe intervale de variaie egaleGruparea pe intervale egale implic urmtoarele etape:a) calculul amplitudinii absolute de variaiei (A) care exprim mprtierea maxim a valorilor serei.Axa = Xmax XminObservaie: Dac variaia este foarte mic (n cazul nostru Axa 10) se va forma o distribuie pe variante (valabil n cazul caracteristicilor: vrsta; zile lucrate).b) stabilirea n parametrii ntr-un anumit numr de grupe (r) se poate stabili astfel: dac variaia caracteristicii este relativ uniform i volumul de uniti nu este suficient de mare numrul de grupe se poate fixa anterior (din cerinele proiectului se vor folosi minimul 8 grupe pentru intervale egale); iar dac numrul grupelor nu este anterior cunoscut i volumul unitilor este suficient de mare se recomand stabilirea grupelor conform relaiei lui Sturgers, r = 1+3,322log nunde: n - nr. caracteristicilor.b) determinarea mrimii intervalului de grupare (h), se calculeaz ca raport ntre amplitudinea absolut a variaiei i numrul de grupe:

sau Not: Mrimea intervalului (h) se rotunjete la ntreg n plus (ex.3,254) Prima grup se pornete de la xmin adugndu-se succesiv mrimea intervalului de grupare (h) rezultat din calculul anterior. Valoarea din stnga intervalului va fi considerat ca limit inferioar, iar valoarea din dreapta ca limit superioar. Valorile care formeaz limitele intervalelor se nregistreaz fie numai ca limit superioar fie ca limit inferioar pentru a evita nregistrri duble a caracteristicilor.Analog se rezolv pentru orice variabil.2A. Gruparea pe intervale egale a vnztorilor dup vrsta) amplitudinea variaiei Axa = Xmax Xmin = 27-19-8Astfel obinem o distribuie pe 9 variante (19,20,21....27) Centralizarea valorilor dup vrst se obine astfel: (vezi Tabelul 2)Repartiia vnztorilor dup vrst

Vrsta(ani)Nr. vnztoriValori centralizate pentru:

Zile lucrateOre lucrateValoarea ncasrilor (lei )Fondul de salariu lunar (lei)

19354432 411258224

2051068487796014715

21613010889908018426

22817314421316024217

2312249201617097535378

2411239191017040032194

259203162014708027102

2647965851950 13316

27241331279005844

TOTAL60127410345918070179416

Reprezentarea grafic a repartiiei vnztorilor dup vrst se poate ilustra prin poligonul frecvenelor (Figura 1) i curba cumulativ a frecvenelor (Figura 2) pentru construirea creia este necesar calculul n prealabil al frecvenelor cumulate cresctor i descresctor determinate n Tabelul 4 Figura 1Tabelul 3

2B. Gruparea pe intervale egale a vnztorilor dup zile lucrateAmplitudinea variaiei Axa = Xmax Xmin = 24-17=7Obinem o distribuie format din 8 variante (17,18,19...24)Repartiia vnztorilor dup numrul zilelor lucrateTabelul 5 Zile lucrateNr. vnztoriValori centralizate pentru:

Ore lucrateValoarea ncasrilor lunare (lei )Fondul de salariu lunar (lei)

173422352758871

1845945319010932

1969448220017901

2069418215018601

219160213252527054

2212209819305036435

2316293826576047619

2448067392012003

TOTAL6010345918070179416

Centralizarea valorilor n funcie de numrul zilelor lucrate se obine ca i n cazul gruprii dup vrsta vnztorilor.Reprezentarea grafic a repartiiei vnztorilor dup zilele lucrate, se poate ilustra prin poligonul frecvenelor (Figura 3) i prin curba cumulativ a frecvenelor (Figura 4) pentru construirea creia este necesar calculul n prealabil al frecvenelor cumulate cresctor i descresctor determinate n Tabelul 6.Figura 3

2C. Gruparea pe intervale egale a vnztorilor dup ore lucratea) Amplitudinea variaiei Axa = Xmax Xmin =211-135=76b) Nr de grupe r = 8c) Mrimea intervalului = 9.5 10.Repartiia vnztorilor dup numrul de ore lucrate Centralizarea valorilor dup orele lucrate se obine astfel (vezi Tabelul 7)Tabelul 7 Grupe dup nr. ore lucrateNr. vnztoriValori centralizate pentru:

Zile lucrateValoarea ncasrilor lunare Fondul de salariu lunar (lei)

135-1455896153514344

145-155815211336022731

155-16561268552018916

165-1751327519540039181

175-1851227219759536497

185-1951226619104035763

195-205246357005965

205-215248379206019

Total601274918070179416

Nota: Limita superioar inclus n interval.Reprezentarea grafic a repartiiei vnztorilor dup numrul de ore lucrate, se poate ilustra prin histogram, poligonul frecvenelor (Figura7.5) i prin curba cumulativ a frecvenelor (Figura 6) pentru construirea creia este necesar calculul n prealabil al frecvenelor cumulate cresctor i descresctor determinate n Tabelul 9Figura 5

2E. Gruparea pe intervale egale a vnztorilor dup salariul brut lunar a) Amplitudinea variaiei Axa = Xmax Xmin = 3692-2200=1492

b) Nr de grupe r = 8c) Mrimea intervalului = 186,5 187Centralizarea valorilor dup salariul brut lunar se obine la fel ca i la orele lucrate.Repartiia vnztorilor n funcie de salariul brut lunar (lei)Tabelul 12 Grupe dup salariul brut lunarNr. vnztoriValori centralizate pentru:

Zile lucrateOre lucrateValoarea ncasrilor lunare (lei )

2200-238724029928540

2387-25746129104092760

2574-2761510787976910

2761-2948112321894173880

2948-313591921607139885

3135-3322173662929264735

3322-350971481201100310

3509-369636049641050

Total60127410345918070

Nota: Limita superioar inclus n interval.Figura 9

Reprezentarea grafic a repartiiei vnztorilor dup salariul brut lunar, se poate ilustra prin histogram, poligonul frecvenelor (Figura 9) i curba cumulativ a frecvenelor (Figura 10) pentru construirea creia este necesar calculul n prealabil al frecvenelor cumulate cresctor i descresctor, determinate n Tabelul 13.

2.2. Gruparea vnztorilor pe intervale neegale

Gruparea pe intervale egale ne-a permis structurarea colectivitii pe grupe ct mai omogene. De asemenea, dup cum s-a observat gruparea statistic este cea mai semnificativ modalitate a sistematizrii datelor dup o caracteristica numeric sau nominativ. Sistematizarea datelor printr-o grupare pe intervale egale rspunde n primul rnd necesitii de sistematizare i omogenizare a datelor unei observaii statistice de mas i a caracterizrii independente a fiecrei variabile din propria observare .Pentru analiza structurii colectivitii pe grupe tipice se folosete gruparea pe intervale neegale. Gruparea pe intervale neegale presupune regruparea intervalelor egale. Un prim principiu al gruprii pe intervale neegale este trecerea de la variaia liniar (interval de mrime constant) la variaia neuniform a unor intervale de grupare din ce n ce mai mari. De exemplu, de la 8 grupe se poate trece la 5 grupe Analiznd situaia concret se pot pstra primele 3 grupe, grupa a patra de obine cumulnd-o cu grupa a cincia, iar ultimele trei grupe se pot cupla. n cazul acesta se poate trece de la grupe pe variante la grupe pe intervale.Un alt principiu de grupare are n vedere separarea unitilor pe trei grupe: mici, mijlocii i mari, se pornete de la nivelul mediu al caracteristicii, care se calculeaz ca o medie aritmetic simpl sau ponderat pentru fiecare variabil n parte:

sau unde : xi - variabilan numrul unitilor nregistrate (n cazul nostru n=60 sau dac nu avem datele iniiale folosim media seriei n care, xi sunt valorile sau centrele de interval i cu frecvenele seriei)Algoritmul de stabilire a celor 3 grupe cu intervale neegale este urmtorul: n grupa a II-a sunt cuprinse grupa care conine nivelul mediu al variabilei i intervalele nvecinate cu acesta; grupa I-a este format limita inferioar a primului interval i limita inferioar a intervalului II, iar a III-a grupa intre limita superioar a intervalului II i limita superioar a ultimului interval de grupare.

2.2.A. Gruparea pe intervale neegale a vnztorilor dup vrstNivelul mediu

Tabelul 14Grupe dup vrst (ani)Nr. vnz.Valori centralizate pentru:

Zile lucrateOre lucrateValoarea ncasrilor (lei )Fondul de salariu (lei)Calificativul

19-2222463381034976564865Cei mai tineri

22-2423488392634137567956Tineri

24-2715323260922693046595Mai puin tineri

Total60127410345918070179416-

3. Calculul mrimilor relative de structurDin cele 5 mrimi relative ntlnite n statistic, n proiectul de fa se pot determina trei:

3.1. Mrimile relative de structur se obin ca raport ntre parte i ntreg. Forma cea mai obinuita de exprimare a mrimilor relative de structur este cea a procentelor care arat cte unitii din indicatorul raportat revin la 100 uniti ale indicatorului baz de raportare. Se pot calcula att pe baza frecvenelor absolute i n acest caz au sens de frecvene relative ()

ct i pe baza valorilor centralizate privind: vrsta, zilele lucrate, orele lucrate, volumul desfacerilor i salariul net, obinndu-se n acest caz ponderea sau greutatea specific () a unei valori () n totalul valorilor colectivitii ():

3.2. Mrimile relative de coordonare se obin ca raport ntre dou grupe sau ntre dou colectiviti ce coexist n spaiu.Pentru o colectivitate mprit n dou grupe pentru care nivelul pe grupe al variabilei studiate este xA i xB :

sau Dac sunt mai multe grupe, se alege una ca baz de comparaie i se raporteaz, pe rnd, fiecare grup la baza aleas.3.3. Mrimile relative de intensitate se obin prin raportarea a doi indicatori cu coninut diferit dar ntre care exist o relaie de interdependen.

la nivel parial: ; la nivelul ansamblului: 3.A. Calculul mrimilor relative pe baza repartiiei vnztorilor dup vrst.Repartiia timpului lucrat (n zile i ore), a valorii desfacerii i a fondului de salarii i a structurii acestora n funcie de vrstTabelul 21Intervalul de variaie al vrsteiCalificativul

Mrimi relative de structur %

Frecvene relative

gi

Zile lucrOre lucrVal. desfFond salariu

19-22Cei mai tineri23,322,722,823,722,9

22-24Tineri33,333,133,432,933,5

24-27Mai putin tineri43.344,143.643,243,4

Total-100100100100100

Interpretare: Cei mai tineri alctuiesc 23,3% din totalul angajailor, lucreaz 22,8% respectiv 22,7% din totalul zilelor i orelor lucrate, realizeaz 23,7% din Valoarea ncasrilor i primesc 22,9% din fondul de salarii.

4. Caracterizarea statistic a repartiiilor obinuteCaracterizarea statistic n cazul dat se refer la determinarea:a) Indicatorilor tendinei centrale: Media aritmetic

Modul (modulul, dominanta)

Mediana (Me)

b) Indicatorii sintetici ai variaiei i ai asimetriei: Abaterea medie liniar :

Dispersia

Abaterea medie ptratic

Coeficientul de variaie (v):

respectiv Coeficientul de asimetrie

sau 3. A. Repartiia vnztorilor dup vrst

Tabelul 24Vrsta(ani)Nr, vnztorixiniFrecvene cumulate cresctor

19357348,72

205100845,90

2161261431,74

228176228,48

2312276340,01

24112644510,34

2592255434,92

2641045835,28

272546031,52

TOTAL601382-246,91

a) Calculul indicatorilor tendinei centrale: Media aritmetic

Modul (modulul, dominanta)Fiind o serie pe variante Modul este valoarea cu frecvena maxim

Mediana (Me)

locul medianei: Variabila 23 ani este prima a crei frecven cumulat cresctor este mai mare de 30,5

b) Calculul indicatorii sintetici ai variaiei i ai asimetriei Dispersia

Abaterea medie ptratic

Coeficientul de variaie (v):

sau v` i v < 35% - seria este omogen i media este reprezentativ pentru serie Coeficientul de asimetrie

sau Rezult asimetrie negativ foarte moderat

4.C. Repartiia vnztorilor dup orele lucrateTabelul 26Grupe dup ore lucrateNr, Vnz,Centrul intervalului xiniFrecv Cumul cresc

xi

135-145514070055379.2

145-15581501200134158.72

155-165516080018819.2

165-1751217020403094.08

175-18513180234043673.92

185-195131902470563845.92

195-2052200400581479.68

205-2152210420602767.68

Total60140010370-19218.4

a) Calculul indicatorilor tendinei centrale: Media aritmetic

Modul Locul Mo - intervalul cu frecvena maxim

Mediana (Me)

locul medianei: deci intervalul (..175-185..) este primul interval a crei frecven cumulat cresctor este mai mare de 30,5

b) Calculul indicatorii sintetici ai variaiei i ai asimetriei Dispersia

Abaterea medie ptratic

Coeficientul de variaie (v):

v` i v < 35% - seria este omogen i media este reprezentativ pentru serie Coeficientul de asimetrie

Rezult asimetrie negativ moderat

4. E. Repartiia vnztorilor dup salariu brut (lei) Grupe dup salariul brut lunarNr, vnz.Centrul intervalului xinifrecv cum cresc

xi

2200-238722293.5458721461.21067552.72

2387-257462480.51488383261.61773005.76

2574-276152667.513337.5131783635817.8

2761-2948122954.53545425835.258129.92

2948-3135123041.53649837208.83633.12

3135-3322133228.541970.5502657.2543131.68

3322-350973415.523908.5572739.81072357.72

3509-369633602.510807.5601735.21003639.68

Total6023684181446-146826157268.4

Tabelul 28a) Calculul indicatorilor tendinei centrale: Media aritmetic

Modul Locul Mo - intervalul cu frecvena maxim (2948-3135)

Mediana (Me)

locul medianei: prin urmare intervalul (........3135-3322.........) este primul interval a crei frecven cumulat cresctor este mai mare de 30,5

b) Calculul indicatorii sintetici ai variaiei i ai asimetriei Dispersia

Abaterea medie ptratic

Coeficientul de variaie (v):

v` i v < 35% - seria este omogen i media este reprezentativ pentru serie Coeficientul de asimetrie

Rezult asimetrie negativ moderatPentru interpretarea rezultatelor se vor trece indicatorii obinui ntr-un tabel sintetic.

5. Analiza corelaiei dintre numrul de ore i salariu brut lunar

5.1 Corelaia liniar simpl (date negrupate)Se aplic pentru primele 10 uniti din eantion, privind numrul de ore lucrate (xi) i salariul brut lunar (yi ) - lei. Seria se va ordona cresctor dup numrul de ore lucrate (xi) meninndu-se salariul brut lunar (yi) corespunztor.

Dintre metodele simple de cercetare a legaturilor statistice recurgem la :A) Metoda seriilor paralele interdependente (Tabelul 35);Tabelul 35Nr. crtOre lucrate (xi)Salariul brut lunar(lei) (yi)

1.1352250

2.1402300

3.1482460

4.1562550

5.1652650

6.1732750

7.1782950

8.1863100

9.1953200

10.2103370

Concluzie: Valorile xi fiind ordonate cresctor se poate observa c i valorile yi cresc n cea mai mare parte, ceea ce sugereaz o legtur direct.B) Metoda grafic este o alt cale de a stabili legtura dintre fenomene.Pentru a obine graficul de corelaie, denumit i corelograma, valorile caracteristicii factoriale (xi) sau intervalele acesteia se trec pe abscisa, iar pe ordonate valorile caracteristicii rezultative (yi) sau intervalele respective. Fiecare unitate observat a celor dou caracteristici se reprezint grafic printr-un punct.

Figura 12

Graficul de asemenea confirm o legtur direct de form liniar.Metoda grafica este utilizat cu bune rezultate pentru alegerea funciei analitice care se studiaz (y = 19.876x - 425.62 n cazul regresiei i corelaiei)Metodele de studiere a legaturilor prezentate anterior au ca deficien principal faptul c dei permit constatarea legturii i caracterul ei, nu o pot msura printr-un indicator sintetic. Acest inconvenient este nlturat prin utilizarea metodei regresie.Metoda regresiei constituie o metoda statistic analitic de cercetare a legturii dintre variabile cu ajutorul unor funcii denumite funcii de regresie.Notnd cu Y variabile dependenta i cu x1 , x2 ... xn variabilele independente obinem ecuaia de regresie y = f (x1 , x2 ... xn).n cazul de fata am apelat la modelul de regresie unifactorial liniar considernd legtura dintre y i x de tipul yxi = a +bxi. Parametri ecuaiei n acest caz se determin prin rezolvarea urmtorului sistem de ecuaii:

Dac se folosete metoda determinanilor se obine:

Datele necesare calculrii celor doi parametri sunt prezentate n Tabelul 36

Funcia de regresie este: Yxi=iValorile funcie de regresie se obin nlocuind xi cu valorile empirice.Parametrul b=19,87 se interpreteaz astfel: creterea numrului de ore cu o unitate, ar determinat o cretere a salariului net, n medie cu 19,87 lei.Tabelul 37Nr ctr.xiyi

xiyiYxi=

1.

2.

3.

4.

5.

6.

7.

8.

9.

10.

Total

a) Raportul de corelaie liniar simpl se ca calcula cu formula:

Tabelul 38Nr. crtxiyiYxi(yi - Yxi)2(yi - )2

1.

2.

3.

4.

5.

9.

7.

8.

9.

10.

Unde:

Se poate spune c legtur este strns (Ry/x=....) i gradul de determinaie este de ......... sau de ................b) Metoda coeficientului de corelaieIntensitatea legturii se msoar prin coeficientul de corelaie (ry/x).

Rezult c legtura dintre aceste dou variabile este direct (rz/x>0) i puternic. Exist legtur liniar intens deoarece ry/x=Ry/x.

Pag. 19 din 22