turdean marinella - bazele statisticii - manual...

146
1 MARINELLA SABINA TURDEAN LIGIA PRODAN BAZELE STATISTICII - Manual de studiu individual -

Upload: others

Post on 06-Sep-2019

110 views

Category:

Documents


15 download

TRANSCRIPT

Page 1: TURDEAN MARINELLA - BAZELE STATISTICII - Manual debv.ucdc.ro/bv/F_1_bazele-statisticii-turdean.pdf · 3 MARINELLA SABINA TURDEAN LIGIA PRODAN BAZELE STATISTICII - Manual de studiu

1

MARINELLA SABINA TURDEAN LIGIA PRODAN

BAZELE STATISTICII - Manual de studiu individual -

Page 2: TURDEAN MARINELLA - BAZELE STATISTICII - Manual debv.ucdc.ro/bv/F_1_bazele-statisticii-turdean.pdf · 3 MARINELLA SABINA TURDEAN LIGIA PRODAN BAZELE STATISTICII - Manual de studiu

2

Page 3: TURDEAN MARINELLA - BAZELE STATISTICII - Manual debv.ucdc.ro/bv/F_1_bazele-statisticii-turdean.pdf · 3 MARINELLA SABINA TURDEAN LIGIA PRODAN BAZELE STATISTICII - Manual de studiu

3

MARINELLA SABINA TURDEAN LIGIA PRODAN

BAZELE STATISTICII

- Manual de studiu individual -

Page 4: TURDEAN MARINELLA - BAZELE STATISTICII - Manual debv.ucdc.ro/bv/F_1_bazele-statisticii-turdean.pdf · 3 MARINELLA SABINA TURDEAN LIGIA PRODAN BAZELE STATISTICII - Manual de studiu

4

Copyright © 2012, Editura Pro Universitaria Toate drepturile asupra prezentei ediţii aparţin Editurii Pro Universitaria Nicio parte din acest volum nu poate fi copiată fără acordul scris al Editurii Pro Universitaria

Descrierea CIP a Bibliotecii Naţionale a României TURDEAN, MARINELLA-SABINA Bazele statisticii : manual de studiu individual / Marinella Turdean, Ligia Prodan. - Bucureşti : Pro Universitaria, 2012 Bibliogr. ISBN 978-606-647-306-4

I. Prodan, Ligia

311(075.8)

Page 5: TURDEAN MARINELLA - BAZELE STATISTICII - Manual debv.ucdc.ro/bv/F_1_bazele-statisticii-turdean.pdf · 3 MARINELLA SABINA TURDEAN LIGIA PRODAN BAZELE STATISTICII - Manual de studiu

5

CUPRINS

INTRODUCERE ........................................................................................................................... 8

UNITATEA DE STUDIU 1 NOŢIUNI INTRODUCTIVE ..................................................... 10 1.1 Introducere .................................................................................................................................................. 10 1.2 Obiectivele unităţii de studiu ..................................................................................................................... 10 1.3 Competenţele unităţii de studiu ................................................................................................................. 10 1.4 Timpul alocat unităţii de studiu ................................................................................................................. 11 1.5 Conţinutul unităţii de studiu ...................................................................................................................... 11

1.5.1 Momente ale evoluţiei statisticii ........................................................................................................ 11 1.5.2 Obiectul şi metoda statisticii .............................................................................................................. 12 1.5.3 Noţiuni fundamentale utilizate în statistică ........................................................................................ 13 1.5.4 Rolul statisticii în economie .............................................................................................................. 14

1.6 Îndrumar pentru autoverificare ................................................................................................................ 15

UNITATEA DE STUDIU 2 OBSERVAREA STATISTICĂ .................................................. 18 2.1 Introducere .................................................................................................................................................. 18 2.2 Obiectivele unităţii de studiu ..................................................................................................................... 18 2.3 Competenţele unităţii de studiu: ................................................................................................................ 18 2.4 Timpul alocat unităţii de studiu: ............................................................................................................... 19 2.5 Conţinutul unităţii de studiu ...................................................................................................................... 19

2.5.1 Scopul observării statistice ................................................................................................................ 19 2.5.2 Principiile care stau la baza observării statistice ................................................................................ 19 2.5.3 Planul observării statistice ................................................................................................................. 19 2.5.4 Clasificarea observărilor statistice ..................................................................................................... 20 2.5.5 Erorile observării statistice ................................................................................................................ 22 2.5.6 Controlul datelor statistice ................................................................................................................. 23

2.6 Îndrumar pentru autoverificare ................................................................................................................ 24

UNITATEA DE STUDIU 3 PRELUCRAREA DATELOR STATISTICE ........................... 27 3.1 Introducere .................................................................................................................................................. 27 3.2 Obiectivele unităţii de studiu ..................................................................................................................... 27 3.3 Competenţele unităţii de studiu: ................................................................................................................ 27 3.4 Timpul alocat unităţii de studiu: ............................................................................................................... 28 3.5 Conţinutul unităţii de studiu ...................................................................................................................... 28

3.5.1 Planul prelucrării datelor statistice ..................................................................................................... 28 3.5.2 Centralizarea datelor statistice ........................................................................................................... 28 3.5.3 Metoda grupării ................................................................................................................................. 29

3.6 Aplicaţii practice ......................................................................................................................................... 32 3.7 Îndrumar pentru autoverificare ................................................................................................................ 33

UNITATEA DE STUDIU 4 PREZENTAREA DATELOR STATISTICE ........................... 36 4.1 Introducere .................................................................................................................................................. 36 4.2 Obiectivele unităţii de studiu ..................................................................................................................... 36 4.3 Competenţele unităţii de studiu: ................................................................................................................ 36 4.4 Timpul alocat unităţii de studiu: ............................................................................................................... 37 4.5 Conţinutul unităţii de studiu ...................................................................................................................... 37

4.5.1 Tabelele statistice ............................................................................................................................... 37 4.5.2 Seriile statistice .................................................................................................................................. 42 4.5.3 Reprezentarea grafica a datelor statistice ........................................................................................... 45

4.6 Aplicatii practice ......................................................................................................................................... 51 4.7 Îndrumar pentru autoverificare ................................................................................................................ 52

Page 6: TURDEAN MARINELLA - BAZELE STATISTICII - Manual debv.ucdc.ro/bv/F_1_bazele-statisticii-turdean.pdf · 3 MARINELLA SABINA TURDEAN LIGIA PRODAN BAZELE STATISTICII - Manual de studiu

6

UNITATEA DE STUDIU 5 MĂRIMILE RELATIVE ........................................................... 56 5.1 Introducere .................................................................................................................................................. 56 5.2 Obiectivele unităţii de studiu ..................................................................................................................... 56 5.3 Competenţele unităţii de studiu: ................................................................................................................ 56 5.4 Timpul alocat unităţii de studiu: ............................................................................................................... 57 5.5 Conţinutul unităţii de studiu ...................................................................................................................... 57

5.5.1 Consideraţii generale privind calculul mărimilor relative ................................................................. 57 5.5.2 Tipuri de mărimi relative ................................................................................................................... 58

5.6 Aplicatii practice ......................................................................................................................................... 64 5.7 Îndrumar pentru autoverificare ................................................................................................................ 67

UNITATEA DE STUDIU 6 ANALIZA SERIILOR DE DISTRIBUŢIE I ............................ 70 6.1 Introducere .................................................................................................................................................. 70 6.2 Obiectivele unităţii de studiu ..................................................................................................................... 70 6.3 Competenţele unităţii de studiu: ................................................................................................................ 71 6.4 Timpul alocat unităţii de studiu: ............................................................................................................... 71 6.5 Conţinutul unităţii de studiu ...................................................................................................................... 71

6.5.1 Condiţii de aplicare şi de calcul pentru mărimile medii .................................................................... 71 6.5.2 Media aritmetică ................................................................................................................................ 72 6.5.3 Media armonică ................................................................................................................................. 80 6.5.4 Media pătratică .................................................................................................................................. 81 6.5.5 Media geometrică .............................................................................................................................. 82 6.5.6 Media caracteristicii alternative ......................................................................................................... 83

6.6 Aplicaţii practice ......................................................................................................................................... 85 6.7 Îndrumar pentru autoverificare ................................................................................................................ 87

UNITATEA DE STUDIU 7 ANALIZA SERIILOR DE DISTRIBUŢIE -II ......................... 90 7.1 Introducere .................................................................................................................................................. 90 7.2 Obiectivele unităţii de studiu ..................................................................................................................... 90 7.3 Competenţele unităţii de studiu: ................................................................................................................ 90 7.4 Timpul alocat unităţii de studiu: ............................................................................................................... 91 7.5 Conţinutul unităţii de studiu ...................................................................................................................... 91

7.5.1 Mediana ............................................................................................................................................. 91 7.5.2 Modul (dominanta) ............................................................................................................................ 92 7.5.3 Cuartile .............................................................................................................................................. 93 7.5.4 Decile ................................................................................................................................................. 95

7.6 Aplicaţii practice ......................................................................................................................................... 97 7.7 Îndrumar pentru autoverificare ................................................................................................................ 98

UNITATEA DE STUDIU 8 ANALIZA SERIILOR DE DISTRIBUŢIE III ....................... 101 8.1 Introducere ................................................................................................................................................ 101 8.2 Obiectivele unităţii de studiu ................................................................................................................... 101 8.3 Competenţele unităţii de studiu: .............................................................................................................. 102 8.4 Timpul alocat unităţii de studiu: ............................................................................................................. 102 8.5 Conţinutul unităţii de studiu .................................................................................................................... 102

8.5.1 Consideraţii generale privind calculul indicatorilor variabilităţii .................................................... 102 8.5.2 Indicatorii simpli ai variabilităţii ..................................................................................................... 103 8.5.3 Indicatorii sintetici ai variabilităţii ................................................................................................... 104 8.5.4 Indicatorii variabilităţii pentru o colectivitate împărţită în grupe. Regula adunării dispersiilor ...... 106 8.5.5 Indicatorii de variabilităţii pentru caracteristicile alternative .......................................................... 109 8.5.6 Asimetria şi indicatorii de asimetrie ................................................................................................ 111

8.6 Aplicaţii practice ....................................................................................................................................... 113 8.7 Îndrumar pentru autoverificare .............................................................................................................. 116

Page 7: TURDEAN MARINELLA - BAZELE STATISTICII - Manual debv.ucdc.ro/bv/F_1_bazele-statisticii-turdean.pdf · 3 MARINELLA SABINA TURDEAN LIGIA PRODAN BAZELE STATISTICII - Manual de studiu

7

UNITATEA DE STUDIU 9 CERCETAREA SELECTIVĂ ................................................ 122 9.1 Introducere ................................................................................................................................................ 122 9.2 Obiectivele unităţii de studiu ................................................................................................................... 122 9.3 Competenţele unităţii de studiu: .............................................................................................................. 123 9.4 Timpul alocat unităţii de studiu: ............................................................................................................. 123 9.5 Conţinutul unităţii de studiu .................................................................................................................... 123

9.5.1 Noţiuni utilizate în sondajul statistic................................................................................................ 124 9.5.2 Planul cercetării prin sondaj ............................................................................................................ 125 9.5.3 Procedee de selecţie ......................................................................................................................... 126 9.5.4 Tehnici de selecţie ........................................................................................................................... 127 9.5.5 Erorile cercetării prin sondaj ............................................................................................................ 128 9.5.6 Tipuri de sondaj ............................................................................................................................... 132

9.6 Aplicaţii practice ....................................................................................................................................... 137 9.7 Îndrumar pentru autoverificare .............................................................................................................. 140

Page 8: TURDEAN MARINELLA - BAZELE STATISTICII - Manual debv.ucdc.ro/bv/F_1_bazele-statisticii-turdean.pdf · 3 MARINELLA SABINA TURDEAN LIGIA PRODAN BAZELE STATISTICII - Manual de studiu

8

0 INTRODUCERE

„Knowledge is power” Francis Bacon, 1598

La început de mileniu III, este mai adevărată ca niciodată afirmaţia lui Pitagora de acum 26 de

secole,: “Totul este număr!” Dacă poţi asocia unui fenomen şi o expresie numerică, dovedeşti că ştii ceva despre acel fenomen!

Statistica este ştiinţa şi în acelaşi timp arta culegerii, prelucrării şi analizei datelor cu ajutorul metodelor specifice care se bazează pe gândirea statistică. De exemplu, interpretarea în medie, şi mă refer aici la familiara medie aritmetica, ne permite sa reţinem ceea ce este esenţial şi tipic în diferitele forme individuale de manifestare ale fenomenelor.

Cursul de statistică constituie un suport ştiinţific adecvat pentru studierea fenomenelor sociale şi economice, a regularităţilor în apariţia acestora precum şi pentru determinarea gradului de influenţă a diferiţilor factori care acţionează asupra acestor fenomene.

Sarcina statisticii este de a ne arăta şi apoi de a ne învăţa să practicăm noi moduri de gândire cu scopul de a descrie, de a analiza şi de a înţelege comportamentul colectivităţilor studiate.

În acest context, lucrarea de faţă prezintă succesiv, de la simplu la complex, principalele metode statistice care oferă deprinderea de a raţiona şi de a interpreta logic informaţiile, cu scopul de a fundamenta în deplină concordanţă cunoştinţe-competenţe, deciziile dintr-un anumit domeniu de activitate. Studenţii, viitori economişti, vor şti cum şi când să aplice metodele studiate pentru a susţine argumentat evaluări, idei, ipoteze.

Problematica tratată în următoarele pagini corespunde programei analitice a cursului universitar de „Bazele statisticii”.

Obiectivele cursului Obiectivul cursului “Bazele statisticii” constă în pregătirea studenţilor în domeniul teoriei si

practicii statistice din ţara noastră şi pe plan internaţional. Studenţii vor cunoaşte modul în care se realizează o cercetare statistică, metodele si procedeele de calcul şi analiză a indicatorilor statistici. O atenţie deosebită este acordată interpretării corecte a rezultatelor şi utilizării limbajului de specialitate adecvat.

Competenţe conferite După parcurgerea acestui curs, studentul va dobândi următoarele competenţe specifice:

Competenţe specifice Cunoaştere şi înţelegere -identificarea de termeni, relaţii, procese, perceperea unor relaţii şi conexiuni în cadrul fenomenelor economico- sociale; - utilizarea corectă a termenilor de specialitate din domeniul economic. Explicare şi interpretare - argumentarea unor enunţuri; - capacitatea de organizare şi planificare a activitatilor cuprinse în planul unei cercetări statistice. Instrumental-aplicative - capacitatea de a transpune în practică cunoştinţele dobândite în cadrul cursului; - capacitatea de a concepe proiecte şi de a derula activităţi legate de aspecte statistice ale activităţii economice; - capacitatea de a da soluţii statistice la probleme legate de decizie şi calcule de perspectivă. - prelucrarea electronică a informaţiilor statistice Atitudinale - reacţia pozitivă la sugestii, cerinţe, sarcini didactice, satisfacţia de a răspunde la întrebări,provocări; - implicarea în activităţi de cercetare ştiinţifică; - capacitatea de a aprecia diversitatea analizei; - abilitatea de a colabora cu specialiştii din alte domenii. - capacitatea de a lucra singur sau în echipă;

Page 9: TURDEAN MARINELLA - BAZELE STATISTICII - Manual debv.ucdc.ro/bv/F_1_bazele-statisticii-turdean.pdf · 3 MARINELLA SABINA TURDEAN LIGIA PRODAN BAZELE STATISTICII - Manual de studiu

9

Resurse şi mijloace de lucru Disciplina „Bazele statisticii”dispune de un manual pentru studiul individual al studenţilor, precum

şi de materiale publicate pe Internet sub formă de sinteze, teste de autoevaluare, studii de caz, aplicaţii, necesare întregirii cunoştinţelor practice şi teoretice. Pentru fixarea cunoştinţelor teoretice şi pentru o mai bună înţelegere a aplicaţiilor practice la activităţile de seminar, sunt folosite echipamente audio-video, metode interactive şi participative de antrenare a studenţilor.

Structura manualului Manualul de studiu individual este compus din 9 unităţi de studiu:

Unitatea de studiu 1. Noţiuni introductive (2 ore) Unitatea de studiu 2. Observarea datelor statistice (2 ore) Unitatea de studiu 3. Prelucrarea datelor statistice (2 ore) Unitatea de studiu 4. Prezentarea datelor statistice (4 ore) Unitatea de studiu 5. Mărimile relative (4 ore) Unitatea de studiu 6. Analiza seriilor de distribuţie I - Mărimile medii (2 ore) Unitatea de studiu 7. Analiza seriilor de distribuţie II – Mărimile medii de poziţie (2) Unitatea de studiu 8. Analiza seriilor de distribuţie III – Indicatorii variabilităţii şi

indicatorii de asimetrie (4 ore) Unitatea de studiu 9. Cercetarea selectivă (6 ore)

Teme de control (TC) Temele de control vor avea loc conform calendarului disciplinei şi vor avea următoarele subiecte:

1. Prelucrarea datelor statistice. Reprezentarea grafică a datelor statistice (1 ora) 2. Calculul mărimilor medii şi a indicatorilor variabilităţii (1 ora)

Bibliografie:

1. Anghelache, C., Isaic- Maniu, A., Mitruţ, C., Voineagu, V., Dumbravă , M., (2007), Analiză economică, sinteze şi studii de caz, Editura Economică, Bucureşti;

2. Băcescu- Carbunaru, A., (2009) Statistică- bazele statisticii, Editura Universitară, Bucureşti; 3. Begu, L.S., (2009), Statistică internaţională –analize comparative, Editura Universitară, Bucureşti 4. Biji, M., Biji, E. M., Lilea, E., Anghelache, C., (2002), Tratat de statistică, Editura Economica,

Bucureşti 5. Biji, E.M., Lilea, E., Roşca, E., Vătui, M., (2010), Statistică pentru economişti, Editura

Economică, Bucureşti; 6. Druică, E., (2012), Statistică pe înţelesul tuturor, Editura CH Beck, Bucureşti; 7. Duguleană, L., (2012) Bazele statisticii economice, Editura CH Beck, Bucureşti; 8. Francis, A., (2004), Statistică şi matematică pentru managementul afacerilor, Editura Tehnică,

Bucureşti; 9. Săvoiu, Gh., (2011), Statistică pentru afaceri, Editura Universitară, Bucureşti 10. Turdean, M., (2012), Statistica, Editura Pro Universitaria, Bucureşti; 11. Ţiţan, E., (2012) Statistică – teorie şi aplicaţii în sectorul terţiar, Editura Meteor Press, Bucureşti;

*** Anuarul Statistic al României, 2011, I.N.S. Bucureşti, 2012 Metoda de evaluare: Examenul final se susţine sub formă scrisă, având ca subiect rezolvarea unor probleme. Se va ţine

cont de participarea la activităţile de seminar şi rezultatul la temele de control ale studentului.

Page 10: TURDEAN MARINELLA - BAZELE STATISTICII - Manual debv.ucdc.ro/bv/F_1_bazele-statisticii-turdean.pdf · 3 MARINELLA SABINA TURDEAN LIGIA PRODAN BAZELE STATISTICII - Manual de studiu

10

1 UNITATEA DE STUDIU 1 NOŢIUNI INTRODUCTIVE 1.1 Introducere 1.2 Obiectivele unităţii de studiu 1.3 Competenţele unităţii de studiu 1.4 Timpul alocat unităţii de studiu 1.5 Conţinutul unităţii de studiu

1.5.1 Momente ale evoluţiei statisticii 1.5.2 Obiectul şi metoda statisticii 1.5.3 Noţiuni fundamentale utilizate în statistică 1.5.4 Rolul statisticii în economie

1.6. Îndrumar pentru autoverificare 1.6.1 Sinteza unitatii de invatare 1.6.2 Concepte si termeni de retinut 1.6.3 Întrebări de control şi teme de dezbatere 1.6.4 Bibliografie

1.1 Introducere

Statistica înseamnă pentru multe persoane doar o simplă caracterizare/descriere a unor fenomene pe baza unui set de date sau utilizarea în relaţiile de comunicare a unor indicatori ca: rata şomajului, cursul valutar, cifra medie de afaceri, rata dobânzii, indicele preţurilor de consum, productivitatea muncii etc.

În realitate, statistica ne ajută să obţinem informaţii care să caracterizeze concret şi corect situaţia existentă, să înţelegem raporturile cauză - efect, să oferim o analiză pertinentă a datelor în scopul elaborării unor previziuni credibile şi să luăm deciziile cele mai bune în domeniul în care ne desfăşurăm activitatea.

1.2 Obiectivele unităţii de studiu

– cunoaşterea obiectului de studiu al statisticii; – cunoaşterea şi caracterizarea principalelor momente ale

evoluţiei statisticii; – descrierea principalelor activităţi care caracterizează etapele

unei cercetări statistice; – diferenţierea metodelor statisticii descriptive de metodele

statisticii inferenţiale; – definirea principalelor noţiuni utilizate în limbajul statistic.

1.3 Competenţele unităţii de studiu – studenţii vor putea să definească şi să caracterizeze

obiectul de studiu al statisticii; – studenţii vor putea să definească noţiuni ca: unitate

statistică, caracteristică statistică, colectivitate statistică, date statistice, indicatori statistici, frecvenţă absolută,

Page 11: TURDEAN MARINELLA - BAZELE STATISTICII - Manual debv.ucdc.ro/bv/F_1_bazele-statisticii-turdean.pdf · 3 MARINELLA SABINA TURDEAN LIGIA PRODAN BAZELE STATISTICII - Manual de studiu

11

frecvenţă relativă; – studenţii vor putea prezenta şi caracteriza activităţile care

se desfăşoară în cadrul etapelor unei cercetări statistice; – studenţii vor putea aprecia că cercetarea statistică se axează

pe aspectul cantitativ, măsurabil al fenomenelor, fără să excludă aspectele calitative;

1.4 Timpul alocat unităţii de studiu

Pentru Unitatea de studiu „Noţiuni introductive”, timpul alocat este de 2 ore.

1.5 Conţinutul unităţii de studiu

1.5.1 Momente ale evoluţiei statisticii Principalele momente ale evoluţiei statisticii ca instrument de

cunoaştere a particularităţilor de nivel, volum, structură şi dinamică a fenomenelor şi proceselor economico-sociale sunt:

Activitatea de colectare a datelor Sub accepţiunea de colectare a datelor, statistica este atestată

de peste cinci milenii. Ea servea unor scopuri demografice, militare, administrative şi fiscale. În China, Grecia, Egipt şi teritoriile Imperiului Roman s-au descoperit documente din antichitate care consemnează forme incipiente de evidenţă a numărului şi mişcării populaţiei, a suprafeţei şi fertilităţii terenurilor agricole, a averilor particulare şi veniturilor statului.

Statistica descriptivă Numele acestei faze provine de la concepţia potrivit căreia

statistica se ocupa cu descrierea situaţiei geografice, economice şi politice a unui stat, trecând de la simpla înregistrare de date la analiza comparativă a acestora în timp şi în spaţiu.

Reprezentanţi de seamă ai acestei şcoli sunt: Herman Conrig, Giovanni Batero, Martin Smeitzel, Gottfied Achenwall (care a introdus termenul de “statistică” care derivă din cuvântul latin status, adică situaţie sau stare socială).

Aritmetica politică Numele acestei faze provine de la şcoala aritmeticii politice

apărută în Anglia în a doua jumătate a secolului al XVII-lea. Repre-zentanţii acestei şcoli au fost preocupaţi de găsirea regularităţilor cu care se produc fenomenele sociale şi economice, analizând datele prin procedee matematice. De asemenea, ei au urmărit ca, prin generalizarea informaţiilor obţinute pe baza unui număr mare de cazuri individuale să formuleze previziuni şi să interpreteze tendinţele de producere a fenomenelor economico-sociale. Şcoala aritmeticii politice este reprezentată de lucrările elaborate de William Petty, Edmund Halley şi John Graunt.

Faza probabilistică Progresul din domeniul matematicii, datorat introducerii

Page 12: TURDEAN MARINELLA - BAZELE STATISTICII - Manual debv.ucdc.ro/bv/F_1_bazele-statisticii-turdean.pdf · 3 MARINELLA SABINA TURDEAN LIGIA PRODAN BAZELE STATISTICII - Manual de studiu

12

calculului probabilităţilor, a determinat şi dezvoltarea statisticii, mai ales la sfârşitul secolului al XVIII-lea şi începutul secolului al XIX-lea. Reprezentanţi de seamă ai acestei etape au fost: B.L. Pascal, Fermat, A.I. Quetlet, J. Bonoulli, K.F. Gauss, P.S. Laplace, S.D. Poisson.

Statistica modernă Spre sfârşitul secolului al XIX-lea au apărut primele lucrări de

statistică inductivă. Sunt de remarcat contribuţiile teoretice şi practice ale lui F. Galton, R.A. Fisher, G.U. Yule, K. Pearson, M.G. Kendall, F.Y. Edgeworth, A.L. Bowley, C.E. Spearman, Markov.

1.5.2 Obiectul şi metoda statisticii Pe parcursul evoluţiei în timp, statistica şi-a conturat un obiect

de studiu şi o metodă proprie de cercetare. În accepţiunea de astăzi, statistica este o disciplină ştiinţifică, iar datorită pronunţatului caracter metodologic constituie, în acelaşi timp, şi o metodă de cercetare utilizată de alte discipline ştiinţifice.

Obiectul de studiu al statisticii îl constituie fenomenele de masă care se caracterizează prin faptul că: - se produc într-un număr mare de cazuri; - rezultă din acţiunea combinată a unui număr mare de factori de influenţă care acţionează cu grade de esenţialitate şi intensitate diferite (sunt fenomene complexe); - au forme individuale de manifestare în timp, în spaţiu sau din punct de vedere organizatoric (au un grad mare de variabilitate).

Având în vedere aceste trei principale caracteristici se poate afirma că statistica este ştiinţa colectării şi înţelegerii datelor iar gândirea statistică este orientată spre controlul şi reducerea variaţiei formelor concrete sub care se manifestă fenomenele.

Fenomenele de masă sunt fenomene de tip nedeterminist (sau stohastice) care se supun acţiunii legilor statistice. Aceste legi se manifestă sub formă de tendinţă care poate fi cunoscută şi verificată doar la nivelul ansamblului şi nu pentru fiecare caz în parte. Fenomenele de masă apar asemănătoare între ele, fiind rezultatul acţiunii diferite a aceloraşi factori de influenţă. Pentru un număr suficient de mare de cazuri individuale, utilizând metode specifice, statistica reţine ceea ce este esenţial şi tipic în forma de manifestare a fenomenelor, eliminând ceea ce este neesenţial, astfel încât factorii cu acţiune întâmplătoare se compensează reciproc.

Cercetarea statistică se axează pe aspectul cantitativ, concret, măsurabil al fenomenelor economico-sociale, fără să excludă aspectele calitative.

Procesul cunoaşterii statistice presupune existenţa şi urmărirea unui plan organizatoric şi a unui plan metodologic după care să se desfăşoare activităţile de cercetare propriu-zise.

Etapele cercetării statistice sunt: observarea statistică, prelucrarea datelor statistice, analiza şi interpretarea rezultatelor. În fiecare dintre aceste etape se are în vedere obiectivul, scopul final al demersului ştiinţific, în funcţie de care se enunţă problema în termeni statistici şi i se găseşte rezolvarea cu ajutorul metodelor statistice.

În prezent, o cercetare statistică se desfăşoară în două faze: statistica descriptivă şi statistica inferenţială.

Statistica descriptivă reprezintă totalitatea metodelor de culegere, sistematizare, rezumare şi prezentare a unui set de date referitoare la o colectivitate statistică. Tehnicile utilizate de statistica descriptivă sunt

Page 13: TURDEAN MARINELLA - BAZELE STATISTICII - Manual debv.ucdc.ro/bv/F_1_bazele-statisticii-turdean.pdf · 3 MARINELLA SABINA TURDEAN LIGIA PRODAN BAZELE STATISTICII - Manual de studiu

13

extrem de variate şi au evoluat de-a lungul timpului. Astăzi ne sunt familiare reprezentările grafice pe baza cărora informaţiile culese şi prelucrate sunt accesibile şi uşor de interpretat. Pentru sinteza datelor de masă se utilizează indicatori statistici, cel mai frecvent folosit fiind media aritmetică. Metodele statisticii descriptive reprezintă baza prezentării şi caracterizării cantitative a fenomenelor. Aplicarea statisticii în diferite domenii de cercetare este însă rezultatul dezvoltării metodelor statisticii inferenţiale.

Statistica inferenţială reprezintă totalitatea metodelor care permit estimarea caracteristicilor unei colectivităţi numeroase pe baza datelor obţinute în urma studierii unui eşantion reprezentativ. Generalizarea (extinderea) concluziilor de la eşantion la populaţia statistică are loc în termeni probabilistici cu recunoaşterea şi măsurarea gradului de incertitudine a rezultatelor, dar şi a nesiguranţei predicţiilor/ estimărilor.

1.5.3 Noţiuni fundamentale utilizate în statistică Definiţie Colectivitatea statistică denumită şi populaţie reprezintă

totalitatea cazurilor individuale, de acelaşi fel, formate pe bazainfluenţei aceloraşi cauze esenţiale. Colectivitatea statisticăconstituie obiectul supus cercetării statistice.

Exemple: populaţia României la 27 martie 2002, studenţii anului I, Universitatea Creştină “Dimitrie Cantemir”, anul universitar 2011 - 2012.

Colectivităţile statistice pot fi clasificate în colectivităţi statice sau colectivităţi dinamice.

Colectivităţile statice exprimă o stare şi au o anumită întindere în spaţiu formând un existent (stoc) la un moment dat. Exemplu: populaţia României la 27 martie 2002.

Colectivităţile dinamice exprimă un proces (flux), o devenire în timp. Caracterizarea acestora presupune înregistrarea elementelor componente într-un interval de timp. Exemplu: numărul de născuţi vii în luna august 2011 în judeţul Cluj; valoarea produselor fabricate la întreprinderea Mobexpert în lunile semestrului I, anul 2011.

În cazul colectivităţilor statice, timpul este constant, iar în cazul colectivităţilor dinamice, spaţiul şi forma organizatorică sunt constante.

Definiţie Unitatea statistică reprezintă forma individuală de

manifestare a fenomenului supus cercetării. Unităţile statistice sunt elementele constitutive ale colectivităţii

statistice. Unităţile statistice pot fi: simple sau complexe. Exemple de unităţi statistice simple ar fi: persoana (aparţine populaţiei), studentul (aparţine facultăţii), salariatul (aparţine societăţii comerciale), iar exemple de unităţile statistice complexe ar fi: familia, echipa, secţia, anul de studiu sau orice rezultat al organizării sociale şi economice a societăţii.

Unităţile statistice sunt purtătoare ale unor trăsături variabile în timp şi spaţiu.

Definiţie Caracteristicile statistice reprezintă trăsăturile (însuşirile)

fenomenelor studiate. În literatura de specialitate se mai utilizează expresiile

variabilă statistică sau variabilă aleatoare. Forma concretă de

Page 14: TURDEAN MARINELLA - BAZELE STATISTICII - Manual debv.ucdc.ro/bv/F_1_bazele-statisticii-turdean.pdf · 3 MARINELLA SABINA TURDEAN LIGIA PRODAN BAZELE STATISTICII - Manual de studiu

14

manifestare a unei caracteristici la nivelul unei unităţi a colectivi-tăţii se numeşte variantă sau valoare.

Caracteristicile statistice pot fi clasificate în funcţie de următorele criterii: 1. conţinutul caracteristicii 1.1 de timp - arată apartenenţa unităţilor statistice la un anumit moment sau o perioadă de timp; 1.2 de spaţiu - arata situarea în teritoriu a unităţii statistice; 1.3 atributive - orice caracteristică ce se poate exprima numeric sau prin cuvinte. 2. natura variaţiei caracteristicii 2.1. cu variaţie continuă - pot lua orice valori într-un interval dat; 2.2. cu variaţie discontinuă - caracteristici care nu pot lua decât valori dispuse la anumite intervale 3. modul de obţinere a informaţiei care caracterizează fenomenul 3.1. caracteristici primare - întâlnite la toate unităţile simple ale colectivităţii; 3.2. caracteristici derivate - întâlnite la nivelul unităţilor complexe ale colectivităţii; rezultă prin compararea a doi indicatori primari. 4. numărul variantelor de răspuns 4.1 caracteristici alternative - au doar două variante de răspuns 4.2 caracteristici nealternative - au mai multe variante de răspuns

Definiţie Datele statistice reprezintă caracterizarea numerică a unităţilor,

grupelor şi colectivităţilor studiate. Mesajul datelor îl constituieinformaţia statistică.

Definiţie Indicatorii statistici reprezintă expresia numerică a unor

categorii economice sau sociale definite în funcţie de timp, de spaţiuşi de structură organizatorică.

Indicatorii statistici pot fi clasificaţi în primari sau derivaţi (în funcţie de tipul caracteristicii primară sau derivată) şi în sintetici sau analitici (în funcţie de gradul de cuprindere a fenomenului studiat).Exprimarea numerică a unei categorii economice presupune folosirea mai multor indicatori, fiecare punând în evidenţă mai multe aspecte legate de categoria economică respectivă.

Definiţie Frecvenţa absolută reprezintă numărul de apariţii ale unei

variante într-o colectivitate. Definiţie

Frecvenţa relativă sau greutatea specifică este ponderea unei variante sau a unui grup de variante în totalul elementelor uneicolectivităţi.

1.5.4 Rolul statisticii în economie Indicatorii determinaţi în etapele de observare, prelucrare şi

analiză a datelor se utilizează pentru: cunoaşterea gradului de dezvoltare a economiei naţionale şi a

societăţii în general; stabilirea obiectivelor şi a direcţiilor de dezvoltare pentru viitor; elaborarea programelor de dezvoltare curenta şi de perspectivă; fundamentarea măsurilor ce trebuie luate în procesul decizional;

Page 15: TURDEAN MARINELLA - BAZELE STATISTICII - Manual debv.ucdc.ro/bv/F_1_bazele-statisticii-turdean.pdf · 3 MARINELLA SABINA TURDEAN LIGIA PRODAN BAZELE STATISTICII - Manual de studiu

15

urmărirea modului în care se realizează obiectivele stabilite; popularizarea datelor obţinute; realizarea unor comparaţii internaţionale.

1.6 Îndrumar pentru autoverificare

1.6.1 Sinteza unităţii de studiu

Statistica ne ajută să obţinem informaţii care să caracterizeze concret şi corect situaţia existentă, să înţelegem raporturile cauză - efect, să oferim o analiză pertinentă a datelor în scopul elaborării unor previziuni credibile şi să luăm deciziile cele mai bune în domeniul în care ne desfăşurăm activitatea.

Principalele momente ale evoluţiei statisticii ca instrument de cunoaştere a particularităţilor de nivel, volum, structură şi dinamică a fenomenelor şi proceselor economico-sociale sunt:

activitatea de colectare a datelor statistica descriptivă aritmetica politică faza probabilistică statistica modernă Pe parcursul evoluţiei în timp, statistica şi-a conturat un obiect de studiu şi o metodă proprie de

cercetare. Obiectul de studiu al statisticii îl constituie fenomenele de masă care se caracterizează prin faptul că:

se produc într-un număr mare de cazuri; rezultă din acţiunea combinată a unui număr mare de factori de influenţă care acţionează cu grade

de esenţialitate şi intensitate diferite (sunt fenomene complexe); au forme individuale de manifestare în timp, în spaţiu sau din punct de vedere organizatoric (au un grad

mare de variabilitate). Fenomenele de masă sunt fenomene de tip nedeterminist (sau stohastice) care se supun acţiunii

legilor statistice. Aceste legi se manifestă sub formă de tendinţă care poate fi cunoscută şi verificată doar la nivelul ansamblului şi nu pentru fiecare caz în parte.

Cercetarea statistică se axează pe aspectul cantitativ, concret, măsurabil al fenomenelor economico-sociale, fără să excludă aspectele calitative.

Procesul cunoaşterii statistice presupune existenţa şi urmărirea unui plan organizatoric şi a unui plan metodologic după care să se desfăşoare activităţile de cercetare propriu-zise.

Etapele cercetării statistice sunt: observarea statistică, prelucrarea datelor statistice, analiza şi interpretarea rezultatelor. În fiecare dintre aceste etape se are în vedere obiectivul, scopul final al demersului ştiinţific, în funcţie de care se enunţă problema în termeni statistici şi i se găseşte rezolvarea cu ajutorul metodelor statistice.

În prezent, o cercetare statistică se desfăşoară în două faze: statistica descriptivă şi statistica inferenţială. Noţiunile fundamentale utilizate în statistică sunt:

colectivitatea statistică unitatea statistică caracteristicile statistice datele statistice indicatorii statistici frecvenţa absolută frecvenţa relativă

Indicatorii determinaţi în etapele de observare, prelucrare şi analiză a datelor se utilizează pentru:

Page 16: TURDEAN MARINELLA - BAZELE STATISTICII - Manual debv.ucdc.ro/bv/F_1_bazele-statisticii-turdean.pdf · 3 MARINELLA SABINA TURDEAN LIGIA PRODAN BAZELE STATISTICII - Manual de studiu

16

cunoaşterea gradului de dezvoltare a economiei naţionale şi a societăţii în general; stabilirea obiectivelor şi a direcţiilor de dezvoltare pentru viitor; elaborarea programelor de dezvoltare curenta şi de perspectivă; fundamentarea măsurilor care trebuie luate în procesul decizional; urmărirea modului în care se realizează obiectivele stabilite; popularizarea datelor obţinute; realizarea unor comparaţii internaţionale.

1.6.2 Concepte şi termeni de reţinut

obiectul de studiu al statisticii; fenomene de masă; legi statistice fenomene deterministe şi fenomene nedeterministe observarea statistică prelucrarea datelor statistice analiza şi interpretarea rezultatelor statistica descriptivă, statistica inferenţială colectivitatea statistică unitatea statistică caracteristicile statistice datele statistice, indicatorii statistici frecvenţa absolută, frecvenţa relativă

1.6.3 Întrebări de control şi teme de dezbatere

1. Care sunt principalele momente în evoluţia statisticii? 2. Care este obiectul de studiu al statisticii? 3. Care sunt caracteristicile fenomenelor de masă? 4. Cum se manifestă legile statistice? 5. Care sunt principalele etape ale unei cercetări statistice? 6. Prin ce se caracterizează statistica descriptivă? 7. Prin ce se caracterizează statistica inferenţială? 8. Care este deosebirea dintre date statistice şi indicatori statisticii? 9. Care este deosebirea dintre frecvenţa absolută şi frecvenţa relativă? 10. Ce este colectivitatea statistică? 11. Ce este caracteristica statistică? 12. Definiţi noţiunea de „unitate statistică”. 13. Prezentaţi criteriile de clasificare a caracteristicilor statistice şi tipurile de caracteristici

corespunzătoare acestora. 14. Care este rolul statisticii în economie? 15. Care este indicatorul statistic cel mai frecvent utilizat pentru sinteza datelor de masă?

Page 17: TURDEAN MARINELLA - BAZELE STATISTICII - Manual debv.ucdc.ro/bv/F_1_bazele-statisticii-turdean.pdf · 3 MARINELLA SABINA TURDEAN LIGIA PRODAN BAZELE STATISTICII - Manual de studiu

17

1.6.4 Bibliografie:

1. Băcescu- Carbunaru, A., (2009) Statistică- bazele statisticii, Editura Universitară, Bucureşti; 2. Biji, M., Biji, E. M., Lilea, E., Anghelache, C., (2002), Tratat de statistică, Editura Economica,

Bucureşti 3. Druică, E., (2012), Statistică pe înţelesul tuturor, Editura CH Beck, Bucureşti; 4. Duguleană, L., (2012) Bazele statisticii economice, Editura CH Beck, Bucureşti; 5. Turdean, M., (2012), Statistica, Editura Pro Universitaria, Bucureşti;

Page 18: TURDEAN MARINELLA - BAZELE STATISTICII - Manual debv.ucdc.ro/bv/F_1_bazele-statisticii-turdean.pdf · 3 MARINELLA SABINA TURDEAN LIGIA PRODAN BAZELE STATISTICII - Manual de studiu

18

2 UNITATEA DE STUDIU 2 OBSERVAREA STATISTICĂ 2.1 Introducere 2.2 Obiectivele unităţii de studiu 2.3 Competenţele unităţii de studiu 2.4 Timpul alocat unităţii de invăţare 2.5 Conţinutul unităţii de studiu

2.5.1 Scopul observării statistice 2.5.2 Principiile care stau la baza observării statistice 2.5.3 Planul observării statistice 2.5.4 Clasificarea observărilor statistice 2.5.5 Erorile observării statistice 2.5.6 Controlul datelor statistice

2.6. Îndrumar pentru autoverificare 2.6.1 Sinteza unitatii de invatare 2.6.2 Concepte si termeni de retinut 2.6.3 Întrebări de control şi teme de dezbatere 2.6.4 Bibliografie

2.1 Introducere

Prima etapă a unei cercetări statistice constă în culegerea datelor referitoare la nivelul, structura şi modificările în dinamică ale fenomenelor datorate complexităţii factorilor care acţionează asupra acestora. Observarea statistică se desfăşoară pe baza unor principii şi a unui plan al observării care urmăresc autenticitatea datelor şi prevenirea erorilor de observare.

2.2 Obiectivele unităţii de studiu

– cunoaşterea cadrului general în care se desfăşoară observarea statistică ;

– definirea noţiunii de observare statistică; – cunoaşterea etapelor planului de observare statistică; – clasificarea observărilor statistice; – cunoaşterea erorilor care pot apare în procesul de observare

şi modalităţile de prevenire a acestora; – cunoaşterea modalităţilor de control a datelor statistice

2.3 Competenţele unităţii de studiu:

– studenţii vor putea să definească noţiuni precum observarea statistică, erori de oservare, controlul datelor statistice;

– studenţii vor cunoaşte principalele probleme metodologice şi organizatorice pe care le implică realizarea unui plan de observare statistică;

Page 19: TURDEAN MARINELLA - BAZELE STATISTICII - Manual debv.ucdc.ro/bv/F_1_bazele-statisticii-turdean.pdf · 3 MARINELLA SABINA TURDEAN LIGIA PRODAN BAZELE STATISTICII - Manual de studiu

19

– studenţii vor putea să clasifice observările statistice în funcţie de modul de organizare a observării, modul de caracterizare a fenomenelor observate, după timpul la care se referă datele sau după numărul unităţilor înregistrate

– studenţii vor putea să descrie principalele tipuri de observări statistice

– studenţii vor putea să distingă erorile de observare întâmplătoare de erorile de observare sistematice;

– studenţii vor putea să identifice principalele surse ale erorilor de observare întâmplătoare;

– studenţii vor şti cum pot fi prevenite erorile de observare; – studenţii vor cunoaşte şi vor putea utiliza metode de

control a datelor culese în etapa observării statistice

2.4 Timpul alocat unităţii de studiu:

Pentru unitatea de studiu „Observarea statistică” timpul alocat este de 2 ore.

2.5 Conţinutul unităţii de studiu

2.5.1 Scopul observării statistice Scopul observării statistice este subordonat scopului general

pentru care s-a organizat cercetarea statistică. Statisticianul este interesat de cunoaşterea situaţiei existente în legătură cu: nivelul fenomenului la un moment dat; structura fenomenului la un moment dat; modificările în dinamică privind nivelul şi structura

fenomenului; interdependenţa cu alte fenomene.

Definiţie Observarea statistică este etapa de culegere a informaţiilor

referitoare la aspectele sub care se prezintă fenomenele.

2.5.2 Principiile care stau la baza observării statistice

Principiile care stau la baza observării statistice sunt: 1. Datele culese să fie reale; 2. Datele să se refere la caracteristicile care răspund cel mai bine scopului observării propus; 3. Culegerea datelor să se realizeze în condiţii obiective, fără preferinţe din partea cercetătorilor.

2.5.3 Planul observării statistice

Pentru buna desfăşurare a unei observări statistice trebuie rezolvate probleme cu caracter metodologic şi organizatoric care constituie, de fapt, planul de observare statistică. 2.5.3.1 Problemele metodologice Problemele metodologice se referă la: a) Stabilirea scopului observării, respectiv cunoaşterea situaţiei

Page 20: TURDEAN MARINELLA - BAZELE STATISTICII - Manual debv.ucdc.ro/bv/F_1_bazele-statisticii-turdean.pdf · 3 MARINELLA SABINA TURDEAN LIGIA PRODAN BAZELE STATISTICII - Manual de studiu

20

existente în ceea ce priveşte nivelul şi structura fenomenului la un moment dat, modificările în dinamică, interdependenţele cu alte fenomene. b) Obiectul observării îl formează colectivitatea cercetată, adică mulţimea unităţilor statistice înregistrate împreună cu variabilele (caracteristicile) stabilite. Nu întotdeauna obiectul observării coincide cu obiectul cercetării; în cazul selecţiei se observă doar un eşantion, iar rezultatele cercetării se vor extinde asupra întregii colectivităţi analizate. c) Unitatea de observare (unitatea statistică) trebuie stabilită foarte precis pentru a se obţine date exacte, comparabile în timp şi spaţiu. d) Programul observării constă în: stabilirea caracteristicilor ce trebuie să fie înregistrate, stabilirea modalităţilor concrete de culegere a datelor şi încadrarea în timp şi spaţiu a activităţii de obţinere a informaţiilor. e) Formularele şi instrucţiunile de înregistrare se prezintă sub formă de fişe şi liste. Fişa se completează pentru o singură unitate de observare şi se foloseşte când programul observării este foarte vast sau când unităţile de înregistrat sunt răspândite în teritoriu. Lista este un formular colectiv în care se înregistrează răspunsurile la întrebările din programe pentru mai multe unităţi concentrate în spaţiu. Formularele de înregistrare sunt însoţite de norme metodologice imprimate direct pe formular sau anexate în broşuri separate. f)Timpul observării vizează două aspecte 1) stabilirea timpului la care se referă datele înregistrate şi care poate fi: 1.1) un moment critic - pentru înregistrările care surprind fenomenul în mod static (la începutul sau la sfârşitul unei perioade de timp). Exemple: recensămintele sau inventarele. 1.2) o întreagă perioadă de timp - pentru observările de tip continuu. Exemple: luna, trimestrul, anul. 2) stabilirea timpului când are loc efectiv înregistrarea, adică intervalul/durata înregistrării, care de regulă, este un interval cu date limite precise. g) Locul observării şi unitatea care raportează se stabilesc cu scopul de a găsi/identifica mai uşor unităţile de observare; în general locul observării coincide cu locul unde este amplasat/ se manifestă fenomenul studiat. 2.5.3.2. Probleme organizatorice Problemele organizatorice se referă la asigurarea celor mai bune condiţii pentru desfăşurarea observării propriu-zise şi presupune: studierea materialelor rezultate din cercetări anterioare similare; întocmirea listelor unităţilor de înregistrare, a hărţilor teritoriului; recrutarea şi instruirea personalului pentru culegerea datelor; redactarea şi tipărirea formularelor şi a instrucţiunilor popularizarea acţiunii.

2.5.4 Clasificarea observărilor statistice Observările statistice pot fi clasificate în funcţie de următoarele criterii: 1. modul de organizare a observării 1.1 observări permanente 1.2 observări special organizate 1.2.1 recensământul 1.2.2 observarea selectivă

Page 21: TURDEAN MARINELLA - BAZELE STATISTICII - Manual debv.ucdc.ro/bv/F_1_bazele-statisticii-turdean.pdf · 3 MARINELLA SABINA TURDEAN LIGIA PRODAN BAZELE STATISTICII - Manual de studiu

21

1.2.3 anchetele statistice 1.2.4 monografia statistică

2. timpul la care se referă datele 2.1 observări statistice curente (rapoarte statistice) 2.2 observări statistice periodice 2.3 observări statistice unice (ocazionale) 3. numărul unităţilor înregistrate 3.1 observări statistice totale 3.2 observări statistice parţiale 3.3 observări ale părţii principale 4. modul de caracterizare a fenomenelor observate 4.1 observări statice 4.2 observări dinamice Observările permanente se realizează prin sistemul raportărilor statistice şi au ca principiu autenticitatea datelor. Observările special organizate se utilizează pentru a completa informaţiile statistice obţinute prin observările permanente. Acestea se organizează când fenomenul ce urmează a fi cercetat nu face obiectul unei observări permanente. Recensământul este cea mai veche formă de observare statistică. Termenul provine de la cuvântul latin “census”, care avea semnificaţia de “listă cu starea persoanelor şi a averilor”. Cea mai des întâlnită formă de recensământ este “recensământul populaţiei” împreună cu principalele caracteristici demografice şi socio-economice. Recensământul este o înregistrare totală cu caracter periodic, care urmăreşte cunoaşterea fenomenelor la un moment dat. Pentru buna organizare a unui recensământ se respectă următoarele principii: universalitatea - presupune cuprinderea totalităţii populaţiei

unui teritoriu; simultaneitatea - presupune culegerea informaţiilor de la

unităţile statistice pentru un anumit moment de timp prestabilit în programul observării ;

stabilitatea - se organizează atunci când colectivitatea statistică prezintă o stabilitate maximă din punct de vedere economico-social;

periodicitatea - se organizează, în principiu, o data la 10 ani; comparabilitatea datelor; posibilitatea cuprinderii unui număr mare de caracteristici

în program; caracterul ştiinţific şi aplicativ general al recensământului.

În prezent, există un program mondial al recensămintelor naţionale ale populaţiei şi locuinţelor elaborat încă din 1958 de Comisia de Statistică a O.N.U., care trebuie însă adaptat la principiul de maximă stabilitate a colectivităţilor. Observarea selectivă va fi tratată, pe larg, în capitolul „Cercetarea selectivă” . Ancheta statistică constă în completarea benevolă a unuia sau a mai multor formulare, în mod direct sau transmise prin poştă. Rezultatele anchetelor statistice sunt orientative, deoarece nu se pune condiţia reprezentativităţii unităţilor. Se organizează cu ocazia târgurilor sau a expoziţiilor, pentru a obţine din partea vizitatorilor, eventuali sau viitori consumatori, date referitoare la cererea de mărfuri. Exemple: în prezent, Institutul Naţional de Statistică organizează ancheta“ Forţa de muncă în România – ocupare şi şomaj” (AMIGO), care este o cercetare

Page 22: TURDEAN MARINELLA - BAZELE STATISTICII - Manual debv.ucdc.ro/bv/F_1_bazele-statisticii-turdean.pdf · 3 MARINELLA SABINA TURDEAN LIGIA PRODAN BAZELE STATISTICII - Manual de studiu

22

statistică trimestrială a pieţei forţei de muncă şi “Ancheta integrată în gospodării” (AIG), care urmăreşte reflectarea nivelului de trai şi a condiţiilor de viaţă. Monografia statistică este rezultatul observării statistice a unei singure unităţi statistice complexe (întreprindere, instituţie, localitate, zonă geografică). Ea urmăreşte şi analizează elementele noi apărute în organizarea activităţii economico-sociale din unitatea complexă supusă studiului, elemente despre care se presupune că vor deveni fenomene de masă. O caracteristică specifică monografiei este că munca de cercetare, de la culegerea datelor la interpretarea lor, se face în mod unitar, de către aceeaşi echipă de specialişti. În cadrul observărilor statistice curente (rapoarte statistice), înregistrarea are loc permanent. Exemplu: înregistrarea fenomenelor demografice. Observările statistice periodice se realizează la un anumit interval de timp. Exemplu: recensământul Observările statistice unice (ocazionale) sunt observări speciale care se organizează pentru consemnarea unui eveniment nerepetabil. Observările statistice totale au ca obiectiv culegerea datelor de la toate unităţile statistice. Observările statistice parţiale se mai numesc observări statistice prin sondaj sau selecţii. Acestea se organizează atunci când nu se poate organiza o observare totală, care nu ar fi justificată din punct de vedere a oportunităţii, economicităţii şi condiţiilor de realizare. În aceste cazuri datele se culeg numai pentru o parte a colectivităţii studiate, urmând ca rezultatele să fie extinse la nivelul întregii colectivităţi. Partea colectivităţii supusă observării se numeşte eşantion sau mostră şi trebuie să fie reprezentativă pentru întreaga colectivitate. Observarea părţii principale are loc atunci când se studiază o colectivitate care prezintă variaţii calitative substanţiale de la o grupă la alta, astfel încât unele grupe au o influenţă hotărâtoare în formarea indicatorilor pentru întreaga colectivitate, în timp ce alte grupe au o influenţă nesemnificativă. În acest caz este suficient să se supună observării numai partea principală a colectivităţii şi, cu anumite rezerve, să se caracterizeze întregul ansamblu. Informaţiile culese nu au caracter reprezentativ ci oferă doar o informaţie orientativă asupra tendinţelor ce se manifestă la nivelul întregului ansamblu. Observările statice surprind fenomenele la un moment dat urmărind doar caracterizarea nivelului şi structurii fenomenului studiat. Observările dinamice presupun înregistrarea datelor care se referă la o anumită perioadă de timp şi permit analiza variaţiei produse în volumul şi structura colectivităţilor statistice, dar şi tendinţele de dezvoltare.

2.5.5 Erorile observării statistice Asigurarea autenticităţii datelor constituie principiul de bază al organizării unei observări statistice. Practica observărilor statistice a demonstrat, că se pot produce erori de înregistrare, care sunt cu atât mai numeroase, cu cât cercetarea are o mai mare amploare. Pot fi considerate surse de erori: inconstanţa în timp a unităţii de observare; limitele puterii de observare umană; definirea incompleta a unităţii de observare;

Page 23: TURDEAN MARINELLA - BAZELE STATISTICII - Manual debv.ucdc.ro/bv/F_1_bazele-statisticii-turdean.pdf · 3 MARINELLA SABINA TURDEAN LIGIA PRODAN BAZELE STATISTICII - Manual de studiu

23

imperfecţiuni ale metodelor şi mijloacelor de observare. Definiţie Erorile de observare sunt abateri ale datelor înregistrate de

la mărimea reală (concretă) a caracteristicilor studiate. În funcţie de caracterul lor, erorile de observare pot fi

clasificate în erori întâmplătoare şi erori sistematice.

2.5.5.1. Erorile de observare întâmplătoare Abaterile de la realitate ce se produc, de regulă, în ambele sensuri se numesc erori de observare întâmplătoare. Acestea se pot datora: neînţelegerii întrebărilor, neatenţiei subiectului care se intervievează, faptului că nu-şi amintesc realitatea, interpretării greşite a întrebării, considerentelor de prestigiu, personalităţii anchetatorului care poate influenţa răspunsul; în

cazul în care observarea se referă la un număr suficient de mare de unităţi statistice, aceste erori se pot compensa reciproc.

2.5.5.2. Erorile de observare sistematice Erorile care denaturează realitatea într-un singur sens influenţând rezultatele cercetării, respectiv indicatorii de ansamblu, se numesc erori de observare sistematice. 2.5.5.3. Prevenirea erorilor Prevenirea erorilor are ca scop asigurarea autenticităţii datelor. În procesul de prelucrare statistică, datele îşi pierd individualitatea, iar erorile se vor regăsi în valoarea indicatorilor derivaţi. Prevenirea propriu-zisă a erorilor se face prin: testarea tehnicilor şi formularelor de înregistrare;

instruirea adecvată a personalului, inclusiv pregătire psihologică şi inspecţii de îndrumare pe teren; popularizarea acţiunilor şi formarea convingerilor populaţiei.

2.5.6 Controlul datelor statistice Controlul statistic poate fi direct – de volum, aritmetic şi logic- sau indirect – extern, intern. Controlul statistic de volum urmăreşte completarea integrală a tuturor formularelor. Controlul aritmetic (cantitativ) presupune efectuarea unor operaţii aritmetice prin care se verifică selectiv indicatorii numerici din formulare (totalurile, diferenţele). Controlul logic (calitativ) constă în compararea răspunsurilor primite la două sau mai multe întrebări între care există relaţii de interdependenţă, deci o legătură logică. Controlul logic poate fi efectuat şi pe baza unor întrebări înscrise în formularele de înregistrare tocmai în acest scop. Controlul extern presupune compararea datelor obţinute în urma observării cu date referitoare la fapte, evenimente şi fenomene cunoscute. Controlul intern presupune obţinerea aceloraşi informaţii pe mai multe căi.

Page 24: TURDEAN MARINELLA - BAZELE STATISTICII - Manual debv.ucdc.ro/bv/F_1_bazele-statisticii-turdean.pdf · 3 MARINELLA SABINA TURDEAN LIGIA PRODAN BAZELE STATISTICII - Manual de studiu

24

2.6 Îndrumar pentru autoverificare

2.6.1 Sinteza unităţii de studiu

Scopul observării statistice este subordonat scopului general pentru care s-a organizat cercetarea statistică. Statisticianul este interesat de cunoaşterea situaţiei existente în legătură cu: nivelul fenomenului la un moment dat; structura fenomenului la un moment dat; modificările în dinamică privind nivelul şi structura fenomenului; interdependenţa cu alte fenomene. Observarea statistică este etapa de culegere a informaţiilor referitoare la aspectele sub care se prezintă fenomenele.

Principiile care stau la baza observării statistice sunt: datele culese să fie reale; datele să se refere la caracteristicile care răspund cel mai bine scopului observării propus; culegerea datelor să se realizeze în condiţii obiective, fără preferinţe din partea cercetătorilor.

Pentru buna desfăşurare a unei observări statistice trebuie rezolvate probleme cu caracter metodologic şi organizatoric care constituie, de fapt, planul de observare statistică.

Problemele metodologice se referă la: stabilirea scopului observării, stabilirea obiectului observării. stabilirea unităţii de observare (unitatea statistică) stabilirea programului observării. elaborarea formularelor şi instrucţiunilor de înregistrare stabilirea timpului observării stabilirea locului observării şi a unitatăţii care raportează Problemele organizatorice se referă la asigurarea celor mai bune condiţii pentru desfăşurarea observării propriu-zise şi presupune: studierea materialelor rezultate din cercetări anterioare similare; întocmirea listelor unităţilor de înregistrare, a hărţilor teritoriului; recrutarea şi instruirea personalului pentru culegerea datelor; redactarea şi tipărirea formularelor şi a instrucţiunilor popularizarea acţiunii.

Observările statistice pot fi clasificate în funcţie de următoarele criterii: modul de organizare a observării timpul la care se referă datele numărul unităţilor înregistrate modul de caracterizare a fenomenelor observate

Asigurarea autenticităţii datelor constituie principiul de bază al organizării unei observări statistice. Practica statistică a demonstrat, că se pot produce erori de înregistrare, care sunt cu atât mai numeroase, cu cât cercetarea este de mai mare amploare.

Erorile de observare sunt abateri ale datelor înregistrate de la mărimea reală (concretă) a caracteristicilor studiate.

În funcţie de modul de apariţie, erorile de observare pot fi clasificate în erori întâmplătoare şi erori sistematice.

Controlul statistic poate fi direct – de volum, aritmetic şi logic- sau indirect – extern, intern.

Page 25: TURDEAN MARINELLA - BAZELE STATISTICII - Manual debv.ucdc.ro/bv/F_1_bazele-statisticii-turdean.pdf · 3 MARINELLA SABINA TURDEAN LIGIA PRODAN BAZELE STATISTICII - Manual de studiu

25

2.6.2 Concepte şi termeni de reţinut observarea statistică; principiile observării statistice; tipuri de observări statistice; observări permanente, observări special organizate; observări totale, observări parţiale; observări statice, observări dinamice; eroare de observare erori de observare întâmplătoare şi erori de observare sistematice; controlul datelor statistice

2.6.3 Întrebări de control şi teme de dezbatere 1. Definiţi noţiunea de observare statistică. 2. Care este scopul observărilor statistice? 3. Enumeraţi principiile care stau la baza observării statistice? 4. Enumeraţi problemele metodologice care trebuie rezolvate în cadrul unui plan de observare

statistică. 5. Enumeraţi problemele organizatorice care trebuie rezolvate în cadrul unui plan de observare

statistică. 6. Prezentaţi criteriile de clasificare ale observărilor statistice precum şi tipurile de observări

corespunzătoare acestora. 7. Care sunt principiile de organizare ale recensământului populaţiei? 8. Definiţi noţiunea de eroare de observare. 9. Cum se pot clasifica erorile de observare în funcţie de modul de apariţie? 10. Caracterizaţi pe scurt principalele tipuri de control statistic.

Page 26: TURDEAN MARINELLA - BAZELE STATISTICII - Manual debv.ucdc.ro/bv/F_1_bazele-statisticii-turdean.pdf · 3 MARINELLA SABINA TURDEAN LIGIA PRODAN BAZELE STATISTICII - Manual de studiu

26

2.6.4 Bibliografie:

1. Băcescu- Carbunaru, A., (2009) Statistică- bazele statisticii, Editura Universitară, Bucureşti; 2. Biji, M., Biji, E. M., Lilea, E., Anghelache, C., (2002), Tratat de statistică, Editura Economica,

Bucureşti 3. Druică, E., (2012), Statistică pe înţelesul tuturor, Editura CH Beck, Bucureşti; 4. Duguleană, L., (2012) Bazele statisticii economice, Editura CH Beck, Bucureşti; 5. Turdean, M., (2012), Statistica, Editura Pro Universitaria, Bucureşti;

Page 27: TURDEAN MARINELLA - BAZELE STATISTICII - Manual debv.ucdc.ro/bv/F_1_bazele-statisticii-turdean.pdf · 3 MARINELLA SABINA TURDEAN LIGIA PRODAN BAZELE STATISTICII - Manual de studiu

27

3 UNITATEA DE STUDIU 3 PRELUCRAREA DATELOR STATISTICE 3.1 Introducere 3.2 Obiectivele unităţii de studiu 3.3 Competenţele unităţii de studiu 3.4 Timpul alocat unităţii de invăţare 3.5 Conţinutul unităţii de studiu

3.5.1 Planul prelucrării datelor statistice 3.5.2 Centralizarea datelor statistice 3.5.3 Metoda grupării

3.6 Aplicaţii practice 3.7 Îndrumar pentru autoverificare 3.7.1 Sinteza unitatii de invatare 3.7.2 Concepte si termeni de retinut 3.7.3 Întrebări de control şi teme de dezbatere 3.7.4 Bibliografie

3.1 Introducere

Prelucrarea datelor statistice este a doua etapă a cercetării statistice şi are ca scop: (i) centralizarea şi sistematizarea datelor culese în etapa observării statistice; (ii) calculul sistemului de indicatori statistici care caracterizează numeric fenomenele şi procesele studiate; (iii) prezentarea rezultatelor prelucrării sub formă de repartiţii, serii, tabele şi grafice.

3.2 Obiectivele unităţii de studiu

– prezentarea scopului prelucrării datelor statistice; – prezentarea metodelor de sistematizare a datelor; – prezentarea metodologiei de grupare a datelor; – recunoaşterea diferitelor tipuri de grupări statistice; – cunoaşterea recomandărilor privind realizarea unor grupări

adecvate scopului cercetării statistice – cunoaşterea funcţiilor pe care le îndeplinesc grupările

statistice

3.3 Competenţele unităţii de studiu:

– studenţii vor putea să definească noţiuni precum: planul prelucrării statistice, centralizarea datelor statistice, grupare statistică, grupă omogenă, caracteristică de grupare;

– studenţii vor putea să sistematizeze datele rezultate din observare prin centralizare simplă sau pe grupe;

– studenţii vor putea să identifice acele variabile de grupare

Page 28: TURDEAN MARINELLA - BAZELE STATISTICII - Manual debv.ucdc.ro/bv/F_1_bazele-statisticii-turdean.pdf · 3 MARINELLA SABINA TURDEAN LIGIA PRODAN BAZELE STATISTICII - Manual de studiu

28

care corespund cel mai bine scopului cercetării statistice; – studenţii vor putea identifica şi caracteriza tipurile de

grupări statistice; – studenţii vor avea capacitatea de a aplica metodologia de

obţinere a grupărilor utilizând intervale egale sau inegale de variaţie.

3.4 Timpul alocat unităţii de studiu:

Pentru Unitatea de studiu „Prelucrarea datelor statistice”, timpul alocat este de 2 ore.

3.5 Conţinutul unităţii de studiu

3.5.1 Planul prelucrării datelor statistice Planul prelucrării statistice presupune rezolvarea unor

probleme metodologice – stabilirea caracteristicilor primare şi derivate, alegerea metodelor şi procedeelor de calcul statistic - şi organizatorice – stabilirea locului prelucrării şi a timpului aferent acestei operaţiuni, modul de transmitere a rezultatelor prelucrării

3.5.2 Centralizarea datelor statistice Centralizarea datelor statistice are ca scop obţinerea unei imagini

de ansamblu asupra fenomenului studiat. Definiţie Centralizarea datelor constă în strângerea la locul prelucrării a

tuturor informaţiilor şi apoi în determinarea indicatorilor totalizatoripentru toate caracteristicile însumabile direct sau care admit uncoeficient de echivalenţă.

Indicatorii totalizatori se mai numesc indicatori absoluţi şi au

unităţi de măsură concrete - tone, hectare, lei, metri. Aceşti indicatori constituie baza informaţională a cunoaşterii statistice şi sunt urmăriţi statistic la toate structurile organizatorice ale economiei naţionale. Centralizarea datelor poate fi: (1) simplă şi (2) pe grupe.

3.5.2.1. Centralizarea simplă Centralizarea simplă presupune agregarea valorilor

individuale ale caracteristicilor pentru toate unităţile colectivităţii, care permit însumarea (din punct de vedere al conţinutului indicatorului). În acest mod se obţin indicatorii totalizatori. Prin centralizare simplă se obţin informaţii privind numărul/volumul unităţilor care compun colectivitatea, dar şi alte informaţii generale necesare în prelucrarea datelor.

Nivelul totalizat al caracteristicii nu este suficient pentru studierea colectivităţii. Este foarte important să cunoaştem nivelul totalizat pe subcolectivităţile omogene din punct de vedere al caracteristicii de grupare. Exemplu: în cazul recensământului populaţia a fost grupată (1) pe judeţe, (2) pe categorii socio-profesionale, (3) în funcţie de sex, (4) vârstă, (5) naţionalitate (5) religie.

Page 29: TURDEAN MARINELLA - BAZELE STATISTICII - Manual debv.ucdc.ro/bv/F_1_bazele-statisticii-turdean.pdf · 3 MARINELLA SABINA TURDEAN LIGIA PRODAN BAZELE STATISTICII - Manual de studiu

29

3.5.2.2. Centralizarea pe grupe Centralizarea pe grupe constă în gruparea datelor şi

calcularea indicatorilor totalizatori parţiali pe fiecare grupă, iar pe baza lor a indicatorilor totalizatori generali corespunzători întreagii colectivităţi. Centralizarea pe grupe presupune sistematizarea şi pregătirea datelor obţinute în timpul observării statistice în vederea aplicării metodelor şi procedeelor de calcul şi analiza statistică. Pe baza sistematizării informaţiilor prin centralizare simplă sau pe grupe, se poate emite ipoteza existenţei sau inexistenţa unei eventuale legături statistice între variabilele înregistrate.

3.5.3 Metoda grupării 3.5.3.1. Noţiuni introductive Metoda grupării este metoda de bază utilizată în prelucrarea

datelor statistice: Metoda grupării statistice presupune împărţirea unităţilor

statistice în grupe omogene în funcţie de variaţia uneia sau a mai multor caracteristici care se numesc factori de grupare.

În procesul prelucrării datelor, metoda grupării se utilizează pentru:

i. sistematizarea şi omogenizarea datelor obţinute în cadrul observării statistice;

ii. evidenţierea structurii unei colectivităţi la un moment dat sau într-o anumită perioadă, precum şi a mutaţiilor produse în timp şi/sau spaţiu;

iii. stabilirea interdependenţelor, respectiv a formei legăturilor dintre fenomene;

iv. evidenţierea relaţiilor cauză - efect. Definiţie Caracteristica de grupare este acea variabilă faţă de care

unităţile colectivităţii sunt repartizate în grupe distincte, cât mai omogene.

Definiţie Grupa omogenă este clasa de unităţi statistice în interiorul căreia

variaţia caracteristicii este minimă. Definiţie

Variabilitatea este proprietatea / însuşirea / capacitatea caracteristicii statistice de a înregistra mai multe valori numerice sau forme de manifestare.

Definiţie Amplitudinea variaţiei reprezintă câmpul de împrăştiere a

valorilor individuale ale unei caracteristici

Amplitudinea variaţiei se calculează conform relaţiei: A = xmax - xmin

unde: A = amplitudinea variaţiei; xmax = valoarea maximă a caracteristicii; xmin = valoarea minimă a caracteristicii

3.5.3.2. Clasificarea grupărilor Grupările statistice se pot clasifica în funcţie de următoarele

criterii 1. numărul caracteristicilor 1.1. grupări simple 1.2. grupări combinate

Page 30: TURDEAN MARINELLA - BAZELE STATISTICII - Manual debv.ucdc.ro/bv/F_1_bazele-statisticii-turdean.pdf · 3 MARINELLA SABINA TURDEAN LIGIA PRODAN BAZELE STATISTICII - Manual de studiu

30

2. conţinutul caracteristicilor 2.1. grupări cronologice 2.2. grupări teritoriale 2.3. grupări după o caracteristică atributivă forma de exprimare a caracteristicii atributive 2.3.1. grupări calitative (exprimate prin cuvinte) 2.3.2. grupări cantitative (exprimate numeric) tipul variaţiei caracteristicii cantitative 2.3.2.1. grupări pe variante 2.3.2.2. grupări pe intervale amplitudinea variaţiei caracteristicii de grupare 2.3.2.2.1. grupări pe intervale egale

2.3.2.2.2. grupări pe intervale neegale 1.1. În cazul grupării simple repartizarea unităţilor statistice

din colectivitatea generală are loc în funcţie de variaţia unei singure caracteristici. Pe baza grupărilor simple se pot stabili frecvenţele corespunzătoare fiecărei grupe, valorile centralizate pentru caracteristica de grupare, dar şi pentru celelalte caracteristici care au fost urmărite în procesul de observare statistică. Grupările simple se prezintă în tabele simple.

1.2. În cazul grupării combinate repartizarea unităţilor statistice din colectivitatea statistică are loc în funcţie de două sau mai multe caracteristici. Metodologia obţinerii grupărilor combinate constă iniţial, în separarea unităţilor statistice în mai multe grupe în funcţie de variaţia primei caracteristici, iar apoi fiecare grupă se separă pe subgrupe în funcţie de variaţia celei de-a doua caracteristici, ş.a.m.d. Grupările combinate se prezintă în tabele combinate.

Grupările cronologice şi teritoriale sunt determinate de condiţiile obiective de timp şi spaţiu în care se produc fenomenele.

2.1. Nu orice înşiruire de date după variabila timp poate fi asimilată unei grupări cronologice. Timpul trebuie să determine o structurare calitativă a colectivităţii pentru a corespunde principiilor grupării statistice. Exemplu: gruparea societăţilor comerciale din judeţul Cluj, după anul înfiinţării.

2.2. Grupările teritoriale sunt utilizate pentru a separa unităţile colectivităţii pe grupe după criteriul “spaţiu”. În scopul obţinerii unei grupări teritoriale, trebuie ca variaţia în spaţiu să constituie o caracteristică determinantă pentru datele care se grupează. Exemple: grupări teritorial-administrative, grupări pe zone geografice, grupări pe regiuni.

2.3. Gruparea după o caracteristică atributivă constă în repartizarea unităţilor colectivităţii în funcţie de trăsăturile specifice ale acestora. Grupările atributive se folosesc pentru toate caracteris-ticile care au fost cuprinse în programul observării, în afara caracteristicilor de timp şi de spaţiu. Ele pot fi caracteristici cantitative (numerice) sau caracteristici calitative (nenumerice). Exemple de caracteristici atributive pentru gruparea populaţiei ar fi: vârsta, starea civilă, profesia, ocupaţia.

2.3.1. Grupările calitative, adică cele realizate după o caracteristică atributivă exprimată prin cuvinte (exemple: clasificări ale economiei naţionale, nomenclatorul profesiilor din economie) sunt cele mai omogene, deoarece în aceeaşi grupă se includ unităţi care, din punct de vedere a caracteristicii de grupare nu prezintă variaţie. Exemplu: grupa frezorilor, din punct de vedere a denumirii meseriei grupa este omogenă, dar poate prezenta o

Page 31: TURDEAN MARINELLA - BAZELE STATISTICII - Manual debv.ucdc.ro/bv/F_1_bazele-statisticii-turdean.pdf · 3 MARINELLA SABINA TURDEAN LIGIA PRODAN BAZELE STATISTICII - Manual de studiu

31

variaţie statistică în funcţie de alte caracteristici cum ar fi: vârsta, vechimea în muncă, gradul de îndemânare.

2.3.2. Grupările după caracteristici atributive exprimate numeric se mai numesc grupări cantitative. Ele pot avea variaţie discretă (variante, tipuri) sau variaţie continua (variaţie pe intervale).

2.3.2.1. Grupările pe variante se întâlnesc, atunci când caracteristica statistică are variaţie discretă, amplitudinea variaţiei este foarte mică şi practic se înregistrează un număr mic de valori distincte, fiecare valoare fiind, de fapt o grupă. Exemple: gruparea familiilor în funcţie de numărul de membri, gruparea locuinţelor în funcţie de numărul de camere, gruparea studenţilor în funcţie de nota obţinută la examen.

2.3.2.2. Grupările pe intervale se constituie atunci când gradul de variaţie a caracteristicii este mare, deci gruparea pe variante ar conduce la un număr foarte mare de clase. Intervalul de variaţie constă într-un număr de variante despărţit de restul colectivităţii prin două limite - inferioară şi superioară. Exemple: grupe de angajaţi în funcţie de mărimea salariului, grupe de societăţi comerciale în funcţie de mărimea profitului.

2.3.2.2.1. Grupările pe intervale egale se utilizează atunci când amplitudinea variaţiei caracteristicii este moderată şi permite alegerea unei mărimi egale a intervalelor, astfel că numărul grupelor să nu modifice forma de variaţie a respectivei caracteristici.

2.3.2.2.2. Grupările pe intervale neegale se utilizează atunci când amplitudinea variaţiei este foarte mare sau pentru grupări tipologice. Exemplu: gruparea agenţilor economici în mici, mijlocii şi mari în funcţie de cifra de afaceri, profit sau valoarea capitalului fix.

3.5.3.3. Metodologia de obţinere a grupărilor Obţinerea grupărilor presupune parcurgerea următoarelor etape:

1.Calculul amplitudinii variaţiei: A = xmax - xmin 2. Stabilirea numărului de grupe “k” în funcţie de: (a) numărul de unităţi înregistrate, (b) câmpul de împrăştiere a variantelor, (c) experienţa specialistului, (d) scopul observării statistice. 3. Stabilirea mărimii intervalului de grupare (h) prin raportarea amplitudinii variaţiei (A) la numărul de grupe (k), conform relaţiei:

k

Ah

Când nu se cunoaşte numărul de grupe, mărimea intervalului de grupare poate fi determinată şi cu ajutorul formulei lui H. A. STURGES:

nlog322.31minxmaxx

h

unde: n = numărul unităţilor observate. 4. Stabilirea limitelor grupelor se realizează pornind de la valoarea minimă înregistrată la care se adaugă mărimea intervalului de grupare sau pornind de la valoarea maximă înregistrată din care se scade mărimea intervalului de grupare. 5.Repartizarea unităţilor statistice pe grupe În cazul în care numărul unităţilor statistice este suficient de mare, limita inferioară a primului interval poate fi cu câteva unităţi

Page 32: TURDEAN MARINELLA - BAZELE STATISTICII - Manual debv.ucdc.ro/bv/F_1_bazele-statisticii-turdean.pdf · 3 MARINELLA SABINA TURDEAN LIGIA PRODAN BAZELE STATISTICII - Manual de studiu

32

mai mică decât valoarea minimă înregistrată sau limita superioară a ultimului interval, cu câteva unităţi mai mare decât valoarea maximă înregistrată, astfel încât adăugând sau scăzând mărimea intervalului de grupare, cifra unităţilor valorilor care reprezintă limitele intervalelor să fie “0” sau “5”. Astfel, repartizarea unităţilor statistice pe fiecare interval va fi mai uşor de realizat.

Pentru realizarea grupărilor statistice se recomandă următoarele:

1. Dacă gruparea s-a realizat pentru sistematizarea datelor cu scopul unei prelucrări ulterioare corespunzătoare, se recomandă ca numărul de grupe să fie mare şi intervalele de grupare să fie egale.

2. Dacă prin grupare se urmăreşte caracterizarea structurii colectivităţii şi a modificărilor survenite în timp, este indicată utilizarea unui număr redus de grupe şi a intervalelor neegale.

3. Numărul de grupe trebuie să fie suficient de mare pentru a oferi informaţii cât mai analitice în vederea caracterizării colectivităţii.

4. Intervalele de grupare stabilite trebuie să permită regruparea datelor sau desfacerea unui interval în alte două intervale.

5. Nici o unitate statistică să nu rămână în afara grupării. 6. Să se evite frecvenţele absolute (sau relative) mici, cu scopul

reducerii la minim a rezultatului acţiunii factorilor întâmplători. 7. Să se evite asimetria pronunţată. 8. Dacă din calcul, rezultă un număr zecimal, mărimea

intervalului se rotunjeşte în funcţie de scopul urmărit. 9. Intervalele deschise ale grupărilor sunt acele intervale în

care sunt omise limita inferioara a primului interval (exemplu: “sub 100”) sau limita superioară a ultimului interval (exemplu: “peste 1000”). Dacă în scopul unor operaţiuni de prelucrare a datelor, este necesară închiderea intervalului, se procedează astfel: atunci când este omisă limita inferioară a primului interval se va scădea din limita lui superioară mărimea intervalului următor, iar când nu există limita superioară pentru ultimul interval se adună la limita inferioară a acestuia mărimea intervalului precedent. La nevoie, primul şi ultimul interval se pot închide în funcţie de mărimea intervalelor vecine.

10. Dacă limita superioară a fiecărui interval se repetă ca limita inferioară a intervalului următor, (specific caracteristicilor continue) se menţionează, într-o notă la subsolul tabelului, modul de includere a limitelor în interval (de exemplu: *limita inferioară/superioară cuprinsă în interval).

Ca sinonim pentru noţiunea de “grupă” se utilizează termenul “clasă”.

3.6 Aplicaţii practice Pentru un eşantion de 30 de clienţi ai unei bănci s-au înregistrat datele privind creditul primit în mii euro: 31; 33; 29; 32; 30; 35; 32; 28; 33; 30; 35; 36; 30; 34; 32; 37; 33; 39; 30; 33; 32; 34; 33; 35; 37; 34; 36; 35; 38; 33. Să se grupeze cei 30 de clienţi după creditul primit pe şase grupe cu intervale egale de variaţie.

Page 33: TURDEAN MARINELLA - BAZELE STATISTICII - Manual debv.ucdc.ro/bv/F_1_bazele-statisticii-turdean.pdf · 3 MARINELLA SABINA TURDEAN LIGIA PRODAN BAZELE STATISTICII - Manual de studiu

33

Rezolvare: Algoritmul de grupare a datelor obţinute din observarea statistică: 1. A = xmax – xmin = 39 – 28 = 11 2. k = 6 grupe

3. stabilirea mărimii intervalului de grupare h = 26

11

k

A

4. stabilirea intervalelor de grupare Varianta I

pe baza valorii minime înregistrate Varianta a II-a

pe baza valorii maxime înregistrate [28 – 30) [30 – 32) [32 – 34) [34 – 36) [36 – 38) [38 – 40)

(27 – 29] (29 – 31] (31 – 33] (33 – 35] (35 – 37] (37 – 39]

*limita inferioară cuprinsă în interval *limita superioară cuprinsă în interval 5. repartizarea unităţilor statistice pe grupe Vom lucra în continuare, cu datele grupate pe baza valorii minime înregistrate.

Nr.crt.

Grupe de clienţi după nivelul creditului (mii

euro)

Nivelul caracteristicii înregistrate

Număr de clienţi

fi

Structura clienţilor fi* (%)

0 1 2 3 1 [28 – 30) 28,29 2 6,7 2 [30 – 32) 30,30, 30, 30,31 5 16,7 3 [32 – 34) 32,32,32,32,33,33,33,33,33,33 10 33,3 4 [34 – 36) 34,34,34,35,35,35,35 7 23,3 5 [36 – 38) 36,36,37,37 4 13,3 6 [38 – 40) 38,39 2 6,7

Total 30 100

3.7 Îndrumar pentru autoverificare

3.7.1 Sinteza unităţii de studiu

Prelucrarea datelor statistice are ca scop: centralizarea şi sistematizarea datelor culese în etapa observării statistice; calculul sistemului de indicatori statistici care caracterizează fenomenele şi procesele; prezentarea rezultatelor prelucrării sub formă de repartiţii, serii, tabele şi grafice. Planul prelucrării statistice presupune rezolvarea unor probleme metodologice – stabilirea

caracteristicilor primare şi derivate, alegerea metodelor şi procedeelor de calcul statistic - şi organizatorice – stabilirea locului prelucrării şi a timpului aferent acestei operaţiuni, modul de transmitere a rezultatelor prelucrării

Centralizarea datelor statistice are ca scop obţinerea unei imagini de ansamblu asupra fenomenului studiat. Centralizarea datelor constă în strângerea la locul prelucrării a tuturor informaţiilor şi apoi în

Page 34: TURDEAN MARINELLA - BAZELE STATISTICII - Manual debv.ucdc.ro/bv/F_1_bazele-statisticii-turdean.pdf · 3 MARINELLA SABINA TURDEAN LIGIA PRODAN BAZELE STATISTICII - Manual de studiu

34

determinarea indicatorilor totalizatori pentru toate caracteristicile însumabile direct sau care admit un coeficient de echivalenţă

Centralizarea simplă presupune agregarea valorilor individuale ale caracteristicilor pentru toate unităţile colectivităţii. În acest mod se obţin indicatorii totalizatori..

Centralizarea pe grupe constă în gruparea datelor şi calcularea indicatorilor totalizatori parţiali pe fiecare grupă, iar pe baza lor a indicatorilor totalizatori generali corespunzători întreagii colectivităţi.

Metoda grupării este metoda de bază utilizată în prelucrarea datelor statistice: Metoda grupării statistice presupune împărţirea unităţilor statistice în grupe omogene în funcţie de

variaţia uneia sau a mai multor caracteristici care se numesc factori de grupare. În procesul prelucrării datelor, metoda grupării se utilizează pentru:

Grupările statistice se pot clasifica în funcţie de următoarele criterii: numărul caracteristicilor conţinutul caracteristicilor forma de exprimare a caracteristicii atributive tipul variaţiei caracteristicii cantitative amplitudinea variaţiei caracteristicii de grupare Obţinerea grupărilor presupune parcurgerea următoarelor etape: Calculul amplitudinii variaţiei: Stabilirea numărului de grupe “k” în funcţie de: (a) numărul de unităţi înregistrate, (b) câmpul de

împrăştiere a variantelor caracteristicii, (c) experienţa specialistului, (d) scopul observării statistice.

Stabilirea mărimii intervalului de grupare (h) prin raportarea amplitudinii variaţiei (A) la numărul de grupe (k);

Stabilirea limitelor grupelor se realizează pornind de la valoarea minimă înregistrată la care se adaugă mărimea intervalului de grupare sau pornind de la valoarea maximă înregistrată din care se scade mărimea intervalului de grupare.

Repartizarea unităţilor statistice pe grupe

3.7.2 Concepte şi termeni de reţinut planul prelucrării statistice; centralizarea datelor statistice; centralizarea simplă şi pe grupe; gruparea datelor statistice; caracteristică de grupare interval de grupare grupă omogenă amplitudinea variaţiei grupări simple, grupări combinate; grupări cronologice, grupări teritoriale, grupări în funcţie de o caracteristică atributivă; grupări calitative, grupări cantitative; grupări pe variante, grupări pe intervale; grupări pe intervale egale, grupări pe intervale neegale.

3.7.3 Întrebări de control şi teme de dezbatere 1. Prezentaţi scopul prelucrării datelor statistice.

Page 35: TURDEAN MARINELLA - BAZELE STATISTICII - Manual debv.ucdc.ro/bv/F_1_bazele-statisticii-turdean.pdf · 3 MARINELLA SABINA TURDEAN LIGIA PRODAN BAZELE STATISTICII - Manual de studiu

35

2. În ce constă planul prelucrării datelor statistice? 3. Definiţi noţiuea de centralizare a datelor statistice. 4. În ce constă centralizarea simplă a datelor statistice? 5. În ce constă centralizarea pe grupe a datelor statistice? 6. Definiţi noţiunile „caracteristică de grupare” şi „grupă omogenă”. 7. Definiţi noţiunea „amplitudinea variaţiei”. 8. Prezentaţi criteriile de clasificare a grupărilor statistice şi tipurile de grupări corespunzătoare

acestora. 9. Prezentaţi etapele metodologiei de obţinere a grupărilor. 10. Prezentaţi funcţiile grupării statistice.

3.7.4 Bibliografie:

1. Biji, M., Biji, E. M., Lilea, E., Anghelache, C., (2002), Tratat de statistică, Editura Economica, Bucureşti

2. Biji, E.M., Lilea, E., Roşca, E., Vătui, M., (2010), Statistică pentru economişti, Editura Economică, Bucureşti;

3. Druică, E., (2012), Statistică pe înţelesul tuturor, Editura CH Beck, Bucureşti; 4. Duguleană, L., (2012) Bazele statisticii economice, Editura CH Beck, Bucureşti; 5. Turdean, M., (2012), Statistica, Editura Pro Universitaria, Bucureşti;

Page 36: TURDEAN MARINELLA - BAZELE STATISTICII - Manual debv.ucdc.ro/bv/F_1_bazele-statisticii-turdean.pdf · 3 MARINELLA SABINA TURDEAN LIGIA PRODAN BAZELE STATISTICII - Manual de studiu

36

4 UNITATEA DE STUDIU 4 PREZENTAREA DATELOR STATISTICE 4.1 Introducere 4.2 Obiectivele unităţii de studiu 4.3 Competenţele unităţii de studiu 4.4 Timpul alocat unităţii de studiu 4.5 Conţinutul unităţii de studiu

4.5.1 Tabelele statistice 4.5.2 Seriile statistice 4.5.3 Reprezentarea grafică a datelor statistice

4.6. Îndrumar pentru autoverificare 4.6.1 Sinteza unităţii de studiu 4.6.2 Concepte si termeni de retinut 4.6.3 Întrebări de control şi teme de dezbatere 4.6.5 Bibliografie

4.1 Introducere

Rezultatele prelucrării datelor obţinute în urma observării se prezintă sub formă de: tabele, serii şi grafice, în care relaţiile dintre fenomenele studiate apar într-o succesiune logică corespunzătoare relaţiilor obiective existente între acestea.

4.2 Obiectivele unităţii de studiu

– cunoaşterea modului în care pot fi prezentate rezultatele prelucrării datelor statistice;

– definirea noţiunilor de tabel statistic, serie statistică, reprezentare grafică;

– cunoaşterea avantajelor utilizării metodei grafice; – cunoşterea elementelor unui tabel statistic şi a regulilor după

care se întocmesc tabelele statistice; – cunoaşterea criterilor de clasificare a seriilor statistice; – cunoaşterea proprietăţilor seriilor statistice; – cunoaşterea elementelor unui grafic şi a regulilor după care

se realizează reprezentările grafice.

4.3 Competenţele unităţii de studiu:

– studenţii vor putea să definească noţiuni ca: tabel statistic, serie statistică, reprezentare grafică, repartiţie teoretică, repartiţie empirică;

– studenţii vor putea să prezinte datele prelucrate în tabele construite corect;

– studenţii vor putea să prezinte datele prelucrate sub formă de serii statistice;

– studenţii vor putea să reprezinte grafic corect datele statistice

Page 37: TURDEAN MARINELLA - BAZELE STATISTICII - Manual debv.ucdc.ro/bv/F_1_bazele-statisticii-turdean.pdf · 3 MARINELLA SABINA TURDEAN LIGIA PRODAN BAZELE STATISTICII - Manual de studiu

37

– studenţii vor şti să aleagă reprezentarea grafică cea mai adecvată pentru fenomenul analizat.

4.4 Timpul alocat unităţii de studiu:

Pentru unitatea de învăţare Managementul internaţional – conotaţii conceptuale, timpul alocat este de 4 ore.

4.5 Conţinutul unităţii de studiu

Sistematizarea datelor prin tabele, serii şi grafice permite interpretarea statistică a formelor de manifestare a fenomenelor, precum şi calculul corect al indicatorilor statistici absoluţi şi derivaţi. Cu ajutorul tabelelor, seriilor şi graficelor se pot caracteriza atât grupele unei colectivităţi, cât şi întregul ansamblu.

4.5.1 Tabelele statistice Definiţie Tabelul statistic reprezintă cea mai adecvată formă de

sistematizare şi prezentarea a unui ansamblu de relaţii cantitative despre fenomenele studiate

În rubricile rezultate din intersecţia liniilor paralele, orizontale

şi verticale se înscriu denumiri textuale şi indicatorii obţinuţi prin prelucrare.

Tabelele statistice se utilizează în toate etapele cercetării statistice cu dublu scop: (i) pentru sistematizarea datelor statistice în vederea aplicării procedeelor de calcul ale indicatorilor derivaţi şi (ii) pentru prezentarea rezultatelor cercetării, a indicatorilor absoluţi şi derivaţi obţinuţi în diferite faze ale prelucrării statistice.

4.5.1.1. Elementele tabelului statistic

La construirea unui tabel statistic trebuie să se ţină cont de elementele de conţinut precum şi de elementele ce ţin de forma de prezentare-titlul general, titlurile interioare, reţeaua tabelului, notele explicative.

Elementele de conţinut se referă la colectivitatea statistică supusă cercetării precum şi la ansamblul caracteristicilor pentru care s-a făcut centralizarea datelor permitând astfel caracterizarea statistică a fenomenelor studiate în condiţii specifice de timp şi spaţiu.

Elementele ce ţin de forma de prezentare a tabelului sunt: Titlul general se trece în partea de sus a tabelului, trebuie să

fie scurt, clar, concis, să atragă atenţia asupra relaţiilor ce trebuie analizate în legătură cu colectivitatea statistică şi să precizeze caracteristicile de timp şi de spaţiu la care se refera datele.

Titlurile interioare se înscriu în capetele coloanelor sau ale liniilor şi se referă la caracteristicile studiate.

Reţeaua tabelului este un ansamblu de linii paralele orizontale şi verticale, care generează rubricile în care se înscriu ordonat valorile numerice ale indicatorilor statistici.

Page 38: TURDEAN MARINELLA - BAZELE STATISTICII - Manual debv.ucdc.ro/bv/F_1_bazele-statisticii-turdean.pdf · 3 MARINELLA SABINA TURDEAN LIGIA PRODAN BAZELE STATISTICII - Manual de studiu

38

Pentru o cât mai completă informare, la subsolul tabelului apar notele explicative, în care se precizează sursa de informaţie sau sunt specificate procedeele de culegere şi prelucrare a datelor. 4.5.1.2. Reguli pentru întocmirea tabelelor

Pentru ca un tabel statistic să constituie într-adevăr un mijloc de sistematizare a datelor este necesară respectarea unor reguli referitoare la modul concret de întocmire a acestuia.

1. Un tabel se numeşte “tabel statistic”, atunci când toate rubricile generate de reţeaua tabelului sunt completate cu indicatori statistici. Dacă pentru o grupă nu a existat fenomenul, în rubrica corespunzătoare se trece semnul “-“, iar dacă se ştie că fenomenul a existat, dar lipsesc datele se trece semnul “...”.

2. Tabelele trebuie numerotate pentru a fi mai uşor de identificat în text.

3. Este obligatorie precizarea unităţilor de măsură în care se exprimă indicatorii statistici. Dacă unitatea de măsură este comună pentru toţi indicatorii din tabel, atunci ea se înscrie în afara reţelei tabelului, de obicei, în dreapta, sus, sau în titlul general al tabelului. Dacă unităţile de măsură sunt diferite, atunci pentru fiecare indicator se înscrie respectiva unitate de măsură, sub titlul interior al coloanei sau al rândului.

4. Pentru a localiza cu uşurinţă datele din tabel este necesară numerotarea liniilor şi a coloanelor.

5. Tabelele statistice trebuie să fie uşor de interpretat, de aceea ele trebuie să cuprindă numai informaţii strict necesare caracterizării statistice a fenomenelor studiate.

6. Notele explicative trebuie să prezinte corect sursa de informaţie sau să atragă atenţia asupra modului de culegere sau prelucrare a datelor. 4.5.1.3. Tipuri de tabele statistice 4.5.1.3.1. Tabelul simplu

Tabelul simplu este acel tip de tabel în care se prezintă indicatorii statistici după criteriul cronologic, teritorial sau organizatoric. Se utilizează, de obicei, pentru prezentarea datelor rezultate în urma unei grupări simple. 4.5.1.3.2. Tabelul pe grupe

Tabelul pe grupe se foloseşte când se aplică gruparea simplă în funcţie de o caracteristică de grupare “x” şi se centralizează frecvenţele de apariţie ale diferitelor variante x1, x2, ...xk, precum şi valorile caracteristicilor “y”, “z”, “w”care se află în relaţie de dependenţă faţă de variaţia caracteristicii de grupare “x”.

Tabelul pe grupe poate fi utilizat la: 1. caracterizarea gradului şi a formei de variaţie a caracteristicii

de grupare “x”; 2. interpretarea legăturilor dintre variaţia caracteristicii de

grupare şi variaţia caracteristicilor care formează predicatul tabelului;

3. aplicarea metodelor de calcul ale corelaţiei statistice.

Page 39: TURDEAN MARINELLA - BAZELE STATISTICII - Manual debv.ucdc.ro/bv/F_1_bazele-statisticii-turdean.pdf · 3 MARINELLA SABINA TURDEAN LIGIA PRODAN BAZELE STATISTICII - Manual de studiu

39

Tabelul 4.1.Tabelul pe grupe

Grupe de unităţi în funcţie d variaţia caracteristicii “x”

Numărul unităţilor (fi)

Valorile centralizate ale caracteristicilor

y z w 1 2 3 4 5

x1 xi xk

f1 fi fk

y/x1

y/xi

y/xk

z/x1

z/xi

z/xk

w/x1

w/xi

w/xk

Total

k

1i

if

k

1i

ix/y

k

1i

ix/z

k

1i

ix/w

4.5.1.3.3. Tabelul combinat Tabelul combinat se construieşte când există cel puţin două

caracteristici de grupare “x”- primară şi “y”- secundară. În tabel sunt prezentate frecvenţele valorilor perechi „xy” precum şi valorile centralizate ale variabilelor “z” şi “w” dependente de factorii de grupare.

Tabelul 4.2.Tabelul combinat

Caracteristica primară de grupare “x”

Caracteristica secundară de grupare “y”

Frecvenţele valorilor

perechi “xy”

Valorile centralizate ale caracteristicilor z w

0 1 2 3 4

x1 y1 yi yp

f11

f1j :

f1p

z/x1y1

z/x1yj

z/x1yp

w/x1y1

w/x1yj

w/x1yp

Total grupa 1

p

1j

j1f j

p

1j

1yx/z

p

1j

j1yx/w

xi y1

yi yp

fi1 fij

fip

z/xiy1

z/xiyj

z/xiyp

w/xiy1

w/xiyj

w/xiyp Total grupa i

p

1j

ijf j

p

1j

iyx/z

p

1j

jiyx/w

xk y1

yi yp

fk1

fkj

fkp

z/xky1

z/xkyj

z/xkyp

w/xky1

w/xkyj

w/xkyp

Total grupa k

p

1j

kjf j

p

1j

kyx/z

p

1j

jkyx/w

Total general

k

1i

if

k

1i

ix/z

k

1i

ix/w

Page 40: TURDEAN MARINELLA - BAZELE STATISTICII - Manual debv.ucdc.ro/bv/F_1_bazele-statisticii-turdean.pdf · 3 MARINELLA SABINA TURDEAN LIGIA PRODAN BAZELE STATISTICII - Manual de studiu

40

Tabelul combinat poate fi utilizat la: i. stabilirea gradului şi a formei de variaţie a valorilor caracteristicii primare de grupare “x”, considerată ca o variabila independentă ale cărei nivele de manifestare individuale sunt prezentate în coloana “0”, iar frecvenţele corespunzătoare în rândurile care reprezintă totalurile parţiale pe grupe din coloana “2”. ii. stabilirea gradului şi a formei de variaţie a valorilor caracteristicii secundare de grupare, “y”, condiţionate de valorile caracteristicii “x” ale cărei niveluri de manifestare sunt prezentate în coloana 1, iar frecvenţele corespunzătoare în coloana 2, (frecvenţele valorilor perechi “xy”) iii. caracterizarea legăturilor dintre valorile perechi ale caracteristicilor de grupare (primară şi secundară) şi valorile centralizate ale variabilelor “z” şi “w”. iv. aplicarea metodelor de calcul ale corelaţiei statistice dintre cele patru variabile.

4.5.1.3.4. Tabelul cu dublă intrare Tabelul cu dublă intrare se utilizează atunci când colectivitatea

statistică se împarte pe grupe în funcţie de variaţia unei caracteristici factoriale “x” şi a unei caracteristici rezultative-dependente “y”. In rubricile tabelului sunt centralizează frecvenţele de apariţie ale valorilor perechi “xiyj”.

Tabelul 4.3. Tabelul cu dublă intrare

Valorile caracteristicii dependente „y”

Valorile caracteristicii de grupare “x”

y1 … yj … yp Frecvenţe după

variabila “x”, (ni)

x1 xi

xm

f11 f1j f1p fi1 fij fip fm1 fmj fmp

n1 ni

nm

Frecvenţe după variabila “y”, fj

f1 fj fp Nnfm

1ii

p

1jj

Tabelul cu dublă intrare poate fi utilizat la: i.stabilirea gradului şi a formei de variaţie a valorilor caracteristicii “x”, considerată independent (folosind distribuţia sa marginală);

ii.stabilirea gradului şi a formei de variaţie a valorilor caracteristicii “y”, considerată independent, (folosind distribuţia sa marginală);

iii.stabilirea gradului şi a formei de variaţie a valorilor caracteristicii “x”, condiţionată de valorile caracteristicii “y”;

iv.stabilirea gradului şi a formei de variaţie a valorilor caracteristicii “y”, condiţionată de valorile caracteristicii “x”.

Page 41: TURDEAN MARINELLA - BAZELE STATISTICII - Manual debv.ucdc.ro/bv/F_1_bazele-statisticii-turdean.pdf · 3 MARINELLA SABINA TURDEAN LIGIA PRODAN BAZELE STATISTICII - Manual de studiu

41

Tabelul 4.4.Distribuţia agenţilor economici în funcţie de cifra de afaceri şi

nivelul creditului primit Grupe de agenţi economici după cifra de afaceri (mii lei)

Grupe de agenţi economici dupăvaloarea creditului primit (mii euro) Total 10 - 12 12 - 14 14 - 16 16 - 18 18 - 20

0 1 2 3 4 5 6 10-20 5 5 5 - - 15 20-30 5 10 5 - - 20 30-40 5 5 10 10 - 30 40-50 - - 15 5 - 20 50-60 - - 5 5 5 15 Total 15 20 40 20 5 100

Din tabelul 4.4 se pot extrage următoarele serii de distribuţie

de frecvenţe: câte o serie de distribuţie pentru fiecare din cele două

caracteristici considerate independent una faţă de cealaltă; ele sunt, de fapt, distribuţiile marginale ale valorilor înscrise în capetele rândurilor sau coloanelor;

cinci serii de distribuţie a agenţilor economici după cifra de afaceri, dar condiţionate de creditul primit;

cinci serii de distribuţie a agenţilor economici după creditul primit, dar condiţionate de cifra de afaceri. 4.5.1.3.5. Tabelul de asociere

Tabelul de asociere se utilizează pentru a prezenta legătura dintre două caracteristici alternative.

În cazul acestui tip de tabel există doua variante x1 şi x2 pentru grupele formate pe baza variaţiei caracteristicii factoriale şi două variante y1 şi y2 pentru grupele formate pe baza variaţiei caracteristicii rezultative.

În rubricile tabelului se trec frecvenţele comune ale combinării succesive a valorilor celor doua variante. Numărul total al unităţilor din colectivitatea supusă cercetării se notează cu N.

Tabelul de asociaţie poate fi utilizat şi în cazul în care caracteristicile nealternative se transformă în variabile alternative. Exemplu: angajaţii care au salariul sub şi peste nivelul mediu al salariului pe întreprindere, angajaţi care şi-au îndeplinit sau care nu şi-au îndeplinit normele, etc.

Tabelul 4.5.Tabelul de asociere

y x

y1 y2 Total

x1 a b a + b x2 c d c + d

Total a + c b + d (a + c) + (b + d) = (a + b) + (c + d) =N

Datele din tabelul 4.4. pot fi transpuse într-un tabel de asociere.

Page 42: TURDEAN MARINELLA - BAZELE STATISTICII - Manual debv.ucdc.ro/bv/F_1_bazele-statisticii-turdean.pdf · 3 MARINELLA SABINA TURDEAN LIGIA PRODAN BAZELE STATISTICII - Manual de studiu

42

Tabelul 4.6Distribuţia agenţilor economici după cifra de afaceri şi creditul primit

Grupe de agenţi economici după creditul primit

(mii euro) Grupe de agenţi economici după cifra de afaceri (mii lei)

sub 16

peste 16

Total

sub 40 55 10 65 peste 40 20 15 35 Total 75 25 100

4.5.2 Seriile statistice Seriile statistice sunt rezultatul grupării datelor în funcţie de

una sau mai multe caracteristici de grupare. Definiţie Seria statistică este o corespondenţă între două şiruri de date

statistice: primul şir reprezintă variaţia caracteristicii de grupare, iarcel de-al doilea şir este rezultatul centralizării frecvenţelor de apariţiesau nivelul unei alte caracteristici aflată în corelaţie cu variabilastudiată.

Seria statistică poate fi considerată ca o funcţie matematică în

care valorile centralizate ale frecvenţelor sau valorile centralizate ale caracteristicilor sunt valori dependente “y”, în funcţie de valorile caracteristicii de grupare “x”. 4.5.2.1. Clasificarea seriilor statistice

Seriile statistice pot fi clasificate în funcţie de următoarele criterii: 1. numărul caracteristicilor de grupare 1.1. serii statistice independente (serii unidimensionale) 1.2. serii statistice condiţionate (serii multidimensionale) 2. conţinutul caracteristicilor de grupare 2.1. serii statistice de timp (cronologice, dinamice)

timpul la care se referă datele 2.1.1. serii dinamice de intervale (de fluxuri) 2.1.2. serii dinamice de momente (de stocuri) 2.2. serii statistice de spaţiu (teritoriale) 2.3.serii statistice de distribuţie (de repartiţie)

forma de exprimare a caracteristicii atributive 2.3.1.serii calitative 2.3.2.serii de variaţie

tipul variaţiei caracteristicii de grupare 2.3.2.1.serii de distribuţie pe variante 2.3.2.2.serii de distribuţie pe intervale

gradul de variaţie a caracteristicii de grupare 2.3.2.2.1.serii de distribuţie pe intervale egale 2.3.2.2.2.serii de distribuţie pe intervale neegale

1.1. Seriile statistice independente (serii unidimensionale) rezultă dintr-o grupare simplă pe baza unei singure caracteristici de grupare. 1.2. Seriile condiţionate (multidimensionale) rezultă dintr-o grupare combinată după două sau mai multe caracteristici statistice

Page 43: TURDEAN MARINELLA - BAZELE STATISTICII - Manual debv.ucdc.ro/bv/F_1_bazele-statisticii-turdean.pdf · 3 MARINELLA SABINA TURDEAN LIGIA PRODAN BAZELE STATISTICII - Manual de studiu

43

care se află într-o relaţie de interdependenţă obiectivă. 2.1. Seriile statistice de timp (dinamice) prezintă variaţia unei

caracteristici în funcţie de timp. Din denumirea seriei trebuie să rezulte clar, dacă datele se referă la momente sau perioade de timp pentru a putea stabili relaţii corecte între ele.

2.1.1. Seriile dinamice de intervale (de fluxuri) se caracterizează prin faptul că prezintă valorile unor caracteristici care constituie rezultatul unui fenomen/proces social-economic şi care au sens să fie urmărite pe parcursul unui interval de timp, săptămână, luna, trimestru, an. Exemplu: producţia în unităţi naturale sau valorice, cheltuielile de producţie, numărul căsătoriilor, etc. Termenii unei serii dinamice de intervale se bucură de proprietatea de a fi însumabili, obţinându-se valoarea centralizată a caracteristicii pe întreaga perioada.

2.1.2. Seriile dinamice de momente (de stocuri) se caracterizează prin faptul că prezintă valorile unei caracteristici pentru care are sens măsurarea/determinarea nivelului la un moment dat. Exemplu: numărul de salariaţi, valoarea capitalului fix, stocurile de mărfuri. Specific seriilor dinamice de momente este faptul că termenii acestora nu se însumează direct, deoarece aceasta ar conduce la înregistrări repetate. Caracterizarea statistică pentru întreaga perioadă nu se poate face în acest caz, printr-un indicator totalizator, ci folosind indicatori derivaţi sub formă de mărimi relative sau medii.

2.2. Seriile statistice de spaţiu (sau teritoriale) rezultă prin centralizarea frecvenţelor sau a valorilor caracteristicii studiate în funcţie de variaţia teritorial-administrativă. Seriile teritoriale sunt folosite pentru sistematizarea informaţiilor statistice pe judeţele ţării, pe regiuni, pe ţări sau alte forme teritorial-administrative. Pe baza seriilor teritoriale se poate obţine o ierarhizare a unităţilor teritoriale în funcţie de nivelul caracteristicilor. Seriile statistice teritoriale se întocmesc, de obicei, pentru mai multe caracteristici între care există relaţii de interdependenţă, urmărindu-se variaţia valorilor acestor caracteristici condiţionată de teritoriul pe care au fost înregistrate datele.

2.3. Seriile statistice de distribuţie reprezintă o corespondenţa între valorile (variantele) caracteristicii atributive (calitativă sau numerică) şi frecvenţele unităţilor la care se înregistrează aceeaşi variantă.

2.3.1. In seriile de distribuţie calitative caracteristica atributivă este exprimată în cuvinte. Exemple: distribuţia pe ramuri a economiei naţionale, distribuţii pe forme de proprietate, distribuţii pe profesii.

2.3.2. Seriile de distribuţie în care caracteristica atributivă este exprimată numeric se mai numesc serii de variaţie. 4.5.2.2. Analiza seriilor statistice

Gradul şi forma de variaţie a fenomenelor de masă sunt determinate de modul de asociere a cauzelor esenţiale cu cele întâmplătoare. Astfel, în modul de formare obiectivă a nivelurilor individuale ale unei caracteristici există o oarecare tendinţă de concentrare către unele valori tipice care imprimă seriei o anumită formă de distribuţie (repartiţie). In analiza seriilor statistice se folosesc atât repartiţiile empirice, cât şi repartiţiile teoretice. Prin repartiţie empirică se înţelege seria care s-a obţinut în urma centralizării datelor statistice folosind frecvenţele absolute sau frecvenţele relative. Atunci când se prezintă date cu privire la aceleaşi caracteristici înregistrate pentru colectivităţi asemănătoare

Page 44: TURDEAN MARINELLA - BAZELE STATISTICII - Manual debv.ucdc.ro/bv/F_1_bazele-statisticii-turdean.pdf · 3 MARINELLA SABINA TURDEAN LIGIA PRODAN BAZELE STATISTICII - Manual de studiu

44

distribuite în unităţi de timp diferite sau coexistente în spaţiu, seriile de date obţinute prin centralizarea datelor individuale se apropie ca formă de repartiţie.

Repartiţiile teoretice sunt elaborate pe baza unei ipoteze de repartiţie a frecvenţelor, astfel încât să se poată stabili relaţii matematice bine determinate între valorile variabilei studiate şi frecvenţele lor de apariţie, interpretate ca o funcţie de probabilităţi. Repartiţiile teoretice se caracterizează printr-o serie de parametri care le definesc şi care pot fi utilizaţi în compararea repartiţiilor empirice cu cele teoretice. Proprietăţile repartiţiilor binomială, normală şi Poisson sunt utilizate de statistica social-economică la interpretarea fenomenelor. De asemenea, ele se mai utilizează la interpretarea indicatorilor care caracterizează colectivitatea generală, în cazul în care nu se dispune decât de datele unei observări parţiale.

Analiza seriilor statistice urmăreşte: 1. determinarea valorilor tipice care caracterizează seria

respectiva; 2. determinarea diferenţelor de nivel dintre termenii individuali şi aceste valori tipice cu scopul: interpretării formei şi gradului de variaţie a caracteristicii studiate şi comparării lor în timp şi spaţiu.

În analiza distribuţiilor empirice se ţine cont de unele proprietăţi ale acestora, care se pot întâlni în toate cazurile sau sunt specifice anumitor serii. Principalele proprietăţi ale seriilor statistice sunt: variabilitatea, forma de repartiţie, independenţa (interdependenţa) şi omogenitatea termenilor. 4.5.2.3. Proprietăţile seriilor statistice 1. Variabilitatea termenilor unei serii statistice este consecinţa faptului că fenomenele de masă nu sunt rezultatul acţiunii unei singure cauze, ci al acţiunii combinate a mai multor cauze. Aceste cauze pot avea caracter esenţial sau întâmplător şi acţionează în mod diferit, la nivelul fiecarui caz în parte. 2. Forma de repartiţie. Asupra fenomenelor de masă acţionează în mod diferit cauze esenţiale cu caracter permanent care imprimă fenomenului o dezvoltare sistematică şi cauze neesenţiale a căror acţiune este diferită de la o unitate la alta. Prin urmare, gradul şi forma de variaţie a fenomenelor de masă sunt determinate de modul de asociere a acţiunii cauzelor esenţiale cu cele întâmplătoare, asociere care are loc în mod diferit în funcţie de condiţiile particulare ale fiecărui caz individual. Rezultă de aici, că în modul de formare obiectivă a nivelurilor individuale ale caracteristicii statistice există o tendinţă de concentrare către unele valori tipice care imprimă seriei o anumită formă de repartiţie. 3. Independenţa (interdependenţa). Datorită condiţiilor specifice corespunzătoare fiecărei unităţi de timp şi de spaţiu, care impun de la caz la caz, un alt mod de asociere a cauzelor esenţiale cu cele neesenţiale, valorile înregistrate pentru aceeaşi caracteristică pot fi diferite şi independente una de alta. Independenţa termenilor se întâlneşte în cazul seriilor de repartiţie de frecvenţe sau teritoriale, unde variabila se înregistrează pentru unităţi de observare distincte. Despre interdependenţa termenilor se vorbeşte şi în cazul seriilor cronologice, unde datele se referă la aceeaşi unitate de observare statistică, în succesiunea apariţiei valorilor în timp. 4. Omogenitatea termenilor. Omogenitatea valorilor (termenilor) dintr-o serie statistică apare ca urmare a faptului că, în aceeaşi serie

Page 45: TURDEAN MARINELLA - BAZELE STATISTICII - Manual debv.ucdc.ro/bv/F_1_bazele-statisticii-turdean.pdf · 3 MARINELLA SABINA TURDEAN LIGIA PRODAN BAZELE STATISTICII - Manual de studiu

45

nu se pot prezenta decât date cu privire la aceleaşi fenomene. Altfel spus, datele trebuie să aibă acelaşi conţinut, diferenţiindu-se doar ca nivel sau variante de manifestare. La întocmirea unei serii statistice este necesară verificarea omogenităţii unităţilor purtătoare ale caracteristicii pentru a putea fi supuse în continuare, prelucrării statistice cu scopul obţinerii valorilor sintetice reprezentative. Dacă din analiza statistică reiese că seria nu prezintă omogenitate, se poate spune că populaţia statistică este formată din mai multe tipuri calitative. Prin urmare, seria respectivă poate fi desfăşurată în serii componente. In acest caz este necesară verificarea măsurii în care tendinţa generală de variaţie din seria iniţială se regăseşte în forma de variaţie specifică fiecărei grupe.

4.5.3 Reprezentarea grafica a datelor statistice Utilizarea metodei grafice de prezentare a datelor statistice are

avantajul de a reda într-o formă simplă, atrăgătoare şi sugestivă trăsăturile esenţiale ale fenomenelor studiate în anumite condiţii de timp şi spaţiu. Reprezentarea grafică a datelor statistice permite:

1. interpretarea vizuală a mărimii raportului dintre doi sau mai mulţi indicatori statistici;

2. memorarea datelor datorită caracterului sugestiv şi intuitiv; 3. interpretarea structurii şi modificărilor structurale în

timp sau în plan teritorial; 4. interpretarea formei de realizare a interdependenţelor

dintre două sau mai multe variabile statistice; 5. interpretarea tendinţelor de dezvoltare a fenomenelor

studiate; 6. popularizarea datelor statistice. Reprezentările grafice se aleg în funcţie de specificul

fenomenelor şi relaţiilor ce trebuie evidenţiate prin folosirea lor.4.5.3.1. Elementele unui grafic

Întocmirea şi apoi interpretarea corectă a unui grafic presupune cunoaşterea şi utilizarea corectă a următoarelor elemente de construcţie: (1) titlul graficului; (2) reţeaua graficului; (3) scara de reprezentare; (4) notele explicative; (5) legenda; (6) sursa de informaţie.

1. Titlul graficului trebuie astfel ales încât să sugereze relaţiile care trebuie interpretate vizual, pe baza graficului respectiv; trebuie să fie scurt, clar, precis şi, pe cât posibil, să corespundă cu titlul tabelului statistic ale cărui date le reprezintă.

2. Reţeaua graficului este formată din linii paralele dispuse orizontal sau vertical, linii oblice sau cercuri concentrice.

3. Scara de reprezentare se alege ţinând cont de ordinul de mărime al indicatorilor de reprezentat, de gradul şi forma de variaţie dintre indicatori, precum şi de scopul urmărit. Scara de reprezentare este, de fapt, o linie denumită suportul scării, dispusă orizontal sau vertical, care este divizată printr-un şir de puncte numerotate. Distanţa dintre două puncte învecinate se numeşte intervalul graficului. Distanţa dintre valorile numerice corespunzătoare punctelor se numeşte interval numeric. In funcţie de specificul fenomenului, pentru a reda cât mai fidel imaginea acestuia, se pot folosi scări uniforme, caz în care diviziunile de pe suportul scării sunt echidistante şi scări neuniforme ca, de exemplu, scara logaritmică.

4. Notele explicative apar atunci când este necesară

Page 46: TURDEAN MARINELLA - BAZELE STATISTICII - Manual debv.ucdc.ro/bv/F_1_bazele-statisticii-turdean.pdf · 3 MARINELLA SABINA TURDEAN LIGIA PRODAN BAZELE STATISTICII - Manual de studiu

46

atenţionarea asupra aspectelor metodologice de calcul al indicatorilor reprezentaţi.

5. Legendele explică semnele convenţionale, haşurile şi culorile folosite. Legenda se plasează în afara cadrului construcţiei grafice.

6. Sursa de informaţie a datelor reprezentate grafic se specifică în toate cazurile în care se folosesc date reale. 4.5.3.2. Principalele tipuri de grafice statistice

Pentru aceleaşi date statistice există mai multe posibilităţi de reprezentare grafică. In practică se optează pentru acel tip de grafi, care permite evidenţierea relaţiilor obiective dintre indicatorii prezentaţi. Cele mai frecvente tipuri de grafice sunt:

1. grafice prin coloane şi benzi; 2. cronogramele; 3. diagrame de structură 4. diagrame de distribuţie; 5. diagrame teritoriale;

4.3.2.1. Grafice prin coloane şi benzi Graficele prin coloane se utilizează cel mai frecvent pentru

prezentarea şi popularizarea datelor statistice, a indicatorilor seriilor teritoriale şi a seriilor cronologice de momente cu intervale egale sau neegale de timp între momente. Graficele prin coloane se construiesc în cadranul I al sistemului de axe carteziene; scara de reprezentare se fixează pe axa Oy, iar pe axa Ox se construiesc atâtea coloane cu baze egale, câţi indicatori sunt reprezentaţi. Toate coloanele au aceeaşi lăţime, sunt separate între ele cu jumătate din lăţimea lor, iar înălţimea acestora este proporţională cu nivelul indicatorului de reprezentat.Dacă diagramele sunt construite în scopul popularizării datelor, valorile indicatorilor se scriu deasupra coloanelor.     

Tabelul 4.7 Câştigul salarial nominal mediu brut lunar, pe activităţi ale economiei

naţionale, anul 2009 Activităţi ale economiei naţionale

Câştigul salarial nominal mediu brut lunar (lei/salariat)

Agricultură 1350 Industrie 1745 Construcţii 1441 Comerţ 1418 Intermedieri financiare 4304 Învăţământ 2206 Sănătate 1810

Sursa: Anuarul Statistic al României 2010, INS, Bucureşti, 2011, pag.150

Page 47: TURDEAN MARINELLA - BAZELE STATISTICII - Manual debv.ucdc.ro/bv/F_1_bazele-statisticii-turdean.pdf · 3 MARINELLA SABINA TURDEAN LIGIA PRODAN BAZELE STATISTICII - Manual de studiu

47

Castigul salarial nominal mediu brut lunar in anul 2009

13501745

1441 1418

4304

22061810

0

500

1000

1500

2000

2500

3000

3500

4000

4500

5000

Agricultură Industrie Construcţii Comerţ Intermedierifinanciare

Învăţământ Sănătate

Fig.4.1

În practica statistică se mai utilizează diagrama cu coloane grupate, diagrama prin coloane lipite, diagrama prin coloane cu subdiviziuni, diagrama prin coloane a abaterilor.

Diagramele prin benzi se utilizează în special pentru reprezentarea grafică a indicatorilor de lungime, a indicatorilor care prezintă între ei variaţii foarte mari sau când datele sunt distribuite cronologic neegal, când se reprezintă serii cu indicatori eterogeni sau serii cu caracteristici combinate care au aspectul unor diagrame simetrice, specifice demografiei (piramida vârstelor). Graficele prin benzi se construiesc în cadranul I al sistemului de axe carteziene. Scara de reprezentare se fixează pe axa Ox, iar benzile se dispun pe axa Oy, lungimea lor fiind proporţională cu nivelul indicatorilor de reprezentat. Benzile au lăţimea mai mică decât coloanele şi sunt separate între ele prin distanţe egale. Se pot construi următoarele tipuri de grafice prin benzi: diagrame prin benzi simple, diagrame prin benzi grupate, diagrame prin benzi cu subdiviziuni, diagrame prin benzi orientate în dublu sens.

Ponderea populatiei pe medii de rezidenta la recensaminte

43.6

54.3

52.7

61.8

45.7

47.3

38.2

56.4

0 10 20 30 40 50 60 70

15.03.1966

05.01.1977

07.01.1992

18.03.2002

Rural

Urban

Fig. 4.2

4.3.2.2. Cronograma Pentru reprezentarea grafică a seriilor cronologice se utilizează

cronogramele. Ele se construiesc în cadranul I al sistemului de axe carteziene. Variaţia de timp se va reprezenta pe axa Ox, iar nivelul indicatorului urmărit pe axa Oy.

La stabilirea scării timpului pe axa Ox şi a nivelurilor fenomenului de pe axa Oy trebuie să se respecte proporţionalitatea, deoarece dacă raportul dintre scări nu este adecvat, nu se reflectă corect dezvoltarea fenomenului.

În cazul în care variaţia de timp este redată prin momente,

Page 48: TURDEAN MARINELLA - BAZELE STATISTICII - Manual debv.ucdc.ro/bv/F_1_bazele-statisticii-turdean.pdf · 3 MARINELLA SABINA TURDEAN LIGIA PRODAN BAZELE STATISTICII - Manual de studiu

48

aceasta se trec în dreptul diviziunilor marcate pe axa Ox. Dacă variaţia de timp este redată prin intervale de timp, aceasta se trec între două diviziuni succesive.

Dacă din seria cronologică lipsesc date pentru unele valori de timp, atunci pentru perioada respectivă se face legătura printr-o linie întreruptă, menţinând tendinţa generală a întregii serii.

Exemplu. Pentru a exemplifica modul de întocmire a cronogramei pentru seriile de intervale de timp (figura 4.3) s-au utilizat datele din tabelul 4.8.

Tabelul 4.8.Evoluţia creditelor neguvernamentale în lei şi valută, perioada 2005-2009

milioane lei Anii 2005 2006 2007 2008 2009

0 1 2 3 4 5

Credite în lei

27091 48637 67713 83643 79711

Credite în valută

32714 43741 80467 114412 120175

Sursa: Anuarul Statistic al României, 2010, INS, Bucureşti, 2011, pag.615

Evolutia creditului neguvernamental in perioada 2005-2009, mil lei

0

20000

40000

60000

80000

100000

120000

140000

2005 2006 2007 2008 2009

Credite în lei

Credite în valută

Fig. 4.3

4.3.2.3. Diagramele de structură

Diagramele de structură se utilizează pentru prezentarea

raporturilor în care se află fiecare grupă faţă de întregul ansamblu, în condiţii bine definite de timp şi spaţiu. Graficele de structură se construiesc pin pătrate, cercuri sau dreptunghiuri a căror suprafaţă se consideră egală cu volumul întregii colectivităţi, adică 100%.

Tabelul 4.9 Cota de piaţă în funcţie de active, anul 2010

Nr. crt.

Banca Cota de piaţă %

0 1 2

1 BCR 19,8 2 BRD 13,8

3 Raiffeisen 6,36

Page 49: TURDEAN MARINELLA - BAZELE STATISTICII - Manual debv.ucdc.ro/bv/F_1_bazele-statisticii-turdean.pdf · 3 MARINELLA SABINA TURDEAN LIGIA PRODAN BAZELE STATISTICII - Manual de studiu

49

4 CEC 6,35 5 Banca Transilvania 6,3 6 Alpha Bank 6,24 7 UniCredit 5,97 8 Volksbank 5,78 9 Bancpost 3,94

10 ING 3,52

11 Alte banci 21,94 Total 100,0

Sursa: Revista Piata Financiară, februarie, 2011

Cota de piata a bancilor din Romania in functie de active, anul 2010

20%

14%

6%6%6%6%

6%6%

4%

4%

22%

BCR BRD RaiffeisenCEC Banca Transilvania Alpha BankUniCredit Volksbank BancpostING Alte banci

Fig.4.4 4.3.2.4. Diagrame de distribuţie Diagramele de distribuţie se utilizează pentru reprezentarea

grafică a seriilor de variaţie. Cel mai des se utilizează histograma, poligonul frecvenţelor, curba cumulativă a frecvenţelor, curba lui Lorenz.

Histograma se foloseşte pentru a reprezenta grafic seriile de distribuţie de frecvenţe. Pe axa absciselor se trec intervalele de grupare, iar pe axa ordonatelor se construieşte scara frecvenţelor în funcţie de frecvenţa maximă înregistrată. Pentru fiecare grupă se ridică câte un dreptunghi (coloană) a cărui suprafaţă trebuie să fie proporţională cu produsul dintre lungimea intervalului şi frecvenţa sa de apariţie. Această relaţie de proporţionalitate constituie principiul de construirea a histogramei. Deasupra fiecărei coloane se trece frecvenţa corespunzătoare fiecărei grupe. Histogramele se utilizează atât pentru reprezentarea grafică a seriilor de distribuţie cu intervale egale, cât şi a seriilor de distribuţie cu intervale neegale.

Exemplu: pentru seria de distribuţie de frecvenţe absolute prezentate în tabelul 4.10, histograma este redată în figura 4.5.

Page 50: TURDEAN MARINELLA - BAZELE STATISTICII - Manual debv.ucdc.ro/bv/F_1_bazele-statisticii-turdean.pdf · 3 MARINELLA SABINA TURDEAN LIGIA PRODAN BAZELE STATISTICII - Manual de studiu

50

Distributia angajatilor in functie de salariul lunar brut, lei

5

10

25

15

10

5

0

5

10

15

20

25

30

1000-2000

2000-3000

3000-4000

4000-5000

5000-6000

6000-7000

Fig.4.5

Poligonul frecvenţelor se utilizează pentru reprezentarea grafică a seriilor de distribuţie de frecvenţe pe variante sau pe intervale de variaţie; se construieşte prin suprapunere pe histogramă sau separat, utilizând o reprezentare independentă. Pe axa absciselor se trec variantele sau intervalele de variaţie egale (sau neegale), iar pe axa ordonatelor se construieşte scara frecvenţelor reale (sau reduse). De pe axa absciselor, din dreptul diviziunilor corespunzătoare variantelor sau după caz din mijlocul segmentului care reprezintă mărimea intervalului se ridică linii perpendiculare proporţionale cu frecvenţele corespunzătoare de pe axa Oy, obţinând puncte de coordonate (xi,yi) Deoarece poligonul trebuie închis, pe axa absciselor se construieşte câte un interval înaintea primului şi după ultimul (având aceeaşi mărime cu acestea), pe mijlocul lor marcând câte un punct. Unind toate punctele de coordonate (xi,yi) cu o linie frântă, se obţine poligonul frecvenţelor.

Exemplu. Utilizând datele din tabelul 4.10 se poate construi poligonului frecvenţelor suprapus peste histogramă (figura 4.6) sau într-o reprezentare independentă.

Distributia angajatilor in functie de salariul lunar brut

5

10

25

15

10

5

0

5

10

15

20

25

30

1000-2000 2000-3000 3000-4000 4000-5000 5000-6000 6000-7000

Fig.4.6

Curba frecvenţelor cumulate se utilizează atunci când dorim să determinăm cu ajutorul graficului, mărimile medii de poziţie (mediana, cuartile, decile). Construirea curbei cumulative a frecvenţelor presupune calculul frecvenţelor absolute cumulate crescător şi descrescător. Frecvenţa cumulată se determină adunând succesiv frecvenţele corespunzătoare intervalelor. Pornind de la frecvenţa primului interval al repartiţiei se obţin frecvenţele cumulate crescător. Dacă însumarea succesivă porneşte de la frecvenţa ultimului interval al repartiţiei se obţin frecvenţele

Page 51: TURDEAN MARINELLA - BAZELE STATISTICII - Manual debv.ucdc.ro/bv/F_1_bazele-statisticii-turdean.pdf · 3 MARINELLA SABINA TURDEAN LIGIA PRODAN BAZELE STATISTICII - Manual de studiu

51

cumulate descrescător. Pe axa Ox se vor reprezenta intervalele echidistante între ele, iar pe axa Oy se vor reprezenta frecvenţele cumulate într-un sens şi în altul. Pe grafic vor apare două curbe care unesc punctele de coordonate: centru de interval cu frecvenţele cumulate crescător şi centru de interval cu frecvenţele cumulate descrescător.

Exemplu. Utilizând datele din tabelul 4.10, se va reprezenta curba frecvenţelor cumulate (figura 4.7).

Tabelul 4.10.Distribuţia angajaţilor după salariul brut lunar

Salariul lunar brut

(lei)

Număr de angajaţi

(fi)

Frecvenţele absolute cumulate

crescător

Frecvenţele absolute cumulate

descrescător 5-6 5 5 70 6-7 10 15 65 7-8 25 40 55 8-9 15 55 40

9-10 10 65 15 10-11 5 70 5 Total 70 * *

Distributia angajatilor dupa salariu - frecvente cumulate crescator si descrescator

0

10

20

30

40

50

60

70

80

1000-2000 2000-3000 3000-4000 4000-5000 5000-6000 6000-7000

Frecvente cumulatecrescatorFrecvente cumulatedescrescator

Fig.4.7 4.3.2.5. Diagrame teritoriale Cartogramele sunt grafice care se utilizează pentru prezentarea

densităţii de repartiţie teritorială a fenomenelor cu ajutorul hărţilor. Densitatea de repartiţie se va reprezenta prin culori sau haşuri de intensităţii diferite. Cartodiagramele reprezintă o formă specială a cartogramelor care constau dintr-o combinaţie a cartogramei cu diagramele (cerc, pătrat, coloane) care se aplică pe cartogramă.

4.6 Aplicatii practice

Să se reprezinte grafic distribuţia şi structura clienţilor în funcţie de nivelul creditului primit.

Nr.crt. Grupe de clienţi după nivelul creditului (mii euro)

Număr de clienţi, fi Structura clienţilor fi* (%)

1 [28 – 30) 2 6,7 2 [30 – 32) 5 16,7

Page 52: TURDEAN MARINELLA - BAZELE STATISTICII - Manual debv.ucdc.ro/bv/F_1_bazele-statisticii-turdean.pdf · 3 MARINELLA SABINA TURDEAN LIGIA PRODAN BAZELE STATISTICII - Manual de studiu

52

3 [32 – 34) 10 33,3 4 [34 – 36) 7 23,3 5 [36 – 38) 4 13,3 6 [38 – 40) 2 6,7 Total 30 100

Structura clientilor in functie de creditul primit

7%

17%

33%

23%

13%7%

28 – 30 30 – 32 32 – 34 34 – 36 36 – 38 38 – 40

4.7 Îndrumar pentru autoverificare

4.7.1 Sinteza unităţii de studiu

Rezultatele prelucrării datelor obţinute în urma observării se prezintă sub formă de: tabele, serii şi grafice, în care relaţiile dintre fenomenele studiate apar într-o succesiune logică corespunzătoare relaţiilor obiective existente între acestea. Sistematizarea datelor prin tabele, serii şi grafice permite interpretarea statistică a formelor de manifestare a fenomenelor, precum şi calculul corect al indicatorilor statistici absoluţi şi derivaţi. Cu ajutorul tabelelor, seriilor şi graficelor se pot caracteriza atât grupele unei colectivităţi, cât şi întregul ansamblu.

Distributia clientilor in functie de creditul primit

2

5

10

7

4

2

0

2

4

6

8

10

12

28 – 30 30 – 32 32 – 34 34 – 36 36 – 38 38 – 40

Page 53: TURDEAN MARINELLA - BAZELE STATISTICII - Manual debv.ucdc.ro/bv/F_1_bazele-statisticii-turdean.pdf · 3 MARINELLA SABINA TURDEAN LIGIA PRODAN BAZELE STATISTICII - Manual de studiu

53

Tabelul statistic reprezintă cea mai adecvată formă de sistematizare şi prezentarea a unui ansamblu de relaţii cantitative despre fenomenele studiate

Elementele unui tabel statistic sunt: titlul general, titlurile interioare, reţeaua tabelului Tipuri de tabele statistice: tabelul simplu tabelul pe grupe tabelul combinat tabelul cu dublă intrare tabelul de asociere

Seriile statistice sunt rezultatul grupării datelor în funcţie de una sau mai multe caracteristici de grupare.

Seria statistică este o corespondenţă între două şiruri de date statistice: primul şir reprezintă variaţia caracteristicii de grupare, iar cel de-al doilea şir este rezultatul centralizării frecvenţelor de apariţie sau nivelul unei alte caracteristici aflată în corelaţie cu variabila studiată. Seriile statistice pot fi clasificate în funcţie de următoarele criterii: numărul caracteristicilor de grupare, conţinutul caracteristicilor de grupare, forma de exprimare a caracteristicii atributive, tipul variaţiei caracteristicii de grupare, gradul de variaţie a caracteristicii de grupare

. Analiza seriilor statistice urmăreşte determinarea valorilor tipice care caracterizează seria respectiva şi determinarea diferenţelor de nivel dintre termenii individuali şi aceste valori tipice cu scopul interpretării formei şi gradului de variaţie a caracteristicii studiate şi comparării lor în timp şi spaţiu.

În analiza distribuţiilor empirice se ţine cont de unele proprietăţi ale acestora, care se pot întâlni în toate cazurile sau sunt specifice anumitor serii. Principalele proprietăţi ale seriilor statistice sunt: variabilitatea, forma de repartiţie, independenţa (interdependenţa) şi omogenitatea termenilor.

Utilizarea metodei grafice de prezentare a datelor statistice are avantajul de a reda într-o formă simplă, atrăgătoare şi sugestivă trăsăturile esenţiale ale fenomenelor studiate în anumite condiţii de timp şi spaţiu. Reprezentarea grafică a datelor statistice permite:

interpretarea vizuală a mărimii raportului dintre doi sau mai mulţi indicatori statistici; memorarea datelor datorită caracterului sugestiv şi intuitiv; interpretarea structurii şi modificărilor structurale în timp sau în plan teritorial; interpretarea formei de realizare a interdependenţelor dintre două sau mai multe variabile

statistice; interpretarea tendinţelor de dezvoltare a fenomenelor studiate; popularizarea datelor statistice.

Reprezentările grafice se aleg în funcţie de specificul fenomenelor şi relaţiilor care trebuie evidenţiate prin utilizarea lor. Elementele unui grafic sunt:

Titlul graficului. Reţeaua graficului Scara de reprezentare neuniforme ca, de exemplu, scara logaritmică. Notele explicative Legendele Sursa de informaţie

Cele mai frecvente tipuri de grafice sunt: grafice prin coloane şi benzi; cronogramele; diagrame de structură diagrame de distribuţie; diagrame teritoriale.

4.7.2 Concepte şi termeni de reţinut prezentarea datelor statistice;

Page 54: TURDEAN MARINELLA - BAZELE STATISTICII - Manual debv.ucdc.ro/bv/F_1_bazele-statisticii-turdean.pdf · 3 MARINELLA SABINA TURDEAN LIGIA PRODAN BAZELE STATISTICII - Manual de studiu

54

tabelul statistic; tabel simplu, tabel pe grupe, tabel combinat, tabel cu dublă intrare, tabel de asociere serie statistică proprietăţile seriilor statistice: variabilitate, formă de repartiţie, independenţa / interdependenţa

termenilor, omogenitatea termenilor grafic prin coloane sau prin benzi; cronograma; diagramă de structură; diagramă de distribuţie; diagramă teritorială

4.7.3 Întrebări de control şi teme de dezbatere 1. Sub ce formă se prezintă rezultatele prelucrării datelor statistice? 2. Definiţi tabelul statistic şi indicaţi elementele unui tabel statistic. 3. Care sunt recomandările de care trebuie să se ţină cont în cazul prezentării datelor într-un tabel

statistic? 4. Care sunt principalelel tipuri de tabele statistice? 5. Definiţi noţiunea de serie statistică. 6. Prezentaţi criteriile în funcţie de care se clasifică seriile statistice şi tipurile de serii corespunzătoare

acestor criterii. 7. Enumeraţi şi caracterizaţi pe scurt proprietăţile seriilor statistice. 8. Enumeraţi avantajele reprezentării grafice a datelor statistice. 9. Care sunt principalele elemente ale unui grafic. 10. Care sunt principalele tipuri de grafice statistice.

Page 55: TURDEAN MARINELLA - BAZELE STATISTICII - Manual debv.ucdc.ro/bv/F_1_bazele-statisticii-turdean.pdf · 3 MARINELLA SABINA TURDEAN LIGIA PRODAN BAZELE STATISTICII - Manual de studiu

55

4.7.4 Bibliografie:

1. Biji, M., Biji, E. M., Lilea, E., Anghelache, C., (2002), Tratat de statistică, Editura Economica, Bucureşti

2. Biji, E.M., Lilea, E., Roşca, E., Vătui, M., (2010), Statistică pentru economişti, Editura Economică, Bucureşti;

3. Druică, E., (2012), Statistică pe înţelesul tuturor, Editura CH Beck, Bucureşti; 4. Duguleană, L., (2012) Bazele statisticii economice, Editura CH Beck, Bucureşti; 5. Turdean, M., (2012), Statistica, Editura Pro Universitaria, Bucureşti; 6. Ţiţan, E., (2012) Statistică – teorie şi aplicaţii în sectorul terţiar, Editura Meteor Press, Bucureşti;

Page 56: TURDEAN MARINELLA - BAZELE STATISTICII - Manual debv.ucdc.ro/bv/F_1_bazele-statisticii-turdean.pdf · 3 MARINELLA SABINA TURDEAN LIGIA PRODAN BAZELE STATISTICII - Manual de studiu

56

5 UNITATEA DE STUDIU 5 MĂRIMILE RELATIVE 5.1 Introducere 5.2 Obiectivele unităţii de studiu 5.3 Competenţele unităţii de studiu 5.4 Timpul alocat unităţii de studiu 5.5 Conţinutul unităţii de studiu

5.5.1 Consideraţii generale privind calculul mărimilor relative 5.5.2 Tipuri de mărimi relative

5.6 Aplicatii practice 5.7 Îndrumar pentru autoverificare 5.7.1 Sinteza unitatii de studiu 5.7.2 Concepte si termeni de retinut 5.7.3 Întrebări de control şi teme de dezbatere 5.7.4 Bibliografie

5.1 Introducere

În procesul cercetării statistice se observă diferenţe: (i) de la un nivel la altul, (ii) de la o unitate la alta, (iii) de la o grupă la alta, (iv) de la o colectivitate la alta. Pentru explicarea acestor diferenţe este necesară compararea indicatorilor statistici.Rezultatul comparării se exprimă cu ajutorul mărimilor relative.

5.2 Obiectivele unităţii de studiu

– definirea noţiunii de „mărime relativă”; – rezolvarea problemelor legate de calculul propriu-zis al

mărimilor relative, respectiv alegerea bazei de raportare, asigurarea comparabilităţii datelor şi alegerea formei de exprimare a acestora;

– cunoaşterea modului de calcul pentru diferite tipuri de mărimi relative;

– cunoaşterea modului de reprezentare grafică a diferitelor tipuri de mărimi relative

5.3 Competenţele unităţii de studiu:

– studenţii vor putea să utilizeze mărimile relative în analizele statistice

– studenţii vor putea clasifica mărimile relative în funcţie de conţinutul informaţiilor

– studenţii vor şti cum se alege baza de raportare; – studenţii vor supune calculului comparativ doar acele

mărimi ce corespund ca metodologie de culegere şi

Page 57: TURDEAN MARINELLA - BAZELE STATISTICII - Manual debv.ucdc.ro/bv/F_1_bazele-statisticii-turdean.pdf · 3 MARINELLA SABINA TURDEAN LIGIA PRODAN BAZELE STATISTICII - Manual de studiu

57

prelucrare sau/şi grad de cuprindere a elementelor ce definesc conţinutul indicatorilor.

– studenţii vor alege o formă corectă de exprimare pentru mărimile relative calculate

5.4 Timpul alocat unităţii de studiu: Pentru unitatea de studiu „Mărimi relative” timpul alocat este de 2 ore.

5.5 Conţinutul unităţii de studiu

5.5.1 Consideraţii generale privind calculul mărimilor relative

În procesul cercetării statistice se observă diferenţe: (i) de la un nivel la altul, (ii) de la o unitate la alta, (iii) de la o grupă la alta, (iv) de la o colectivitate la alta. Pentru explicarea acestor diferenţe este necesară compararea indicatorilor statistici.Rezultatul comparării se exprimă cu ajutorul mărimilor relative.

Definiţie O mărime relativă este rezultatul comparării sub formă de raport

a doi indicatori statistici absoluţi.

Mărimea relativă indică numărul de unităţi din indicatorul de raportat care revin la o unitate a indicatorului considerat bază de raportare.

Calculul mărimilor relative impune rezolvarea unor probleme legate de alegerea bazei de raportare, de asigurarea comparabilităţii datelor şi de alegerea formei de exprimare a mărimilor relative.

Alegerea bazei de raportare Baza de raportare se alege în funcţie de gradul de interdependenţă

dintre caracteristicile sau fenomenele studiate astfel încât rezultatul raportului să fie cât mai semnificativ, având în vedere că valoarea raportului depinde, în principal, de mărimea de la numitorul fracţiei.

Atunci când comparaţia se realizează în dinamica, se consideră ca bază de raportare un moment sau o perioadă semnificativă pentru dezvoltarea fenomenului.

Asigurarea comparabilităţii datelor Asigurarea comparabilităţii datelor constă în verificarea

metodologiei de calcul şi a timpului la care se referă datele. Exemplu, pentru calculul eficienţei capitalului fix sau a necesarului de capital fix, este necesar ca valoarea capitalului fix să fie calculată ca medie anuală, pentru a corespunde cu valoarea adăugată brută e pentru aceeaşi perioadă.

Se pot supune calculului comparativ doar acele mărimi ce corespund ca: (i) metodologie de culegere şi prelucrare sau/şi (ii) grad de cuprindere a elementelor ce definesc conţinutul indicatorilor.

Alegerea formei de exprimare a mărimilor relative Forma de exprimare a mărimilor relative se stabileste pornind de

la diferenţele de mărime ce există între indicatorii comparabili.

Page 58: TURDEAN MARINELLA - BAZELE STATISTICII - Manual debv.ucdc.ro/bv/F_1_bazele-statisticii-turdean.pdf · 3 MARINELLA SABINA TURDEAN LIGIA PRODAN BAZELE STATISTICII - Manual de studiu

58

Mărimile relative trebuie să fie sugestive şi pot fi exprimate prin (i) numere întregi, (ii) fracţii ordinare şi zecimale, (iii) procente, promile, prodecimile.

5.5.2 Tipuri de mărimi relative În funcţie de conţinutul informaţiilor, mărimile relative pot rezulta

în urma comparaţiilor privind aceeaşi variabila statistica sau două variabile diferite.

In cercetarea statistică se utilizează următoarele tipuri de mărimi relative:

1. mărimi relative de structura; 2. mărimi relative de coordonare; 3. mărimi relative de dinamica; 4. mărimi relative de intensitate. 5. mărimi relative ale planului. 5.5.2.1. Mărimile relative de structură Termenii sinonimi pentru mărimile relative de structură sunt

ponderi sau greutăţi specifice. Calculul mărimilor relative de structură este posibil atunci când

colectivitatea supusă cercetării este împărţită în grupe omogene în funţie de variaţia uneia sau a mai multor caracteristici. Mărimile relative de structură se utilizează pentru a stabili care este raportul dintre fiecare grupă şi întregul ansamblu. Mărimile relative de structură se pot calcula atât pentru valorile centralizate ale diferitelor caracteristici cât şi pentru frecvenţele grupelor. Dacă notăm nivelul absolut al caracteristicii din fiecare grupă cu x1, x2,

...., xn şi cu

n

1iix nivelul absolut (totalizat) al variabilei corespunzător

întregii colectivităţi, se pot obţine următoarele mărimi relative de structură, exprimate sub formă zecimală:

n

1i ix

nx

ng......

n

1i ix

2x

2g

n

1i ix

1x

1g

sau sub formă de procent:

100x

x%g...100

x

x%g100

x

x%g

n

1ii

nnn

1ii

22n

1ii

11

Dacă se calculează toate mărimile relative de structură

corespunzătoare tuturor grupelor în care s-a împărţit colectivitatea după variaţia aceleiaşi caracteristici şi se face suma lor, această sumă trebuie să fie 1 sau 100 în funcţie de modul de exprimare al mărimilor relative, sub formă zecimală sau procentual.

00,1

x

x

x

x...xx

x

x...

x

x

x

xn

1ii

n

1ii

n

1ii

n21n

1ii

nn

1ii

2n

1ii

1

Page 59: TURDEAN MARINELLA - BAZELE STATISTICII - Manual debv.ucdc.ro/bv/F_1_bazele-statisticii-turdean.pdf · 3 MARINELLA SABINA TURDEAN LIGIA PRODAN BAZELE STATISTICII - Manual de studiu

59

Deci 1,00gn

1ii

100100x

x100

x

x....xx

100x

x.....100

x

x100

x

x

n

1ii

n

1ii

n

1ii

n21

n

1ii

n

n

1ii

2

n

1ii

1

Deci,

n

1ii 100%g

Relaţiile generale de calcul pentru mărimile relative de structură exprimate zecimal, respectiv procentual, calculate pentru valorile centralizate ale caracteristicilor sunt:

n

1ii

ii

x

xg sau 100

x

xg

n

1ii

i%i

Mărimile relative pentru frecvenţele grupelor se pot calcula sub formă zecimală

n

1ii

z f

if

if

n

1i1*

zi

f , sau sub formă procentuală

100f

if

%if

n

1ii

n

1i100

%if

Mărimile relative de structură se reprezintă grafic cu ajutorul diagramelor de structură: dreptunghi, cerc, pătrat de structură.

Reprezentarea grafica a structurii productiei realizata in perioada curenta

A31%

B49%

C20%

Page 60: TURDEAN MARINELLA - BAZELE STATISTICII - Manual debv.ucdc.ro/bv/F_1_bazele-statisticii-turdean.pdf · 3 MARINELLA SABINA TURDEAN LIGIA PRODAN BAZELE STATISTICII - Manual de studiu

60

5.5.2.2. Mărimile relative de coordonare Mărimile relative de coordonare indică raporturile care există între

grupele aceleiaşi colectivităţi sau între două sau mai multe colectivităţi aflate în aceeaşi unitate de timp, dar în teritorii diferite. Ori de câte ori este posibil calculul mărimilor relative de structură, devine posibil şi calculul mărimilor relative de coordonare.

Exemple: se compară pentru o anumită perioadă numărul populaţiei din mediul urban cu cea din mediul rural, pe judeţele ţării; se compară indicatorii economici referitori la utilizarea forţei de muncă din cele opt regiuni statistice, cu indicatorii corespunzători dintr-o regiune aleasă ca bază de comparaţie sau cu indicatorii corespunzători calculaţi la nivelul economiei naţionale.

Mărimile relative de coordonare se utilizează, în special, în studiul variaţiei teritoriale având, prin urmare, caracter de indici teritoriali. Indicii teritoriali astfel constituiţi stau la baza comparaţiilor pe plan naţional (între judeţele ţării, între regiuni) şi pe plan internaţional între ţări, zone geografice, etc.

Direcţia de comparaţie nu este unică. Oricare din termenii seriei poate fi considerat bază de comparaţie.

Relaţia de calcul pentru mărimile relative de coordonare este:

KA/B = B

A

X

X

unde: XA = nivelul indicatorului care se compară; XB = nivelul indicatorului ales bază de comparaţie. Mărimile relative de coordonare se exprimă sub formă de coeficient

(zecimal). Mărimile relative de coordonare se reprezintă grafic cu ajutorul

diagramelor prin benzi sau a diagramelor prin coloane.Astfel se pot stabili relaţiile care există între grupele aceleiaşi colectivităţi. Dacă mărimile relative de coordonare se folosesc în studiul variaţiei teritoriale reprezentarea grafică este cartograma sau cartodiagrama.

Ponderea populatiei pe medii de rezidenta la recensaminte

43.6

54.3

52.7

61.8

45.7

47.3

38.2

56.4

0 10 20 30 40 50 60 70

15.03.1966

05.01.1977

07.01.1992

18.03.2002

Rural

Urban

Sursa: Anuarul Statistic al Romaniei, 2011, INS, Bucuresti, 2012, pag. 56

5.5.2.3. Mărimile relative de dinamică Mărimile relative de dinamică se utilizează pentru caracterizarea

statistică a evoluţiei în timp a fenomenelor. Aceste mărimi se calculează atunci când, pentru acelaşi indicator, există valori înregistrate în unităţi diferite de timp.

Mărimile relative de dinamică se mai numesc indici de dinamică.

Indicele de dinamică (y

't/tI ) are relaţia generală de calcul:

Page 61: TURDEAN MARINELLA - BAZELE STATISTICII - Manual debv.ucdc.ro/bv/F_1_bazele-statisticii-turdean.pdf · 3 MARINELLA SABINA TURDEAN LIGIA PRODAN BAZELE STATISTICII - Manual de studiu

61

100y

yI

't

ty

't/t

unde: yt = nivelul fenomenului în perioada / la momentul t; yt’ = nivelul fenomenului în perioada / la momentul t’; t, t’ = perioada / momentul de timp. Mărimile relative de dinamică se pot construi cu bază fixă şi cu

bază în lanţ (mobilă sau variabilă): Mărimile relative de dinamică cu bază fixă se obţin prin

raportarea fiecărui termen al unei serii cronologice la primul termen al seriei, conform relaţiei:

100y

yI

1

ty

't/t

unde: yt = nivelul fenomenului în perioada / la momentul t; y1 = nivelul fenomenului în prima perioadă / primul an din serie.

Indicele de dinamică cu bază fixă serveşte la determinarea modificărilor faţă de o bază de referinţă semnificativă.

Mărimile relative de dinamică cu bază în lanţ (mobilă sau variabilă) se obţin prin raportarea fiecărui termen al seriei la termenul precedent, conform relaţiei:

100y

yI

1t

ty

t/t'

unde: yt = nivelul fenomenului în perioada / la momentul t; yt-1 = nivelul fenomenului în perioada / momentul precedent perioadei / momentului t.

Mărimile relative ale dinamicii se exprimă sub formă zecimală sau procentual. Între mărimile relative ale dinamicii se poate stabili următoarea relaţie: produsul indicilor cu bază în lanţ este egal cu indicele cu baza fixă corespunzător întregii perioade:

y

1/t

1

TT

2t

y

1t/t Iy

yI

unde: yT = nivelul fenomenului la momentul T, ultimul an din serie. Relaţia este valabilă doar pentru cazul în care mărimile relative ale

dinamicii cu bază fixă şi bază în lanţ sunt exprimate zecimal. Mărimile relative de dinamică se reprezintă grafic cu ajutorul diagramelor prin coloane.

Indicii prosusului intern brut, anul precedent= 100

104.2106.3 107.3

96.793.7

107.9

85

90

95

100

105

110

2005 2006 2007 2008 2009 2010

Sursa: Anuarul Statistic al Romaniei, 2011, INS, Bucuresti, 2012, pag. 323-324

Page 62: TURDEAN MARINELLA - BAZELE STATISTICII - Manual debv.ucdc.ro/bv/F_1_bazele-statisticii-turdean.pdf · 3 MARINELLA SABINA TURDEAN LIGIA PRODAN BAZELE STATISTICII - Manual de studiu

62

5.5.2.4 Mărimile relative de intensitate Mărimile relative de intensitate reprezintă raporturile dintre doi

indicatori absoluţi, de natură diferită, care se afla într-o relaţie de interdependenţă obiectivă.

Relaţia generală de calcul pentru o mărime relativă de intensitate este:

i

ii z

yx

unde: xi = mărimea relativă de intensitate, caracteristică secundară (derivată); yi şi zi = caracteristici primare înregistrate direct prin observare statistică.

Mărimile relative de intensitate se pot calcula pentru fiecare unitate statistică, pe grupe sau pe total colectivitate.

Pentru mărimile relative de intensitate nu funcţionează relaţia de însumare directă.

Pentru a calcula nivelul unei mărimi relative de intensitate pe total colectivitate se aplică acelaşi procedeu ca şi în cazul determinării mărimii relative de intensitate la nivelul unităţii de observare. Astfel, nivelul mărimii relative de intensitate x pe total colectivitate “ X ” se obţine raportând nivelul totalizat al caracteristicii “y” la nivelul totalizat al caracteristicii “z” conform relaţiei:

X =

n

1ii

n

1ii

z

y

unde: n = numărul de unităţi observate. Mărimile relative de intensitate se utilizează în industrie (eficienţa

capitalului fix, necesarul de capital fix, înzestrarea muncii cu capital fix, productivitatea muncii), turism (indicatorii eficienţei activităţii de turism) şi demografie (coeficienţii mişcării naturale şi migratorii a populaţiei, densitatea populaţiei).

Unitatea de măsură a unei mărimi relative de intensitate este, de fapt, unitatea de măsură a unei noi variabile statistice rezultată din unitatea de masura a indicatorului de raportat si unitatea de măsură a indicatorului bază de raportare, de exemplu, lei/ persoana, (pentru productivitatea muncii). Mărimile relative de intensitate mai pot fi exprimate sub formă zecimală (leu/leu, necesarul de capital fix), promile (lei/1000 lei, eficienţa capitalului fix), prodecimile (pentru mărimile relative de intensitate specifice demografiei sau cele ce caracterizează aspecte referitoare la nivelul de trai, de exemplu, medici la 10000 locuitori).

5.5.2.5 Mărimile relative ale planului Mărimile relative ale planului se calculează la nivelul agenţilor

economici, în ideea elaborării unor programe de aprovizionare, producţie şi desfacere pe termen scurt şi mediu.

Calculul mărimilor relative ale planului presupune cunoaşterea următoarelor date din evidenţele economice al unităţii analizate:

x0 = nivelul realizat al fenomenului în perioada de bază; xpl = nivelul planificat al fenomenului pentru perioada curentă; x1 = nivelul realizat al fenomenului în perioada curentă. Din compararea sub formă de raport a celor trei indicatori rezultă: (i) mărimea relativă a sarcinii de plan, ce exprimă măsura în

care se urmăreşte, în perioada curentă, depăşirea nivelului atins de un

Page 63: TURDEAN MARINELLA - BAZELE STATISTICII - Manual debv.ucdc.ro/bv/F_1_bazele-statisticii-turdean.pdf · 3 MARINELLA SABINA TURDEAN LIGIA PRODAN BAZELE STATISTICII - Manual de studiu

63

fenomen în perioada aleasă ca bază de comparaţie:

100x

xi

0

pls

0/pl

unde: s

0/pli = indicele sarcinii de plan.

Indicele sarcinii de plan pentru variabila producţie este de dorit să fie supraunitar în timp ce acelaşi indice pentru “costuri” este de preferat să aibă valoare subunitară.

(ii) mărimea relativă a realizării planului care măsoară gradul de realizare a sarcinilor faţa de nivelul prevăzut de plan:

010x

xi

pl

1i

1/pl

unde: i

pl/1i = indicele realizării planului.

(iii) mărimea relativă a dinamicii care măsoară gradul de realizare a planului în perioada curentă faţă de perioada de bază:

100x

xi

0

1d

1/0

unde: d

0/1i = indicele de dinamică.

Intre cei trei indici exprimaţi sub formă zecimală se poate stabili relaţia:

i

pl/1

s

0/pl

d

0/1 iii

Dacă se cunosc informaţii la nivel parţial (pe secţii) se pot calcula mărimile relative ale planului pe ansamblu/total societate comercială/total colectivitate.

Indicele sarcinii de plan pe total societatecomercială

010x

xI

n

1i0

n

1ipl

s

pl/0

Indicele realizării planului pe totalsocietate comercială

010x

xI

n

1ipl

n

1i1

i

1/pl

Indicele de dinamică pe total societatecomercială

100x

xI

n

1i0

n

1i1

d

1/0

Între indicii de mai sus există relaţia: d

1/0

i

1/pl

s

pl/0 III

Mărimile relative ale planului se exprimă sub formă zecimală sau sub formă procentuală şi se reprezintă grafic cu ajutorul diagramelor prin coloane.

Page 64: TURDEAN MARINELLA - BAZELE STATISTICII - Manual debv.ucdc.ro/bv/F_1_bazele-statisticii-turdean.pdf · 3 MARINELLA SABINA TURDEAN LIGIA PRODAN BAZELE STATISTICII - Manual de studiu

64

Gradul de indeplinire a planului pe fiecare sectie si pe total agent economic

103%

109%

115%

108.19%

9698

100102104106108110112114116

A B C Total agenteconomic

5.6 Aplicatii practice Pentru un agent economic se cunosc datele:

Secţia Productia realizata in perioada de baza

(mil. lei)

Productia planificata in perioada curenta

(mil. lei)

Indicele indeplinirii planului

A 20 26 1,03 B 30 40 1,09 C 10 15 1,15

TOTAL 60 81 Se cere:

1. Producţia realizată în perioada curentă, pe fiecare secţie şi pe total. 2. Indicele sarcinii de plan, pe fiecare sectie şi pe total 3. Indicele de dinamică pe fiecare secţie şi pe total 4. Indicele îndeplinirii planului pe total 5. Reprezentarea grafică a structurii producţiei realizată în perioada de bază şi în perioada curentă 6. Reprezentarea grafică a gradului de îndeplinire a planului pe fiecare secţie Rezolvare: 1. Producţia realizată în perioada curentă, pe fiecare secţie se calculează astfel:

pli1/pl1

pl

1i1/pl xix

x

xi

lei.mil78,262603,1xix Apli

A1/plA1 lei.mil6,434009,1xix Bpli

B1/plB1

lei.mil25,171515,1xix Cpli

C1/plC1

Producţia realizată în perioada curentă, pe total agent economic este:

lei.mil63,8725,176,4378,26x3

1i1

2. Indicele sarcinii de plan, pe fiecare secţie se determină conform relaţiei: 0

plspl/0 x

xi

Page 65: TURDEAN MARINELLA - BAZELE STATISTICII - Manual debv.ucdc.ro/bv/F_1_bazele-statisticii-turdean.pdf · 3 MARINELLA SABINA TURDEAN LIGIA PRODAN BAZELE STATISTICII - Manual de studiu

65

%130sau3,120

26

x

xi

A0

AplsApl/0 %33,133sau3333,1

30

40

x

xi

B0

BplsBpl/0

%150sau5,110

15

x

xi

C0

CplsCpl/0

Indicele sarcinii de plan pe total agent economic este:

%135sau35,1lei.mil60

lei.mil81

x

x

I3

1i0

3

1ipl

spl/0

3. Indicele de dinamică pe fiecare secţie se determină conform relaţiei: 0

1d0/1 x

xi

%9,133sau339,120

78,26

x

xi

A0

A1dA1/0 %33,145sau4533,1

30

6,43

x

xi

B0

B1dB1/0

%5,172sau725,110

25,17

x

xi

C0

C1dC1/0

sau i

pl/1s

0/pld

0/1 iii

%9,133sau339,103,13,1iii iApl/1

sA0/pl

dA0/1

%33,145sau4533,109,1333,1iii iBpl/1

sB0/pl

dB0/1

%5,172sau725,115,15,1iii iCpl/1

sC0/pl

dC0/1

Indicele de dinamică pe total agent economic este:

%05,146sau4605,1lei.mil60

lei.mil63,87

x

x

I3

1i0

3

1i1

d1/0

sau

%05,146sau4605,10819,135,1III i1/pl

spl/0

d1/0

3. Indicele îndeplinirii planului pe total agent economic este:

%19,108sau0819,1lei.mil81

lei.mil63,87

x

x

I3

1ipl

3

1i1

i1/pl

4. Structura producţiei realizată în perioada de bază se determină conform relaţiei:

100

x

x%g

3

1ii0

i0

i0

; 100

x

x%g

3

1ii1

A1

i1

%33,33100lei.mil60

lei.mil20100

x

x%g

3

1ii0

A0

A0

%56,30100lei.mil63,87

lei.mil78,26100

x

x%g

3

1ii1

A1

A1

Page 66: TURDEAN MARINELLA - BAZELE STATISTICII - Manual debv.ucdc.ro/bv/F_1_bazele-statisticii-turdean.pdf · 3 MARINELLA SABINA TURDEAN LIGIA PRODAN BAZELE STATISTICII - Manual de studiu

66

%50100lei.mil60

lei.mil30100

x

x%g

3

1ii0

B0

B0

%75,49100lei.mil63,87

lei.mil6,43100

x

x%g

3

1ii1

B1

B1

%67,16100lei.mil60

lei.mil10100

x

x%g

3

1ii0

C0

C0

%69,19100lei.mil63,87

lei.mil25,17100

x

x%g

3

1ii1

C1

C1

Rezultatele calculelor sunt prezentate în tabelul de mai jos.

Secţia Productia realizata in perioada curenta (mil. lei)

Indicele sarcinii de plan

Indicele de dinamica

Structura producţiei realizată în perioada de bază (%)

Structura producţiei realizată în perioada curentă (%)

A 26,78 1,3 1,339 33,33 30,56 B 43,6 1,3333 1,4533 50 49,75 C 17,25 1,5 1,725 16,67 19,69 TOTAL 87,63 1,35 1,4605 100 100

Reprezentarea grafica a structurii productiei realizata in perioada curenta

A31%

B49%

C20%

Fig. 5.1 Fig. 5.2 5. Reprezentarea grafică a gradului de îndeplinire a planului pe fiecare secţie

Gradul de indeplinire a planului pe fiecare sectie si pe total agent economic

108.19%

115%

109%

103%

95

100

105

110

115

120

A B C Total agenteconomic

Reprezentarea grafica a structurii productiei realizata in perioada de baza

A33%

B50%

C17%

Page 67: TURDEAN MARINELLA - BAZELE STATISTICII - Manual debv.ucdc.ro/bv/F_1_bazele-statisticii-turdean.pdf · 3 MARINELLA SABINA TURDEAN LIGIA PRODAN BAZELE STATISTICII - Manual de studiu

67

Fig.5.3

5.7 Îndrumar pentru autoverificare

5.7.1 Sinteza unităţii de studiu

O mărime relativă este rezultatul comparării sub formă de raport a doi indicatori statistici absoluţi. Mărimea relativă indică numărul de unităţi din indicatorul de raportat care revin la o unitate a

indicatorului considerat bază de raportare. Calculul mărimilor relative impune rezolvarea unor probleme legate de alegerea bazei de raportare,

asigurarea comparabilităţii datelor şi alegerea formei de exprimare a mărimilor relative. Relaţiile generale de calcul pentru mărimile relative sunt: Nr. crt.

Tipuri de mărimi relative

Relaţia de calcul

1 Mărimi relative de structură 100

x

xg

n

1ii

i%i

sau

100f

if

%if

n

1ii

2 Mărimi relative de

coordonare KA/B = B

A

X

X

3 Mărimi relative de

dinamică 100y

yI

't

ty

't/t

4 Mărimi relative de intensitate

La nivelul unei unităţi statistice/ grupe

La nivelul colectivităţii statistice, (în medie)

i

ii z

yx

X =

n

1ii

n

1ii

z

y

5 Mărimi relative ale

planului La nivelul unei unităţi statistice/ grupe

La nivelul colectivităţii statistice, (în medie)

Indicele sarcinii de plan 100

x

xi

0

pls

0/pl

010x

xI

n

1i0

n

1ipl

s

pl/0

Indicele îndeplinirii planului 010

x

xi

pl

1i

1/pl 010

x

xI

n

1ipl

n

1i1

i

1/pl

Page 68: TURDEAN MARINELLA - BAZELE STATISTICII - Manual debv.ucdc.ro/bv/F_1_bazele-statisticii-turdean.pdf · 3 MARINELLA SABINA TURDEAN LIGIA PRODAN BAZELE STATISTICII - Manual de studiu

68

Indicele de dinamică 100

x

xi

0

1d

1/0 100

x

xI

n

1i0

n

1i1

d

1/0

5.7.2 Concepte şi termeni de reţinut

mărime relativă; mărimi relative de structură; mărimi relative de coordonare; mărimi relative de dinamică; mărimi relative de intensitate; mărimi relative ale planului

5.7.3 Întrebări de control şi teme de dezbatere 1. Ce sunt mărimile relative? 2. Care sunt principalele probleme care trebuie rezolvate pentru a calcula mărimile relative? 3. Enumeraţi tipurile de mărimi relative studiate. 4. Ce tipuri de mărmi relative se utilizează pentru compararea a doi indicatori cu acelaşi conţinut? 5. Ce tip de mărime relativă se utilizează pentru compararea a doi indicatori cu conţinut diferit, între

care există o legătură obiectivă? 6. Cum se reprezintă grafic mărimile relative de structură? 7. Cum se reprezintă grafic mărimile relative de dinamică? 8. Cum se reprezintă grafic mărimile relative de coordonare? 9. Cum se reprezintă grafic mărimile relative de intensitate? 10. Cum se reprezintă grafic mărimile relative ale planului?

Page 69: TURDEAN MARINELLA - BAZELE STATISTICII - Manual debv.ucdc.ro/bv/F_1_bazele-statisticii-turdean.pdf · 3 MARINELLA SABINA TURDEAN LIGIA PRODAN BAZELE STATISTICII - Manual de studiu

69

5.7.4 Bibliografie:

1. Anghelache, C., Isaic- Maniu, A., Mitruţ, C., Voineagu, V., Dumbravă , M., (2007), Analiză economică, sinteze şi studii de caz, Editura Economică, Bucureşti;

2. Băcescu- Carbunaru, A., (2009) Statistică- bazele statisticii, Editura Universitară, Bucureşti; 3. Begu, L.S., (2009), Statistică internaţională –analize comparative, Editura Universitară, Bucureşti 4. Biji, E.M., Lilea, E., Roşca, E., Vătui, M., (2010), Statistică pentru economişti, Editura

Economică, Bucureşti; 5. Druică, E., (2012), Statistică pe înţelesul tuturor, Editura CH Beck, Bucureşti; 6. Duguleană, L., (2012) Bazele statisticii economice, Editura CH Beck, Bucureşti; 7. Turdean, M., (2012), Statistica, Editura Pro Universitaria, Bucureşti;

Page 70: TURDEAN MARINELLA - BAZELE STATISTICII - Manual debv.ucdc.ro/bv/F_1_bazele-statisticii-turdean.pdf · 3 MARINELLA SABINA TURDEAN LIGIA PRODAN BAZELE STATISTICII - Manual de studiu

70

6 UNITATEA DE STUDIU 6 ANALIZA SERIILOR DE DISTRIBUŢIE I -MĂRIMILE MEDII-

6.1 Introducere 6.2 Obiectivele unităţii de studiu 6.3 Competenţele unităţii de studiu 6.4 Timpul alocat unităţii de invăţare 6.5 Conţinutul unităţii de studiu

6.5.1 Condiţii de aplicare şi de calcul pentru mărimile medii 6.5.2 Media aritmetică 6.5.3 Media armonică 6.5.4 Media pătratică 6.5.5 Media geometrică 6.5.6 Media caracteristicii alternative

6.6 Aplicaţii practice 6.7 Îndrumar pentru autoverificare 6.7.1 Sinteza unitatii de invatare 6.7.2 Concepte si termeni de retinut 6.7.3 Întrebări de control şi teme de dezbatere 6.7.4 Bibliografie

6.1 Introducere

Determinarea valorilor tipice care să fie reprezentative pentru întreaga colectivitate studiată se realizează prin calculul mărimilor medii care exprimă ceea ce este comun şi general în forma de manifestare a fenomenelor de masă urmărind eliminarea a ceea ce este întâmplător şi neesenţial în producerea lor.

Mărimile medii sunt: (I) indicatori derivaţi, (II) care au caracter abstract (Exemplu: salariul mediu de 662 (ne referim la lei grei de la 1 iulie 2005) lei s-ar fi putut să nu-l fi primit nici un individ din colectivitatea statistică) şi (III) se exprimă în unităţi de măsură concrete.

6.2 Obiectivele unităţii de studiu

– cunoaşterea semnificaţiei mărimilor medii; – cunoaşterea condiţiilor de calcul a mărimilor medii; – definirea mediei aritmetice, mediei armonice, mediei

pătratice şi mediei geometrice; – cunoaşterea proprietăţilor diferitelor tipuri de medii; – cunoaşterea utilizărilor diferitelor tipuri de medii

Page 71: TURDEAN MARINELLA - BAZELE STATISTICII - Manual debv.ucdc.ro/bv/F_1_bazele-statisticii-turdean.pdf · 3 MARINELLA SABINA TURDEAN LIGIA PRODAN BAZELE STATISTICII - Manual de studiu

71

6.3 Competenţele unităţii de studiu:

– studenţii vor putea să definească media aritmetică, media armonică, media pătratică, media geometrică, media caracteristicii alternative;

– studenţii vor putea calcula medii simple sau medii ponderate, în funcţie de tipul seriilor statistice;

– studenţii vor cunoaşte proprietăţile mediilor studiate şi relaţiile dintre acestea;

– studenţii vor putea stabili ce tip de medie caracterizează cel mai bine fenomenul studiat;

6.4 Timpul alocat unităţii de studiu:

Pentru unitatea de studiu Analiza seriilor de distribuţie I –Mărimile medii , timpul alocat este de 2 ore.

6.5 Conţinutul unităţii de studiu

6.5.1 Condiţii de aplicare şi de calcul pentru mărimile medii

Calculul mărimilor medii trebuie să se bazeze pe un număr mare de cazuri individuale diferite.

Valorile individuale ale caracteristicii pentru care se calculează mărimile medii să nu difere prea mult de la o unitate la alta, deci colectivitatea să fie omogenă.

Dacă valorile individuale diferă semnificativ se calculează medii parţiale (sau pe grupe omogene).

Pentru a caracteriza cât mai corect fenomenul, trebuie ales acel tip de medie care corespunde cel mai bine formei de variaţie a caracteristicii studiate.

În practica statistică se utilizează: (i) media aritmetica, (ii) media armonică, (iii) media pătratică, (iv) media geometrică, (v) media cronologică. Toate aceste medii se calculează sub formă de medii simple sau ponderate. În analizele statistice se mai utilzează şi (vi) media caracteristicii alternative.

Mediile simple se utilizează atunci când numărul variantelor sub care s-a înregistrat caracteristica este egal cu numărul unităţilor la care s-a făcut observarea. Mediile ponderate se utilizează atunci când aceeaşi variantă se întâlneşte la mai multe unităţi de observare, deci fiecărei variante a caracteristicii i se poate ataşa o frecvenţă.

În continuare se vor descrie modul de calcul şi proprietăţile principalelor tipuri de medii utilizate în statistică, cu excepţia mediei cronologice, care se va trata la capitolul “Analiza seriilor cronologice”.

Page 72: TURDEAN MARINELLA - BAZELE STATISTICII - Manual debv.ucdc.ro/bv/F_1_bazele-statisticii-turdean.pdf · 3 MARINELLA SABINA TURDEAN LIGIA PRODAN BAZELE STATISTICII - Manual de studiu

72

6.5.2 Media aritmetică In statistica social-economică, se utilizează cel mai des media

aritmetică, de aceea când se vorbeşte despre medie, se înţelege automat că este vorba despre media aritmetică, iar în cazul în care s-a calculat alt tip de medie se va specifica felul ei.

Definiţie 1. Media aritmetica este rezultatul sintetizării într-o singură

expresie numerică a tuturor nivelurilor individuale observate. Seobţine prin raportarea valorii totalizate a caracteristicii la numărultotal al unităţilor statistice observate.

2. Media aritmetica este valoarea la care ar fi ajuns fiecareunitate înregistrată dacă toţi factorii ar fi acţionat constant în toatecazurile.

3. Media aritmetică este acea valoare pe care dacă o utilizămpentru a înlocui toţi termenii seriei am obţine o sumă egală cu suma termenilor reali.

Media aritmetică simplă se calculează atunci când numărul variantelor sub care s-a înregistrat caracteristica este egal cu numărul unităţilor statistice.

Pentru calculul mediei aritmetice simple se fac următoarele

notaţii: x = caracteristica statistică;

x1, x2, ...., xn = valorile caracteristicii unde: i = n,1 ; n = numărul de unităţi înregistrate;

x = media aritmetică.

x1 + x2 + ....+ xn =

n

1iix

x + x + ....+ x = n x Prin egalarea ecuaţiilor de mai sus se obţine expresia:

n x =

n

1iix

de unde: x = n

xn

1ii

În calculele statistice se întâlnesc mai rar cazuri în care numărul variantelor (m) coincide cu numărul unităţilor (n). De regulă, aceeaşi valoare individuală se întâlneşte de mai multe ori şi, ca urmare, trebuie să se ţină cont şi de frecvenţele de apariţie.

x1 ; x2 ;....; xm fi = frecvenţa de apariţie a variabilei xi; n = numărul unităţilor statistice; f1 ; f2 ;....; fm m = numărul variantelor, m < n. Pentru seriile statistice de frecvenţe se utilizează media

aritmetică ponderată Nivelul totalizat al caracteristicii este:

x1 f1+ x2 f2+ ....+ xm fm= i

m

1ii fx

Page 73: TURDEAN MARINELLA - BAZELE STATISTICII - Manual debv.ucdc.ro/bv/F_1_bazele-statisticii-turdean.pdf · 3 MARINELLA SABINA TURDEAN LIGIA PRODAN BAZELE STATISTICII - Manual de studiu

73

Dacă se înlocuiesc nivelurile individuale ale caracteristicilor cu

valoarea tipică, media,

x , se obţine:

x f1 + x f2+ ....+ x fm = x (f1 + f2 +...+fm) =

m

1iifx

Prin egalarea ecuaţiilor de mai sus se obţine:

m

1iifx = i

m

1ii fx

de unde: x =

m

1ii

m

1iii

f

fx

În cazul în care frecvenţele (numărul de apariţii) sunt

exprimate sub forma de procente relaţia de calcul a mediei aritmetice ponderate devine:

x = 100

%fx

%f

%fxm

1i

*ii

m

1ii

m

1i

*ii

unde: fi*% = 100

f

fm

1ii

i

şi 100%fm

1i

*i

.

Dacă frecvenţele sunt exprimate sub formă de zecimală, relaţia de calcul a mediei aritmetice ponderate devine:

x =

m

1i

*icim

1ici

m

1i

*ici

fxf

fx

unde: f*ic =

m

1ii

i

f

fşi 1f

m

1i

*ic

.

Calculul mediei într-o serie de distribuţie de frecvenţe pe intervale de grupare

Dacă repartiţia de frecvenţe se prezintă pe intervale de variaţie, xi reprezintă centrul de interval corespunzător.

O serie statistică pe intervale de grupare poate fi prezentată cu frecvenţe absolute (fi) sau cu frecvenţe relative (f*

i%; f*ic).

fi*% =

m

1ii

i

f

f; fi

*c =

m

1ii

i

f

f

unde: fi = frecvenţa absolută a grupei “i”;

Page 74: TURDEAN MARINELLA - BAZELE STATISTICII - Manual debv.ucdc.ro/bv/F_1_bazele-statisticii-turdean.pdf · 3 MARINELLA SABINA TURDEAN LIGIA PRODAN BAZELE STATISTICII - Manual de studiu

74

fi*% = frecvenţa relativă a grupei “i” exprimată procentual;

fi*

c = frecvenţa relativă a grupei “i” exprimată sub formă de coeficient.

Considerând, în mod convenţional, că în fiecare interval

frecvenţele se distribuie uniform, înseamnă că valoarea medie a caracteristicii în fiecare grupă va fi egală cu media aritmetică simplă a celor doua limite, inferioară şi superioară. Cu cât intervalele sunt mai mici cu atât mărimea centrului de interval (ci) este mai reprezentativă pentru caracterizarea grupei respective.

2

sup.lim.inf.limci

sau ci = lim. inf. +1/2 (din mărimea intervalului) Dacă seria prezintă intervale deschise (sub 100, peste 1000)

este necesară închiderea intervalelor cu aceeaşi mărime ca şi a celor alăturate (intervalul următor, respectiv intervalul precedent).

În cazul seriilor pe intervale egale de grupare, dacă se calculează centrul de interval pentru prima grupă, celelalte centre de interval se află într-o progresie aritmetică cu raţia egală cu mărimea intervalelor.

În cazul seriilor pe intervale de grupare neegale calcularea fiecărui centru de interval este obligatorie, deoarece creşterea acestora nu mai este uniformă

Calculul mediei pentru o serie de distribuţie cu intervale de grupare nu este o mărime exactă. Doar în mod convenţional se consideră că frecvenţele se distribuie uniform în interval, în realitate, valorile centrelor de interval nu sunt medii exacte pentru grupele de unităţi constituite după caracteristica de grupare aleasă.

Media aritmetică determinată pe baza unei serii de distribuţie de frecvenţe pe intervale de grupare va fi cu atât mai apropiată de media calculată din datele individuale centralizate cu cât: (i) frecvenţele sunt mai mari; (ii) frecvenţele sunt simetric distribuite, (iii) mărimea intervalelor de grupare este mai mica.

Media se exprimă în unitatea de măsură a variabilei. Media este exactă atunci când o calculăm direct din valorile

sub care s-a înregistrat caracteristica. Ea este o medie aproximativă când o calculăm pe baza unei serii pe intervale de variaţie. În acest caz determinarea mediei se bazează pe stabilirea centrelor de interval în ipoteza repartizării uniforme a frecvenţelor în cadrul fiecărui interval.

Proprietăţile mediei aritmetice a) Într-un şir de valori egale media acestora este egală cu

fiecare dintre ele indiferent dacă seria este o serie simplă sau o serie de frecvenţe:

x1 = x2 = ....= xi = ....= xn = xc

x = cc

n

1ii

xn

xn

n

x

b) Media aritmetică este întotdeauna o valoare cuprinsă în intervalul de variaţie al caracteristicii:

xmin < x < xmax

Page 75: TURDEAN MARINELLA - BAZELE STATISTICII - Manual debv.ucdc.ro/bv/F_1_bazele-statisticii-turdean.pdf · 3 MARINELLA SABINA TURDEAN LIGIA PRODAN BAZELE STATISTICII - Manual de studiu

75

Dacă din calcule rezultă că media se plasează în afara acestor limite, rezultatul este în mod sigur eronat.

c) În cazul unei serii de distribuţie de frecvenţe, media se încadrează între valorile extreme ale variabilei, oscilând în jurul termenului cu frecvenţa cea mai mare.

Proprietăţile a), b) şi c) servesc la calculul logic al mediei aritmetice.

d) Într-o serie statistică suma algebrică a tuturor abaterilor individuale ale termenilor seriei de la media lor aritmetică este egală cu «0», adică:

0xxn

1ii

Demonstraţie pentru cazul unei serii simple:

0n

xnxxnxxxxx

n

1i

n

1ii

i

n

1ii

n

1i

n

1ii

n

1ii

În cazul seriei de frecvenţe, compensarea reciprocă a

abaterilor are loc după relaţia:

0fxx i

m

1ii

0

f

fx

ffx

fxfxfxfxfxx

m

1im

1ii

m

1iiim

1iiii

m

1ii

m

1iii

m

1i

m

1iiiii

m

1ii

Proprietăţile a) d) permit verificarea exactităţii calculelor. e) Dacă într-o serie statistică se micşorează sau se măresc toţi

termenii cu o constantă “a” şi se calculează media aritmetică a noilor termeni, această medie va fi mai mică sau mai mare decât media seriei iniţiale cu constanta “a”.

Demonstraţie pentru cazul unei serii simple. Noua serie cu termeni măriţi sau micşoraţi va fi:

x1’ = x1 a; x2’ = x2 a;.....; xn’ = xn a Aplicând relaţia de calcul a mediei aritmetice simple pentru

noua serie, obţine relaţia:

axn

an

n

x

n

ax

n

ax.....axax'x

n

1ii

n

1ii

n21

Page 76: TURDEAN MARINELLA - BAZELE STATISTICII - Manual debv.ucdc.ro/bv/F_1_bazele-statisticii-turdean.pdf · 3 MARINELLA SABINA TURDEAN LIGIA PRODAN BAZELE STATISTICII - Manual de studiu

76

Pentru cazul unei serii de frecvenţe se obţine, în mod similar:

ax

f

fa

f

fx

f

fax

'xm

1ii

m

1ii

m

1ii

m

1iii

m

1ii

i

m

1ii

f) Dacă într-o serie statistică se amplifică sau se simplifică toţi

termenii seriei cu un factor constant “k” şi se calculează media noilor termeni, aceasta va avea o valoare care va fi de “k” ori mai mare sau mai mică decât media seriei iniţiale.

Demonstraţie: 1.Termeni amplificaţi

Pentru cazul unei serii simple, noua serie cu termeni amplificaţi va fi:

x1’ = x1 k; x2’ = x2k;.....; xn’ = xn k Aplicând relaţia de definiţie a mediei aritmetice simple pentru

noua serie, se obţine:

xkn

xk

n

kx....kxkx'x

n

1ii

n21

Pentru cazul unei serii de frecvenţe cu termeni amplificaţi se

obţine:

xk

f

fxk

f

fkx

'xm

1ii

m

1iii

m

1ii

i

m

1ii

1.Termeni simplificaţi Ppentru cazul unei serii simple, noua serie cu termeni

simplificaţi va fi

x1’ = k

x1 ; x2’ = k

x2 ;.....; xn’ =k

xn

Aplicând relaţia de definiţie a mediei aritmetice simple pentru noua serie, se obţine:

xk

1

n

xk

1

nk

x....

k

x

k

x

'x

n

1ii

n21

Pentru cazul unei serii de frecvenţe cu termeni simplificaţi se obţine:

xk

1

f

fxk

1

f

fk

x

'xm

1ii

m

1iii

m

1ii

i

m

1i

i

Proprietăţile e) - f) servesc la calculul simplificat al mediei

Page 77: TURDEAN MARINELLA - BAZELE STATISTICII - Manual debv.ucdc.ro/bv/F_1_bazele-statisticii-turdean.pdf · 3 MARINELLA SABINA TURDEAN LIGIA PRODAN BAZELE STATISTICII - Manual de studiu

77

aritmetice. Utilizarea calculului simplificat al mediei este recomandabil atunci când seria se prezintă pe intervale de variaţie egale.

În cazul unei serii de distribuţie de frecvenţe, dacă din toţi termenii seriei vom scădea constanta “a” şi apoi îi vom împărţi cu constanta “k”, va rezulta o nouă medie. Pentru a obţine media iniţială vom înmulţi noua medie cu constanta “k” şi vom aduna apoi constanta “a”. In acest scop se utilizează relaţia:

ak

f

fk

ax

xm

1ii

i

m

1i

i

unde este de preferat ca cele două constante “a” şi “k” să fie: “a” = mijlocul unui interval, de obicei centrul intervalului cu frecvenţa cea mai mare; “k” = mărimea (lungimea) intervalului de grupare; un divizor al diferenţei “xi - a”.

g) Dacă într-o serie statistică de distribuţie se reduc proporţional toate frecvenţele cu aceeaşi constanta “c”, media calculată pe baza noilor frecvenţe rămâne neschimbată, adică:

Demonstraţie Pornind de la relaţia mediei aritmetice ponderate

m

1ii

m

1iii

m21

mm2211

f

fx

f.....ff

fx....fxfxx

în care, dacă se înlocuiesc noile valori ale frecvenţei, rezultă:

m

1ii

m

1iii

m

1ii

m

1iii

m

1i

i

m

1i

ii

m21

mm

22

11

f

fx

fc

1

fxc

1

c

fc

fx

c

f.....

c

f

c

fc

fx....

c

fx

c

fx

'x

Această proprietate serveşte la calculul mediei cu ajutorul frecvenţelor relative.

Demonstraţie. În cazul în care constanta “c” este

m

1iif

Page 78: TURDEAN MARINELLA - BAZELE STATISTICII - Manual debv.ucdc.ro/bv/F_1_bazele-statisticii-turdean.pdf · 3 MARINELLA SABINA TURDEAN LIGIA PRODAN BAZELE STATISTICII - Manual de studiu

78

x

f

fx

f

f

1

fx

f

1

f

f

f

fx

m

1ii

m

1iii

m

1iim

1ii

m

1iiim

1ii

m

1im

1ii

i

m

1im

1ii

ii

Din relaţia de mai sus reiese faptul că media nu se schimbă dacă frecvenţele absolute “fi” sunt înlocuite cu frecvenţele relative corespunzătoare, fi

*.

. xf

fx

f

f

f

fx

m

1i

*i

m

1i

*ii

m

1im

1ii

i

m

1im

1ii

ii

Dacă frecvenţa relativă se exprimă procentual,

100

f

f%f

m

1ii

i*i

, atunci 100%fm

1i

*i

şi relaţia se poate scrie:

100

%fx

%f

%fxx

m

1i

*ii

m

1i

*i

m

1i

*ii

Dacă frecvenţa relativă se exprimă zecimal,

m

1ii

i*zi

f

ff ,

atunci 1fm

1i

*zi

şi relaţia devine:

m

1i

*ziim

1i

*zi

m

1i

*zii

fxf

fxx

h) Într-o serie de variaţie cu frecvenţe egale media aritmetică ponderată se transformă într-o medie simplă.

Demonstraţie: Fie fc = frecvenţa constantă, adică f1 = f2 = ... = fm =fc,:

m

x

fm

xf

fm

fx

f.....ff

fx....fxfx'x

m

1ii

c

m

1iic

c

m

1ici

ccc

cmc2c1

i) Într-o colectivitate împărţită în “r” grupe omogene, media pe

total (n

xx

n

1ii

o

) se poate calcula pe baza mediilor de grupă

Page 79: TURDEAN MARINELLA - BAZELE STATISTICII - Manual debv.ucdc.ro/bv/F_1_bazele-statisticii-turdean.pdf · 3 MARINELLA SABINA TURDEAN LIGIA PRODAN BAZELE STATISTICII - Manual de studiu

79

(

m

1ii

i

m

1ii

i

f

fxx ) folosind în acest scop următoarea relaţie:

r

1ii

i

r

1i

i

o

n

nxx

unde:

m = numărul de variante ale caracteristicii din fiecare grupă “r”; r = numărul de grupe; n = numărul unităţilor statistice din colectivitatea generală, m < n,

ni = numărul unităţilor statistice din grupa r;

m

1iii fn ,

r

1iinn .

fi = numărul de apariţii ale variantei m în grupa r

j) Media aritmetică a sumei a două variabile întâmplătoare “X”

şi “Y” este egală cu suma mediilor celor două variabile luate în calcul.

Notând variabilele factoriale “x” şi “y” şi variabila complexa “x + y” se obţine:

yxyx

unde vom înlocui pe n

)yx(

yx

n

1iii

şi va rezultă:

yx

n

y

n

x

n

yx

n

yx....yxyxyx

n

1ii

n

1ii

n

1i11

nn2211

GENERALIZARE. Valoarea medie a sumei mai multor

variabile independente este egală cu suma valorilor medii ale tuturor variabilelor luate în calcul.

k) Media produsului a două variabile întâmplătoare este egală

cu produsul mediilor celor două variabile.

Notând variabile factoriale “x” şi “y” şi variabila complexă “ xy ”, se obţine:

Page 80: TURDEAN MARINELLA - BAZELE STATISTICII - Manual debv.ucdc.ro/bv/F_1_bazele-statisticii-turdean.pdf · 3 MARINELLA SABINA TURDEAN LIGIA PRODAN BAZELE STATISTICII - Manual de studiu

80

yxxy Ştiind că:

n

y

n

y...yyy

n

x

n

x...xxx

n

1ii

n21

n

1ii

n21

relaţia devine:

nnn

yn

x....2

yn

x1

yn

x...n

y2

x....2

y2

x1

y2

xn

y1

x....2

y1

x1

y1

xxy

yx

nn

yx

nn

yx...xx

nn

yx...yxyxn

1ii

n

1ii

n

1iin21

n

1iin

n

1ii2

n

1ii1

GENERALIZARE: Media produsului mai multor variabile

întâmplătoare, este egală cu produsul mediilor fiecărei variabile.

6.5.3 Media armonică Definiţie

Media armonică (xh) a termenilor unei serii este acea valoare a cărei mărime inversă este media aritmetică calculată din valorile inverse ale termenilor aceleiaşi serii.

Relaţiile de calcul sunt:

pentru o serie simplă

n

1i ix

1n

x h

pentru o serie de repartiţie de frecvenţe

m

1ii

i

m

1ii

fx

1

f

x h

Dacă toate valorile caracteristicii sunt pozitive, media

armonică este întotdeauna mai mică decât media aritmetică calculată pe baza aceloraşi valori.

Dacă se consideră două variabile dependente funcţional, y = 1/x şi pentru o variabilă se utilizează media aritmetica, atunci pentru cealaltă variabilă este obligatoriu să se utilizeze media armonică. Dacă din evidenţe rezultă numai variantele caracteristicii (xi) şi produsele de frecvenţă “xifi” fără să avem date despre frecvenţele absolute “fi” pentru calculul mediei armonice ponderate se va utiliza următoarea formulă:

Page 81: TURDEAN MARINELLA - BAZELE STATISTICII - Manual debv.ucdc.ro/bv/F_1_bazele-statisticii-turdean.pdf · 3 MARINELLA SABINA TURDEAN LIGIA PRODAN BAZELE STATISTICII - Manual de studiu

81

m

1iii

i

m

1iii

fxx

1

fx

x h

Media armonică poate fi egală cu media aritmetică calculată

din aceleaşi valori ale caracteristicii, dar folosind sisteme de ponderare diferite.

m

1iii

i

m

1iii

m

1ii

m

1iii

fxx

1

fxx

f

fxx h

Media armonică este egală cu media aritmetică numai în cazul în care media aritmetică are ca ponderi frecvenţele absolute “fi”, iar media armonică are ca ponderi produsele “xifi”. Utilizând acest sistem de ponderare, media armonică poate fi uşor transformată în medie aritmetică.

Media armonică determinată cu acest sistem de ponderare se foloseşte la calculul nivelului mediu al unei caracteristici derivate cu caracter de mărime medie. Exemplu, (i) indicele mediu de grup al preţurilor (când lipsesc informaţii despre volumul fizic al mărfurilor), (ii) la calculul salariului mediu pe întreprindere, când se cunoaşte salariul mediu şi fondul de salarii la nivelul secţiilor, (iii) la calculul producţiei medii la hectar în cadrul unei unităţi agricole, când se cunoaşte recolta medie şi recolta totală pe parcelele acesteia.

În comparaţie cu media aritmetică, media armonică este mai puţin influenţată de valorile extreme.

6.5.4 Media pătratică Definiţie Media pătratică (xp) este acea valoare pe care dacă o utilizăm

pentru a înlocui toţi termenii seriei am obţine o sumă egală cu sumapătratelor termenilor reali.

Demonstraţie pentru cazul unei serii simple

n

1i

2i

2n

22

21 xx...xx

Dacă fiecare termen al relaţiei de mai sus este înlocuit cu media

pătratică, se obţine:

n

1i

2i

2p

2p

2p xx...xx

adică

n

1i

2i

2p xxn

Page 82: TURDEAN MARINELLA - BAZELE STATISTICII - Manual debv.ucdc.ro/bv/F_1_bazele-statisticii-turdean.pdf · 3 MARINELLA SABINA TURDEAN LIGIA PRODAN BAZELE STATISTICII - Manual de studiu

82

deci: n

xx

n

1i

2i

p

Similar, pentru cazul unei serii de frecvenţe se obţine:

m

1ii

m

1ii

2i

p

f

fxx

xh <x <xp Media pătratică se utilizează la calculul abaterii medii

pătratice, fiind unul din cei mai utilizaţi indicatori de variaţie.

6.5.5 Media geometrică Definiţie Media geometrică (“Xg”) este acea valoare pe care dacă o

utilizăm pentru a înlocui toţi termenii seriei am obţine un produsegal cu produsul termenilor reali.

Demonstraţie pentru cazul unei serii simple:

x1 · x2 · .... · xn =

n

iix

1

Dacă fiecare termen al seriei este înlocuit cu media

geometrică

xg ·xg ·....· xg =

n

1iix

se obţine

(xg)n =

n

1iix ,

iar relaţia de calcul pentru media geometrică simplă este:

xg = n

n

1iix

In cazul seriilor de distribuţie de frecvenţa se calculează media geometrică ponderată, adică:

m

i

fi

fm

ff im xxxx1

21 ...21

Dacă fiecare termen este înlocuit cu media geometrică,

obţinem:

m

i

fi

fg

fg

fg

im xxxx1

)(...)()( 21

Prin egalarea ecuaţiilor de mai sus se obţine:

Page 83: TURDEAN MARINELLA - BAZELE STATISTICII - Manual debv.ucdc.ro/bv/F_1_bazele-statisticii-turdean.pdf · 3 MARINELLA SABINA TURDEAN LIGIA PRODAN BAZELE STATISTICII - Manual de studiu

83

m

i

fi

fg

i

m

ii xx

1

1

iar relaţia de calcul pentru media geometrică ponderată este:

m

ii

if m

i

fig xx 1

1

O metodă de determinare, atât a mediei geometrice simple, cât

şi a celei ponderate constă în logaritmarea variabilei. Astfel se obţine:

- pentru media geometrică simplă:

n

xlogxlog

n

1ii

g

- pentru media geometrică ponderată

m

1ii

m

1iii

g

f

xlogfxlog

Proprietăţile mediei geometrice sunt: a) Dacă un termen al seriei este cu zero sau are valoare

negativă, media geometrică a seriei nu se mai poate calcula. b) Abaterile termenilor seriei faţă de medie nu se mai

calculează ca diferenţe, ca şi în cazul mediei aritmetice, ci sub formă de rapoarte xi / xg, iar produsul acestor abateri este întotdeauna egal cu 1.

c) Media geometrică se utilizează frecvent în cazul seriilor dinamice, la calculul mediilor din mărimile relative ale dinamicii, între care există o relaţie de produs (de exemplu, calculul indicelui mediu de dinamică).

d) Media geometrică se foloseşte mai rar în cazul seriilor de distribuţie de frecvenţe. Acest tip de medie este recomandabil să se utilizeze atunci când seria prezintă variaţii foarte mari între termeni sau un pronunţat caracter de asimetrie.

e) Prin logaritmare media geometrică se transformă într-o medie aritmetică a logaritmilor factorilor, iar antilogaritmul ei este o valoare mai mică decât media aritmetică calculată din valorile reale ale termenilor seriei (xg < x ).

Între tipurile de medii prezentate mai sus există următoarea

relaţie: xh < xg < x < xp

6.5.6 Media caracteristicii alternative În cercetarea statistică a fenomenelor social-economice se

întâlnesc caracteristici ale căror variante nu se exprimă numeric (cantitativ), ci prin cuvinte (calitativ) şi nu admit decât una din două alternative. Orice caracteristică numerică nealternativă se

Page 84: TURDEAN MARINELLA - BAZELE STATISTICII - Manual debv.ucdc.ro/bv/F_1_bazele-statisticii-turdean.pdf · 3 MARINELLA SABINA TURDEAN LIGIA PRODAN BAZELE STATISTICII - Manual de studiu

84

poate transforma într-o caracteristică alternativă prin raportarea la un anumit prag care poate fi, de exemplu, media aritmetică. In această situaţie, unităţile colectivităţii se vor separa în două grupe: unităţi cu nivel de dezvoltare mai mic decât media şi unităţi cu nivel de dezvoltare mai mare decât media.

Caracteristica alternativă are doar două variante da - nu (de exemplu, produs bun - produs rebut, populaţie ocupată - populaţie neocupată, salariaţi care şi-au îndeplinit norma - salariaţi care nu şi-au îndeplinit norma, student promovat - student nepromovat).

Pentru a calcula media aritmetică a caracteristicii alternative este necesar să se exprime numeric cele două variante pe care le pot lua aceste caracteristici.

Convenţional, se vor considera variantele cu răspuns afirmativ ca având valoarea “1”, iar variantele cu răspuns negativ ca având valoarea “0”.

Valorile caracteristicii vor fi: x1 = 1, pentru răspunsul “da” şi x2 = 0, pentru răspunsul “nu”.

Pentru a demonstra cât mai clar modul de calcul al mediei caracteristicii alternative, vom sistematiza elementele necesare aşa cum este prezentat în tabelul 6.1.

Tabelul 6.1.Distribuţia de frecvenţe a caracteristicii alternative

Răspunsul înregistrat

Valoarea caracteristicii

(xi)

Frecvenţe absolute (fi)

Frecvenţe relative (fiz)

Da x1 = 1 M p = M/N Nu x2 = 0 N - M q = (N - M)/N =

1 - M/N = = 1 - p

Total N = M + (N -M)

p + q = 1

unde:

M = numărul unităţilor ce posedă caracteristică; N = numărul total al unităţilor; N - M = numărul unităţilor ce nu posedă caracteristică. În cazul distribuţiei de frecvenţă prezentată în tabel, media se

va calcula aplicând relaţia de calcul a mediei aritmetice ponderate descrisă de ecuaţia 6.8, care pentru cazul nostru devine:

x =

m

1ii

m

1iii

f

fx = p

N

M

MNM

MNM

)(

)(01

Se poate observa că media caracteristicii alternative reprezintă

tocmai frecvenţa relativă (exprimată zecimal) a răspunsurilor afirmative.

Altfel spus, media caracteristicii alternative se obţine raportând numărul de unităţi la care s-a înregistrat una din cele două variante ale caracteristicii, la numărul total al unităţilor statistice. Deoarece unităţile colectivităţii se divid în doua părţi, unele care posedă caracteristică şi altele care nu posedă caracteristică, media caracteristicii alternative poate fi considerată şi ca o mărime relativă de

Page 85: TURDEAN MARINELLA - BAZELE STATISTICII - Manual debv.ucdc.ro/bv/F_1_bazele-statisticii-turdean.pdf · 3 MARINELLA SABINA TURDEAN LIGIA PRODAN BAZELE STATISTICII - Manual de studiu

85

structură, o pondere, o greutate specifică, o frecvenţă relativă. Exemplu: Dintr-o colectivitate N = 2000 persoane un număr

M = 20 persoane au declarat că locuiesc într-o zonă rezidenţială, deci media caracteristicii alternative ”persoane care locuiesc într-o zonă rezidenţială” este p = M/N = 20/2000 = 0,01, ceea ce reprezintă 1%.. Ponderea persoanelor care nu locuiesc într-o zonă rezidenţialăva fi 99%.

Pentru calculul mediei generale (p) din medii parţiale ale unei

caracteristici alternative (pi) se poate utiliza relaţia de calcul a mediei aritmetice ponderate.

Ştiind că: i

ii N

Mp

se obţine:

m

1ii

m

1iii

N

Np

p

Dacă în relaţia de mai sus se înlocuieşte pi Ni = Mi, se obţine

m

1ii

m

1ii

N

M

p

unde: p = media generală a caracteristicii alternative; pi = media de grupă a caracteristicii alternative; Ni = frecvenţa unităţilor din fiecare grupă; m = numărul de grupe în care a fost împărţită colectivitatea; Mi = frecvenţa unităţilor care îndeplinesc caracteristica în fiecare grupă.

În aplicaţiile concrete, mărimile medii nu se folosesc aleatoriu, ci în funcţie de specificul şi proprietăţile fenomenelor.

Cea mai frecventă întrebare care se poate pune este: “Care dintre tipurile de medii descrise caracterizează mai exact o serie statistica?” Pentru a răspunde la această întrebare trebuie analizată seria de valori, deoarece pentru orice colectivitate statistică există o proprietate determinantă, care trebuie să rămână neschimbată oricare ar fi variaţiile posibile ale valorilor înregistrate, xi. Media este deci o valoare “x ” reprezentativă pentru o serie de variante x1, x2,..., xn, care prin substituţia xi = x nu modifică proprietatea determinantă a seriei.

6.6 Aplicaţii practice Problema 6.1. Pentru patru unităţi statistice s-au înregistrat datele 2, 5, 7, 10.Să se calculeze tipurile de medii cunoscute şi să se verifice relaţia dintre acestea.

Page 86: TURDEAN MARINELLA - BAZELE STATISTICII - Manual debv.ucdc.ro/bv/F_1_bazele-statisticii-turdean.pdf · 3 MARINELLA SABINA TURDEAN LIGIA PRODAN BAZELE STATISTICII - Manual de studiu

86

Media aritmetică simplă: 64

24

4

10752

n

x

x

n

1ii

Media armonică simplă: 24,49428,0

4

10

1

7

1

5

1

2

14

x

1

nx

n

1i i

h

Media pătratică simplă: 67,64

10752

n

x

x2222

n

1i

2i

p

Media geometrică simplă: 14,570010752xx 44n

n

1iig

Între cele patru tipuri de medii există relaţia:

67,6614,524,4

xxxx pgh

Problema 6.2. Pentru 14 unităţi statistice s-au înregistrat datele:

xi 2 5 7 10 fi 3 4 5 2

Să se calculeze tipurile de medii cunoscute şi să se verifice relaţia dintre acestea.

Media aritmetică ponderată: 78,514

81

14

210574532

f

fxx

m

1ii

i

m

1ii

Media armonică ponderată: 35,42

10

15

7

14

5

13

2

114

fx

1

f

xm

1ii

i

m

1ii

h

Media pătratică ponderată: 30,614

210574532

f

fxx

2222

m

1ii

m

1ii

2i

p

Media geometrică ponderată: 11,510016807625810752xx 1414 2543f m

1i

fig

m

1ii

i

Page 87: TURDEAN MARINELLA - BAZELE STATISTICII - Manual debv.ucdc.ro/bv/F_1_bazele-statisticii-turdean.pdf · 3 MARINELLA SABINA TURDEAN LIGIA PRODAN BAZELE STATISTICII - Manual de studiu

87

11,5x7088,0xlog

7088,0924,914

1)10log27log55log42log3(

14

1xlog

xlogff

1xlog

gg

g

iii

g

30,698,511,535,4

xxxx pgh

6.7 Îndrumar pentru autoverificare

6.7.1 Sinteza unităţii de studiu

Media aritmetică este cel mai cunoscut indicator al tendinţei centrale şi se calculează raportând suma valorilor la numărul lor. Media aritmetică este considerată în principiu reprezentativă pentru că ia în calcul toate valorile unei serii de date. Principalul dezavantaj al mediei aritmetice constă în faptul că, prin modul de calcul acordă aceeaşi importanţă valorilor extreme, deci nu poate fi considerată reprezentativă în cazul în care se întâlnesc astfel de valori. Doar accidental mărimea mediei aritmetice coincide cu vreo valoare individuală observată. Dacă toate valorile caracteristicii sunt pozitive, media armonică este întotdeauna mai mică decât media aritmetică calculată pe baza aceloraşi valori. Dacă se consideră două variabile dependente funcţional, y = 1/x şi pentru o variabilă se utilizează media aritmetica, atunci pentru cealaltă variabilă este obligatoriu să se utilizeze media armonică. Media armonică poate fi egală cu media aritmetică calculată din aceleaşi valori ale caracteristicii, dar folosind sisteme de ponderare diferite.Media armonică este egală cu media aritmetică numai în cazul în care media aritmetică are ca ponderi frecvenţele absolute “fi”, iar media armonică are ca ponderi produsele “xifi”. Utilizând acest sistem de ponderare, media armonică poate fi uşor transformată în medie aritmetică.În comparaţie cu media aritmetică, media armonică este mai puţin influenţată de valorile extreme.

Media pătratică se utilizează când se dă o mai mare importanţă termenilor mai mari ai seriei. Media pătratică este întotdeauna mai mare decât media aritmetică a aceloraşi termeni. Dacă un termen al seriei este cu zero sau are valoare negativă, media geometrică a seriei nu se mai poate calcula. Abaterile termenilor seriei faţă de medie nu se mai calculează ca diferenţe, ca şi în cazul mediei aritmetice, ci sub formă de rapoarte xi / xg, iar produsul acestor abateri este întotdeauna egal cu 1.Media geometrică se utilizează frecvent în cazul seriilor dinamice, la calculul mediilor din mărimile relative ale dinamicii, între care există o relaţie de produs (de exemplu, calculul indicelui mediu de dinamică). Media geometrică se foloseşte mai rar în cazul seriilor de distribuţie de frecvenţe. Acest tip de medie este recomandabil să se utilizeze atunci când seria prezintă variaţii foarte mari între termeni sau un pronunţat caracter de asimetrie. Prin logaritmare media geometrică se transformă într-o medie aritmetică a logaritmilor factorilor, iar antilogaritmul ei este o valoare mai mică decât media aritmetică calculată din valorile reale ale termenilor seriei.

Media caracteristicii alternative se obţine raportând numărul de unităţi la care s-a înregistrat una din cele două variante ale caracteristicii, la numărul total al unităţilor statistice.

Page 88: TURDEAN MARINELLA - BAZELE STATISTICII - Manual debv.ucdc.ro/bv/F_1_bazele-statisticii-turdean.pdf · 3 MARINELLA SABINA TURDEAN LIGIA PRODAN BAZELE STATISTICII - Manual de studiu

88

Relaţiile de calcul pentru diferitele tipuri de medii

Tip medie Medii simple Medii ponderate

Media aritmetică

x = n

xn

1ii

m

1ii

m

1iii

f

fxx = *

iz

m

1ii

m

1i

*ii

m

1i

*i

m

1i

*ii

fx100

%fx

%f

%fx

Media armonică

n

1i i

h

x

1n

x

m

1ii

i

m

1ii

fx

1

f

x h =

m

ii

i

m

ii

i

m

ii

fx

fx

f

1

*

1

*

1

*

%1100

%1

%=

m

1i

*iz

i

fx

11

Media pătratică

n

xx

n

ii

p

1

2

m

1ii

m

1ii

2i

p

f

fxx =

m

ii

m

iii

f

fx

1

*

1

*2

%

%=

100

%fxm

1i

*i

2i

=

m

1i

*iz

2i fx

Media geometric

ă

xg = n

n

1iix

m

1ii

if m

1i

fig xx

Între cele patru tipuri de medii există relaţia:

pgh xxxx

Media caracteristicii alternative:

NMp

6.7.2 Concepte şi termeni de reţinut

mărimi medii; medii simple, medii ponderate; frecvenţă absolută; frecvenţă relativă exprimată procentual sau zecimal; media aritmetică; media armonică; media pătratică; media geometrică; media cronologică media caracteristicii alternative.

Page 89: TURDEAN MARINELLA - BAZELE STATISTICII - Manual debv.ucdc.ro/bv/F_1_bazele-statisticii-turdean.pdf · 3 MARINELLA SABINA TURDEAN LIGIA PRODAN BAZELE STATISTICII - Manual de studiu

89

6.7.3 Întrebări de control şi teme de dezbatere

1. Care sunt condiţiile de care trebuie ţinut cont la calculul mărimilor medii? 2. Enumeraţi tipurile de medii utilizate în analizele statistice. 3. Când se calculează medii simple şi când se calculează medii ponderate? 4. Definiţi media aritmetică şi prezentaţi modul de calcul al mediei aritmetice simple şi al mediei

aritmetice ponderate 5. Prezentaţi proprietăţile şi utilizările mediei aritmetice. 6. Definiţi media armonică şi prezentaţi modul de calcul al mediei armonice simple şi al mediei

armonice ponderate 7. Prezentaţi proprietăţile şi utilizările mediei armonice. 8. Definiţi media pătratică şi prezentaţi modul de calcul al mediei pătratice simple şi al mediei

pătratice ponderate 9. Prezentaţi proprietăţile şi utilizările mediei pătratice. 10. Definiţi media geometrică şi prezentaţi modul de calcul al mediei geometrice simple şi al

mediei geometrice ponderate 11. Prezentaţi proprietăţile şi utilizările mediei geometrice. 12. Definiţi media caracteristicii alternative şi prezentaţi modul de calcul al acesteia. 13. Ce relaţie există între media aritmetică, media geometrică, media pătratică şi media armonică.

6.7.4 Bibliografie:

1. Biji, M., Biji, E. M., Lilea, E., Anghelache, C., (2002), Tratat de statistică, Editura Economica, Bucureşti

2. Biji, E.M., Lilea, E., Roşca, E., Vătui, M., (2010), Statistică pentru economişti, Editura Economică, Bucureşti;

3. Druică, E., (2012), Statistică pe înţelesul tuturor, Editura CH Beck, Bucureşti; 4. Duguleană, L., (2012) Bazele statisticii economice, Editura CH Beck, Bucureşti; 5. Turdean, M., (2012), Statistica, Editura Pro Universitaria, Bucureşti;

Page 90: TURDEAN MARINELLA - BAZELE STATISTICII - Manual debv.ucdc.ro/bv/F_1_bazele-statisticii-turdean.pdf · 3 MARINELLA SABINA TURDEAN LIGIA PRODAN BAZELE STATISTICII - Manual de studiu

90

7 UNITATEA DE STUDIU 7 ANALIZA SERIILOR DE DISTRIBUŢIE -II – MĂRIMILE MEDII DE POZIŢIE

7.1 Introducere 7.2 Obiectivele unităţii de studiu 7.3 Competenţele unităţii de studiu 7.4 Timpul alocat unităţii de invăţare 7.5 Conţinutul unităţii de studiu

7.5.1 Mediana 7.5.2 Modul 7.5.3 Cuartile 7.5.4 Decile

7.6. Aplicaţii practice 7.7. Îndrumar pentru autoverificare 7.7.1 Sinteza unitatii de invatare 7.7.2 Concepte si termeni de retinut 7.7.3 Întrebări de control şi teme de dezbatere 7.7.4 Bibliografie

7.1 Introducere

Mărimile medii reflectă ceea ce este esenţial şi tipic în nivelul de dezvoltare a fenomenelor, dar nu caracterizează modul de repartiţie a frecvenţelor în cadrul seriei.

Pentru a completa analiza seriilor de distribuţie este necesară şi calcularea unor valori medii de poziţie dintre care mediana şi modul (sau dominanta) sunt cele mai importante.

7.2 Obiectivele unităţii de studiu

– cunoaşterea indicatorilor care completează analiza seriilor de distribuţie;

– definirea noţiunilor: mediană, mod, cuartile, decile; – cunoaşterea modului de calcul al acestor indicatori în cazul

seriilor pe variante şi în cazul seriilor de distribuţie de frecvenţe; – definirea şi utilizarea indicatorilor coeficient de variaţie

intercuartilică şi coeficient de variaţie interdecilică.

7.3 Competenţele unităţii de studiu:

– studenţii vor putea să definească noţiuni ca: mediana, mod, cuartile, decile, coeficient de variaţie intercuartilică şi

Page 91: TURDEAN MARINELLA - BAZELE STATISTICII - Manual debv.ucdc.ro/bv/F_1_bazele-statisticii-turdean.pdf · 3 MARINELLA SABINA TURDEAN LIGIA PRODAN BAZELE STATISTICII - Manual de studiu

91

coeficient de variaţie interdecilică. – studenţii vor cunoaşte etapele de calcul ale indicatorilor de

poziţie pentru seriile pe variante şi pentru seriile de distribuţie de frecvenţe;

– şi vor putea calcula şi interpreta nivelul indicatorilor de poziţie pentru seriile pe variante şi pentru seriile de distribuţie de frecvenţe;

– studenţii vor putea calcula şi interpreta valorile obţinute pentru coeficientul de variaţie intercuartilică şi coeficientul de variaţie interdecilică;

7.4 Timpul alocat unităţii de studiu:

Pentru unitatea de studiu „Analiza seriilor de distribuţie II – Mărimile medii de poziţie”, timpul alocat este de 2 ore.

7.5 Conţinutul unităţii de studiu

7.5.1 Mediana Definiţie Mediana (Me) reprezintă valoarea centrală a unei serii

statistice ordonată crescător sau descrescător, care împartetermenii seriei în două părţi egale: 50% din numărul termenilor vor fi mai mici decât mediana şi 50% dintre aceştia vor fi mai maridecât mediana.

* Calculul medianei pentru cazul seriilor pe variante: În cazul seriilor simple, locul medianei se determină conform

relaţiei:

locul Me = 2

1n

unde: n = numărul termenilor seriei. Pentru seriile pe variante cu număr impar de termeni (n = 2k +

1), valoarea medianei este dată de valoarea termenului de rang “k+1”, adică valoarea termenului central care are proprietatea de a împărţi termenii seriei ordonată crescător (sau descrescător) în doua părţi egale.

Pentru seriile pe variante cu număr par de termeni (n = 2k), mediana se poate determina ca medie aritmetică simplă a celor doi termeni centrali.

* Calculul medianei pentru cazul seriilor de distribuţie de frecvenţe:

Pentru seriile de distribuţie de frecvenţe pe intervale, calculul medianei presupune acceptarea următoarei ipoteze: în fiecare interval frecvenţele se distribuie uniform.

Calculul propriu-zis al valorii medianei este precedat de determinarea frecvenţelor absolute cumulate crescător, a locului

Page 92: TURDEAN MARINELLA - BAZELE STATISTICII - Manual debv.ucdc.ro/bv/F_1_bazele-statisticii-turdean.pdf · 3 MARINELLA SABINA TURDEAN LIGIA PRODAN BAZELE STATISTICII - Manual de studiu

92

medianei şi a intervalului median:

locul Me =

1f2

1 n

1ii

Intervalul median va fi acel interval a cărui frecvenţă absolută

cumulată crescător ( cumMef ) este prima mai mare decât locul medianei

dat de relaţia de calcul.

cumMef >

1f2

1 n

1ii

Relaţia de calcul a medianei pentru o serie de distribuţie de frecvenţe este:

Me = x0 + h abs

Me

cumpMe

n

1ii

f

f1f2

1

unde: x0 = limita inferioară a intervalului median; h = mărimea intervalului median;

cumpMef = frecvenţa cumulată a intervalului precedent celui median; abs

Mef = frecvenţa absolută a intervalului median.

Pentru a determina pe grafic valoarea medianei se va utiliza curba cumulativă a frecvenţelor (figura 7.1). Se suprapun pe acelaşi grafic curba frecvenţelor cumulate crescător şi curba frecvenţelor cumulate descrescător, iar din punctul lor de intersecţie se coboară o perpendiculară pe axa absciselor unde se va citi valoarea medianei.

Me Figura 7.1. Determinarea grafică a medianei Mediana se exprimă în aceeaşi unitate de măsură ca şi variabila studiată.

7.5.2 Modul (dominanta) Definiţie

Modul unei distribuţii statistice este acea valoare a caracteristicii care corespunde frecvenţei maxime.

Fiind valoarea cea mai frecvent întâlnită, modul mai este cunoscut în literatura de specialitate şi sub denumirea de dominanta seriei.

Pentru seriile de variante modul se calculează în cazul în care există un nivel al caracteristicii care apare de mai multe ori. Se determină frecvenţa maximă şi se citeşte valoarea caracteristicii corespunzătoare.

Pentru o serie de distribuţie de frecvenţe pe intervale se stabileşte întâi intervalul modal, adică acel interval care are frecvenţa maximă. Relaţia de calcul a modului este:

Page 93: TURDEAN MARINELLA - BAZELE STATISTICII - Manual debv.ucdc.ro/bv/F_1_bazele-statisticii-turdean.pdf · 3 MARINELLA SABINA TURDEAN LIGIA PRODAN BAZELE STATISTICII - Manual de studiu

93

M0 = x0 + h 21

1

unde: x0 = limita inferioară a intervalului modal; h = mărimea intervalului modal; 1 = diferenţa dintre frecvenţa absolută a

intervalului modal şi frecvenţa absolută a intervalului precedent celui modal;

2 = diferenţa dintre frecvenţa absolută a intervalului modal şi frecvenţa absolută a intervalului următor celui modal.

Pentru seriile de distribuţie pe intervale, determinarea grafică a modului se face cu ajutorul histogramei (figura 7.2). Se notează pe grafic cu A, B, C şi D punctele de coordonate:

Fig. 7.2 Determinarea grafică a modului

A = limita inferioară a intervalului modal, frecvenţa intervalului precedent celui modal;

B = limita inferioară a intervalului modal, frecvenţa intervalului modal;

C = limita superioară a intervalului modal, frecvenţa intervalului modal;

D = limita superioara a intervalului modal, frecvenţa intervalului următor celui modal.

Din punctul de intersecţie a segmentelor de dreaptă care unesc punctele A şi C, respectiv punctele B şi D se trasează o perpendiculară pe abscisă unde se citeşte valoarea modului.

Uneori modul poate înlocui valoarea mediei aritmetice, când aceasta nu are sens sau nu poate fi calculata.

Exemplu. Talia în industria confecţiilor (la femei, nr. 48 - 52; la bărbaţi, nr. 52 - 56); mărimea cea mai des solicitată la încălţăminte (la femei nr. 36 - 37; la bărbaţi nr. 40 - 42). Modul se exprimă în aceeaşi unitate de măsură ca şi variabila studiată.

7.5.3 Cuartile Pentru seriile de distribuţie de frecvenţe cu tendinţă pronunţată

de asimetrie sau caracterizate printr-o amplitudine mare a variaţiei, se calculează şi alţi indicatori de poziţie cum ar fi: cuartile, decile, percentile.

Page 94: TURDEAN MARINELLA - BAZELE STATISTICII - Manual debv.ucdc.ro/bv/F_1_bazele-statisticii-turdean.pdf · 3 MARINELLA SABINA TURDEAN LIGIA PRODAN BAZELE STATISTICII - Manual de studiu

94

Definiţie Cuartilele sunt acele valori ale caracteristicii care separă o

serie statistică ordonată crescător sau descrescător în patru părţiegale.

Cele trei cuartile care se calculează sunt: Q1 - 25% din termenii seriei sunt mai mici decât Q1 şi 75% din

termeni sunt mai mari decât Q1; Q2 este egală cu mediana, adică 50% din termenii seriei sunt

mai mici decât Q2 şi 50% din termenii seriei sunt mai mari decât Q2;

Q3 - 75% din termenii seriei sunt mai mici decât Q3 şi 25% din termeni sunt mai mari decât Q3.

Modul de calcul al cuartilelor este asemănător cu cel al medianei şi urmează etapele:

a) Seria se ordonează crescător; b) Se determină frecvenţele absolute cumulate crescător; c) Se calculează locul Q1 şi locul Q3:

locul Q1 =

1f4

1 n

1ii

locul Q3 =

1f4

3 n

1ii

d) Se determină intervalul în care se situează Q1, ca fiind acel interval a cărui frecvenţă absolută cumulată crescător

cum

1Qf este prima mai mare decât locul Q1 dat de relaţia de calcul;

e) Se determină intervalul în care se situează Q3, ca fiind acel interval a cărui frecvenţă absolută cumulată crescător

cum

3Qf este prima mai mare decât locul Q3 dat de relaţia de calcul;

f) Calculul efectiv al valorilor Q1, Q2 şi Q3 are loc după relaţiile:

Q1 = x0 + h abs

Q

cumpQ

n

1ii

1

1

f

f1f4

1

Q2 = Me = x0 + h abs

Me

cumpMe

n

1ii

f

f1f2

1

Q3 = x0 + h absQ

cumpQ

n

1ii

3

3

f

f1f4

3

unde: x0 = limita inferioară a intervalului în care se situează Q1, respectiv Q3; h = mărimea intervalului în care se situează Q1, respectiv Q3;

cum

1pQf = frecvenţa cumulată a intervalului precedent celui în care se

Page 95: TURDEAN MARINELLA - BAZELE STATISTICII - Manual debv.ucdc.ro/bv/F_1_bazele-statisticii-turdean.pdf · 3 MARINELLA SABINA TURDEAN LIGIA PRODAN BAZELE STATISTICII - Manual de studiu

95

situează Q1; cum

3pQf = frecvenţa cumulată a intervalului precedent celui în care se

situează Q3; abs

1Qf = frecvenţe a absolută a intervalului în care se situează Q1;

abs

3Qf = frecvenţe a absolută a intervalului în care se situează Q3.

Variaţia intercuartilică Într-o serie perfect simetrică, se respectă egalitatea: Me - Q1 = Q3 - Me Din această relaţie se observă că media aritmetică a celor două

cuartile Q1 şi Q3 este egală cu valoarea cuartilei a doua, adică cu mediana seriei:

Me2

QQ 31

Dacă seria nu este perfect simetrică relaţia de mai sus devine: Me - Q1 Q3 – Me, şi rezultă că seria prezintă un anumit grad

de variaţie intercuartilică, care poate fi măsurată statistic prin indicatori de variaţie adecvaţi, exprimaţi în mărimi absolute sau relative.

Abaterea intercuartilică (Aq) se calculează după relaţia: Aq = Q3 – Q1 Abaterea intercuartilică indică intervalul de valori în care se

situează 50% din unităţile situate în centrul seriei. Abaterea semiintercuartilică se calculează după relaţia:

2

QQ

2

MeQQMeA 1331

qS

Abaterea intercuarticlică şi abaterea semiintercuartilică se exprimă în unităţile de măsură ale variabilei studiate şi nu pot fi folosite la comparaţia statistică a mai multor serii. Pentru a elimina acest inconvenient, se calculează coeficientul de variaţie intercuartilică (vq), ca raport între abaterea semiintercuartilică şi mediană:

vq = Me2

QQ

Me

A13Sq

Variaţia intercuartilică poate lua valori numai în intervalul cuprins între 0 şi 1, şi se apreciază că este cu atât mai nesemnificativă cu cât vq are o valoare mai mică.

7.5.4 Decile Definiţie Decilele sunt acele valori ale caracteristicii, care separă o

serie statistică ordonată crescător sau descrescător în zece părţiegale.

De obicei, se calculează decila întâi (D1) şi decila a noua (D9). Decila a cincia este egală cu cuartila a doua, respectiv cu mediana.

Modul de calcul al decilelor este asemănător cu cel al cuartilelor: a) Seria se ordonează crescător; b) Se determină frecvenţele absolute cumulate crescător; c) Se calculează locul D1 şi locul D9;

Page 96: TURDEAN MARINELLA - BAZELE STATISTICII - Manual debv.ucdc.ro/bv/F_1_bazele-statisticii-turdean.pdf · 3 MARINELLA SABINA TURDEAN LIGIA PRODAN BAZELE STATISTICII - Manual de studiu

96

locul D1 =

1f10

1 n

1ii

locul D9 =

1f10

9 n

1ii

Se determină intervalul în care se situează D1, ca fiind acel interval

a cărui frecvenţă absolută cumulată crescător cum

1Df este prima mai

mare decât locul D1 dat de relaţia de calcul; d) Se determină intervalul în care se situează D9, ca fiind acel

interval a cărui frecvenţă absolută cumulată crescător cum

9Df este

prima mai mare decât locul D9 dat de relaţia de calcul; e) Calculul efectiv al valorii D1 şi D9 are loc conform relaţiilor:

D1 = x0 + h abs

D

cumpD

n

1ii

1

1

f

f1f10

1

D9 = x0 + h abs

D

cumpD

n

1ii

9

9

f

f1f10

9

unde: x0 = limita inferioară a intervalului în care se situează D1, respectiv D9; h = mărimea intervalului în care se situează D1, respectiv D9;

cum

1pDf = frecvenţa cumulată a intervalului precedent celui în care se

situează D1; cum

9pDf = frecvenţa cumulată a intervalului precedent celui în care se

situează D9; abs

1Df = frecvenţe a absolută a intervalului în care se situează D1;

abs

9Df = frecvenţe a absolută a intervalului în care se situează D9.

Indicatorii variaţiei interdecilice se bazează pe aceleaşi considerate ca şi cei ai variaţiei intercuartilice. Pentru o serie perfect simetrică se respectă egalitatea:

Me - D1 = D9 - Me Abaterea interdecilică (Dd) va avea relaţia de calcul: Dd = D9 – D1

Abaterea semiinterdecilică are relaţia de calcul:

2

DD

2

MeDDMeD 1991

Sd

Coeficientul de variaţie interdecilică (vd) se determină ca raport între abaterea semiinterdecilică şi valoarea mediană:

vd = Me2

DD

Me

D 19d

Page 97: TURDEAN MARINELLA - BAZELE STATISTICII - Manual debv.ucdc.ro/bv/F_1_bazele-statisticii-turdean.pdf · 3 MARINELLA SABINA TURDEAN LIGIA PRODAN BAZELE STATISTICII - Manual de studiu

97

Variaţia interdecilică se calculează pentru serii statistice cu număr mare de grupe şi evidentă tendinţă de asimetrie. Coeficientul de

variaţie interdecilic ia valori în intervalul 1,0 şi este cu atât mai nesemnificativ cu cât aceste valori sunt mai mici.

Cuartilele şi decilele se utilizează atunci când dorim să analizăm numai un anumit segment al seriei. Dacă ne interesează 50% din valorile din mijlocul seriei, vom calcula Q1 şi Q3 care delimitează acest segment. Dacă ne interesează 80% din valorile din mijlocul seriei vom calcula D1 şi D9.

Mediile calculate din totalitatea valorilor individuale (media aritmetică, armonică, geometrică, pătratică) şi mărimile medii de poziţie (mediana, modul, cuartile, decile) caracterizează forma de variaţie a caracteristicii. In cazul unei distribuţii perfect simetrice a frecvenţelor, media aritmetică (x), mediana (Me) şi modulul (Mo), se află în relaţia:

x = Me = Mo Fenomenele social-economice prezintă tendinţe de asimetrie

mai mult sau mai puţin pronunţate. Utilizând indicatorii menţionaţi mai sus se pot calcula indicatori

de variaţie şi asimetrie, care permit aprofundarea analizei seriilor de distribuţie.

7.6 Aplicaţii practice Problema 7.6.1 Pentru un eşantion de 30 de clienţi ai unei bănci s-au înregistrat datele privind creditul primit în mii euro: 31; 33; 29; 32; 30; 35; 32; 28; 33; 30; 35; 36; 30; 34; 32; 37; 33; 39; 30; 33; 32; 34; 33; 35; 37; 34; 36; 35; 38; 33. Să se calculeze mediana şi modul pentru seria de date negrupate. Rezolvare: Pentru a determina mediana seriei de 30 de variante (seria de date negrupate) va trebui să ordonăm seria în mod crescător sau descrescător.

n1 n2 n3 n4 n5 n6 n7 n8 n9 n10 n11 n12 n13 n14 n15

28 29 30 30 30 30 31 32 32 32 32 33 33 33 33 n16 n17 n18 n19 n20 n21 n22 n23 n24 n25 n26 n27 n28 n29 n30

33 33 34 34 34 35 35 35 35 36 36 37 37 38 39

332

3333

2

nnMe

1615

Modul este acea variantă a seriei care apare de cele mai multe ori. Modul reprezintă valoarea caracteristicii care are frecvenţa maximă, M0 = 33 (6 apariţii).

Page 98: TURDEAN MARINELLA - BAZELE STATISTICII - Manual debv.ucdc.ro/bv/F_1_bazele-statisticii-turdean.pdf · 3 MARINELLA SABINA TURDEAN LIGIA PRODAN BAZELE STATISTICII - Manual de studiu

98

Problema 7.6.2 Să se calculeze mediana şi modul pentru seria de date prezentată în tabelul de mai jos.

Nr.crt. Grupe de clienţi după valoarea

creditului (mii euro) Număr de clienţi

fi

Frecvenţe cumulate

1 [28 – 30) 2 2 30 2 [30 – 32) 5 7 28 3 [32 – 34) 10 17 23 4 [34 – 36) 7 24 13 5 [36 – 38) 4 28 6 6 [38 – 40) 2 30 2

Total 30 * *

Calculul medianei

5,152

311f

2

1Meloc i

Intervalul median este acel interval a cărui frecvenţă absolută cumulată crescător este prima mai mare decât locul medianei dat de relaţia de calcul. Deci: 17 < 15,5. Frecvenţa cumulată crescător 17 corespunde intervalului 32-34, deci mediana se va situa în acest interval. 32 < Me < 34

7,3310

75,15232

12

1int

0

abs

Me

cummedianervalullapână

f

ffrhxMe

Intervalul modal este acel interval care are frecvenţa cea mai mare. Deci: 32 < Mo < 34

33,257)(105)(10

510232hxM

Δ2Δ1

Δ100

7.7 Îndrumar pentru autoverificare

7.6.1. Sinteza unităţii de studiu

Mărimile medii reflectă ceea ce este esenţial şi tipic în nivelul de dezvoltare a fenomenelor, dar nu caracterizează modul de repartiţie a frecvenţelor în cadrul seriei.

Pentru a completa analiza seriilor de distribuţie este necesară şi calcularea unor valori medii de poziţie dintre care mediana şi modul (sau dominanta) sunt cele mai importante.

Mediana (Me) reprezintă valoarea centrală a unei serii statistice ordonată crescător sau descrescător, care împarte termenii seriei în două părţi egale: 50% din numărul termenilor vor fi mai mici decât mediana şi 50% dintre aceştia vor fi mai mari decât mediana.

Mediana se exprimă în aceeaşi unitate de măsură ca şi variabila studiată. Modul unei distribuţii statistice este acea valoare a caracteristicii care corespunde frecvenţei

maxime.

Page 99: TURDEAN MARINELLA - BAZELE STATISTICII - Manual debv.ucdc.ro/bv/F_1_bazele-statisticii-turdean.pdf · 3 MARINELLA SABINA TURDEAN LIGIA PRODAN BAZELE STATISTICII - Manual de studiu

99

Fiind valoarea cea mai frecvent întâlnită, modul mai este cunoscut în literatura de specialitate şi sub denumirea de dominanta seriei.

Uneori modul poate înlocui valoarea mediei aritmetice, când aceasta nu are sens sau nu poate fi calculata.

Cuartilele sunt acele valori ale caracteristicii care separă o serie statistică ordonată crescător sau descrescător în patru părţi egale.

Într-o serie perfect simetrică, se respectă egalitatea: Me - Q1 = Q3 - Me Dacă seria nu este perfect simetrică relaţia de mai sus devine: Me - Q1 Q3 – Me şi rezultă că seria

prezintă un anumit grad de variaţie intercuartilică, care poate fi măsurată statistic prin indicatori de variaţie adecvaţi, exprimaţi în mărimi absolute sau relative.

Decilele sunt acele valori ale caracteristicii, care separă o serie statistică ordonată crescător sau descrescător în zece părţi egale.

De obicei, se calculează decila întâi (D1) şi decila a noua (D9). Decila a cincia este egală cu cuartila a doua, respectiv cu mediana. Indicatorii variaţiei interdecilice se bazează pe aceleaşi considerate ca şi cei ai variaţiei intercuartilice. Pentru o serie perfect simetrică se respectă egalitatea: Me - D1 = D9 - Me

Variaţia interdecilică se calculează pentru serii statistice cu număr mare de grupe şi evidentă tendinţă de

asimetrie. Coeficientul de variaţie interdecilic ia valori în intervalul 1,0 şi este cu atât mai nesemnificativ cu cât aceste valori sunt mai mici.

Cuartilele şi decilele se utilizează atunci când dorim să analizăm numai un anumit segment al seriei. Dacă ne interesează 50% din valorile din mijlocul seriei, vom calcula Q1 şi Q3 care delimitează acest segment. Dacă ne interesează 80% din valorile din mijlocul seriei vom calcula D1 şi D9.

Mediile calculate din totalitatea valorilor individuale (media aritmetică, armonică, geometrică, pătratică) şi mărimile medii de poziţie (mediana, modul, cuartile, decile) caracterizează forma de variaţie a caracteristicii. In cazul unei distribuţii perfect simetrice a frecvenţelor, media aritmetică (x), mediana

(Me) şi modulul (Mo), se află în relaţia: x = Me = Mo Fenomenele social-economice prezintă tendinţe de asimetrie mai mult sau mai puţin pronunţate. Utilizând indicatorii menţionaţi mai sus se pot calcula indicatori de variaţie şi asimetrie, care permit

aprofundarea analizei seriilor de distribuţie.

7.6.2. Concepte şi termeni de reţinut

indicatori medii de poziţie; mediana; modul; cuartile; decile; locul medianei; locul cuartilei; locul decilei intervalul median; intervalul modal; intervalul cuartilei intervalul decilei; abatere intercuartilică, abatere semiintercuartilică abatere interdecilică, abatere semiinterdecilică coeficient de variaţie intercuartilică, coefficient de variaţie interdecilică

Page 100: TURDEAN MARINELLA - BAZELE STATISTICII - Manual debv.ucdc.ro/bv/F_1_bazele-statisticii-turdean.pdf · 3 MARINELLA SABINA TURDEAN LIGIA PRODAN BAZELE STATISTICII - Manual de studiu

100

7.6..3 Întrebări de control şi teme de dezbatere

1. De ce se calculează indicatorii medii de poziţie? 2. Care sunt indicatorii medii de poziţie? 3. Definiţi mediana şi prezentaţi modul de calcul al acesteia pentru o serie de variante şi pentru o

serie de distribuţie de frecvenţe. 4. Cum se poate determina grafic valoarea medianei? 5. Definiţi modul şi prezentaţi modul de calcul al acestuia pentru o serie de variante şi pentru o

serie de distribuţie de frecvenţe. 6. Cum se poate determina grafic nivelul modului? 7. Definiţi cuartilele şi prezentaţi modul de calcul al acestora pentru o serie de variante şi pentru o

serie de distribuţie de frecvenţe. 8. Definiţi decilele şi prezentaţi modul de calcul al acestora pentru o serie de variante şi pentru o

serie de distribuţie de frecvenţe. 9. Ce relaţie există între mediană şi cuartile în cazul unei distribuţii perfect simetrice? 10. Ce relaţie există între mediană şi decile în cazul unei distribuţii perfect simetrice? 11. Ce relaţie există între medie, mediană şi mod în cazul unei distribuţii perfect simetrice? 12. Cum se calculează abaterea intercuartilică, abaterea semiintercuartilică şi coeficientul de variaţie

intercuartilică? 13. Cum se calculează abaterea interdecilică, abaterea semiinterdecilică şi coeficientul de variaţie

interdecilică?

7.6.4 Bibliografie:

1. Anghelache, C., Isaic- Maniu, A., Mitruţ, C., Voineagu, V., Dumbravă , M., (2007), Analiză

economică, sinteze şi studii de caz, Editura Economică, Bucureşti; 2. Begu, L.S., (2009), Statistică internaţională –analize comparative, Editura Universitară, Bucureşti 3. Biji, M., Biji, E. M., Lilea, E., Anghelache, C., (2002), Tratat de statistică, Editura Economica,

Bucureşti 4. Biji, E.M., Lilea, E., Roşca, E., Vătui, M., (2010), Statistică pentru economişti, Editura

Economică, Bucureşti; 5. Turdean, M., (2012), Statistica, Editura Pro Universitaria, Bucureşti; 6. Ţiţan, E., (2012) Statistică – teorie şi aplicaţii în sectorul terţiar, Editura Meteor Press, Bucureşti;

Page 101: TURDEAN MARINELLA - BAZELE STATISTICII - Manual debv.ucdc.ro/bv/F_1_bazele-statisticii-turdean.pdf · 3 MARINELLA SABINA TURDEAN LIGIA PRODAN BAZELE STATISTICII - Manual de studiu

101

8 UNITATEA DE STUDIU 8 ANALIZA SERIILOR DE DISTRIBUŢIE III – INDICATORII VARIABILITĂŢII ŞI INDICATORII DE ASIMETRIE -

8.1 Introducere 8.2 Obiectivele unităţii de studiu 8.3 Competenţele unităţii de studiu 8.4 Timpul alocat unităţii de invăţare 8.5 Conţinutul unităţii de studiu

8.5.1 Consideraţii generale privind calcului indicatorilor variabilităţii 8.5.2 Indicatorii simpli ai variabilităţii 8.5.3 Indicatorii sintetici ai variabilităţii 8.5.4 Indicatorii variabilităţii pentru o colectivitate împărţită în grupe. Regula adunării dispersiilor 8.5.5 Indicatorii variabilităţii pentru caracteristicile alternative 8.5.6 Asimetria şi indicatorii de asimetrie

8.6 Aplicaţii practice 8.7 Îndrumar pentru autoverificare 8.7.1 Sinteza unitatii de invatare 8.7.2 Concepte si termeni de retinut 8.7.3 Întrebări de control şi teme de dezbatere 8.7.4 Bibliografie

8.1 Introducere

Pentru a caracteriza o colectivitate statistică, datele care trebuie analizate sunt numeroase şi, de obicei, prezintă o amplitudine mare a variaţiei. Cu cât o colectivitate este mai puţin omogenă, ea trebuie caracterizată din punct de vedere statistic, atât cu ajutorul indicatorilor totalizatori, cât şi cu al celor derivaţi. Dintre indicatorii derivaţi, media aritmetică calculată din totalitatea cazurilor individuale observate, reprezintă indicatorul cu care se estimează cel mai frecvent valoarea tipică, adică acea valoare care exprimă tendinţa centrală de manifestare a unei caracteristici.

Dacă am reduce analiza doar la determinarea şi interpretarea mărimii medii nu ar fi posibilă cunoaşterea condiţiilor concrete în care apar şi se dezvoltă fenomenele; nu am putea separa şi stabili intensitatea cu care acţionează factorii esenţiali şi cei întâmplători; nu am obţine explicaţia gradului de variabilitate şi, în consecinţă, nu am putea depista tendinţele acestor fenomene.

8.2 Obiectivele unităţii de studiu

– necesitatea calculului indicatorilor de variabilitate – definirea indicatorilor simpli ai variabilităţii; – definirea indicatorilor sintetici ai variabilităţii; – cunoaşterea indicatorilor variabilităţii pentru o colectivitate

împărţită în grupe; – cunoaşterea indicatorilor variabilităţii pentru caracteristicile

alternative; – cunoaşterea indicatorilor de asimetrie.

Page 102: TURDEAN MARINELLA - BAZELE STATISTICII - Manual debv.ucdc.ro/bv/F_1_bazele-statisticii-turdean.pdf · 3 MARINELLA SABINA TURDEAN LIGIA PRODAN BAZELE STATISTICII - Manual de studiu

102

8.3 Competenţele unităţii de studiu:

– studenţii vor putea diferenţia indicatorii simpli de indicatorii sintetici ai variabilităţii;

– studenţii vor putea să analizeze seriile de date pe baza indicatorilor simpli ai variabilităţii;

– studenţii vor putea să aprofundeze analiza statististică a seriilor de date pe baza indicatorilor sintetici ai variabilităţii;

– studenţii vor putea să stabilească măsura/ proporţia în care factorul de grupare influenţeză variaţia caracteristicii rezultative;

– studenţii vor putea analiza seriile de date pe baza indicatorilor de asimetrie;

8.4 Timpul alocat unităţii de studiu:

Pentru unitatea de studiu „Analiza serilor de distribuţie III – Indicatorii variabilităţii şi indicatorii de asimetrie”, timpul alocat este de 4 ore.

8.5 Conţinutul unităţii de studiu

8.5.1 Consideraţii generale privind calculul indicatorilor variabilităţii

Cu cât fenomenele sunt mai complexe, deci depind de mai mulţi factori, cu atât variaţia este mai mare şi folosirea mărimilor medii implică verificarea stabilităţii şi reprezentativităţii lor. O medie este reprezentativă doar când se calculează din valori omogene.

Analiza statistică a seriilor de distribuţie poate fi aprofundată prin calculul indicatorilor de variaţie care servesc la:

- verificarea reprezentativităţii mediei; - verificarea gradului de omogenitate a seriei; - caracterizarea statistică a gradului şi a formei de variaţie a unei

caracteristici; - compararea în timp şi în spaţiu a seriilor statistice din punct

de vedere al aceleiaşi caracteristici sau pentru caracteristici diferite; - separarea modului de acţiune a factorilor esenţiali de cei

întâmplători; - evidenţierea gradului de influenţă a factorilor după care s-a

făcut gruparea unităţilor din colectivitate, respectiv, identificarea felului în care factorii esenţiali îşi modifică acţiunea de la o grupă la alta.

În funcţie de gradul de aprofundare şi de scopul analizei

Page 103: TURDEAN MARINELLA - BAZELE STATISTICII - Manual debv.ucdc.ro/bv/F_1_bazele-statisticii-turdean.pdf · 3 MARINELLA SABINA TURDEAN LIGIA PRODAN BAZELE STATISTICII - Manual de studiu

103

statistice se calculează: indicatorii simpli ai variabilităţii; indicatorii sintetici ai variabilităţii; indicatorii analizei dispersionale.

8.5.2 Indicatorii simpli ai variabilităţii Acest tip de indicatori servesc la caracterizarea gradului de

împrăştiere a unităţilor purtătoare a caracteristicilor înregistrate. Ei se calculează pentru a stabili amplitudinea variaţiei şi abaterea valorilor individuale de la media lor. Se exprimă în mărimi absolute - utilizând aceeaşi unitate de măsură ca şi pentru caracteristica statistică - cât şi în mărimi relative calculate în raport cu valoarea medie.

Din grupa indicatorilor simpli fac parte: (1) Amplitudinea absolută a variaţiei (A) se calculează ca

diferenţă între nivelul maxim (xmax) şi nivelul minim (xmin) al caracteristicii, conform relaţiei:

A = xmax - xmin Amplitudinea absolută a variaţiei se exprimă în unitatea de

măsură a variabilei şi nu poate fi utilizată la compararea a două variabile exprimate în unităţi de măsură diferite. Informaţiile despre variabilitate obţinute cu ajutorul amplitudinii variaţiei sunt reduse şi nu vizează ansamblul de date deoarece nu se ţine cont de toate valorile observate.

Amplitudinea variaţiei este influenţată de prezenţa valorilor aberante. Acest indicator nu se calculează (nu are sens) în cazul seriilor de distribuţie de frecvenţe pe intervale de variaţie.

(2) Amplitudinea relativă a variaţiei (A%) se calculează ca raport între amplitudinea absolută a variaţiei şi nivelul mediu al caracteristicii şi se exprimă în procente.

A% = x

A100

Deşi amplitudinea variaţiei este calculată din valorile extreme ale seriei (care se pot situa la mare distanţă faţă de masa mare a valorilor individuale), din punct de vedere metodologic prezintă importanţă, fiind utilizată în etapa de prelucrare a datelor statistice la stabilirea numărului de grupe şi a mărimii intervalului de grupare.

(3) Abaterile individuale absolute (di) se calculează ca diferenţă între fiecare variantă înregistrată şi media aritmetică, conform relaţiei:

di = xi - x, i = n,1 unde: n = numărul de variante. (4) Abaterile individuale relative (di%) se calculează raportând

abaterile absolute la nivelul mediu al caracteristicii.

di% = 100x

xx100

x

d ii

În procesul de analiză se mai pot calcula abaterile maxime într-un sens sau altul.

(5) Abaterea maximă negativă în expresie absolută (dmax neg) se calculează ca diferenţă între nivelul minim al caracteristicii şi medie:

dmax neg = xmin - x (6) Abaterea maximă negativă în expresie relativă (dmax neg %) se

Page 104: TURDEAN MARINELLA - BAZELE STATISTICII - Manual debv.ucdc.ro/bv/F_1_bazele-statisticii-turdean.pdf · 3 MARINELLA SABINA TURDEAN LIGIA PRODAN BAZELE STATISTICII - Manual de studiu

104

calculează ca raport între abaterea maximă negativă absolută şi medie

dmax neg % = 100x

xx100

x

dminnegmax

(7) Abaterea maximă pozitivă în expresie absolută (dmax poz) se calculează ca diferenţa între nivelul maxim al caracteristicii şi medie:

dmax poz = xmax - x (8) Abaterea maximă pozitivă în expresie relativă (dmax poz %) se

calculează ca raport între abaterea maximă pozitivă absolută şi medie

dmax poz % = 100x

xx100

x

dmaxpozmax

Indicatorii

simpli ai variaţiei ţin cont ori de valorile extreme ori evidenţiază abaterile individuale ale acestora de la medie. Gradul de variaţie al unei caracteristici depinde însă de totalitatea abaterilor de la medie ale variantelor înregistrate, precum şi de frecvenţa lor de apariţie. In consecinţă, se poate afirma că indicatorii simpli ai variaţiei nu pot exprima întreaga variaţie a unei caracteristici.

Prin urmare, pentru caracterizarea gradului de variaţie se va apela la indicatorii sintetici ai variaţiei, care iau în considerare toate abaterile caracteristicii, precum şi frecvenţele de apariţie corespunzătoare.

8.5.3 Indicatorii sintetici ai variabilităţii Indicatorii sintetici ai variabilităţii exprimă variaţia tuturor

valorilor individuale faţă de tendinţa centrală a caracteristicilor studiate.

Indicatorii sintetici ai variabilităţii ţin cont de toate unităţile observate, trebuie să fie uşor de înţeles şi uşor de calculat. Din această categorie de indicatori fac parte: (i) abaterea medie liniară (dx), (ii) abaterea medie pătratică (x), (iii) dispersia (2

x), (iv) coeficientul de variaţie (v).

1. Abaterea medie liniară (dx), se calculează ca o medie aritmetică simplă sau ponderată (cu frecvenţe absolute sau frecvenţe relative sub formă de pondere sau coeficient) a abaterilor termenilor seriei de la media lor, luate în valoare absolută.

Relaţiile de calcul pentru abaterea medie liniară sunt: pentru serii simple:

n

xxd

n

1ii

x

pentru distribuţii de frecvenţe: serie de frecvenţe

absolute serie cu frecvenţe

relative exprimate în procente

serie cu frecvenţe relative exprimate

zecimal

m

1ii

i

m

1ii

x

f

fxxd

100

fxxd

m

1i

*%ii

x

m

1i

*ziix fxxd

Page 105: TURDEAN MARINELLA - BAZELE STATISTICII - Manual debv.ucdc.ro/bv/F_1_bazele-statisticii-turdean.pdf · 3 MARINELLA SABINA TURDEAN LIGIA PRODAN BAZELE STATISTICII - Manual de studiu

105

Abaterea medie liniară se exprimă în unităţile de măsură ale variabilei şi în consecinţă nu poate fi utilizată pentru compararea unor caracteristici diferite. Ea nu ţine seama de faptul că abaterile mai mari în valoare absolută influenţează în mai mare măsură gradul de variaţie a unei caracteristici în comparaţie cu abaterile mai mici. Calculul acestui indicator este justificat doar când pentru caracterizarea variabilităţii ne interesează doar mărimea abaterilor nu şi sensul lor.

2. Principalul indicator sintetic al variaţiei este abaterea medie

pătratică (x). Abaterea medie liniară ( xd ) elimină semnul abaterilor de la tendinţa centrală. Acelaşi obiectiv poate fi atins prin ridicarea la pătrat a abaterilor.

Abaterea medie pătratică se calculează ca o medie pătratică simplă sau ponderată (cu frecvenţe absolute sau frecvenţe relative sub formă de pondere sau coeficient) a abaterilor tuturor variantelor seriei de la media lor aritmetica.

Relaţiile de calcul pentru abaterea medie pătratică sunt: pentru serii simple:

x =

n

xxn

1i

2

i

pentru distribuţii de frecvenţe

serii de frecvenţe absolute

serii cu frecvenţe relative exprimate

în procente

serii cu frecvenţe relative exprimate

zecimal

x=

m

1ii

m

1ii

2

i

f

fxx x=

100

fxxm

1i

*%i

2

i

x=

m

1i

*iz

2

i fxx

Acest tip de indicator, fiind calculat cu ajutorul pătratelor abaterilor este mai concludent decât abaterea medie liniară. Prin ridicarea la pătrat se dă o importanţă mai mare abaterilor mai mari în valoare absolută, acestea influenţând într-o mai mare măsură gradul de variaţie al variabilei analizate.

Dacă pentru aceeaşi serie se calculează abaterea medie liniară (dx) şi abaterea medie pătratică (x), între cei doi indicatori va exista următoarea inegalitate:

xx d

Pentru o serie de distribuţie cu tendinţă clară de normalitate, abaterea medie liniară este 4/5 din valoarea abaterii medii pătratice.

Abaterea medie pătratică se exprimă în unitatea de măsură a variabilei studiate.

3. Dispersia (variaţia) unei caracteristici (2x) se calculează ca

o medie aritmetică simplă sau ponderată (cu frecvenţe absolute sau relative sub formă de pondere sau coeficient) a pătratelor abaterilor termenilor faţă de media lor.

Dispersia nu are unitate de măsură cu conţinut economic. Relaţiile de calcul pentru dispersii sunt:

Page 106: TURDEAN MARINELLA - BAZELE STATISTICII - Manual debv.ucdc.ro/bv/F_1_bazele-statisticii-turdean.pdf · 3 MARINELLA SABINA TURDEAN LIGIA PRODAN BAZELE STATISTICII - Manual de studiu

106

pentru serii simple

2x =

n

xxn

1i

2

i

pentru distribuţii de frecvenţe

serii de frecvenţe absolute

serii cu frecvenţe relative exprimate in

procente

serii cu frecvenţerelative exprimate

zecimal

2x =

m

1ii

m

1ii

2

i

f

fxx 2

x =

100

fxxm

1i

*%i

2

i

2x= *

iz

m

1i

2

i fxx

Indicatorii sintetici prezentaţi se pot utiliza doar pentru compararea gradului de variaţie a seriilor care se referă la aceleaşi caracteristici.

4. Pentru compararea gradului de variaţie al unor caracteristici diferite, se recurge la coeficientul de variaţie (v). El se calculează ca raport procentual între abaterea medie pătratică şi nivelul mediu al seriei.

v = 100x

x

O altă relaţie de calcul pentru coeficientul de variaţie este:

v’ = 100x

d x

unde: dx = abaterea medie liniară. Cu cât nivelul coeficientului de variaţie este mai aproape de

zero, cu atât variaţia este mai redusă, colectivitatea este mai omogenă şi media va avea un grad ridicat de reprezentativitate. In cazul în care coeficientul de variaţie ia valori de peste 35 - 40% se apreciază că media nu mai este reprezentativă şi prin urmare este necesară separarea datelor pe grupe în funcţie de variaţia unei alte caracteristici de grupare.

8.5.4 Indicatorii variabilităţii pentru o colectivitate împărţită în grupe. Regula adunării dispersiilor

Cu cât fenomenele studiate sunt mai complexe, caracteristicile care le definesc prezintă un grad mai mare de variaţie. Ca urmare, unităţile la care s-a făcut observarea trebuie împărţite în grupe în funcţie de variaţia factorilor determinanţi. In cazul aplicării metodei grupării se pot calcula atât medii pe grupe, cât şi o medie a colectivităţii totale. De asemenea, se pot determina indicatori de variaţie (dispersii) pentru fiecare grupă şi pentru întreaga colectivitate.

Presupunând că s-au înregistrat datele referitoare la două caracteristici x şi y şi unităţile au fost grupate în m grupe în funcţie de variaţia caracteristicii x s-au obţinut distribuţiile condiţionate din tabelul cu dublă intrare.

Distribuţiile condiţionate ale caracteristicii rezultative „y” în funcţie de variaţia factorului de grupare „x”

Page 107: TURDEAN MARINELLA - BAZELE STATISTICII - Manual debv.ucdc.ro/bv/F_1_bazele-statisticii-turdean.pdf · 3 MARINELLA SABINA TURDEAN LIGIA PRODAN BAZELE STATISTICII - Manual de studiu

107

Valorile caracteristicii y Valorile caracteristicii de grupare x

y1 … yj... yp Total

ni

Medii pe grupe (medii

condiţionate)(y/xi)

x1

xi

xm

f11 … f1j ... f1p fi1 … fij ... fip fm1 … fmj ... fmp

n1

ni

nm

1y

iy

my

Total fj

f1 …. fj.... fp

m

1ii

p

1jj nf

yo

Media şi indicatorii de variaţie pentru întreaga colectivitate se pot calcula făcând abstracţie că ea este compusă din mai multe grupe, sau luând în calcul variaţia din interiorul grupelor şi dintre grupe. În consecinţă, între indicatorii de variaţie calculaţi la nivelul fiecărei grupe şi cei pe întreaga colectivitate există relaţii bazate pe regula de adunare a dispersiilor. Cele două variabile prezentate în tabel se află într-o relaţie de cauzalitate şi în urma calculului indicatorilor de variaţie corespunzători se poate preciza dacă factorul de grupare x este un factor determinant pentru variaţia caracteristicii y. Pe baza datelor din tabelul 8.1 se pot calcula mediile şi dispersiile pe fiecare grupă şi pe total. Mediile de grupă se notează cu yi şi se calculează cu relaţia:

yi =

p

jij

ij

p

jj

f

fy

1

1

Numărul mediilor de grupă este egal cu numărul grupelor în care s-a împărţit colectivitatea. Factorul de grupare, considerat ca factor esenţial, determină/influenţează variaţia caracteristicii studiate în măsura în care mediile de grupă diferă între ele. Dacă factorul de grupare nu este factor determinant pentru caracteristica studiată, mediile de grupă vor fi apropiate de media colectivităţii generale, deci variaţia caracteristicii este produsă de alţi factori şi nu de cel ales pentru gruparea datelor. Media pe total colectivitate yo sintetizează variaţia tuturor valorilor individuale din colectivitate sau variaţia valorilor medii de grupă şi se calculează cu relaţiile:

yo =

p

1jj

j

p

1jj

f

fy

sau yo =

m

1ii

i

m

1ii

n

ny

La nivelul fiecărei unităţi observate, variaţia totală (yj -yo) se compune din variaţia faţă de media de grupă (yj -yi) la care se adaugă variaţia mediei de grupă de la media colectivităţii totale (yi - yo), conform relaţiei:

Page 108: TURDEAN MARINELLA - BAZELE STATISTICII - Manual debv.ucdc.ro/bv/F_1_bazele-statisticii-turdean.pdf · 3 MARINELLA SABINA TURDEAN LIGIA PRODAN BAZELE STATISTICII - Manual de studiu

108

(yj -yo) = (yj - yi) - (yi - yo) La nivelul grupei valoarea caracteristicii de grupare este

considerată constantă. Prin urmare, variaţia valorilor individuale din fiecare grupă în jurul mediei de grupă (yj - yi) va măsura gradul de influenţă a factorilor variabili (neînregistraţi, întâmplători, nesistematici).

Variaţia mediilor de grupă faţă de media colectivităţii totale (yi - yo) este interpretată ca fiind rezultatul acţiunii factorului de grupare. În acest caz factorii variabili din interiorul grupei se păstrează la un nivel constant.

Pentru a determina intensitatea cu care au influenţat asupra variaţiei caracteristicii dependente cele două grupe de factori (întâmplători şi esenţiali), atât la nivelul grupelor, cât şi la nivelul colectivităţii generale se calculează următoarele dispersii:

(i) dispersia de grupă (2i),

(ii) media dispersiilor de grupă (2i),

(iii) dispersia dintre grupe (2), (iv) dispersia totală (2

o). (i) Dispersia de grupă se calculează ca o medie aritmetică

ponderată a pătratelor abaterilor fiecărei variante dintr-o grupă de la media lor (media grupei).

2i =

p

jij

p

jijij

f

fyy

1

1

2

unde: fij = frecvenţe corespunzătoare variantei “j” din grupa “i”. Dispersia de grupă măsoară influenţa factorilor întâmplători care

acţionează la nivelul grupei asupra variaţiei caracteristicii dependente y.

(ii) Numărul dispersiilor de grupă este acelaşi cu numărul grupelor care formează colectivitatea. Pentru a sintetiza influenţa/acţiunea tuturor factorilor întâmplători care acţionează la nivelul tuturor grupelor se calculează media dispersiilor de grupă:

i2 =

m

ii

m

iii

n

n

1

1

2

unde: ni = frecvenţa grupei i. (iii) Dispersia dintre grupe se calculează ca o medie aritmetică

ponderată a pătratelor abaterilor fiecărei medii de grupă de la media colectivităţii totale.

m

1ii

m

1ii

2

oi2

n

nyy

Dispersia dintre grupe măsoară influenţa factorului de grupare asupra variaţiei caracteristicii dependente “y”.

(iv) Dispersia totală se calculează ca o medie aritmetică ponderată a pătratelor abaterilor fiecărei variante de la media colectivităţii totale:

Page 109: TURDEAN MARINELLA - BAZELE STATISTICII - Manual debv.ucdc.ro/bv/F_1_bazele-statisticii-turdean.pdf · 3 MARINELLA SABINA TURDEAN LIGIA PRODAN BAZELE STATISTICII - Manual de studiu

109

2o =

p

jj

p

jjoj

f

fyy

1

1

2

Dispersia totală reflectă, la nivelul întregii colectivităţi, influenţa acţiunii conjugate a celor două grupe de factori - esenţiali şi întâmplători - asupra variaţiei caracteristicii dependente y.

Dispersia totală se mai poate calcula adunând la media dispersiilor de grupă, dispersia dintre grupe conform relaţiei cunoscută în literatura de specialitate sub denumirea de regula “adunării dispersiilor”:

2o = 2 + 2

Pe baza regulii de adunare a dispersiilor se pot calcula doi indicatori statistici cu caracter de mărimi relative de structură:

coeficientul de determinaţie (R2y/x) se calculează ca raport

procentual dintre dispersia dintre grupe şi dispersia totală, după relaţia:

1002

22

/o

xyR

coeficientul de nedeterminaţie (K2y/z) se calculează ca

raport procentual dintre media dispersiilor parţiale şi dispersia totală, după relaţia:

K2y/z = 100

2o

2

Dacă R2y/x > 50% se consideră că factorul de grupare este

semnificativ (hotărâtor, determinant) pentru variaţia caracteristicii dependente, studiate.

Coeficientul de nedeterminaţii arată câte procente din variaţia caracteristicii dependente sunt determinate de acţiunea factorilor întâmplători (neesenţiali, nesistematici, reziduali, nesemnificativi).

8.5.5 Indicatorii de variabilităţii pentru caracteristicile alternative

Dispersia caracteristicii alternative (2p) se calculează ca o

medie aritmetică ponderată a pătratelor abaterilor termenilor de la media lor. Utilizând datele din tabelul 6.1 se obţine:

2p =

qp

qppp

22 )0()1(

unde: 1 şi 0 = variantele caracteristicii alternative,

p = media caracteristicii alternative sau frecvenţa relativă a unităţilor care posedă caracteristica,

q = frecvenţa relativă a unităţilor care nu posedă caracteristica.

Deoarece p + q = 1 şi 1- p = q, relaţia de calcul devine:

2p =

qp

pqpq

qp

qppq

)(22

= p q = p (1 - p)

deci: 2

p = p q = p (1 - p)

Page 110: TURDEAN MARINELLA - BAZELE STATISTICII - Manual debv.ucdc.ro/bv/F_1_bazele-statisticii-turdean.pdf · 3 MARINELLA SABINA TURDEAN LIGIA PRODAN BAZELE STATISTICII - Manual de studiu

110

Abaterea medie pătratică (p) a caracteristicii alternative se determină conform relaţiei:

p = )p1(pqp2p

Dispersia caracteristicii alternative poate lua doar valori

cuprinse în intervalul 25.0;0 , iar abaterea medie pătratică doar

valori cuprinse în intervalul 5.0;0 . Când frecvenţele relative p şi q sunt egale, abaterea standard şi dispersia vor înregistra valorile maxime p = 0,5, respectiv 2

p = 0,25. In cazul în care colectivitatea este împărţită în m grupe şi se

studiază variaţia unei caracteristici alternative, se pot calcula următorii indicatori:

i. Dispersia de grupă: 2

pi = pi qi = pi (1-pi) unde: pi = media caracteristicii alternative din grupa i,

qi = frecvenţa relativă a unităţilor care nu posedă caracteristica din grupa i.

ii. Media dispersiilor parţiale (p) este o medie aritmetică ponderată a dispersiilor grupelor în care a fost împărţită colectivitatea:

m

ii

m

iiii

m

ii

m

iip

p

N

Npq

N

Ni

1

1

1

1

2

2)(

unde: Ni = numărul total al unităţilor observate din fiecare grupă.

iii. Dispersia dintre grupe pentru o caracteristică alternativă (2

p) se calculează ca o medie aritmetică ponderată a pătratelor abaterilor mediilor caracteristicii alternative din fiecare grupă de la media caracteristicii alternative pe întreaga colectivitate:

m

ii

m

iii

p

N

Npp

1

1

2

2

unde p = media caracteristicii alternative pe întreaga colectivitate.

iv. Dispersia totală a caracteristicii alternative (2

p) este produsul dintre cele două frecvenţe relative p şi q din colectivitatea totală:

2p = p q

Regula adunării dispersiilor se păstrează şi în cazul unei

caracteristici alternative: 2

p = 2p + 2

p

Page 111: TURDEAN MARINELLA - BAZELE STATISTICII - Manual debv.ucdc.ro/bv/F_1_bazele-statisticii-turdean.pdf · 3 MARINELLA SABINA TURDEAN LIGIA PRODAN BAZELE STATISTICII - Manual de studiu

111

8.5.6 Asimetria şi indicatorii de asimetrie Distribuţia statistică simetrică este acea distribuţie pentru care

frecvenţele sunt uniform dispersate de-o parte şi de alta a valorii medii.

Definiţie Gradul de îndepărtare al unei distribuţii statistice de la

simetrie se numeşte asimetrie.

Pentru o serie de distribuţie perfect simetrică (figura 8.1.A.) între cei trei indicatori modul, mediana şi media aritmetică există relaţia:

x = Mo = Me Seriile de distribuţie de frecvenţe prezintă cel mai des asimetrie

de stânga sau de dreapta (figura 8.1.B, C). Asimetria se poate analiza prin metoda grafică, utilizând histograma sau poligonul frecvenţelor, care oferă o imagine sugestivă asupra gradului de asimetrie.

Pentru a măsura şi exprima printr-o valoare numerică gradul de asimetrie se calculează indicatorii de asimetrie sub formă absolută şi relativă.

x = M o = M e x

y

Figura 8.1. Distribuţia statistică simetrică(A). Distribuţie

asimetrică de stânga (B) şi de dreapta (C) Asimetria absolută se determină după relaţia: As = x - Mo Asimetria absolută se exprimă în unitatea de măsură a

variabilei. Indicatorii de asimetrie calculaţi sub formă relativă sunt: 1) coeficientul de asimetrie (Pearson)

1asc = x

Mox

Acest coeficient ia valori cuprinse între 1;1 ; cu cât este mai mic în valoare absolută cu atât asimetria este mai mică. Legătura dintre tipul de asimetrie şi valoarea coeficientului de asimetrie este prezentată în figura 8.2.

M o< Me < x

y

x

x < Me < Mo

y

x

(B) (C )

(A)

Page 112: TURDEAN MARINELLA - BAZELE STATISTICII - Manual debv.ucdc.ro/bv/F_1_bazele-statisticii-turdean.pdf · 3 MARINELLA SABINA TURDEAN LIGIA PRODAN BAZELE STATISTICII - Manual de studiu

112

1asc < 0 1asc = 0

1asc > 0

Seria prezintă asimetrie de stânga

Seria este simetrică

Seria prezintă asimetrie de

dreapta Figura 8.2. Legătura dintre tipul de asimetrie şi valoarea coeficientului de asimetrie

Acest indicator de asimetrie este recomandat a se utiliza pentru analiza distribuţiilor uşor asimetrice.

2) În cazul în care se cunoaşte mediana seriei, coeficientul de asimetrie se poate calcula după relaţia:

2asc = x

Mex

)(3

Acest coeficient ia valori cuprinse între 3;3 ; cu cât este mai mic în valoare absolută, cu atât asimetria este mai mică.

3) Asupra asimetriei influenţează şi celelalte valori medii de poziţie. Dacă se ţine seama de influenţa cuartilelor se calculează coeficientul propus de Yule:

3asc = 12

12

qq

qq

unde: q2 = Q3 -Me sau q2 = D9-Me q1 = Me -Q1 sau q1 = Me -D1. Dacă acest coeficient se apropie de valoarea 0,1 se poate considera

că seria este moderat asimetrică, iar dacă este mai mare decât 0,3, seria este pronunţat asimetrică.

xi

f i

xi

f i

xi

f i

Figura 8.3 Curba platicurtică, curba normală, curba

leptocurtică Boltirea măsoară înălţimea, adică aplatizarea sau alungirea

curbei frecvenţelor unei repartiţii comparativ cu cea normală. Karl Pearson propune următoarea expresie pentru coeficientul boltirii:

cb = 22

x

4x

)(

unde: 2

x = dispersia variabilei, momentul centrat de ordin 2; 4

x = momentul centrat de ordin 4 care se calculează după relaţia:

4x =

m

1ii

m

1ii

4i

f

f)xx(

Pentru a obţine un indicator de măsurare a excesului (cex) se compară coeficientul de boltire al lui Pearson cu valoarea acestui

Page 113: TURDEAN MARINELLA - BAZELE STATISTICII - Manual debv.ucdc.ro/bv/F_1_bazele-statisticii-turdean.pdf · 3 MARINELLA SABINA TURDEAN LIGIA PRODAN BAZELE STATISTICII - Manual de studiu

113

indicator pentru cazul repartiţiei normale pentru care coeficientul boltirii cb = 3.

cex = cb -3 Legătura dintre coeficientul boltirii si forma curbei de frecven-

ţe este dată în figura următoare.

cex < 0 cex =0 cex > 0 cb < 3 cb = 3 cb > 3 Curba este platicurtică = curba prezintă un grad deaplatizare mai pronunţatîn raport cu cea normală

Curba este Normală

Curba este leptocurtică= prezintă un grad de boltire mai mare în raport cu cea normală

Figura 8.4. Curba platicurtică (A), normală (B) şi leptocurtică (C) a frecvenţelor

8.6 Aplicaţii practice Problema 8.6.1 Pentru un eşantion de 30 de clienţi ai unei bănci s-au înregistrat datele privind creditul primit în mii euro: 31; 33; 29; 32; 30; 35; 32; 28; 33; 30; 35; 36; 30; 34; 32; 37; 33; 39; 30; 33; 32; 34; 33; 35; 37; 34; 36; 35; 38; 33. Să se calculeze media aritmetică şi indicatorii simpli ai variabilităţii pentru seria de date negrupate. Rezolvare: a) Pentru seria de date negrupate, creditul mediu se calculează după relaţia mediei aritmetice simple:

mii3,3330

999

30

33...293313

30

x

n

xx

30

1ii

n

1ii

Є / client

Indicatorii simpli ai variabilităţii:

1. Amplitudinea variaţiei: A = xmax – xmin = 39 – 28 = 11 mii Є

2.a.) Abaterea maximă pozitivă (absolută):

7,53,3339xx.d maxpoz.max mii Є

2.b.) Abaterea maximă pozitivă (relativă)

%1,171003,33

3,3339100

x

xxd max

.%poz.max

3.a.) Abaterea maximă negativă (absolută):

3,53,3328. minmax xxd neg mii Є

3.b.) Abaterea maximă negativă (relativă):

%91,151003,33

3,3328100

x

xxd min

.%neg.max

Page 114: TURDEAN MARINELLA - BAZELE STATISTICII - Manual debv.ucdc.ro/bv/F_1_bazele-statisticii-turdean.pdf · 3 MARINELLA SABINA TURDEAN LIGIA PRODAN BAZELE STATISTICII - Manual de studiu

114

Problema 8.6.2 Se dă distribuţia:

Nr.crt. Grupe de clienţi după nivelul creditului (mii euro) Număr de clienţi

fi

0 1 3 1 [28 – 30) 2 2 [30 – 32) 5 3 [32 – 34) 10 4 [34 – 36) 7 5 [36 – 38) 4 6 [38 – 40) 2

Total 30 Se cere:

a) să se verifice omogenitatea distribuţiei; b) Să se calculeze gradul de asimetrie; c) Să se calculeze media caracteristicii “clienţi” care au primit un credit mai mare de 36 mii Є.

Rezolvare: a) Pentru a verifica omogenitatea distribuţiei se va calcula coeficientul de variaţie.

100x

v x

Pentru o serie omogenă, coeficientul de variaţie trebuie să fie mai mic decât 35%.

Nr.crt. Grupe de clienţi după

valoarea creditului (mii euro)

Număr de clienţi

fi

Centrul de interval

xi

xifi i2

i fxx

0 1 2 5 6 7 1 [28 – 30) 2 29 58 (29-33,8)22= 46,08 2 [30 – 32) 5 31 155 (31-33,8)25= 39,2 3 [32 – 34) 10 33 330 (33-33,8)210= 6,4 4 [34 – 36) 7 35 245 (35-33,8)27= 10,08 5 [36 – 38) 4 37 148 (37-33,8)24= 40,96 6 [38 – 40) 2 39 78 (39-33,8)22= 54,08

Total 30 * 1014 196,8 Media aritmetică ponderată

client/euromii8,3330

1014

2471052

2394377351033531229

f

fxx

6k

1ii

6k

1iii

Dispersia ( 2x )

6,5630

196,82471052

2233,8)(394233,8)(377233,8)(3510233,8)(335233,8)(312233,8)(29

6k

1iif

if6k

1i

2)xi(x2xσ

Page 115: TURDEAN MARINELLA - BAZELE STATISTICII - Manual debv.ucdc.ro/bv/F_1_bazele-statisticii-turdean.pdf · 3 MARINELLA SABINA TURDEAN LIGIA PRODAN BAZELE STATISTICII - Manual de studiu

115

Abaterea medie pătratică ( x )

56,256,630

8,196)(

1

1

2

2

k

ii

k

iii

xx

f

fxx mii euro

Coeficientul de variaţie:

100x

v x

%57,71008,33

56,2v

Deoarece v < 35%, seria este omogenă, iar media, 33,8 mii euro/client este reprezentativă.

Media aritmetică este exactă atunci când se calculează din variantele sub care s-a înregistrat caracteristica (date negrupate- vezi aplicaţia 8.6.1- 30 variante; media 33,3 mii euro/client) dar poate fi calculată suficient de corect şi pe baza unei serii de intervale (6 grupe; media 33,8 mii euro/client).

b) Calculul coeficientului de asimetrie

x

MoxCas

8,33x mii Є/client, σx= 2,56 mii Є/client Intervalul modal este acel interval care are frecvenţa cea mai mare. Deci: 32 < Mo < 34

33,257)(105)(10

510232hxM

Δ2Δ1

Δ100

214,056,2

25,338,33Cas

c) %202,030

6sau

N

Mp

Ponderea clienţilor care au primit credit mai mare de 36 mii Є este de 20%.

Mo = 33,25 x = 33,8

0Mox asimetrie pozitivă (de stânga)

Page 116: TURDEAN MARINELLA - BAZELE STATISTICII - Manual debv.ucdc.ro/bv/F_1_bazele-statisticii-turdean.pdf · 3 MARINELLA SABINA TURDEAN LIGIA PRODAN BAZELE STATISTICII - Manual de studiu

116

8.7 Îndrumar pentru autoverificare

8.7.1 Sinteza unităţii de studiu

Cu cât fenomenele sunt mai complexe, deci depind de mai mulţi factori, cu atât variaţia este mai mare şi folosirea mărimilor medii implică verificarea stabilităţii şi reprezentativităţii lor. O medie este reprezentativă doar când se calculează din valori omogene. Analiza statistică a seriilor de distribuţie poate fi aprofundată prin calculul indicatorilor de variaţie care servesc la:

verificarea reprezentativităţii mediei; verificarea gradului de omogenitate a seriei; caracterizarea statistică a gradului şi a formei de variaţie a unei caracteristici; compararea în timp şi în spaţiu a seriilor statistice din punct de vedere al aceleiaşi

caracteristici sau pentru caracteristici diferite; separarea modului de acţiune a factorilor esenţiali de cei întâmplători; evidenţierea gradului de influenţă a factorilor după care s-a făcut gruparea unităţilor din

colectivitate, respectiv, identificarea felului în care factorii esenţiali îşi modifică acţiunea de la o grupă la alta.

În funcţie de gradul de aprofundare şi de scopul analizei statistice se calculează: indicatorii simpli ai variabilităţii, indicatorii sintetici ai variabilităţii indicatorii analizei dispersionale.

Indicatorii simpli ai variabilităţii servesc la caracterizarea gradului de împrăştiere a unităţilor purtătoare a caracteristicilor înregistrate. Ei se calculează pentru a stabili amplitudinea variaţiei şi abaterea valorilor individuale de la media lor. Se exprimă în mărimi absolute - utilizând aceeaşi unitate de măsură ca şi pentru caracteristica statistică - cât şi în mărimi relative calculate în raport cu valoarea medie. Din grupa indicatorilor simpli fac parte:

amplitudinea absolută a variaţiei (A); amplitudinea relativă a variaţiei (A%); abaterile individuale absolute (di); abaterile individuale relative (di%); abaterea maximă negativă în expresie absolută (dmax neg); abaterea maximă negativă în expresie relativă (dmax neg %); abaterea maximă pozitivă în expresie absolută (dmax poz); abaterea maximă pozitivă în expresie relativă (dmax poz %);

Indicatorii simpli ai variabilităţii Indicatori Mărimi absolute Mărimi relative

Amplitudine absolută A = xmax - xmin A% =

x

A100

Abatere individuală de la medie

di = xi - x di% = 100

x

xx100

x

d ii

Abatere maximă negativă dmax neg = xmin - x dmax neg % = 100

x

xx100

x

dminnegmax

Abatere maximă pozitivă dmax poz = xmax - x dmax poz % = 100

x

xx100

x

dmaxpozmax

Page 117: TURDEAN MARINELLA - BAZELE STATISTICII - Manual debv.ucdc.ro/bv/F_1_bazele-statisticii-turdean.pdf · 3 MARINELLA SABINA TURDEAN LIGIA PRODAN BAZELE STATISTICII - Manual de studiu

117

Indicatorii simpli ai variaţiei ţin cont ori de valorile extreme ori evidenţiază abaterile individuale ale acestora de la medie. Gradul de variaţie al unei caracteristici depinde însă de totalitatea abaterilor de la medie ale variantelor înregistrate, precum şi de frecvenţa lor de apariţie. In consecinţă, se poate afirma că indicatorii simpli ai variaţiei nu pot exprima întreaga variaţie a unei caracteristici.

Prin urmare, pentru caracterizarea gradului de variaţie se va apela la indicatorii sintetici ai variaţiei, care iau în considerare toate abaterile caracteristicii, precum şi frecvenţele de apariţie corespunzătoare.

Indicatorii sintetici ai variabilităţii exprimă variaţia tuturor valorilor individuale faţă de tendinţa centrală a caracteristicilor studiate.

Indicatorii sintetici ai variabilităţii ţin cont de toate unităţile observate, trebuie să fie uşor de înţeles şi uşor de calculat. Din această categorie de indicatori fac parte:

abaterea medie liniară (dx), abaterea medie pătratică (x), dispersia (2

x), coeficientul de variaţie (v).

Indicatorii sintetici ai variabilităţii Indicatori Abatere medie liniară

(dx) Abatere medie pătratică

(x) Dispersia (2

x)

Serie de variante

n

xxd

n

1ii

x

x =

n

xxn

1i

2

i

2

x =

n

xxn

1i

2

i

Serie de distribuţie

de frecvenţe absolute

m

1ii

i

m

1ii

x

f

fxxd x =

m

1ii

m

1ii

2

i

f

fxx

2x=

m

1ii

m

1ii

2

i

f

fxx

Serie de distribuţie

de frecvenţe relative

exprimate procentual

100

fxx

d

m

1i

*%ii

x

x =

100

fxxm

1i

*%i

2

i

2

x =

100

fxxm

1i

*%i

2

i

Serie de distribuţie

de frecvenţe relative

exprimate zecimal

m

1i

*ciix fxxd x =

m

1i

*ic

2

i fxx 2x = *

ic

m

1i

2

i fxx

Coeficientul de variaţie v = 100xx sau v’ = 100

x

dx (v’ < v)

Cu cât fenomenele studiate sunt mai complexe, caracteristicile care le definesc prezintă un grad mai mare de variaţie. Ca urmare, unităţile la care s-a făcut observarea trebuie împărţite în grupe în funcţie de variaţia factorilor determinanţi. In cazul aplicării metodei grupării se pot calcula atât medii pe grupe, cât şi o medie a colectivităţii totale. De asemenea, se pot determina indicatori de variaţie (dispersii) pentru fiecare grupă şi pentru întreaga colectivitate.

Media şi indicatorii de variaţie pentru întreaga colectivitate se pot calcula făcând abstracţie că ea este compusă din mai multe grupe, sau luând în calcul variaţia din interiorul grupelor şi dintre grupe. În consecinţă, între indicatorii de variaţie calculaţi la nivelul fiecărei grupe şi cei pe întreaga colectivitate există relaţii bazate pe regula de adunare a dispersiilor.

Numărul mediilor de grupă este egal cu numărul grupelor în care s-a împărţit colectivitatea. Factorul de grupare, considerat ca factor esenţial, determină/influenţează variaţia caracteristicii studiate în măsura în care mediile de grupă diferă între ele.

Page 118: TURDEAN MARINELLA - BAZELE STATISTICII - Manual debv.ucdc.ro/bv/F_1_bazele-statisticii-turdean.pdf · 3 MARINELLA SABINA TURDEAN LIGIA PRODAN BAZELE STATISTICII - Manual de studiu

118

Dacă factorul de grupare nu este factor determinant pentru caracteristica studiată, mediile de grupă vor fi apropiate de media colectivităţii generale, deci variaţia caracteristicii este produsă de alţi factori şi nu de cel ales pentru gruparea datelor.

Pentru a determina intensitatea cu care au influenţat asupra variaţiei caracteristicii dependente cele două grupe de factori (întâmplători şi esenţiali), atât la nivelul grupelor, cât şi la nivelul colectivităţii

generale se calculează următoarele dispersii: dispersia de grupă (2i), media dispersiilor de grupă ( 2

i ),

dispersia dintre grupe (2) şi dispersia totală (2o).

Pe baza regulii de adunare a dispersiilor 2o = 2 + 2 , se pot calcula doi indicatori statistici cu

caracter de mărimi relative de structură: coeficientul de determinaţie (R2y/x) si coeficientul de

nedeterminaţie (K2y/z)

Regula de adunare a dispersiilor Regula de adunare a dispersiilor 2

o = 2 + 2 Dispersia totală

2o =

p

1jj

p

1jj

2

oj

f

fyy

Dispersia de grupă

2i =

p

1jij

p

1jij

2

ij

f

fyy

Media dispersiilor parţiale

2 =

m

1ii

m

1ii

2i

n

n

Dispersia dintre grupe

2 =

m

1ii

m

1ii

2

oi

n

nyy

Coeficientul de determinaţie (R2y/x) si

Coeficientul de nedeterminaţie (K2y/z) R2

y/x = 1002o

2

si K2y/z = 100

2o

2

Dispersia caracteristicii alternative (2p) se calculează ca o medie aritmetică ponderată a pătratelor

abaterilor termenilor de la media lor. 2p =

qp

qppp

22 )0()1(

. Deoarece p + q = 1 şi 1- p = q,

relaţia de calcul devine: 2p =

qp

pqpq

qp

qppq

)(22

= p q = p (1 - p), deci,2p = p q = p (1 –p)

Abaterea medie pătratică (p) a caracteristicii alternative se determină conform relaţiei:

p = )p1(pqp2p

Dispersia caracteristicii alternative poate lua doar valori cuprinse în intervalul 25.0;0 , iar abaterea

medie pătratică doar valori cuprinse în intervalul 5.0;0 . Când frecvenţele relative p şi q sunt egale,

abaterea standard şi dispersia vor înregistra valorile maxime p = 0,5, respectiv 2p = 0,25.

In cazul în care colectivitatea este împărţită în m grupe şi se studiază variaţia unei caracteristici alternative, se pot calcula următorii indicatori: dispersia de grupă, media dispersiilor parţiale, dispersia dintre grupe, dispersia totală a caracteristicii alternative. Regula adunării dispersiilor se păstrează şi în cazul unei caracteristici alternative: 2

p = 2p + 2

p

Page 119: TURDEAN MARINELLA - BAZELE STATISTICII - Manual debv.ucdc.ro/bv/F_1_bazele-statisticii-turdean.pdf · 3 MARINELLA SABINA TURDEAN LIGIA PRODAN BAZELE STATISTICII - Manual de studiu

119

Indicatorii de variabilităţii pentru caracteristicile alternative Dispersia totală 2

p = p q

Abaterea medie pătratică

p = )p1(pqp2p

Dispersia de grupă 2pi = pi qi

Media dispersiilor parţiale 2

p =

m

1ii

m

1iiii

m

1ii

m

1ii

2pi

N

N)pq(

N

N

Dispersia dintre grupe 2

p =

m

1ii

m

1ii

2i

N

Npp

Regula de adunare a dispersiilor 2p = 2

p + 2p

Distribuţia statistică simetrică este acea distribuţie pentru care frecvenţele sunt uniform dispersate de-o parte şi de alta a valorii medii. Gradul de îndepărtare al unei distribuţii statistice de la simetrie se numeşte asimetrie. Pentru o serie de distribuţie perfect simetrică între cei trei indicatori modul, mediana şi media aritmetică există relaţia: x = Mo = Me

Seriile de distribuţie de frecvenţe prezintă cel mai des asimetrie de stânga sau de dreapta. Asimetria se poate analiza prin metoda grafică, utilizând histograma sau poligonul frecvenţelor, care oferă o imagine sugestivă asupra gradului de asimetrie.Pentru a măsura şi exprima printr-o valoare numerică gradul de asimetrie se calculează indicatorii de asimetrie sub formă absolută şi relativă.

Boltirea măsoară înălţimea, adică aplatizarea sau alungirea curbei frecvenţelor unei repartiţii comparativ cu cea normală. Karl Pearson propune următoarea expresie pentru coeficientul boltirii:

cb = 22

x

4x

)(

unde: 2x = dispersia variabilei, momentul centrat de ordin 2;

4x = momentul centrat de ordin 4 care se calculează după relaţia:

4x =

m

1ii

m

1ii

4i

f

f)xx(

Pentru a obţine un indicator de măsurare a excesului (cex) se compară coeficientul de boltire al lui Pearson cu valoarea acestui indicator pentru cazul repartiţiei normale pentru care coeficientul boltirii cb = 3.

Coeficienţi de asimetrie Coeficientul de asimetrie Pearson

-1 < x1

asMox

c

< 1

Coeficientul de asimetrie -3 <

x2

asMex3

c

< 3

Coeficientul de asimetrie Yule

12

123as qq

qqc

unde: q2 = Q3 - Me ; q2 = D9 - Me q1 = Me - Q1 q1 = Me - D1

dacă cas3 0.1 serie moderat asimetrică dacă cas3 0.3 serie pronunţat asimetrică

Page 120: TURDEAN MARINELLA - BAZELE STATISTICII - Manual debv.ucdc.ro/bv/F_1_bazele-statisticii-turdean.pdf · 3 MARINELLA SABINA TURDEAN LIGIA PRODAN BAZELE STATISTICII - Manual de studiu

120

8.7.2 Concepte şi termeni de reţinut reprezentativitatea mediei; omogenitatea seriei; indicatori simpli ai variabilităţii;

o amplitudinea absolută a variaţiei (A); amplitudinea relativă a variaţiei (A%); o abaterile individuale absolute (di); abaterile individuale relative (di%); o abaterea maximă negativă în expresie absolută (dmax neg);abaterea maximă negativă în

expresie relativă (dmax neg %); o abaterea maximă pozitivă în expresie absolută (dmax poz );abaterea maximă pozitivă în

expresie relativă(dmax poz %); indicatori sintetici ai variabilităţii;

o abaterea medie liniară (dx), o abaterea medie pătratică (x), o dispersia (2

x), o coeficientul de variaţie (v).

regula de adunare a dispersiilor o media de grupă o media colectivitatii totale o dispersia de grupă o media dispersiilor de grupă o dispersia dintre grupe o dispersia colectivităţii totale o coeficient de determinatie; o coeficient de nedeterminaţie

asimetrie asimetrie absolută coeficient de asimetrie; coeficientul boltirii; coeficientul excesului

8.7.3 Întrebări de control şi teme de dezbatere

1. De ce este necesar calculul indicatorilor variabilităţii? 2. Care sunt indicatorii simpli ai variabilităţii? 3. Enumeraţi indicatorii sintetici ai variabilităţii. 4. Cum se calculează abaterea medie liniară? 5. Cum se calculează dispersia? 6. Cum se calculează abaterea medie pătratică? 7. Cum se calculează coeficientul de variaţie? 8. Cum se stabileşte omogenitatea seriei, respectiv reprezentativitatea mediei? 9. Cum se calculează şi care este semnificaţia dispersiei de grupă în cazul unei distribuţii condiţionate a

unei caracteristici rezultative „y” în funcţie de o caracteristică de grupare „x”? 10. Cum se calculează şi care este semnificaţia dispersiei dintre grupe în cazul unei distribuţii condiţionate

a unei caracteristici rezultative „y” în funcţie de o caracteristică de grupare „x”? 11. Care este regula de adunare a dispersiilor 12. Ce indicatori statistici pot fi calculaţi pe baza regulii de adunare a disperiilor? 13. Cum se calculează şi care este semnificaţia coeficientului de determinaţie?

Page 121: TURDEAN MARINELLA - BAZELE STATISTICII - Manual debv.ucdc.ro/bv/F_1_bazele-statisticii-turdean.pdf · 3 MARINELLA SABINA TURDEAN LIGIA PRODAN BAZELE STATISTICII - Manual de studiu

121

14. Cum se calculează şi care este semnificaţia coeficientului de nedeterminaţie? 15. Prin ce se caracterizează o distribuţie simetrică? 16. Ce relaţie există intre mod, mediană şi medie aritmetică în cazul unei serii perfect simetrice? 17. Definiţi noţiunea de asimetrie. Care sunt relaţiile de calcul pentru coeficienţii de asimetrie? 18. Ce este boltirea? Care este relaţia de calcul pentru coeficietul boltirii?

8.7.4 Bibliografie:

1. Anghelache, C., Isaic- Maniu, A., Mitruţ, C., Voineagu, V., Dumbravă , M., (2007), Analiză economică, sinteze şi studii de caz, Editura Economică, Bucureşti;

2. Begu, L.S., (2009), Statistică internaţională –analize comparative, Editura Universitară, Bucureşti 3. Duguleană, L., (2012) Bazele statisticii economice, Editura CH Beck, Bucureşti; 4. Francis, A., (2004), Statistică şi matematică pentru managementul afacerilor, Editura Tehnică,

Bucureşti; 5. Turdean, M., (2012), Statistica, Editura Pro Universitaria, Bucureşti; 6. Ţiţan, E., (2012) Statistică – teorie şi aplicaţii în sectorul terţiar, Editura Meteor Press, Bucureşti;

Page 122: TURDEAN MARINELLA - BAZELE STATISTICII - Manual debv.ucdc.ro/bv/F_1_bazele-statisticii-turdean.pdf · 3 MARINELLA SABINA TURDEAN LIGIA PRODAN BAZELE STATISTICII - Manual de studiu

122

9 UNITATEA DE STUDIU 9 CERCETAREA SELECTIVĂ

9.1 Introducere 9.2 Obiectivele unitatii de invatare 9.3 Competenţele unităţii de studiu 9.4 Timpul alocat unităţii de invăţare 9.5 Conţinutul unităţii de studiu

9.5.1 Notiuni utilizate in sondajul statistic 9.5.2 Planul cercetarii prin sondaj 9.5.3 Procedee de selectie 9.5.4 Tehnici de selectie 9.5.5 Erorile cercetarii prin sondaj 9.5.6 Tipuri de sondaj

9.6 Aplicaţii practice 9.7. Îndrumar pentru autoverificare 9.7.1 Sinteza unitatii de invatare 9.7.2 Concepte si termeni de retinut 9.7.3 Întrebări de control şi teme de dezbatere 9.7.4 Bibliografie

9.1 Introducere Fenomenele şi procesele social-economice pot fi cunoscute şi caracterizate pe baza datelor obţinute prin metode de înregistrare totală sau parţială. În anumite condiţii de timp şi de spaţiu nu se poate face înregistrarea totală a unităţilor care compun o colectivitate deoarece o astfel de operaţiune nu ar fi oportună din punct de vedere al costurilor şi operativităţii obţinerii rezultatelor. Problema care apare constă în a alege între precizia unor valori rezultate dintr-o înregistrare totală, dar influenţată de erorile de înregistrare (care sunt cu atât mai mari cu cât este mai mare volumul colectivităţii) şi o valoare, cu siguranţă inexactă, dar a cărei eroare de apariţie poate fi predeterminată, sau altfel spus, a cărei probabilitate de apariţie este cunoscută.

9.2 Obiectivele unităţii de studiu

– cunoaşterea conceptului de esantion (mostra); – cunoasterea avatajelor cercetarii partiale in raport cu

cercetarea totala; – cunoaşterea notiunilor utilizate in sondajul statistic; – cunoasterea etapelor planului de cercetare prin sondaj; – cunoaşterea conditiilor de asiguare a reprezentativitatii

esantionului; – cunoasterea procedeului de inferenta statistica; – cunoasterea procedeelor de selectie: aleatoare, dirijata si

Page 123: TURDEAN MARINELLA - BAZELE STATISTICII - Manual debv.ucdc.ro/bv/F_1_bazele-statisticii-turdean.pdf · 3 MARINELLA SABINA TURDEAN LIGIA PRODAN BAZELE STATISTICII - Manual de studiu

123

mixta; – cunoasterea tehnicilor de selectie; – cunoasterea erorilor cercetarii prin sondaj; – cunoasterea tipurilor de sondaj.

9.3 Competenţele unităţii de studiu:

– studenţii vor putea să definească conceptul de esantion – studenţii vor putea să prezinte avantajele cercetarii partiale

in raport cu cercetarea prin sondaj; – studenţii vor putea să defineasca colectivitatea totala si

colectivitatatea de selectie; – studenţii vor putea să defineasca procedeul de inferenta

statistica; – studenţii vor cunoaşte cele trei procedee de selectie:

aleatoare, dirijata si mixta; – studenţii vor cunoaşte tehnicile de selectie; – studenţii vor putea sa faca diferenta dintre selecţia repetata

si cea nerepetata; – studenţii vor putea să defineasca conceptul de eroare de

selectie; – studenţii vor putea calcula eroarea medie de

reprezentativitate atat pentru selectia repetata cat si pentru cea nerepetata;

– studenţii vor putea determina intervalul de incredere pentru media colectivitatii generale;

– studenţii vor putea să defineasca distributia normala; – studenţii vor putea calcula, pe baza erorii limite maxim

admisibile, volumul de sondaj necesar atat pentru sondajul repetat cat si pentru sondajul nerepetat.

9.4 Timpul alocat unităţii de studiu:

Pentru unitatea de studiu „Cercetarea selectiv”, timpul alocat este de 4 ore.

9.5 Conţinutul unităţii de studiu

Definiţie Cercetarea prin sondaj este o metodă statistică de cunoaştere a

unei populaţii pe baza datelor înregistrate numai asupra unei părţireprezentative numită eşantion (mostră).

Cercetarea prin sondaj a unităţilor colectivităţii îşi atinge scopul doar în cazul în care rezultatele obţinute în urma prelucrării datelor din eşantion pot fi extinse/generalizate la nivelul întregii populaţii din care a fost extras eşantionul.

Datorită numărului mic de unităţi statistice studiate, cercetarea

Page 124: TURDEAN MARINELLA - BAZELE STATISTICII - Manual debv.ucdc.ro/bv/F_1_bazele-statisticii-turdean.pdf · 3 MARINELLA SABINA TURDEAN LIGIA PRODAN BAZELE STATISTICII - Manual de studiu

124

parţială prezintă următoarele avantaje în raport cu cercetarea totală: - un volum mai redus de cheltuieli; - operativitate ridicată; - erori de înregistrare mai puţin frecvente şi mai uşor de

înlăturat în diferite faze de verificare a datelor; - caracterizarea mai aprofundată a fenomenului studiat

deoarece în programul observării prin sondaj poate fi cuprins un număr mai mare de caracteristici statistice.

Teoria sondajului, ca metodă de cunoaştere şi înregistrare a

lumii înconjurătoare, asigură cadrul metodologic şi ştiinţific necesar rezolvării problemelor legate de:

constituirea de eşantioane reprezentative; culegerea datelor din eşantion; prelucrarea datelor statistice din care rezultă indicatori

derivaţi: mărimi relative, mărimi medii, indici, care descriu statistic eşantionul;

estimarea cu o anumită probabilitate a parametrilor colectivităţii testate;

testarea veridicităţii/verosimilităţii estimaţiilor obţinute.

9.5.1 Noţiuni utilizate în sondajul statistic Cercetării prin sondaj îi este specifică utilizarea unor noţiuni

perechi care au acelaşi conţinut metodologic dar diferă din punct de vedere al informaţiei cuprinse.

1.a. Colectivitatea generală denumită şi populaţie, reprezintă ansamblul unităţilor statistice simple sau complexe care face obiectul cercetării statistice. Volumul colectivităţii generale se notează cu N.

1.b. Colectivitatea de selecţie denumită şi eşantion, mostră, probă, constituie acea parte din colectivitatea generală pentru care urmează să se culeagă datele. Volumul colectivităţii de selecţie se notează cu n.

Cu ajutorul datelor obţinute în urma observării unui eşantion se pot determina două categorii de indicatori:

2.a. Indicatori ai distribuţiei eşantionului, numiţi şi valori de sondaj, obţinuţi prin prelucrarea datelor rezultate din observarea eşantionului de volum n.

2.b. Indicatori ai distribuţiei populaţiei, numiţi şi parametri, care se estimează prin inferenţa statistică pe baza valorilor de sondaj obţinute pentru eşantion.

Dintr-o anumită colectivitate generală pot fi extrase mai multe

eşantioane care diferă între ele atât ca volum cât şi ca structură. Prin urmare, indicatorii statistici obţinuţi pe baza colectivităţii de sondaj, pot fi consideraţi variabile aleatoare pentru care se pot stabili distribuţii de frecvenţe.

Media şi dispersia pentru o colectivitate generală delimitată în timp şi spaţiu nu pot lua decât o singură valoare.

Relaţiile de calcul pentru valorile statistice de sondaj (valori statistice calculate) precum şi a parametrilor populaţiei sunt redate în tabelul 9.1.

Page 125: TURDEAN MARINELLA - BAZELE STATISTICII - Manual debv.ucdc.ro/bv/F_1_bazele-statisticii-turdean.pdf · 3 MARINELLA SABINA TURDEAN LIGIA PRODAN BAZELE STATISTICII - Manual de studiu

125

Tabelul 9.1.Valorile statistice de sondaj şi parametrii populaţiei

Denumirea indicatorului Media Dispersia

Caracteristica nealternativă

Colectivitatea generală

N

xx

N

1ii

o

N

xxN

1i

2

i2o

o

Colectivitatea de selecţie

n

xx

n

1ii

s

n

xxn

1i

2

i2s

s

Caracteristica alternativă

Colectivitatea generală N

Mp p1p2

p

Colectivitatea de selecţie n

mw w1w2

w

9.5.2 Planul cercetării prin sondaj Planul cercetării prin sondaj presupune extragerea şi

observarea unui număr limitat de unităţi statistice aparţinătoare unei colectivităţi statistice pe care dorim să o cunoaştem. Pentru a cunoaşte colectivitatea, informaţiile rezultate cu acest prilej trebuie să fie utile şi suficient de precise.

Etapele planului de cercetare prin sondaj sunt: 1. Etapa de enunţare a obiectivelor cercetării urmăreşte: Estimarea unor caracteristici ale unei distribuţii, adică în

urma calculelor anumitor valori caracteristice eşantionului de volum (n) se estimează parametrii populaţiei (N);

Verificarea ipotezelor privind forma distribuţiilor, legăturile dintre fenomene, evoluţia fenomenelor.

2. Definirea populaţiei constă în: delimitarea statistică a

populaţiei şi verificarea gradului de omogenitate al acesteia. Delimitarea populaţiei presupune precizarea naturii sale

(indivizi, societăţi comerciale), a caracteristicilor urmărite (vârstă, profil de activitate), a spaţiului şi a timpului.

Verificarea gradului de omogenitate a colectivităţilor generale constă în analiza indicatorilor variaţiei caracteristicilor urmărite. Acest tip de analiză se poate baza pe datele oferite de o observare totală anterioară sau pe datele obţinute în urma mai multor sondaje succesive.

3. Eşantionarea presupune, în primul rând, stabilirea bazei de sondaj, adică a unei liste în care sunt prezentate sistematizat unităţile colectivităţii generale astfel încât să permită formarea aleatoare a eşantionului. Definirea unităţilor folosite la eşantionare presupune cunoaşterea naturii şi a modului de organizare a unităţilor în cadrul populaţiei. Unităţile de eşantionare pot fi: unităţi simple sau unităţi complexe. De asemenea, trebuie făcută distincţia dintre unităţile de observare, adică unitatea pe care o încercăm să o cunoaştem şi despre care se culeg informaţiile şi unitatea de eşantionare, adică unitatea desemnată în procesul de eşantionare să furnizeze informaţii atunci când ea diferă de unitatea de observare.

Page 126: TURDEAN MARINELLA - BAZELE STATISTICII - Manual debv.ucdc.ro/bv/F_1_bazele-statisticii-turdean.pdf · 3 MARINELLA SABINA TURDEAN LIGIA PRODAN BAZELE STATISTICII - Manual de studiu

126

Exemplu: În anchetele asupra locuinţelor, unitatea de observare o constituie locuinţa, iar unitatea de eşantionare este persoana solicitată să ofere informaţii asupra acestui subiect. Procedeul de eşantionare se poate baza pe principiul selecţiei aleatoare sau pe principiul alegerii raţionale. Rezultatele cercetării prin sondaj depind de asigurarea reprezentativităţii eşantionului. Această condiţie este îndeplinită atunci când:

- unităţile se includ în eşantion după principiul hazardului cu o probabilitate diferită de zero, ce poate fi calculată;

- eşantionul este suficient de mare ca să permită redarea însuşirilor esenţiale ale colectivităţii totale;

- eşantionul reproduce în structura sa aceeaşi structură pe care o are şi colectivitatea generală.

4. Pentru determinarea eşantionului se pot folosi selecţii aleatoare, selecţii dirijate şi selecţii mixte, cunoscute sub denumirea generală de procedee de selecţie.

5. Observarea statistică a eşantionului se face respectând planul observării statistice.

6. Prelucrarea datelor necesită respectarea problemelor metodologice şi organizatorice cuprinse în planul de prelucrare (vezi Capitolul 3).

7. Pe baza indicatorilor distribuţiei eşantionului obţinuţi prin prelucrarea datelor are loc etapa de analiză a informaţiilor obţinute despre eşantion.

8. Inferenţa statistică este procedeul prin care se poate trece de la o valoare statistică calculată pe baza datelor dintr-un eşantion spre o valoare estimată.

9. Decizia statistică este legată de specificul demersului economic pentru care s-a desfăşurat sondajul, ca de exemplu, în agricultură - pentru estimarea recoltei probabile, în industrie - pentru controlul calităţii produselor, în comerţ – pentru estimarea cererii de mărfuri şi cunoaşterea opiniei consumatorilor. Sondajul este un instrument des utilizat şi în alte domenii: sondarea opiniei publice cu privire la alegeri, studiul comportamentului uman, determinarea stării de sănătate, verificarea ipotezelor privind influenţa diferiţilor factori asupra fenomenelor cercetate de biologie, medicină, fizică, psihologie, chimie, economie.

9.5.3 Procedee de selecţie La formarea eşantionului, unităţile statistice pot fi selectate

după principiul selecţiei aleatoare, al selecţiei dirijate (subiectiv organizate) sau al selecţiei mixte.

9.5.3.1 Selecţia aleatoare Selecţia aleatoare presupune extragerea din colectivitatea totală a

unităţilor eşantionului în mod aleator. Fiecare unitate componentă a populaţiei are o probabilitate egală şi diferită de zero de a fi aleasă în eşantion. Acest tip de eşantionare se aplică atunci când nu se cunoaşte structura colectivităţii totale după caracteristica ce urmează fi studiată.

9.5.3.2 Selecţia dirijată În cazul selecţiilor dirijate se poate spune că are loc, de fapt, o

alegere a unităţilor statistice după un anumit criteriu prestabilit, raţio-nal şi util. Acest principiu de eşantionare se aplică în sondajul realizat pentru colectivităţile grupate în grupe tipice.

Page 127: TURDEAN MARINELLA - BAZELE STATISTICII - Manual debv.ucdc.ro/bv/F_1_bazele-statisticii-turdean.pdf · 3 MARINELLA SABINA TURDEAN LIGIA PRODAN BAZELE STATISTICII - Manual de studiu

127

9.5.3.4 Selecţia mixtă Selecţia mixtă este o combinaţie a principiilor selecţiei

aleatoare cu principiile selecţiei dirijate.

9.5.4 Tehnici de selecţie Tehnicile de selecţie depind de specificul domeniului cercetării

precum şi de resursele observatorului. Planul cercetării prin sondaj are următoarele etape: În funcţie de modul de extragere a unităţilor eşantionului,

selecţiile aleatoare pot fi realizate după: 1. procedeul tragerii la sorţi cu variantele:

1.1 procedeul selecţiei repetate (al bilei revenite); 1.2 procedeul selecţiei nerepetate (al bilei nerevenite).

2. procedeul selecţiei mecanice cu variantele: 2.1. procedeul tabelului cu numere întâmplătoare; 2.2. procedeul pasului de numere.

1. Procedeul tragerii la sorţi constă în extragerea dintr-o urmă a unor bile (sau a altor obiecte) reprezentând fiecare o unitate a colectivităţii.

1.1. Selecţia repetată se realizează după schema urnei cu bila revenită, care presupune ca de fiecare dată bila extrasă să fie reintrodusă în urnă. Astfel volumul colectivităţii generale (N) rămâne neschimbat pe toată durata operaţiunii de construire a eşantionului. Fiecare unitate din colectivitatea totală are aceeaşi

probabilitate N

1p de a fi selectată. La sfârşit în urnă rămân (N -

1) unităţi. 1.2. Selecţia nerepetată presupune că bila odată extrasă nu

se mai introduce în urnă, mărind astfel şansa fiecărei unităţi rămase de a intra în eşantion. Probabilitatea unei unităţi de a participa la formarea eşantionului se măreşte pe parcursul selecţiei astfel:

)1n(N

1p...

2N

1p

1N

1p

N

1p n321

La sfârşitul efectuării selecţiei, numărul unităţilor rămase în populaţie va fi (N – n).

Datorită faptului că în cazul selecţiei nerepetate este exclusă posibilitatea extragerii de mai multe ori a aceleiaşi unităţi, erorile sunt mai mici, deci rezultatele obţinute au un grad de precizie mai mare.

2. Selecţia mecanică 1. Procedeul tabelului cu numere aleatoare constă în

numerotarea tuturor unităţilor colectivităţii generale într-o ordine oarecare de la 1 la N. Extragerea unităţilor eşantionului (n) din tabelele cu numere aleatoare are loc alegând la întâmplare rândul şi coloana cu care începe selecţia.

2. Procedeul pasului de numărare presupune ordonarea unităţilor după o caracteristică oarecare. Operaţia de alcătuire a eşantionului este precedată de stabilirea pasului de numărare care trebuie să fie un număr întreg, calculat ca raport între volumul colectivităţii generale şi volumul colectivităţii de selecţie (N/n). Pentru construirea eşantionului se selectează la întâmplare o unitate la care se adaugă pasul de numărare până la obţinerea celor n unităţi ale eşantionului.

Page 128: TURDEAN MARINELLA - BAZELE STATISTICII - Manual debv.ucdc.ro/bv/F_1_bazele-statisticii-turdean.pdf · 3 MARINELLA SABINA TURDEAN LIGIA PRODAN BAZELE STATISTICII - Manual de studiu

128

9.5.5 Erorile cercetării prin sondaj Abaterea care există între valorile calculate prin prelucrarea

datelor din eşantion şi ceea ce s-ar obţine în urma prelucrării datelor, dacă s-ar fi organizat o observare totală, se numeşte eroare de selecţie.

Erorile întâlnite în cadrul sondajului pot fi: (i) erori comune tuturor tipurilor de observări numite erori de înregistrare şi (ii) erori specifice cercetării prin sondaj numite erori de reprezentativitate.

Erorile de înregistrare pot fi înlăturate în diferitele etape ale controlului statistic.

Erorile de reprezentativitate specifice cercetării selective pot fi: (i) erori sistematice şi (ii) erori întâmplătoare.

- Erorile sistematice de reprezentativitate pot fi evitate dacă se respectă întocmai principiile teoriei selecţiei. Dintre cazurile care conduc la apariţia acestui tip de erori menţionăm: alegerea preferenţială (deliberată) a unităţilor din eşantion sau cuprinderea incompletă în eşantion a unităţilor din motive de comoditate.

- Erorile întâmplătoare de reprezentativitate apar chiar dacă se respectă întocmai principiile teoriei selecţiei.

Deoarece eşantionul are un număr mic de unităţi, el poate reproduce doar în mod întâmplător colectivitatea generală. În cazul selecţiilor aleatoare, erorile de reprezentativitate pot fi predeterminate. Estimarea parametrilor pentru colectivitatea generală poate avea loc pe baza valorilor de sondaj, cu o eroare întâmplătoare de reprezentativitate care se găseşte într-un interval probabilistic.

Erorile de reprezentativitate pot fi calculate ca: (a) erori efective şi (b) erori probabile.

9.5.5.1 Erorile efective de reprezentativitate Erorile efective de reprezentativitate se pot calcula pentru

acele caracteristici despre care s-au înregistrat date în urma unei observări totale.

Eroarea efectivă de reprezentativitate, (x

d ) are relaţia de

calcul:

0sxxxd

unde: sx = media eşantionului

0x = media colectivităţii totale Calculul erorii efective înseamnă, de fapt, verificarea reprezen-

tativităţii unui eşantion. Atunci când structura pe grupe a colectivităţii de selecţie nu diferă cu mai mult de ± 5% de structura colectivităţii generale, eşantionul este considerat reprezentativ.

Pentru a determina gradul de reprezentativitate (%x

d ) al

eşantionului se aplică relaţia:

100x

dd

0

x

%x

unde: x

d = eroarea efectivă de reprezentativitate

0x = media colectivităţii totale

Page 129: TURDEAN MARINELLA - BAZELE STATISTICII - Manual debv.ucdc.ro/bv/F_1_bazele-statisticii-turdean.pdf · 3 MARINELLA SABINA TURDEAN LIGIA PRODAN BAZELE STATISTICII - Manual de studiu

129

În practică, în cele mai multe situaţii, nu se dispune de date referitoare la colectivitatea generală, ca urmare, media pe întreaga colectivitate nu este cunoscută. În aceste cazuri se efectuează mai multe selecţii succesive cu scopul de a verifica gradul de stabilitate a mediei şi a dispersiei pentru variabila după care se face eşantionarea.

Eroarea de reprezentativitate se va calcula în acest caz după

relaţia:

ssxxxd

unde: sx = media mediilor de selecţie efectuate pentru verificarea stabilităţii selecţiei.

9.5.5.2 Eroarea medie probabilă de reprezentativitate Erorile efective de reprezentativitate se pot calcula doar pentru

acele caracteristici despre care se cunosc date din eşantion şi date pentru întreaga colectivitate.

Cu cât volumul colectivităţii de selecţie este mai mare, cu atât media de selecţie va estima mai bine media colectivităţii generale. Pentru acelaşi volum de selecţie se pot obţine mai multe eşantioane din aceeaşi colectivitate generală, rezultând astfel valori diferite ale mediei de selecţie. În acest context de formare a mediilor de selecţie, fiecare medie poate să apară o singură dată sau de mai multe ori. Se poate afirma deci că media de selecţie este o variabilă aleatoare căreia i se poate stabili legea de distribuţie.

Erorile efective de reprezentativitate ( xd ) vor fi diferite de la un

eşantion la altul, ceea ce impune calculul unui indicator sintetic numit eroare medie de reprezentativitate. Acest indicator se calculează utilizând media pătratică pentru a evita compensarea erorilor de sensuri diferite şi pentru a da semnificaţia cuvenită erorilor mai mari. În cercetarea selectivă, media pătratică se simbolizează cu σ

x .(μx)

k

k 2

1iis

1iis0

ixx

f

fxsxμσ

unde: k = numărul eşantioanelor posibile

isx = media selecţiei i fs

i = frecvenţa mediei de selecţie i

Dacă volumul eşantionului este suficient de mare (peste 40 de unităţi), media de selecţie se distribuie potrivit funcţiei Gauss-Laplace cunoscută şi sub denumirea de distribuţie normală.

Distribuţia normală este de forma unei distribuţii simetrice în care, cea mai mare probabilitate de apariţie o are acea medie de selecţie care coincide ca valoare cu media colectivităţii generale a cărei eroare efectivă de reprezentativitate este zero. Celelalte valori ale mediei de selecţie se distribuie simetric (de ambele părţi ale mediei ce coincide cu media colectivităţii generale), având probabilităţi bine determinate şi egale pentru aceeaşi eroare/abatere absolută într-un sens sau altul. Probabilităţile de apariţie ale acestor

Page 130: TURDEAN MARINELLA - BAZELE STATISTICII - Manual debv.ucdc.ro/bv/F_1_bazele-statisticii-turdean.pdf · 3 MARINELLA SABINA TURDEAN LIGIA PRODAN BAZELE STATISTICII - Manual de studiu

130

medii de selecţie descresc proporţional şi simetric către capetele distribuţiei, în timp ce erorile de reprezentativitate cresc. Erorile de reprezentativitate sunt exprimate în aceeaşi unitate de măsură ca şi variabila studiată. Pentru ca aceste erori să poată fi comparabile pentru orice variabilă studiată, abaterile absolute se transformă în abateri normale normate după relaţia:

x

0s

σ

xxz

Dacă mediile de selecţie se distribuie după legea normală, înseamnă că şi erorile întâmplătoare de reprezentativitate urmează aceeaşi formă de distribuţie.

Probabilitatea ca media de eşantionare să fie cuprinsă între două limite fixate anticipat (pe baza datelor sondajului), este:

xs0xs zxxzxP

Această probabilitate poate fi determinată cu relaţia:

dze2π

1ΦP

z

z

2

2z

(z)

Coeficientul z este argumentul funcţiei Gauss-Laplace şi se găseşte tabelat

Intervalul (xsxs zσx;zσx ) se numeşte interval de

încredere. Produsul

xz se numeşte eroare limită maxim admisibilă şi se

notează cu XΔ .

xΔ = xzσ

Riscul ca media populaţiei, (0

x ), să nu se afle în acest interval

se numeşte nivel sau prag de semnificaţie, se notează cu “α” şi este o valoare complementară a nivelului de încredere.

Probabilitatea caracterizează siguranţa cu care se afirmă că intervalul de încredere cuprinde valoarea mediei populaţiei. Altfel spus, probabilitatea (sau nivelul de siguranţă sau nivelul de încredere) ne arată ce şanse sunt ca eroarea reală comisă atunci

când o valoare 0

x necunoscută este aproximată prin sx să nu

depăşească eroarea limită maxim admisibilă XΔ . În practica cercetărilor selective s-a convenit că nivelul

probabilităţii cu care se fac estimările să nu fie mai mic de 95%. Aceasta înseamnă că şansele de a greşi estimarea nu trebuie să fie mai mari de 5%.

Intervalele de încredere pentru selecţii probabilistice succesive de volum suficient de mare (formate din unităţi statistice extrase dintr-o colectivitate N şi pentru care se poate accepta ipoteza că media de selecţie se distribuie normal) sunt reprezentate grafic în fig. 7.2.

Page 131: TURDEAN MARINELLA - BAZELE STATISTICII - Manual debv.ucdc.ro/bv/F_1_bazele-statisticii-turdean.pdf · 3 MARINELLA SABINA TURDEAN LIGIA PRODAN BAZELE STATISTICII - Manual de studiu

131

xs 3x

xs 2x

xsx sx

xsx

xs 2x

xs 3x

Figura 9.2. Reprezentarea grafică a intervalelor de încredere Urmărind valorile coeficientului z, se observă că pe măsură ce

acestea cresc, (i) creşte şi probabilitatea P = (z), (ii) creşte intervalul de încredere al mediei şi (iii) scade exactitatea cu care se estimează media generală pe baza selecţiei.

Nivelul coeficientului z, intervalul de încredere, nivelul de siguranţă, pragul de semnificaţie

Nivelul

coeficientului z

Intervalul de încredere

xs zx

Nivelul de siguranţă

P(%)

Pragul de semnificaţie

(riscul) α = 100 – P (%)

1 xsx 68.26 31.74

1.96 xs 96.1x 95.00 5.00

2 xs 2x 95.44 4.56

2.58 xs 58.2x 99.00 1.00

3 xs 3x 99.73 0.27

3.3 xs 3.3x 99.90 0.10

4 xs 4x 99.99 0.01

Despre eroarea limită, XΔ , se poate afirma că este o mărime variabilă direct proporţională cu probabilitatea utilizată pentru garantarea rezultatelor şi invers proporţională cu exactitatea/precizia rezultatelor.

În cazul selecţiei aleatoare repetate între dispersia

colectivităţii generale (2o ), dispersia mediilor de selecţie de la

media colectivităţii totale (2x

) şi volumul selecţiei (n) există

relaţia: 2o

2x

σnσ

Pe baza relaţiei de mai sus se poate determina eroarea medie de reprezentativitate:

n

σ

n

σσ o

2o

repx

Deoarece în anumite condiţii de timp şi de spaţiu abaterea

medie pătratică ( o ) are un caracter stabil, se poate trage concluzia

că mărimea erorii medii de reprezentativitate poate fi influenţată prin modificarea volumului eşantionului. De obicei, urmărind

Page 132: TURDEAN MARINELLA - BAZELE STATISTICII - Manual debv.ucdc.ro/bv/F_1_bazele-statisticii-turdean.pdf · 3 MARINELLA SABINA TURDEAN LIGIA PRODAN BAZELE STATISTICII - Manual de studiu

132

reducerea erorii medii de reprezentativitate vom apela la relaţia:

2

ox

kn

σ

k

σ

În cazul selecţiei aleatoare nerepetate, numărul de eşantioane este mai mic deoarece aceeaşi unitate nu poate participa decât la o singură selecţie. Astfel, apare inegalitatea:

20

2x

σnσ

Pentru selecţia nerepetată, eroarea medie de reprezentativitate va fi:

1N

nN

n

σσ

20

nerepx

unde:1N

nN

- coeficientul de corecţie a erorii medii de

reprezentativitate în cazul aplicării procedeului bilei nerevenite. N – n, reprezintă volumul colectivităţii generale rămas după

ultima extragere, cazul selecţiei nerepetate. N – 1, reprezintă volumul colectivităţii generale rămas după

ultima extragere, cazul selecţiei repetate. Dacă volumul colectivităţii generale este suficient de mare se

renunţă la (-1) din numitorul relaţiei precedente şi aceasta devine:

N

n1

n

σσ

20

nerepx

În cazul în care se cercetează variaţia unei caracteristici alternative, eroarea medie de reprezentativitate va fi:

- pentru selecţia aleatoare repetată:

n

p)p(1σ

p

- pentru selecţia aleatoare nerepetată:

N

n1

n

p)p(1σ

p

Eroarea medie de reprezentativitate (x

) şi eroarea limită

( XΔ ) pot fi calculate anticipat în cazul în care: (i) se cunoaşte media şi dispersia generală a unei caracteristici sau un estimator al acesteia, (ii) s-a stabilit volumul eşantionului şi (iii) s-a stabilit probabilitatea cu care se vor garanta rezultatele.

9.5.6 Tipuri de sondaj Tipul de sondaj se stabileşte în funcţie de scopul cercetării,

forma de organizare a colectivităţii generale şi gradul de omogenitate al acesteia.

Cele mai utilizate tipuri de sondaj sunt: 1. sondajul aleator simplu; 2. sondajul tipic (stratificat); 3. sondajul de serii. Pe baza indicatorilor: eroare medie de reprezentativitate, eroare

limită şi volumul eşantionului se estimează parametrii colectivităţii generale.

Page 133: TURDEAN MARINELLA - BAZELE STATISTICII - Manual debv.ucdc.ro/bv/F_1_bazele-statisticii-turdean.pdf · 3 MARINELLA SABINA TURDEAN LIGIA PRODAN BAZELE STATISTICII - Manual de studiu

133

9.5.6.1 Sondajul aleator simplu Sondajul aleator simplu se aplică pentru colectivităţile cu grad

ridicat de omogenitate. Eşantionul se formează prin extragerea unităţilor din colectivitatea generală după procedeul bilei revenite sau al bilei nerevenite.

Se vor calcula următorii indicatori:

1. Eroarea medie de reprezentativitate ( xσ ):

- cazul sondajului repetat:

n

σσ

20

repx

- cazul sondajului nerepetat:

N

n1

n

σσ

20

nerepx

2. Eroarea limită maxim admisibilă ( xΔ ):

xx zσΔ

- cazul sondajului repetat:

n

σzzσΔ

20

repxrepx

- cazul sondajului nerepetat:

N

n1

n

σzzσΔ

20

nerepxnerepx

3. Volumul eşantionului (n) se determină pornind de la relaţia de calcul a erorii limită:

xx zσΔ

- cazul sondajului repetat: Dacă se consideră:

n

σzΔ

20

repx

atunci:

2repx

20

2

Δ

σzn

- cazul sondajului nerepetat: Dacă se consideră:

N

n1

n

σzΔ

20

nerepx

atunci:

N

σzΔ

σzn

20

22

nerepx

20

2

Page 134: TURDEAN MARINELLA - BAZELE STATISTICII - Manual debv.ucdc.ro/bv/F_1_bazele-statisticii-turdean.pdf · 3 MARINELLA SABINA TURDEAN LIGIA PRODAN BAZELE STATISTICII - Manual de studiu

134

4. Valoarea reală/adevărată dar necunoscută a mediei

colectivităţii generale ( 0x ) se va situa în intervalul de încredere:

xs0xs ΔxxΔx Intervalul de încredere pentru variaţia mediei estimate pe baza

datelor de selecţie permite, pentru unele situaţii, determinarea intervalului de variaţie probabil al nivelului totalizat al caracteristicii corespunzător colectivităţii generale:

xsxs ΔxNxNΔxN sau

xs

N

1iixs ΔxNxΔxN

9.5.6.2 Sondajul tipic În studiul fenomenelor social-economice de masă se utilizează

cel mai frecvent sondajul tipic (stratificat). Acest tip de sondaj se aplică în cazul colectivităţilor neomogene, împărţite pe grupe cât mai omogene.

În funcţie de gradul de omogenitate al grupelor, mediile de grupă au valori mai apropiate de valorile individuale din care s-au calculat. Ca urmare, variaţia mediilor de selecţie posibile va depinde de gradul de variaţie al fiecărei grupe care este sintetizat de

indicatorul media dispersiilor parţiale (2

).

Deoarece 20

2 , prin aplicarea selecţiei tipice vor

rezulta erori de reprezentativitate mai mici decât în cazul selecţiei aleatoare simple.

Dacă nu se dispune de date dintr-o cercetare totală anterioară, deci nu se cunoaşte media dispersiilor parţiale din colectivitatea

totală 20 , se va utiliza pentru calculul indicatorilor de selecţie

media dispersiilor parţiale din colectivitatea de selecţie (2s ).

Relaţiile de calcul ale indicatorilor de selecţie pentru cazul sondajului tipic se determină pornind de la cele ale sondajului aleator simplu în care se înlocuieşte dispersia colectivităţii generale (dispersia

eşantionului) cu media dispersiilor de grupă (2

).

1. Eroarea medie de reprezentativitate ( x ) este:

- în cazul sondajului repetat:

n

σσ

2

x

- cazul sondajului nerepetat:

N

n1

n

2

x

2. Eroarea limită ( x ) este: - cazul sondajului repetat:

Page 135: TURDEAN MARINELLA - BAZELE STATISTICII - Manual debv.ucdc.ro/bv/F_1_bazele-statisticii-turdean.pdf · 3 MARINELLA SABINA TURDEAN LIGIA PRODAN BAZELE STATISTICII - Manual de studiu

135

nz

2

x

- cazul sondajului nerepetat:

N

n1

nz

2

x

3. Volumul eşantionului (n) este: - cazul sondajului repetat:

2x

22

)(

zn

- cazul sondajului nerepetat:

N

t

zn

222

x

22

4. Intervalul de încredere pentru media colectivităţii generale este:

xs0xs xxx

unde:

i

isis

n

nxx

adică: sx este media ponderată a mediilor de selecţie isx

corespunzătoare grupelor în care a fost împărţită colectivitatea. Intervalul de încredere pentru variaţia nivelului totalizat al

caracteristicii este:

xs

N

1iixs xNxxN

În cazul sondajului tipic, pentru repartizarea unităţilor eşantionului pe subeşantioane corespunzător tipurilor calitative determinate se pot aplica trei procedee:

1. Repartizarea unităţilor eşantionului în mod egal pe subeşantioane indiferent de numărul unităţilor ce compun grupele colectivităţii totale. Acest tip de selecţie se numeşte selecţie tipică (stratificată) neproporţională.

k

nnk

unde: n – numărul unităţilor eşantionului nk – numărul unităţilor din subeşantionul k k – numărul grupelor din colectivitatea totală. 2. Repartizarea unităţilor eşantionului pe subeşantioane în

funcţie de ponderea fiecărei grupe în colectivitatea generală. Acest tip de selecţie se numeşte selecţie tipică (stratificată) proporţională, se foloseşte cel mai frecvent în practică deoarece conduce la o structură a colectivităţii de selecţie identică cu cea a colectivităţii generale, asigurând apariţia unor erori foarte mici.

Page 136: TURDEAN MARINELLA - BAZELE STATISTICII - Manual debv.ucdc.ro/bv/F_1_bazele-statisticii-turdean.pdf · 3 MARINELLA SABINA TURDEAN LIGIA PRODAN BAZELE STATISTICII - Manual de studiu

136

k

1ii

ik

N

Nnn

unde: Ni – numărul unităţilor din grupa i a colectivităţii generale.

3. Repartizarea unităţilor eşantionului pe subeşantioane în funcţie de ponderea fiecărei grupe în colectivitatea generală, cât şi de gradul de omogenitate al grupelor, reprezentat de abaterea medie pătratică. Acest tip de selecţie se numeşte selecţie tipică (stratificată) optimă, deoarece conduce la cele mai mici erori posibile.

k

1iii

iik

N

Nnn

9.5.6.3 Sondajul de serii Sondajul de serii se utilizează atunci când colectivitatea

generală este formată din unităţi complexe. În cazul sondajului de serii, eroarea medie de reprezentativitate

se calculează ca şi în cazul sondajului aleator simplu, respectiv al sondajului tipic, dar cu următoarele corecţii:

- Numărul unităţilor colectivităţii generale (N) se înlocuieşte cu numărul de serii din colectivitatea generală (R);

- Numărul unităţilor din eşantion (n) se înlocuieşte cu numărul de serii din eşantion (r);

- Dispersia dintre valorile individuale (20σ ), respectiv

media dispersiilor parţiale (2σ ) se înlocuieşte cu dispersia dintre

serii (dispersia dintre grupe) 2δ .

Eroarea medie de reprezentativitate va fi: - în cazul sondajului repetat:

r

δσ

2

repx

- în cazul sondajului nerepetat:

1R

rR

r

δσ

2

nerepx

9.5.6.4 Alte tipuri de sondaje - Sondajul în trepte Uneori, complexitatea fenomenelor social-economice impune

ca sondajul să aibă loc în mai multe trepte. Acest tip de sondaj este considerat o formă particulară a selecţiei de serii, iar eroarea medie de selecţie se va determina după relaţia:

...f1r

δf1

r

δσ 2

2

22

11

21

x

unde: 2iδ = dispersiile dintre serii în fiecare treaptă;

fi = proporţia de selecţie a diferitelor trepte calculate ca

Page 137: TURDEAN MARINELLA - BAZELE STATISTICII - Manual debv.ucdc.ro/bv/F_1_bazele-statisticii-turdean.pdf · 3 MARINELLA SABINA TURDEAN LIGIA PRODAN BAZELE STATISTICII - Manual de studiu

137

raport între numărul seriilor selectate şi numărul total al seriilor din treapta respectivă;

ri = numărul seriilor extrase în fiecare treaptă. Un exemplu de sondaj în trepte este selecţia teritorială. Prima

treaptă o reprezintă judeţele ţării. În treapta a doua se aleg localităţile din judeţele respective. În treapta a treia se aleg întreprinderi din localităţile alese etc.

- Sondajul în mai multe faze Acest tip de sondaj presupune organizarea unei observări totale

în care se înregistrează un număr redus de caracteristici statistice. În faza a doua se înregistrează un număr mai mic de unităţi statistice, dar programul de observare cuprinde mai multe caracteristici. În a treia fază se înregistrează un număr şi mai mic de unităţi, dar programul de observare urmăreşte caracterizarea şi mai completă a fenomenului studiat. În practică, în funcţie de scopul cercetării prin sondaj trebuie să se aleagă acel tip de selecţie care să asigure cel mai ridicat grad de precizie a rezultatelor fără a depăşi un cost alocat.

9.6 Aplicaţii practice Din colectivitatea de 400 de agenţi ai unei firme de asigurări a fost selectat întâmplător şi nerepetat un eşantion de 10% pentru care se cunosc datele:

Grupe de agenţi după comisionul

încasat (mii lei) Număr de agenţi (persoane)

4,0 – 4,4 2 4,4 – 4,8 7 4,8 – 5,2 14 5,2 – 5,6 9 5,6 – 6,0 5 6,0 – 6,4 3

Total 40 Se cere: a) Să se verifice omogenitatea eşantionului. b) Ştiind că rezultatele se garantează cu o probabilitate de 0,9973 (z = 3), să se estimeze limitele între care se va situa comisionul mediu al unui agent din colectivitatea generală precum şi comisionul total minim şi comisionul total maxim plătit de firmă angajaţilor săi. c) Dacă probabilitatea cu care se garantează rezultatele este de 0,9545 (z = 2), să se reia calculele referitoare la estimarea comisionului mediu al unui agent din colectivitatea generală şi să se comenteze rezultatele. d) Să se determine volumul noului eşantion în condiţiile în care eroarea limită calculată la pct. b) se micşorează cu 20%, respectiv măreşte cu 20%. e) Să se estimeze procentul maxim al agenţilor din colectivitatea generală care au încasat mai mult de 5,2 mii lei, în cazul unei probabilităţi de 0,9973 (z = 3).

Page 138: TURDEAN MARINELLA - BAZELE STATISTICII - Manual debv.ucdc.ro/bv/F_1_bazele-statisticii-turdean.pdf · 3 MARINELLA SABINA TURDEAN LIGIA PRODAN BAZELE STATISTICII - Manual de studiu

138

Rezolvare: a) Calculul comisionului mediu al unui agent pe baza datelor din eşantion

Grupe de agenţi după comisionul încasat

(mii lei)

Număr de agenţi (fi) xi xifi i

2

i fxx

4,0 – 4,4 4,4 – 4,8 4,8 – 5,2 5,2 – 5,6 5,6 – 6,0 6,0 – 6,4

2 7 14 9 5 3

4,2 4,6 5,0 5,4 5,8 6,2

8,4 32,2

70 48,6

29 18,6

1,8818 2,2743 0,4046 0,4761 1,9845 3,1827

Total 40 * 06,8 10,204

lei/agentmii5,1740

206,8

f

fxx

i

iis

Calculul dispersiei:

0,255140

10,204

i

i2

i2s

2x f

f)x(xσσ

Calculul abaterii medii pătratice:

0,5050,255140

10,204

i

i2

isx f

f)x(xσσ

Calculul coeficientului de variaţie:

9,76%1005,17

0,505100

x

σv x

v = 9,76 % < 35%, se poate afirma că seria de date este omogenă şi media 5,17 mii lei/agent este reprezentativă. b) Calculul erorii limită maxim admisibilă

0,227400

401

40

0,25513

N

n1

n

σzzμΔ

2s

xx

Estimarea comisionului mediu al unui agent din colectivitatea generală:

5,397x 4,943

272,05,17x227,017,5

x xx

0

0

xs0xs

Estimarea comisionului total minim şi a comisionului total maxim:

)xN(x)x(N xs

400

1iixs

Comisionul total minim:

leimii1977,24,943400)ΔxN( xs

Comisionul total maxim:

leimii2158,85,397400)ΔxN( xs

c) Pentru p = 0,9545, z = 2

151,0400

401

40

2551,02

N

n1

nz

2

x

Page 139: TURDEAN MARINELLA - BAZELE STATISTICII - Manual debv.ucdc.ro/bv/F_1_bazele-statisticii-turdean.pdf · 3 MARINELLA SABINA TURDEAN LIGIA PRODAN BAZELE STATISTICII - Manual de studiu

139

5,321x 5,019

151,05,17x151,017,5

x xx

0

0

xs0xs

Dacă probabilitatea cu care se garantează rezultatele scade, eroarea limită se micşorează şi prin urmare şi intervalul de încredere pentru medie se va micşora.

d) Determinarea volumului noului eşantion

agenti60

400

2551,03)1816,0(

2551,03'n

N

z)(

z'n

N

'n1

'nz

1816,0227,08,08,0

227,0

22

2

2s

22'

x

2s

22s'

x

x'x

x

Dacă eroarea limită se micşorează, intervalul de încredere pentru medie se micşorează şi volumul eşantionului va fi mai mare.

agenti29

400

2551,03)2724,0(

2551,03

N

2z)(

z''n

2724,0227,02,12,1

0,227

40n60'n

22

2

2s2''

x

2s

2x

''x

x

Dacă eroarea limită se măreşte, intervalul de încredere pentru medie va fi mai mare şi numărul necesar de unităţi pentru eşantion poate fi mai mic.

40 n29''n

e) 425,040

17

n

mw sau 42,5% dintre agenţii din eşantion au încasat comisioane peste 5,2 mii lei.

%7,64%2,22%5,42p

222,0400

401

40

)425,01(425,03

N

n1

n

)w1(wZz

wp

max

ww

wmax

Se poate afirma că cel mult 64,7%, respectiv 259 de agenţi din totalul agenţilor firmei de asigurări au încasat un comision mai mare de 5,2 mii lei.

4,943 5,019 0x 5.321 5,397

p = 0,9545

p = 0,9973

Page 140: TURDEAN MARINELLA - BAZELE STATISTICII - Manual debv.ucdc.ro/bv/F_1_bazele-statisticii-turdean.pdf · 3 MARINELLA SABINA TURDEAN LIGIA PRODAN BAZELE STATISTICII - Manual de studiu

140

9.7 Îndrumar pentru autoverificare

9.7.1 Sinteza unităţii de studiu Cercetarea prin sondaj este o metodă statistică de cunoaştere a unei populaţii pe baza datelor

înregistrate numai asupra unei părţi reprezentative numită eşantion (mostră). Cercetarea prin sondaj a unităţilor colectivităţii îşi atinge scopul doar în cazul în care rezultatele

obţinute în urma prelucrării datelor din eşantion pot fi extinse/generalizate la nivelul întregii populaţii din care a fost extras eşantionul.

Datorită numărului mic de unităţi statistice studiate, cercetarea parţială prezintă următoarele avantaje în raport cu cercetarea totală:

un volum mai redus de cheltuieli; operativitate ridicată; erori de înregistrare mai puţin frecvente şi mai uşor de înlăturat în diferite faze de verificare a

datelor; caracterizarea mai aprofundată a fenomenului studiat deoarece în programul observării prin

sondaj poate fi cuprins un număr mai mare de caracteristici statistice. Cercetării prin sondaj îi este specifică utilizarea unor noţiuni perechi care au acelaşi conţinut metodologic dar

diferă din punct de vedere al informaţiei cuprinse: Colectivitatea generală şi colectivitatea de selecţie Valori de sondaj şi parametri,

Relaţiile de calcul pentru valorile statistice de sondaj (valori statistice calculate) precum şi a parametrilor populaţiei sunt redate în tabelul de mai jos.

Valorile statistice de sondaj şi parametrii populaţiei

Denumirea indicatorului Media Dispersia

Caracteristica nealternativă

Colectivitatea generală

N

xx

N

1ii

o

N

xxN

1i

2

i2o

o

Colectivitatea de selecţie

n

xx

n

1ii

s

n

xxn

1i

2

i2s

s

Caracteristica alternativă

Colectivitatea generală N

Mp p1p2

p

Colectivitatea de selecţien

mw w1w2

w

Planul cercetării prin sondaj presupune extragerea şi observarea unui număr limitat de unităţi

statistice aparţinătoare unei colectivităţi statistice pe care dorim să o cunoaştem. Pentru a cunoaşte colectivitatea, informaţiile rezultate cu acest prilej trebuie să fie utile şi suficient de precise.

Etapele planului de cercetare prin sondaj sunt:

Page 141: TURDEAN MARINELLA - BAZELE STATISTICII - Manual debv.ucdc.ro/bv/F_1_bazele-statisticii-turdean.pdf · 3 MARINELLA SABINA TURDEAN LIGIA PRODAN BAZELE STATISTICII - Manual de studiu

141

Procedeele de selecţie sunt: Selecţia aleatoare Selecţia dirijată Selecţia mixtă Tehnicile de selecţie sunt: În funcţie de modul de extragere a unităţilor eşantionului, selecţiile aleatoare pot fi realizate după: procedeul tragerii la sorţi cu variantele:

o procedeul selecţiei repetate (al bilei revenite); o procedeul selecţiei nerepetate (al bilei nerevenite).

procedeul selecţiei mecanice cu variantele: o procedeul tabelului cu numere întâmplătoare; o procedeul pasului de numere.

Abaterea care există între valorile calculate prin prelucrarea datelor din eşantion şi ceea ce s-ar obţine în urma prelucrării datelor, dacă s-ar fi organizat o observare totală, se numeşte eroare de selecţie.

Erorile întâlnite în cadrul sondajului pot fi: (i) erori comune tuturor tipurilor de observări numite erori de înregistrare şi (ii) erori specifice cercetării prin sondaj numite erori de reprezentativitate.

Erorile de înregistrare pot fi înlăturate în diferitele etape ale controlului statistic. Erorile de reprezentativitate specifice cercetării selective pot fi: (i) erori sistematice şi (ii) erori

întâmplătoare. Erorile de reprezentativitate pot fi calculate ca: (a) erori efective şi (b) erori probabile. Distribuţia normală este de forma unei distribuţii simetrice în care, cea mai mare probabilitate de

apariţie o are acea medie de selecţie care coincide ca valoare cu media colectivităţii generale a cărei eroare efectivă de reprezentativitate este zero. Celelalte valori ale mediei de selecţie se distribuie simetric

1. Enuntarea obiectivelor cercetării

3. Esantionarea 3.1 Stabilirea bazei de sondaj 3.2 Definirea unitatilor de observare / de esantionare

2. Definirea populatiei statistice 2.1 Delimitarea in timp si spatiu a colectivitatii generale 2.2 Verificarea omogenitatii colectivitatii generale

4. Alegerea procedeului de selectie

5.Obsevarea statistica a esantionului

6. Prelucrarea datelor statistice

7. Analiza datelor

8. Inferenta statistica

9. Decizia statistica

Page 142: TURDEAN MARINELLA - BAZELE STATISTICII - Manual debv.ucdc.ro/bv/F_1_bazele-statisticii-turdean.pdf · 3 MARINELLA SABINA TURDEAN LIGIA PRODAN BAZELE STATISTICII - Manual de studiu

142

(de ambele părţi ale mediei ce coincide cu media colectivităţii generale), având probabilităţi bine determinate şi egale pentru aceeaşi eroare/abatere absolută într-un sens sau altul. Probabilităţile de apariţie ale acestor medii de selecţie descresc proporţional şi simetric către capetele distribuţiei, în timp ce erorile de reprezentativitate cresc. Erorile de reprezentativitate sunt exprimate în aceeaşi unitate de măsură ca şi variabila studiată. Pentru ca aceste erori să poată fi comparabile pentru orice variabilă studiată, abaterile absolute se transformă în abateri normale normate după relaţia:

x

0s

σ

xxz

Dacă mediile de selecţie se distribuie după legea normală, înseamnă că şi erorile întâmplătoare de reprezentativitate urmează aceeaşi formă de distribuţie.

Probabilitatea ca media de eşantionare să fie cuprinsă între două limite fixate anticipat (pe baza datelor sondajului), este:

xs0xs zxxzxP

Această probabilitate poate fi determinată cu relaţia:

dze2π

1ΦP

z

z

2

2z

(z)

Coeficientul z este argumentul funcţiei Gauss-Laplace şi se găseşte tabelat Intervalul (

xsxs zσx;zσx ) se numeşte interval de încredere.

Produsul x

z se numeşte eroare limită maxim admisibilă şi se notează cu XΔ .

xΔ = xzσ

Riscul ca media populaţiei, (0

x ), să nu se afle în acest interval se numeşte nivel sau prag de

semnificaţie, se notează cu “α” şi este o valoare complementară a nivelului de încredere. Probabilitatea caracterizează siguranţa cu care se afirmă că intervalul de încredere cuprinde valoarea

mediei populaţiei. Altfel spus, probabilitatea (sau nivelul de siguranţă sau nivelul de încredere) ne arată ce

şanse sunt ca eroarea reală comisă atunci când o valoare 0

x necunoscută este aproximată prin sx să nu

depăşească eroarea limită maxim admisibilă XΔ . În practica cercetărilor selective s-a convenit că nivelul probabilităţii cu care se fac estimările să nu

fie mai mic de 95%. Aceasta înseamnă că şansele de a greşi estimarea nu trebuie să fie mai mari de 5%. Urmărind valorile coeficientului z, se observă că pe măsură ce acestea cresc, (i) creşte şi probabilitatea P = (z), (ii) creşte intervalul de încredere al mediei şi (iii) scade exactitatea cu care se estimează media generală pe baza selecţiei.

Despre eroarea limită, XΔ , se poate afirma că este o mărime variabilă direct proporţională cu probabilitatea utilizată pentru garantarea rezultatelor şi invers proporţională cu exactitatea/precizia rezultatelor.

Tipul de sondaj se stabileşte în funcţie de scopul cercetării, forma de organizare a colectivităţii generale şi gradul de omogenitate al acesteia. Cele mai utilizate tipuri de sondaj sunt:

sondajul aleator simplu; sondajul tipic (stratificat); sondajul de serii.

Pe baza indicatorilor: eroare medie de reprezentativitate, eroare limită şi volumul eşantionului se estimează parametrii colectivităţii generale.

Page 143: TURDEAN MARINELLA - BAZELE STATISTICII - Manual debv.ucdc.ro/bv/F_1_bazele-statisticii-turdean.pdf · 3 MARINELLA SABINA TURDEAN LIGIA PRODAN BAZELE STATISTICII - Manual de studiu

143

INDICATORII DE SELECŢIE PENTRU SONDAJUL SIMPLU REPETAT Indicatori

Tip de caracteristică

Eroarea medie de reprezentativitate

(px

σ;σ )

Eroarea limită ( XΔ ; pΔ )

Volumul eşantionului (n)

Caracteristica nealternativă n

σσ

20

x xx zσΔ 2

x

20

2

Δ

σzn

Caracteristica alternativă n

p)p(1σ

p

p

zσpΔ 2p

2

)(Δ

p)p(1zn

INDICATORII DE SELECŢIE PENTRU SONDAJ SIMPLU NEREPETAT Indicatori

Tip de caracteristică

Eroarea medie de reprezentativitate

(px

; )

Eroarea limită ( xΔ ; pΔ )

Volumul eşantionului (n)

Caracteristica nealternativă

N

n1

n

20

x

xx zσΔ

N

σtΔ

σzn

20

22

x

20

2

Caracteristica alternativă

N

n1

n

p)p(1pσ p

zσpΔ N

p)p(1tΔ

p)p(1zn

22

p

2

Dacă nu se cunoaşte dispersia colectivităţii totale 20σ ( 2

pσ pentru caracteristica alternativă), aceasta

se va înlocui cu 2

sσ ( 2wσ pentru caracteristica alternativa), dispersia colectivităţii de selecţie.

INDICATORII DE SELECŢIE PENTRU SONDAJ TIPIC REPETAT

Indicatori

Tip de caracteristică

Eroarea medie de reprezentativitate

(px

σ;σ )

Eroarea limită ( X ; pΔ )

Volumul eşantionului (n)

Caracteristica nealternativă

n

σσ

2

x xx zσΔ 2

x

22

Δ

σzn

Caracteristica alternativă

n

p)p(1σ

p

p

zσpΔ 2p

2

Δ

p)p(1zn

Page 144: TURDEAN MARINELLA - BAZELE STATISTICII - Manual debv.ucdc.ro/bv/F_1_bazele-statisticii-turdean.pdf · 3 MARINELLA SABINA TURDEAN LIGIA PRODAN BAZELE STATISTICII - Manual de studiu

144

INDICATORII DE SELECŢIE PENTRU SONDAJ TIPIC NEREPETAT Indicatori

Tip de caracteristică

Eroarea medie de reprezentativitate

(px

σ;σ )

Eroarea limită ( XΔ ; pΔ )

Volumul eşantionului (n)

Caracteristica nealternativă

N

n1

n

σσ

2

x xx zσΔ

N

σtΔ

σzn

222

x

22

Caracteristica alternativă

N

n1

n

p)p(1σ

p pp zσΔ N

p)p(1tΔ

p)p(1zn

22

p

2

Dacă nu se cunoaşte media dispersiilor parţiale corespunzătoare colectivităţii totale 2

)p1(p ,

aceasta se va înlocui cu media dispersiilor parţiale din colectivitatea de selecţie 2sσ ( w)w(1 ).

INDICATORII DE SELECŢIE PENTRU SONDAJUL DE SERII REPETAT

IndicatoriTip de caracteristică

Eroarea medie de reprezentativitate

(px

σ;σ )

Eroarea limită ( X ; pΔ )

Volumul eşantionului (r)

Caracteristica nealternativă

r

δσ

2

x xx zσΔ

2x

22

Δ

δzr

Caracteristica alternativă

r

δσ

2p

p pp zσΔ

2p

2p

2

)(Δ

δzr

INDICATORII DE SELECŢIE PENTRU SONDAJUL DE SERII NEREPETAT Indicatori

Tip de caracteristică

Eroarea medie de reprezentativitate

(px

σ;σ )

Eroarea limită ( X ; pΔ )

Volumul eşantionului (r)

Caracteristica nealternativă

1R

rR

r

δσ

2

x xx zσΔ R

δt

R

11Δ

δzr

222

x

22

Caracteristica alternativă

1R

rR

r

δσ

2p

p pp zσΔ R

δt

R

11Δ

δzr

2p

22

p

2p

2

Page 145: TURDEAN MARINELLA - BAZELE STATISTICII - Manual debv.ucdc.ro/bv/F_1_bazele-statisticii-turdean.pdf · 3 MARINELLA SABINA TURDEAN LIGIA PRODAN BAZELE STATISTICII - Manual de studiu

145

9.7.2 Concepte şi termeni de reţinut esantion; colectivitate generala; colectivitate de selectie; inferenta statistica; selectia aleatoare; selectia dirijata; selectia mixta; unitatea de observare; unitatea de esantionare; procedee de esantionare; selectia repetata; selectia nerepetata; eroarea de selectie; erori de inregistrare; erori de reperzentativitate; erori sistematice; erori intamplatoare; erori efective; erori probabile; eroarea medie de reprezentativitate; eroarea limita maxim admisibila; distributia normala; volumul esantionului; intervalul de incredere; media de selectie; media colectivitatii totale;

9.7.3 Întrebări de control şi teme de dezbatere 1. Definiti conceptul esantion. 2. Prezentaţi avatajele utilizarii cercetarii partiale in raport cu cercetarea totala. 3. Care sunt principalele etape ale realizarii unui sondaj statistic? 4. Care este diferenta dintre unitatea de observare si unitatea de esantionare? 5. In ce consta procedeul de inferenta statistica? 6. Enumerati procedeele de esantionare. 7. Prezentati principalele procedee de selectie utilizate in alcatuirea esantioanelor aleatoare. 8. In ce consta procedeul selectiei repetate sau al bilei revenite? 9. Determinarea erorii medii de reprezentativitate, a erorii limite maxim admisibile si a intervalului de

incredere in cazul utilizarii sondajului simplu aleator nerepetat. 10. Prin ce se caracterizeaza distributia normala? 11. Care este nivelul probabilitatii, convenit in practica cercetarilor selective, pentru realizarea

estimarilor? 12. Cum se determina volumul esantionului in cazul sondajului aleator simplu repetat si nerepetat? 13. Cum se determina intervalul de variatie probabil al nivelului totalizat al caracteristicii corespunzator

colectivitatii generale? 14. Cand se aplica sondajul aleator simplu?

Page 146: TURDEAN MARINELLA - BAZELE STATISTICII - Manual debv.ucdc.ro/bv/F_1_bazele-statisticii-turdean.pdf · 3 MARINELLA SABINA TURDEAN LIGIA PRODAN BAZELE STATISTICII - Manual de studiu

146

15. Ce particularitati prezinta sondajul stratificat (tipic)? 16. Cand se utilizeaza sondajul de serii?

9.7.4 Bibliografie:

1. Begu, L.S., (2009), Statistică internaţională –analize comparative, Editura Universitară, Bucureşti 2. Biji, E.M., Lilea, E., Roşca, E., Vătui, M., (2010), Statistică pentru economişti, Editura

Economică, Bucureşti; 3. Duguleană, L., (2012) Bazele statisticii economice, Editura CH Beck, Bucureşti; 4. Francis, A., (2004), Statistică şi matematică pentru managementul afacerilor, Editura Tehnică,

Bucureşti; 5. Săvoiu, Gh., (2011), Statistică pentru afaceri, Editura Universitară, Bucureşti 6. Turdean, M., (2012), Statistica, Editura Pro Universitaria, Bucureşti;