1
MARINELLA SABINA TURDEAN LIGIA PRODAN
BAZELE STATISTICII - Manual de studiu individual -
2
3
MARINELLA SABINA TURDEAN LIGIA PRODAN
BAZELE STATISTICII
- Manual de studiu individual -
4
Copyright © 2012, Editura Pro Universitaria Toate drepturile asupra prezentei ediţii aparţin Editurii Pro Universitaria Nicio parte din acest volum nu poate fi copiată fără acordul scris al Editurii Pro Universitaria
Descrierea CIP a Bibliotecii Naţionale a României TURDEAN, MARINELLA-SABINA Bazele statisticii : manual de studiu individual / Marinella Turdean, Ligia Prodan. - Bucureşti : Pro Universitaria, 2012 Bibliogr. ISBN 978-606-647-306-4
I. Prodan, Ligia
311(075.8)
5
CUPRINS
INTRODUCERE ........................................................................................................................... 8
UNITATEA DE STUDIU 1 NOŢIUNI INTRODUCTIVE ..................................................... 10 1.1 Introducere .................................................................................................................................................. 10 1.2 Obiectivele unităţii de studiu ..................................................................................................................... 10 1.3 Competenţele unităţii de studiu ................................................................................................................. 10 1.4 Timpul alocat unităţii de studiu ................................................................................................................. 11 1.5 Conţinutul unităţii de studiu ...................................................................................................................... 11
1.5.1 Momente ale evoluţiei statisticii ........................................................................................................ 11 1.5.2 Obiectul şi metoda statisticii .............................................................................................................. 12 1.5.3 Noţiuni fundamentale utilizate în statistică ........................................................................................ 13 1.5.4 Rolul statisticii în economie .............................................................................................................. 14
1.6 Îndrumar pentru autoverificare ................................................................................................................ 15
UNITATEA DE STUDIU 2 OBSERVAREA STATISTICĂ .................................................. 18 2.1 Introducere .................................................................................................................................................. 18 2.2 Obiectivele unităţii de studiu ..................................................................................................................... 18 2.3 Competenţele unităţii de studiu: ................................................................................................................ 18 2.4 Timpul alocat unităţii de studiu: ............................................................................................................... 19 2.5 Conţinutul unităţii de studiu ...................................................................................................................... 19
2.5.1 Scopul observării statistice ................................................................................................................ 19 2.5.2 Principiile care stau la baza observării statistice ................................................................................ 19 2.5.3 Planul observării statistice ................................................................................................................. 19 2.5.4 Clasificarea observărilor statistice ..................................................................................................... 20 2.5.5 Erorile observării statistice ................................................................................................................ 22 2.5.6 Controlul datelor statistice ................................................................................................................. 23
2.6 Îndrumar pentru autoverificare ................................................................................................................ 24
UNITATEA DE STUDIU 3 PRELUCRAREA DATELOR STATISTICE ........................... 27 3.1 Introducere .................................................................................................................................................. 27 3.2 Obiectivele unităţii de studiu ..................................................................................................................... 27 3.3 Competenţele unităţii de studiu: ................................................................................................................ 27 3.4 Timpul alocat unităţii de studiu: ............................................................................................................... 28 3.5 Conţinutul unităţii de studiu ...................................................................................................................... 28
3.5.1 Planul prelucrării datelor statistice ..................................................................................................... 28 3.5.2 Centralizarea datelor statistice ........................................................................................................... 28 3.5.3 Metoda grupării ................................................................................................................................. 29
3.6 Aplicaţii practice ......................................................................................................................................... 32 3.7 Îndrumar pentru autoverificare ................................................................................................................ 33
UNITATEA DE STUDIU 4 PREZENTAREA DATELOR STATISTICE ........................... 36 4.1 Introducere .................................................................................................................................................. 36 4.2 Obiectivele unităţii de studiu ..................................................................................................................... 36 4.3 Competenţele unităţii de studiu: ................................................................................................................ 36 4.4 Timpul alocat unităţii de studiu: ............................................................................................................... 37 4.5 Conţinutul unităţii de studiu ...................................................................................................................... 37
4.5.1 Tabelele statistice ............................................................................................................................... 37 4.5.2 Seriile statistice .................................................................................................................................. 42 4.5.3 Reprezentarea grafica a datelor statistice ........................................................................................... 45
4.6 Aplicatii practice ......................................................................................................................................... 51 4.7 Îndrumar pentru autoverificare ................................................................................................................ 52
6
UNITATEA DE STUDIU 5 MĂRIMILE RELATIVE ........................................................... 56 5.1 Introducere .................................................................................................................................................. 56 5.2 Obiectivele unităţii de studiu ..................................................................................................................... 56 5.3 Competenţele unităţii de studiu: ................................................................................................................ 56 5.4 Timpul alocat unităţii de studiu: ............................................................................................................... 57 5.5 Conţinutul unităţii de studiu ...................................................................................................................... 57
5.5.1 Consideraţii generale privind calculul mărimilor relative ................................................................. 57 5.5.2 Tipuri de mărimi relative ................................................................................................................... 58
5.6 Aplicatii practice ......................................................................................................................................... 64 5.7 Îndrumar pentru autoverificare ................................................................................................................ 67
UNITATEA DE STUDIU 6 ANALIZA SERIILOR DE DISTRIBUŢIE I ............................ 70 6.1 Introducere .................................................................................................................................................. 70 6.2 Obiectivele unităţii de studiu ..................................................................................................................... 70 6.3 Competenţele unităţii de studiu: ................................................................................................................ 71 6.4 Timpul alocat unităţii de studiu: ............................................................................................................... 71 6.5 Conţinutul unităţii de studiu ...................................................................................................................... 71
6.5.1 Condiţii de aplicare şi de calcul pentru mărimile medii .................................................................... 71 6.5.2 Media aritmetică ................................................................................................................................ 72 6.5.3 Media armonică ................................................................................................................................. 80 6.5.4 Media pătratică .................................................................................................................................. 81 6.5.5 Media geometrică .............................................................................................................................. 82 6.5.6 Media caracteristicii alternative ......................................................................................................... 83
6.6 Aplicaţii practice ......................................................................................................................................... 85 6.7 Îndrumar pentru autoverificare ................................................................................................................ 87
UNITATEA DE STUDIU 7 ANALIZA SERIILOR DE DISTRIBUŢIE -II ......................... 90 7.1 Introducere .................................................................................................................................................. 90 7.2 Obiectivele unităţii de studiu ..................................................................................................................... 90 7.3 Competenţele unităţii de studiu: ................................................................................................................ 90 7.4 Timpul alocat unităţii de studiu: ............................................................................................................... 91 7.5 Conţinutul unităţii de studiu ...................................................................................................................... 91
7.5.1 Mediana ............................................................................................................................................. 91 7.5.2 Modul (dominanta) ............................................................................................................................ 92 7.5.3 Cuartile .............................................................................................................................................. 93 7.5.4 Decile ................................................................................................................................................. 95
7.6 Aplicaţii practice ......................................................................................................................................... 97 7.7 Îndrumar pentru autoverificare ................................................................................................................ 98
UNITATEA DE STUDIU 8 ANALIZA SERIILOR DE DISTRIBUŢIE III ....................... 101 8.1 Introducere ................................................................................................................................................ 101 8.2 Obiectivele unităţii de studiu ................................................................................................................... 101 8.3 Competenţele unităţii de studiu: .............................................................................................................. 102 8.4 Timpul alocat unităţii de studiu: ............................................................................................................. 102 8.5 Conţinutul unităţii de studiu .................................................................................................................... 102
8.5.1 Consideraţii generale privind calculul indicatorilor variabilităţii .................................................... 102 8.5.2 Indicatorii simpli ai variabilităţii ..................................................................................................... 103 8.5.3 Indicatorii sintetici ai variabilităţii ................................................................................................... 104 8.5.4 Indicatorii variabilităţii pentru o colectivitate împărţită în grupe. Regula adunării dispersiilor ...... 106 8.5.5 Indicatorii de variabilităţii pentru caracteristicile alternative .......................................................... 109 8.5.6 Asimetria şi indicatorii de asimetrie ................................................................................................ 111
8.6 Aplicaţii practice ....................................................................................................................................... 113 8.7 Îndrumar pentru autoverificare .............................................................................................................. 116
7
UNITATEA DE STUDIU 9 CERCETAREA SELECTIVĂ ................................................ 122 9.1 Introducere ................................................................................................................................................ 122 9.2 Obiectivele unităţii de studiu ................................................................................................................... 122 9.3 Competenţele unităţii de studiu: .............................................................................................................. 123 9.4 Timpul alocat unităţii de studiu: ............................................................................................................. 123 9.5 Conţinutul unităţii de studiu .................................................................................................................... 123
9.5.1 Noţiuni utilizate în sondajul statistic................................................................................................ 124 9.5.2 Planul cercetării prin sondaj ............................................................................................................ 125 9.5.3 Procedee de selecţie ......................................................................................................................... 126 9.5.4 Tehnici de selecţie ........................................................................................................................... 127 9.5.5 Erorile cercetării prin sondaj ............................................................................................................ 128 9.5.6 Tipuri de sondaj ............................................................................................................................... 132
9.6 Aplicaţii practice ....................................................................................................................................... 137 9.7 Îndrumar pentru autoverificare .............................................................................................................. 140
8
0 INTRODUCERE
„Knowledge is power” Francis Bacon, 1598
La început de mileniu III, este mai adevărată ca niciodată afirmaţia lui Pitagora de acum 26 de
secole,: “Totul este număr!” Dacă poţi asocia unui fenomen şi o expresie numerică, dovedeşti că ştii ceva despre acel fenomen!
Statistica este ştiinţa şi în acelaşi timp arta culegerii, prelucrării şi analizei datelor cu ajutorul metodelor specifice care se bazează pe gândirea statistică. De exemplu, interpretarea în medie, şi mă refer aici la familiara medie aritmetica, ne permite sa reţinem ceea ce este esenţial şi tipic în diferitele forme individuale de manifestare ale fenomenelor.
Cursul de statistică constituie un suport ştiinţific adecvat pentru studierea fenomenelor sociale şi economice, a regularităţilor în apariţia acestora precum şi pentru determinarea gradului de influenţă a diferiţilor factori care acţionează asupra acestor fenomene.
Sarcina statisticii este de a ne arăta şi apoi de a ne învăţa să practicăm noi moduri de gândire cu scopul de a descrie, de a analiza şi de a înţelege comportamentul colectivităţilor studiate.
În acest context, lucrarea de faţă prezintă succesiv, de la simplu la complex, principalele metode statistice care oferă deprinderea de a raţiona şi de a interpreta logic informaţiile, cu scopul de a fundamenta în deplină concordanţă cunoştinţe-competenţe, deciziile dintr-un anumit domeniu de activitate. Studenţii, viitori economişti, vor şti cum şi când să aplice metodele studiate pentru a susţine argumentat evaluări, idei, ipoteze.
Problematica tratată în următoarele pagini corespunde programei analitice a cursului universitar de „Bazele statisticii”.
Obiectivele cursului Obiectivul cursului “Bazele statisticii” constă în pregătirea studenţilor în domeniul teoriei si
practicii statistice din ţara noastră şi pe plan internaţional. Studenţii vor cunoaşte modul în care se realizează o cercetare statistică, metodele si procedeele de calcul şi analiză a indicatorilor statistici. O atenţie deosebită este acordată interpretării corecte a rezultatelor şi utilizării limbajului de specialitate adecvat.
Competenţe conferite După parcurgerea acestui curs, studentul va dobândi următoarele competenţe specifice:
Competenţe specifice Cunoaştere şi înţelegere -identificarea de termeni, relaţii, procese, perceperea unor relaţii şi conexiuni în cadrul fenomenelor economico- sociale; - utilizarea corectă a termenilor de specialitate din domeniul economic. Explicare şi interpretare - argumentarea unor enunţuri; - capacitatea de organizare şi planificare a activitatilor cuprinse în planul unei cercetări statistice. Instrumental-aplicative - capacitatea de a transpune în practică cunoştinţele dobândite în cadrul cursului; - capacitatea de a concepe proiecte şi de a derula activităţi legate de aspecte statistice ale activităţii economice; - capacitatea de a da soluţii statistice la probleme legate de decizie şi calcule de perspectivă. - prelucrarea electronică a informaţiilor statistice Atitudinale - reacţia pozitivă la sugestii, cerinţe, sarcini didactice, satisfacţia de a răspunde la întrebări,provocări; - implicarea în activităţi de cercetare ştiinţifică; - capacitatea de a aprecia diversitatea analizei; - abilitatea de a colabora cu specialiştii din alte domenii. - capacitatea de a lucra singur sau în echipă;
9
Resurse şi mijloace de lucru Disciplina „Bazele statisticii”dispune de un manual pentru studiul individual al studenţilor, precum
şi de materiale publicate pe Internet sub formă de sinteze, teste de autoevaluare, studii de caz, aplicaţii, necesare întregirii cunoştinţelor practice şi teoretice. Pentru fixarea cunoştinţelor teoretice şi pentru o mai bună înţelegere a aplicaţiilor practice la activităţile de seminar, sunt folosite echipamente audio-video, metode interactive şi participative de antrenare a studenţilor.
Structura manualului Manualul de studiu individual este compus din 9 unităţi de studiu:
Unitatea de studiu 1. Noţiuni introductive (2 ore) Unitatea de studiu 2. Observarea datelor statistice (2 ore) Unitatea de studiu 3. Prelucrarea datelor statistice (2 ore) Unitatea de studiu 4. Prezentarea datelor statistice (4 ore) Unitatea de studiu 5. Mărimile relative (4 ore) Unitatea de studiu 6. Analiza seriilor de distribuţie I - Mărimile medii (2 ore) Unitatea de studiu 7. Analiza seriilor de distribuţie II – Mărimile medii de poziţie (2) Unitatea de studiu 8. Analiza seriilor de distribuţie III – Indicatorii variabilităţii şi
indicatorii de asimetrie (4 ore) Unitatea de studiu 9. Cercetarea selectivă (6 ore)
Teme de control (TC) Temele de control vor avea loc conform calendarului disciplinei şi vor avea următoarele subiecte:
1. Prelucrarea datelor statistice. Reprezentarea grafică a datelor statistice (1 ora) 2. Calculul mărimilor medii şi a indicatorilor variabilităţii (1 ora)
Bibliografie:
1. Anghelache, C., Isaic- Maniu, A., Mitruţ, C., Voineagu, V., Dumbravă , M., (2007), Analiză economică, sinteze şi studii de caz, Editura Economică, Bucureşti;
2. Băcescu- Carbunaru, A., (2009) Statistică- bazele statisticii, Editura Universitară, Bucureşti; 3. Begu, L.S., (2009), Statistică internaţională –analize comparative, Editura Universitară, Bucureşti 4. Biji, M., Biji, E. M., Lilea, E., Anghelache, C., (2002), Tratat de statistică, Editura Economica,
Bucureşti 5. Biji, E.M., Lilea, E., Roşca, E., Vătui, M., (2010), Statistică pentru economişti, Editura
Economică, Bucureşti; 6. Druică, E., (2012), Statistică pe înţelesul tuturor, Editura CH Beck, Bucureşti; 7. Duguleană, L., (2012) Bazele statisticii economice, Editura CH Beck, Bucureşti; 8. Francis, A., (2004), Statistică şi matematică pentru managementul afacerilor, Editura Tehnică,
Bucureşti; 9. Săvoiu, Gh., (2011), Statistică pentru afaceri, Editura Universitară, Bucureşti 10. Turdean, M., (2012), Statistica, Editura Pro Universitaria, Bucureşti; 11. Ţiţan, E., (2012) Statistică – teorie şi aplicaţii în sectorul terţiar, Editura Meteor Press, Bucureşti;
*** Anuarul Statistic al României, 2011, I.N.S. Bucureşti, 2012 Metoda de evaluare: Examenul final se susţine sub formă scrisă, având ca subiect rezolvarea unor probleme. Se va ţine
cont de participarea la activităţile de seminar şi rezultatul la temele de control ale studentului.
10
1 UNITATEA DE STUDIU 1 NOŢIUNI INTRODUCTIVE 1.1 Introducere 1.2 Obiectivele unităţii de studiu 1.3 Competenţele unităţii de studiu 1.4 Timpul alocat unităţii de studiu 1.5 Conţinutul unităţii de studiu
1.5.1 Momente ale evoluţiei statisticii 1.5.2 Obiectul şi metoda statisticii 1.5.3 Noţiuni fundamentale utilizate în statistică 1.5.4 Rolul statisticii în economie
1.6. Îndrumar pentru autoverificare 1.6.1 Sinteza unitatii de invatare 1.6.2 Concepte si termeni de retinut 1.6.3 Întrebări de control şi teme de dezbatere 1.6.4 Bibliografie
1.1 Introducere
Statistica înseamnă pentru multe persoane doar o simplă caracterizare/descriere a unor fenomene pe baza unui set de date sau utilizarea în relaţiile de comunicare a unor indicatori ca: rata şomajului, cursul valutar, cifra medie de afaceri, rata dobânzii, indicele preţurilor de consum, productivitatea muncii etc.
În realitate, statistica ne ajută să obţinem informaţii care să caracterizeze concret şi corect situaţia existentă, să înţelegem raporturile cauză - efect, să oferim o analiză pertinentă a datelor în scopul elaborării unor previziuni credibile şi să luăm deciziile cele mai bune în domeniul în care ne desfăşurăm activitatea.
1.2 Obiectivele unităţii de studiu
– cunoaşterea obiectului de studiu al statisticii; – cunoaşterea şi caracterizarea principalelor momente ale
evoluţiei statisticii; – descrierea principalelor activităţi care caracterizează etapele
unei cercetări statistice; – diferenţierea metodelor statisticii descriptive de metodele
statisticii inferenţiale; – definirea principalelor noţiuni utilizate în limbajul statistic.
1.3 Competenţele unităţii de studiu – studenţii vor putea să definească şi să caracterizeze
obiectul de studiu al statisticii; – studenţii vor putea să definească noţiuni ca: unitate
statistică, caracteristică statistică, colectivitate statistică, date statistice, indicatori statistici, frecvenţă absolută,
11
frecvenţă relativă; – studenţii vor putea prezenta şi caracteriza activităţile care
se desfăşoară în cadrul etapelor unei cercetări statistice; – studenţii vor putea aprecia că cercetarea statistică se axează
pe aspectul cantitativ, măsurabil al fenomenelor, fără să excludă aspectele calitative;
1.4 Timpul alocat unităţii de studiu
Pentru Unitatea de studiu „Noţiuni introductive”, timpul alocat este de 2 ore.
1.5 Conţinutul unităţii de studiu
1.5.1 Momente ale evoluţiei statisticii Principalele momente ale evoluţiei statisticii ca instrument de
cunoaştere a particularităţilor de nivel, volum, structură şi dinamică a fenomenelor şi proceselor economico-sociale sunt:
Activitatea de colectare a datelor Sub accepţiunea de colectare a datelor, statistica este atestată
de peste cinci milenii. Ea servea unor scopuri demografice, militare, administrative şi fiscale. În China, Grecia, Egipt şi teritoriile Imperiului Roman s-au descoperit documente din antichitate care consemnează forme incipiente de evidenţă a numărului şi mişcării populaţiei, a suprafeţei şi fertilităţii terenurilor agricole, a averilor particulare şi veniturilor statului.
Statistica descriptivă Numele acestei faze provine de la concepţia potrivit căreia
statistica se ocupa cu descrierea situaţiei geografice, economice şi politice a unui stat, trecând de la simpla înregistrare de date la analiza comparativă a acestora în timp şi în spaţiu.
Reprezentanţi de seamă ai acestei şcoli sunt: Herman Conrig, Giovanni Batero, Martin Smeitzel, Gottfied Achenwall (care a introdus termenul de “statistică” care derivă din cuvântul latin status, adică situaţie sau stare socială).
Aritmetica politică Numele acestei faze provine de la şcoala aritmeticii politice
apărută în Anglia în a doua jumătate a secolului al XVII-lea. Repre-zentanţii acestei şcoli au fost preocupaţi de găsirea regularităţilor cu care se produc fenomenele sociale şi economice, analizând datele prin procedee matematice. De asemenea, ei au urmărit ca, prin generalizarea informaţiilor obţinute pe baza unui număr mare de cazuri individuale să formuleze previziuni şi să interpreteze tendinţele de producere a fenomenelor economico-sociale. Şcoala aritmeticii politice este reprezentată de lucrările elaborate de William Petty, Edmund Halley şi John Graunt.
Faza probabilistică Progresul din domeniul matematicii, datorat introducerii
12
calculului probabilităţilor, a determinat şi dezvoltarea statisticii, mai ales la sfârşitul secolului al XVIII-lea şi începutul secolului al XIX-lea. Reprezentanţi de seamă ai acestei etape au fost: B.L. Pascal, Fermat, A.I. Quetlet, J. Bonoulli, K.F. Gauss, P.S. Laplace, S.D. Poisson.
Statistica modernă Spre sfârşitul secolului al XIX-lea au apărut primele lucrări de
statistică inductivă. Sunt de remarcat contribuţiile teoretice şi practice ale lui F. Galton, R.A. Fisher, G.U. Yule, K. Pearson, M.G. Kendall, F.Y. Edgeworth, A.L. Bowley, C.E. Spearman, Markov.
1.5.2 Obiectul şi metoda statisticii Pe parcursul evoluţiei în timp, statistica şi-a conturat un obiect
de studiu şi o metodă proprie de cercetare. În accepţiunea de astăzi, statistica este o disciplină ştiinţifică, iar datorită pronunţatului caracter metodologic constituie, în acelaşi timp, şi o metodă de cercetare utilizată de alte discipline ştiinţifice.
Obiectul de studiu al statisticii îl constituie fenomenele de masă care se caracterizează prin faptul că: - se produc într-un număr mare de cazuri; - rezultă din acţiunea combinată a unui număr mare de factori de influenţă care acţionează cu grade de esenţialitate şi intensitate diferite (sunt fenomene complexe); - au forme individuale de manifestare în timp, în spaţiu sau din punct de vedere organizatoric (au un grad mare de variabilitate).
Având în vedere aceste trei principale caracteristici se poate afirma că statistica este ştiinţa colectării şi înţelegerii datelor iar gândirea statistică este orientată spre controlul şi reducerea variaţiei formelor concrete sub care se manifestă fenomenele.
Fenomenele de masă sunt fenomene de tip nedeterminist (sau stohastice) care se supun acţiunii legilor statistice. Aceste legi se manifestă sub formă de tendinţă care poate fi cunoscută şi verificată doar la nivelul ansamblului şi nu pentru fiecare caz în parte. Fenomenele de masă apar asemănătoare între ele, fiind rezultatul acţiunii diferite a aceloraşi factori de influenţă. Pentru un număr suficient de mare de cazuri individuale, utilizând metode specifice, statistica reţine ceea ce este esenţial şi tipic în forma de manifestare a fenomenelor, eliminând ceea ce este neesenţial, astfel încât factorii cu acţiune întâmplătoare se compensează reciproc.
Cercetarea statistică se axează pe aspectul cantitativ, concret, măsurabil al fenomenelor economico-sociale, fără să excludă aspectele calitative.
Procesul cunoaşterii statistice presupune existenţa şi urmărirea unui plan organizatoric şi a unui plan metodologic după care să se desfăşoare activităţile de cercetare propriu-zise.
Etapele cercetării statistice sunt: observarea statistică, prelucrarea datelor statistice, analiza şi interpretarea rezultatelor. În fiecare dintre aceste etape se are în vedere obiectivul, scopul final al demersului ştiinţific, în funcţie de care se enunţă problema în termeni statistici şi i se găseşte rezolvarea cu ajutorul metodelor statistice.
În prezent, o cercetare statistică se desfăşoară în două faze: statistica descriptivă şi statistica inferenţială.
Statistica descriptivă reprezintă totalitatea metodelor de culegere, sistematizare, rezumare şi prezentare a unui set de date referitoare la o colectivitate statistică. Tehnicile utilizate de statistica descriptivă sunt
13
extrem de variate şi au evoluat de-a lungul timpului. Astăzi ne sunt familiare reprezentările grafice pe baza cărora informaţiile culese şi prelucrate sunt accesibile şi uşor de interpretat. Pentru sinteza datelor de masă se utilizează indicatori statistici, cel mai frecvent folosit fiind media aritmetică. Metodele statisticii descriptive reprezintă baza prezentării şi caracterizării cantitative a fenomenelor. Aplicarea statisticii în diferite domenii de cercetare este însă rezultatul dezvoltării metodelor statisticii inferenţiale.
Statistica inferenţială reprezintă totalitatea metodelor care permit estimarea caracteristicilor unei colectivităţi numeroase pe baza datelor obţinute în urma studierii unui eşantion reprezentativ. Generalizarea (extinderea) concluziilor de la eşantion la populaţia statistică are loc în termeni probabilistici cu recunoaşterea şi măsurarea gradului de incertitudine a rezultatelor, dar şi a nesiguranţei predicţiilor/ estimărilor.
1.5.3 Noţiuni fundamentale utilizate în statistică Definiţie Colectivitatea statistică denumită şi populaţie reprezintă
totalitatea cazurilor individuale, de acelaşi fel, formate pe bazainfluenţei aceloraşi cauze esenţiale. Colectivitatea statisticăconstituie obiectul supus cercetării statistice.
Exemple: populaţia României la 27 martie 2002, studenţii anului I, Universitatea Creştină “Dimitrie Cantemir”, anul universitar 2011 - 2012.
Colectivităţile statistice pot fi clasificate în colectivităţi statice sau colectivităţi dinamice.
Colectivităţile statice exprimă o stare şi au o anumită întindere în spaţiu formând un existent (stoc) la un moment dat. Exemplu: populaţia României la 27 martie 2002.
Colectivităţile dinamice exprimă un proces (flux), o devenire în timp. Caracterizarea acestora presupune înregistrarea elementelor componente într-un interval de timp. Exemplu: numărul de născuţi vii în luna august 2011 în judeţul Cluj; valoarea produselor fabricate la întreprinderea Mobexpert în lunile semestrului I, anul 2011.
În cazul colectivităţilor statice, timpul este constant, iar în cazul colectivităţilor dinamice, spaţiul şi forma organizatorică sunt constante.
Definiţie Unitatea statistică reprezintă forma individuală de
manifestare a fenomenului supus cercetării. Unităţile statistice sunt elementele constitutive ale colectivităţii
statistice. Unităţile statistice pot fi: simple sau complexe. Exemple de unităţi statistice simple ar fi: persoana (aparţine populaţiei), studentul (aparţine facultăţii), salariatul (aparţine societăţii comerciale), iar exemple de unităţile statistice complexe ar fi: familia, echipa, secţia, anul de studiu sau orice rezultat al organizării sociale şi economice a societăţii.
Unităţile statistice sunt purtătoare ale unor trăsături variabile în timp şi spaţiu.
Definiţie Caracteristicile statistice reprezintă trăsăturile (însuşirile)
fenomenelor studiate. În literatura de specialitate se mai utilizează expresiile
variabilă statistică sau variabilă aleatoare. Forma concretă de
14
manifestare a unei caracteristici la nivelul unei unităţi a colectivi-tăţii se numeşte variantă sau valoare.
Caracteristicile statistice pot fi clasificate în funcţie de următorele criterii: 1. conţinutul caracteristicii 1.1 de timp - arată apartenenţa unităţilor statistice la un anumit moment sau o perioadă de timp; 1.2 de spaţiu - arata situarea în teritoriu a unităţii statistice; 1.3 atributive - orice caracteristică ce se poate exprima numeric sau prin cuvinte. 2. natura variaţiei caracteristicii 2.1. cu variaţie continuă - pot lua orice valori într-un interval dat; 2.2. cu variaţie discontinuă - caracteristici care nu pot lua decât valori dispuse la anumite intervale 3. modul de obţinere a informaţiei care caracterizează fenomenul 3.1. caracteristici primare - întâlnite la toate unităţile simple ale colectivităţii; 3.2. caracteristici derivate - întâlnite la nivelul unităţilor complexe ale colectivităţii; rezultă prin compararea a doi indicatori primari. 4. numărul variantelor de răspuns 4.1 caracteristici alternative - au doar două variante de răspuns 4.2 caracteristici nealternative - au mai multe variante de răspuns
Definiţie Datele statistice reprezintă caracterizarea numerică a unităţilor,
grupelor şi colectivităţilor studiate. Mesajul datelor îl constituieinformaţia statistică.
Definiţie Indicatorii statistici reprezintă expresia numerică a unor
categorii economice sau sociale definite în funcţie de timp, de spaţiuşi de structură organizatorică.
Indicatorii statistici pot fi clasificaţi în primari sau derivaţi (în funcţie de tipul caracteristicii primară sau derivată) şi în sintetici sau analitici (în funcţie de gradul de cuprindere a fenomenului studiat).Exprimarea numerică a unei categorii economice presupune folosirea mai multor indicatori, fiecare punând în evidenţă mai multe aspecte legate de categoria economică respectivă.
Definiţie Frecvenţa absolută reprezintă numărul de apariţii ale unei
variante într-o colectivitate. Definiţie
Frecvenţa relativă sau greutatea specifică este ponderea unei variante sau a unui grup de variante în totalul elementelor uneicolectivităţi.
1.5.4 Rolul statisticii în economie Indicatorii determinaţi în etapele de observare, prelucrare şi
analiză a datelor se utilizează pentru: cunoaşterea gradului de dezvoltare a economiei naţionale şi a
societăţii în general; stabilirea obiectivelor şi a direcţiilor de dezvoltare pentru viitor; elaborarea programelor de dezvoltare curenta şi de perspectivă; fundamentarea măsurilor ce trebuie luate în procesul decizional;
15
urmărirea modului în care se realizează obiectivele stabilite; popularizarea datelor obţinute; realizarea unor comparaţii internaţionale.
1.6 Îndrumar pentru autoverificare
1.6.1 Sinteza unităţii de studiu
Statistica ne ajută să obţinem informaţii care să caracterizeze concret şi corect situaţia existentă, să înţelegem raporturile cauză - efect, să oferim o analiză pertinentă a datelor în scopul elaborării unor previziuni credibile şi să luăm deciziile cele mai bune în domeniul în care ne desfăşurăm activitatea.
Principalele momente ale evoluţiei statisticii ca instrument de cunoaştere a particularităţilor de nivel, volum, structură şi dinamică a fenomenelor şi proceselor economico-sociale sunt:
activitatea de colectare a datelor statistica descriptivă aritmetica politică faza probabilistică statistica modernă Pe parcursul evoluţiei în timp, statistica şi-a conturat un obiect de studiu şi o metodă proprie de
cercetare. Obiectul de studiu al statisticii îl constituie fenomenele de masă care se caracterizează prin faptul că:
se produc într-un număr mare de cazuri; rezultă din acţiunea combinată a unui număr mare de factori de influenţă care acţionează cu grade
de esenţialitate şi intensitate diferite (sunt fenomene complexe); au forme individuale de manifestare în timp, în spaţiu sau din punct de vedere organizatoric (au un grad
mare de variabilitate). Fenomenele de masă sunt fenomene de tip nedeterminist (sau stohastice) care se supun acţiunii
legilor statistice. Aceste legi se manifestă sub formă de tendinţă care poate fi cunoscută şi verificată doar la nivelul ansamblului şi nu pentru fiecare caz în parte.
Cercetarea statistică se axează pe aspectul cantitativ, concret, măsurabil al fenomenelor economico-sociale, fără să excludă aspectele calitative.
Procesul cunoaşterii statistice presupune existenţa şi urmărirea unui plan organizatoric şi a unui plan metodologic după care să se desfăşoare activităţile de cercetare propriu-zise.
Etapele cercetării statistice sunt: observarea statistică, prelucrarea datelor statistice, analiza şi interpretarea rezultatelor. În fiecare dintre aceste etape se are în vedere obiectivul, scopul final al demersului ştiinţific, în funcţie de care se enunţă problema în termeni statistici şi i se găseşte rezolvarea cu ajutorul metodelor statistice.
În prezent, o cercetare statistică se desfăşoară în două faze: statistica descriptivă şi statistica inferenţială. Noţiunile fundamentale utilizate în statistică sunt:
colectivitatea statistică unitatea statistică caracteristicile statistice datele statistice indicatorii statistici frecvenţa absolută frecvenţa relativă
Indicatorii determinaţi în etapele de observare, prelucrare şi analiză a datelor se utilizează pentru:
16
cunoaşterea gradului de dezvoltare a economiei naţionale şi a societăţii în general; stabilirea obiectivelor şi a direcţiilor de dezvoltare pentru viitor; elaborarea programelor de dezvoltare curenta şi de perspectivă; fundamentarea măsurilor care trebuie luate în procesul decizional; urmărirea modului în care se realizează obiectivele stabilite; popularizarea datelor obţinute; realizarea unor comparaţii internaţionale.
1.6.2 Concepte şi termeni de reţinut
obiectul de studiu al statisticii; fenomene de masă; legi statistice fenomene deterministe şi fenomene nedeterministe observarea statistică prelucrarea datelor statistice analiza şi interpretarea rezultatelor statistica descriptivă, statistica inferenţială colectivitatea statistică unitatea statistică caracteristicile statistice datele statistice, indicatorii statistici frecvenţa absolută, frecvenţa relativă
1.6.3 Întrebări de control şi teme de dezbatere
1. Care sunt principalele momente în evoluţia statisticii? 2. Care este obiectul de studiu al statisticii? 3. Care sunt caracteristicile fenomenelor de masă? 4. Cum se manifestă legile statistice? 5. Care sunt principalele etape ale unei cercetări statistice? 6. Prin ce se caracterizează statistica descriptivă? 7. Prin ce se caracterizează statistica inferenţială? 8. Care este deosebirea dintre date statistice şi indicatori statisticii? 9. Care este deosebirea dintre frecvenţa absolută şi frecvenţa relativă? 10. Ce este colectivitatea statistică? 11. Ce este caracteristica statistică? 12. Definiţi noţiunea de „unitate statistică”. 13. Prezentaţi criteriile de clasificare a caracteristicilor statistice şi tipurile de caracteristici
corespunzătoare acestora. 14. Care este rolul statisticii în economie? 15. Care este indicatorul statistic cel mai frecvent utilizat pentru sinteza datelor de masă?
17
1.6.4 Bibliografie:
1. Băcescu- Carbunaru, A., (2009) Statistică- bazele statisticii, Editura Universitară, Bucureşti; 2. Biji, M., Biji, E. M., Lilea, E., Anghelache, C., (2002), Tratat de statistică, Editura Economica,
Bucureşti 3. Druică, E., (2012), Statistică pe înţelesul tuturor, Editura CH Beck, Bucureşti; 4. Duguleană, L., (2012) Bazele statisticii economice, Editura CH Beck, Bucureşti; 5. Turdean, M., (2012), Statistica, Editura Pro Universitaria, Bucureşti;
18
2 UNITATEA DE STUDIU 2 OBSERVAREA STATISTICĂ 2.1 Introducere 2.2 Obiectivele unităţii de studiu 2.3 Competenţele unităţii de studiu 2.4 Timpul alocat unităţii de invăţare 2.5 Conţinutul unităţii de studiu
2.5.1 Scopul observării statistice 2.5.2 Principiile care stau la baza observării statistice 2.5.3 Planul observării statistice 2.5.4 Clasificarea observărilor statistice 2.5.5 Erorile observării statistice 2.5.6 Controlul datelor statistice
2.6. Îndrumar pentru autoverificare 2.6.1 Sinteza unitatii de invatare 2.6.2 Concepte si termeni de retinut 2.6.3 Întrebări de control şi teme de dezbatere 2.6.4 Bibliografie
2.1 Introducere
Prima etapă a unei cercetări statistice constă în culegerea datelor referitoare la nivelul, structura şi modificările în dinamică ale fenomenelor datorate complexităţii factorilor care acţionează asupra acestora. Observarea statistică se desfăşoară pe baza unor principii şi a unui plan al observării care urmăresc autenticitatea datelor şi prevenirea erorilor de observare.
2.2 Obiectivele unităţii de studiu
– cunoaşterea cadrului general în care se desfăşoară observarea statistică ;
– definirea noţiunii de observare statistică; – cunoaşterea etapelor planului de observare statistică; – clasificarea observărilor statistice; – cunoaşterea erorilor care pot apare în procesul de observare
şi modalităţile de prevenire a acestora; – cunoaşterea modalităţilor de control a datelor statistice
2.3 Competenţele unităţii de studiu:
– studenţii vor putea să definească noţiuni precum observarea statistică, erori de oservare, controlul datelor statistice;
– studenţii vor cunoaşte principalele probleme metodologice şi organizatorice pe care le implică realizarea unui plan de observare statistică;
19
– studenţii vor putea să clasifice observările statistice în funcţie de modul de organizare a observării, modul de caracterizare a fenomenelor observate, după timpul la care se referă datele sau după numărul unităţilor înregistrate
– studenţii vor putea să descrie principalele tipuri de observări statistice
– studenţii vor putea să distingă erorile de observare întâmplătoare de erorile de observare sistematice;
– studenţii vor putea să identifice principalele surse ale erorilor de observare întâmplătoare;
– studenţii vor şti cum pot fi prevenite erorile de observare; – studenţii vor cunoaşte şi vor putea utiliza metode de
control a datelor culese în etapa observării statistice
2.4 Timpul alocat unităţii de studiu:
Pentru unitatea de studiu „Observarea statistică” timpul alocat este de 2 ore.
2.5 Conţinutul unităţii de studiu
2.5.1 Scopul observării statistice Scopul observării statistice este subordonat scopului general
pentru care s-a organizat cercetarea statistică. Statisticianul este interesat de cunoaşterea situaţiei existente în legătură cu: nivelul fenomenului la un moment dat; structura fenomenului la un moment dat; modificările în dinamică privind nivelul şi structura
fenomenului; interdependenţa cu alte fenomene.
Definiţie Observarea statistică este etapa de culegere a informaţiilor
referitoare la aspectele sub care se prezintă fenomenele.
2.5.2 Principiile care stau la baza observării statistice
Principiile care stau la baza observării statistice sunt: 1. Datele culese să fie reale; 2. Datele să se refere la caracteristicile care răspund cel mai bine scopului observării propus; 3. Culegerea datelor să se realizeze în condiţii obiective, fără preferinţe din partea cercetătorilor.
2.5.3 Planul observării statistice
Pentru buna desfăşurare a unei observări statistice trebuie rezolvate probleme cu caracter metodologic şi organizatoric care constituie, de fapt, planul de observare statistică. 2.5.3.1 Problemele metodologice Problemele metodologice se referă la: a) Stabilirea scopului observării, respectiv cunoaşterea situaţiei
20
existente în ceea ce priveşte nivelul şi structura fenomenului la un moment dat, modificările în dinamică, interdependenţele cu alte fenomene. b) Obiectul observării îl formează colectivitatea cercetată, adică mulţimea unităţilor statistice înregistrate împreună cu variabilele (caracteristicile) stabilite. Nu întotdeauna obiectul observării coincide cu obiectul cercetării; în cazul selecţiei se observă doar un eşantion, iar rezultatele cercetării se vor extinde asupra întregii colectivităţi analizate. c) Unitatea de observare (unitatea statistică) trebuie stabilită foarte precis pentru a se obţine date exacte, comparabile în timp şi spaţiu. d) Programul observării constă în: stabilirea caracteristicilor ce trebuie să fie înregistrate, stabilirea modalităţilor concrete de culegere a datelor şi încadrarea în timp şi spaţiu a activităţii de obţinere a informaţiilor. e) Formularele şi instrucţiunile de înregistrare se prezintă sub formă de fişe şi liste. Fişa se completează pentru o singură unitate de observare şi se foloseşte când programul observării este foarte vast sau când unităţile de înregistrat sunt răspândite în teritoriu. Lista este un formular colectiv în care se înregistrează răspunsurile la întrebările din programe pentru mai multe unităţi concentrate în spaţiu. Formularele de înregistrare sunt însoţite de norme metodologice imprimate direct pe formular sau anexate în broşuri separate. f)Timpul observării vizează două aspecte 1) stabilirea timpului la care se referă datele înregistrate şi care poate fi: 1.1) un moment critic - pentru înregistrările care surprind fenomenul în mod static (la începutul sau la sfârşitul unei perioade de timp). Exemple: recensămintele sau inventarele. 1.2) o întreagă perioadă de timp - pentru observările de tip continuu. Exemple: luna, trimestrul, anul. 2) stabilirea timpului când are loc efectiv înregistrarea, adică intervalul/durata înregistrării, care de regulă, este un interval cu date limite precise. g) Locul observării şi unitatea care raportează se stabilesc cu scopul de a găsi/identifica mai uşor unităţile de observare; în general locul observării coincide cu locul unde este amplasat/ se manifestă fenomenul studiat. 2.5.3.2. Probleme organizatorice Problemele organizatorice se referă la asigurarea celor mai bune condiţii pentru desfăşurarea observării propriu-zise şi presupune: studierea materialelor rezultate din cercetări anterioare similare; întocmirea listelor unităţilor de înregistrare, a hărţilor teritoriului; recrutarea şi instruirea personalului pentru culegerea datelor; redactarea şi tipărirea formularelor şi a instrucţiunilor popularizarea acţiunii.
2.5.4 Clasificarea observărilor statistice Observările statistice pot fi clasificate în funcţie de următoarele criterii: 1. modul de organizare a observării 1.1 observări permanente 1.2 observări special organizate 1.2.1 recensământul 1.2.2 observarea selectivă
21
1.2.3 anchetele statistice 1.2.4 monografia statistică
2. timpul la care se referă datele 2.1 observări statistice curente (rapoarte statistice) 2.2 observări statistice periodice 2.3 observări statistice unice (ocazionale) 3. numărul unităţilor înregistrate 3.1 observări statistice totale 3.2 observări statistice parţiale 3.3 observări ale părţii principale 4. modul de caracterizare a fenomenelor observate 4.1 observări statice 4.2 observări dinamice Observările permanente se realizează prin sistemul raportărilor statistice şi au ca principiu autenticitatea datelor. Observările special organizate se utilizează pentru a completa informaţiile statistice obţinute prin observările permanente. Acestea se organizează când fenomenul ce urmează a fi cercetat nu face obiectul unei observări permanente. Recensământul este cea mai veche formă de observare statistică. Termenul provine de la cuvântul latin “census”, care avea semnificaţia de “listă cu starea persoanelor şi a averilor”. Cea mai des întâlnită formă de recensământ este “recensământul populaţiei” împreună cu principalele caracteristici demografice şi socio-economice. Recensământul este o înregistrare totală cu caracter periodic, care urmăreşte cunoaşterea fenomenelor la un moment dat. Pentru buna organizare a unui recensământ se respectă următoarele principii: universalitatea - presupune cuprinderea totalităţii populaţiei
unui teritoriu; simultaneitatea - presupune culegerea informaţiilor de la
unităţile statistice pentru un anumit moment de timp prestabilit în programul observării ;
stabilitatea - se organizează atunci când colectivitatea statistică prezintă o stabilitate maximă din punct de vedere economico-social;
periodicitatea - se organizează, în principiu, o data la 10 ani; comparabilitatea datelor; posibilitatea cuprinderii unui număr mare de caracteristici
în program; caracterul ştiinţific şi aplicativ general al recensământului.
În prezent, există un program mondial al recensămintelor naţionale ale populaţiei şi locuinţelor elaborat încă din 1958 de Comisia de Statistică a O.N.U., care trebuie însă adaptat la principiul de maximă stabilitate a colectivităţilor. Observarea selectivă va fi tratată, pe larg, în capitolul „Cercetarea selectivă” . Ancheta statistică constă în completarea benevolă a unuia sau a mai multor formulare, în mod direct sau transmise prin poştă. Rezultatele anchetelor statistice sunt orientative, deoarece nu se pune condiţia reprezentativităţii unităţilor. Se organizează cu ocazia târgurilor sau a expoziţiilor, pentru a obţine din partea vizitatorilor, eventuali sau viitori consumatori, date referitoare la cererea de mărfuri. Exemple: în prezent, Institutul Naţional de Statistică organizează ancheta“ Forţa de muncă în România – ocupare şi şomaj” (AMIGO), care este o cercetare
22
statistică trimestrială a pieţei forţei de muncă şi “Ancheta integrată în gospodării” (AIG), care urmăreşte reflectarea nivelului de trai şi a condiţiilor de viaţă. Monografia statistică este rezultatul observării statistice a unei singure unităţi statistice complexe (întreprindere, instituţie, localitate, zonă geografică). Ea urmăreşte şi analizează elementele noi apărute în organizarea activităţii economico-sociale din unitatea complexă supusă studiului, elemente despre care se presupune că vor deveni fenomene de masă. O caracteristică specifică monografiei este că munca de cercetare, de la culegerea datelor la interpretarea lor, se face în mod unitar, de către aceeaşi echipă de specialişti. În cadrul observărilor statistice curente (rapoarte statistice), înregistrarea are loc permanent. Exemplu: înregistrarea fenomenelor demografice. Observările statistice periodice se realizează la un anumit interval de timp. Exemplu: recensământul Observările statistice unice (ocazionale) sunt observări speciale care se organizează pentru consemnarea unui eveniment nerepetabil. Observările statistice totale au ca obiectiv culegerea datelor de la toate unităţile statistice. Observările statistice parţiale se mai numesc observări statistice prin sondaj sau selecţii. Acestea se organizează atunci când nu se poate organiza o observare totală, care nu ar fi justificată din punct de vedere a oportunităţii, economicităţii şi condiţiilor de realizare. În aceste cazuri datele se culeg numai pentru o parte a colectivităţii studiate, urmând ca rezultatele să fie extinse la nivelul întregii colectivităţi. Partea colectivităţii supusă observării se numeşte eşantion sau mostră şi trebuie să fie reprezentativă pentru întreaga colectivitate. Observarea părţii principale are loc atunci când se studiază o colectivitate care prezintă variaţii calitative substanţiale de la o grupă la alta, astfel încât unele grupe au o influenţă hotărâtoare în formarea indicatorilor pentru întreaga colectivitate, în timp ce alte grupe au o influenţă nesemnificativă. În acest caz este suficient să se supună observării numai partea principală a colectivităţii şi, cu anumite rezerve, să se caracterizeze întregul ansamblu. Informaţiile culese nu au caracter reprezentativ ci oferă doar o informaţie orientativă asupra tendinţelor ce se manifestă la nivelul întregului ansamblu. Observările statice surprind fenomenele la un moment dat urmărind doar caracterizarea nivelului şi structurii fenomenului studiat. Observările dinamice presupun înregistrarea datelor care se referă la o anumită perioadă de timp şi permit analiza variaţiei produse în volumul şi structura colectivităţilor statistice, dar şi tendinţele de dezvoltare.
2.5.5 Erorile observării statistice Asigurarea autenticităţii datelor constituie principiul de bază al organizării unei observări statistice. Practica observărilor statistice a demonstrat, că se pot produce erori de înregistrare, care sunt cu atât mai numeroase, cu cât cercetarea are o mai mare amploare. Pot fi considerate surse de erori: inconstanţa în timp a unităţii de observare; limitele puterii de observare umană; definirea incompleta a unităţii de observare;
23
imperfecţiuni ale metodelor şi mijloacelor de observare. Definiţie Erorile de observare sunt abateri ale datelor înregistrate de
la mărimea reală (concretă) a caracteristicilor studiate. În funcţie de caracterul lor, erorile de observare pot fi
clasificate în erori întâmplătoare şi erori sistematice.
2.5.5.1. Erorile de observare întâmplătoare Abaterile de la realitate ce se produc, de regulă, în ambele sensuri se numesc erori de observare întâmplătoare. Acestea se pot datora: neînţelegerii întrebărilor, neatenţiei subiectului care se intervievează, faptului că nu-şi amintesc realitatea, interpretării greşite a întrebării, considerentelor de prestigiu, personalităţii anchetatorului care poate influenţa răspunsul; în
cazul în care observarea se referă la un număr suficient de mare de unităţi statistice, aceste erori se pot compensa reciproc.
2.5.5.2. Erorile de observare sistematice Erorile care denaturează realitatea într-un singur sens influenţând rezultatele cercetării, respectiv indicatorii de ansamblu, se numesc erori de observare sistematice. 2.5.5.3. Prevenirea erorilor Prevenirea erorilor are ca scop asigurarea autenticităţii datelor. În procesul de prelucrare statistică, datele îşi pierd individualitatea, iar erorile se vor regăsi în valoarea indicatorilor derivaţi. Prevenirea propriu-zisă a erorilor se face prin: testarea tehnicilor şi formularelor de înregistrare;
instruirea adecvată a personalului, inclusiv pregătire psihologică şi inspecţii de îndrumare pe teren; popularizarea acţiunilor şi formarea convingerilor populaţiei.
2.5.6 Controlul datelor statistice Controlul statistic poate fi direct – de volum, aritmetic şi logic- sau indirect – extern, intern. Controlul statistic de volum urmăreşte completarea integrală a tuturor formularelor. Controlul aritmetic (cantitativ) presupune efectuarea unor operaţii aritmetice prin care se verifică selectiv indicatorii numerici din formulare (totalurile, diferenţele). Controlul logic (calitativ) constă în compararea răspunsurilor primite la două sau mai multe întrebări între care există relaţii de interdependenţă, deci o legătură logică. Controlul logic poate fi efectuat şi pe baza unor întrebări înscrise în formularele de înregistrare tocmai în acest scop. Controlul extern presupune compararea datelor obţinute în urma observării cu date referitoare la fapte, evenimente şi fenomene cunoscute. Controlul intern presupune obţinerea aceloraşi informaţii pe mai multe căi.
24
2.6 Îndrumar pentru autoverificare
2.6.1 Sinteza unităţii de studiu
Scopul observării statistice este subordonat scopului general pentru care s-a organizat cercetarea statistică. Statisticianul este interesat de cunoaşterea situaţiei existente în legătură cu: nivelul fenomenului la un moment dat; structura fenomenului la un moment dat; modificările în dinamică privind nivelul şi structura fenomenului; interdependenţa cu alte fenomene. Observarea statistică este etapa de culegere a informaţiilor referitoare la aspectele sub care se prezintă fenomenele.
Principiile care stau la baza observării statistice sunt: datele culese să fie reale; datele să se refere la caracteristicile care răspund cel mai bine scopului observării propus; culegerea datelor să se realizeze în condiţii obiective, fără preferinţe din partea cercetătorilor.
Pentru buna desfăşurare a unei observări statistice trebuie rezolvate probleme cu caracter metodologic şi organizatoric care constituie, de fapt, planul de observare statistică.
Problemele metodologice se referă la: stabilirea scopului observării, stabilirea obiectului observării. stabilirea unităţii de observare (unitatea statistică) stabilirea programului observării. elaborarea formularelor şi instrucţiunilor de înregistrare stabilirea timpului observării stabilirea locului observării şi a unitatăţii care raportează Problemele organizatorice se referă la asigurarea celor mai bune condiţii pentru desfăşurarea observării propriu-zise şi presupune: studierea materialelor rezultate din cercetări anterioare similare; întocmirea listelor unităţilor de înregistrare, a hărţilor teritoriului; recrutarea şi instruirea personalului pentru culegerea datelor; redactarea şi tipărirea formularelor şi a instrucţiunilor popularizarea acţiunii.
Observările statistice pot fi clasificate în funcţie de următoarele criterii: modul de organizare a observării timpul la care se referă datele numărul unităţilor înregistrate modul de caracterizare a fenomenelor observate
Asigurarea autenticităţii datelor constituie principiul de bază al organizării unei observări statistice. Practica statistică a demonstrat, că se pot produce erori de înregistrare, care sunt cu atât mai numeroase, cu cât cercetarea este de mai mare amploare.
Erorile de observare sunt abateri ale datelor înregistrate de la mărimea reală (concretă) a caracteristicilor studiate.
În funcţie de modul de apariţie, erorile de observare pot fi clasificate în erori întâmplătoare şi erori sistematice.
Controlul statistic poate fi direct – de volum, aritmetic şi logic- sau indirect – extern, intern.
25
2.6.2 Concepte şi termeni de reţinut observarea statistică; principiile observării statistice; tipuri de observări statistice; observări permanente, observări special organizate; observări totale, observări parţiale; observări statice, observări dinamice; eroare de observare erori de observare întâmplătoare şi erori de observare sistematice; controlul datelor statistice
2.6.3 Întrebări de control şi teme de dezbatere 1. Definiţi noţiunea de observare statistică. 2. Care este scopul observărilor statistice? 3. Enumeraţi principiile care stau la baza observării statistice? 4. Enumeraţi problemele metodologice care trebuie rezolvate în cadrul unui plan de observare
statistică. 5. Enumeraţi problemele organizatorice care trebuie rezolvate în cadrul unui plan de observare
statistică. 6. Prezentaţi criteriile de clasificare ale observărilor statistice precum şi tipurile de observări
corespunzătoare acestora. 7. Care sunt principiile de organizare ale recensământului populaţiei? 8. Definiţi noţiunea de eroare de observare. 9. Cum se pot clasifica erorile de observare în funcţie de modul de apariţie? 10. Caracterizaţi pe scurt principalele tipuri de control statistic.
26
2.6.4 Bibliografie:
1. Băcescu- Carbunaru, A., (2009) Statistică- bazele statisticii, Editura Universitară, Bucureşti; 2. Biji, M., Biji, E. M., Lilea, E., Anghelache, C., (2002), Tratat de statistică, Editura Economica,
Bucureşti 3. Druică, E., (2012), Statistică pe înţelesul tuturor, Editura CH Beck, Bucureşti; 4. Duguleană, L., (2012) Bazele statisticii economice, Editura CH Beck, Bucureşti; 5. Turdean, M., (2012), Statistica, Editura Pro Universitaria, Bucureşti;
27
3 UNITATEA DE STUDIU 3 PRELUCRAREA DATELOR STATISTICE 3.1 Introducere 3.2 Obiectivele unităţii de studiu 3.3 Competenţele unităţii de studiu 3.4 Timpul alocat unităţii de invăţare 3.5 Conţinutul unităţii de studiu
3.5.1 Planul prelucrării datelor statistice 3.5.2 Centralizarea datelor statistice 3.5.3 Metoda grupării
3.6 Aplicaţii practice 3.7 Îndrumar pentru autoverificare 3.7.1 Sinteza unitatii de invatare 3.7.2 Concepte si termeni de retinut 3.7.3 Întrebări de control şi teme de dezbatere 3.7.4 Bibliografie
3.1 Introducere
Prelucrarea datelor statistice este a doua etapă a cercetării statistice şi are ca scop: (i) centralizarea şi sistematizarea datelor culese în etapa observării statistice; (ii) calculul sistemului de indicatori statistici care caracterizează numeric fenomenele şi procesele studiate; (iii) prezentarea rezultatelor prelucrării sub formă de repartiţii, serii, tabele şi grafice.
3.2 Obiectivele unităţii de studiu
– prezentarea scopului prelucrării datelor statistice; – prezentarea metodelor de sistematizare a datelor; – prezentarea metodologiei de grupare a datelor; – recunoaşterea diferitelor tipuri de grupări statistice; – cunoaşterea recomandărilor privind realizarea unor grupări
adecvate scopului cercetării statistice – cunoaşterea funcţiilor pe care le îndeplinesc grupările
statistice
3.3 Competenţele unităţii de studiu:
– studenţii vor putea să definească noţiuni precum: planul prelucrării statistice, centralizarea datelor statistice, grupare statistică, grupă omogenă, caracteristică de grupare;
– studenţii vor putea să sistematizeze datele rezultate din observare prin centralizare simplă sau pe grupe;
– studenţii vor putea să identifice acele variabile de grupare
28
care corespund cel mai bine scopului cercetării statistice; – studenţii vor putea identifica şi caracteriza tipurile de
grupări statistice; – studenţii vor avea capacitatea de a aplica metodologia de
obţinere a grupărilor utilizând intervale egale sau inegale de variaţie.
3.4 Timpul alocat unităţii de studiu:
Pentru Unitatea de studiu „Prelucrarea datelor statistice”, timpul alocat este de 2 ore.
3.5 Conţinutul unităţii de studiu
3.5.1 Planul prelucrării datelor statistice Planul prelucrării statistice presupune rezolvarea unor
probleme metodologice – stabilirea caracteristicilor primare şi derivate, alegerea metodelor şi procedeelor de calcul statistic - şi organizatorice – stabilirea locului prelucrării şi a timpului aferent acestei operaţiuni, modul de transmitere a rezultatelor prelucrării
3.5.2 Centralizarea datelor statistice Centralizarea datelor statistice are ca scop obţinerea unei imagini
de ansamblu asupra fenomenului studiat. Definiţie Centralizarea datelor constă în strângerea la locul prelucrării a
tuturor informaţiilor şi apoi în determinarea indicatorilor totalizatoripentru toate caracteristicile însumabile direct sau care admit uncoeficient de echivalenţă.
Indicatorii totalizatori se mai numesc indicatori absoluţi şi au
unităţi de măsură concrete - tone, hectare, lei, metri. Aceşti indicatori constituie baza informaţională a cunoaşterii statistice şi sunt urmăriţi statistic la toate structurile organizatorice ale economiei naţionale. Centralizarea datelor poate fi: (1) simplă şi (2) pe grupe.
3.5.2.1. Centralizarea simplă Centralizarea simplă presupune agregarea valorilor
individuale ale caracteristicilor pentru toate unităţile colectivităţii, care permit însumarea (din punct de vedere al conţinutului indicatorului). În acest mod se obţin indicatorii totalizatori. Prin centralizare simplă se obţin informaţii privind numărul/volumul unităţilor care compun colectivitatea, dar şi alte informaţii generale necesare în prelucrarea datelor.
Nivelul totalizat al caracteristicii nu este suficient pentru studierea colectivităţii. Este foarte important să cunoaştem nivelul totalizat pe subcolectivităţile omogene din punct de vedere al caracteristicii de grupare. Exemplu: în cazul recensământului populaţia a fost grupată (1) pe judeţe, (2) pe categorii socio-profesionale, (3) în funcţie de sex, (4) vârstă, (5) naţionalitate (5) religie.
29
3.5.2.2. Centralizarea pe grupe Centralizarea pe grupe constă în gruparea datelor şi
calcularea indicatorilor totalizatori parţiali pe fiecare grupă, iar pe baza lor a indicatorilor totalizatori generali corespunzători întreagii colectivităţi. Centralizarea pe grupe presupune sistematizarea şi pregătirea datelor obţinute în timpul observării statistice în vederea aplicării metodelor şi procedeelor de calcul şi analiza statistică. Pe baza sistematizării informaţiilor prin centralizare simplă sau pe grupe, se poate emite ipoteza existenţei sau inexistenţa unei eventuale legături statistice între variabilele înregistrate.
3.5.3 Metoda grupării 3.5.3.1. Noţiuni introductive Metoda grupării este metoda de bază utilizată în prelucrarea
datelor statistice: Metoda grupării statistice presupune împărţirea unităţilor
statistice în grupe omogene în funcţie de variaţia uneia sau a mai multor caracteristici care se numesc factori de grupare.
În procesul prelucrării datelor, metoda grupării se utilizează pentru:
i. sistematizarea şi omogenizarea datelor obţinute în cadrul observării statistice;
ii. evidenţierea structurii unei colectivităţi la un moment dat sau într-o anumită perioadă, precum şi a mutaţiilor produse în timp şi/sau spaţiu;
iii. stabilirea interdependenţelor, respectiv a formei legăturilor dintre fenomene;
iv. evidenţierea relaţiilor cauză - efect. Definiţie Caracteristica de grupare este acea variabilă faţă de care
unităţile colectivităţii sunt repartizate în grupe distincte, cât mai omogene.
Definiţie Grupa omogenă este clasa de unităţi statistice în interiorul căreia
variaţia caracteristicii este minimă. Definiţie
Variabilitatea este proprietatea / însuşirea / capacitatea caracteristicii statistice de a înregistra mai multe valori numerice sau forme de manifestare.
Definiţie Amplitudinea variaţiei reprezintă câmpul de împrăştiere a
valorilor individuale ale unei caracteristici
Amplitudinea variaţiei se calculează conform relaţiei: A = xmax - xmin
unde: A = amplitudinea variaţiei; xmax = valoarea maximă a caracteristicii; xmin = valoarea minimă a caracteristicii
3.5.3.2. Clasificarea grupărilor Grupările statistice se pot clasifica în funcţie de următoarele
criterii 1. numărul caracteristicilor 1.1. grupări simple 1.2. grupări combinate
30
2. conţinutul caracteristicilor 2.1. grupări cronologice 2.2. grupări teritoriale 2.3. grupări după o caracteristică atributivă forma de exprimare a caracteristicii atributive 2.3.1. grupări calitative (exprimate prin cuvinte) 2.3.2. grupări cantitative (exprimate numeric) tipul variaţiei caracteristicii cantitative 2.3.2.1. grupări pe variante 2.3.2.2. grupări pe intervale amplitudinea variaţiei caracteristicii de grupare 2.3.2.2.1. grupări pe intervale egale
2.3.2.2.2. grupări pe intervale neegale 1.1. În cazul grupării simple repartizarea unităţilor statistice
din colectivitatea generală are loc în funcţie de variaţia unei singure caracteristici. Pe baza grupărilor simple se pot stabili frecvenţele corespunzătoare fiecărei grupe, valorile centralizate pentru caracteristica de grupare, dar şi pentru celelalte caracteristici care au fost urmărite în procesul de observare statistică. Grupările simple se prezintă în tabele simple.
1.2. În cazul grupării combinate repartizarea unităţilor statistice din colectivitatea statistică are loc în funcţie de două sau mai multe caracteristici. Metodologia obţinerii grupărilor combinate constă iniţial, în separarea unităţilor statistice în mai multe grupe în funcţie de variaţia primei caracteristici, iar apoi fiecare grupă se separă pe subgrupe în funcţie de variaţia celei de-a doua caracteristici, ş.a.m.d. Grupările combinate se prezintă în tabele combinate.
Grupările cronologice şi teritoriale sunt determinate de condiţiile obiective de timp şi spaţiu în care se produc fenomenele.
2.1. Nu orice înşiruire de date după variabila timp poate fi asimilată unei grupări cronologice. Timpul trebuie să determine o structurare calitativă a colectivităţii pentru a corespunde principiilor grupării statistice. Exemplu: gruparea societăţilor comerciale din judeţul Cluj, după anul înfiinţării.
2.2. Grupările teritoriale sunt utilizate pentru a separa unităţile colectivităţii pe grupe după criteriul “spaţiu”. În scopul obţinerii unei grupări teritoriale, trebuie ca variaţia în spaţiu să constituie o caracteristică determinantă pentru datele care se grupează. Exemple: grupări teritorial-administrative, grupări pe zone geografice, grupări pe regiuni.
2.3. Gruparea după o caracteristică atributivă constă în repartizarea unităţilor colectivităţii în funcţie de trăsăturile specifice ale acestora. Grupările atributive se folosesc pentru toate caracteris-ticile care au fost cuprinse în programul observării, în afara caracteristicilor de timp şi de spaţiu. Ele pot fi caracteristici cantitative (numerice) sau caracteristici calitative (nenumerice). Exemple de caracteristici atributive pentru gruparea populaţiei ar fi: vârsta, starea civilă, profesia, ocupaţia.
2.3.1. Grupările calitative, adică cele realizate după o caracteristică atributivă exprimată prin cuvinte (exemple: clasificări ale economiei naţionale, nomenclatorul profesiilor din economie) sunt cele mai omogene, deoarece în aceeaşi grupă se includ unităţi care, din punct de vedere a caracteristicii de grupare nu prezintă variaţie. Exemplu: grupa frezorilor, din punct de vedere a denumirii meseriei grupa este omogenă, dar poate prezenta o
31
variaţie statistică în funcţie de alte caracteristici cum ar fi: vârsta, vechimea în muncă, gradul de îndemânare.
2.3.2. Grupările după caracteristici atributive exprimate numeric se mai numesc grupări cantitative. Ele pot avea variaţie discretă (variante, tipuri) sau variaţie continua (variaţie pe intervale).
2.3.2.1. Grupările pe variante se întâlnesc, atunci când caracteristica statistică are variaţie discretă, amplitudinea variaţiei este foarte mică şi practic se înregistrează un număr mic de valori distincte, fiecare valoare fiind, de fapt o grupă. Exemple: gruparea familiilor în funcţie de numărul de membri, gruparea locuinţelor în funcţie de numărul de camere, gruparea studenţilor în funcţie de nota obţinută la examen.
2.3.2.2. Grupările pe intervale se constituie atunci când gradul de variaţie a caracteristicii este mare, deci gruparea pe variante ar conduce la un număr foarte mare de clase. Intervalul de variaţie constă într-un număr de variante despărţit de restul colectivităţii prin două limite - inferioară şi superioară. Exemple: grupe de angajaţi în funcţie de mărimea salariului, grupe de societăţi comerciale în funcţie de mărimea profitului.
2.3.2.2.1. Grupările pe intervale egale se utilizează atunci când amplitudinea variaţiei caracteristicii este moderată şi permite alegerea unei mărimi egale a intervalelor, astfel că numărul grupelor să nu modifice forma de variaţie a respectivei caracteristici.
2.3.2.2.2. Grupările pe intervale neegale se utilizează atunci când amplitudinea variaţiei este foarte mare sau pentru grupări tipologice. Exemplu: gruparea agenţilor economici în mici, mijlocii şi mari în funcţie de cifra de afaceri, profit sau valoarea capitalului fix.
3.5.3.3. Metodologia de obţinere a grupărilor Obţinerea grupărilor presupune parcurgerea următoarelor etape:
1.Calculul amplitudinii variaţiei: A = xmax - xmin 2. Stabilirea numărului de grupe “k” în funcţie de: (a) numărul de unităţi înregistrate, (b) câmpul de împrăştiere a variantelor, (c) experienţa specialistului, (d) scopul observării statistice. 3. Stabilirea mărimii intervalului de grupare (h) prin raportarea amplitudinii variaţiei (A) la numărul de grupe (k), conform relaţiei:
k
Ah
Când nu se cunoaşte numărul de grupe, mărimea intervalului de grupare poate fi determinată şi cu ajutorul formulei lui H. A. STURGES:
nlog322.31minxmaxx
h
unde: n = numărul unităţilor observate. 4. Stabilirea limitelor grupelor se realizează pornind de la valoarea minimă înregistrată la care se adaugă mărimea intervalului de grupare sau pornind de la valoarea maximă înregistrată din care se scade mărimea intervalului de grupare. 5.Repartizarea unităţilor statistice pe grupe În cazul în care numărul unităţilor statistice este suficient de mare, limita inferioară a primului interval poate fi cu câteva unităţi
32
mai mică decât valoarea minimă înregistrată sau limita superioară a ultimului interval, cu câteva unităţi mai mare decât valoarea maximă înregistrată, astfel încât adăugând sau scăzând mărimea intervalului de grupare, cifra unităţilor valorilor care reprezintă limitele intervalelor să fie “0” sau “5”. Astfel, repartizarea unităţilor statistice pe fiecare interval va fi mai uşor de realizat.
Pentru realizarea grupărilor statistice se recomandă următoarele:
1. Dacă gruparea s-a realizat pentru sistematizarea datelor cu scopul unei prelucrări ulterioare corespunzătoare, se recomandă ca numărul de grupe să fie mare şi intervalele de grupare să fie egale.
2. Dacă prin grupare se urmăreşte caracterizarea structurii colectivităţii şi a modificărilor survenite în timp, este indicată utilizarea unui număr redus de grupe şi a intervalelor neegale.
3. Numărul de grupe trebuie să fie suficient de mare pentru a oferi informaţii cât mai analitice în vederea caracterizării colectivităţii.
4. Intervalele de grupare stabilite trebuie să permită regruparea datelor sau desfacerea unui interval în alte două intervale.
5. Nici o unitate statistică să nu rămână în afara grupării. 6. Să se evite frecvenţele absolute (sau relative) mici, cu scopul
reducerii la minim a rezultatului acţiunii factorilor întâmplători. 7. Să se evite asimetria pronunţată. 8. Dacă din calcul, rezultă un număr zecimal, mărimea
intervalului se rotunjeşte în funcţie de scopul urmărit. 9. Intervalele deschise ale grupărilor sunt acele intervale în
care sunt omise limita inferioara a primului interval (exemplu: “sub 100”) sau limita superioară a ultimului interval (exemplu: “peste 1000”). Dacă în scopul unor operaţiuni de prelucrare a datelor, este necesară închiderea intervalului, se procedează astfel: atunci când este omisă limita inferioară a primului interval se va scădea din limita lui superioară mărimea intervalului următor, iar când nu există limita superioară pentru ultimul interval se adună la limita inferioară a acestuia mărimea intervalului precedent. La nevoie, primul şi ultimul interval se pot închide în funcţie de mărimea intervalelor vecine.
10. Dacă limita superioară a fiecărui interval se repetă ca limita inferioară a intervalului următor, (specific caracteristicilor continue) se menţionează, într-o notă la subsolul tabelului, modul de includere a limitelor în interval (de exemplu: *limita inferioară/superioară cuprinsă în interval).
Ca sinonim pentru noţiunea de “grupă” se utilizează termenul “clasă”.
3.6 Aplicaţii practice Pentru un eşantion de 30 de clienţi ai unei bănci s-au înregistrat datele privind creditul primit în mii euro: 31; 33; 29; 32; 30; 35; 32; 28; 33; 30; 35; 36; 30; 34; 32; 37; 33; 39; 30; 33; 32; 34; 33; 35; 37; 34; 36; 35; 38; 33. Să se grupeze cei 30 de clienţi după creditul primit pe şase grupe cu intervale egale de variaţie.
33
Rezolvare: Algoritmul de grupare a datelor obţinute din observarea statistică: 1. A = xmax – xmin = 39 – 28 = 11 2. k = 6 grupe
3. stabilirea mărimii intervalului de grupare h = 26
11
k
A
4. stabilirea intervalelor de grupare Varianta I
pe baza valorii minime înregistrate Varianta a II-a
pe baza valorii maxime înregistrate [28 – 30) [30 – 32) [32 – 34) [34 – 36) [36 – 38) [38 – 40)
(27 – 29] (29 – 31] (31 – 33] (33 – 35] (35 – 37] (37 – 39]
*limita inferioară cuprinsă în interval *limita superioară cuprinsă în interval 5. repartizarea unităţilor statistice pe grupe Vom lucra în continuare, cu datele grupate pe baza valorii minime înregistrate.
Nr.crt.
Grupe de clienţi după nivelul creditului (mii
euro)
Nivelul caracteristicii înregistrate
Număr de clienţi
fi
Structura clienţilor fi* (%)
0 1 2 3 1 [28 – 30) 28,29 2 6,7 2 [30 – 32) 30,30, 30, 30,31 5 16,7 3 [32 – 34) 32,32,32,32,33,33,33,33,33,33 10 33,3 4 [34 – 36) 34,34,34,35,35,35,35 7 23,3 5 [36 – 38) 36,36,37,37 4 13,3 6 [38 – 40) 38,39 2 6,7
Total 30 100
3.7 Îndrumar pentru autoverificare
3.7.1 Sinteza unităţii de studiu
Prelucrarea datelor statistice are ca scop: centralizarea şi sistematizarea datelor culese în etapa observării statistice; calculul sistemului de indicatori statistici care caracterizează fenomenele şi procesele; prezentarea rezultatelor prelucrării sub formă de repartiţii, serii, tabele şi grafice. Planul prelucrării statistice presupune rezolvarea unor probleme metodologice – stabilirea
caracteristicilor primare şi derivate, alegerea metodelor şi procedeelor de calcul statistic - şi organizatorice – stabilirea locului prelucrării şi a timpului aferent acestei operaţiuni, modul de transmitere a rezultatelor prelucrării
Centralizarea datelor statistice are ca scop obţinerea unei imagini de ansamblu asupra fenomenului studiat. Centralizarea datelor constă în strângerea la locul prelucrării a tuturor informaţiilor şi apoi în
34
determinarea indicatorilor totalizatori pentru toate caracteristicile însumabile direct sau care admit un coeficient de echivalenţă
Centralizarea simplă presupune agregarea valorilor individuale ale caracteristicilor pentru toate unităţile colectivităţii. În acest mod se obţin indicatorii totalizatori..
Centralizarea pe grupe constă în gruparea datelor şi calcularea indicatorilor totalizatori parţiali pe fiecare grupă, iar pe baza lor a indicatorilor totalizatori generali corespunzători întreagii colectivităţi.
Metoda grupării este metoda de bază utilizată în prelucrarea datelor statistice: Metoda grupării statistice presupune împărţirea unităţilor statistice în grupe omogene în funcţie de
variaţia uneia sau a mai multor caracteristici care se numesc factori de grupare. În procesul prelucrării datelor, metoda grupării se utilizează pentru:
Grupările statistice se pot clasifica în funcţie de următoarele criterii: numărul caracteristicilor conţinutul caracteristicilor forma de exprimare a caracteristicii atributive tipul variaţiei caracteristicii cantitative amplitudinea variaţiei caracteristicii de grupare Obţinerea grupărilor presupune parcurgerea următoarelor etape: Calculul amplitudinii variaţiei: Stabilirea numărului de grupe “k” în funcţie de: (a) numărul de unităţi înregistrate, (b) câmpul de
împrăştiere a variantelor caracteristicii, (c) experienţa specialistului, (d) scopul observării statistice.
Stabilirea mărimii intervalului de grupare (h) prin raportarea amplitudinii variaţiei (A) la numărul de grupe (k);
Stabilirea limitelor grupelor se realizează pornind de la valoarea minimă înregistrată la care se adaugă mărimea intervalului de grupare sau pornind de la valoarea maximă înregistrată din care se scade mărimea intervalului de grupare.
Repartizarea unităţilor statistice pe grupe
3.7.2 Concepte şi termeni de reţinut planul prelucrării statistice; centralizarea datelor statistice; centralizarea simplă şi pe grupe; gruparea datelor statistice; caracteristică de grupare interval de grupare grupă omogenă amplitudinea variaţiei grupări simple, grupări combinate; grupări cronologice, grupări teritoriale, grupări în funcţie de o caracteristică atributivă; grupări calitative, grupări cantitative; grupări pe variante, grupări pe intervale; grupări pe intervale egale, grupări pe intervale neegale.
3.7.3 Întrebări de control şi teme de dezbatere 1. Prezentaţi scopul prelucrării datelor statistice.
35
2. În ce constă planul prelucrării datelor statistice? 3. Definiţi noţiuea de centralizare a datelor statistice. 4. În ce constă centralizarea simplă a datelor statistice? 5. În ce constă centralizarea pe grupe a datelor statistice? 6. Definiţi noţiunile „caracteristică de grupare” şi „grupă omogenă”. 7. Definiţi noţiunea „amplitudinea variaţiei”. 8. Prezentaţi criteriile de clasificare a grupărilor statistice şi tipurile de grupări corespunzătoare
acestora. 9. Prezentaţi etapele metodologiei de obţinere a grupărilor. 10. Prezentaţi funcţiile grupării statistice.
3.7.4 Bibliografie:
1. Biji, M., Biji, E. M., Lilea, E., Anghelache, C., (2002), Tratat de statistică, Editura Economica, Bucureşti
2. Biji, E.M., Lilea, E., Roşca, E., Vătui, M., (2010), Statistică pentru economişti, Editura Economică, Bucureşti;
3. Druică, E., (2012), Statistică pe înţelesul tuturor, Editura CH Beck, Bucureşti; 4. Duguleană, L., (2012) Bazele statisticii economice, Editura CH Beck, Bucureşti; 5. Turdean, M., (2012), Statistica, Editura Pro Universitaria, Bucureşti;
36
4 UNITATEA DE STUDIU 4 PREZENTAREA DATELOR STATISTICE 4.1 Introducere 4.2 Obiectivele unităţii de studiu 4.3 Competenţele unităţii de studiu 4.4 Timpul alocat unităţii de studiu 4.5 Conţinutul unităţii de studiu
4.5.1 Tabelele statistice 4.5.2 Seriile statistice 4.5.3 Reprezentarea grafică a datelor statistice
4.6. Îndrumar pentru autoverificare 4.6.1 Sinteza unităţii de studiu 4.6.2 Concepte si termeni de retinut 4.6.3 Întrebări de control şi teme de dezbatere 4.6.5 Bibliografie
4.1 Introducere
Rezultatele prelucrării datelor obţinute în urma observării se prezintă sub formă de: tabele, serii şi grafice, în care relaţiile dintre fenomenele studiate apar într-o succesiune logică corespunzătoare relaţiilor obiective existente între acestea.
4.2 Obiectivele unităţii de studiu
– cunoaşterea modului în care pot fi prezentate rezultatele prelucrării datelor statistice;
– definirea noţiunilor de tabel statistic, serie statistică, reprezentare grafică;
– cunoaşterea avantajelor utilizării metodei grafice; – cunoşterea elementelor unui tabel statistic şi a regulilor după
care se întocmesc tabelele statistice; – cunoaşterea criterilor de clasificare a seriilor statistice; – cunoaşterea proprietăţilor seriilor statistice; – cunoaşterea elementelor unui grafic şi a regulilor după care
se realizează reprezentările grafice.
4.3 Competenţele unităţii de studiu:
– studenţii vor putea să definească noţiuni ca: tabel statistic, serie statistică, reprezentare grafică, repartiţie teoretică, repartiţie empirică;
– studenţii vor putea să prezinte datele prelucrate în tabele construite corect;
– studenţii vor putea să prezinte datele prelucrate sub formă de serii statistice;
– studenţii vor putea să reprezinte grafic corect datele statistice
37
– studenţii vor şti să aleagă reprezentarea grafică cea mai adecvată pentru fenomenul analizat.
4.4 Timpul alocat unităţii de studiu:
Pentru unitatea de învăţare Managementul internaţional – conotaţii conceptuale, timpul alocat este de 4 ore.
4.5 Conţinutul unităţii de studiu
Sistematizarea datelor prin tabele, serii şi grafice permite interpretarea statistică a formelor de manifestare a fenomenelor, precum şi calculul corect al indicatorilor statistici absoluţi şi derivaţi. Cu ajutorul tabelelor, seriilor şi graficelor se pot caracteriza atât grupele unei colectivităţi, cât şi întregul ansamblu.
4.5.1 Tabelele statistice Definiţie Tabelul statistic reprezintă cea mai adecvată formă de
sistematizare şi prezentarea a unui ansamblu de relaţii cantitative despre fenomenele studiate
În rubricile rezultate din intersecţia liniilor paralele, orizontale
şi verticale se înscriu denumiri textuale şi indicatorii obţinuţi prin prelucrare.
Tabelele statistice se utilizează în toate etapele cercetării statistice cu dublu scop: (i) pentru sistematizarea datelor statistice în vederea aplicării procedeelor de calcul ale indicatorilor derivaţi şi (ii) pentru prezentarea rezultatelor cercetării, a indicatorilor absoluţi şi derivaţi obţinuţi în diferite faze ale prelucrării statistice.
4.5.1.1. Elementele tabelului statistic
La construirea unui tabel statistic trebuie să se ţină cont de elementele de conţinut precum şi de elementele ce ţin de forma de prezentare-titlul general, titlurile interioare, reţeaua tabelului, notele explicative.
Elementele de conţinut se referă la colectivitatea statistică supusă cercetării precum şi la ansamblul caracteristicilor pentru care s-a făcut centralizarea datelor permitând astfel caracterizarea statistică a fenomenelor studiate în condiţii specifice de timp şi spaţiu.
Elementele ce ţin de forma de prezentare a tabelului sunt: Titlul general se trece în partea de sus a tabelului, trebuie să
fie scurt, clar, concis, să atragă atenţia asupra relaţiilor ce trebuie analizate în legătură cu colectivitatea statistică şi să precizeze caracteristicile de timp şi de spaţiu la care se refera datele.
Titlurile interioare se înscriu în capetele coloanelor sau ale liniilor şi se referă la caracteristicile studiate.
Reţeaua tabelului este un ansamblu de linii paralele orizontale şi verticale, care generează rubricile în care se înscriu ordonat valorile numerice ale indicatorilor statistici.
38
Pentru o cât mai completă informare, la subsolul tabelului apar notele explicative, în care se precizează sursa de informaţie sau sunt specificate procedeele de culegere şi prelucrare a datelor. 4.5.1.2. Reguli pentru întocmirea tabelelor
Pentru ca un tabel statistic să constituie într-adevăr un mijloc de sistematizare a datelor este necesară respectarea unor reguli referitoare la modul concret de întocmire a acestuia.
1. Un tabel se numeşte “tabel statistic”, atunci când toate rubricile generate de reţeaua tabelului sunt completate cu indicatori statistici. Dacă pentru o grupă nu a existat fenomenul, în rubrica corespunzătoare se trece semnul “-“, iar dacă se ştie că fenomenul a existat, dar lipsesc datele se trece semnul “...”.
2. Tabelele trebuie numerotate pentru a fi mai uşor de identificat în text.
3. Este obligatorie precizarea unităţilor de măsură în care se exprimă indicatorii statistici. Dacă unitatea de măsură este comună pentru toţi indicatorii din tabel, atunci ea se înscrie în afara reţelei tabelului, de obicei, în dreapta, sus, sau în titlul general al tabelului. Dacă unităţile de măsură sunt diferite, atunci pentru fiecare indicator se înscrie respectiva unitate de măsură, sub titlul interior al coloanei sau al rândului.
4. Pentru a localiza cu uşurinţă datele din tabel este necesară numerotarea liniilor şi a coloanelor.
5. Tabelele statistice trebuie să fie uşor de interpretat, de aceea ele trebuie să cuprindă numai informaţii strict necesare caracterizării statistice a fenomenelor studiate.
6. Notele explicative trebuie să prezinte corect sursa de informaţie sau să atragă atenţia asupra modului de culegere sau prelucrare a datelor. 4.5.1.3. Tipuri de tabele statistice 4.5.1.3.1. Tabelul simplu
Tabelul simplu este acel tip de tabel în care se prezintă indicatorii statistici după criteriul cronologic, teritorial sau organizatoric. Se utilizează, de obicei, pentru prezentarea datelor rezultate în urma unei grupări simple. 4.5.1.3.2. Tabelul pe grupe
Tabelul pe grupe se foloseşte când se aplică gruparea simplă în funcţie de o caracteristică de grupare “x” şi se centralizează frecvenţele de apariţie ale diferitelor variante x1, x2, ...xk, precum şi valorile caracteristicilor “y”, “z”, “w”care se află în relaţie de dependenţă faţă de variaţia caracteristicii de grupare “x”.
Tabelul pe grupe poate fi utilizat la: 1. caracterizarea gradului şi a formei de variaţie a caracteristicii
de grupare “x”; 2. interpretarea legăturilor dintre variaţia caracteristicii de
grupare şi variaţia caracteristicilor care formează predicatul tabelului;
3. aplicarea metodelor de calcul ale corelaţiei statistice.
39
Tabelul 4.1.Tabelul pe grupe
Grupe de unităţi în funcţie d variaţia caracteristicii “x”
Numărul unităţilor (fi)
Valorile centralizate ale caracteristicilor
y z w 1 2 3 4 5
x1 xi xk
f1 fi fk
y/x1
y/xi
y/xk
z/x1
z/xi
z/xk
w/x1
w/xi
w/xk
Total
k
1i
if
k
1i
ix/y
k
1i
ix/z
k
1i
ix/w
4.5.1.3.3. Tabelul combinat Tabelul combinat se construieşte când există cel puţin două
caracteristici de grupare “x”- primară şi “y”- secundară. În tabel sunt prezentate frecvenţele valorilor perechi „xy” precum şi valorile centralizate ale variabilelor “z” şi “w” dependente de factorii de grupare.
Tabelul 4.2.Tabelul combinat
Caracteristica primară de grupare “x”
Caracteristica secundară de grupare “y”
Frecvenţele valorilor
perechi “xy”
Valorile centralizate ale caracteristicilor z w
0 1 2 3 4
x1 y1 yi yp
f11
f1j :
f1p
z/x1y1
z/x1yj
z/x1yp
w/x1y1
w/x1yj
w/x1yp
Total grupa 1
p
1j
j1f j
p
1j
1yx/z
p
1j
j1yx/w
xi y1
yi yp
fi1 fij
fip
z/xiy1
z/xiyj
z/xiyp
w/xiy1
w/xiyj
w/xiyp Total grupa i
p
1j
ijf j
p
1j
iyx/z
p
1j
jiyx/w
xk y1
yi yp
fk1
fkj
fkp
z/xky1
z/xkyj
z/xkyp
w/xky1
w/xkyj
w/xkyp
Total grupa k
p
1j
kjf j
p
1j
kyx/z
p
1j
jkyx/w
Total general
k
1i
if
k
1i
ix/z
k
1i
ix/w
40
Tabelul combinat poate fi utilizat la: i. stabilirea gradului şi a formei de variaţie a valorilor caracteristicii primare de grupare “x”, considerată ca o variabila independentă ale cărei nivele de manifestare individuale sunt prezentate în coloana “0”, iar frecvenţele corespunzătoare în rândurile care reprezintă totalurile parţiale pe grupe din coloana “2”. ii. stabilirea gradului şi a formei de variaţie a valorilor caracteristicii secundare de grupare, “y”, condiţionate de valorile caracteristicii “x” ale cărei niveluri de manifestare sunt prezentate în coloana 1, iar frecvenţele corespunzătoare în coloana 2, (frecvenţele valorilor perechi “xy”) iii. caracterizarea legăturilor dintre valorile perechi ale caracteristicilor de grupare (primară şi secundară) şi valorile centralizate ale variabilelor “z” şi “w”. iv. aplicarea metodelor de calcul ale corelaţiei statistice dintre cele patru variabile.
4.5.1.3.4. Tabelul cu dublă intrare Tabelul cu dublă intrare se utilizează atunci când colectivitatea
statistică se împarte pe grupe în funcţie de variaţia unei caracteristici factoriale “x” şi a unei caracteristici rezultative-dependente “y”. In rubricile tabelului sunt centralizează frecvenţele de apariţie ale valorilor perechi “xiyj”.
Tabelul 4.3. Tabelul cu dublă intrare
Valorile caracteristicii dependente „y”
Valorile caracteristicii de grupare “x”
y1 … yj … yp Frecvenţe după
variabila “x”, (ni)
x1 xi
xm
f11 f1j f1p fi1 fij fip fm1 fmj fmp
n1 ni
nm
Frecvenţe după variabila “y”, fj
f1 fj fp Nnfm
1ii
p
1jj
Tabelul cu dublă intrare poate fi utilizat la: i.stabilirea gradului şi a formei de variaţie a valorilor caracteristicii “x”, considerată independent (folosind distribuţia sa marginală);
ii.stabilirea gradului şi a formei de variaţie a valorilor caracteristicii “y”, considerată independent, (folosind distribuţia sa marginală);
iii.stabilirea gradului şi a formei de variaţie a valorilor caracteristicii “x”, condiţionată de valorile caracteristicii “y”;
iv.stabilirea gradului şi a formei de variaţie a valorilor caracteristicii “y”, condiţionată de valorile caracteristicii “x”.
41
Tabelul 4.4.Distribuţia agenţilor economici în funcţie de cifra de afaceri şi
nivelul creditului primit Grupe de agenţi economici după cifra de afaceri (mii lei)
Grupe de agenţi economici dupăvaloarea creditului primit (mii euro) Total 10 - 12 12 - 14 14 - 16 16 - 18 18 - 20
0 1 2 3 4 5 6 10-20 5 5 5 - - 15 20-30 5 10 5 - - 20 30-40 5 5 10 10 - 30 40-50 - - 15 5 - 20 50-60 - - 5 5 5 15 Total 15 20 40 20 5 100
Din tabelul 4.4 se pot extrage următoarele serii de distribuţie
de frecvenţe: câte o serie de distribuţie pentru fiecare din cele două
caracteristici considerate independent una faţă de cealaltă; ele sunt, de fapt, distribuţiile marginale ale valorilor înscrise în capetele rândurilor sau coloanelor;
cinci serii de distribuţie a agenţilor economici după cifra de afaceri, dar condiţionate de creditul primit;
cinci serii de distribuţie a agenţilor economici după creditul primit, dar condiţionate de cifra de afaceri. 4.5.1.3.5. Tabelul de asociere
Tabelul de asociere se utilizează pentru a prezenta legătura dintre două caracteristici alternative.
În cazul acestui tip de tabel există doua variante x1 şi x2 pentru grupele formate pe baza variaţiei caracteristicii factoriale şi două variante y1 şi y2 pentru grupele formate pe baza variaţiei caracteristicii rezultative.
În rubricile tabelului se trec frecvenţele comune ale combinării succesive a valorilor celor doua variante. Numărul total al unităţilor din colectivitatea supusă cercetării se notează cu N.
Tabelul de asociaţie poate fi utilizat şi în cazul în care caracteristicile nealternative se transformă în variabile alternative. Exemplu: angajaţii care au salariul sub şi peste nivelul mediu al salariului pe întreprindere, angajaţi care şi-au îndeplinit sau care nu şi-au îndeplinit normele, etc.
Tabelul 4.5.Tabelul de asociere
y x
y1 y2 Total
x1 a b a + b x2 c d c + d
Total a + c b + d (a + c) + (b + d) = (a + b) + (c + d) =N
Datele din tabelul 4.4. pot fi transpuse într-un tabel de asociere.
42
Tabelul 4.6Distribuţia agenţilor economici după cifra de afaceri şi creditul primit
Grupe de agenţi economici după creditul primit
(mii euro) Grupe de agenţi economici după cifra de afaceri (mii lei)
sub 16
peste 16
Total
sub 40 55 10 65 peste 40 20 15 35 Total 75 25 100
4.5.2 Seriile statistice Seriile statistice sunt rezultatul grupării datelor în funcţie de
una sau mai multe caracteristici de grupare. Definiţie Seria statistică este o corespondenţă între două şiruri de date
statistice: primul şir reprezintă variaţia caracteristicii de grupare, iarcel de-al doilea şir este rezultatul centralizării frecvenţelor de apariţiesau nivelul unei alte caracteristici aflată în corelaţie cu variabilastudiată.
Seria statistică poate fi considerată ca o funcţie matematică în
care valorile centralizate ale frecvenţelor sau valorile centralizate ale caracteristicilor sunt valori dependente “y”, în funcţie de valorile caracteristicii de grupare “x”. 4.5.2.1. Clasificarea seriilor statistice
Seriile statistice pot fi clasificate în funcţie de următoarele criterii: 1. numărul caracteristicilor de grupare 1.1. serii statistice independente (serii unidimensionale) 1.2. serii statistice condiţionate (serii multidimensionale) 2. conţinutul caracteristicilor de grupare 2.1. serii statistice de timp (cronologice, dinamice)
timpul la care se referă datele 2.1.1. serii dinamice de intervale (de fluxuri) 2.1.2. serii dinamice de momente (de stocuri) 2.2. serii statistice de spaţiu (teritoriale) 2.3.serii statistice de distribuţie (de repartiţie)
forma de exprimare a caracteristicii atributive 2.3.1.serii calitative 2.3.2.serii de variaţie
tipul variaţiei caracteristicii de grupare 2.3.2.1.serii de distribuţie pe variante 2.3.2.2.serii de distribuţie pe intervale
gradul de variaţie a caracteristicii de grupare 2.3.2.2.1.serii de distribuţie pe intervale egale 2.3.2.2.2.serii de distribuţie pe intervale neegale
1.1. Seriile statistice independente (serii unidimensionale) rezultă dintr-o grupare simplă pe baza unei singure caracteristici de grupare. 1.2. Seriile condiţionate (multidimensionale) rezultă dintr-o grupare combinată după două sau mai multe caracteristici statistice
43
care se află într-o relaţie de interdependenţă obiectivă. 2.1. Seriile statistice de timp (dinamice) prezintă variaţia unei
caracteristici în funcţie de timp. Din denumirea seriei trebuie să rezulte clar, dacă datele se referă la momente sau perioade de timp pentru a putea stabili relaţii corecte între ele.
2.1.1. Seriile dinamice de intervale (de fluxuri) se caracterizează prin faptul că prezintă valorile unor caracteristici care constituie rezultatul unui fenomen/proces social-economic şi care au sens să fie urmărite pe parcursul unui interval de timp, săptămână, luna, trimestru, an. Exemplu: producţia în unităţi naturale sau valorice, cheltuielile de producţie, numărul căsătoriilor, etc. Termenii unei serii dinamice de intervale se bucură de proprietatea de a fi însumabili, obţinându-se valoarea centralizată a caracteristicii pe întreaga perioada.
2.1.2. Seriile dinamice de momente (de stocuri) se caracterizează prin faptul că prezintă valorile unei caracteristici pentru care are sens măsurarea/determinarea nivelului la un moment dat. Exemplu: numărul de salariaţi, valoarea capitalului fix, stocurile de mărfuri. Specific seriilor dinamice de momente este faptul că termenii acestora nu se însumează direct, deoarece aceasta ar conduce la înregistrări repetate. Caracterizarea statistică pentru întreaga perioadă nu se poate face în acest caz, printr-un indicator totalizator, ci folosind indicatori derivaţi sub formă de mărimi relative sau medii.
2.2. Seriile statistice de spaţiu (sau teritoriale) rezultă prin centralizarea frecvenţelor sau a valorilor caracteristicii studiate în funcţie de variaţia teritorial-administrativă. Seriile teritoriale sunt folosite pentru sistematizarea informaţiilor statistice pe judeţele ţării, pe regiuni, pe ţări sau alte forme teritorial-administrative. Pe baza seriilor teritoriale se poate obţine o ierarhizare a unităţilor teritoriale în funcţie de nivelul caracteristicilor. Seriile statistice teritoriale se întocmesc, de obicei, pentru mai multe caracteristici între care există relaţii de interdependenţă, urmărindu-se variaţia valorilor acestor caracteristici condiţionată de teritoriul pe care au fost înregistrate datele.
2.3. Seriile statistice de distribuţie reprezintă o corespondenţa între valorile (variantele) caracteristicii atributive (calitativă sau numerică) şi frecvenţele unităţilor la care se înregistrează aceeaşi variantă.
2.3.1. In seriile de distribuţie calitative caracteristica atributivă este exprimată în cuvinte. Exemple: distribuţia pe ramuri a economiei naţionale, distribuţii pe forme de proprietate, distribuţii pe profesii.
2.3.2. Seriile de distribuţie în care caracteristica atributivă este exprimată numeric se mai numesc serii de variaţie. 4.5.2.2. Analiza seriilor statistice
Gradul şi forma de variaţie a fenomenelor de masă sunt determinate de modul de asociere a cauzelor esenţiale cu cele întâmplătoare. Astfel, în modul de formare obiectivă a nivelurilor individuale ale unei caracteristici există o oarecare tendinţă de concentrare către unele valori tipice care imprimă seriei o anumită formă de distribuţie (repartiţie). In analiza seriilor statistice se folosesc atât repartiţiile empirice, cât şi repartiţiile teoretice. Prin repartiţie empirică se înţelege seria care s-a obţinut în urma centralizării datelor statistice folosind frecvenţele absolute sau frecvenţele relative. Atunci când se prezintă date cu privire la aceleaşi caracteristici înregistrate pentru colectivităţi asemănătoare
44
distribuite în unităţi de timp diferite sau coexistente în spaţiu, seriile de date obţinute prin centralizarea datelor individuale se apropie ca formă de repartiţie.
Repartiţiile teoretice sunt elaborate pe baza unei ipoteze de repartiţie a frecvenţelor, astfel încât să se poată stabili relaţii matematice bine determinate între valorile variabilei studiate şi frecvenţele lor de apariţie, interpretate ca o funcţie de probabilităţi. Repartiţiile teoretice se caracterizează printr-o serie de parametri care le definesc şi care pot fi utilizaţi în compararea repartiţiilor empirice cu cele teoretice. Proprietăţile repartiţiilor binomială, normală şi Poisson sunt utilizate de statistica social-economică la interpretarea fenomenelor. De asemenea, ele se mai utilizează la interpretarea indicatorilor care caracterizează colectivitatea generală, în cazul în care nu se dispune decât de datele unei observări parţiale.
Analiza seriilor statistice urmăreşte: 1. determinarea valorilor tipice care caracterizează seria
respectiva; 2. determinarea diferenţelor de nivel dintre termenii individuali şi aceste valori tipice cu scopul: interpretării formei şi gradului de variaţie a caracteristicii studiate şi comparării lor în timp şi spaţiu.
În analiza distribuţiilor empirice se ţine cont de unele proprietăţi ale acestora, care se pot întâlni în toate cazurile sau sunt specifice anumitor serii. Principalele proprietăţi ale seriilor statistice sunt: variabilitatea, forma de repartiţie, independenţa (interdependenţa) şi omogenitatea termenilor. 4.5.2.3. Proprietăţile seriilor statistice 1. Variabilitatea termenilor unei serii statistice este consecinţa faptului că fenomenele de masă nu sunt rezultatul acţiunii unei singure cauze, ci al acţiunii combinate a mai multor cauze. Aceste cauze pot avea caracter esenţial sau întâmplător şi acţionează în mod diferit, la nivelul fiecarui caz în parte. 2. Forma de repartiţie. Asupra fenomenelor de masă acţionează în mod diferit cauze esenţiale cu caracter permanent care imprimă fenomenului o dezvoltare sistematică şi cauze neesenţiale a căror acţiune este diferită de la o unitate la alta. Prin urmare, gradul şi forma de variaţie a fenomenelor de masă sunt determinate de modul de asociere a acţiunii cauzelor esenţiale cu cele întâmplătoare, asociere care are loc în mod diferit în funcţie de condiţiile particulare ale fiecărui caz individual. Rezultă de aici, că în modul de formare obiectivă a nivelurilor individuale ale caracteristicii statistice există o tendinţă de concentrare către unele valori tipice care imprimă seriei o anumită formă de repartiţie. 3. Independenţa (interdependenţa). Datorită condiţiilor specifice corespunzătoare fiecărei unităţi de timp şi de spaţiu, care impun de la caz la caz, un alt mod de asociere a cauzelor esenţiale cu cele neesenţiale, valorile înregistrate pentru aceeaşi caracteristică pot fi diferite şi independente una de alta. Independenţa termenilor se întâlneşte în cazul seriilor de repartiţie de frecvenţe sau teritoriale, unde variabila se înregistrează pentru unităţi de observare distincte. Despre interdependenţa termenilor se vorbeşte şi în cazul seriilor cronologice, unde datele se referă la aceeaşi unitate de observare statistică, în succesiunea apariţiei valorilor în timp. 4. Omogenitatea termenilor. Omogenitatea valorilor (termenilor) dintr-o serie statistică apare ca urmare a faptului că, în aceeaşi serie
45
nu se pot prezenta decât date cu privire la aceleaşi fenomene. Altfel spus, datele trebuie să aibă acelaşi conţinut, diferenţiindu-se doar ca nivel sau variante de manifestare. La întocmirea unei serii statistice este necesară verificarea omogenităţii unităţilor purtătoare ale caracteristicii pentru a putea fi supuse în continuare, prelucrării statistice cu scopul obţinerii valorilor sintetice reprezentative. Dacă din analiza statistică reiese că seria nu prezintă omogenitate, se poate spune că populaţia statistică este formată din mai multe tipuri calitative. Prin urmare, seria respectivă poate fi desfăşurată în serii componente. In acest caz este necesară verificarea măsurii în care tendinţa generală de variaţie din seria iniţială se regăseşte în forma de variaţie specifică fiecărei grupe.
4.5.3 Reprezentarea grafica a datelor statistice Utilizarea metodei grafice de prezentare a datelor statistice are
avantajul de a reda într-o formă simplă, atrăgătoare şi sugestivă trăsăturile esenţiale ale fenomenelor studiate în anumite condiţii de timp şi spaţiu. Reprezentarea grafică a datelor statistice permite:
1. interpretarea vizuală a mărimii raportului dintre doi sau mai mulţi indicatori statistici;
2. memorarea datelor datorită caracterului sugestiv şi intuitiv; 3. interpretarea structurii şi modificărilor structurale în
timp sau în plan teritorial; 4. interpretarea formei de realizare a interdependenţelor
dintre două sau mai multe variabile statistice; 5. interpretarea tendinţelor de dezvoltare a fenomenelor
studiate; 6. popularizarea datelor statistice. Reprezentările grafice se aleg în funcţie de specificul
fenomenelor şi relaţiilor ce trebuie evidenţiate prin folosirea lor.4.5.3.1. Elementele unui grafic
Întocmirea şi apoi interpretarea corectă a unui grafic presupune cunoaşterea şi utilizarea corectă a următoarelor elemente de construcţie: (1) titlul graficului; (2) reţeaua graficului; (3) scara de reprezentare; (4) notele explicative; (5) legenda; (6) sursa de informaţie.
1. Titlul graficului trebuie astfel ales încât să sugereze relaţiile care trebuie interpretate vizual, pe baza graficului respectiv; trebuie să fie scurt, clar, precis şi, pe cât posibil, să corespundă cu titlul tabelului statistic ale cărui date le reprezintă.
2. Reţeaua graficului este formată din linii paralele dispuse orizontal sau vertical, linii oblice sau cercuri concentrice.
3. Scara de reprezentare se alege ţinând cont de ordinul de mărime al indicatorilor de reprezentat, de gradul şi forma de variaţie dintre indicatori, precum şi de scopul urmărit. Scara de reprezentare este, de fapt, o linie denumită suportul scării, dispusă orizontal sau vertical, care este divizată printr-un şir de puncte numerotate. Distanţa dintre două puncte învecinate se numeşte intervalul graficului. Distanţa dintre valorile numerice corespunzătoare punctelor se numeşte interval numeric. In funcţie de specificul fenomenului, pentru a reda cât mai fidel imaginea acestuia, se pot folosi scări uniforme, caz în care diviziunile de pe suportul scării sunt echidistante şi scări neuniforme ca, de exemplu, scara logaritmică.
4. Notele explicative apar atunci când este necesară
46
atenţionarea asupra aspectelor metodologice de calcul al indicatorilor reprezentaţi.
5. Legendele explică semnele convenţionale, haşurile şi culorile folosite. Legenda se plasează în afara cadrului construcţiei grafice.
6. Sursa de informaţie a datelor reprezentate grafic se specifică în toate cazurile în care se folosesc date reale. 4.5.3.2. Principalele tipuri de grafice statistice
Pentru aceleaşi date statistice există mai multe posibilităţi de reprezentare grafică. In practică se optează pentru acel tip de grafi, care permite evidenţierea relaţiilor obiective dintre indicatorii prezentaţi. Cele mai frecvente tipuri de grafice sunt:
1. grafice prin coloane şi benzi; 2. cronogramele; 3. diagrame de structură 4. diagrame de distribuţie; 5. diagrame teritoriale;
4.3.2.1. Grafice prin coloane şi benzi Graficele prin coloane se utilizează cel mai frecvent pentru
prezentarea şi popularizarea datelor statistice, a indicatorilor seriilor teritoriale şi a seriilor cronologice de momente cu intervale egale sau neegale de timp între momente. Graficele prin coloane se construiesc în cadranul I al sistemului de axe carteziene; scara de reprezentare se fixează pe axa Oy, iar pe axa Ox se construiesc atâtea coloane cu baze egale, câţi indicatori sunt reprezentaţi. Toate coloanele au aceeaşi lăţime, sunt separate între ele cu jumătate din lăţimea lor, iar înălţimea acestora este proporţională cu nivelul indicatorului de reprezentat.Dacă diagramele sunt construite în scopul popularizării datelor, valorile indicatorilor se scriu deasupra coloanelor.
Tabelul 4.7 Câştigul salarial nominal mediu brut lunar, pe activităţi ale economiei
naţionale, anul 2009 Activităţi ale economiei naţionale
Câştigul salarial nominal mediu brut lunar (lei/salariat)
Agricultură 1350 Industrie 1745 Construcţii 1441 Comerţ 1418 Intermedieri financiare 4304 Învăţământ 2206 Sănătate 1810
Sursa: Anuarul Statistic al României 2010, INS, Bucureşti, 2011, pag.150
47
Castigul salarial nominal mediu brut lunar in anul 2009
13501745
1441 1418
4304
22061810
0
500
1000
1500
2000
2500
3000
3500
4000
4500
5000
Agricultură Industrie Construcţii Comerţ Intermedierifinanciare
Învăţământ Sănătate
Fig.4.1
În practica statistică se mai utilizează diagrama cu coloane grupate, diagrama prin coloane lipite, diagrama prin coloane cu subdiviziuni, diagrama prin coloane a abaterilor.
Diagramele prin benzi se utilizează în special pentru reprezentarea grafică a indicatorilor de lungime, a indicatorilor care prezintă între ei variaţii foarte mari sau când datele sunt distribuite cronologic neegal, când se reprezintă serii cu indicatori eterogeni sau serii cu caracteristici combinate care au aspectul unor diagrame simetrice, specifice demografiei (piramida vârstelor). Graficele prin benzi se construiesc în cadranul I al sistemului de axe carteziene. Scara de reprezentare se fixează pe axa Ox, iar benzile se dispun pe axa Oy, lungimea lor fiind proporţională cu nivelul indicatorilor de reprezentat. Benzile au lăţimea mai mică decât coloanele şi sunt separate între ele prin distanţe egale. Se pot construi următoarele tipuri de grafice prin benzi: diagrame prin benzi simple, diagrame prin benzi grupate, diagrame prin benzi cu subdiviziuni, diagrame prin benzi orientate în dublu sens.
Ponderea populatiei pe medii de rezidenta la recensaminte
43.6
54.3
52.7
61.8
45.7
47.3
38.2
56.4
0 10 20 30 40 50 60 70
15.03.1966
05.01.1977
07.01.1992
18.03.2002
Rural
Urban
Fig. 4.2
4.3.2.2. Cronograma Pentru reprezentarea grafică a seriilor cronologice se utilizează
cronogramele. Ele se construiesc în cadranul I al sistemului de axe carteziene. Variaţia de timp se va reprezenta pe axa Ox, iar nivelul indicatorului urmărit pe axa Oy.
La stabilirea scării timpului pe axa Ox şi a nivelurilor fenomenului de pe axa Oy trebuie să se respecte proporţionalitatea, deoarece dacă raportul dintre scări nu este adecvat, nu se reflectă corect dezvoltarea fenomenului.
În cazul în care variaţia de timp este redată prin momente,
48
aceasta se trec în dreptul diviziunilor marcate pe axa Ox. Dacă variaţia de timp este redată prin intervale de timp, aceasta se trec între două diviziuni succesive.
Dacă din seria cronologică lipsesc date pentru unele valori de timp, atunci pentru perioada respectivă se face legătura printr-o linie întreruptă, menţinând tendinţa generală a întregii serii.
Exemplu. Pentru a exemplifica modul de întocmire a cronogramei pentru seriile de intervale de timp (figura 4.3) s-au utilizat datele din tabelul 4.8.
Tabelul 4.8.Evoluţia creditelor neguvernamentale în lei şi valută, perioada 2005-2009
milioane lei Anii 2005 2006 2007 2008 2009
0 1 2 3 4 5
Credite în lei
27091 48637 67713 83643 79711
Credite în valută
32714 43741 80467 114412 120175
Sursa: Anuarul Statistic al României, 2010, INS, Bucureşti, 2011, pag.615
Evolutia creditului neguvernamental in perioada 2005-2009, mil lei
0
20000
40000
60000
80000
100000
120000
140000
2005 2006 2007 2008 2009
Credite în lei
Credite în valută
Fig. 4.3
4.3.2.3. Diagramele de structură
Diagramele de structură se utilizează pentru prezentarea
raporturilor în care se află fiecare grupă faţă de întregul ansamblu, în condiţii bine definite de timp şi spaţiu. Graficele de structură se construiesc pin pătrate, cercuri sau dreptunghiuri a căror suprafaţă se consideră egală cu volumul întregii colectivităţi, adică 100%.
Tabelul 4.9 Cota de piaţă în funcţie de active, anul 2010
Nr. crt.
Banca Cota de piaţă %
0 1 2
1 BCR 19,8 2 BRD 13,8
3 Raiffeisen 6,36
49
4 CEC 6,35 5 Banca Transilvania 6,3 6 Alpha Bank 6,24 7 UniCredit 5,97 8 Volksbank 5,78 9 Bancpost 3,94
10 ING 3,52
11 Alte banci 21,94 Total 100,0
Sursa: Revista Piata Financiară, februarie, 2011
Cota de piata a bancilor din Romania in functie de active, anul 2010
20%
14%
6%6%6%6%
6%6%
4%
4%
22%
BCR BRD RaiffeisenCEC Banca Transilvania Alpha BankUniCredit Volksbank BancpostING Alte banci
Fig.4.4 4.3.2.4. Diagrame de distribuţie Diagramele de distribuţie se utilizează pentru reprezentarea
grafică a seriilor de variaţie. Cel mai des se utilizează histograma, poligonul frecvenţelor, curba cumulativă a frecvenţelor, curba lui Lorenz.
Histograma se foloseşte pentru a reprezenta grafic seriile de distribuţie de frecvenţe. Pe axa absciselor se trec intervalele de grupare, iar pe axa ordonatelor se construieşte scara frecvenţelor în funcţie de frecvenţa maximă înregistrată. Pentru fiecare grupă se ridică câte un dreptunghi (coloană) a cărui suprafaţă trebuie să fie proporţională cu produsul dintre lungimea intervalului şi frecvenţa sa de apariţie. Această relaţie de proporţionalitate constituie principiul de construirea a histogramei. Deasupra fiecărei coloane se trece frecvenţa corespunzătoare fiecărei grupe. Histogramele se utilizează atât pentru reprezentarea grafică a seriilor de distribuţie cu intervale egale, cât şi a seriilor de distribuţie cu intervale neegale.
Exemplu: pentru seria de distribuţie de frecvenţe absolute prezentate în tabelul 4.10, histograma este redată în figura 4.5.
50
Distributia angajatilor in functie de salariul lunar brut, lei
5
10
25
15
10
5
0
5
10
15
20
25
30
1000-2000
2000-3000
3000-4000
4000-5000
5000-6000
6000-7000
Fig.4.5
Poligonul frecvenţelor se utilizează pentru reprezentarea grafică a seriilor de distribuţie de frecvenţe pe variante sau pe intervale de variaţie; se construieşte prin suprapunere pe histogramă sau separat, utilizând o reprezentare independentă. Pe axa absciselor se trec variantele sau intervalele de variaţie egale (sau neegale), iar pe axa ordonatelor se construieşte scara frecvenţelor reale (sau reduse). De pe axa absciselor, din dreptul diviziunilor corespunzătoare variantelor sau după caz din mijlocul segmentului care reprezintă mărimea intervalului se ridică linii perpendiculare proporţionale cu frecvenţele corespunzătoare de pe axa Oy, obţinând puncte de coordonate (xi,yi) Deoarece poligonul trebuie închis, pe axa absciselor se construieşte câte un interval înaintea primului şi după ultimul (având aceeaşi mărime cu acestea), pe mijlocul lor marcând câte un punct. Unind toate punctele de coordonate (xi,yi) cu o linie frântă, se obţine poligonul frecvenţelor.
Exemplu. Utilizând datele din tabelul 4.10 se poate construi poligonului frecvenţelor suprapus peste histogramă (figura 4.6) sau într-o reprezentare independentă.
Distributia angajatilor in functie de salariul lunar brut
5
10
25
15
10
5
0
5
10
15
20
25
30
1000-2000 2000-3000 3000-4000 4000-5000 5000-6000 6000-7000
Fig.4.6
Curba frecvenţelor cumulate se utilizează atunci când dorim să determinăm cu ajutorul graficului, mărimile medii de poziţie (mediana, cuartile, decile). Construirea curbei cumulative a frecvenţelor presupune calculul frecvenţelor absolute cumulate crescător şi descrescător. Frecvenţa cumulată se determină adunând succesiv frecvenţele corespunzătoare intervalelor. Pornind de la frecvenţa primului interval al repartiţiei se obţin frecvenţele cumulate crescător. Dacă însumarea succesivă porneşte de la frecvenţa ultimului interval al repartiţiei se obţin frecvenţele
51
cumulate descrescător. Pe axa Ox se vor reprezenta intervalele echidistante între ele, iar pe axa Oy se vor reprezenta frecvenţele cumulate într-un sens şi în altul. Pe grafic vor apare două curbe care unesc punctele de coordonate: centru de interval cu frecvenţele cumulate crescător şi centru de interval cu frecvenţele cumulate descrescător.
Exemplu. Utilizând datele din tabelul 4.10, se va reprezenta curba frecvenţelor cumulate (figura 4.7).
Tabelul 4.10.Distribuţia angajaţilor după salariul brut lunar
Salariul lunar brut
(lei)
Număr de angajaţi
(fi)
Frecvenţele absolute cumulate
crescător
Frecvenţele absolute cumulate
descrescător 5-6 5 5 70 6-7 10 15 65 7-8 25 40 55 8-9 15 55 40
9-10 10 65 15 10-11 5 70 5 Total 70 * *
Distributia angajatilor dupa salariu - frecvente cumulate crescator si descrescator
0
10
20
30
40
50
60
70
80
1000-2000 2000-3000 3000-4000 4000-5000 5000-6000 6000-7000
Frecvente cumulatecrescatorFrecvente cumulatedescrescator
Fig.4.7 4.3.2.5. Diagrame teritoriale Cartogramele sunt grafice care se utilizează pentru prezentarea
densităţii de repartiţie teritorială a fenomenelor cu ajutorul hărţilor. Densitatea de repartiţie se va reprezenta prin culori sau haşuri de intensităţii diferite. Cartodiagramele reprezintă o formă specială a cartogramelor care constau dintr-o combinaţie a cartogramei cu diagramele (cerc, pătrat, coloane) care se aplică pe cartogramă.
4.6 Aplicatii practice
Să se reprezinte grafic distribuţia şi structura clienţilor în funcţie de nivelul creditului primit.
Nr.crt. Grupe de clienţi după nivelul creditului (mii euro)
Număr de clienţi, fi Structura clienţilor fi* (%)
1 [28 – 30) 2 6,7 2 [30 – 32) 5 16,7
52
3 [32 – 34) 10 33,3 4 [34 – 36) 7 23,3 5 [36 – 38) 4 13,3 6 [38 – 40) 2 6,7 Total 30 100
Structura clientilor in functie de creditul primit
7%
17%
33%
23%
13%7%
28 – 30 30 – 32 32 – 34 34 – 36 36 – 38 38 – 40
4.7 Îndrumar pentru autoverificare
4.7.1 Sinteza unităţii de studiu
Rezultatele prelucrării datelor obţinute în urma observării se prezintă sub formă de: tabele, serii şi grafice, în care relaţiile dintre fenomenele studiate apar într-o succesiune logică corespunzătoare relaţiilor obiective existente între acestea. Sistematizarea datelor prin tabele, serii şi grafice permite interpretarea statistică a formelor de manifestare a fenomenelor, precum şi calculul corect al indicatorilor statistici absoluţi şi derivaţi. Cu ajutorul tabelelor, seriilor şi graficelor se pot caracteriza atât grupele unei colectivităţi, cât şi întregul ansamblu.
Distributia clientilor in functie de creditul primit
2
5
10
7
4
2
0
2
4
6
8
10
12
28 – 30 30 – 32 32 – 34 34 – 36 36 – 38 38 – 40
53
Tabelul statistic reprezintă cea mai adecvată formă de sistematizare şi prezentarea a unui ansamblu de relaţii cantitative despre fenomenele studiate
Elementele unui tabel statistic sunt: titlul general, titlurile interioare, reţeaua tabelului Tipuri de tabele statistice: tabelul simplu tabelul pe grupe tabelul combinat tabelul cu dublă intrare tabelul de asociere
Seriile statistice sunt rezultatul grupării datelor în funcţie de una sau mai multe caracteristici de grupare.
Seria statistică este o corespondenţă între două şiruri de date statistice: primul şir reprezintă variaţia caracteristicii de grupare, iar cel de-al doilea şir este rezultatul centralizării frecvenţelor de apariţie sau nivelul unei alte caracteristici aflată în corelaţie cu variabila studiată. Seriile statistice pot fi clasificate în funcţie de următoarele criterii: numărul caracteristicilor de grupare, conţinutul caracteristicilor de grupare, forma de exprimare a caracteristicii atributive, tipul variaţiei caracteristicii de grupare, gradul de variaţie a caracteristicii de grupare
. Analiza seriilor statistice urmăreşte determinarea valorilor tipice care caracterizează seria respectiva şi determinarea diferenţelor de nivel dintre termenii individuali şi aceste valori tipice cu scopul interpretării formei şi gradului de variaţie a caracteristicii studiate şi comparării lor în timp şi spaţiu.
În analiza distribuţiilor empirice se ţine cont de unele proprietăţi ale acestora, care se pot întâlni în toate cazurile sau sunt specifice anumitor serii. Principalele proprietăţi ale seriilor statistice sunt: variabilitatea, forma de repartiţie, independenţa (interdependenţa) şi omogenitatea termenilor.
Utilizarea metodei grafice de prezentare a datelor statistice are avantajul de a reda într-o formă simplă, atrăgătoare şi sugestivă trăsăturile esenţiale ale fenomenelor studiate în anumite condiţii de timp şi spaţiu. Reprezentarea grafică a datelor statistice permite:
interpretarea vizuală a mărimii raportului dintre doi sau mai mulţi indicatori statistici; memorarea datelor datorită caracterului sugestiv şi intuitiv; interpretarea structurii şi modificărilor structurale în timp sau în plan teritorial; interpretarea formei de realizare a interdependenţelor dintre două sau mai multe variabile
statistice; interpretarea tendinţelor de dezvoltare a fenomenelor studiate; popularizarea datelor statistice.
Reprezentările grafice se aleg în funcţie de specificul fenomenelor şi relaţiilor care trebuie evidenţiate prin utilizarea lor. Elementele unui grafic sunt:
Titlul graficului. Reţeaua graficului Scara de reprezentare neuniforme ca, de exemplu, scara logaritmică. Notele explicative Legendele Sursa de informaţie
Cele mai frecvente tipuri de grafice sunt: grafice prin coloane şi benzi; cronogramele; diagrame de structură diagrame de distribuţie; diagrame teritoriale.
4.7.2 Concepte şi termeni de reţinut prezentarea datelor statistice;
54
tabelul statistic; tabel simplu, tabel pe grupe, tabel combinat, tabel cu dublă intrare, tabel de asociere serie statistică proprietăţile seriilor statistice: variabilitate, formă de repartiţie, independenţa / interdependenţa
termenilor, omogenitatea termenilor grafic prin coloane sau prin benzi; cronograma; diagramă de structură; diagramă de distribuţie; diagramă teritorială
4.7.3 Întrebări de control şi teme de dezbatere 1. Sub ce formă se prezintă rezultatele prelucrării datelor statistice? 2. Definiţi tabelul statistic şi indicaţi elementele unui tabel statistic. 3. Care sunt recomandările de care trebuie să se ţină cont în cazul prezentării datelor într-un tabel
statistic? 4. Care sunt principalelel tipuri de tabele statistice? 5. Definiţi noţiunea de serie statistică. 6. Prezentaţi criteriile în funcţie de care se clasifică seriile statistice şi tipurile de serii corespunzătoare
acestor criterii. 7. Enumeraţi şi caracterizaţi pe scurt proprietăţile seriilor statistice. 8. Enumeraţi avantajele reprezentării grafice a datelor statistice. 9. Care sunt principalele elemente ale unui grafic. 10. Care sunt principalele tipuri de grafice statistice.
55
4.7.4 Bibliografie:
1. Biji, M., Biji, E. M., Lilea, E., Anghelache, C., (2002), Tratat de statistică, Editura Economica, Bucureşti
2. Biji, E.M., Lilea, E., Roşca, E., Vătui, M., (2010), Statistică pentru economişti, Editura Economică, Bucureşti;
3. Druică, E., (2012), Statistică pe înţelesul tuturor, Editura CH Beck, Bucureşti; 4. Duguleană, L., (2012) Bazele statisticii economice, Editura CH Beck, Bucureşti; 5. Turdean, M., (2012), Statistica, Editura Pro Universitaria, Bucureşti; 6. Ţiţan, E., (2012) Statistică – teorie şi aplicaţii în sectorul terţiar, Editura Meteor Press, Bucureşti;
56
5 UNITATEA DE STUDIU 5 MĂRIMILE RELATIVE 5.1 Introducere 5.2 Obiectivele unităţii de studiu 5.3 Competenţele unităţii de studiu 5.4 Timpul alocat unităţii de studiu 5.5 Conţinutul unităţii de studiu
5.5.1 Consideraţii generale privind calculul mărimilor relative 5.5.2 Tipuri de mărimi relative
5.6 Aplicatii practice 5.7 Îndrumar pentru autoverificare 5.7.1 Sinteza unitatii de studiu 5.7.2 Concepte si termeni de retinut 5.7.3 Întrebări de control şi teme de dezbatere 5.7.4 Bibliografie
5.1 Introducere
În procesul cercetării statistice se observă diferenţe: (i) de la un nivel la altul, (ii) de la o unitate la alta, (iii) de la o grupă la alta, (iv) de la o colectivitate la alta. Pentru explicarea acestor diferenţe este necesară compararea indicatorilor statistici.Rezultatul comparării se exprimă cu ajutorul mărimilor relative.
5.2 Obiectivele unităţii de studiu
– definirea noţiunii de „mărime relativă”; – rezolvarea problemelor legate de calculul propriu-zis al
mărimilor relative, respectiv alegerea bazei de raportare, asigurarea comparabilităţii datelor şi alegerea formei de exprimare a acestora;
– cunoaşterea modului de calcul pentru diferite tipuri de mărimi relative;
– cunoaşterea modului de reprezentare grafică a diferitelor tipuri de mărimi relative
5.3 Competenţele unităţii de studiu:
– studenţii vor putea să utilizeze mărimile relative în analizele statistice
– studenţii vor putea clasifica mărimile relative în funcţie de conţinutul informaţiilor
– studenţii vor şti cum se alege baza de raportare; – studenţii vor supune calculului comparativ doar acele
mărimi ce corespund ca metodologie de culegere şi
57
prelucrare sau/şi grad de cuprindere a elementelor ce definesc conţinutul indicatorilor.
– studenţii vor alege o formă corectă de exprimare pentru mărimile relative calculate
5.4 Timpul alocat unităţii de studiu: Pentru unitatea de studiu „Mărimi relative” timpul alocat este de 2 ore.
5.5 Conţinutul unităţii de studiu
5.5.1 Consideraţii generale privind calculul mărimilor relative
În procesul cercetării statistice se observă diferenţe: (i) de la un nivel la altul, (ii) de la o unitate la alta, (iii) de la o grupă la alta, (iv) de la o colectivitate la alta. Pentru explicarea acestor diferenţe este necesară compararea indicatorilor statistici.Rezultatul comparării se exprimă cu ajutorul mărimilor relative.
Definiţie O mărime relativă este rezultatul comparării sub formă de raport
a doi indicatori statistici absoluţi.
Mărimea relativă indică numărul de unităţi din indicatorul de raportat care revin la o unitate a indicatorului considerat bază de raportare.
Calculul mărimilor relative impune rezolvarea unor probleme legate de alegerea bazei de raportare, de asigurarea comparabilităţii datelor şi de alegerea formei de exprimare a mărimilor relative.
Alegerea bazei de raportare Baza de raportare se alege în funcţie de gradul de interdependenţă
dintre caracteristicile sau fenomenele studiate astfel încât rezultatul raportului să fie cât mai semnificativ, având în vedere că valoarea raportului depinde, în principal, de mărimea de la numitorul fracţiei.
Atunci când comparaţia se realizează în dinamica, se consideră ca bază de raportare un moment sau o perioadă semnificativă pentru dezvoltarea fenomenului.
Asigurarea comparabilităţii datelor Asigurarea comparabilităţii datelor constă în verificarea
metodologiei de calcul şi a timpului la care se referă datele. Exemplu, pentru calculul eficienţei capitalului fix sau a necesarului de capital fix, este necesar ca valoarea capitalului fix să fie calculată ca medie anuală, pentru a corespunde cu valoarea adăugată brută e pentru aceeaşi perioadă.
Se pot supune calculului comparativ doar acele mărimi ce corespund ca: (i) metodologie de culegere şi prelucrare sau/şi (ii) grad de cuprindere a elementelor ce definesc conţinutul indicatorilor.
Alegerea formei de exprimare a mărimilor relative Forma de exprimare a mărimilor relative se stabileste pornind de
la diferenţele de mărime ce există între indicatorii comparabili.
58
Mărimile relative trebuie să fie sugestive şi pot fi exprimate prin (i) numere întregi, (ii) fracţii ordinare şi zecimale, (iii) procente, promile, prodecimile.
5.5.2 Tipuri de mărimi relative În funcţie de conţinutul informaţiilor, mărimile relative pot rezulta
în urma comparaţiilor privind aceeaşi variabila statistica sau două variabile diferite.
In cercetarea statistică se utilizează următoarele tipuri de mărimi relative:
1. mărimi relative de structura; 2. mărimi relative de coordonare; 3. mărimi relative de dinamica; 4. mărimi relative de intensitate. 5. mărimi relative ale planului. 5.5.2.1. Mărimile relative de structură Termenii sinonimi pentru mărimile relative de structură sunt
ponderi sau greutăţi specifice. Calculul mărimilor relative de structură este posibil atunci când
colectivitatea supusă cercetării este împărţită în grupe omogene în funţie de variaţia uneia sau a mai multor caracteristici. Mărimile relative de structură se utilizează pentru a stabili care este raportul dintre fiecare grupă şi întregul ansamblu. Mărimile relative de structură se pot calcula atât pentru valorile centralizate ale diferitelor caracteristici cât şi pentru frecvenţele grupelor. Dacă notăm nivelul absolut al caracteristicii din fiecare grupă cu x1, x2,
...., xn şi cu
n
1iix nivelul absolut (totalizat) al variabilei corespunzător
întregii colectivităţi, se pot obţine următoarele mărimi relative de structură, exprimate sub formă zecimală:
n
1i ix
nx
ng......
n
1i ix
2x
2g
n
1i ix
1x
1g
sau sub formă de procent:
100x
x%g...100
x
x%g100
x
x%g
n
1ii
nnn
1ii
22n
1ii
11
Dacă se calculează toate mărimile relative de structură
corespunzătoare tuturor grupelor în care s-a împărţit colectivitatea după variaţia aceleiaşi caracteristici şi se face suma lor, această sumă trebuie să fie 1 sau 100 în funcţie de modul de exprimare al mărimilor relative, sub formă zecimală sau procentual.
00,1
x
x
x
x...xx
x
x...
x
x
x
xn
1ii
n
1ii
n
1ii
n21n
1ii
nn
1ii
2n
1ii
1
59
Deci 1,00gn
1ii
100100x
x100
x
x....xx
100x
x.....100
x
x100
x
x
n
1ii
n
1ii
n
1ii
n21
n
1ii
n
n
1ii
2
n
1ii
1
Deci,
n
1ii 100%g
Relaţiile generale de calcul pentru mărimile relative de structură exprimate zecimal, respectiv procentual, calculate pentru valorile centralizate ale caracteristicilor sunt:
n
1ii
ii
x
xg sau 100
x
xg
n
1ii
i%i
Mărimile relative pentru frecvenţele grupelor se pot calcula sub formă zecimală
n
1ii
z f
if
if
n
1i1*
zi
f , sau sub formă procentuală
100f
if
%if
n
1ii
n
1i100
%if
Mărimile relative de structură se reprezintă grafic cu ajutorul diagramelor de structură: dreptunghi, cerc, pătrat de structură.
Reprezentarea grafica a structurii productiei realizata in perioada curenta
A31%
B49%
C20%
60
5.5.2.2. Mărimile relative de coordonare Mărimile relative de coordonare indică raporturile care există între
grupele aceleiaşi colectivităţi sau între două sau mai multe colectivităţi aflate în aceeaşi unitate de timp, dar în teritorii diferite. Ori de câte ori este posibil calculul mărimilor relative de structură, devine posibil şi calculul mărimilor relative de coordonare.
Exemple: se compară pentru o anumită perioadă numărul populaţiei din mediul urban cu cea din mediul rural, pe judeţele ţării; se compară indicatorii economici referitori la utilizarea forţei de muncă din cele opt regiuni statistice, cu indicatorii corespunzători dintr-o regiune aleasă ca bază de comparaţie sau cu indicatorii corespunzători calculaţi la nivelul economiei naţionale.
Mărimile relative de coordonare se utilizează, în special, în studiul variaţiei teritoriale având, prin urmare, caracter de indici teritoriali. Indicii teritoriali astfel constituiţi stau la baza comparaţiilor pe plan naţional (între judeţele ţării, între regiuni) şi pe plan internaţional între ţări, zone geografice, etc.
Direcţia de comparaţie nu este unică. Oricare din termenii seriei poate fi considerat bază de comparaţie.
Relaţia de calcul pentru mărimile relative de coordonare este:
KA/B = B
A
X
X
unde: XA = nivelul indicatorului care se compară; XB = nivelul indicatorului ales bază de comparaţie. Mărimile relative de coordonare se exprimă sub formă de coeficient
(zecimal). Mărimile relative de coordonare se reprezintă grafic cu ajutorul
diagramelor prin benzi sau a diagramelor prin coloane.Astfel se pot stabili relaţiile care există între grupele aceleiaşi colectivităţi. Dacă mărimile relative de coordonare se folosesc în studiul variaţiei teritoriale reprezentarea grafică este cartograma sau cartodiagrama.
Ponderea populatiei pe medii de rezidenta la recensaminte
43.6
54.3
52.7
61.8
45.7
47.3
38.2
56.4
0 10 20 30 40 50 60 70
15.03.1966
05.01.1977
07.01.1992
18.03.2002
Rural
Urban
Sursa: Anuarul Statistic al Romaniei, 2011, INS, Bucuresti, 2012, pag. 56
5.5.2.3. Mărimile relative de dinamică Mărimile relative de dinamică se utilizează pentru caracterizarea
statistică a evoluţiei în timp a fenomenelor. Aceste mărimi se calculează atunci când, pentru acelaşi indicator, există valori înregistrate în unităţi diferite de timp.
Mărimile relative de dinamică se mai numesc indici de dinamică.
Indicele de dinamică (y
't/tI ) are relaţia generală de calcul:
61
100y
yI
't
ty
't/t
unde: yt = nivelul fenomenului în perioada / la momentul t; yt’ = nivelul fenomenului în perioada / la momentul t’; t, t’ = perioada / momentul de timp. Mărimile relative de dinamică se pot construi cu bază fixă şi cu
bază în lanţ (mobilă sau variabilă): Mărimile relative de dinamică cu bază fixă se obţin prin
raportarea fiecărui termen al unei serii cronologice la primul termen al seriei, conform relaţiei:
100y
yI
1
ty
't/t
unde: yt = nivelul fenomenului în perioada / la momentul t; y1 = nivelul fenomenului în prima perioadă / primul an din serie.
Indicele de dinamică cu bază fixă serveşte la determinarea modificărilor faţă de o bază de referinţă semnificativă.
Mărimile relative de dinamică cu bază în lanţ (mobilă sau variabilă) se obţin prin raportarea fiecărui termen al seriei la termenul precedent, conform relaţiei:
100y
yI
1t
ty
t/t'
unde: yt = nivelul fenomenului în perioada / la momentul t; yt-1 = nivelul fenomenului în perioada / momentul precedent perioadei / momentului t.
Mărimile relative ale dinamicii se exprimă sub formă zecimală sau procentual. Între mărimile relative ale dinamicii se poate stabili următoarea relaţie: produsul indicilor cu bază în lanţ este egal cu indicele cu baza fixă corespunzător întregii perioade:
y
1/t
1
TT
2t
y
1t/t Iy
yI
unde: yT = nivelul fenomenului la momentul T, ultimul an din serie. Relaţia este valabilă doar pentru cazul în care mărimile relative ale
dinamicii cu bază fixă şi bază în lanţ sunt exprimate zecimal. Mărimile relative de dinamică se reprezintă grafic cu ajutorul diagramelor prin coloane.
Indicii prosusului intern brut, anul precedent= 100
104.2106.3 107.3
96.793.7
107.9
85
90
95
100
105
110
2005 2006 2007 2008 2009 2010
Sursa: Anuarul Statistic al Romaniei, 2011, INS, Bucuresti, 2012, pag. 323-324
62
5.5.2.4 Mărimile relative de intensitate Mărimile relative de intensitate reprezintă raporturile dintre doi
indicatori absoluţi, de natură diferită, care se afla într-o relaţie de interdependenţă obiectivă.
Relaţia generală de calcul pentru o mărime relativă de intensitate este:
i
ii z
yx
unde: xi = mărimea relativă de intensitate, caracteristică secundară (derivată); yi şi zi = caracteristici primare înregistrate direct prin observare statistică.
Mărimile relative de intensitate se pot calcula pentru fiecare unitate statistică, pe grupe sau pe total colectivitate.
Pentru mărimile relative de intensitate nu funcţionează relaţia de însumare directă.
Pentru a calcula nivelul unei mărimi relative de intensitate pe total colectivitate se aplică acelaşi procedeu ca şi în cazul determinării mărimii relative de intensitate la nivelul unităţii de observare. Astfel, nivelul mărimii relative de intensitate x pe total colectivitate “ X ” se obţine raportând nivelul totalizat al caracteristicii “y” la nivelul totalizat al caracteristicii “z” conform relaţiei:
X =
n
1ii
n
1ii
z
y
unde: n = numărul de unităţi observate. Mărimile relative de intensitate se utilizează în industrie (eficienţa
capitalului fix, necesarul de capital fix, înzestrarea muncii cu capital fix, productivitatea muncii), turism (indicatorii eficienţei activităţii de turism) şi demografie (coeficienţii mişcării naturale şi migratorii a populaţiei, densitatea populaţiei).
Unitatea de măsură a unei mărimi relative de intensitate este, de fapt, unitatea de măsură a unei noi variabile statistice rezultată din unitatea de masura a indicatorului de raportat si unitatea de măsură a indicatorului bază de raportare, de exemplu, lei/ persoana, (pentru productivitatea muncii). Mărimile relative de intensitate mai pot fi exprimate sub formă zecimală (leu/leu, necesarul de capital fix), promile (lei/1000 lei, eficienţa capitalului fix), prodecimile (pentru mărimile relative de intensitate specifice demografiei sau cele ce caracterizează aspecte referitoare la nivelul de trai, de exemplu, medici la 10000 locuitori).
5.5.2.5 Mărimile relative ale planului Mărimile relative ale planului se calculează la nivelul agenţilor
economici, în ideea elaborării unor programe de aprovizionare, producţie şi desfacere pe termen scurt şi mediu.
Calculul mărimilor relative ale planului presupune cunoaşterea următoarelor date din evidenţele economice al unităţii analizate:
x0 = nivelul realizat al fenomenului în perioada de bază; xpl = nivelul planificat al fenomenului pentru perioada curentă; x1 = nivelul realizat al fenomenului în perioada curentă. Din compararea sub formă de raport a celor trei indicatori rezultă: (i) mărimea relativă a sarcinii de plan, ce exprimă măsura în
care se urmăreşte, în perioada curentă, depăşirea nivelului atins de un
63
fenomen în perioada aleasă ca bază de comparaţie:
100x
xi
0
pls
0/pl
unde: s
0/pli = indicele sarcinii de plan.
Indicele sarcinii de plan pentru variabila producţie este de dorit să fie supraunitar în timp ce acelaşi indice pentru “costuri” este de preferat să aibă valoare subunitară.
(ii) mărimea relativă a realizării planului care măsoară gradul de realizare a sarcinilor faţa de nivelul prevăzut de plan:
010x
xi
pl
1i
1/pl
unde: i
pl/1i = indicele realizării planului.
(iii) mărimea relativă a dinamicii care măsoară gradul de realizare a planului în perioada curentă faţă de perioada de bază:
100x
xi
0
1d
1/0
unde: d
0/1i = indicele de dinamică.
Intre cei trei indici exprimaţi sub formă zecimală se poate stabili relaţia:
i
pl/1
s
0/pl
d
0/1 iii
Dacă se cunosc informaţii la nivel parţial (pe secţii) se pot calcula mărimile relative ale planului pe ansamblu/total societate comercială/total colectivitate.
Indicele sarcinii de plan pe total societatecomercială
010x
xI
n
1i0
n
1ipl
s
pl/0
Indicele realizării planului pe totalsocietate comercială
010x
xI
n
1ipl
n
1i1
i
1/pl
Indicele de dinamică pe total societatecomercială
100x
xI
n
1i0
n
1i1
d
1/0
Între indicii de mai sus există relaţia: d
1/0
i
1/pl
s
pl/0 III
Mărimile relative ale planului se exprimă sub formă zecimală sau sub formă procentuală şi se reprezintă grafic cu ajutorul diagramelor prin coloane.
64
Gradul de indeplinire a planului pe fiecare sectie si pe total agent economic
103%
109%
115%
108.19%
9698
100102104106108110112114116
A B C Total agenteconomic
5.6 Aplicatii practice Pentru un agent economic se cunosc datele:
Secţia Productia realizata in perioada de baza
(mil. lei)
Productia planificata in perioada curenta
(mil. lei)
Indicele indeplinirii planului
A 20 26 1,03 B 30 40 1,09 C 10 15 1,15
TOTAL 60 81 Se cere:
1. Producţia realizată în perioada curentă, pe fiecare secţie şi pe total. 2. Indicele sarcinii de plan, pe fiecare sectie şi pe total 3. Indicele de dinamică pe fiecare secţie şi pe total 4. Indicele îndeplinirii planului pe total 5. Reprezentarea grafică a structurii producţiei realizată în perioada de bază şi în perioada curentă 6. Reprezentarea grafică a gradului de îndeplinire a planului pe fiecare secţie Rezolvare: 1. Producţia realizată în perioada curentă, pe fiecare secţie se calculează astfel:
pli1/pl1
pl
1i1/pl xix
x
xi
lei.mil78,262603,1xix Apli
A1/plA1 lei.mil6,434009,1xix Bpli
B1/plB1
lei.mil25,171515,1xix Cpli
C1/plC1
Producţia realizată în perioada curentă, pe total agent economic este:
lei.mil63,8725,176,4378,26x3
1i1
2. Indicele sarcinii de plan, pe fiecare secţie se determină conform relaţiei: 0
plspl/0 x
xi
65
%130sau3,120
26
x
xi
A0
AplsApl/0 %33,133sau3333,1
30
40
x
xi
B0
BplsBpl/0
%150sau5,110
15
x
xi
C0
CplsCpl/0
Indicele sarcinii de plan pe total agent economic este:
%135sau35,1lei.mil60
lei.mil81
x
x
I3
1i0
3
1ipl
spl/0
3. Indicele de dinamică pe fiecare secţie se determină conform relaţiei: 0
1d0/1 x
xi
%9,133sau339,120
78,26
x
xi
A0
A1dA1/0 %33,145sau4533,1
30
6,43
x
xi
B0
B1dB1/0
%5,172sau725,110
25,17
x
xi
C0
C1dC1/0
sau i
pl/1s
0/pld
0/1 iii
%9,133sau339,103,13,1iii iApl/1
sA0/pl
dA0/1
%33,145sau4533,109,1333,1iii iBpl/1
sB0/pl
dB0/1
%5,172sau725,115,15,1iii iCpl/1
sC0/pl
dC0/1
Indicele de dinamică pe total agent economic este:
%05,146sau4605,1lei.mil60
lei.mil63,87
x
x
I3
1i0
3
1i1
d1/0
sau
%05,146sau4605,10819,135,1III i1/pl
spl/0
d1/0
3. Indicele îndeplinirii planului pe total agent economic este:
%19,108sau0819,1lei.mil81
lei.mil63,87
x
x
I3
1ipl
3
1i1
i1/pl
4. Structura producţiei realizată în perioada de bază se determină conform relaţiei:
100
x
x%g
3
1ii0
i0
i0
; 100
x
x%g
3
1ii1
A1
i1
%33,33100lei.mil60
lei.mil20100
x
x%g
3
1ii0
A0
A0
%56,30100lei.mil63,87
lei.mil78,26100
x
x%g
3
1ii1
A1
A1
66
%50100lei.mil60
lei.mil30100
x
x%g
3
1ii0
B0
B0
%75,49100lei.mil63,87
lei.mil6,43100
x
x%g
3
1ii1
B1
B1
%67,16100lei.mil60
lei.mil10100
x
x%g
3
1ii0
C0
C0
%69,19100lei.mil63,87
lei.mil25,17100
x
x%g
3
1ii1
C1
C1
Rezultatele calculelor sunt prezentate în tabelul de mai jos.
Secţia Productia realizata in perioada curenta (mil. lei)
Indicele sarcinii de plan
Indicele de dinamica
Structura producţiei realizată în perioada de bază (%)
Structura producţiei realizată în perioada curentă (%)
A 26,78 1,3 1,339 33,33 30,56 B 43,6 1,3333 1,4533 50 49,75 C 17,25 1,5 1,725 16,67 19,69 TOTAL 87,63 1,35 1,4605 100 100
Reprezentarea grafica a structurii productiei realizata in perioada curenta
A31%
B49%
C20%
Fig. 5.1 Fig. 5.2 5. Reprezentarea grafică a gradului de îndeplinire a planului pe fiecare secţie
Gradul de indeplinire a planului pe fiecare sectie si pe total agent economic
108.19%
115%
109%
103%
95
100
105
110
115
120
A B C Total agenteconomic
Reprezentarea grafica a structurii productiei realizata in perioada de baza
A33%
B50%
C17%
67
Fig.5.3
5.7 Îndrumar pentru autoverificare
5.7.1 Sinteza unităţii de studiu
O mărime relativă este rezultatul comparării sub formă de raport a doi indicatori statistici absoluţi. Mărimea relativă indică numărul de unităţi din indicatorul de raportat care revin la o unitate a
indicatorului considerat bază de raportare. Calculul mărimilor relative impune rezolvarea unor probleme legate de alegerea bazei de raportare,
asigurarea comparabilităţii datelor şi alegerea formei de exprimare a mărimilor relative. Relaţiile generale de calcul pentru mărimile relative sunt: Nr. crt.
Tipuri de mărimi relative
Relaţia de calcul
1 Mărimi relative de structură 100
x
xg
n
1ii
i%i
sau
100f
if
%if
n
1ii
2 Mărimi relative de
coordonare KA/B = B
A
X
X
3 Mărimi relative de
dinamică 100y
yI
't
ty
't/t
4 Mărimi relative de intensitate
La nivelul unei unităţi statistice/ grupe
La nivelul colectivităţii statistice, (în medie)
i
ii z
yx
X =
n
1ii
n
1ii
z
y
5 Mărimi relative ale
planului La nivelul unei unităţi statistice/ grupe
La nivelul colectivităţii statistice, (în medie)
Indicele sarcinii de plan 100
x
xi
0
pls
0/pl
010x
xI
n
1i0
n
1ipl
s
pl/0
Indicele îndeplinirii planului 010
x
xi
pl
1i
1/pl 010
x
xI
n
1ipl
n
1i1
i
1/pl
68
Indicele de dinamică 100
x
xi
0
1d
1/0 100
x
xI
n
1i0
n
1i1
d
1/0
5.7.2 Concepte şi termeni de reţinut
mărime relativă; mărimi relative de structură; mărimi relative de coordonare; mărimi relative de dinamică; mărimi relative de intensitate; mărimi relative ale planului
5.7.3 Întrebări de control şi teme de dezbatere 1. Ce sunt mărimile relative? 2. Care sunt principalele probleme care trebuie rezolvate pentru a calcula mărimile relative? 3. Enumeraţi tipurile de mărimi relative studiate. 4. Ce tipuri de mărmi relative se utilizează pentru compararea a doi indicatori cu acelaşi conţinut? 5. Ce tip de mărime relativă se utilizează pentru compararea a doi indicatori cu conţinut diferit, între
care există o legătură obiectivă? 6. Cum se reprezintă grafic mărimile relative de structură? 7. Cum se reprezintă grafic mărimile relative de dinamică? 8. Cum se reprezintă grafic mărimile relative de coordonare? 9. Cum se reprezintă grafic mărimile relative de intensitate? 10. Cum se reprezintă grafic mărimile relative ale planului?
69
5.7.4 Bibliografie:
1. Anghelache, C., Isaic- Maniu, A., Mitruţ, C., Voineagu, V., Dumbravă , M., (2007), Analiză economică, sinteze şi studii de caz, Editura Economică, Bucureşti;
2. Băcescu- Carbunaru, A., (2009) Statistică- bazele statisticii, Editura Universitară, Bucureşti; 3. Begu, L.S., (2009), Statistică internaţională –analize comparative, Editura Universitară, Bucureşti 4. Biji, E.M., Lilea, E., Roşca, E., Vătui, M., (2010), Statistică pentru economişti, Editura
Economică, Bucureşti; 5. Druică, E., (2012), Statistică pe înţelesul tuturor, Editura CH Beck, Bucureşti; 6. Duguleană, L., (2012) Bazele statisticii economice, Editura CH Beck, Bucureşti; 7. Turdean, M., (2012), Statistica, Editura Pro Universitaria, Bucureşti;
70
6 UNITATEA DE STUDIU 6 ANALIZA SERIILOR DE DISTRIBUŢIE I -MĂRIMILE MEDII-
6.1 Introducere 6.2 Obiectivele unităţii de studiu 6.3 Competenţele unităţii de studiu 6.4 Timpul alocat unităţii de invăţare 6.5 Conţinutul unităţii de studiu
6.5.1 Condiţii de aplicare şi de calcul pentru mărimile medii 6.5.2 Media aritmetică 6.5.3 Media armonică 6.5.4 Media pătratică 6.5.5 Media geometrică 6.5.6 Media caracteristicii alternative
6.6 Aplicaţii practice 6.7 Îndrumar pentru autoverificare 6.7.1 Sinteza unitatii de invatare 6.7.2 Concepte si termeni de retinut 6.7.3 Întrebări de control şi teme de dezbatere 6.7.4 Bibliografie
6.1 Introducere
Determinarea valorilor tipice care să fie reprezentative pentru întreaga colectivitate studiată se realizează prin calculul mărimilor medii care exprimă ceea ce este comun şi general în forma de manifestare a fenomenelor de masă urmărind eliminarea a ceea ce este întâmplător şi neesenţial în producerea lor.
Mărimile medii sunt: (I) indicatori derivaţi, (II) care au caracter abstract (Exemplu: salariul mediu de 662 (ne referim la lei grei de la 1 iulie 2005) lei s-ar fi putut să nu-l fi primit nici un individ din colectivitatea statistică) şi (III) se exprimă în unităţi de măsură concrete.
6.2 Obiectivele unităţii de studiu
– cunoaşterea semnificaţiei mărimilor medii; – cunoaşterea condiţiilor de calcul a mărimilor medii; – definirea mediei aritmetice, mediei armonice, mediei
pătratice şi mediei geometrice; – cunoaşterea proprietăţilor diferitelor tipuri de medii; – cunoaşterea utilizărilor diferitelor tipuri de medii
71
6.3 Competenţele unităţii de studiu:
– studenţii vor putea să definească media aritmetică, media armonică, media pătratică, media geometrică, media caracteristicii alternative;
– studenţii vor putea calcula medii simple sau medii ponderate, în funcţie de tipul seriilor statistice;
– studenţii vor cunoaşte proprietăţile mediilor studiate şi relaţiile dintre acestea;
– studenţii vor putea stabili ce tip de medie caracterizează cel mai bine fenomenul studiat;
6.4 Timpul alocat unităţii de studiu:
Pentru unitatea de studiu Analiza seriilor de distribuţie I –Mărimile medii , timpul alocat este de 2 ore.
6.5 Conţinutul unităţii de studiu
6.5.1 Condiţii de aplicare şi de calcul pentru mărimile medii
Calculul mărimilor medii trebuie să se bazeze pe un număr mare de cazuri individuale diferite.
Valorile individuale ale caracteristicii pentru care se calculează mărimile medii să nu difere prea mult de la o unitate la alta, deci colectivitatea să fie omogenă.
Dacă valorile individuale diferă semnificativ se calculează medii parţiale (sau pe grupe omogene).
Pentru a caracteriza cât mai corect fenomenul, trebuie ales acel tip de medie care corespunde cel mai bine formei de variaţie a caracteristicii studiate.
În practica statistică se utilizează: (i) media aritmetica, (ii) media armonică, (iii) media pătratică, (iv) media geometrică, (v) media cronologică. Toate aceste medii se calculează sub formă de medii simple sau ponderate. În analizele statistice se mai utilzează şi (vi) media caracteristicii alternative.
Mediile simple se utilizează atunci când numărul variantelor sub care s-a înregistrat caracteristica este egal cu numărul unităţilor la care s-a făcut observarea. Mediile ponderate se utilizează atunci când aceeaşi variantă se întâlneşte la mai multe unităţi de observare, deci fiecărei variante a caracteristicii i se poate ataşa o frecvenţă.
În continuare se vor descrie modul de calcul şi proprietăţile principalelor tipuri de medii utilizate în statistică, cu excepţia mediei cronologice, care se va trata la capitolul “Analiza seriilor cronologice”.
72
6.5.2 Media aritmetică In statistica social-economică, se utilizează cel mai des media
aritmetică, de aceea când se vorbeşte despre medie, se înţelege automat că este vorba despre media aritmetică, iar în cazul în care s-a calculat alt tip de medie se va specifica felul ei.
Definiţie 1. Media aritmetica este rezultatul sintetizării într-o singură
expresie numerică a tuturor nivelurilor individuale observate. Seobţine prin raportarea valorii totalizate a caracteristicii la numărultotal al unităţilor statistice observate.
2. Media aritmetica este valoarea la care ar fi ajuns fiecareunitate înregistrată dacă toţi factorii ar fi acţionat constant în toatecazurile.
3. Media aritmetică este acea valoare pe care dacă o utilizămpentru a înlocui toţi termenii seriei am obţine o sumă egală cu suma termenilor reali.
Media aritmetică simplă se calculează atunci când numărul variantelor sub care s-a înregistrat caracteristica este egal cu numărul unităţilor statistice.
Pentru calculul mediei aritmetice simple se fac următoarele
notaţii: x = caracteristica statistică;
x1, x2, ...., xn = valorile caracteristicii unde: i = n,1 ; n = numărul de unităţi înregistrate;
x = media aritmetică.
x1 + x2 + ....+ xn =
n
1iix
x + x + ....+ x = n x Prin egalarea ecuaţiilor de mai sus se obţine expresia:
n x =
n
1iix
de unde: x = n
xn
1ii
În calculele statistice se întâlnesc mai rar cazuri în care numărul variantelor (m) coincide cu numărul unităţilor (n). De regulă, aceeaşi valoare individuală se întâlneşte de mai multe ori şi, ca urmare, trebuie să se ţină cont şi de frecvenţele de apariţie.
x1 ; x2 ;....; xm fi = frecvenţa de apariţie a variabilei xi; n = numărul unităţilor statistice; f1 ; f2 ;....; fm m = numărul variantelor, m < n. Pentru seriile statistice de frecvenţe se utilizează media
aritmetică ponderată Nivelul totalizat al caracteristicii este:
x1 f1+ x2 f2+ ....+ xm fm= i
m
1ii fx
73
Dacă se înlocuiesc nivelurile individuale ale caracteristicilor cu
valoarea tipică, media,
x , se obţine:
x f1 + x f2+ ....+ x fm = x (f1 + f2 +...+fm) =
m
1iifx
Prin egalarea ecuaţiilor de mai sus se obţine:
m
1iifx = i
m
1ii fx
de unde: x =
m
1ii
m
1iii
f
fx
În cazul în care frecvenţele (numărul de apariţii) sunt
exprimate sub forma de procente relaţia de calcul a mediei aritmetice ponderate devine:
x = 100
%fx
%f
%fxm
1i
*ii
m
1ii
m
1i
*ii
unde: fi*% = 100
f
fm
1ii
i
şi 100%fm
1i
*i
.
Dacă frecvenţele sunt exprimate sub formă de zecimală, relaţia de calcul a mediei aritmetice ponderate devine:
x =
m
1i
*icim
1ici
m
1i
*ici
fxf
fx
unde: f*ic =
m
1ii
i
f
fşi 1f
m
1i
*ic
.
Calculul mediei într-o serie de distribuţie de frecvenţe pe intervale de grupare
Dacă repartiţia de frecvenţe se prezintă pe intervale de variaţie, xi reprezintă centrul de interval corespunzător.
O serie statistică pe intervale de grupare poate fi prezentată cu frecvenţe absolute (fi) sau cu frecvenţe relative (f*
i%; f*ic).
fi*% =
m
1ii
i
f
f; fi
*c =
m
1ii
i
f
f
unde: fi = frecvenţa absolută a grupei “i”;
74
fi*% = frecvenţa relativă a grupei “i” exprimată procentual;
fi*
c = frecvenţa relativă a grupei “i” exprimată sub formă de coeficient.
Considerând, în mod convenţional, că în fiecare interval
frecvenţele se distribuie uniform, înseamnă că valoarea medie a caracteristicii în fiecare grupă va fi egală cu media aritmetică simplă a celor doua limite, inferioară şi superioară. Cu cât intervalele sunt mai mici cu atât mărimea centrului de interval (ci) este mai reprezentativă pentru caracterizarea grupei respective.
2
sup.lim.inf.limci
sau ci = lim. inf. +1/2 (din mărimea intervalului) Dacă seria prezintă intervale deschise (sub 100, peste 1000)
este necesară închiderea intervalelor cu aceeaşi mărime ca şi a celor alăturate (intervalul următor, respectiv intervalul precedent).
În cazul seriilor pe intervale egale de grupare, dacă se calculează centrul de interval pentru prima grupă, celelalte centre de interval se află într-o progresie aritmetică cu raţia egală cu mărimea intervalelor.
În cazul seriilor pe intervale de grupare neegale calcularea fiecărui centru de interval este obligatorie, deoarece creşterea acestora nu mai este uniformă
Calculul mediei pentru o serie de distribuţie cu intervale de grupare nu este o mărime exactă. Doar în mod convenţional se consideră că frecvenţele se distribuie uniform în interval, în realitate, valorile centrelor de interval nu sunt medii exacte pentru grupele de unităţi constituite după caracteristica de grupare aleasă.
Media aritmetică determinată pe baza unei serii de distribuţie de frecvenţe pe intervale de grupare va fi cu atât mai apropiată de media calculată din datele individuale centralizate cu cât: (i) frecvenţele sunt mai mari; (ii) frecvenţele sunt simetric distribuite, (iii) mărimea intervalelor de grupare este mai mica.
Media se exprimă în unitatea de măsură a variabilei. Media este exactă atunci când o calculăm direct din valorile
sub care s-a înregistrat caracteristica. Ea este o medie aproximativă când o calculăm pe baza unei serii pe intervale de variaţie. În acest caz determinarea mediei se bazează pe stabilirea centrelor de interval în ipoteza repartizării uniforme a frecvenţelor în cadrul fiecărui interval.
Proprietăţile mediei aritmetice a) Într-un şir de valori egale media acestora este egală cu
fiecare dintre ele indiferent dacă seria este o serie simplă sau o serie de frecvenţe:
x1 = x2 = ....= xi = ....= xn = xc
x = cc
n
1ii
xn
xn
n
x
b) Media aritmetică este întotdeauna o valoare cuprinsă în intervalul de variaţie al caracteristicii:
xmin < x < xmax
75
Dacă din calcule rezultă că media se plasează în afara acestor limite, rezultatul este în mod sigur eronat.
c) În cazul unei serii de distribuţie de frecvenţe, media se încadrează între valorile extreme ale variabilei, oscilând în jurul termenului cu frecvenţa cea mai mare.
Proprietăţile a), b) şi c) servesc la calculul logic al mediei aritmetice.
d) Într-o serie statistică suma algebrică a tuturor abaterilor individuale ale termenilor seriei de la media lor aritmetică este egală cu «0», adică:
0xxn
1ii
Demonstraţie pentru cazul unei serii simple:
0n
xnxxnxxxxx
n
1i
n
1ii
i
n
1ii
n
1i
n
1ii
n
1ii
În cazul seriei de frecvenţe, compensarea reciprocă a
abaterilor are loc după relaţia:
0fxx i
m
1ii
0
f
fx
ffx
fxfxfxfxfxx
m
1im
1ii
m
1iiim
1iiii
m
1ii
m
1iii
m
1i
m
1iiiii
m
1ii
Proprietăţile a) d) permit verificarea exactităţii calculelor. e) Dacă într-o serie statistică se micşorează sau se măresc toţi
termenii cu o constantă “a” şi se calculează media aritmetică a noilor termeni, această medie va fi mai mică sau mai mare decât media seriei iniţiale cu constanta “a”.
Demonstraţie pentru cazul unei serii simple. Noua serie cu termeni măriţi sau micşoraţi va fi:
x1’ = x1 a; x2’ = x2 a;.....; xn’ = xn a Aplicând relaţia de calcul a mediei aritmetice simple pentru
noua serie, obţine relaţia:
axn
an
n
x
n
ax
n
ax.....axax'x
n
1ii
n
1ii
n21
76
Pentru cazul unei serii de frecvenţe se obţine, în mod similar:
ax
f
fa
f
fx
f
fax
'xm
1ii
m
1ii
m
1ii
m
1iii
m
1ii
i
m
1ii
f) Dacă într-o serie statistică se amplifică sau se simplifică toţi
termenii seriei cu un factor constant “k” şi se calculează media noilor termeni, aceasta va avea o valoare care va fi de “k” ori mai mare sau mai mică decât media seriei iniţiale.
Demonstraţie: 1.Termeni amplificaţi
Pentru cazul unei serii simple, noua serie cu termeni amplificaţi va fi:
x1’ = x1 k; x2’ = x2k;.....; xn’ = xn k Aplicând relaţia de definiţie a mediei aritmetice simple pentru
noua serie, se obţine:
xkn
xk
n
kx....kxkx'x
n
1ii
n21
Pentru cazul unei serii de frecvenţe cu termeni amplificaţi se
obţine:
xk
f
fxk
f
fkx
'xm
1ii
m
1iii
m
1ii
i
m
1ii
1.Termeni simplificaţi Ppentru cazul unei serii simple, noua serie cu termeni
simplificaţi va fi
x1’ = k
x1 ; x2’ = k
x2 ;.....; xn’ =k
xn
Aplicând relaţia de definiţie a mediei aritmetice simple pentru noua serie, se obţine:
xk
1
n
xk
1
nk
x....
k
x
k
x
'x
n
1ii
n21
Pentru cazul unei serii de frecvenţe cu termeni simplificaţi se obţine:
xk
1
f
fxk
1
f
fk
x
'xm
1ii
m
1iii
m
1ii
i
m
1i
i
Proprietăţile e) - f) servesc la calculul simplificat al mediei
77
aritmetice. Utilizarea calculului simplificat al mediei este recomandabil atunci când seria se prezintă pe intervale de variaţie egale.
În cazul unei serii de distribuţie de frecvenţe, dacă din toţi termenii seriei vom scădea constanta “a” şi apoi îi vom împărţi cu constanta “k”, va rezulta o nouă medie. Pentru a obţine media iniţială vom înmulţi noua medie cu constanta “k” şi vom aduna apoi constanta “a”. In acest scop se utilizează relaţia:
ak
f
fk
ax
xm
1ii
i
m
1i
i
unde este de preferat ca cele două constante “a” şi “k” să fie: “a” = mijlocul unui interval, de obicei centrul intervalului cu frecvenţa cea mai mare; “k” = mărimea (lungimea) intervalului de grupare; un divizor al diferenţei “xi - a”.
g) Dacă într-o serie statistică de distribuţie se reduc proporţional toate frecvenţele cu aceeaşi constanta “c”, media calculată pe baza noilor frecvenţe rămâne neschimbată, adică:
Demonstraţie Pornind de la relaţia mediei aritmetice ponderate
m
1ii
m
1iii
m21
mm2211
f
fx
f.....ff
fx....fxfxx
în care, dacă se înlocuiesc noile valori ale frecvenţei, rezultă:
m
1ii
m
1iii
m
1ii
m
1iii
m
1i
i
m
1i
ii
m21
mm
22
11
f
fx
fc
1
fxc
1
c
fc
fx
c
f.....
c
f
c
fc
fx....
c
fx
c
fx
'x
Această proprietate serveşte la calculul mediei cu ajutorul frecvenţelor relative.
Demonstraţie. În cazul în care constanta “c” este
m
1iif
78
x
f
fx
f
f
1
fx
f
1
f
f
f
fx
m
1ii
m
1iii
m
1iim
1ii
m
1iiim
1ii
m
1im
1ii
i
m
1im
1ii
ii
Din relaţia de mai sus reiese faptul că media nu se schimbă dacă frecvenţele absolute “fi” sunt înlocuite cu frecvenţele relative corespunzătoare, fi
*.
. xf
fx
f
f
f
fx
m
1i
*i
m
1i
*ii
m
1im
1ii
i
m
1im
1ii
ii
Dacă frecvenţa relativă se exprimă procentual,
100
f
f%f
m
1ii
i*i
, atunci 100%fm
1i
*i
şi relaţia se poate scrie:
100
%fx
%f
%fxx
m
1i
*ii
m
1i
*i
m
1i
*ii
Dacă frecvenţa relativă se exprimă zecimal,
m
1ii
i*zi
f
ff ,
atunci 1fm
1i
*zi
şi relaţia devine:
m
1i
*ziim
1i
*zi
m
1i
*zii
fxf
fxx
h) Într-o serie de variaţie cu frecvenţe egale media aritmetică ponderată se transformă într-o medie simplă.
Demonstraţie: Fie fc = frecvenţa constantă, adică f1 = f2 = ... = fm =fc,:
m
x
fm
xf
fm
fx
f.....ff
fx....fxfx'x
m
1ii
c
m
1iic
c
m
1ici
ccc
cmc2c1
i) Într-o colectivitate împărţită în “r” grupe omogene, media pe
total (n
xx
n
1ii
o
) se poate calcula pe baza mediilor de grupă
79
(
m
1ii
i
m
1ii
i
f
fxx ) folosind în acest scop următoarea relaţie:
r
1ii
i
r
1i
i
o
n
nxx
unde:
m = numărul de variante ale caracteristicii din fiecare grupă “r”; r = numărul de grupe; n = numărul unităţilor statistice din colectivitatea generală, m < n,
ni = numărul unităţilor statistice din grupa r;
m
1iii fn ,
r
1iinn .
fi = numărul de apariţii ale variantei m în grupa r
j) Media aritmetică a sumei a două variabile întâmplătoare “X”
şi “Y” este egală cu suma mediilor celor două variabile luate în calcul.
Notând variabilele factoriale “x” şi “y” şi variabila complexa “x + y” se obţine:
yxyx
unde vom înlocui pe n
)yx(
yx
n
1iii
şi va rezultă:
yx
n
y
n
x
n
yx
n
yx....yxyxyx
n
1ii
n
1ii
n
1i11
nn2211
GENERALIZARE. Valoarea medie a sumei mai multor
variabile independente este egală cu suma valorilor medii ale tuturor variabilelor luate în calcul.
k) Media produsului a două variabile întâmplătoare este egală
cu produsul mediilor celor două variabile.
Notând variabile factoriale “x” şi “y” şi variabila complexă “ xy ”, se obţine:
80
yxxy Ştiind că:
n
y
n
y...yyy
n
x
n
x...xxx
n
1ii
n21
n
1ii
n21
relaţia devine:
nnn
yn
x....2
yn
x1
yn
x...n
y2
x....2
y2
x1
y2
xn
y1
x....2
y1
x1
y1
xxy
yx
nn
yx
nn
yx...xx
nn
yx...yxyxn
1ii
n
1ii
n
1iin21
n
1iin
n
1ii2
n
1ii1
GENERALIZARE: Media produsului mai multor variabile
întâmplătoare, este egală cu produsul mediilor fiecărei variabile.
6.5.3 Media armonică Definiţie
Media armonică (xh) a termenilor unei serii este acea valoare a cărei mărime inversă este media aritmetică calculată din valorile inverse ale termenilor aceleiaşi serii.
Relaţiile de calcul sunt:
pentru o serie simplă
n
1i ix
1n
x h
pentru o serie de repartiţie de frecvenţe
m
1ii
i
m
1ii
fx
1
f
x h
Dacă toate valorile caracteristicii sunt pozitive, media
armonică este întotdeauna mai mică decât media aritmetică calculată pe baza aceloraşi valori.
Dacă se consideră două variabile dependente funcţional, y = 1/x şi pentru o variabilă se utilizează media aritmetica, atunci pentru cealaltă variabilă este obligatoriu să se utilizeze media armonică. Dacă din evidenţe rezultă numai variantele caracteristicii (xi) şi produsele de frecvenţă “xifi” fără să avem date despre frecvenţele absolute “fi” pentru calculul mediei armonice ponderate se va utiliza următoarea formulă:
81
m
1iii
i
m
1iii
fxx
1
fx
x h
Media armonică poate fi egală cu media aritmetică calculată
din aceleaşi valori ale caracteristicii, dar folosind sisteme de ponderare diferite.
m
1iii
i
m
1iii
m
1ii
m
1iii
fxx
1
fxx
f
fxx h
Media armonică este egală cu media aritmetică numai în cazul în care media aritmetică are ca ponderi frecvenţele absolute “fi”, iar media armonică are ca ponderi produsele “xifi”. Utilizând acest sistem de ponderare, media armonică poate fi uşor transformată în medie aritmetică.
Media armonică determinată cu acest sistem de ponderare se foloseşte la calculul nivelului mediu al unei caracteristici derivate cu caracter de mărime medie. Exemplu, (i) indicele mediu de grup al preţurilor (când lipsesc informaţii despre volumul fizic al mărfurilor), (ii) la calculul salariului mediu pe întreprindere, când se cunoaşte salariul mediu şi fondul de salarii la nivelul secţiilor, (iii) la calculul producţiei medii la hectar în cadrul unei unităţi agricole, când se cunoaşte recolta medie şi recolta totală pe parcelele acesteia.
În comparaţie cu media aritmetică, media armonică este mai puţin influenţată de valorile extreme.
6.5.4 Media pătratică Definiţie Media pătratică (xp) este acea valoare pe care dacă o utilizăm
pentru a înlocui toţi termenii seriei am obţine o sumă egală cu sumapătratelor termenilor reali.
Demonstraţie pentru cazul unei serii simple
n
1i
2i
2n
22
21 xx...xx
Dacă fiecare termen al relaţiei de mai sus este înlocuit cu media
pătratică, se obţine:
n
1i
2i
2p
2p
2p xx...xx
adică
n
1i
2i
2p xxn
82
deci: n
xx
n
1i
2i
p
Similar, pentru cazul unei serii de frecvenţe se obţine:
m
1ii
m
1ii
2i
p
f
fxx
xh <x <xp Media pătratică se utilizează la calculul abaterii medii
pătratice, fiind unul din cei mai utilizaţi indicatori de variaţie.
6.5.5 Media geometrică Definiţie Media geometrică (“Xg”) este acea valoare pe care dacă o
utilizăm pentru a înlocui toţi termenii seriei am obţine un produsegal cu produsul termenilor reali.
Demonstraţie pentru cazul unei serii simple:
x1 · x2 · .... · xn =
n
iix
1
Dacă fiecare termen al seriei este înlocuit cu media
geometrică
xg ·xg ·....· xg =
n
1iix
se obţine
(xg)n =
n
1iix ,
iar relaţia de calcul pentru media geometrică simplă este:
xg = n
n
1iix
In cazul seriilor de distribuţie de frecvenţa se calculează media geometrică ponderată, adică:
m
i
fi
fm
ff im xxxx1
21 ...21
Dacă fiecare termen este înlocuit cu media geometrică,
obţinem:
m
i
fi
fg
fg
fg
im xxxx1
)(...)()( 21
Prin egalarea ecuaţiilor de mai sus se obţine:
83
m
i
fi
fg
i
m
ii xx
1
1
iar relaţia de calcul pentru media geometrică ponderată este:
m
ii
if m
i
fig xx 1
1
O metodă de determinare, atât a mediei geometrice simple, cât
şi a celei ponderate constă în logaritmarea variabilei. Astfel se obţine:
- pentru media geometrică simplă:
n
xlogxlog
n
1ii
g
- pentru media geometrică ponderată
m
1ii
m
1iii
g
f
xlogfxlog
Proprietăţile mediei geometrice sunt: a) Dacă un termen al seriei este cu zero sau are valoare
negativă, media geometrică a seriei nu se mai poate calcula. b) Abaterile termenilor seriei faţă de medie nu se mai
calculează ca diferenţe, ca şi în cazul mediei aritmetice, ci sub formă de rapoarte xi / xg, iar produsul acestor abateri este întotdeauna egal cu 1.
c) Media geometrică se utilizează frecvent în cazul seriilor dinamice, la calculul mediilor din mărimile relative ale dinamicii, între care există o relaţie de produs (de exemplu, calculul indicelui mediu de dinamică).
d) Media geometrică se foloseşte mai rar în cazul seriilor de distribuţie de frecvenţe. Acest tip de medie este recomandabil să se utilizeze atunci când seria prezintă variaţii foarte mari între termeni sau un pronunţat caracter de asimetrie.
e) Prin logaritmare media geometrică se transformă într-o medie aritmetică a logaritmilor factorilor, iar antilogaritmul ei este o valoare mai mică decât media aritmetică calculată din valorile reale ale termenilor seriei (xg < x ).
Între tipurile de medii prezentate mai sus există următoarea
relaţie: xh < xg < x < xp
6.5.6 Media caracteristicii alternative În cercetarea statistică a fenomenelor social-economice se
întâlnesc caracteristici ale căror variante nu se exprimă numeric (cantitativ), ci prin cuvinte (calitativ) şi nu admit decât una din două alternative. Orice caracteristică numerică nealternativă se
84
poate transforma într-o caracteristică alternativă prin raportarea la un anumit prag care poate fi, de exemplu, media aritmetică. In această situaţie, unităţile colectivităţii se vor separa în două grupe: unităţi cu nivel de dezvoltare mai mic decât media şi unităţi cu nivel de dezvoltare mai mare decât media.
Caracteristica alternativă are doar două variante da - nu (de exemplu, produs bun - produs rebut, populaţie ocupată - populaţie neocupată, salariaţi care şi-au îndeplinit norma - salariaţi care nu şi-au îndeplinit norma, student promovat - student nepromovat).
Pentru a calcula media aritmetică a caracteristicii alternative este necesar să se exprime numeric cele două variante pe care le pot lua aceste caracteristici.
Convenţional, se vor considera variantele cu răspuns afirmativ ca având valoarea “1”, iar variantele cu răspuns negativ ca având valoarea “0”.
Valorile caracteristicii vor fi: x1 = 1, pentru răspunsul “da” şi x2 = 0, pentru răspunsul “nu”.
Pentru a demonstra cât mai clar modul de calcul al mediei caracteristicii alternative, vom sistematiza elementele necesare aşa cum este prezentat în tabelul 6.1.
Tabelul 6.1.Distribuţia de frecvenţe a caracteristicii alternative
Răspunsul înregistrat
Valoarea caracteristicii
(xi)
Frecvenţe absolute (fi)
Frecvenţe relative (fiz)
Da x1 = 1 M p = M/N Nu x2 = 0 N - M q = (N - M)/N =
1 - M/N = = 1 - p
Total N = M + (N -M)
p + q = 1
unde:
M = numărul unităţilor ce posedă caracteristică; N = numărul total al unităţilor; N - M = numărul unităţilor ce nu posedă caracteristică. În cazul distribuţiei de frecvenţă prezentată în tabel, media se
va calcula aplicând relaţia de calcul a mediei aritmetice ponderate descrisă de ecuaţia 6.8, care pentru cazul nostru devine:
x =
m
1ii
m
1iii
f
fx = p
N
M
MNM
MNM
)(
)(01
Se poate observa că media caracteristicii alternative reprezintă
tocmai frecvenţa relativă (exprimată zecimal) a răspunsurilor afirmative.
Altfel spus, media caracteristicii alternative se obţine raportând numărul de unităţi la care s-a înregistrat una din cele două variante ale caracteristicii, la numărul total al unităţilor statistice. Deoarece unităţile colectivităţii se divid în doua părţi, unele care posedă caracteristică şi altele care nu posedă caracteristică, media caracteristicii alternative poate fi considerată şi ca o mărime relativă de
85
structură, o pondere, o greutate specifică, o frecvenţă relativă. Exemplu: Dintr-o colectivitate N = 2000 persoane un număr
M = 20 persoane au declarat că locuiesc într-o zonă rezidenţială, deci media caracteristicii alternative ”persoane care locuiesc într-o zonă rezidenţială” este p = M/N = 20/2000 = 0,01, ceea ce reprezintă 1%.. Ponderea persoanelor care nu locuiesc într-o zonă rezidenţialăva fi 99%.
Pentru calculul mediei generale (p) din medii parţiale ale unei
caracteristici alternative (pi) se poate utiliza relaţia de calcul a mediei aritmetice ponderate.
Ştiind că: i
ii N
Mp
se obţine:
m
1ii
m
1iii
N
Np
p
Dacă în relaţia de mai sus se înlocuieşte pi Ni = Mi, se obţine
m
1ii
m
1ii
N
M
p
unde: p = media generală a caracteristicii alternative; pi = media de grupă a caracteristicii alternative; Ni = frecvenţa unităţilor din fiecare grupă; m = numărul de grupe în care a fost împărţită colectivitatea; Mi = frecvenţa unităţilor care îndeplinesc caracteristica în fiecare grupă.
În aplicaţiile concrete, mărimile medii nu se folosesc aleatoriu, ci în funcţie de specificul şi proprietăţile fenomenelor.
Cea mai frecventă întrebare care se poate pune este: “Care dintre tipurile de medii descrise caracterizează mai exact o serie statistica?” Pentru a răspunde la această întrebare trebuie analizată seria de valori, deoarece pentru orice colectivitate statistică există o proprietate determinantă, care trebuie să rămână neschimbată oricare ar fi variaţiile posibile ale valorilor înregistrate, xi. Media este deci o valoare “x ” reprezentativă pentru o serie de variante x1, x2,..., xn, care prin substituţia xi = x nu modifică proprietatea determinantă a seriei.
6.6 Aplicaţii practice Problema 6.1. Pentru patru unităţi statistice s-au înregistrat datele 2, 5, 7, 10.Să se calculeze tipurile de medii cunoscute şi să se verifice relaţia dintre acestea.
86
Media aritmetică simplă: 64
24
4
10752
n
x
x
n
1ii
Media armonică simplă: 24,49428,0
4
10
1
7
1
5
1
2
14
x
1
nx
n
1i i
h
Media pătratică simplă: 67,64
10752
n
x
x2222
n
1i
2i
p
Media geometrică simplă: 14,570010752xx 44n
n
1iig
Între cele patru tipuri de medii există relaţia:
67,6614,524,4
xxxx pgh
Problema 6.2. Pentru 14 unităţi statistice s-au înregistrat datele:
xi 2 5 7 10 fi 3 4 5 2
Să se calculeze tipurile de medii cunoscute şi să se verifice relaţia dintre acestea.
Media aritmetică ponderată: 78,514
81
14
210574532
f
fxx
m
1ii
i
m
1ii
Media armonică ponderată: 35,42
10
15
7
14
5
13
2
114
fx
1
f
xm
1ii
i
m
1ii
h
Media pătratică ponderată: 30,614
210574532
f
fxx
2222
m
1ii
m
1ii
2i
p
Media geometrică ponderată: 11,510016807625810752xx 1414 2543f m
1i
fig
m
1ii
i
87
11,5x7088,0xlog
7088,0924,914
1)10log27log55log42log3(
14
1xlog
xlogff
1xlog
gg
g
iii
g
30,698,511,535,4
xxxx pgh
6.7 Îndrumar pentru autoverificare
6.7.1 Sinteza unităţii de studiu
Media aritmetică este cel mai cunoscut indicator al tendinţei centrale şi se calculează raportând suma valorilor la numărul lor. Media aritmetică este considerată în principiu reprezentativă pentru că ia în calcul toate valorile unei serii de date. Principalul dezavantaj al mediei aritmetice constă în faptul că, prin modul de calcul acordă aceeaşi importanţă valorilor extreme, deci nu poate fi considerată reprezentativă în cazul în care se întâlnesc astfel de valori. Doar accidental mărimea mediei aritmetice coincide cu vreo valoare individuală observată. Dacă toate valorile caracteristicii sunt pozitive, media armonică este întotdeauna mai mică decât media aritmetică calculată pe baza aceloraşi valori. Dacă se consideră două variabile dependente funcţional, y = 1/x şi pentru o variabilă se utilizează media aritmetica, atunci pentru cealaltă variabilă este obligatoriu să se utilizeze media armonică. Media armonică poate fi egală cu media aritmetică calculată din aceleaşi valori ale caracteristicii, dar folosind sisteme de ponderare diferite.Media armonică este egală cu media aritmetică numai în cazul în care media aritmetică are ca ponderi frecvenţele absolute “fi”, iar media armonică are ca ponderi produsele “xifi”. Utilizând acest sistem de ponderare, media armonică poate fi uşor transformată în medie aritmetică.În comparaţie cu media aritmetică, media armonică este mai puţin influenţată de valorile extreme.
Media pătratică se utilizează când se dă o mai mare importanţă termenilor mai mari ai seriei. Media pătratică este întotdeauna mai mare decât media aritmetică a aceloraşi termeni. Dacă un termen al seriei este cu zero sau are valoare negativă, media geometrică a seriei nu se mai poate calcula. Abaterile termenilor seriei faţă de medie nu se mai calculează ca diferenţe, ca şi în cazul mediei aritmetice, ci sub formă de rapoarte xi / xg, iar produsul acestor abateri este întotdeauna egal cu 1.Media geometrică se utilizează frecvent în cazul seriilor dinamice, la calculul mediilor din mărimile relative ale dinamicii, între care există o relaţie de produs (de exemplu, calculul indicelui mediu de dinamică). Media geometrică se foloseşte mai rar în cazul seriilor de distribuţie de frecvenţe. Acest tip de medie este recomandabil să se utilizeze atunci când seria prezintă variaţii foarte mari între termeni sau un pronunţat caracter de asimetrie. Prin logaritmare media geometrică se transformă într-o medie aritmetică a logaritmilor factorilor, iar antilogaritmul ei este o valoare mai mică decât media aritmetică calculată din valorile reale ale termenilor seriei.
Media caracteristicii alternative se obţine raportând numărul de unităţi la care s-a înregistrat una din cele două variante ale caracteristicii, la numărul total al unităţilor statistice.
88
Relaţiile de calcul pentru diferitele tipuri de medii
Tip medie Medii simple Medii ponderate
Media aritmetică
x = n
xn
1ii
m
1ii
m
1iii
f
fxx = *
iz
m
1ii
m
1i
*ii
m
1i
*i
m
1i
*ii
fx100
%fx
%f
%fx
Media armonică
n
1i i
h
x
1n
x
m
1ii
i
m
1ii
fx
1
f
x h =
m
ii
i
m
ii
i
m
ii
fx
fx
f
1
*
1
*
1
*
%1100
%1
%=
m
1i
*iz
i
fx
11
Media pătratică
n
xx
n
ii
p
1
2
m
1ii
m
1ii
2i
p
f
fxx =
m
ii
m
iii
f
fx
1
*
1
*2
%
%=
100
%fxm
1i
*i
2i
=
m
1i
*iz
2i fx
Media geometric
ă
xg = n
n
1iix
m
1ii
if m
1i
fig xx
Între cele patru tipuri de medii există relaţia:
pgh xxxx
Media caracteristicii alternative:
NMp
6.7.2 Concepte şi termeni de reţinut
mărimi medii; medii simple, medii ponderate; frecvenţă absolută; frecvenţă relativă exprimată procentual sau zecimal; media aritmetică; media armonică; media pătratică; media geometrică; media cronologică media caracteristicii alternative.
89
6.7.3 Întrebări de control şi teme de dezbatere
1. Care sunt condiţiile de care trebuie ţinut cont la calculul mărimilor medii? 2. Enumeraţi tipurile de medii utilizate în analizele statistice. 3. Când se calculează medii simple şi când se calculează medii ponderate? 4. Definiţi media aritmetică şi prezentaţi modul de calcul al mediei aritmetice simple şi al mediei
aritmetice ponderate 5. Prezentaţi proprietăţile şi utilizările mediei aritmetice. 6. Definiţi media armonică şi prezentaţi modul de calcul al mediei armonice simple şi al mediei
armonice ponderate 7. Prezentaţi proprietăţile şi utilizările mediei armonice. 8. Definiţi media pătratică şi prezentaţi modul de calcul al mediei pătratice simple şi al mediei
pătratice ponderate 9. Prezentaţi proprietăţile şi utilizările mediei pătratice. 10. Definiţi media geometrică şi prezentaţi modul de calcul al mediei geometrice simple şi al
mediei geometrice ponderate 11. Prezentaţi proprietăţile şi utilizările mediei geometrice. 12. Definiţi media caracteristicii alternative şi prezentaţi modul de calcul al acesteia. 13. Ce relaţie există între media aritmetică, media geometrică, media pătratică şi media armonică.
6.7.4 Bibliografie:
1. Biji, M., Biji, E. M., Lilea, E., Anghelache, C., (2002), Tratat de statistică, Editura Economica, Bucureşti
2. Biji, E.M., Lilea, E., Roşca, E., Vătui, M., (2010), Statistică pentru economişti, Editura Economică, Bucureşti;
3. Druică, E., (2012), Statistică pe înţelesul tuturor, Editura CH Beck, Bucureşti; 4. Duguleană, L., (2012) Bazele statisticii economice, Editura CH Beck, Bucureşti; 5. Turdean, M., (2012), Statistica, Editura Pro Universitaria, Bucureşti;
90
7 UNITATEA DE STUDIU 7 ANALIZA SERIILOR DE DISTRIBUŢIE -II – MĂRIMILE MEDII DE POZIŢIE
7.1 Introducere 7.2 Obiectivele unităţii de studiu 7.3 Competenţele unităţii de studiu 7.4 Timpul alocat unităţii de invăţare 7.5 Conţinutul unităţii de studiu
7.5.1 Mediana 7.5.2 Modul 7.5.3 Cuartile 7.5.4 Decile
7.6. Aplicaţii practice 7.7. Îndrumar pentru autoverificare 7.7.1 Sinteza unitatii de invatare 7.7.2 Concepte si termeni de retinut 7.7.3 Întrebări de control şi teme de dezbatere 7.7.4 Bibliografie
7.1 Introducere
Mărimile medii reflectă ceea ce este esenţial şi tipic în nivelul de dezvoltare a fenomenelor, dar nu caracterizează modul de repartiţie a frecvenţelor în cadrul seriei.
Pentru a completa analiza seriilor de distribuţie este necesară şi calcularea unor valori medii de poziţie dintre care mediana şi modul (sau dominanta) sunt cele mai importante.
7.2 Obiectivele unităţii de studiu
– cunoaşterea indicatorilor care completează analiza seriilor de distribuţie;
– definirea noţiunilor: mediană, mod, cuartile, decile; – cunoaşterea modului de calcul al acestor indicatori în cazul
seriilor pe variante şi în cazul seriilor de distribuţie de frecvenţe; – definirea şi utilizarea indicatorilor coeficient de variaţie
intercuartilică şi coeficient de variaţie interdecilică.
7.3 Competenţele unităţii de studiu:
– studenţii vor putea să definească noţiuni ca: mediana, mod, cuartile, decile, coeficient de variaţie intercuartilică şi
91
coeficient de variaţie interdecilică. – studenţii vor cunoaşte etapele de calcul ale indicatorilor de
poziţie pentru seriile pe variante şi pentru seriile de distribuţie de frecvenţe;
– şi vor putea calcula şi interpreta nivelul indicatorilor de poziţie pentru seriile pe variante şi pentru seriile de distribuţie de frecvenţe;
– studenţii vor putea calcula şi interpreta valorile obţinute pentru coeficientul de variaţie intercuartilică şi coeficientul de variaţie interdecilică;
7.4 Timpul alocat unităţii de studiu:
Pentru unitatea de studiu „Analiza seriilor de distribuţie II – Mărimile medii de poziţie”, timpul alocat este de 2 ore.
7.5 Conţinutul unităţii de studiu
7.5.1 Mediana Definiţie Mediana (Me) reprezintă valoarea centrală a unei serii
statistice ordonată crescător sau descrescător, care împartetermenii seriei în două părţi egale: 50% din numărul termenilor vor fi mai mici decât mediana şi 50% dintre aceştia vor fi mai maridecât mediana.
* Calculul medianei pentru cazul seriilor pe variante: În cazul seriilor simple, locul medianei se determină conform
relaţiei:
locul Me = 2
1n
unde: n = numărul termenilor seriei. Pentru seriile pe variante cu număr impar de termeni (n = 2k +
1), valoarea medianei este dată de valoarea termenului de rang “k+1”, adică valoarea termenului central care are proprietatea de a împărţi termenii seriei ordonată crescător (sau descrescător) în doua părţi egale.
Pentru seriile pe variante cu număr par de termeni (n = 2k), mediana se poate determina ca medie aritmetică simplă a celor doi termeni centrali.
* Calculul medianei pentru cazul seriilor de distribuţie de frecvenţe:
Pentru seriile de distribuţie de frecvenţe pe intervale, calculul medianei presupune acceptarea următoarei ipoteze: în fiecare interval frecvenţele se distribuie uniform.
Calculul propriu-zis al valorii medianei este precedat de determinarea frecvenţelor absolute cumulate crescător, a locului
92
medianei şi a intervalului median:
locul Me =
1f2
1 n
1ii
Intervalul median va fi acel interval a cărui frecvenţă absolută
cumulată crescător ( cumMef ) este prima mai mare decât locul medianei
dat de relaţia de calcul.
cumMef >
1f2
1 n
1ii
Relaţia de calcul a medianei pentru o serie de distribuţie de frecvenţe este:
Me = x0 + h abs
Me
cumpMe
n
1ii
f
f1f2
1
unde: x0 = limita inferioară a intervalului median; h = mărimea intervalului median;
cumpMef = frecvenţa cumulată a intervalului precedent celui median; abs
Mef = frecvenţa absolută a intervalului median.
Pentru a determina pe grafic valoarea medianei se va utiliza curba cumulativă a frecvenţelor (figura 7.1). Se suprapun pe acelaşi grafic curba frecvenţelor cumulate crescător şi curba frecvenţelor cumulate descrescător, iar din punctul lor de intersecţie se coboară o perpendiculară pe axa absciselor unde se va citi valoarea medianei.
Me Figura 7.1. Determinarea grafică a medianei Mediana se exprimă în aceeaşi unitate de măsură ca şi variabila studiată.
7.5.2 Modul (dominanta) Definiţie
Modul unei distribuţii statistice este acea valoare a caracteristicii care corespunde frecvenţei maxime.
Fiind valoarea cea mai frecvent întâlnită, modul mai este cunoscut în literatura de specialitate şi sub denumirea de dominanta seriei.
Pentru seriile de variante modul se calculează în cazul în care există un nivel al caracteristicii care apare de mai multe ori. Se determină frecvenţa maximă şi se citeşte valoarea caracteristicii corespunzătoare.
Pentru o serie de distribuţie de frecvenţe pe intervale se stabileşte întâi intervalul modal, adică acel interval care are frecvenţa maximă. Relaţia de calcul a modului este:
93
M0 = x0 + h 21
1
unde: x0 = limita inferioară a intervalului modal; h = mărimea intervalului modal; 1 = diferenţa dintre frecvenţa absolută a
intervalului modal şi frecvenţa absolută a intervalului precedent celui modal;
2 = diferenţa dintre frecvenţa absolută a intervalului modal şi frecvenţa absolută a intervalului următor celui modal.
Pentru seriile de distribuţie pe intervale, determinarea grafică a modului se face cu ajutorul histogramei (figura 7.2). Se notează pe grafic cu A, B, C şi D punctele de coordonate:
Fig. 7.2 Determinarea grafică a modului
A = limita inferioară a intervalului modal, frecvenţa intervalului precedent celui modal;
B = limita inferioară a intervalului modal, frecvenţa intervalului modal;
C = limita superioară a intervalului modal, frecvenţa intervalului modal;
D = limita superioara a intervalului modal, frecvenţa intervalului următor celui modal.
Din punctul de intersecţie a segmentelor de dreaptă care unesc punctele A şi C, respectiv punctele B şi D se trasează o perpendiculară pe abscisă unde se citeşte valoarea modului.
Uneori modul poate înlocui valoarea mediei aritmetice, când aceasta nu are sens sau nu poate fi calculata.
Exemplu. Talia în industria confecţiilor (la femei, nr. 48 - 52; la bărbaţi, nr. 52 - 56); mărimea cea mai des solicitată la încălţăminte (la femei nr. 36 - 37; la bărbaţi nr. 40 - 42). Modul se exprimă în aceeaşi unitate de măsură ca şi variabila studiată.
7.5.3 Cuartile Pentru seriile de distribuţie de frecvenţe cu tendinţă pronunţată
de asimetrie sau caracterizate printr-o amplitudine mare a variaţiei, se calculează şi alţi indicatori de poziţie cum ar fi: cuartile, decile, percentile.
94
Definiţie Cuartilele sunt acele valori ale caracteristicii care separă o
serie statistică ordonată crescător sau descrescător în patru părţiegale.
Cele trei cuartile care se calculează sunt: Q1 - 25% din termenii seriei sunt mai mici decât Q1 şi 75% din
termeni sunt mai mari decât Q1; Q2 este egală cu mediana, adică 50% din termenii seriei sunt
mai mici decât Q2 şi 50% din termenii seriei sunt mai mari decât Q2;
Q3 - 75% din termenii seriei sunt mai mici decât Q3 şi 25% din termeni sunt mai mari decât Q3.
Modul de calcul al cuartilelor este asemănător cu cel al medianei şi urmează etapele:
a) Seria se ordonează crescător; b) Se determină frecvenţele absolute cumulate crescător; c) Se calculează locul Q1 şi locul Q3:
locul Q1 =
1f4
1 n
1ii
locul Q3 =
1f4
3 n
1ii
d) Se determină intervalul în care se situează Q1, ca fiind acel interval a cărui frecvenţă absolută cumulată crescător
cum
1Qf este prima mai mare decât locul Q1 dat de relaţia de calcul;
e) Se determină intervalul în care se situează Q3, ca fiind acel interval a cărui frecvenţă absolută cumulată crescător
cum
3Qf este prima mai mare decât locul Q3 dat de relaţia de calcul;
f) Calculul efectiv al valorilor Q1, Q2 şi Q3 are loc după relaţiile:
Q1 = x0 + h abs
Q
cumpQ
n
1ii
1
1
f
f1f4
1
Q2 = Me = x0 + h abs
Me
cumpMe
n
1ii
f
f1f2
1
Q3 = x0 + h absQ
cumpQ
n
1ii
3
3
f
f1f4
3
unde: x0 = limita inferioară a intervalului în care se situează Q1, respectiv Q3; h = mărimea intervalului în care se situează Q1, respectiv Q3;
cum
1pQf = frecvenţa cumulată a intervalului precedent celui în care se
95
situează Q1; cum
3pQf = frecvenţa cumulată a intervalului precedent celui în care se
situează Q3; abs
1Qf = frecvenţe a absolută a intervalului în care se situează Q1;
abs
3Qf = frecvenţe a absolută a intervalului în care se situează Q3.
Variaţia intercuartilică Într-o serie perfect simetrică, se respectă egalitatea: Me - Q1 = Q3 - Me Din această relaţie se observă că media aritmetică a celor două
cuartile Q1 şi Q3 este egală cu valoarea cuartilei a doua, adică cu mediana seriei:
Me2
QQ 31
Dacă seria nu este perfect simetrică relaţia de mai sus devine: Me - Q1 Q3 – Me, şi rezultă că seria prezintă un anumit grad
de variaţie intercuartilică, care poate fi măsurată statistic prin indicatori de variaţie adecvaţi, exprimaţi în mărimi absolute sau relative.
Abaterea intercuartilică (Aq) se calculează după relaţia: Aq = Q3 – Q1 Abaterea intercuartilică indică intervalul de valori în care se
situează 50% din unităţile situate în centrul seriei. Abaterea semiintercuartilică se calculează după relaţia:
2
2
MeQQMeA 1331
qS
Abaterea intercuarticlică şi abaterea semiintercuartilică se exprimă în unităţile de măsură ale variabilei studiate şi nu pot fi folosite la comparaţia statistică a mai multor serii. Pentru a elimina acest inconvenient, se calculează coeficientul de variaţie intercuartilică (vq), ca raport între abaterea semiintercuartilică şi mediană:
vq = Me2
Me
A13Sq
Variaţia intercuartilică poate lua valori numai în intervalul cuprins între 0 şi 1, şi se apreciază că este cu atât mai nesemnificativă cu cât vq are o valoare mai mică.
7.5.4 Decile Definiţie Decilele sunt acele valori ale caracteristicii, care separă o
serie statistică ordonată crescător sau descrescător în zece părţiegale.
De obicei, se calculează decila întâi (D1) şi decila a noua (D9). Decila a cincia este egală cu cuartila a doua, respectiv cu mediana.
Modul de calcul al decilelor este asemănător cu cel al cuartilelor: a) Seria se ordonează crescător; b) Se determină frecvenţele absolute cumulate crescător; c) Se calculează locul D1 şi locul D9;
96
locul D1 =
1f10
1 n
1ii
locul D9 =
1f10
9 n
1ii
Se determină intervalul în care se situează D1, ca fiind acel interval
a cărui frecvenţă absolută cumulată crescător cum
1Df este prima mai
mare decât locul D1 dat de relaţia de calcul; d) Se determină intervalul în care se situează D9, ca fiind acel
interval a cărui frecvenţă absolută cumulată crescător cum
9Df este
prima mai mare decât locul D9 dat de relaţia de calcul; e) Calculul efectiv al valorii D1 şi D9 are loc conform relaţiilor:
D1 = x0 + h abs
D
cumpD
n
1ii
1
1
f
f1f10
1
D9 = x0 + h abs
D
cumpD
n
1ii
9
9
f
f1f10
9
unde: x0 = limita inferioară a intervalului în care se situează D1, respectiv D9; h = mărimea intervalului în care se situează D1, respectiv D9;
cum
1pDf = frecvenţa cumulată a intervalului precedent celui în care se
situează D1; cum
9pDf = frecvenţa cumulată a intervalului precedent celui în care se
situează D9; abs
1Df = frecvenţe a absolută a intervalului în care se situează D1;
abs
9Df = frecvenţe a absolută a intervalului în care se situează D9.
Indicatorii variaţiei interdecilice se bazează pe aceleaşi considerate ca şi cei ai variaţiei intercuartilice. Pentru o serie perfect simetrică se respectă egalitatea:
Me - D1 = D9 - Me Abaterea interdecilică (Dd) va avea relaţia de calcul: Dd = D9 – D1
Abaterea semiinterdecilică are relaţia de calcul:
2
DD
2
MeDDMeD 1991
Sd
Coeficientul de variaţie interdecilică (vd) se determină ca raport între abaterea semiinterdecilică şi valoarea mediană:
vd = Me2
DD
Me
D 19d
97
Variaţia interdecilică se calculează pentru serii statistice cu număr mare de grupe şi evidentă tendinţă de asimetrie. Coeficientul de
variaţie interdecilic ia valori în intervalul 1,0 şi este cu atât mai nesemnificativ cu cât aceste valori sunt mai mici.
Cuartilele şi decilele se utilizează atunci când dorim să analizăm numai un anumit segment al seriei. Dacă ne interesează 50% din valorile din mijlocul seriei, vom calcula Q1 şi Q3 care delimitează acest segment. Dacă ne interesează 80% din valorile din mijlocul seriei vom calcula D1 şi D9.
Mediile calculate din totalitatea valorilor individuale (media aritmetică, armonică, geometrică, pătratică) şi mărimile medii de poziţie (mediana, modul, cuartile, decile) caracterizează forma de variaţie a caracteristicii. In cazul unei distribuţii perfect simetrice a frecvenţelor, media aritmetică (x), mediana (Me) şi modulul (Mo), se află în relaţia:
x = Me = Mo Fenomenele social-economice prezintă tendinţe de asimetrie
mai mult sau mai puţin pronunţate. Utilizând indicatorii menţionaţi mai sus se pot calcula indicatori
de variaţie şi asimetrie, care permit aprofundarea analizei seriilor de distribuţie.
7.6 Aplicaţii practice Problema 7.6.1 Pentru un eşantion de 30 de clienţi ai unei bănci s-au înregistrat datele privind creditul primit în mii euro: 31; 33; 29; 32; 30; 35; 32; 28; 33; 30; 35; 36; 30; 34; 32; 37; 33; 39; 30; 33; 32; 34; 33; 35; 37; 34; 36; 35; 38; 33. Să se calculeze mediana şi modul pentru seria de date negrupate. Rezolvare: Pentru a determina mediana seriei de 30 de variante (seria de date negrupate) va trebui să ordonăm seria în mod crescător sau descrescător.
n1 n2 n3 n4 n5 n6 n7 n8 n9 n10 n11 n12 n13 n14 n15
28 29 30 30 30 30 31 32 32 32 32 33 33 33 33 n16 n17 n18 n19 n20 n21 n22 n23 n24 n25 n26 n27 n28 n29 n30
33 33 34 34 34 35 35 35 35 36 36 37 37 38 39
332
3333
2
nnMe
1615
Modul este acea variantă a seriei care apare de cele mai multe ori. Modul reprezintă valoarea caracteristicii care are frecvenţa maximă, M0 = 33 (6 apariţii).
98
Problema 7.6.2 Să se calculeze mediana şi modul pentru seria de date prezentată în tabelul de mai jos.
Nr.crt. Grupe de clienţi după valoarea
creditului (mii euro) Număr de clienţi
fi
Frecvenţe cumulate
1 [28 – 30) 2 2 30 2 [30 – 32) 5 7 28 3 [32 – 34) 10 17 23 4 [34 – 36) 7 24 13 5 [36 – 38) 4 28 6 6 [38 – 40) 2 30 2
Total 30 * *
Calculul medianei
5,152
311f
2
1Meloc i
Intervalul median este acel interval a cărui frecvenţă absolută cumulată crescător este prima mai mare decât locul medianei dat de relaţia de calcul. Deci: 17 < 15,5. Frecvenţa cumulată crescător 17 corespunde intervalului 32-34, deci mediana se va situa în acest interval. 32 < Me < 34
7,3310
75,15232
12
1int
0
abs
Me
cummedianervalullapână
f
ffrhxMe
Intervalul modal este acel interval care are frecvenţa cea mai mare. Deci: 32 < Mo < 34
33,257)(105)(10
510232hxM
Δ2Δ1
Δ100
7.7 Îndrumar pentru autoverificare
7.6.1. Sinteza unităţii de studiu
Mărimile medii reflectă ceea ce este esenţial şi tipic în nivelul de dezvoltare a fenomenelor, dar nu caracterizează modul de repartiţie a frecvenţelor în cadrul seriei.
Pentru a completa analiza seriilor de distribuţie este necesară şi calcularea unor valori medii de poziţie dintre care mediana şi modul (sau dominanta) sunt cele mai importante.
Mediana (Me) reprezintă valoarea centrală a unei serii statistice ordonată crescător sau descrescător, care împarte termenii seriei în două părţi egale: 50% din numărul termenilor vor fi mai mici decât mediana şi 50% dintre aceştia vor fi mai mari decât mediana.
Mediana se exprimă în aceeaşi unitate de măsură ca şi variabila studiată. Modul unei distribuţii statistice este acea valoare a caracteristicii care corespunde frecvenţei
maxime.
99
Fiind valoarea cea mai frecvent întâlnită, modul mai este cunoscut în literatura de specialitate şi sub denumirea de dominanta seriei.
Uneori modul poate înlocui valoarea mediei aritmetice, când aceasta nu are sens sau nu poate fi calculata.
Cuartilele sunt acele valori ale caracteristicii care separă o serie statistică ordonată crescător sau descrescător în patru părţi egale.
Într-o serie perfect simetrică, se respectă egalitatea: Me - Q1 = Q3 - Me Dacă seria nu este perfect simetrică relaţia de mai sus devine: Me - Q1 Q3 – Me şi rezultă că seria
prezintă un anumit grad de variaţie intercuartilică, care poate fi măsurată statistic prin indicatori de variaţie adecvaţi, exprimaţi în mărimi absolute sau relative.
Decilele sunt acele valori ale caracteristicii, care separă o serie statistică ordonată crescător sau descrescător în zece părţi egale.
De obicei, se calculează decila întâi (D1) şi decila a noua (D9). Decila a cincia este egală cu cuartila a doua, respectiv cu mediana. Indicatorii variaţiei interdecilice se bazează pe aceleaşi considerate ca şi cei ai variaţiei intercuartilice. Pentru o serie perfect simetrică se respectă egalitatea: Me - D1 = D9 - Me
Variaţia interdecilică se calculează pentru serii statistice cu număr mare de grupe şi evidentă tendinţă de
asimetrie. Coeficientul de variaţie interdecilic ia valori în intervalul 1,0 şi este cu atât mai nesemnificativ cu cât aceste valori sunt mai mici.
Cuartilele şi decilele se utilizează atunci când dorim să analizăm numai un anumit segment al seriei. Dacă ne interesează 50% din valorile din mijlocul seriei, vom calcula Q1 şi Q3 care delimitează acest segment. Dacă ne interesează 80% din valorile din mijlocul seriei vom calcula D1 şi D9.
Mediile calculate din totalitatea valorilor individuale (media aritmetică, armonică, geometrică, pătratică) şi mărimile medii de poziţie (mediana, modul, cuartile, decile) caracterizează forma de variaţie a caracteristicii. In cazul unei distribuţii perfect simetrice a frecvenţelor, media aritmetică (x), mediana
(Me) şi modulul (Mo), se află în relaţia: x = Me = Mo Fenomenele social-economice prezintă tendinţe de asimetrie mai mult sau mai puţin pronunţate. Utilizând indicatorii menţionaţi mai sus se pot calcula indicatori de variaţie şi asimetrie, care permit
aprofundarea analizei seriilor de distribuţie.
7.6.2. Concepte şi termeni de reţinut
indicatori medii de poziţie; mediana; modul; cuartile; decile; locul medianei; locul cuartilei; locul decilei intervalul median; intervalul modal; intervalul cuartilei intervalul decilei; abatere intercuartilică, abatere semiintercuartilică abatere interdecilică, abatere semiinterdecilică coeficient de variaţie intercuartilică, coefficient de variaţie interdecilică
100
7.6..3 Întrebări de control şi teme de dezbatere
1. De ce se calculează indicatorii medii de poziţie? 2. Care sunt indicatorii medii de poziţie? 3. Definiţi mediana şi prezentaţi modul de calcul al acesteia pentru o serie de variante şi pentru o
serie de distribuţie de frecvenţe. 4. Cum se poate determina grafic valoarea medianei? 5. Definiţi modul şi prezentaţi modul de calcul al acestuia pentru o serie de variante şi pentru o
serie de distribuţie de frecvenţe. 6. Cum se poate determina grafic nivelul modului? 7. Definiţi cuartilele şi prezentaţi modul de calcul al acestora pentru o serie de variante şi pentru o
serie de distribuţie de frecvenţe. 8. Definiţi decilele şi prezentaţi modul de calcul al acestora pentru o serie de variante şi pentru o
serie de distribuţie de frecvenţe. 9. Ce relaţie există între mediană şi cuartile în cazul unei distribuţii perfect simetrice? 10. Ce relaţie există între mediană şi decile în cazul unei distribuţii perfect simetrice? 11. Ce relaţie există între medie, mediană şi mod în cazul unei distribuţii perfect simetrice? 12. Cum se calculează abaterea intercuartilică, abaterea semiintercuartilică şi coeficientul de variaţie
intercuartilică? 13. Cum se calculează abaterea interdecilică, abaterea semiinterdecilică şi coeficientul de variaţie
interdecilică?
7.6.4 Bibliografie:
1. Anghelache, C., Isaic- Maniu, A., Mitruţ, C., Voineagu, V., Dumbravă , M., (2007), Analiză
economică, sinteze şi studii de caz, Editura Economică, Bucureşti; 2. Begu, L.S., (2009), Statistică internaţională –analize comparative, Editura Universitară, Bucureşti 3. Biji, M., Biji, E. M., Lilea, E., Anghelache, C., (2002), Tratat de statistică, Editura Economica,
Bucureşti 4. Biji, E.M., Lilea, E., Roşca, E., Vătui, M., (2010), Statistică pentru economişti, Editura
Economică, Bucureşti; 5. Turdean, M., (2012), Statistica, Editura Pro Universitaria, Bucureşti; 6. Ţiţan, E., (2012) Statistică – teorie şi aplicaţii în sectorul terţiar, Editura Meteor Press, Bucureşti;
101
8 UNITATEA DE STUDIU 8 ANALIZA SERIILOR DE DISTRIBUŢIE III – INDICATORII VARIABILITĂŢII ŞI INDICATORII DE ASIMETRIE -
8.1 Introducere 8.2 Obiectivele unităţii de studiu 8.3 Competenţele unităţii de studiu 8.4 Timpul alocat unităţii de invăţare 8.5 Conţinutul unităţii de studiu
8.5.1 Consideraţii generale privind calcului indicatorilor variabilităţii 8.5.2 Indicatorii simpli ai variabilităţii 8.5.3 Indicatorii sintetici ai variabilităţii 8.5.4 Indicatorii variabilităţii pentru o colectivitate împărţită în grupe. Regula adunării dispersiilor 8.5.5 Indicatorii variabilităţii pentru caracteristicile alternative 8.5.6 Asimetria şi indicatorii de asimetrie
8.6 Aplicaţii practice 8.7 Îndrumar pentru autoverificare 8.7.1 Sinteza unitatii de invatare 8.7.2 Concepte si termeni de retinut 8.7.3 Întrebări de control şi teme de dezbatere 8.7.4 Bibliografie
8.1 Introducere
Pentru a caracteriza o colectivitate statistică, datele care trebuie analizate sunt numeroase şi, de obicei, prezintă o amplitudine mare a variaţiei. Cu cât o colectivitate este mai puţin omogenă, ea trebuie caracterizată din punct de vedere statistic, atât cu ajutorul indicatorilor totalizatori, cât şi cu al celor derivaţi. Dintre indicatorii derivaţi, media aritmetică calculată din totalitatea cazurilor individuale observate, reprezintă indicatorul cu care se estimează cel mai frecvent valoarea tipică, adică acea valoare care exprimă tendinţa centrală de manifestare a unei caracteristici.
Dacă am reduce analiza doar la determinarea şi interpretarea mărimii medii nu ar fi posibilă cunoaşterea condiţiilor concrete în care apar şi se dezvoltă fenomenele; nu am putea separa şi stabili intensitatea cu care acţionează factorii esenţiali şi cei întâmplători; nu am obţine explicaţia gradului de variabilitate şi, în consecinţă, nu am putea depista tendinţele acestor fenomene.
8.2 Obiectivele unităţii de studiu
– necesitatea calculului indicatorilor de variabilitate – definirea indicatorilor simpli ai variabilităţii; – definirea indicatorilor sintetici ai variabilităţii; – cunoaşterea indicatorilor variabilităţii pentru o colectivitate
împărţită în grupe; – cunoaşterea indicatorilor variabilităţii pentru caracteristicile
alternative; – cunoaşterea indicatorilor de asimetrie.
102
8.3 Competenţele unităţii de studiu:
– studenţii vor putea diferenţia indicatorii simpli de indicatorii sintetici ai variabilităţii;
– studenţii vor putea să analizeze seriile de date pe baza indicatorilor simpli ai variabilităţii;
– studenţii vor putea să aprofundeze analiza statististică a seriilor de date pe baza indicatorilor sintetici ai variabilităţii;
– studenţii vor putea să stabilească măsura/ proporţia în care factorul de grupare influenţeză variaţia caracteristicii rezultative;
– studenţii vor putea analiza seriile de date pe baza indicatorilor de asimetrie;
8.4 Timpul alocat unităţii de studiu:
Pentru unitatea de studiu „Analiza serilor de distribuţie III – Indicatorii variabilităţii şi indicatorii de asimetrie”, timpul alocat este de 4 ore.
8.5 Conţinutul unităţii de studiu
8.5.1 Consideraţii generale privind calculul indicatorilor variabilităţii
Cu cât fenomenele sunt mai complexe, deci depind de mai mulţi factori, cu atât variaţia este mai mare şi folosirea mărimilor medii implică verificarea stabilităţii şi reprezentativităţii lor. O medie este reprezentativă doar când se calculează din valori omogene.
Analiza statistică a seriilor de distribuţie poate fi aprofundată prin calculul indicatorilor de variaţie care servesc la:
- verificarea reprezentativităţii mediei; - verificarea gradului de omogenitate a seriei; - caracterizarea statistică a gradului şi a formei de variaţie a unei
caracteristici; - compararea în timp şi în spaţiu a seriilor statistice din punct
de vedere al aceleiaşi caracteristici sau pentru caracteristici diferite; - separarea modului de acţiune a factorilor esenţiali de cei
întâmplători; - evidenţierea gradului de influenţă a factorilor după care s-a
făcut gruparea unităţilor din colectivitate, respectiv, identificarea felului în care factorii esenţiali îşi modifică acţiunea de la o grupă la alta.
În funcţie de gradul de aprofundare şi de scopul analizei
103
statistice se calculează: indicatorii simpli ai variabilităţii; indicatorii sintetici ai variabilităţii; indicatorii analizei dispersionale.
8.5.2 Indicatorii simpli ai variabilităţii Acest tip de indicatori servesc la caracterizarea gradului de
împrăştiere a unităţilor purtătoare a caracteristicilor înregistrate. Ei se calculează pentru a stabili amplitudinea variaţiei şi abaterea valorilor individuale de la media lor. Se exprimă în mărimi absolute - utilizând aceeaşi unitate de măsură ca şi pentru caracteristica statistică - cât şi în mărimi relative calculate în raport cu valoarea medie.
Din grupa indicatorilor simpli fac parte: (1) Amplitudinea absolută a variaţiei (A) se calculează ca
diferenţă între nivelul maxim (xmax) şi nivelul minim (xmin) al caracteristicii, conform relaţiei:
A = xmax - xmin Amplitudinea absolută a variaţiei se exprimă în unitatea de
măsură a variabilei şi nu poate fi utilizată la compararea a două variabile exprimate în unităţi de măsură diferite. Informaţiile despre variabilitate obţinute cu ajutorul amplitudinii variaţiei sunt reduse şi nu vizează ansamblul de date deoarece nu se ţine cont de toate valorile observate.
Amplitudinea variaţiei este influenţată de prezenţa valorilor aberante. Acest indicator nu se calculează (nu are sens) în cazul seriilor de distribuţie de frecvenţe pe intervale de variaţie.
(2) Amplitudinea relativă a variaţiei (A%) se calculează ca raport între amplitudinea absolută a variaţiei şi nivelul mediu al caracteristicii şi se exprimă în procente.
A% = x
A100
Deşi amplitudinea variaţiei este calculată din valorile extreme ale seriei (care se pot situa la mare distanţă faţă de masa mare a valorilor individuale), din punct de vedere metodologic prezintă importanţă, fiind utilizată în etapa de prelucrare a datelor statistice la stabilirea numărului de grupe şi a mărimii intervalului de grupare.
(3) Abaterile individuale absolute (di) se calculează ca diferenţă între fiecare variantă înregistrată şi media aritmetică, conform relaţiei:
di = xi - x, i = n,1 unde: n = numărul de variante. (4) Abaterile individuale relative (di%) se calculează raportând
abaterile absolute la nivelul mediu al caracteristicii.
di% = 100x
xx100
x
d ii
În procesul de analiză se mai pot calcula abaterile maxime într-un sens sau altul.
(5) Abaterea maximă negativă în expresie absolută (dmax neg) se calculează ca diferenţă între nivelul minim al caracteristicii şi medie:
dmax neg = xmin - x (6) Abaterea maximă negativă în expresie relativă (dmax neg %) se
104
calculează ca raport între abaterea maximă negativă absolută şi medie
dmax neg % = 100x
xx100
x
dminnegmax
(7) Abaterea maximă pozitivă în expresie absolută (dmax poz) se calculează ca diferenţa între nivelul maxim al caracteristicii şi medie:
dmax poz = xmax - x (8) Abaterea maximă pozitivă în expresie relativă (dmax poz %) se
calculează ca raport între abaterea maximă pozitivă absolută şi medie
dmax poz % = 100x
xx100
x
dmaxpozmax
Indicatorii
simpli ai variaţiei ţin cont ori de valorile extreme ori evidenţiază abaterile individuale ale acestora de la medie. Gradul de variaţie al unei caracteristici depinde însă de totalitatea abaterilor de la medie ale variantelor înregistrate, precum şi de frecvenţa lor de apariţie. In consecinţă, se poate afirma că indicatorii simpli ai variaţiei nu pot exprima întreaga variaţie a unei caracteristici.
Prin urmare, pentru caracterizarea gradului de variaţie se va apela la indicatorii sintetici ai variaţiei, care iau în considerare toate abaterile caracteristicii, precum şi frecvenţele de apariţie corespunzătoare.
8.5.3 Indicatorii sintetici ai variabilităţii Indicatorii sintetici ai variabilităţii exprimă variaţia tuturor
valorilor individuale faţă de tendinţa centrală a caracteristicilor studiate.
Indicatorii sintetici ai variabilităţii ţin cont de toate unităţile observate, trebuie să fie uşor de înţeles şi uşor de calculat. Din această categorie de indicatori fac parte: (i) abaterea medie liniară (dx), (ii) abaterea medie pătratică (x), (iii) dispersia (2
x), (iv) coeficientul de variaţie (v).
1. Abaterea medie liniară (dx), se calculează ca o medie aritmetică simplă sau ponderată (cu frecvenţe absolute sau frecvenţe relative sub formă de pondere sau coeficient) a abaterilor termenilor seriei de la media lor, luate în valoare absolută.
Relaţiile de calcul pentru abaterea medie liniară sunt: pentru serii simple:
n
xxd
n
1ii
x
pentru distribuţii de frecvenţe: serie de frecvenţe
absolute serie cu frecvenţe
relative exprimate în procente
serie cu frecvenţe relative exprimate
zecimal
m
1ii
i
m
1ii
x
f
fxxd
100
fxxd
m
1i
*%ii
x
m
1i
*ziix fxxd
105
Abaterea medie liniară se exprimă în unităţile de măsură ale variabilei şi în consecinţă nu poate fi utilizată pentru compararea unor caracteristici diferite. Ea nu ţine seama de faptul că abaterile mai mari în valoare absolută influenţează în mai mare măsură gradul de variaţie a unei caracteristici în comparaţie cu abaterile mai mici. Calculul acestui indicator este justificat doar când pentru caracterizarea variabilităţii ne interesează doar mărimea abaterilor nu şi sensul lor.
2. Principalul indicator sintetic al variaţiei este abaterea medie
pătratică (x). Abaterea medie liniară ( xd ) elimină semnul abaterilor de la tendinţa centrală. Acelaşi obiectiv poate fi atins prin ridicarea la pătrat a abaterilor.
Abaterea medie pătratică se calculează ca o medie pătratică simplă sau ponderată (cu frecvenţe absolute sau frecvenţe relative sub formă de pondere sau coeficient) a abaterilor tuturor variantelor seriei de la media lor aritmetica.
Relaţiile de calcul pentru abaterea medie pătratică sunt: pentru serii simple:
x =
n
xxn
1i
2
i
pentru distribuţii de frecvenţe
serii de frecvenţe absolute
serii cu frecvenţe relative exprimate
în procente
serii cu frecvenţe relative exprimate
zecimal
x=
m
1ii
m
1ii
2
i
f
fxx x=
100
fxxm
1i
*%i
2
i
x=
m
1i
*iz
2
i fxx
Acest tip de indicator, fiind calculat cu ajutorul pătratelor abaterilor este mai concludent decât abaterea medie liniară. Prin ridicarea la pătrat se dă o importanţă mai mare abaterilor mai mari în valoare absolută, acestea influenţând într-o mai mare măsură gradul de variaţie al variabilei analizate.
Dacă pentru aceeaşi serie se calculează abaterea medie liniară (dx) şi abaterea medie pătratică (x), între cei doi indicatori va exista următoarea inegalitate:
xx d
Pentru o serie de distribuţie cu tendinţă clară de normalitate, abaterea medie liniară este 4/5 din valoarea abaterii medii pătratice.
Abaterea medie pătratică se exprimă în unitatea de măsură a variabilei studiate.
3. Dispersia (variaţia) unei caracteristici (2x) se calculează ca
o medie aritmetică simplă sau ponderată (cu frecvenţe absolute sau relative sub formă de pondere sau coeficient) a pătratelor abaterilor termenilor faţă de media lor.
Dispersia nu are unitate de măsură cu conţinut economic. Relaţiile de calcul pentru dispersii sunt:
106
pentru serii simple
2x =
n
xxn
1i
2
i
pentru distribuţii de frecvenţe
serii de frecvenţe absolute
serii cu frecvenţe relative exprimate in
procente
serii cu frecvenţerelative exprimate
zecimal
2x =
m
1ii
m
1ii
2
i
f
fxx 2
x =
100
fxxm
1i
*%i
2
i
2x= *
iz
m
1i
2
i fxx
Indicatorii sintetici prezentaţi se pot utiliza doar pentru compararea gradului de variaţie a seriilor care se referă la aceleaşi caracteristici.
4. Pentru compararea gradului de variaţie al unor caracteristici diferite, se recurge la coeficientul de variaţie (v). El se calculează ca raport procentual între abaterea medie pătratică şi nivelul mediu al seriei.
v = 100x
x
O altă relaţie de calcul pentru coeficientul de variaţie este:
v’ = 100x
d x
unde: dx = abaterea medie liniară. Cu cât nivelul coeficientului de variaţie este mai aproape de
zero, cu atât variaţia este mai redusă, colectivitatea este mai omogenă şi media va avea un grad ridicat de reprezentativitate. In cazul în care coeficientul de variaţie ia valori de peste 35 - 40% se apreciază că media nu mai este reprezentativă şi prin urmare este necesară separarea datelor pe grupe în funcţie de variaţia unei alte caracteristici de grupare.
8.5.4 Indicatorii variabilităţii pentru o colectivitate împărţită în grupe. Regula adunării dispersiilor
Cu cât fenomenele studiate sunt mai complexe, caracteristicile care le definesc prezintă un grad mai mare de variaţie. Ca urmare, unităţile la care s-a făcut observarea trebuie împărţite în grupe în funcţie de variaţia factorilor determinanţi. In cazul aplicării metodei grupării se pot calcula atât medii pe grupe, cât şi o medie a colectivităţii totale. De asemenea, se pot determina indicatori de variaţie (dispersii) pentru fiecare grupă şi pentru întreaga colectivitate.
Presupunând că s-au înregistrat datele referitoare la două caracteristici x şi y şi unităţile au fost grupate în m grupe în funcţie de variaţia caracteristicii x s-au obţinut distribuţiile condiţionate din tabelul cu dublă intrare.
Distribuţiile condiţionate ale caracteristicii rezultative „y” în funcţie de variaţia factorului de grupare „x”
107
Valorile caracteristicii y Valorile caracteristicii de grupare x
y1 … yj... yp Total
ni
Medii pe grupe (medii
condiţionate)(y/xi)
x1
xi
xm
f11 … f1j ... f1p fi1 … fij ... fip fm1 … fmj ... fmp
n1
ni
nm
1y
iy
my
Total fj
f1 …. fj.... fp
m
1ii
p
1jj nf
yo
Media şi indicatorii de variaţie pentru întreaga colectivitate se pot calcula făcând abstracţie că ea este compusă din mai multe grupe, sau luând în calcul variaţia din interiorul grupelor şi dintre grupe. În consecinţă, între indicatorii de variaţie calculaţi la nivelul fiecărei grupe şi cei pe întreaga colectivitate există relaţii bazate pe regula de adunare a dispersiilor. Cele două variabile prezentate în tabel se află într-o relaţie de cauzalitate şi în urma calculului indicatorilor de variaţie corespunzători se poate preciza dacă factorul de grupare x este un factor determinant pentru variaţia caracteristicii y. Pe baza datelor din tabelul 8.1 se pot calcula mediile şi dispersiile pe fiecare grupă şi pe total. Mediile de grupă se notează cu yi şi se calculează cu relaţia:
yi =
p
jij
ij
p
jj
f
fy
1
1
Numărul mediilor de grupă este egal cu numărul grupelor în care s-a împărţit colectivitatea. Factorul de grupare, considerat ca factor esenţial, determină/influenţează variaţia caracteristicii studiate în măsura în care mediile de grupă diferă între ele. Dacă factorul de grupare nu este factor determinant pentru caracteristica studiată, mediile de grupă vor fi apropiate de media colectivităţii generale, deci variaţia caracteristicii este produsă de alţi factori şi nu de cel ales pentru gruparea datelor. Media pe total colectivitate yo sintetizează variaţia tuturor valorilor individuale din colectivitate sau variaţia valorilor medii de grupă şi se calculează cu relaţiile:
yo =
p
1jj
j
p
1jj
f
fy
sau yo =
m
1ii
i
m
1ii
n
ny
La nivelul fiecărei unităţi observate, variaţia totală (yj -yo) se compune din variaţia faţă de media de grupă (yj -yi) la care se adaugă variaţia mediei de grupă de la media colectivităţii totale (yi - yo), conform relaţiei:
108
(yj -yo) = (yj - yi) - (yi - yo) La nivelul grupei valoarea caracteristicii de grupare este
considerată constantă. Prin urmare, variaţia valorilor individuale din fiecare grupă în jurul mediei de grupă (yj - yi) va măsura gradul de influenţă a factorilor variabili (neînregistraţi, întâmplători, nesistematici).
Variaţia mediilor de grupă faţă de media colectivităţii totale (yi - yo) este interpretată ca fiind rezultatul acţiunii factorului de grupare. În acest caz factorii variabili din interiorul grupei se păstrează la un nivel constant.
Pentru a determina intensitatea cu care au influenţat asupra variaţiei caracteristicii dependente cele două grupe de factori (întâmplători şi esenţiali), atât la nivelul grupelor, cât şi la nivelul colectivităţii generale se calculează următoarele dispersii:
(i) dispersia de grupă (2i),
(ii) media dispersiilor de grupă (2i),
(iii) dispersia dintre grupe (2), (iv) dispersia totală (2
o). (i) Dispersia de grupă se calculează ca o medie aritmetică
ponderată a pătratelor abaterilor fiecărei variante dintr-o grupă de la media lor (media grupei).
2i =
p
jij
p
jijij
f
fyy
1
1
2
unde: fij = frecvenţe corespunzătoare variantei “j” din grupa “i”. Dispersia de grupă măsoară influenţa factorilor întâmplători care
acţionează la nivelul grupei asupra variaţiei caracteristicii dependente y.
(ii) Numărul dispersiilor de grupă este acelaşi cu numărul grupelor care formează colectivitatea. Pentru a sintetiza influenţa/acţiunea tuturor factorilor întâmplători care acţionează la nivelul tuturor grupelor se calculează media dispersiilor de grupă:
i2 =
m
ii
m
iii
n
n
1
1
2
unde: ni = frecvenţa grupei i. (iii) Dispersia dintre grupe se calculează ca o medie aritmetică
ponderată a pătratelor abaterilor fiecărei medii de grupă de la media colectivităţii totale.
m
1ii
m
1ii
2
oi2
n
nyy
Dispersia dintre grupe măsoară influenţa factorului de grupare asupra variaţiei caracteristicii dependente “y”.
(iv) Dispersia totală se calculează ca o medie aritmetică ponderată a pătratelor abaterilor fiecărei variante de la media colectivităţii totale:
109
2o =
p
jj
p
jjoj
f
fyy
1
1
2
Dispersia totală reflectă, la nivelul întregii colectivităţi, influenţa acţiunii conjugate a celor două grupe de factori - esenţiali şi întâmplători - asupra variaţiei caracteristicii dependente y.
Dispersia totală se mai poate calcula adunând la media dispersiilor de grupă, dispersia dintre grupe conform relaţiei cunoscută în literatura de specialitate sub denumirea de regula “adunării dispersiilor”:
2o = 2 + 2
Pe baza regulii de adunare a dispersiilor se pot calcula doi indicatori statistici cu caracter de mărimi relative de structură:
coeficientul de determinaţie (R2y/x) se calculează ca raport
procentual dintre dispersia dintre grupe şi dispersia totală, după relaţia:
1002
22
/o
xyR
coeficientul de nedeterminaţie (K2y/z) se calculează ca
raport procentual dintre media dispersiilor parţiale şi dispersia totală, după relaţia:
K2y/z = 100
2o
2
Dacă R2y/x > 50% se consideră că factorul de grupare este
semnificativ (hotărâtor, determinant) pentru variaţia caracteristicii dependente, studiate.
Coeficientul de nedeterminaţii arată câte procente din variaţia caracteristicii dependente sunt determinate de acţiunea factorilor întâmplători (neesenţiali, nesistematici, reziduali, nesemnificativi).
8.5.5 Indicatorii de variabilităţii pentru caracteristicile alternative
Dispersia caracteristicii alternative (2p) se calculează ca o
medie aritmetică ponderată a pătratelor abaterilor termenilor de la media lor. Utilizând datele din tabelul 6.1 se obţine:
2p =
qp
qppp
22 )0()1(
unde: 1 şi 0 = variantele caracteristicii alternative,
p = media caracteristicii alternative sau frecvenţa relativă a unităţilor care posedă caracteristica,
q = frecvenţa relativă a unităţilor care nu posedă caracteristica.
Deoarece p + q = 1 şi 1- p = q, relaţia de calcul devine:
2p =
qp
pqpq
qp
qppq
)(22
= p q = p (1 - p)
deci: 2
p = p q = p (1 - p)
110
Abaterea medie pătratică (p) a caracteristicii alternative se determină conform relaţiei:
p = )p1(pqp2p
Dispersia caracteristicii alternative poate lua doar valori
cuprinse în intervalul 25.0;0 , iar abaterea medie pătratică doar
valori cuprinse în intervalul 5.0;0 . Când frecvenţele relative p şi q sunt egale, abaterea standard şi dispersia vor înregistra valorile maxime p = 0,5, respectiv 2
p = 0,25. In cazul în care colectivitatea este împărţită în m grupe şi se
studiază variaţia unei caracteristici alternative, se pot calcula următorii indicatori:
i. Dispersia de grupă: 2
pi = pi qi = pi (1-pi) unde: pi = media caracteristicii alternative din grupa i,
qi = frecvenţa relativă a unităţilor care nu posedă caracteristica din grupa i.
ii. Media dispersiilor parţiale (p) este o medie aritmetică ponderată a dispersiilor grupelor în care a fost împărţită colectivitatea:
m
ii
m
iiii
m
ii
m
iip
p
N
Npq
N
Ni
1
1
1
1
2
2)(
unde: Ni = numărul total al unităţilor observate din fiecare grupă.
iii. Dispersia dintre grupe pentru o caracteristică alternativă (2
p) se calculează ca o medie aritmetică ponderată a pătratelor abaterilor mediilor caracteristicii alternative din fiecare grupă de la media caracteristicii alternative pe întreaga colectivitate:
m
ii
m
iii
p
N
Npp
1
1
2
2
unde p = media caracteristicii alternative pe întreaga colectivitate.
iv. Dispersia totală a caracteristicii alternative (2
p) este produsul dintre cele două frecvenţe relative p şi q din colectivitatea totală:
2p = p q
Regula adunării dispersiilor se păstrează şi în cazul unei
caracteristici alternative: 2
p = 2p + 2
p
111
8.5.6 Asimetria şi indicatorii de asimetrie Distribuţia statistică simetrică este acea distribuţie pentru care
frecvenţele sunt uniform dispersate de-o parte şi de alta a valorii medii.
Definiţie Gradul de îndepărtare al unei distribuţii statistice de la
simetrie se numeşte asimetrie.
Pentru o serie de distribuţie perfect simetrică (figura 8.1.A.) între cei trei indicatori modul, mediana şi media aritmetică există relaţia:
x = Mo = Me Seriile de distribuţie de frecvenţe prezintă cel mai des asimetrie
de stânga sau de dreapta (figura 8.1.B, C). Asimetria se poate analiza prin metoda grafică, utilizând histograma sau poligonul frecvenţelor, care oferă o imagine sugestivă asupra gradului de asimetrie.
Pentru a măsura şi exprima printr-o valoare numerică gradul de asimetrie se calculează indicatorii de asimetrie sub formă absolută şi relativă.
x = M o = M e x
y
Figura 8.1. Distribuţia statistică simetrică(A). Distribuţie
asimetrică de stânga (B) şi de dreapta (C) Asimetria absolută se determină după relaţia: As = x - Mo Asimetria absolută se exprimă în unitatea de măsură a
variabilei. Indicatorii de asimetrie calculaţi sub formă relativă sunt: 1) coeficientul de asimetrie (Pearson)
1asc = x
Mox
Acest coeficient ia valori cuprinse între 1;1 ; cu cât este mai mic în valoare absolută cu atât asimetria este mai mică. Legătura dintre tipul de asimetrie şi valoarea coeficientului de asimetrie este prezentată în figura 8.2.
M o< Me < x
y
x
x < Me < Mo
y
x
(B) (C )
(A)
112
1asc < 0 1asc = 0
1asc > 0
Seria prezintă asimetrie de stânga
Seria este simetrică
Seria prezintă asimetrie de
dreapta Figura 8.2. Legătura dintre tipul de asimetrie şi valoarea coeficientului de asimetrie
Acest indicator de asimetrie este recomandat a se utiliza pentru analiza distribuţiilor uşor asimetrice.
2) În cazul în care se cunoaşte mediana seriei, coeficientul de asimetrie se poate calcula după relaţia:
2asc = x
Mex
)(3
Acest coeficient ia valori cuprinse între 3;3 ; cu cât este mai mic în valoare absolută, cu atât asimetria este mai mică.
3) Asupra asimetriei influenţează şi celelalte valori medii de poziţie. Dacă se ţine seama de influenţa cuartilelor se calculează coeficientul propus de Yule:
3asc = 12
12
unde: q2 = Q3 -Me sau q2 = D9-Me q1 = Me -Q1 sau q1 = Me -D1. Dacă acest coeficient se apropie de valoarea 0,1 se poate considera
că seria este moderat asimetrică, iar dacă este mai mare decât 0,3, seria este pronunţat asimetrică.
xi
f i
xi
f i
xi
f i
Figura 8.3 Curba platicurtică, curba normală, curba
leptocurtică Boltirea măsoară înălţimea, adică aplatizarea sau alungirea
curbei frecvenţelor unei repartiţii comparativ cu cea normală. Karl Pearson propune următoarea expresie pentru coeficientul boltirii:
cb = 22
x
4x
)(
unde: 2
x = dispersia variabilei, momentul centrat de ordin 2; 4
x = momentul centrat de ordin 4 care se calculează după relaţia:
4x =
m
1ii
m
1ii
4i
f
f)xx(
Pentru a obţine un indicator de măsurare a excesului (cex) se compară coeficientul de boltire al lui Pearson cu valoarea acestui
113
indicator pentru cazul repartiţiei normale pentru care coeficientul boltirii cb = 3.
cex = cb -3 Legătura dintre coeficientul boltirii si forma curbei de frecven-
ţe este dată în figura următoare.
cex < 0 cex =0 cex > 0 cb < 3 cb = 3 cb > 3 Curba este platicurtică = curba prezintă un grad deaplatizare mai pronunţatîn raport cu cea normală
Curba este Normală
Curba este leptocurtică= prezintă un grad de boltire mai mare în raport cu cea normală
Figura 8.4. Curba platicurtică (A), normală (B) şi leptocurtică (C) a frecvenţelor
8.6 Aplicaţii practice Problema 8.6.1 Pentru un eşantion de 30 de clienţi ai unei bănci s-au înregistrat datele privind creditul primit în mii euro: 31; 33; 29; 32; 30; 35; 32; 28; 33; 30; 35; 36; 30; 34; 32; 37; 33; 39; 30; 33; 32; 34; 33; 35; 37; 34; 36; 35; 38; 33. Să se calculeze media aritmetică şi indicatorii simpli ai variabilităţii pentru seria de date negrupate. Rezolvare: a) Pentru seria de date negrupate, creditul mediu se calculează după relaţia mediei aritmetice simple:
mii3,3330
999
30
33...293313
30
x
n
xx
30
1ii
n
1ii
Є / client
Indicatorii simpli ai variabilităţii:
1. Amplitudinea variaţiei: A = xmax – xmin = 39 – 28 = 11 mii Є
2.a.) Abaterea maximă pozitivă (absolută):
7,53,3339xx.d maxpoz.max mii Є
2.b.) Abaterea maximă pozitivă (relativă)
%1,171003,33
3,3339100
x
xxd max
.%poz.max
3.a.) Abaterea maximă negativă (absolută):
3,53,3328. minmax xxd neg mii Є
3.b.) Abaterea maximă negativă (relativă):
%91,151003,33
3,3328100
x
xxd min
.%neg.max
114
Problema 8.6.2 Se dă distribuţia:
Nr.crt. Grupe de clienţi după nivelul creditului (mii euro) Număr de clienţi
fi
0 1 3 1 [28 – 30) 2 2 [30 – 32) 5 3 [32 – 34) 10 4 [34 – 36) 7 5 [36 – 38) 4 6 [38 – 40) 2
Total 30 Se cere:
a) să se verifice omogenitatea distribuţiei; b) Să se calculeze gradul de asimetrie; c) Să se calculeze media caracteristicii “clienţi” care au primit un credit mai mare de 36 mii Є.
Rezolvare: a) Pentru a verifica omogenitatea distribuţiei se va calcula coeficientul de variaţie.
100x
v x
Pentru o serie omogenă, coeficientul de variaţie trebuie să fie mai mic decât 35%.
Nr.crt. Grupe de clienţi după
valoarea creditului (mii euro)
Număr de clienţi
fi
Centrul de interval
xi
xifi i2
i fxx
0 1 2 5 6 7 1 [28 – 30) 2 29 58 (29-33,8)22= 46,08 2 [30 – 32) 5 31 155 (31-33,8)25= 39,2 3 [32 – 34) 10 33 330 (33-33,8)210= 6,4 4 [34 – 36) 7 35 245 (35-33,8)27= 10,08 5 [36 – 38) 4 37 148 (37-33,8)24= 40,96 6 [38 – 40) 2 39 78 (39-33,8)22= 54,08
Total 30 * 1014 196,8 Media aritmetică ponderată
client/euromii8,3330
1014
2471052
2394377351033531229
f
fxx
6k
1ii
6k
1iii
Dispersia ( 2x )
6,5630
196,82471052
2233,8)(394233,8)(377233,8)(3510233,8)(335233,8)(312233,8)(29
6k
1iif
if6k
1i
2)xi(x2xσ
115
Abaterea medie pătratică ( x )
56,256,630
8,196)(
1
1
2
2
k
ii
k
iii
xx
f
fxx mii euro
Coeficientul de variaţie:
100x
v x
%57,71008,33
56,2v
Deoarece v < 35%, seria este omogenă, iar media, 33,8 mii euro/client este reprezentativă.
Media aritmetică este exactă atunci când se calculează din variantele sub care s-a înregistrat caracteristica (date negrupate- vezi aplicaţia 8.6.1- 30 variante; media 33,3 mii euro/client) dar poate fi calculată suficient de corect şi pe baza unei serii de intervale (6 grupe; media 33,8 mii euro/client).
b) Calculul coeficientului de asimetrie
x
MoxCas
8,33x mii Є/client, σx= 2,56 mii Є/client Intervalul modal este acel interval care are frecvenţa cea mai mare. Deci: 32 < Mo < 34
33,257)(105)(10
510232hxM
Δ2Δ1
Δ100
214,056,2
25,338,33Cas
c) %202,030
6sau
N
Mp
Ponderea clienţilor care au primit credit mai mare de 36 mii Є este de 20%.
Mo = 33,25 x = 33,8
0Mox asimetrie pozitivă (de stânga)
116
8.7 Îndrumar pentru autoverificare
8.7.1 Sinteza unităţii de studiu
Cu cât fenomenele sunt mai complexe, deci depind de mai mulţi factori, cu atât variaţia este mai mare şi folosirea mărimilor medii implică verificarea stabilităţii şi reprezentativităţii lor. O medie este reprezentativă doar când se calculează din valori omogene. Analiza statistică a seriilor de distribuţie poate fi aprofundată prin calculul indicatorilor de variaţie care servesc la:
verificarea reprezentativităţii mediei; verificarea gradului de omogenitate a seriei; caracterizarea statistică a gradului şi a formei de variaţie a unei caracteristici; compararea în timp şi în spaţiu a seriilor statistice din punct de vedere al aceleiaşi
caracteristici sau pentru caracteristici diferite; separarea modului de acţiune a factorilor esenţiali de cei întâmplători; evidenţierea gradului de influenţă a factorilor după care s-a făcut gruparea unităţilor din
colectivitate, respectiv, identificarea felului în care factorii esenţiali îşi modifică acţiunea de la o grupă la alta.
În funcţie de gradul de aprofundare şi de scopul analizei statistice se calculează: indicatorii simpli ai variabilităţii, indicatorii sintetici ai variabilităţii indicatorii analizei dispersionale.
Indicatorii simpli ai variabilităţii servesc la caracterizarea gradului de împrăştiere a unităţilor purtătoare a caracteristicilor înregistrate. Ei se calculează pentru a stabili amplitudinea variaţiei şi abaterea valorilor individuale de la media lor. Se exprimă în mărimi absolute - utilizând aceeaşi unitate de măsură ca şi pentru caracteristica statistică - cât şi în mărimi relative calculate în raport cu valoarea medie. Din grupa indicatorilor simpli fac parte:
amplitudinea absolută a variaţiei (A); amplitudinea relativă a variaţiei (A%); abaterile individuale absolute (di); abaterile individuale relative (di%); abaterea maximă negativă în expresie absolută (dmax neg); abaterea maximă negativă în expresie relativă (dmax neg %); abaterea maximă pozitivă în expresie absolută (dmax poz); abaterea maximă pozitivă în expresie relativă (dmax poz %);
Indicatorii simpli ai variabilităţii Indicatori Mărimi absolute Mărimi relative
Amplitudine absolută A = xmax - xmin A% =
x
A100
Abatere individuală de la medie
di = xi - x di% = 100
x
xx100
x
d ii
Abatere maximă negativă dmax neg = xmin - x dmax neg % = 100
x
xx100
x
dminnegmax
Abatere maximă pozitivă dmax poz = xmax - x dmax poz % = 100
x
xx100
x
dmaxpozmax
117
Indicatorii simpli ai variaţiei ţin cont ori de valorile extreme ori evidenţiază abaterile individuale ale acestora de la medie. Gradul de variaţie al unei caracteristici depinde însă de totalitatea abaterilor de la medie ale variantelor înregistrate, precum şi de frecvenţa lor de apariţie. In consecinţă, se poate afirma că indicatorii simpli ai variaţiei nu pot exprima întreaga variaţie a unei caracteristici.
Prin urmare, pentru caracterizarea gradului de variaţie se va apela la indicatorii sintetici ai variaţiei, care iau în considerare toate abaterile caracteristicii, precum şi frecvenţele de apariţie corespunzătoare.
Indicatorii sintetici ai variabilităţii exprimă variaţia tuturor valorilor individuale faţă de tendinţa centrală a caracteristicilor studiate.
Indicatorii sintetici ai variabilităţii ţin cont de toate unităţile observate, trebuie să fie uşor de înţeles şi uşor de calculat. Din această categorie de indicatori fac parte:
abaterea medie liniară (dx), abaterea medie pătratică (x), dispersia (2
x), coeficientul de variaţie (v).
Indicatorii sintetici ai variabilităţii Indicatori Abatere medie liniară
(dx) Abatere medie pătratică
(x) Dispersia (2
x)
Serie de variante
n
xxd
n
1ii
x
x =
n
xxn
1i
2
i
2
x =
n
xxn
1i
2
i
Serie de distribuţie
de frecvenţe absolute
m
1ii
i
m
1ii
x
f
fxxd x =
m
1ii
m
1ii
2
i
f
fxx
2x=
m
1ii
m
1ii
2
i
f
fxx
Serie de distribuţie
de frecvenţe relative
exprimate procentual
100
fxx
d
m
1i
*%ii
x
x =
100
fxxm
1i
*%i
2
i
2
x =
100
fxxm
1i
*%i
2
i
Serie de distribuţie
de frecvenţe relative
exprimate zecimal
m
1i
*ciix fxxd x =
m
1i
*ic
2
i fxx 2x = *
ic
m
1i
2
i fxx
Coeficientul de variaţie v = 100xx sau v’ = 100
x
dx (v’ < v)
Cu cât fenomenele studiate sunt mai complexe, caracteristicile care le definesc prezintă un grad mai mare de variaţie. Ca urmare, unităţile la care s-a făcut observarea trebuie împărţite în grupe în funcţie de variaţia factorilor determinanţi. In cazul aplicării metodei grupării se pot calcula atât medii pe grupe, cât şi o medie a colectivităţii totale. De asemenea, se pot determina indicatori de variaţie (dispersii) pentru fiecare grupă şi pentru întreaga colectivitate.
Media şi indicatorii de variaţie pentru întreaga colectivitate se pot calcula făcând abstracţie că ea este compusă din mai multe grupe, sau luând în calcul variaţia din interiorul grupelor şi dintre grupe. În consecinţă, între indicatorii de variaţie calculaţi la nivelul fiecărei grupe şi cei pe întreaga colectivitate există relaţii bazate pe regula de adunare a dispersiilor.
Numărul mediilor de grupă este egal cu numărul grupelor în care s-a împărţit colectivitatea. Factorul de grupare, considerat ca factor esenţial, determină/influenţează variaţia caracteristicii studiate în măsura în care mediile de grupă diferă între ele.
118
Dacă factorul de grupare nu este factor determinant pentru caracteristica studiată, mediile de grupă vor fi apropiate de media colectivităţii generale, deci variaţia caracteristicii este produsă de alţi factori şi nu de cel ales pentru gruparea datelor.
Pentru a determina intensitatea cu care au influenţat asupra variaţiei caracteristicii dependente cele două grupe de factori (întâmplători şi esenţiali), atât la nivelul grupelor, cât şi la nivelul colectivităţii
generale se calculează următoarele dispersii: dispersia de grupă (2i), media dispersiilor de grupă ( 2
i ),
dispersia dintre grupe (2) şi dispersia totală (2o).
Pe baza regulii de adunare a dispersiilor 2o = 2 + 2 , se pot calcula doi indicatori statistici cu
caracter de mărimi relative de structură: coeficientul de determinaţie (R2y/x) si coeficientul de
nedeterminaţie (K2y/z)
Regula de adunare a dispersiilor Regula de adunare a dispersiilor 2
o = 2 + 2 Dispersia totală
2o =
p
1jj
p
1jj
2
oj
f
fyy
Dispersia de grupă
2i =
p
1jij
p
1jij
2
ij
f
fyy
Media dispersiilor parţiale
2 =
m
1ii
m
1ii
2i
n
n
Dispersia dintre grupe
2 =
m
1ii
m
1ii
2
oi
n
nyy
Coeficientul de determinaţie (R2y/x) si
Coeficientul de nedeterminaţie (K2y/z) R2
y/x = 1002o
2
si K2y/z = 100
2o
2
Dispersia caracteristicii alternative (2p) se calculează ca o medie aritmetică ponderată a pătratelor
abaterilor termenilor de la media lor. 2p =
qp
qppp
22 )0()1(
. Deoarece p + q = 1 şi 1- p = q,
relaţia de calcul devine: 2p =
qp
pqpq
qp
qppq
)(22
= p q = p (1 - p), deci,2p = p q = p (1 –p)
Abaterea medie pătratică (p) a caracteristicii alternative se determină conform relaţiei:
p = )p1(pqp2p
Dispersia caracteristicii alternative poate lua doar valori cuprinse în intervalul 25.0;0 , iar abaterea
medie pătratică doar valori cuprinse în intervalul 5.0;0 . Când frecvenţele relative p şi q sunt egale,
abaterea standard şi dispersia vor înregistra valorile maxime p = 0,5, respectiv 2p = 0,25.
In cazul în care colectivitatea este împărţită în m grupe şi se studiază variaţia unei caracteristici alternative, se pot calcula următorii indicatori: dispersia de grupă, media dispersiilor parţiale, dispersia dintre grupe, dispersia totală a caracteristicii alternative. Regula adunării dispersiilor se păstrează şi în cazul unei caracteristici alternative: 2
p = 2p + 2
p
119
Indicatorii de variabilităţii pentru caracteristicile alternative Dispersia totală 2
p = p q
Abaterea medie pătratică
p = )p1(pqp2p
Dispersia de grupă 2pi = pi qi
Media dispersiilor parţiale 2
p =
m
1ii
m
1iiii
m
1ii
m
1ii
2pi
N
N)pq(
N
N
Dispersia dintre grupe 2
p =
m
1ii
m
1ii
2i
N
Npp
Regula de adunare a dispersiilor 2p = 2
p + 2p
Distribuţia statistică simetrică este acea distribuţie pentru care frecvenţele sunt uniform dispersate de-o parte şi de alta a valorii medii. Gradul de îndepărtare al unei distribuţii statistice de la simetrie se numeşte asimetrie. Pentru o serie de distribuţie perfect simetrică între cei trei indicatori modul, mediana şi media aritmetică există relaţia: x = Mo = Me
Seriile de distribuţie de frecvenţe prezintă cel mai des asimetrie de stânga sau de dreapta. Asimetria se poate analiza prin metoda grafică, utilizând histograma sau poligonul frecvenţelor, care oferă o imagine sugestivă asupra gradului de asimetrie.Pentru a măsura şi exprima printr-o valoare numerică gradul de asimetrie se calculează indicatorii de asimetrie sub formă absolută şi relativă.
Boltirea măsoară înălţimea, adică aplatizarea sau alungirea curbei frecvenţelor unei repartiţii comparativ cu cea normală. Karl Pearson propune următoarea expresie pentru coeficientul boltirii:
cb = 22
x
4x
)(
unde: 2x = dispersia variabilei, momentul centrat de ordin 2;
4x = momentul centrat de ordin 4 care se calculează după relaţia:
4x =
m
1ii
m
1ii
4i
f
f)xx(
Pentru a obţine un indicator de măsurare a excesului (cex) se compară coeficientul de boltire al lui Pearson cu valoarea acestui indicator pentru cazul repartiţiei normale pentru care coeficientul boltirii cb = 3.
Coeficienţi de asimetrie Coeficientul de asimetrie Pearson
-1 < x1
asMox
c
< 1
Coeficientul de asimetrie -3 <
x2
asMex3
c
< 3
Coeficientul de asimetrie Yule
12
123as qq
qqc
unde: q2 = Q3 - Me ; q2 = D9 - Me q1 = Me - Q1 q1 = Me - D1
dacă cas3 0.1 serie moderat asimetrică dacă cas3 0.3 serie pronunţat asimetrică
120
8.7.2 Concepte şi termeni de reţinut reprezentativitatea mediei; omogenitatea seriei; indicatori simpli ai variabilităţii;
o amplitudinea absolută a variaţiei (A); amplitudinea relativă a variaţiei (A%); o abaterile individuale absolute (di); abaterile individuale relative (di%); o abaterea maximă negativă în expresie absolută (dmax neg);abaterea maximă negativă în
expresie relativă (dmax neg %); o abaterea maximă pozitivă în expresie absolută (dmax poz );abaterea maximă pozitivă în
expresie relativă(dmax poz %); indicatori sintetici ai variabilităţii;
o abaterea medie liniară (dx), o abaterea medie pătratică (x), o dispersia (2
x), o coeficientul de variaţie (v).
regula de adunare a dispersiilor o media de grupă o media colectivitatii totale o dispersia de grupă o media dispersiilor de grupă o dispersia dintre grupe o dispersia colectivităţii totale o coeficient de determinatie; o coeficient de nedeterminaţie
asimetrie asimetrie absolută coeficient de asimetrie; coeficientul boltirii; coeficientul excesului
8.7.3 Întrebări de control şi teme de dezbatere
1. De ce este necesar calculul indicatorilor variabilităţii? 2. Care sunt indicatorii simpli ai variabilităţii? 3. Enumeraţi indicatorii sintetici ai variabilităţii. 4. Cum se calculează abaterea medie liniară? 5. Cum se calculează dispersia? 6. Cum se calculează abaterea medie pătratică? 7. Cum se calculează coeficientul de variaţie? 8. Cum se stabileşte omogenitatea seriei, respectiv reprezentativitatea mediei? 9. Cum se calculează şi care este semnificaţia dispersiei de grupă în cazul unei distribuţii condiţionate a
unei caracteristici rezultative „y” în funcţie de o caracteristică de grupare „x”? 10. Cum se calculează şi care este semnificaţia dispersiei dintre grupe în cazul unei distribuţii condiţionate
a unei caracteristici rezultative „y” în funcţie de o caracteristică de grupare „x”? 11. Care este regula de adunare a dispersiilor 12. Ce indicatori statistici pot fi calculaţi pe baza regulii de adunare a disperiilor? 13. Cum se calculează şi care este semnificaţia coeficientului de determinaţie?
121
14. Cum se calculează şi care este semnificaţia coeficientului de nedeterminaţie? 15. Prin ce se caracterizează o distribuţie simetrică? 16. Ce relaţie există intre mod, mediană şi medie aritmetică în cazul unei serii perfect simetrice? 17. Definiţi noţiunea de asimetrie. Care sunt relaţiile de calcul pentru coeficienţii de asimetrie? 18. Ce este boltirea? Care este relaţia de calcul pentru coeficietul boltirii?
8.7.4 Bibliografie:
1. Anghelache, C., Isaic- Maniu, A., Mitruţ, C., Voineagu, V., Dumbravă , M., (2007), Analiză economică, sinteze şi studii de caz, Editura Economică, Bucureşti;
2. Begu, L.S., (2009), Statistică internaţională –analize comparative, Editura Universitară, Bucureşti 3. Duguleană, L., (2012) Bazele statisticii economice, Editura CH Beck, Bucureşti; 4. Francis, A., (2004), Statistică şi matematică pentru managementul afacerilor, Editura Tehnică,
Bucureşti; 5. Turdean, M., (2012), Statistica, Editura Pro Universitaria, Bucureşti; 6. Ţiţan, E., (2012) Statistică – teorie şi aplicaţii în sectorul terţiar, Editura Meteor Press, Bucureşti;
122
9 UNITATEA DE STUDIU 9 CERCETAREA SELECTIVĂ
9.1 Introducere 9.2 Obiectivele unitatii de invatare 9.3 Competenţele unităţii de studiu 9.4 Timpul alocat unităţii de invăţare 9.5 Conţinutul unităţii de studiu
9.5.1 Notiuni utilizate in sondajul statistic 9.5.2 Planul cercetarii prin sondaj 9.5.3 Procedee de selectie 9.5.4 Tehnici de selectie 9.5.5 Erorile cercetarii prin sondaj 9.5.6 Tipuri de sondaj
9.6 Aplicaţii practice 9.7. Îndrumar pentru autoverificare 9.7.1 Sinteza unitatii de invatare 9.7.2 Concepte si termeni de retinut 9.7.3 Întrebări de control şi teme de dezbatere 9.7.4 Bibliografie
9.1 Introducere Fenomenele şi procesele social-economice pot fi cunoscute şi caracterizate pe baza datelor obţinute prin metode de înregistrare totală sau parţială. În anumite condiţii de timp şi de spaţiu nu se poate face înregistrarea totală a unităţilor care compun o colectivitate deoarece o astfel de operaţiune nu ar fi oportună din punct de vedere al costurilor şi operativităţii obţinerii rezultatelor. Problema care apare constă în a alege între precizia unor valori rezultate dintr-o înregistrare totală, dar influenţată de erorile de înregistrare (care sunt cu atât mai mari cu cât este mai mare volumul colectivităţii) şi o valoare, cu siguranţă inexactă, dar a cărei eroare de apariţie poate fi predeterminată, sau altfel spus, a cărei probabilitate de apariţie este cunoscută.
9.2 Obiectivele unităţii de studiu
– cunoaşterea conceptului de esantion (mostra); – cunoasterea avatajelor cercetarii partiale in raport cu
cercetarea totala; – cunoaşterea notiunilor utilizate in sondajul statistic; – cunoasterea etapelor planului de cercetare prin sondaj; – cunoaşterea conditiilor de asiguare a reprezentativitatii
esantionului; – cunoasterea procedeului de inferenta statistica; – cunoasterea procedeelor de selectie: aleatoare, dirijata si
123
mixta; – cunoasterea tehnicilor de selectie; – cunoasterea erorilor cercetarii prin sondaj; – cunoasterea tipurilor de sondaj.
9.3 Competenţele unităţii de studiu:
– studenţii vor putea să definească conceptul de esantion – studenţii vor putea să prezinte avantajele cercetarii partiale
in raport cu cercetarea prin sondaj; – studenţii vor putea să defineasca colectivitatea totala si
colectivitatatea de selectie; – studenţii vor putea să defineasca procedeul de inferenta
statistica; – studenţii vor cunoaşte cele trei procedee de selectie:
aleatoare, dirijata si mixta; – studenţii vor cunoaşte tehnicile de selectie; – studenţii vor putea sa faca diferenta dintre selecţia repetata
si cea nerepetata; – studenţii vor putea să defineasca conceptul de eroare de
selectie; – studenţii vor putea calcula eroarea medie de
reprezentativitate atat pentru selectia repetata cat si pentru cea nerepetata;
– studenţii vor putea determina intervalul de incredere pentru media colectivitatii generale;
– studenţii vor putea să defineasca distributia normala; – studenţii vor putea calcula, pe baza erorii limite maxim
admisibile, volumul de sondaj necesar atat pentru sondajul repetat cat si pentru sondajul nerepetat.
9.4 Timpul alocat unităţii de studiu:
Pentru unitatea de studiu „Cercetarea selectiv”, timpul alocat este de 4 ore.
9.5 Conţinutul unităţii de studiu
Definiţie Cercetarea prin sondaj este o metodă statistică de cunoaştere a
unei populaţii pe baza datelor înregistrate numai asupra unei părţireprezentative numită eşantion (mostră).
Cercetarea prin sondaj a unităţilor colectivităţii îşi atinge scopul doar în cazul în care rezultatele obţinute în urma prelucrării datelor din eşantion pot fi extinse/generalizate la nivelul întregii populaţii din care a fost extras eşantionul.
Datorită numărului mic de unităţi statistice studiate, cercetarea
124
parţială prezintă următoarele avantaje în raport cu cercetarea totală: - un volum mai redus de cheltuieli; - operativitate ridicată; - erori de înregistrare mai puţin frecvente şi mai uşor de
înlăturat în diferite faze de verificare a datelor; - caracterizarea mai aprofundată a fenomenului studiat
deoarece în programul observării prin sondaj poate fi cuprins un număr mai mare de caracteristici statistice.
Teoria sondajului, ca metodă de cunoaştere şi înregistrare a
lumii înconjurătoare, asigură cadrul metodologic şi ştiinţific necesar rezolvării problemelor legate de:
constituirea de eşantioane reprezentative; culegerea datelor din eşantion; prelucrarea datelor statistice din care rezultă indicatori
derivaţi: mărimi relative, mărimi medii, indici, care descriu statistic eşantionul;
estimarea cu o anumită probabilitate a parametrilor colectivităţii testate;
testarea veridicităţii/verosimilităţii estimaţiilor obţinute.
9.5.1 Noţiuni utilizate în sondajul statistic Cercetării prin sondaj îi este specifică utilizarea unor noţiuni
perechi care au acelaşi conţinut metodologic dar diferă din punct de vedere al informaţiei cuprinse.
1.a. Colectivitatea generală denumită şi populaţie, reprezintă ansamblul unităţilor statistice simple sau complexe care face obiectul cercetării statistice. Volumul colectivităţii generale se notează cu N.
1.b. Colectivitatea de selecţie denumită şi eşantion, mostră, probă, constituie acea parte din colectivitatea generală pentru care urmează să se culeagă datele. Volumul colectivităţii de selecţie se notează cu n.
Cu ajutorul datelor obţinute în urma observării unui eşantion se pot determina două categorii de indicatori:
2.a. Indicatori ai distribuţiei eşantionului, numiţi şi valori de sondaj, obţinuţi prin prelucrarea datelor rezultate din observarea eşantionului de volum n.
2.b. Indicatori ai distribuţiei populaţiei, numiţi şi parametri, care se estimează prin inferenţa statistică pe baza valorilor de sondaj obţinute pentru eşantion.
Dintr-o anumită colectivitate generală pot fi extrase mai multe
eşantioane care diferă între ele atât ca volum cât şi ca structură. Prin urmare, indicatorii statistici obţinuţi pe baza colectivităţii de sondaj, pot fi consideraţi variabile aleatoare pentru care se pot stabili distribuţii de frecvenţe.
Media şi dispersia pentru o colectivitate generală delimitată în timp şi spaţiu nu pot lua decât o singură valoare.
Relaţiile de calcul pentru valorile statistice de sondaj (valori statistice calculate) precum şi a parametrilor populaţiei sunt redate în tabelul 9.1.
125
Tabelul 9.1.Valorile statistice de sondaj şi parametrii populaţiei
Denumirea indicatorului Media Dispersia
Caracteristica nealternativă
Colectivitatea generală
N
xx
N
1ii
o
N
xxN
1i
2
i2o
o
Colectivitatea de selecţie
n
xx
n
1ii
s
n
xxn
1i
2
i2s
s
Caracteristica alternativă
Colectivitatea generală N
Mp p1p2
p
Colectivitatea de selecţie n
mw w1w2
w
9.5.2 Planul cercetării prin sondaj Planul cercetării prin sondaj presupune extragerea şi
observarea unui număr limitat de unităţi statistice aparţinătoare unei colectivităţi statistice pe care dorim să o cunoaştem. Pentru a cunoaşte colectivitatea, informaţiile rezultate cu acest prilej trebuie să fie utile şi suficient de precise.
Etapele planului de cercetare prin sondaj sunt: 1. Etapa de enunţare a obiectivelor cercetării urmăreşte: Estimarea unor caracteristici ale unei distribuţii, adică în
urma calculelor anumitor valori caracteristice eşantionului de volum (n) se estimează parametrii populaţiei (N);
Verificarea ipotezelor privind forma distribuţiilor, legăturile dintre fenomene, evoluţia fenomenelor.
2. Definirea populaţiei constă în: delimitarea statistică a
populaţiei şi verificarea gradului de omogenitate al acesteia. Delimitarea populaţiei presupune precizarea naturii sale
(indivizi, societăţi comerciale), a caracteristicilor urmărite (vârstă, profil de activitate), a spaţiului şi a timpului.
Verificarea gradului de omogenitate a colectivităţilor generale constă în analiza indicatorilor variaţiei caracteristicilor urmărite. Acest tip de analiză se poate baza pe datele oferite de o observare totală anterioară sau pe datele obţinute în urma mai multor sondaje succesive.
3. Eşantionarea presupune, în primul rând, stabilirea bazei de sondaj, adică a unei liste în care sunt prezentate sistematizat unităţile colectivităţii generale astfel încât să permită formarea aleatoare a eşantionului. Definirea unităţilor folosite la eşantionare presupune cunoaşterea naturii şi a modului de organizare a unităţilor în cadrul populaţiei. Unităţile de eşantionare pot fi: unităţi simple sau unităţi complexe. De asemenea, trebuie făcută distincţia dintre unităţile de observare, adică unitatea pe care o încercăm să o cunoaştem şi despre care se culeg informaţiile şi unitatea de eşantionare, adică unitatea desemnată în procesul de eşantionare să furnizeze informaţii atunci când ea diferă de unitatea de observare.
126
Exemplu: În anchetele asupra locuinţelor, unitatea de observare o constituie locuinţa, iar unitatea de eşantionare este persoana solicitată să ofere informaţii asupra acestui subiect. Procedeul de eşantionare se poate baza pe principiul selecţiei aleatoare sau pe principiul alegerii raţionale. Rezultatele cercetării prin sondaj depind de asigurarea reprezentativităţii eşantionului. Această condiţie este îndeplinită atunci când:
- unităţile se includ în eşantion după principiul hazardului cu o probabilitate diferită de zero, ce poate fi calculată;
- eşantionul este suficient de mare ca să permită redarea însuşirilor esenţiale ale colectivităţii totale;
- eşantionul reproduce în structura sa aceeaşi structură pe care o are şi colectivitatea generală.
4. Pentru determinarea eşantionului se pot folosi selecţii aleatoare, selecţii dirijate şi selecţii mixte, cunoscute sub denumirea generală de procedee de selecţie.
5. Observarea statistică a eşantionului se face respectând planul observării statistice.
6. Prelucrarea datelor necesită respectarea problemelor metodologice şi organizatorice cuprinse în planul de prelucrare (vezi Capitolul 3).
7. Pe baza indicatorilor distribuţiei eşantionului obţinuţi prin prelucrarea datelor are loc etapa de analiză a informaţiilor obţinute despre eşantion.
8. Inferenţa statistică este procedeul prin care se poate trece de la o valoare statistică calculată pe baza datelor dintr-un eşantion spre o valoare estimată.
9. Decizia statistică este legată de specificul demersului economic pentru care s-a desfăşurat sondajul, ca de exemplu, în agricultură - pentru estimarea recoltei probabile, în industrie - pentru controlul calităţii produselor, în comerţ – pentru estimarea cererii de mărfuri şi cunoaşterea opiniei consumatorilor. Sondajul este un instrument des utilizat şi în alte domenii: sondarea opiniei publice cu privire la alegeri, studiul comportamentului uman, determinarea stării de sănătate, verificarea ipotezelor privind influenţa diferiţilor factori asupra fenomenelor cercetate de biologie, medicină, fizică, psihologie, chimie, economie.
9.5.3 Procedee de selecţie La formarea eşantionului, unităţile statistice pot fi selectate
după principiul selecţiei aleatoare, al selecţiei dirijate (subiectiv organizate) sau al selecţiei mixte.
9.5.3.1 Selecţia aleatoare Selecţia aleatoare presupune extragerea din colectivitatea totală a
unităţilor eşantionului în mod aleator. Fiecare unitate componentă a populaţiei are o probabilitate egală şi diferită de zero de a fi aleasă în eşantion. Acest tip de eşantionare se aplică atunci când nu se cunoaşte structura colectivităţii totale după caracteristica ce urmează fi studiată.
9.5.3.2 Selecţia dirijată În cazul selecţiilor dirijate se poate spune că are loc, de fapt, o
alegere a unităţilor statistice după un anumit criteriu prestabilit, raţio-nal şi util. Acest principiu de eşantionare se aplică în sondajul realizat pentru colectivităţile grupate în grupe tipice.
127
9.5.3.4 Selecţia mixtă Selecţia mixtă este o combinaţie a principiilor selecţiei
aleatoare cu principiile selecţiei dirijate.
9.5.4 Tehnici de selecţie Tehnicile de selecţie depind de specificul domeniului cercetării
precum şi de resursele observatorului. Planul cercetării prin sondaj are următoarele etape: În funcţie de modul de extragere a unităţilor eşantionului,
selecţiile aleatoare pot fi realizate după: 1. procedeul tragerii la sorţi cu variantele:
1.1 procedeul selecţiei repetate (al bilei revenite); 1.2 procedeul selecţiei nerepetate (al bilei nerevenite).
2. procedeul selecţiei mecanice cu variantele: 2.1. procedeul tabelului cu numere întâmplătoare; 2.2. procedeul pasului de numere.
1. Procedeul tragerii la sorţi constă în extragerea dintr-o urmă a unor bile (sau a altor obiecte) reprezentând fiecare o unitate a colectivităţii.
1.1. Selecţia repetată se realizează după schema urnei cu bila revenită, care presupune ca de fiecare dată bila extrasă să fie reintrodusă în urnă. Astfel volumul colectivităţii generale (N) rămâne neschimbat pe toată durata operaţiunii de construire a eşantionului. Fiecare unitate din colectivitatea totală are aceeaşi
probabilitate N
1p de a fi selectată. La sfârşit în urnă rămân (N -
1) unităţi. 1.2. Selecţia nerepetată presupune că bila odată extrasă nu
se mai introduce în urnă, mărind astfel şansa fiecărei unităţi rămase de a intra în eşantion. Probabilitatea unei unităţi de a participa la formarea eşantionului se măreşte pe parcursul selecţiei astfel:
)1n(N
1p...
2N
1p
1N
1p
N
1p n321
La sfârşitul efectuării selecţiei, numărul unităţilor rămase în populaţie va fi (N – n).
Datorită faptului că în cazul selecţiei nerepetate este exclusă posibilitatea extragerii de mai multe ori a aceleiaşi unităţi, erorile sunt mai mici, deci rezultatele obţinute au un grad de precizie mai mare.
2. Selecţia mecanică 1. Procedeul tabelului cu numere aleatoare constă în
numerotarea tuturor unităţilor colectivităţii generale într-o ordine oarecare de la 1 la N. Extragerea unităţilor eşantionului (n) din tabelele cu numere aleatoare are loc alegând la întâmplare rândul şi coloana cu care începe selecţia.
2. Procedeul pasului de numărare presupune ordonarea unităţilor după o caracteristică oarecare. Operaţia de alcătuire a eşantionului este precedată de stabilirea pasului de numărare care trebuie să fie un număr întreg, calculat ca raport între volumul colectivităţii generale şi volumul colectivităţii de selecţie (N/n). Pentru construirea eşantionului se selectează la întâmplare o unitate la care se adaugă pasul de numărare până la obţinerea celor n unităţi ale eşantionului.
128
9.5.5 Erorile cercetării prin sondaj Abaterea care există între valorile calculate prin prelucrarea
datelor din eşantion şi ceea ce s-ar obţine în urma prelucrării datelor, dacă s-ar fi organizat o observare totală, se numeşte eroare de selecţie.
Erorile întâlnite în cadrul sondajului pot fi: (i) erori comune tuturor tipurilor de observări numite erori de înregistrare şi (ii) erori specifice cercetării prin sondaj numite erori de reprezentativitate.
Erorile de înregistrare pot fi înlăturate în diferitele etape ale controlului statistic.
Erorile de reprezentativitate specifice cercetării selective pot fi: (i) erori sistematice şi (ii) erori întâmplătoare.
- Erorile sistematice de reprezentativitate pot fi evitate dacă se respectă întocmai principiile teoriei selecţiei. Dintre cazurile care conduc la apariţia acestui tip de erori menţionăm: alegerea preferenţială (deliberată) a unităţilor din eşantion sau cuprinderea incompletă în eşantion a unităţilor din motive de comoditate.
- Erorile întâmplătoare de reprezentativitate apar chiar dacă se respectă întocmai principiile teoriei selecţiei.
Deoarece eşantionul are un număr mic de unităţi, el poate reproduce doar în mod întâmplător colectivitatea generală. În cazul selecţiilor aleatoare, erorile de reprezentativitate pot fi predeterminate. Estimarea parametrilor pentru colectivitatea generală poate avea loc pe baza valorilor de sondaj, cu o eroare întâmplătoare de reprezentativitate care se găseşte într-un interval probabilistic.
Erorile de reprezentativitate pot fi calculate ca: (a) erori efective şi (b) erori probabile.
9.5.5.1 Erorile efective de reprezentativitate Erorile efective de reprezentativitate se pot calcula pentru
acele caracteristici despre care s-au înregistrat date în urma unei observări totale.
Eroarea efectivă de reprezentativitate, (x
d ) are relaţia de
calcul:
0sxxxd
unde: sx = media eşantionului
0x = media colectivităţii totale Calculul erorii efective înseamnă, de fapt, verificarea reprezen-
tativităţii unui eşantion. Atunci când structura pe grupe a colectivităţii de selecţie nu diferă cu mai mult de ± 5% de structura colectivităţii generale, eşantionul este considerat reprezentativ.
Pentru a determina gradul de reprezentativitate (%x
d ) al
eşantionului se aplică relaţia:
100x
dd
0
x
%x
unde: x
d = eroarea efectivă de reprezentativitate
0x = media colectivităţii totale
129
În practică, în cele mai multe situaţii, nu se dispune de date referitoare la colectivitatea generală, ca urmare, media pe întreaga colectivitate nu este cunoscută. În aceste cazuri se efectuează mai multe selecţii succesive cu scopul de a verifica gradul de stabilitate a mediei şi a dispersiei pentru variabila după care se face eşantionarea.
Eroarea de reprezentativitate se va calcula în acest caz după
relaţia:
ssxxxd
unde: sx = media mediilor de selecţie efectuate pentru verificarea stabilităţii selecţiei.
9.5.5.2 Eroarea medie probabilă de reprezentativitate Erorile efective de reprezentativitate se pot calcula doar pentru
acele caracteristici despre care se cunosc date din eşantion şi date pentru întreaga colectivitate.
Cu cât volumul colectivităţii de selecţie este mai mare, cu atât media de selecţie va estima mai bine media colectivităţii generale. Pentru acelaşi volum de selecţie se pot obţine mai multe eşantioane din aceeaşi colectivitate generală, rezultând astfel valori diferite ale mediei de selecţie. În acest context de formare a mediilor de selecţie, fiecare medie poate să apară o singură dată sau de mai multe ori. Se poate afirma deci că media de selecţie este o variabilă aleatoare căreia i se poate stabili legea de distribuţie.
Erorile efective de reprezentativitate ( xd ) vor fi diferite de la un
eşantion la altul, ceea ce impune calculul unui indicator sintetic numit eroare medie de reprezentativitate. Acest indicator se calculează utilizând media pătratică pentru a evita compensarea erorilor de sensuri diferite şi pentru a da semnificaţia cuvenită erorilor mai mari. În cercetarea selectivă, media pătratică se simbolizează cu σ
x .(μx)
k
k 2
1iis
1iis0
ixx
f
fxsxμσ
unde: k = numărul eşantioanelor posibile
isx = media selecţiei i fs
i = frecvenţa mediei de selecţie i
Dacă volumul eşantionului este suficient de mare (peste 40 de unităţi), media de selecţie se distribuie potrivit funcţiei Gauss-Laplace cunoscută şi sub denumirea de distribuţie normală.
Distribuţia normală este de forma unei distribuţii simetrice în care, cea mai mare probabilitate de apariţie o are acea medie de selecţie care coincide ca valoare cu media colectivităţii generale a cărei eroare efectivă de reprezentativitate este zero. Celelalte valori ale mediei de selecţie se distribuie simetric (de ambele părţi ale mediei ce coincide cu media colectivităţii generale), având probabilităţi bine determinate şi egale pentru aceeaşi eroare/abatere absolută într-un sens sau altul. Probabilităţile de apariţie ale acestor
130
medii de selecţie descresc proporţional şi simetric către capetele distribuţiei, în timp ce erorile de reprezentativitate cresc. Erorile de reprezentativitate sunt exprimate în aceeaşi unitate de măsură ca şi variabila studiată. Pentru ca aceste erori să poată fi comparabile pentru orice variabilă studiată, abaterile absolute se transformă în abateri normale normate după relaţia:
x
0s
σ
xxz
Dacă mediile de selecţie se distribuie după legea normală, înseamnă că şi erorile întâmplătoare de reprezentativitate urmează aceeaşi formă de distribuţie.
Probabilitatea ca media de eşantionare să fie cuprinsă între două limite fixate anticipat (pe baza datelor sondajului), este:
xs0xs zxxzxP
Această probabilitate poate fi determinată cu relaţia:
dze2π
1ΦP
z
z
2
2z
(z)
Coeficientul z este argumentul funcţiei Gauss-Laplace şi se găseşte tabelat
Intervalul (xsxs zσx;zσx ) se numeşte interval de
încredere. Produsul
xz se numeşte eroare limită maxim admisibilă şi se
notează cu XΔ .
xΔ = xzσ
Riscul ca media populaţiei, (0
x ), să nu se afle în acest interval
se numeşte nivel sau prag de semnificaţie, se notează cu “α” şi este o valoare complementară a nivelului de încredere.
Probabilitatea caracterizează siguranţa cu care se afirmă că intervalul de încredere cuprinde valoarea mediei populaţiei. Altfel spus, probabilitatea (sau nivelul de siguranţă sau nivelul de încredere) ne arată ce şanse sunt ca eroarea reală comisă atunci
când o valoare 0
x necunoscută este aproximată prin sx să nu
depăşească eroarea limită maxim admisibilă XΔ . În practica cercetărilor selective s-a convenit că nivelul
probabilităţii cu care se fac estimările să nu fie mai mic de 95%. Aceasta înseamnă că şansele de a greşi estimarea nu trebuie să fie mai mari de 5%.
Intervalele de încredere pentru selecţii probabilistice succesive de volum suficient de mare (formate din unităţi statistice extrase dintr-o colectivitate N şi pentru care se poate accepta ipoteza că media de selecţie se distribuie normal) sunt reprezentate grafic în fig. 7.2.
131
xs 3x
xs 2x
xsx sx
xsx
xs 2x
xs 3x
Figura 9.2. Reprezentarea grafică a intervalelor de încredere Urmărind valorile coeficientului z, se observă că pe măsură ce
acestea cresc, (i) creşte şi probabilitatea P = (z), (ii) creşte intervalul de încredere al mediei şi (iii) scade exactitatea cu care se estimează media generală pe baza selecţiei.
Nivelul coeficientului z, intervalul de încredere, nivelul de siguranţă, pragul de semnificaţie
Nivelul
coeficientului z
Intervalul de încredere
xs zx
Nivelul de siguranţă
P(%)
Pragul de semnificaţie
(riscul) α = 100 – P (%)
1 xsx 68.26 31.74
1.96 xs 96.1x 95.00 5.00
2 xs 2x 95.44 4.56
2.58 xs 58.2x 99.00 1.00
3 xs 3x 99.73 0.27
3.3 xs 3.3x 99.90 0.10
4 xs 4x 99.99 0.01
Despre eroarea limită, XΔ , se poate afirma că este o mărime variabilă direct proporţională cu probabilitatea utilizată pentru garantarea rezultatelor şi invers proporţională cu exactitatea/precizia rezultatelor.
În cazul selecţiei aleatoare repetate între dispersia
colectivităţii generale (2o ), dispersia mediilor de selecţie de la
media colectivităţii totale (2x
) şi volumul selecţiei (n) există
relaţia: 2o
2x
σnσ
Pe baza relaţiei de mai sus se poate determina eroarea medie de reprezentativitate:
n
σ
n
σσ o
2o
repx
Deoarece în anumite condiţii de timp şi de spaţiu abaterea
medie pătratică ( o ) are un caracter stabil, se poate trage concluzia
că mărimea erorii medii de reprezentativitate poate fi influenţată prin modificarea volumului eşantionului. De obicei, urmărind
132
reducerea erorii medii de reprezentativitate vom apela la relaţia:
2
ox
kn
σ
k
σ
În cazul selecţiei aleatoare nerepetate, numărul de eşantioane este mai mic deoarece aceeaşi unitate nu poate participa decât la o singură selecţie. Astfel, apare inegalitatea:
20
2x
σnσ
Pentru selecţia nerepetată, eroarea medie de reprezentativitate va fi:
1N
nN
n
σσ
20
nerepx
unde:1N
nN
- coeficientul de corecţie a erorii medii de
reprezentativitate în cazul aplicării procedeului bilei nerevenite. N – n, reprezintă volumul colectivităţii generale rămas după
ultima extragere, cazul selecţiei nerepetate. N – 1, reprezintă volumul colectivităţii generale rămas după
ultima extragere, cazul selecţiei repetate. Dacă volumul colectivităţii generale este suficient de mare se
renunţă la (-1) din numitorul relaţiei precedente şi aceasta devine:
N
n1
n
σσ
20
nerepx
În cazul în care se cercetează variaţia unei caracteristici alternative, eroarea medie de reprezentativitate va fi:
- pentru selecţia aleatoare repetată:
n
p)p(1σ
p
- pentru selecţia aleatoare nerepetată:
N
n1
n
p)p(1σ
p
Eroarea medie de reprezentativitate (x
) şi eroarea limită
( XΔ ) pot fi calculate anticipat în cazul în care: (i) se cunoaşte media şi dispersia generală a unei caracteristici sau un estimator al acesteia, (ii) s-a stabilit volumul eşantionului şi (iii) s-a stabilit probabilitatea cu care se vor garanta rezultatele.
9.5.6 Tipuri de sondaj Tipul de sondaj se stabileşte în funcţie de scopul cercetării,
forma de organizare a colectivităţii generale şi gradul de omogenitate al acesteia.
Cele mai utilizate tipuri de sondaj sunt: 1. sondajul aleator simplu; 2. sondajul tipic (stratificat); 3. sondajul de serii. Pe baza indicatorilor: eroare medie de reprezentativitate, eroare
limită şi volumul eşantionului se estimează parametrii colectivităţii generale.
133
9.5.6.1 Sondajul aleator simplu Sondajul aleator simplu se aplică pentru colectivităţile cu grad
ridicat de omogenitate. Eşantionul se formează prin extragerea unităţilor din colectivitatea generală după procedeul bilei revenite sau al bilei nerevenite.
Se vor calcula următorii indicatori:
1. Eroarea medie de reprezentativitate ( xσ ):
- cazul sondajului repetat:
n
σσ
20
repx
- cazul sondajului nerepetat:
N
n1
n
σσ
20
nerepx
2. Eroarea limită maxim admisibilă ( xΔ ):
xx zσΔ
- cazul sondajului repetat:
n
σzzσΔ
20
repxrepx
- cazul sondajului nerepetat:
N
n1
n
σzzσΔ
20
nerepxnerepx
3. Volumul eşantionului (n) se determină pornind de la relaţia de calcul a erorii limită:
xx zσΔ
- cazul sondajului repetat: Dacă se consideră:
n
σzΔ
20
repx
atunci:
2repx
20
2
Δ
σzn
- cazul sondajului nerepetat: Dacă se consideră:
N
n1
n
σzΔ
20
nerepx
atunci:
N
σzΔ
σzn
20
22
nerepx
20
2
134
4. Valoarea reală/adevărată dar necunoscută a mediei
colectivităţii generale ( 0x ) se va situa în intervalul de încredere:
xs0xs ΔxxΔx Intervalul de încredere pentru variaţia mediei estimate pe baza
datelor de selecţie permite, pentru unele situaţii, determinarea intervalului de variaţie probabil al nivelului totalizat al caracteristicii corespunzător colectivităţii generale:
xsxs ΔxNxNΔxN sau
xs
N
1iixs ΔxNxΔxN
9.5.6.2 Sondajul tipic În studiul fenomenelor social-economice de masă se utilizează
cel mai frecvent sondajul tipic (stratificat). Acest tip de sondaj se aplică în cazul colectivităţilor neomogene, împărţite pe grupe cât mai omogene.
În funcţie de gradul de omogenitate al grupelor, mediile de grupă au valori mai apropiate de valorile individuale din care s-au calculat. Ca urmare, variaţia mediilor de selecţie posibile va depinde de gradul de variaţie al fiecărei grupe care este sintetizat de
indicatorul media dispersiilor parţiale (2
).
Deoarece 20
2 , prin aplicarea selecţiei tipice vor
rezulta erori de reprezentativitate mai mici decât în cazul selecţiei aleatoare simple.
Dacă nu se dispune de date dintr-o cercetare totală anterioară, deci nu se cunoaşte media dispersiilor parţiale din colectivitatea
totală 20 , se va utiliza pentru calculul indicatorilor de selecţie
media dispersiilor parţiale din colectivitatea de selecţie (2s ).
Relaţiile de calcul ale indicatorilor de selecţie pentru cazul sondajului tipic se determină pornind de la cele ale sondajului aleator simplu în care se înlocuieşte dispersia colectivităţii generale (dispersia
eşantionului) cu media dispersiilor de grupă (2
).
1. Eroarea medie de reprezentativitate ( x ) este:
- în cazul sondajului repetat:
n
σσ
2
x
- cazul sondajului nerepetat:
N
n1
n
2
x
2. Eroarea limită ( x ) este: - cazul sondajului repetat:
135
nz
2
x
- cazul sondajului nerepetat:
N
n1
nz
2
x
3. Volumul eşantionului (n) este: - cazul sondajului repetat:
2x
22
)(
zn
- cazul sondajului nerepetat:
N
t
zn
222
x
22
4. Intervalul de încredere pentru media colectivităţii generale este:
xs0xs xxx
unde:
i
isis
n
nxx
adică: sx este media ponderată a mediilor de selecţie isx
corespunzătoare grupelor în care a fost împărţită colectivitatea. Intervalul de încredere pentru variaţia nivelului totalizat al
caracteristicii este:
xs
N
1iixs xNxxN
În cazul sondajului tipic, pentru repartizarea unităţilor eşantionului pe subeşantioane corespunzător tipurilor calitative determinate se pot aplica trei procedee:
1. Repartizarea unităţilor eşantionului în mod egal pe subeşantioane indiferent de numărul unităţilor ce compun grupele colectivităţii totale. Acest tip de selecţie se numeşte selecţie tipică (stratificată) neproporţională.
k
nnk
unde: n – numărul unităţilor eşantionului nk – numărul unităţilor din subeşantionul k k – numărul grupelor din colectivitatea totală. 2. Repartizarea unităţilor eşantionului pe subeşantioane în
funcţie de ponderea fiecărei grupe în colectivitatea generală. Acest tip de selecţie se numeşte selecţie tipică (stratificată) proporţională, se foloseşte cel mai frecvent în practică deoarece conduce la o structură a colectivităţii de selecţie identică cu cea a colectivităţii generale, asigurând apariţia unor erori foarte mici.
136
k
1ii
ik
N
Nnn
unde: Ni – numărul unităţilor din grupa i a colectivităţii generale.
3. Repartizarea unităţilor eşantionului pe subeşantioane în funcţie de ponderea fiecărei grupe în colectivitatea generală, cât şi de gradul de omogenitate al grupelor, reprezentat de abaterea medie pătratică. Acest tip de selecţie se numeşte selecţie tipică (stratificată) optimă, deoarece conduce la cele mai mici erori posibile.
k
1iii
iik
N
Nnn
9.5.6.3 Sondajul de serii Sondajul de serii se utilizează atunci când colectivitatea
generală este formată din unităţi complexe. În cazul sondajului de serii, eroarea medie de reprezentativitate
se calculează ca şi în cazul sondajului aleator simplu, respectiv al sondajului tipic, dar cu următoarele corecţii:
- Numărul unităţilor colectivităţii generale (N) se înlocuieşte cu numărul de serii din colectivitatea generală (R);
- Numărul unităţilor din eşantion (n) se înlocuieşte cu numărul de serii din eşantion (r);
- Dispersia dintre valorile individuale (20σ ), respectiv
media dispersiilor parţiale (2σ ) se înlocuieşte cu dispersia dintre
serii (dispersia dintre grupe) 2δ .
Eroarea medie de reprezentativitate va fi: - în cazul sondajului repetat:
r
δσ
2
repx
- în cazul sondajului nerepetat:
1R
rR
r
δσ
2
nerepx
9.5.6.4 Alte tipuri de sondaje - Sondajul în trepte Uneori, complexitatea fenomenelor social-economice impune
ca sondajul să aibă loc în mai multe trepte. Acest tip de sondaj este considerat o formă particulară a selecţiei de serii, iar eroarea medie de selecţie se va determina după relaţia:
...f1r
δf1
r
δσ 2
2
22
11
21
x
unde: 2iδ = dispersiile dintre serii în fiecare treaptă;
fi = proporţia de selecţie a diferitelor trepte calculate ca
137
raport între numărul seriilor selectate şi numărul total al seriilor din treapta respectivă;
ri = numărul seriilor extrase în fiecare treaptă. Un exemplu de sondaj în trepte este selecţia teritorială. Prima
treaptă o reprezintă judeţele ţării. În treapta a doua se aleg localităţile din judeţele respective. În treapta a treia se aleg întreprinderi din localităţile alese etc.
- Sondajul în mai multe faze Acest tip de sondaj presupune organizarea unei observări totale
în care se înregistrează un număr redus de caracteristici statistice. În faza a doua se înregistrează un număr mai mic de unităţi statistice, dar programul de observare cuprinde mai multe caracteristici. În a treia fază se înregistrează un număr şi mai mic de unităţi, dar programul de observare urmăreşte caracterizarea şi mai completă a fenomenului studiat. În practică, în funcţie de scopul cercetării prin sondaj trebuie să se aleagă acel tip de selecţie care să asigure cel mai ridicat grad de precizie a rezultatelor fără a depăşi un cost alocat.
9.6 Aplicaţii practice Din colectivitatea de 400 de agenţi ai unei firme de asigurări a fost selectat întâmplător şi nerepetat un eşantion de 10% pentru care se cunosc datele:
Grupe de agenţi după comisionul
încasat (mii lei) Număr de agenţi (persoane)
4,0 – 4,4 2 4,4 – 4,8 7 4,8 – 5,2 14 5,2 – 5,6 9 5,6 – 6,0 5 6,0 – 6,4 3
Total 40 Se cere: a) Să se verifice omogenitatea eşantionului. b) Ştiind că rezultatele se garantează cu o probabilitate de 0,9973 (z = 3), să se estimeze limitele între care se va situa comisionul mediu al unui agent din colectivitatea generală precum şi comisionul total minim şi comisionul total maxim plătit de firmă angajaţilor săi. c) Dacă probabilitatea cu care se garantează rezultatele este de 0,9545 (z = 2), să se reia calculele referitoare la estimarea comisionului mediu al unui agent din colectivitatea generală şi să se comenteze rezultatele. d) Să se determine volumul noului eşantion în condiţiile în care eroarea limită calculată la pct. b) se micşorează cu 20%, respectiv măreşte cu 20%. e) Să se estimeze procentul maxim al agenţilor din colectivitatea generală care au încasat mai mult de 5,2 mii lei, în cazul unei probabilităţi de 0,9973 (z = 3).
138
Rezolvare: a) Calculul comisionului mediu al unui agent pe baza datelor din eşantion
Grupe de agenţi după comisionul încasat
(mii lei)
Număr de agenţi (fi) xi xifi i
2
i fxx
4,0 – 4,4 4,4 – 4,8 4,8 – 5,2 5,2 – 5,6 5,6 – 6,0 6,0 – 6,4
2 7 14 9 5 3
4,2 4,6 5,0 5,4 5,8 6,2
8,4 32,2
70 48,6
29 18,6
1,8818 2,2743 0,4046 0,4761 1,9845 3,1827
Total 40 * 06,8 10,204
lei/agentmii5,1740
206,8
f
fxx
i
iis
Calculul dispersiei:
0,255140
10,204
i
i2
i2s
2x f
f)x(xσσ
Calculul abaterii medii pătratice:
0,5050,255140
10,204
i
i2
isx f
f)x(xσσ
Calculul coeficientului de variaţie:
9,76%1005,17
0,505100
x
σv x
v = 9,76 % < 35%, se poate afirma că seria de date este omogenă şi media 5,17 mii lei/agent este reprezentativă. b) Calculul erorii limită maxim admisibilă
0,227400
401
40
0,25513
N
n1
n
σzzμΔ
2s
xx
Estimarea comisionului mediu al unui agent din colectivitatea generală:
5,397x 4,943
272,05,17x227,017,5
x xx
0
0
xs0xs
Estimarea comisionului total minim şi a comisionului total maxim:
)xN(x)x(N xs
400
1iixs
Comisionul total minim:
leimii1977,24,943400)ΔxN( xs
Comisionul total maxim:
leimii2158,85,397400)ΔxN( xs
c) Pentru p = 0,9545, z = 2
151,0400
401
40
2551,02
N
n1
nz
2
x
139
5,321x 5,019
151,05,17x151,017,5
x xx
0
0
xs0xs
Dacă probabilitatea cu care se garantează rezultatele scade, eroarea limită se micşorează şi prin urmare şi intervalul de încredere pentru medie se va micşora.
d) Determinarea volumului noului eşantion
agenti60
400
2551,03)1816,0(
2551,03'n
N
z)(
z'n
N
'n1
'nz
1816,0227,08,08,0
227,0
22
2
2s
22'
x
2s
22s'
x
x'x
x
Dacă eroarea limită se micşorează, intervalul de încredere pentru medie se micşorează şi volumul eşantionului va fi mai mare.
agenti29
400
2551,03)2724,0(
2551,03
N
2z)(
z''n
2724,0227,02,12,1
0,227
40n60'n
22
2
2s2''
x
2s
2x
''x
x
Dacă eroarea limită se măreşte, intervalul de încredere pentru medie va fi mai mare şi numărul necesar de unităţi pentru eşantion poate fi mai mic.
40 n29''n
e) 425,040
17
n
mw sau 42,5% dintre agenţii din eşantion au încasat comisioane peste 5,2 mii lei.
%7,64%2,22%5,42p
222,0400
401
40
)425,01(425,03
N
n1
n
)w1(wZz
wp
max
ww
wmax
Se poate afirma că cel mult 64,7%, respectiv 259 de agenţi din totalul agenţilor firmei de asigurări au încasat un comision mai mare de 5,2 mii lei.
4,943 5,019 0x 5.321 5,397
p = 0,9545
p = 0,9973
140
9.7 Îndrumar pentru autoverificare
9.7.1 Sinteza unităţii de studiu Cercetarea prin sondaj este o metodă statistică de cunoaştere a unei populaţii pe baza datelor
înregistrate numai asupra unei părţi reprezentative numită eşantion (mostră). Cercetarea prin sondaj a unităţilor colectivităţii îşi atinge scopul doar în cazul în care rezultatele
obţinute în urma prelucrării datelor din eşantion pot fi extinse/generalizate la nivelul întregii populaţii din care a fost extras eşantionul.
Datorită numărului mic de unităţi statistice studiate, cercetarea parţială prezintă următoarele avantaje în raport cu cercetarea totală:
un volum mai redus de cheltuieli; operativitate ridicată; erori de înregistrare mai puţin frecvente şi mai uşor de înlăturat în diferite faze de verificare a
datelor; caracterizarea mai aprofundată a fenomenului studiat deoarece în programul observării prin
sondaj poate fi cuprins un număr mai mare de caracteristici statistice. Cercetării prin sondaj îi este specifică utilizarea unor noţiuni perechi care au acelaşi conţinut metodologic dar
diferă din punct de vedere al informaţiei cuprinse: Colectivitatea generală şi colectivitatea de selecţie Valori de sondaj şi parametri,
Relaţiile de calcul pentru valorile statistice de sondaj (valori statistice calculate) precum şi a parametrilor populaţiei sunt redate în tabelul de mai jos.
Valorile statistice de sondaj şi parametrii populaţiei
Denumirea indicatorului Media Dispersia
Caracteristica nealternativă
Colectivitatea generală
N
xx
N
1ii
o
N
xxN
1i
2
i2o
o
Colectivitatea de selecţie
n
xx
n
1ii
s
n
xxn
1i
2
i2s
s
Caracteristica alternativă
Colectivitatea generală N
Mp p1p2
p
Colectivitatea de selecţien
mw w1w2
w
Planul cercetării prin sondaj presupune extragerea şi observarea unui număr limitat de unităţi
statistice aparţinătoare unei colectivităţi statistice pe care dorim să o cunoaştem. Pentru a cunoaşte colectivitatea, informaţiile rezultate cu acest prilej trebuie să fie utile şi suficient de precise.
Etapele planului de cercetare prin sondaj sunt:
141
Procedeele de selecţie sunt: Selecţia aleatoare Selecţia dirijată Selecţia mixtă Tehnicile de selecţie sunt: În funcţie de modul de extragere a unităţilor eşantionului, selecţiile aleatoare pot fi realizate după: procedeul tragerii la sorţi cu variantele:
o procedeul selecţiei repetate (al bilei revenite); o procedeul selecţiei nerepetate (al bilei nerevenite).
procedeul selecţiei mecanice cu variantele: o procedeul tabelului cu numere întâmplătoare; o procedeul pasului de numere.
Abaterea care există între valorile calculate prin prelucrarea datelor din eşantion şi ceea ce s-ar obţine în urma prelucrării datelor, dacă s-ar fi organizat o observare totală, se numeşte eroare de selecţie.
Erorile întâlnite în cadrul sondajului pot fi: (i) erori comune tuturor tipurilor de observări numite erori de înregistrare şi (ii) erori specifice cercetării prin sondaj numite erori de reprezentativitate.
Erorile de înregistrare pot fi înlăturate în diferitele etape ale controlului statistic. Erorile de reprezentativitate specifice cercetării selective pot fi: (i) erori sistematice şi (ii) erori
întâmplătoare. Erorile de reprezentativitate pot fi calculate ca: (a) erori efective şi (b) erori probabile. Distribuţia normală este de forma unei distribuţii simetrice în care, cea mai mare probabilitate de
apariţie o are acea medie de selecţie care coincide ca valoare cu media colectivităţii generale a cărei eroare efectivă de reprezentativitate este zero. Celelalte valori ale mediei de selecţie se distribuie simetric
1. Enuntarea obiectivelor cercetării
3. Esantionarea 3.1 Stabilirea bazei de sondaj 3.2 Definirea unitatilor de observare / de esantionare
2. Definirea populatiei statistice 2.1 Delimitarea in timp si spatiu a colectivitatii generale 2.2 Verificarea omogenitatii colectivitatii generale
4. Alegerea procedeului de selectie
5.Obsevarea statistica a esantionului
6. Prelucrarea datelor statistice
7. Analiza datelor
8. Inferenta statistica
9. Decizia statistica
142
(de ambele părţi ale mediei ce coincide cu media colectivităţii generale), având probabilităţi bine determinate şi egale pentru aceeaşi eroare/abatere absolută într-un sens sau altul. Probabilităţile de apariţie ale acestor medii de selecţie descresc proporţional şi simetric către capetele distribuţiei, în timp ce erorile de reprezentativitate cresc. Erorile de reprezentativitate sunt exprimate în aceeaşi unitate de măsură ca şi variabila studiată. Pentru ca aceste erori să poată fi comparabile pentru orice variabilă studiată, abaterile absolute se transformă în abateri normale normate după relaţia:
x
0s
σ
xxz
Dacă mediile de selecţie se distribuie după legea normală, înseamnă că şi erorile întâmplătoare de reprezentativitate urmează aceeaşi formă de distribuţie.
Probabilitatea ca media de eşantionare să fie cuprinsă între două limite fixate anticipat (pe baza datelor sondajului), este:
xs0xs zxxzxP
Această probabilitate poate fi determinată cu relaţia:
dze2π
1ΦP
z
z
2
2z
(z)
Coeficientul z este argumentul funcţiei Gauss-Laplace şi se găseşte tabelat Intervalul (
xsxs zσx;zσx ) se numeşte interval de încredere.
Produsul x
z se numeşte eroare limită maxim admisibilă şi se notează cu XΔ .
xΔ = xzσ
Riscul ca media populaţiei, (0
x ), să nu se afle în acest interval se numeşte nivel sau prag de
semnificaţie, se notează cu “α” şi este o valoare complementară a nivelului de încredere. Probabilitatea caracterizează siguranţa cu care se afirmă că intervalul de încredere cuprinde valoarea
mediei populaţiei. Altfel spus, probabilitatea (sau nivelul de siguranţă sau nivelul de încredere) ne arată ce
şanse sunt ca eroarea reală comisă atunci când o valoare 0
x necunoscută este aproximată prin sx să nu
depăşească eroarea limită maxim admisibilă XΔ . În practica cercetărilor selective s-a convenit că nivelul probabilităţii cu care se fac estimările să nu
fie mai mic de 95%. Aceasta înseamnă că şansele de a greşi estimarea nu trebuie să fie mai mari de 5%. Urmărind valorile coeficientului z, se observă că pe măsură ce acestea cresc, (i) creşte şi probabilitatea P = (z), (ii) creşte intervalul de încredere al mediei şi (iii) scade exactitatea cu care se estimează media generală pe baza selecţiei.
Despre eroarea limită, XΔ , se poate afirma că este o mărime variabilă direct proporţională cu probabilitatea utilizată pentru garantarea rezultatelor şi invers proporţională cu exactitatea/precizia rezultatelor.
Tipul de sondaj se stabileşte în funcţie de scopul cercetării, forma de organizare a colectivităţii generale şi gradul de omogenitate al acesteia. Cele mai utilizate tipuri de sondaj sunt:
sondajul aleator simplu; sondajul tipic (stratificat); sondajul de serii.
Pe baza indicatorilor: eroare medie de reprezentativitate, eroare limită şi volumul eşantionului se estimează parametrii colectivităţii generale.
143
INDICATORII DE SELECŢIE PENTRU SONDAJUL SIMPLU REPETAT Indicatori
Tip de caracteristică
Eroarea medie de reprezentativitate
(px
σ;σ )
Eroarea limită ( XΔ ; pΔ )
Volumul eşantionului (n)
Caracteristica nealternativă n
σσ
20
x xx zσΔ 2
x
20
2
Δ
σzn
Caracteristica alternativă n
p)p(1σ
p
p
zσpΔ 2p
2
)(Δ
p)p(1zn
INDICATORII DE SELECŢIE PENTRU SONDAJ SIMPLU NEREPETAT Indicatori
Tip de caracteristică
Eroarea medie de reprezentativitate
(px
; )
Eroarea limită ( xΔ ; pΔ )
Volumul eşantionului (n)
Caracteristica nealternativă
N
n1
n
20
x
xx zσΔ
N
σtΔ
σzn
20
22
x
20
2
Caracteristica alternativă
N
n1
n
p)p(1pσ p
zσpΔ N
p)p(1tΔ
p)p(1zn
22
p
2
Dacă nu se cunoaşte dispersia colectivităţii totale 20σ ( 2
pσ pentru caracteristica alternativă), aceasta
se va înlocui cu 2
sσ ( 2wσ pentru caracteristica alternativa), dispersia colectivităţii de selecţie.
INDICATORII DE SELECŢIE PENTRU SONDAJ TIPIC REPETAT
Indicatori
Tip de caracteristică
Eroarea medie de reprezentativitate
(px
σ;σ )
Eroarea limită ( X ; pΔ )
Volumul eşantionului (n)
Caracteristica nealternativă
n
σσ
2
x xx zσΔ 2
x
22
Δ
σzn
Caracteristica alternativă
n
p)p(1σ
p
p
zσpΔ 2p
2
Δ
p)p(1zn
144
INDICATORII DE SELECŢIE PENTRU SONDAJ TIPIC NEREPETAT Indicatori
Tip de caracteristică
Eroarea medie de reprezentativitate
(px
σ;σ )
Eroarea limită ( XΔ ; pΔ )
Volumul eşantionului (n)
Caracteristica nealternativă
N
n1
n
σσ
2
x xx zσΔ
N
σtΔ
σzn
222
x
22
Caracteristica alternativă
N
n1
n
p)p(1σ
p pp zσΔ N
p)p(1tΔ
p)p(1zn
22
p
2
Dacă nu se cunoaşte media dispersiilor parţiale corespunzătoare colectivităţii totale 2
)p1(p ,
aceasta se va înlocui cu media dispersiilor parţiale din colectivitatea de selecţie 2sσ ( w)w(1 ).
INDICATORII DE SELECŢIE PENTRU SONDAJUL DE SERII REPETAT
IndicatoriTip de caracteristică
Eroarea medie de reprezentativitate
(px
σ;σ )
Eroarea limită ( X ; pΔ )
Volumul eşantionului (r)
Caracteristica nealternativă
r
δσ
2
x xx zσΔ
2x
22
Δ
δzr
Caracteristica alternativă
r
δσ
2p
p pp zσΔ
2p
2p
2
)(Δ
δzr
INDICATORII DE SELECŢIE PENTRU SONDAJUL DE SERII NEREPETAT Indicatori
Tip de caracteristică
Eroarea medie de reprezentativitate
(px
σ;σ )
Eroarea limită ( X ; pΔ )
Volumul eşantionului (r)
Caracteristica nealternativă
1R
rR
r
δσ
2
x xx zσΔ R
δt
R
11Δ
δzr
222
x
22
Caracteristica alternativă
1R
rR
r
δσ
2p
p pp zσΔ R
δt
R
11Δ
δzr
2p
22
p
2p
2
145
9.7.2 Concepte şi termeni de reţinut esantion; colectivitate generala; colectivitate de selectie; inferenta statistica; selectia aleatoare; selectia dirijata; selectia mixta; unitatea de observare; unitatea de esantionare; procedee de esantionare; selectia repetata; selectia nerepetata; eroarea de selectie; erori de inregistrare; erori de reperzentativitate; erori sistematice; erori intamplatoare; erori efective; erori probabile; eroarea medie de reprezentativitate; eroarea limita maxim admisibila; distributia normala; volumul esantionului; intervalul de incredere; media de selectie; media colectivitatii totale;
9.7.3 Întrebări de control şi teme de dezbatere 1. Definiti conceptul esantion. 2. Prezentaţi avatajele utilizarii cercetarii partiale in raport cu cercetarea totala. 3. Care sunt principalele etape ale realizarii unui sondaj statistic? 4. Care este diferenta dintre unitatea de observare si unitatea de esantionare? 5. In ce consta procedeul de inferenta statistica? 6. Enumerati procedeele de esantionare. 7. Prezentati principalele procedee de selectie utilizate in alcatuirea esantioanelor aleatoare. 8. In ce consta procedeul selectiei repetate sau al bilei revenite? 9. Determinarea erorii medii de reprezentativitate, a erorii limite maxim admisibile si a intervalului de
incredere in cazul utilizarii sondajului simplu aleator nerepetat. 10. Prin ce se caracterizeaza distributia normala? 11. Care este nivelul probabilitatii, convenit in practica cercetarilor selective, pentru realizarea
estimarilor? 12. Cum se determina volumul esantionului in cazul sondajului aleator simplu repetat si nerepetat? 13. Cum se determina intervalul de variatie probabil al nivelului totalizat al caracteristicii corespunzator
colectivitatii generale? 14. Cand se aplica sondajul aleator simplu?
146
15. Ce particularitati prezinta sondajul stratificat (tipic)? 16. Cand se utilizeaza sondajul de serii?
9.7.4 Bibliografie:
1. Begu, L.S., (2009), Statistică internaţională –analize comparative, Editura Universitară, Bucureşti 2. Biji, E.M., Lilea, E., Roşca, E., Vătui, M., (2010), Statistică pentru economişti, Editura
Economică, Bucureşti; 3. Duguleană, L., (2012) Bazele statisticii economice, Editura CH Beck, Bucureşti; 4. Francis, A., (2004), Statistică şi matematică pentru managementul afacerilor, Editura Tehnică,
Bucureşti; 5. Săvoiu, Gh., (2011), Statistică pentru afaceri, Editura Universitară, Bucureşti 6. Turdean, M., (2012), Statistica, Editura Pro Universitaria, Bucureşti;