statistica pt ects
TRANSCRIPT
Nicoleta PETCU
-
2008 – 2009
Anul I, sem. 2
REPROGRAFIA UNIVERSITĂŢII “TRANSILVANIA” DIN BRAŞOV
PREFAŢĂ
Complexitatea cu care se desfăşoară procesele economice şi sociale, la nivel micro şi
macroeconomic, impune în mod necesar folosirea combinată a tuturor ştiinţelor, printre care şi
statistica.
Lucrarea cuprinde principalele probleme ale metodologiei statisticii economico-
sociale, selectate în funcţie de locul pe care această disciplină îl ocupă în pregătirea studenţilor
din învăţământul economic. Tratată în general, fie ca o ştiinţă de graniţă, fie ca o ştiinţă
metodologică, statistica este indispensabilă pentru cunoaşterea complexă a fenomenelor din
natură şi societate, conceptele sale fiind curente pentru limbajul omului modern. Se poate
spune că în prezent, nu există domeniu în care să nu se afirme: "statisticile de care dispunem
demonstrează că fenomenele cercetate corespund sau infirmă ipoteza pe care ştiinţa de
specialitate din domeniul respectiv a formulat-o".
Cu deosebire statistica îşi găseşte aplicaţie în studierea fenomenelor sociale, a
regularităţilor cu care acestea se produc, a evidenţierii gradului de influenţă a diferiţilor
factori, în studiul dinamicii şi mutaţiilor structurale, în analizele complexe privind realizarea
diferitelor programe de dezvoltare economico-socială, în fundamentarea statistică a deciziilor
financiare şi bancare.
Cursul de statistică se adresează, în primul rând, studenţilor din învăţământul superior
economic. Prin problematica abordată, el poate fi consultat de către toţi economiştii care sunt
interesaţi în cunoaşterea şi folosirea corectă, cu discernământ a metodelor statistice, a
metodologiilor de elaborare a indicatorilor în statistica micro şi macro economică. Prelucrarea
indicatorilor derivaţi şi procedeele de analiză statistică constituie partea principală a
manualului, indiferent dacă sunt tratate ca problematică generală valabilă pentru orice
investigaţie statistică, fie că se referă la un domeniu particular, de cercetare concretă la nivel
micro şi macro economic.
Orientarea pentru partea practică, aplicativă, este ilustrată prin numeroase grafice,
tabele şi modele de calcul şi analiză statistică, aplicaţii la datele concrete, de regulă din
realitatea vieţii noastre economice şi/sau din diferite publicaţii cu caracter oficial.
5
CUPRINS
Pag .
Capitolul 1. Statistica - instrument de cunoaştere a fenomenelor economice.
Observarea statistică ..................................................................................................
1. Obiectul şi metoda statisticii; relaţiile cu celelalte ştiinţe .................................
2. Concepte de bază folosite în statistică ………………………………………...
3. Rolul observării în procesul de cercetare statistică …………………………...
4. Proiectarea observării statistice ……………………………………………….
5. Metode de observare statistică ………………………………………………..
6. Organizarea sistemului informaţional în România ……………………………
7. Erorile observării statistice. Controlul datelor statistice ....................................
Rezumat .................................................................................................................
Termeni importanţi ................................................................................................
Teste de autocontrol ..............................................................................................
Capitolul 2. Sistematizarea şi prezentarea datelor statistice ..................................
1. Tipuri de grupări ...............................................................................................
2. Grupare unidimensională .............................................................. ....................
3. Grupare bidimensională ....................................................................................
4. Prezentarea datelor statistice .............................................................................
4.1 Tabele statistice ...........................................................................................
4.2 Seriile statistice ............................................................................................
4.3 Reprezentări grafice .....................................................................................
Rezumat .................................................................................................................
Termeni importanţi .............................. ..................................................................
Teste de autocontrol ..............................................................................................
Capitolul 3. Serii de distribuţie unidimensionale ...................... ..............................
1. Indicatorii statistici – definiţii, tipuri .................................................................
2. Indicatori statistici calculaţi sub formă de mărimi relative ...............................
3. Indicatorii tendinţei centrale ..............................................................................
3.1 Mărimi medii ...............................................................................................
3.1.1 Media aritmetică .......... .......................................................................
3.1.2 Media armonică ..................................................................................
3.1.3 Media pătratică ...................................... .............................................
3.1.4 Media geometrică ...............................................................................
3.2 Mediana ................................................................................. ......................
3.3 Moda (modulul, dominanta) ........................................................................
3.4 Cuartilele .....................................................................................................
4. Indicatorii variaţiei ............................................................................................
4.1 Indicatorii simpli ai variaţiei .......................................................................
4.2 Indicatorii sintetici ai variaţiei .....................................................................
5. Media şi dispersia caracteristicii alternative ......................................................
10
10
12
14
15
17
21
22
24
24
24
26
26
27
30
34
35
36
38
43
44
44
46
46
46
52
52
52
55
56
57
57
61
64
65
65
66
70
6
6. Asimetria ........................................................ ...................................................
Rezumat .................................................................................................................
Termeni importanţi ............................................................... .................................
Teste de autocontrol ..............................................................................................
Probleme propuse ........................................................................................ ..........
Capitolul 4. Serii de distribuţie bidimensionale .......................................................
1. Analiza dispersională ........................................................................................
2. Analiza ANOVA (testul Fisher - Snedecor) ......................................................
3. Tesul χ2 ............................................................ ............. ....................................
Rezumat ................................................................ .................................................
Termeni importanţi ................................................................................................
Teste de autocontrol ..................................................................... .........................
Probleme propuse ..................................................................................................
Capitolul 5. Regresie şi corelaţie ................................................................ ............. ..
1. Tipuri de legături între fenomenele social-economice .................... .......... ......
2. Regresia şi corelaţia liniară ...............................................................................
2.1 Calculul coeficienţilor de regresie ...............................................................
2.2 Măsurarea intensităţii corelaţiei ..................................................................
2.3 Semnificaţia estimaţiilor. Intervale de încredere .......................... ...............
2.4 Analiza reziduurilor .....................................................................................
3. Regresia neliniară ..............................................................................................
3.1 Tipuri de legături neliniare ..........................................................................
3.2 Raportul de corelaţie neliniară .....................................................................
4. Regresia multiplă ..................... ..........................................................................
5. Metode neparametrice de măsurare a legăturilor dintre fenomene ...................
5.1 Tabelul de asociere şi coeficientul de asociere ........................................ .....
5.2 Coeficienţii de corelaţie a rangurilor ...........................................................
Rezumat .................................................................................................................
Termeni importanţi ................................................................................................
Teste de autocontrol ..............................................................................................
Probleme propuse ..................... .............................................................................
Capitolul 6. Analiza seriilor cronologice ..................................................................
1. Noţiuni, particularităţi ....................................... ...............................................
2. Indicatorii statistici utilizaţi în prelucrarea seriilor cronologice ........................
2.1 Indicatori absoluţi ................................................................................... .....
2.2 Indicatori relativi .........................................................................................
2.3 Indicatori medii ...........................................................................................
3. Ajustarea seriilor cronologice ............................................................................
3.1 Ajustarea pe baza mediilor mobile ..............................................................
3.2 Ajustarea prin sporul mediu ................... .....................................................
3.3 Ajustarea pe baza indicelui mediu de dinamică ..........................................
3.4 Ajustarea prin metoda celor mai mici pătrate .............................................
4. Analiza sezonalităţii...........................................................................................
Rezumat ................................................................................................................
Termeni importanţi ................................................................................................
Teste de autocontrol ..............................................................................................
Probleme propuse ......................... .........................................................................
71
74
74
74
75
77
77
83
85
88
88
88
88
92
92
93
94
95
97
98
100
100
102
105
109
110
111
113
113
113
113
115
115
118
118
119
120
123
123
125
126
126
128
132
132
132
132
7
Capitolul 7. Metoda indicilor .....................................................................................
1. Noţiunea de indice statistic. Probleme teoretice ale construiri i indicilor .........
2. Indicii agregaţi. Sisteme de ponderare folosite la construirea indicilor de
grup .......................................................................................................................
3. Indicii de grup calculaţi ca medie a indicilor individuali ................................
4. Indicii calculaţi ca raport a două medii ............................................................
Rezumat ............................................................................. ...................................
Termeni importanţi ...............................................................................................
Teste de autocontrol .................................................................................... .........
Probleme propuse .................................................................................................
Bibliografie ..................................................................................................................
136
136
137
144
146
150
150
150
151
153
Capitolul 1 9
Capitolul 1
Tema Statistica - instrument de cunoaştere a fenomenelor economice.
Observarea statistică
Obiectivele 1. Obiectul şi metoda statisticii; relaţiile cu celelalte ştiinţe
2. Concepte de bază folosite în statistică
3. Rolul observării în procesul de cercetare statistică
4. Proiectarea observării statistice
5. Metode de observare statistică
6. Organizarea sistemului informaţional în România
7. Erorile observării statistice. Controlul datelor statistice
Mijloace - citire/învăţare
- întrebări, probleme ce apar, explicaţii
- definiţii, explicaţii ce trebuie reţinute
- situaţii economice concrete, supuse analizei, exemple (sub
lupă)
- teme de casă, aplicaţii practice pentru studenţi
Finalitatea - o perspectivă de ansamblu asupra conţinutului cursului
- deprinderea de a defini problema supusă analizei statistice
Evaluarea - parcurgerea aplicaţiilor propuse
Timp de lucru
necesar
1. Pentru cunoaşterea problemei: 4 ore
2. Pentru rezolvarea temelor: 12 ore + timpul de documentare
10 Statistica - instrument de cunoaştere a fenomenelor economice. Observarea statistică
Statistica - instrument de cunoaştere a fenomenelor
economice. Observarea statistică
1. Obiectul şi metoda statisticii; relaţiile cu celelalte ştiinţe
În toate momentele dezvoltării sale, statistica se ocupă de acele fenomene şi
procese care se produc într-un număr mare de cazuri, prezintă în reproducerea lor anumite
regularităţi şi care pot fi denumite fenomene de masă sau fenomene de tip colectiv. Pentru a
înţelege caracterul şi particularităţile acestor fenomene trebuie pornit de la natura raporturilor
de cauzalitate a acestora. În general, în cadrul societăţii ca şi în natură şi în tehnologie,
fenomenele pot să apară ca rezultat al unei singure cauze sau ca rezultat al mai multor cauze
care se manifestă izolat sau în interdependenţă între ele. În primul caz, sunt fenomene univoc
determinate şi de regulă, ele se prezintă ca fenomene simple, identice între ele denumite şi
fenomene tipice. În cel de-al doilea caz, apar ca fenomene multicauzale al căror proces de
formare poate să prezinte grade diferite de complexitate, cu relaţii multiple de
interdependenţă, formând împreună un ansamblu a cărui dimensiune şi structură pot fi
delimitate în timp, în spaţiu şi organizatoric.
Spre deosebire de fenomenele tipice care apar ca rezultat al unei singure cauze,
fenomenele de masă apar ca rezultat al influenţei comune a unui număr mare de cauze
şi condiţii variabile, cu grade şi sensuri diferite de influenţă, ceea ce face ca ele să se
prezinte ca o masă compactă de fenomene atipice, aparent independente între ele.
Fenomenele de masă, aparţinând unei forme superioare de mişcare a materiei se produc sub
acţiunea unor factori cu caracter sistematic, asociaţi cu cei întâmplători şi ca atare
fenomenologia cauzalităţii lor este complexă. Astfel în cadrul fenomenelor simple, univoc
determinate, pe măsură ce se produce cauza se produce şi efectul, dacă condiţiile rămân
neschimbate. Ele apar deci ca fenomene deterministe, certe, ca rezultat al acţiunii unor legi
ale dinamicii, ce pot fi cunoscute cu ajutorul metodei experimentale şi pentru care legea
odată descoperită poate fi verificată pentru fiecare caz în parte.
Fenomenele de masă, în general, apar ca o mulţime de forme individuale diferite, cu
existenţă distinctă, aparent fără nici o legătură de la o formă la alta, dar care analizate
comparativ se constată că au o aceeaşi esenţă. Aceasta se explică în principal prin faptul că ele
sunt generate de o serie de cauze comune care se manifestă de regulă în condiţii diferite.
În consecinţă, la fenomenele de masă din societate, relaţiile de multicauzalitate directă sau
indirectă care le determină fac imposibilă cunoaşterea legilor care le produc şi guvernează,
dacă se iau în studiu izolat doar câteva forme de manifestare a lor, ignorând ansamblul din
care fac parte. Explicaţia constă în faptul că în practică, formele individuale de manifestare
diferă de la o unitate la alta în funcţie de modul în care se asociază şi se combină factorii
sistematici cu cei întâmplători, cei esenţiali cu cei neesenţiali, cei obiectivi cu cei
subiectivi, lăsând impresia că fiecare formă individuală din cadrul ansamblului se produce la
întâmplare, fără să existe o cauzalitate certă. Dar, analizându-le la nivel de ansamblu, ele par
asemănătoare între ele, fiind generate de cauze esenţiale comune, supunându-se aceleiaşi
legi de apariţie şi dezvoltare. La aceasta, trebuie adăugat şi un alt aspect şi anume, relaţiile de
cauzalitate dintre fenomenele sociale au caracter dinamic, ca urmare a modificării
Capitolul 1 11
permanente a condiţiilor în care se manifestă. De aici se poate trage concluzia logică că în
astfel de cazuri legea acţionează atât static când fenomenele de masă sunt circumscrise în
aceleaşi condiţii de timp cât şi dinamic când fenomenele sunt delimitate în spaţiu şi
organizatoric, dar înregistrate în unităţi de timp diferite.
Ca atare, pentru a descoperi legea de apariţie a unor astfel de fenomene nu sunt
suficiente numai metodele experimentale, ca în cazul fenomenelor de tip determinist ci şi
altele, bazate pe o serie de abstractizări succesive, prin care să se reţină numai ceea ce este
esenţial, tipic în forma lor de manifestare prin eliminarea aspectelor întâmplătoare şi
neesenţiale. Aceasta presupune că se iau în studiu toate cazurile individuale deoarece, spre
deosebire de fenomenele care se produc pe baza legilor dinamicii, deci apar ca fenomene
identice, fenomenele de masă având cauze comune de apariţie dar şi unele cauze particulare,
care diferă de la un caz la altul, sunt numai asemănătoare între ele. Principala lor
proprietate este variabilitatea în timp şi în spaţiu şi legea de apariţie a acestora se
manifestă ca tendinţă ce nu poate fi cunoscută şi verificată decât la nivelul ansamblului
şi nu în fiecare caz în parte. Prezenţa printre factorii determinanţi şi a factorilor aleatori face
ca astfel de fenomene să nu poată fi interpretate decât recurgând la principiile teoriei
probabilităţilor. Ca atare, ele pot fi considerate ca fiind fenomene de tip nedeterminist sau
stochastic. În acelaşi timp, sub raport statistic, interpretarea acţiunii factorilor întâmplători nu
se poate realiza decât folosind proprietăţile legii numerelor mari, potrivit căreia variaţiile
întâmplătoare de la tendinţa generală se compensează reciproc dacă există un număr mare de
cazuri individuale de aceeaşi esenţă, luate în studiu.
Fenomenelor de masă le sunt specifice legile statistice - legi care se manifestă sub
formă de tendinţă, faţă de care abaterile întâmplătoare într-un sens sau altul se compensează
reciproc. În consecinţă, este necesar ca în cercetările statistice să se ia toate cazurile
individuale sau un număr suficient de mare, dar reprezentativ pentru întregul ansamblu,
pentru ca ele să poată intra sub acţiunea legii numerelor mari.
Sintetizând cele arătate, se poate conchide că o primă particularitate a statisticii
economico-sociale constă în faptul că: statistica studiază fenomenele social-economice de
masă în cadrul cărora acţionează legile statistice şi care prezintă proprietatea de a fi variabile
în timp şi spaţiu. În literatura de specialitate ele se întâlnesc sub denumirea de fenomene de
masă, fenomene de tip colectiv, fenomene stochastice sau fenomene atipice.
Studierea acestor fenomene reclamă folosirea combinată a mai multor discipline,
printre care şi statistica. În aceste condiţii este necesar să se stabilească unghiul din care
statistica îşi realizează studiile sale, ajungând astfel la cea de-a doua particularitate şi anume:
caracterizarea laturii cantitativ-numerice a fenomenelor social-economice, stabilindu-le
dimensiunea, dinamica, intensitatea, structura şi mutaţiile de structură, raporturile de
interdependenţă şi celelalte aspecte ce pot fi caracterizate numeric în funcţie de locul şi timpul
în care s-au produs în strânsă interdependenţă cu latura lor calitativă.
Deci, operând cu fenomene care apar în cadrul societăţii, statistica contribuie la
procesul de cunoaştere cantitativă pornind de la conţinutul calitativ al acestora. Desigur, în
analiza statistică, accentul cade pe latura cantitativă, dar cercetarea trebuie să pornească de la
înţelegerea trăsăturilor calitative ale fenomenelor. Abstractizările şi generalizările realizate
prin intermediul statisticii în vederea evidenţierii a ceea ce este specific, tipic în manifestările
unui fenomen sunt corecte numai în condiţiile înţelegerii şi respectării integrităţii calitative a
acestuia.
Statistica este ştiinţa care studiază aspectele cantitative ale
determinărilor calitative ale fenomenelor de masă, fenomene care sunt supuse acţiunii
12 Statistica - instrument de cunoaştere a fenomenelor economice. Observarea statistică
legilor statistice ce se manifestă în condiţii concrete, variabile în timp, spaţiu şi
organizare socio-economică.
Se poate afirma, fără teama de a greşi, că statistica se aplică în toate domeniile în care
fenomenele se pot exprima cantitativ-numeric şi prezintă proprietatea de a fi variabile între ele
ca formă concretă de manifestare.
Proiectarea unei cercetări statistice este o operaţiune de mare amploare, antrenând un
volum mare de resurse materiale, financiare şi umane şi un sistem informaţional bine articulat,
cu funcţionalitate permanentă. Într-o formă sugestivă, se poate urmări, pe etape, procesul de
elaborare şi desfăşurare a unei cercetări statistice.
2. Concepte de bază folosite în statistică
În vederea creării unui cadru comun tuturor formelor de activitate statistică şi
pentru evitarea unor interpretări greşite în statistică se folosesc o serie de noţiuni (concepte)
de bază cu care se operează în mod unitar în toate etapele cercetării şi în toate statisticile
aplicate (de ramură).
Colectivitatea statistică denumită şi populaţie, reprezintă totalitatea elementelor de
aceeaşi natură supuse unui studiu statistic. Masa elementelor se constituie într-o colectivitate,
dacă există o serie de trăsături comune, deci, dacă ele sunt generate de acelaşi complex de
cauze esenţiale. Uneori colectivitatea se defineşte ca totalitatea elementelor care prezintă
aceleaşi caracteristici esenţiale de identificare.
Colectivitatea statistică, astfel definită, are un caracter obiectiv şi finit. Aceasta
înseamnă că în orice cercetare concretă este necesară delimitarea ei. Delimitarea presupune
definirea elementelor din punctul de vedere al conţinutului, spaţiului, timpului şi formei
organizatorice, ceea ce face ca ele să poată fi: statice şi dinamice.
Colectivităţile statice exprimă o stare şi o anumită întindere în spaţiu, formând
împreună un existent (stoc) la un moment dat.
Colectivităţile dinamice exprimă un proces (flux), o devenire în timp. Caracterizarea
lor presupune înregistrarea elementelor componente pe un interval de timp.
Pentru o înţelegere clară a relaţiei dintre colectivităţile statice şi cele dinamice trebuie
subliniat faptul că în ambele cazuri există o mulţime de elemente variabile alături de unele
constante. Astfel, în cazul colectivităţilor statice timpul şi forma organizatorică trebuie să fie
constante, iar în cazul celor dinamice, spaţiul şi forma organizatorică sunt constante.
În analiza fenomenelor statistica poate opera, pentru alegerea şi validarea unor modele
de calcul şi analiză, cu colectivităţi (populaţii) abstracte şi infinite elaborate de către statistica
matematică sau cu colectivităţi ipotetice necesare elaborării unei ipoteze statistice ce urmează
să fie verificat în practică, pe baza unor date empirice.
Unităţile statistice reprezintă elementele constitutive ale colectivităţilor. Ca şi
colectivităţile, unităţile pot fi separate în statice şi dinamice. În cazul celor statice, unităţile
compun efectivul masei de fenomene (de persoane, de animale, de produse în stoc etc.). În
cazul colectivităţilor dinamice, unităţile aparţin aceleiaşi structuri organizatorice, au acelaşi
conţinut dar se produc în condiţii diferite de timp, ceea ce face ca ele să poată fi considerate
ca evenimente ale unui proces economico-social de masă.
Unităţile statistice pot fi simple şi complexe. Cele simple sunt elementele constitutive
ale colectivităţii (persoana, exemplarul de marfă etc.); iar cele complexe sunt rezultatul
organizării sociale şi economice a colectivităţii (familia, echipa, secţia, anul de studiu etc.).
Capitolul 1 13
De reţinut că unităţile statistice fiind entităţi independente şi obiective, pot fi studiate
individual, pe subcolectivităţi sau pe întreaga colectivitate.
Unităţile complexe ale colectivităţii pentru care se culeg date în procesul cunoaşterii
se deosebesc de unităţile de raportare, care pot fi de exemplu: întreprinderi, instituţii şi altele,
care potrivit legislaţiei în vigoare informează sistematic asupra activităţii unităţilor aflate în
structura lor organizatorică. Unităţile unei colectivităţi statistice sunt purtătoare ale unor
caracteristici variabile.
Caracteristicile statistice, denumite şi variabile statistice sau variabile aleatoare,
reprezintă criteriile pe baza cărora se caracterizează unităţile colectivităţii. Aceste criterii pot
fi însuşiri sau trăsături ale unităţilor care definesc ş i delimitează între ele unităţile colectivităţii
şi care urmează să fie înregistrate. Formele concrete de manifestare ale caracteristicilor la
nivelul fiecărei unităţi a colectivităţii se numesc variante sau valori. Numărul de unităţi la
care se înregistrează aceeaşi variantă sau valoare se numeşte frecvenţă sau pondere.
Caracteristicile statistice se diferenţiază după mai multe criterii.
a) După conţinutul lor pot fi de timp, de spaţiu şi atributive.
Caracteristicile de timp arată apartenenţa unităţilor la un moment sau perioadă de
timp.
Caracteristicile de spaţiu arată situarea în teritoriu a unităţii. Se exprimă prin cuvinte
pe baza unui nomenclator al unităţilor teritoriale.
Caracteristicile atributive sunt toate celelalte însuşiri ale unităţilor statistice şi
servesc pentru definirea fenomenelor studiate.
b) După modul de exprimare, ele se separă în caracteristici calitative (exprimate prin
cuvinte) şi caracteristici cantitative (exprimate numeric). De exemplu, profesia şi
vârsta.
După natura variaţiei, cele numerice se împart în caracteristici cu variaţie continuă
şi cu variaţie discontinuă sau discretă.
c) După modul de manifestare la nivelul unităţilor simple pot fi alternative -
manifestarea directă sau opus ei, de exemplu urban-rural - şi nealternative - cu
variante distincte numerice sau calitative, de exemplu salariile şi profesia.
După modul de obţinere şi folosire a datelor pot fi primare - obţinute în procesul de
culegere a datelor şi cu care se caracterizează nivelul de dezvoltare atins la nivelul unităţilor
simple şi complexe şi caracteristici derivate obţinute prin aplicarea unui model de calcul
statistic.
Datele statistice sunt caracterizări numerice ale unităţilor, grupelor şi colectivităţii
obţinute din observare şi prelucrare. În statistică, datele sunt întotdeauna mărimi concrete,
caracterizate printr-o parte noţională care defineşte conţinutul calitativ, valoarea numerică şi
elementele de identificare (de timp, de spaţiu etc.). Mesajul datelor îl reprezintă informaţia.
Obţinerea datelor statistice depinde de modul de organizare şi funcţionare a sistemului
informaţional statistic. Coordonarea ştiinţifică şi metodologică, într-o viziune sistemică, este
asigurată de către organul de statistică publică. În acest sens, informaţia statistică trebuie
privită ca un proces continuu, în care în permanenţă intră date primare, se prelucrează pe
diferite structuri, se stochează, se publică sau se transmit unor beneficiari de informaţii pe
baza unor programe prestabilite.
Datele statistice se pot structura după modul de utilizare a lor în procesul de cercetare
statistică în: date primare (observate) şi date prelucrate (derivate) prin aplicarea unui model de
calcul statistic asupra datelor primare. Suportul datelor statistice îl constituie indicatorii
statistici. Între date şi indicatori statistici există o relaţie de reciprocitate. Deosebirea constă
însă în faptul că datele statistice sunt o expresie generalizatoare în timp ce indicatorii statistici
sunt particularizaţi pe domenii şi de obicei apar şi se folosesc ca sisteme şi subsisteme de
indicatori.
14 Statistica - instrument de cunoaştere a fenomenelor economice. Observarea statistică
Indicatorii statistici reprezintă expresia numerică a unei determinări calitative
obiective obţinută în urma efectuării unei cercetări statistice raportată la condiţii specifice de
timp, spaţiu şi organizatorice şi se regăsesc cu regularitate în statistica oficială şi în
publicaţiile de specialitate.
Indicatorul statistic măsoară, de regulă, o categorie economică, socială, demografică,
tehnologică etc.
Exprimarea numerică a unei categorii presupune folosirea mai multor indicatori,
fiecare punând în evidenţă anumite aspecte esenţiale ale acesteia. Astfel, productivitatea
muncii poate fi exprimată direct prin producţia fizică, producţia marfă, valoarea adăugată etc.,
obţinută într-o unitate de timp de muncă. Nici unul din aceşti indicatori nu poate caracteriza
însă complet conţinutul acestei categorii complexe, fiecare răspunzând unui anumit aspect
determinat de obiectivul de cunoaştere stabilit.
Pornind de la obiectivul de cunoaştere stabilit trebuie să elaborăm, în primul rând, lista
indicatorilor statistici care trebuie calculaţi.
Indicatorii statistici pot fi obţinuţi prin măsurare şi estimare. Pentru calcularea unor
indicatori macroeconomici dispunem de date pentru unele componente şi pentru celelalte
recurgem la aplicarea unor raţionamente deduse din corelaţiile dintre componente.
Măsurarea presupune exprimarea în unităţi concrete de măsură şi se face atunci când
statistica vine în contact direct cu fenomenele studiate sau preia din alţi purtători de informaţii
date numerice.
Estimarea presupune o caracterizare statistică utilizând un model sau o ipoteză
statistică prin care pe baza datelor parţiale de care se dispune se determină o serie de
indicatori generalizatori. Aceste date pot fi reprezentative şi atunci se poate face o estimare
corectă şi nereprezentativă şi atunci se pot utiliza numai pentru obţinerea unor indicatori
orientativi, fără suport statistic.
Elaborarea indicatorilor statistici se realizează sub îndrumarea şi controlul organului
oficial de statistică din ţara respectivă.
3. Rolul observării în procesul de cercetare statistică
Observarea denumită şi culegerea (înregistrarea) datelor reprezintă prima
etapă a procesului de cercetare statistică.
Observarea statistică constă din culegerea unitară a datelor despre
unele caracteristici în prealabil stabilite de la unităţile care au fost incluse în obiectivul
de cercetare statistică, după un program riguros elaborat.
La efectuarea observării statistice trebuie să se ţină seama de unele recomandări
generale ca:
datele culese cu privire la însuşirile proprii fenomenului observat trebuie să fie
autentice. Pentru realizarea acestui obiectiv este necesar să se ia toate măsurile ca
datele observării să nu conţină erori, pentru ca valoarea indicatorilor generalizatori
obţinuţi pe baza lor să nu fie modificată, iar concluzia statistică să reflecte denaturat
fenomenele studiate.
caracterizarea colectivităţilor supuse studiului se bazează pe observaţii culese pentru
fiecare unitate componentă a colectivităţii. Prin urmare, definirea unităţilor de
Capitolul 1 15
observare (simple şi complexe) trebuie să se facă pe baza unor elemente clare care să
permită înţelegerea unitară a noţiunii respective de către toate persoanele participante
la culegerea datelor;
datele obţinute prin observarea statistică trebuie să îndeplinească atât condiţia de
volum cât şi de calitate. Dacă datele sunt incomplete ca volum nu există siguranţa că
prin prelucrarea lor, oricât de corectă ar fi, se va ajunge la descoperirea legităţilor
obiective după care s-au produs fenomenele;
datele statistice trebuie să se prezinte ca un material informativ complet şi unitar atât
sub aspectul organizatoric cât şi al conţinutului.
Pentru ca activitatea de culegere a datelor să fie eficientă se recomandă stabilirea în
prealabil a unor etape de lucru, a unui program de acţiune.
4. Proiectarea observării statistice
Ca etapă a cercetării, observarea statistică este condiţionată de scopul
cercetării, de particularităţile obiectului studiat şi de tehnica de calcul folosită în procesul de
prelucrare ulterioară a datelor observării.
Principalele probleme, care trebuie rezolvate pentru realizarea unei observări statistice,
se referă la: scopul observării; obiectul observării; programul observării propriu-zise: unitatea
de observare; timpul şi locul observării; formularele; instrucţiunile; problemele organizatorice
necesare desfăşurării normale a operaţiei de culegere a datelor.
Scopul observării este subordonat scopului general pentru care s-a organizat
cercetarea statistică.
Scopul general al cercetării este legat de funcţiile statisticii ca ştiinţă socială şi
activitatea practică de informare. Scopul special al unei observări se determină în funcţie de
necesităţile specifice de informaţii pentru domeniul în care se organizează cercetarea şi care
se încadrează în scopul general al acesteia. Corespunzător obiectivului final urmărit de
cercetarea statistică respectivă se pot delimita obiectivele parţiale care, în cazul observării
statistice, se vor referi concret la volumul şi calitatea datelor necesare.
Obiectul observării îl formează colectivitatea de fenomene despre care urmează să se
culeagă date statistice. Colectivitatea supusă observării trebuie delimitată - aşa cum am
precizat şi mai înainte - ca volum, în timp şi spaţiu, indiferent dacă este o colectivitate statică
sau o colectivitate dinamică. De remarcat este faptul că nu întotdeauna obiectul cercetării
coincide cu obiectul observării. Astfel, în cazul când se foloseşte o observare parţială,
colectivitatea observată este mai mică decât colectivitatea totală. Indiferent însă, de felul
observării utilizate este necesar ca atunci când caracterizarea finală se referă la întreaga
colectivitate să se definească nu numai colectivitatea parţială - pentru care se culeg datele - ci
şi cea totală pentru care se generalizează rezultatele. Definirea colectivităţii statistice trebuie
să se facă după o serie de caracteristici esenţiale, stabile şi care să asigure comparabilitatea
datelor de la o observare la alta.
În cazul fenomenelor cu un grad mai mare de complexitate, colectivitatea se
structurează pe subcolectivităţi cu un grad mai mare de omogenitate (de exemplu, muncitorii
în cadrul personalului unei unităţi economice, numărul studenţilor străini în totalul studenţilor
unei facultăţi etc.). Aceste subcolectivităţi pot fi observate separat sau împreună cu întregul
ansamblu.
Programul propriu-zis al observării este format din totalitatea caracteristicilor
pentru care urmează să se culeagă date de la toate unităţile colectivită ţii.
16 Statistica - instrument de cunoaştere a fenomenelor economice. Observarea statistică
Programul observării se concretizează în întrebări care sunt înscrise în formulare
statistice şi la care trebuie să se obţină răspunsuri cu privire la nivelul de dezvoltare sau la
forma lor de manifestare.
De menţionat faptul că, în programul observării trebuie să se includă acele
caracteristici care prezintă interes pentru cercetarea statistică şi sunt esenţiale, adică răspund
direct obiectivului stabilit. Întocmirea corectă a unui program de observare este nerealizabilă
fără consultarea specialiştilor din domeniul care face obiectul observării.
Unitatea de observare poate să fie simplă sau complexă. Definirea unităţilor de
observare, indiferent de felul lor, trebuie să se facă pe baza unor elemente clare, care să
permită înţelegerea unitară a noţiunii respective de către toate persoanele care culeg datele.
De asemenea, la definirea unei unităţi de observare trebuie să se ţină seama şi de felul
colectivităţii (statice sau dinamice). Astfel, unităţile colectivităţii statice există la momentul
dat ca entităţi de sine stătătoare, bine determinate, cu o dimensiune precisă. Spre deosebire de
acestea, unităţile colectivităţilor dinamice (fenomenele apar, se dezvoltă, dispar în decursul
unei perioade) pot fi înregistrate numai pe intervalul respectiv, numărul lor la un anumit
moment fiind lipsit de sens.
La definirea unităţii de observare trebuie să se ţină seama şi de necesitatea de a asigura
comparabilitatea datelor pe plan teritorial şi în dinamică.
Timpul observării - pentru efectuarea unitară a observării statistice trebuie să se
precizeze atât timpul la care se referă datele culese, cât şi timpul când se face înregistrarea.
Timpul la care se referă datele nu trebuie confundat cu timpul înregistrării. De regulă,
timpul observării este considerat acela la care se referă datele culese şi poate fi un singur
moment (pentru înregistrările statice) sau o perioadă (pentru înregistrările dinamice).
Alegerea timpului observării se face în funcţie de felul observării, de particularităţile
obiectului şi mai ales de scopul cercetării statistice.
Pentru înregistrările în dinamică se stabileşte timpul observării pentru o perioadă - o
zi, o decadă, o lună, un trimestru etc. - iar completarea formularelor se face după expirarea
timpului la care se referă datele. Este cazul rapoartelor statistice.
Există şi situaţii când timpul observării coincide cu timpul când se înregistrează datele,
cum este cazul fotografierii zilei de lucru a angajatului.
Un alt aspect căruia trebuie să i se acorde o mare importanţă se referă la alegerea
timpului observării. În practica statistică, ca timp al observării se alege perioada în care
colectivităţile prezintă gradul cel mai ridicat de stabilitate. De exemplu, recensământul
populaţiei se efectuează iarna când deplasarea populaţiei este mai redusă. Pentru studiul
cererii de consum a populaţiei pentru anumite bunuri şi servicii, în funcţie de scopul
cercetărilor vom alege o perioadă mai stabilă, în afara sărbătorilor dacă vrem să evidenţiem
componenta stabilă sau altă perioadă dacă vrem să punem în evidenţă şi să determinăm
sezonalitatea atunci când este cazul.
De remarcat faptul că în prelucrarea ulterioară a datelor nu apare decât timpul la care
se referă datele.
Locul observării este precizat în program cu scopul de a găsi mai uşor unităţile de
observare. El coincide, de regulă, cu locul producerii fenomenelor. Cazul în care locul
înregistrării diferă de locul producerii fenomenului se întâlneşte în special când observarea
statistică se realizează prin preluarea datelor din diferite surse deja existente (alte forme de
evidenţă, publicaţii etc.).
În general probleme legate de loc apar în observarea statistică pentru unităţile statistice
complexe, care includ în ele unităţile simple din care sunt formate.
Formulare şi instrucţiuni - pentru a realiza o observare unitară este necesar ca
formularele pe care se culeg datele statistice să fie tipizate şi întocmite pe baza programului
observării, astfel încât să se poată da răspunsuri la toate caracteristicile.
Capitolul 1 17
În practică se folosesc două tipuri de formulare: fişa şi lista. În fişe se trec datele cu
privire la o singură unitate de observare, conform programului. Fişa se foloseşte când
programul de observare este mai bogat şi când unităţile de înregistrare sunt mai răspândite în
spaţiu. Într-o listă se înscriu răspunsurile la caracteristicile din program pentru mai multe
unităţi de observare statistică concentrate în spaţiu. În unele situaţii se pot folosi şi combinat
cele două tipuri de formulare. De exemplu, la recensămintele de populaţie se întocmeşte câte
o fişă pentru fiecare familie, iar persoanele care locuiesc în colectivităţi numeroase (cămine,
armată, spitale) sunt înregistrate în liste.
Normele metodologice şi tehnice privind completarea formularelor sunt imprimate
direct pe ele sau separat în broşuri speciale.
Aceste instrucţiuni de completare a formularelor trebuie să fie cât mai scurte, dar
complete, asigurând înţelegerea uniformă pentru toţi observatorii statistici.
Formularele trebuie să fie întocmite în aşa fel încât să permită codificarea
răspunsurilor la întrebări, în vederea prelucrării ulterioare a datelor folosind o tehnică de
calcul adecvată.
Măsurile organizatorice au drept scop asigurarea unor condiţii cât mai bune pentru
desfăşurarea observării statistice. Mai întâi este necesar să se efectueze din timp o
documentaţie amplă cu privire la experienţa acumulată cu prilejul unor observări similare,
întrucât în ţară sau pe plan mondial valorificarea acestei experienţe are drept rezultat atât
obţinerea unui volum mare de date şi de bună calitate cât şi posibilitatea asigurării
comparabilităţii datelor în timp şi în spaţiu.
Când datele se culeg direct de la populaţie este necesar să se facă popularizarea
acţiunii prin presă, radio şi televiziune pentru a informa populaţia asupra conţinutului şi
scopului observării respective.
Măsurile organizatorice sunt foarte variate de la o observare la alta, în funcţie de
natura specifică a fenomenelor studiate, de sursele de informaţie utilizate, de volumul de date
ce urmează să fie obţinut, de felul şi procedeul de înregistrare folosit. De aceea, planul unei
observări trebuie să se particularizeze pe fiecare cercetare în parte, în funcţie de scopul
acesteia.
5. Metode de observare statistică
În procesul istoric de dezvoltare a statisticii s-au conturat mai multe metode de
observare care de regulă, se folosesc combinat, sub îndrumarea şi controlul organelor oficiale
de statistică, în prezent Institutul Naţional de Statistică). În general metoda de observare a fost
şi este dependentă de modul de organizare şi funcţionare al sistemului informaţional al
statisticii de stat. În acest sens, informaţia statistică poate fi privită ca un proces continuu în
care pe măsură ce intră date, acestea se prelucrează şi sunt transformate în indicatori statistici
care pot fi transmişi în ordine ierarhică organului superior sau stocaţi în băncile de date
statistice, servind frecvent ca mijloace de informare publică despre principalele aspecte şi
fenomene ale dezvoltării economice şi sociale.
Existenţa mai multor metode de observare statistică prezentând particularităţi de
conţinut şi metodologie face posibilă clasificarea lor în funcţie de mai multe criterii.
Un prim criteriu de clasificare este acela al gradului de cuprindere al numărului de
unităţi în procesul de observare. În funcţie de aceasta, întâlnim observări totale şi
observări parţiale. Observarea totală presupune înregistrarea după criterii unitare a datelor -
potrivit programului de observare de la toate unităţile colectivităţii. În acest caz, principala
problemă este aceea a identificării tuturor cazurilor concrete sub care se manifestă fenomenul
18 Statistica - instrument de cunoaştere a fenomenelor economice. Observarea statistică
studiat. Ţinând seama de posibilităţile de obţinere a informaţiei, observările totale sunt:
recensământul şi raportările statistice cunoscute şi sub denumirea de dări de seamă.
Observările parţiale presupun că datele se obţin numai de la o parte a unităţilor colectivităţii,
parte care poate să fie reprezentativă sau nu în raport cu întreaga colectiv itate.
Un alt criteriu de clasificare are în vedere modul în care este caracterizat
fenomenul. Din acest punct de vedere se întâlnesc observări statice şi observări dinamice.
Observaţiile statice sunt folosite pentru a culege date cu privire la volumul şi structura unei
colectivităţi statice delimitată ca volum şi circumscrisă în aceleaşi condiţii de timp, adică la un
moment dat. Observările dinamice au ca obiect înregistrarea unui proces ce evoluează în timp.
În acest caz trebuie să se stabilească timpul la care se referă datele şi periodicitatea cu care se
face înregistrarea. În cadrul observărilor statice se includ recensămintele şi în general orice
inventariere statistică indiferent de colectivitatea la care se referă, iar celelalte observări
statistice totale sau parţiale, care înregistrează fenomenele în continua lor transformare sunt
observări cu caracter dinamic. De exemplu, bugetele de familie necesare caracterizării
statistice a calităţii vieţii, reprezintă o observare dinamică ca de altfel şi dările de seamă
statistice transmise de agenţii economici. Din punct de vedere al modului de organizare
observările statistice pot fi observări cu caracter permanent, deci, în mod sistematic intră
date statistice în sistemul informaţional şi observări speciale care vin să completeze pe cele
permanente, organizându-se de fiecare dată când este necesar. În general observările cu
caracter permanent reprezintă principala "materie primă"a procesului de cercetare prin
sistemul informaţional statistic, în timp ce observările speciale sunt organizate de către
organul central de statistică pentru lărgirea cadrului de interpretare şi analiză al fenomenelor
complexe existente în societate.
Din punct de vedere al timpului de efectuare se pot întâlni observări curente,
periodice şi unice.
De reţinut că în practica statistică aceste criterii se pot întrepătrunde. Alegerea celei
mai potrivite metode de observare trebuie să se facă în raport cu natura specifică a
fenomenelor studiate cu sursele de informaţie de care dispunem şi pot fi utilizate, cu
mijloacele de prelucrare a informaţiei pe care le avem, precum şi de cantitatea de informaţie
existentă în băncile de date statistice.
Principalele metode de observare statistică sunt:
recensământul;
raportările statistice denumite şi sistemul dărilor de seamă;
observarea selectivă;
ancheta statistică;
observarea părţii principale;
monografia.
Recensământul este cea mai veche metodă de observare statistică. Ea a apărut încă
din antichitate şi avea un caracter demografic. În general reprezintă fotografierea fenomenelor
la un moment dat. Deci, trebuie să alegem un moment critic faţă de care ne raportăm atunci
când culegem datele. Recensămintele populaţiei reprezintă modelul general pentru observările
de acest tip. Ele reprezintă operaţii de mare amploare şi durata de pregătire de 1-2 ani. La
organizarea unui recensământ se ţine seama de experienţa naţională şi internaţională în acest
domeniu concretizate în special în nomenclatoarele care vor fi utilizate la prelucrarea datelor
şi la prezentarea structurată a informaţiei care să permită alinierea statisticii noastre la teoria şi
practica ţărilor avansate.
Recensămintele reprezintă observări cu caracter periodic, periodicitatea recunoscută
pe plan naţional şi internaţional fiind de 5-10 ani. La alcătuirea programului observării trebuie
să se ţină seama de scopul recensământului. În acelaşi timp pentru a putea surprinde mutaţiile
de structură trebuie să asigurăm comparabilitatea datelor pe plan naţional şi internaţional. În
Capitolul 1 19
acest scop, se elaborează un număr mare de nomenclatoare. Pentru a asigura operativitatea
culegerii datelor se folosesc recenzori şi de altă specialitate decât cea statistică, ceea ce
înseamnă că ei trebuie recrutaţi şi instruiţi astfel încât să se folosească norme unitare pe tot
teritoriul.
Teritoriul se împarte în circumscripţii şi sectoare de recensământ, care să permită
combinarea prelucrării centralizate cu cea descentralizată. Pentru buna reuşită a
recensământului se organizează un recensământ de probă cu care ocazie se verifică dacă
normele pe un recenzor sunt bine stabilite şi în timpul preconizat se poate obţine întreaga
cantitate de informaţie.
Prin analogie se pot folosi recensăminte şi în alte domenii ca de exemplu:
- anual, populaţia de vârstă şcolară şi cu opţiunile corespunzătoare;
- anual, recensământul animalelor.
Într-un sens mai larg orice inventariere poate să fie considerată ca un recensământ
statistic.
Raportările statistice curente sunt specifice sistemelor informaţionale în cadrul
cărora sunt cuprinse cu obligaţii permanente de informare întreprinderile, instituţiile şi agenţii
economici, publici şi privaţi. Ele se realizează în concordanţă cu obligaţiile stipulate prin
legea statisticii statului de drept. În aceste raportări, denumite uneori şi dări de seamă sunt
incluşi principalii indicatori cu caracter economic, social-cultural, juridic, de învăţământ şi
alte servicii. Unitatea odată inclusă în sistemul informaţional statistic este obligată de lege să
transmită integral informaţia cerută prin formulare tipizate de raportări statistice, la termenele
fixate şi despre perioada respectivă, în continua desfăşurare a fenomenelor şi activităţilor ce
fac obiectul înregistrărilor pe baza acestei metode de observare.
În consecinţă, trebuie să existe un nomenclator de raportări statistice în care sunt
trecute toate formularele, obligatoriu simbolurile acestora, beneficiarii de informaţii, numărul
de exemplare şi conţinutul indicatorilor. În condiţiile prelucrării automatizate a informaţiei
este necesar ca periodic să se efectueze un proces de raţionalizare a raportărilor statistice,
eliminându-se paralelismele de obţinere a datelor şi informaţiei de prisos.
Valorificarea rezultatelor obţinute prin această metodă de observare se face în scopul
informării populaţiei, a guvernului şi a organismelor internaţionale la care ţara noastră este
afiliată. Este evident faptul că opinia publică într-o economie de piaţă este din ce în ce mai
interesată în legătură cu mersul activităţii economice, a problemelor de investiţii de capital,
probleme privind piaţa muncii, probleme de management şi marketing modern, care nu pot fi
rezolvate decât printr-o statistică corectă şi operativă.
Rezultă că, raportările statistice sunt observări totale pentru unităţile cuprinse în
sistemul informaţional statistic, cu caracter permanent şi surprind în acelaşi timp atât
probleme statice cât şi dinamice. Evident numărul dărilor de seamă şi al indicatorilor la care
se referă sunt mai numeroase pentru unităţile economice şi sociale din sectorul public. Totuşi
informarea opiniei publice asupra economiei naţionale trebuie să cuprindă întregul sistem de
relaţii economice din ţară. Pentru unele aspecte privind activitatea din sectorul privat al
economiei, se folosesc şi unele surse indirecte, în principal statistica fiscală care va ocupa un
loc din ce în ce mai important în furnizarea datelor statistice sub formă de raportări statistice
periodice.
Sondajul reprezentativ cunoscut şi sub denumirea de observare selectivă face parte
din metodele de observare special organizate şi cu caracter parţial. Are ca scop să înlocuiască
o observare totală de mare amploare sau care practic este imposibilă. De exemplu, dacă vrem
să studiem calitatea produselor, durata medie de funcţionare a bunurilor, etc., nu este raţional
să se facă o observare totală. De asemenea, dacă vrem să studiem calitatea vieţii recurgem la
un sondaj pe bază de bugete de familie în care sunt înregistrate veniturile pe surse şi
20 Statistica - instrument de cunoaştere a fenomenelor economice. Observarea statistică
cheltuielile pe destinaţie pentru un eşantion de familii. Pe baza bugetelor de familie putem
stabili un indice al costului vieţii.
Pentru ca să putem substitui observarea totală prin cea parţială eşantionul trebuie să
îndeplinească condiţia de reprezentativitate. Prin reprezentativitate înţelegem ca eşantionul să
reproducă într-un număr mic de unităţi structura întregii colectivităţi (populaţii). De aici
rezultă că, pentru a aplica corect un sondaj statistic, trebuie să studiem mai întâi structura
populaţiei şi factorii determinanţi, cu caracter esenţial, care au influenţat asupra fenomenelor
pe care le studiem.
În acest sens sondajul statistic este o metodă riguroasă care se bazează pe principiile
teoriei probabilităţilor potrivit căreia putem obţine nu numai caracterizarea statistică a
fenomenelor, dar putem calcula şi erorile probabile de estimare a tendinţelor generale pe baza
datelor de eşantion.
Ancheta statistică este o metodă de observare parţială cu deosebirea că numai cu totul
întâmplător poate să îndeplinească condiţia de reprezentativitate. Ea se bazează pe
completarea benevolă a chestionarelor, ceea ce înseamnă că pe baza rezultatelor ei putem
aprecia unele tendinţe generale fără să putem face o estimare riguroasă a parametrilor
colectivităţii totale. De exemplu, cererea de bunuri de consum se poate studia fie prin sondaje
statistice reprezentative, deci prin metoda selectivă, fie prin anchete statistice. În primul caz
eşantionul se stabileşte prin aplicarea unei scheme probabilistice alegând unităţile care vor
forma eşantionul astfel încât să reprezinte toate straturile populaţiei într-o proporţie
corespunzătoare. Putem folosi pentru studiul cererii de mărfuri şi o anchetă statistică efectuată
la pavilioanele de mostre. În acest caz sunt rugaţi vizitatorii să completeze chestionarele. În
cel de-al doilea caz evident că datele sunt numai orientative deoarece se constată că structura
celor care completează chestionarele prezintă abateri semnificative de la structura populaţiei
totale.
Frecvent cele două metode de observare se folosesc în cercetările cu caracter
sociologic şi în sondajele de opinie publică.
Observarea părţii principale se foloseşte atunci când se studiază o colectivitate care
prezintă variaţii calitative substanţiale de la o grupă la alta, astfel încât unele grupe au o
influenţă hotărâtoare la formarea indicatorilor pe întreaga colectivitate, iar altele au o
influenţă nesemnificativă. În consecinţă în cadrul unei colectivităţi pot fi preponderente
anumite grupe şi în acst caz este suficient să se supună observării numai partea principală a
colectivităţii şi, cu anumite rezerve, să se caracterizeze întregul ansamblu.
Informaţiile culese prin observarea părţii principale nu au caracter reprezentativ, dar
pot da o informaţie orientativă asupra tendinţelor ce se manifestă la nivelul întregului.
Monografia este o observare parţială care se realizează la o unitate complexă sau
pentru o problemă care interesează. De exemplu, se poate întocmi monografia unui oraş,
municipiu, întreprindere.
Rezultă că o monografie statistică înseamnă o caracterizare multilaterală a unităţilor
complexe studiate. Ea se realizează de către o echipă mixtă de specialişti care participă la
toate trei etapele: observarea datelor, prelucrarea lor, analiza şi interpretarea rezultatelor.
În sfârşit, în aplicarea concretă a tuturor metodelor de observare statistică trebuie să se
folosească în mod corespunzător procedeele de culegere statistică a datelor care respectă în
cea mai mare măsură principiul autenticităţii. Astfel, pentru culegerea datelor putem folosi
măsurarea şi/sau observarea directă, interogarea, autoânregistrarea, fie preluarea din alţi
purtători de informaţii.
Măsurarea directă se foloseşte atunci când variabilele incluse în programul observării
se pot obţine direct printr-o operaţie de măsurare cantitativă efectuată nemijlocit de cel care
culege datele. În acest caz, responsabilitatea asupra conţinutului real al indicatorilor revine
celui care completează şi semnează formularele de observare statistică.
Capitolul 1 21
Procedeul interogării se foloseşte atunci când completarea formularelor se face de o
persoană special angajată numită recenzor. Acesta consemnează răspunsurile de la persoanele
intervievate. De aici necesitatea ca recenzorul să aibă talentul de a convinge pe cel căruia îi
solicită informaţia de confidenţialitatea răspunsului şi de faptul că în procesul de prelucrare
ulterioară datele solicitate şi consemnate îşi pierd individualitatea. Ele se regăsesc numai în
indicatori globali sau în expresii numerice cu caracter de medie, structură etc. Rezultă de aici
că responsabilitatea autenticităţii datelor îi revine în principal recenzorului incluzând în acesta
şi măsura în care l-a determinat pe cel intervievat la furnizarea unor date exacte. În ţările în
care cele mai multe informaţii statistice se obţin pe bază de sondaje statistice există instituţii
specializate în astfel de operaţiuni şi ei folosesc în scopul realizării observării statistice ca
recenzori fie angajaţi proprii, fie angajaţi temporari.
Auto-înregistrarea se foloseşte atunci când formularele sunt completate de persoanele
la care se referă datele. Ea se realizează fie atunci când formularele se expediază celor de la
care se culeg datele, fie că se distribuie într-un mod organizat de exemplu: târguri de mostre,
expoziţii. Tot aici se pot încadra şi bugetele de familie care se completează în mod curent de
către un membru al familiei din eşantion. Evident că în acest caz asigurarea veridicităţii
datelor depinde exclusiv de cel care completează formularul.
Procedeul preluării datelor statistice din alţi purtători de informaţii provine din
particularitatea statisticii de a-şi realiza observarea prin cele două căi: contactul direct cu
obiectul observării şi folosirea unor surse de informaţii deja existente. Astfel, statistica poate
să relizeze observarea folosind documente de evidenţă primară, documente contabile şi
financiare, diferite publicaţii statistice. Rezultă în acest caz că statistica fiind beneficiar de
informaţie depinde de autenticitatea datelor înscrise în purtătorii de informaţii utilizaţi. De
regulă, prin sondaj, statistica efectuează un control asupra credibilităţii surselor de informare
utilizate.
Pentru completarea observării statistice curente serviciile de statistică publică au acces
la evidenţele administrative deţinute de serviciile publice - bilanţuri contabile, documente de
impozitare, registre comerciale, registre de evidenţă a populaţiei etc., cu obligaţia de păstrare
a confidenţialităţii datelor incluse în sistemul de indicatori calculate şi publicate de Comisia
Naţională pentru Statistică.
6. Organizarea sistemului informaţional în România
Întreaga activitate a statisticii publice trebuie să se desfăşoare respectând
următoarele principii: autonomiei; confidenţialităţii; transparenţei; specializării;
proporţionalităţii şi deontologiei statistice.
Se cunoaşte că organizarea sistemului informaţional depinde întotdeauna de rolul şi
funcţiile pe care statistica, ca instituţie statală îl are în procesul de conducere şi de luare a
deciziilor atât la nivel macro cât şi în structurile componente ale acestuia. De aici rezultă că
statistica trebuie să-şi organizeze astfel întreaga sa activitate încât să furnizeze în mod curent
sau de câte ori este nevoie date cuprinzătoare pentru informarea opiniei publice, a organelor
puterii de stat cât şi a instituţiilor internaţionale la care ţara noastră este afiliată.
Ca atare, întreaga activitate de statistică trebuie să fie desfăşurată într-o viziune
sistemică şi să fie concretizată într-un sistem de indicatori deschis şi dinamic. Aceasta
presupune de asemenea, că acest sistem să fie organizat pe subsisteme corespunzător
structurilor principale ale economiei naţionale. În principal, în ţara noastră, statistica trebuie
să obţină informaţii şi să le transmită după criteriul de ramură, după criteriul teritorial şi după
criteriul formei de proprietate.
22 Statistica - instrument de cunoaştere a fenomenelor economice. Observarea statistică
La nivelul fiecărei structuri ierarhice statistica trebuie să asigure pe de o parte
posibilitatea de agregare şi dezagregare a informaţiei, ceea ce nu împiedică o anumită
autonomie. Această autonomie apare în special în structura de ramură şi teritorială în care ea
trebuie să relizeze şi analize complexe al căror obiect îl constituie ramura sau judeţul
respectiv.
Deci, putem considera că obţinerea informaţiei statistice este un proces continuu în
care statistica de stat are legături sistematice cu furnizorii de date statistice şi cu beneficiarii
de informaţii.
Organizarea sistemulul informaţional şi funcţionarea lui depinde în mare măsură de
tehnica de calcul de care se dispune. Prelucrarea automată a datelor statistice impune o
anumită rigurozitate în ceea ce priveşte obţinerea datelor cât şi prelucrarea acestora. În acest
sens, organul statistic trebuie să aibă în componenţa sa şi un departament de calcul şi de
obţinere a indicatorilor, a conţinutului acestora, a gradului lor de cuprindere şi asigurării
comparabilităţii lor pe plan naţional şi internaţional. În acelaşi timp rezultă că la fiecare nivel
de obţinere a informaţiilor statistice trebuie să fie elaboraţi purtători de informaţie şi băncile
de date statistice corespunzătoare. Numai în aceste condiţii sunt posibile să existe relaţii
nemerice strict determinate între indicatorii urmăriţi.
Fiind conceput într-o structură ierarhică între elementele sistemului se obţin indicatori
agregaţi de la bază către vârful sistemului şi indicatori dezagregaţi de la vârful sistemului
către bază. În altă ordine de idei trebuie reţinut că statistica operând cu fenomene variabile în
timp, spaţiu şi organizatoric, nu poate folosi o singură expresie numerică pentru caracterizarea
aceluiaşi fenomen, ci un număr mai mare de indicatori, de regulă cuprinşi într -un sistem.
Elaborarea sistemului şi subsistemelor de indicatori în structura orizontală, verticală şi
transversală este o problemă cu caracter permanent ce trebuie să fie rezolvată de către
statistica de stat pe baza experienţei naţionale şi internaţionale dobândită în domeniul teoriei
economice şi a practicii statistice privind organizarea şi funcţionarea instituţiilor de statistică.
7. Erorile observării statistice. Controlul datelor statistice
Principiul de bază al efectuării unei observaţii statistice este acela al asigurării
autenticităţii datelor. Prin autenticitatea datelor se înţelege corespondenţa deplină între datele
înregistrate şi mărimea obiectivă a fenomenului. Buna organizare a unei observări statistice
trebuie să se reflecte în obţinerea unor date exacte şi în volum complet.
Practica statistică a dovedit că în mod curent se pot produce mai multe feluri de erori
şi anume: erori de observare sau înregistrare; erori de reprezentativitate; erori de modelare
statistică.
Erorile de observare reprezintă abateri între datele înregistrate şi mărimea concretă,
reală a caracteristicilor cuprinse în programul observării. Aceste erori de înregistrare sunt cu
atât mai numeroase cu cât cercetarea este de mai mare amploare şi cuprinde un program
amplu de observare.
Erorile de observare întâmplătoare se produc, de regulă, în ambele sensuri şi sunt
făcute nepremeditat; fie din neânţelegerea corectă a întrebării, fie din lipsa de memorie. Cu
cât observarea se referă la un număr mai mare de unităţi, cu atât posibilităţile de compensare a
acestor erori sunt mai mari şi ca atare ele vor influenţa în mai mică măsură rezultatele de
ansamblu.
Erorile de observare sistematice se produc, de regulă, într-un singur sens şi
influenţează asupra indicatorilor de ansamblu. Erorile sistematice sunt de natură subiectivă şi
provin fie din neânţelegerea fenomenelor, fie din rea credinţă.
Capitolul 1 23
Exemplu de eroare de observare sistematică poate fi menţionat aşa numitul proces de
"aglomerare a vârstelor" terminale între 0 şi 5; populaţia fiind tentată să declare o vârstă
rotunjită la 0 şi 5.
Erorile de reprezentativitate apar atunci când înlocuim o observare totală prin una
parţială. Şi în acest caz întâlnim două categorii de erori: erori întâmplătoare şi erori
sistematice. Erorile întâmplătoare apar datorită faptului că, oricât s-ar respecta principiile
teoriei selecţiei este destul de greu să obţinem eşantioane în structură identică cu cea a
colectivităţii generale. Astfel de erori se produc în ambele sensuri şi ele sunt calculabile
folosind principiile teoriei probabilităţilor dacă la formarea eşantionului am folosi o schemă
probabilistică.
Erorile sistematice apar de regulă când folosim un sistem preferenţial, subiectiv, de
formare a eşantionului. În acest caz, de regulă, erorile se produc într-un singur sens şi
influenţa lor se propagă asupra exactităţii estimaţiei parametrilor colectivităţii totale. Ele pot fi
înlăturate dacă luăm toate măsurile de respectare riguroasă a teoriei selecţiei.
Erorile de modelare statistică sunt specifice prelucrării şi analizei datelor statistice.
Statistica studiază fenomenele complexe care prezintă un grad mare de variaţie
numerică şi pot fi caracterizate statistic prin diferite modele de calcul. Pe lângă banca de date
statistice, statistica dispune şi de o bancă de modele statistice. Ele reprezintă modele teoretice
care trebuie să fie adoptate la specificul fenomenelor. Dacă modelele statistice se aplică
mecanic fără discernământul unei analize calitative, riscăm să ajungem la concluzii care sunt
infirmate de realitatea obiectivă. Aceasta este posibil atunci când în analiza teoretică
prealabilă nu se acordă suficientă atenţie particularităţilor specifice privind conţinutul şi
tendinţele obiective de dezvoltare a fenomenelor studiate sau seriile de date obţinute provin
dintr-un număr insuficient de unităţi observate. În acest din urmă caz nu se respectă cerinţele
legii numerelor mari potrivit căreia legea statistică nu poate să fie evidenţiată decât dacă se
lucrează cu un număr suficient de mare de date în raport cu întreaga colectivitate. De aceea, în
statistică se aplică frecvent metode de verificare a ipotezelor utilizate şi teste de semnificaţie a
indicatorilor. În acest caz operăm frecvent cu noţiunea de eroare d e modelare şi ea poate să fie
interpretată tot în sens probabilistic. În cele mai multe cazuri dispunem de tabele de repartiţie
a erorilor probabile şi prin compararea rezultatelor empirice cu valori tabelare infirmăm sau
validăm rezultatele obţinute.
Pentru eliminarea erorilor, datele statistice sunt supuse unui control care poate fi de
volum, cantitativ, numeric sau logic.
Controlul de volum presupune ca la centrul de prelucrare să se verifice dacă au sosit
toate formularele, cu toate rubricile completate.
Controlul cantitativ-numeric constă în refacerea prin sondaj a unor calcule de obţinere
a unor indicatori înscrişi în formular.
Controlul logic presupune ca pe baza experienţei şi cunoştinţelor din domeniul
respectiv să depistăm eventuale erori printr-o comparaţie vizuală.
Pentru erorile de estimare şi modelare se folosesc modele de verificare a ipotezelor
statistice şi se aplică teste de semnificaţie a valorilor indicatorilor calculaţi. Astfel de cazuri se
vor întâlni în capitolele următoare.
În sfârşit trebuie precizat şi faptul că pentru asigurarea calităţii datelor statistice
comunicate serviciilor de statistică publică, personalul acestora are drept de verificare a
modului de determinare a indicatorilor respectivi şi corespondenţa lor cu evidenţele
deţinătorilor de date primare. În cazul depistării unor erori (abateri) se încheie proces-verbal
de constatare a contravenţiei şi se aplică amenzi.
Controlul datelor statistice face legătura între observarea şi prelucrarea datelor
statistice. De reţinut că, pentru depistarea erorilor în statistică utilizăm şi calculatoarele
electronice existând programe adecvate acestui scop.
24 Statistica - instrument de cunoaştere a fenomenelor economice. Observarea statistică
Rezumat
Acest capitol prezintă noţiunile de bază necesare organizării unei cercetări statistice:
stabilirea obiectivului cercetării, definirea colectivităţii şi a caracteristicilor necesare analizei,
culegerea datelor conform planului observării.
Termeni importanţi: colectivitatea statistică, caracteristica statistică, unitatea
statistică, indicator statistic, observarea statistică, erorile statistice.
Teste de autocontrol:
1. Ce înţelegeţi prin colectivitate statistică ? Exemplificaţi.
2. Prin ce se caracterizează o colectivitate statistică ?
3. Unitatea statistică. Definiţie, tipuri.
4. Definiţi observarea statistică.
5. Ce tipuri de observări statistice cunoaşteţi ?
6. Ce tipuri de erori statistice cunoaşteţi ?
Capitolul 2 25
Capitolul 2
Tema Sistematizarea şi prezentarea datelor statistice
Obiectivele 1. Tipuri de grupări
2. Grupare unidimensională
3. Grupare bidimensională
4. Prezentarea datelor statistice
4.1 Tabele statistice
4.2 Seriile statistice
4.3 Reprezentări grafice
Mijloace
- citire/învăţare
- întrebări, probleme ce apar, explicaţii
- definiţii, explicaţii ce trebuie reţinute
- situaţii economice concrete, supuse analizei, exemple (sub
lupă)
- teme de casă, aplicaţii practice pentru studenţi
Finalitatea 1. realizarea sistematizării datelor sub formă de grupe omogene după una
sau mai multe caracteristici necesară calculului indicatorilor statistici
2. prezentarea datelor sub formă de tabele, serii, grafice
Evaluarea - parcurgerea aplicaţiilor propuse
Timp de lucru
necesar
1. Pentru cunoaşterea problemei: 4 ore
2. Pentru rezolvarea temelor: 12 ore + timpul de documentare
Sistematizarea şi prezentarea datelor statistice 26
Sistematizarea şi prezentarea datelor statistice
1. Tipuri de grupări
Metoda grupării este considerată ca metodă de bază a cercetărilor statistice.
Această metodă este folosită pentru a putea trece de la o masă amorfă de date individuale
diferite la o omogenizare a acestora.
În sens statistic, prin grupare înţelegem separarea unităţilor
colectivităţii pe grupe omogene. O grupă este considerată statistic omogenă, dacă
unităţile din aceeaşi clasă sau subclasă prezintă variaţii minime fie ca nivel de
dezvoltare, fie ca formă de manifestare.
Această variaţie minimă este interpretată în statistică ca fiind rezultatul influenţei
factorilor aleatori. Ca atare, omogenizarea datelor pe grupe se poate face cu ajutorul unor
caracteristici esenţiale de grupare, care pot fi interpretate şi ca factori determinaţi.
După conţinutul caracteristicii de grupare putem avea: grupări cronologice; grupări
teritoriale; grupări atributive.
Grupările cronologice presupun că s-a folosit drept caracteristică de grupare o
variabilă de timp. Un exemplu de acest fel îl poate constitui gruparea agenţilor economici
după anul înfiinţării. Menţionăm că nu orice însuşire de date după timp poate fi asimilată unei
grupări statistice. Timpul trebuie să determine o structurare calitativă a colectivităţii pentru a
răspunde principiilor grupării statistice.
Grupările teritoriale sunt folosite pentru a separa unităţile colectivităţii în grupe după
un criteriu de spaţiu. Se pot obţine: grupări teritorial-administrative, grupări pe zone
geografice etc. Grupările teritoriale nu pot fi confundate cu o prezentare a datelor după o
caracteristică de spaţiu. Gruparea teritorială respectivă trebuie să se refere la toate unităţile şi
din acest punct de vedere trebuie să fie asigurată omogenizarea datelor.
Grupările atributive se folosesc pentru toate caracteristicile care au format
programul observării, în afara caracteristicilor de timp şi spaţiu.
Ele pot fi caracteristici cantitative (numerice) şi calitative (nenumerice). În cazul
grupării după o caracteristică numerică trebuie determinată amplitudinea variaţiei şi numărul
de grupe r, iar în cazul grupării după o caracteristică nenumerică trebuie stabilit un
nomenclator al grupelor şi subgrupelor. De obicei, noţiunea de grupare include variabilele
statistice şi cu precădere pe cele numerice, în timp ce grupările nenumerice se mai numesc şi
clasificări şi au, de regulă, caracter permanent şi oficial.
La rândul lor grupările după o variabilă numerică se întâlnesc în trei situaţii:
a) amplitudinea variaţiei foarte mică şi în acest caz gruparea se face direct pe variante.
De exemplu: gruparea familiilor după numărul persoanelor, gruparea familiilor după numărul
copiilor, gruparea studenţilor după nota obţinută la examen;
Capitolul 2 27
b) dacă amplitudinea variaţiei este moderată se foloseşte o grupare pe intervale de
variaţie egale. În acest caz, e necesar, să se stabilească numărul de grupe şi mărimea
intervalului de variaţie.
c) dacă amplitudinea variaţiei este foarte mare se recomandă gruparea pe intervale de
variaţie neegale. În acest caz, se face în prealabil o grupare pe intervale egale de variaţie
folosind un număr mai mare de grupe. După ce am efectuat această primă grupare se trece la
restrângerea grupelor încercând să imprimăm un mod de variaţie sistematică, adică se alege
un interval de bază căruia i se aplică multiplicatori din ce în ce mai mari. Astfel, am putea
aprecia că, cu cât valoarea caracteristicii creşte cu atât mai uşor este de asigurat omogenitatea.
În general, gruparea pe intervale neegale urmăreşte să structureze colectivitatea pe tipuri
calitative. De exemplu, dacă se grupează întreprinderile comerciale după volumul
desfacerilor, gruparea o putem face pe intervale neegale şi ne dă posibilitatea structurării
colectivităţii pe întreprinderi mici, mijlocii, mari şi foarte mari.
Grupările şi clasificările pot fi simple şi combinate. Cele simple se obţin atunci când
folosim o singură caracteristică de grupare şi combinate când se folosesc împreună mai multe
caracteristici de grupare.
În mod obligatoriu se folosesc grupări simple pentru toate variabilele cuprinse în
programul observării şi grupări combinate pentru interpretarea interdependenţei statistice
dintre fenomene.
2. Grupare unidimensională
Dintr-o anchetă prin sondaj s-au obţinut următoarele date în legătură cu
activitatea a 20 de societăţi comerciale:
Tabelul nr. 1
Nr
.
crt
.
Cifra de
afaceri -mii
RON-
Număr de
personal
Fondul
de salarii -mii RON-
Nr.
crt.
Cifra de
afaceri -mii
RON-
Număr de
personal
Fondul
de salarii -mii RON-
1. 50 5 22 11. 76 13 37
2. 66 5 31 12. 181 19 89
3. 185 21 90 13. 122 10 63
4. 117 12 50 14. 137 12 58
5. 98 9 47 15. 140 17 71
6. 125 8 33 16. 59 7 18
7. 89 10 40 17. 91 11 36
8. 148 18 64 18. 133 9 52
9. 77 8 29 19. 101 11 60
10. 203 24 106
20. 172 13 88
Se cere:
1. Să se precizeze scopul, obiectul, unitatea şi programul observării;
2. Să se grupeze unităţile comerciale după mărimea cifrei de afaceri pe intervale
egale şi neegale;
Sistematizarea şi prezentarea datelor statistice 28
3. Să se grupeze unităţile comerciale pe intervale egale după două caracteristici între
care există o legătură;
4. Să se reprezinte grafic repartiţiile obţinute (histograma şi poligonul frecvenţelor).
Rezolvare:
1. Scopul observării – determinarea unui sistem corelat de indicatori care să permită
caracterizarea celor 20 de societăţi comerciale.
Obiectul observării – este constituit din cele 20 de societăţi comerciale.
Unitatea de observare – o formează fiecare societate comercială supusă studiului.
Programul observării – cuprinde cele trei caracteristici: cifra de afaceri, numărul de
personal şi fondul de salarii.
Informaţiile culese sunt supuse prelucrării. Această etapă a cercetării statistice
cuprinde centralizarea informaţiilor, gruparea statistică şi determinarea unor indicatori
statistici.
Centralizarea informaţiilor presupune obţinerea unor indicatori totalizatori pentru
fiecare variabilă numerică (cantitativă) în parte la nivelul populaţiei statistice, adică o
centralizare simplă sau, în funcţie de situaţia concretă, o centralizare a informaţiilor pe grupe,
rezultând mai întâi indicatori parţiali şi apoi pentru întreaga populaţie.
Pentru aplicaţia de mai sus vom avea:
cele 20 de societăţi comerciale au avut o cifră de afaceri de 2370 mi i RON;
un număr de personal de 242 salariaţi;
un fond de salarii de 1084 mii RON.
Pentru a grupa unităţile pe intervale egale trebuie parcurse următoarele etape:
2. Gruparea societăţilor comerciale pe intervale egale:
a) calculul amplitudinii variaţiei:
minmax xxA ,
unde:
maxx - nivelul maxim al variabilei “x”;
minx - nivelul minim al variabilei “x”.
Amplitudinea variaţiei pentru cele trei caracteristici, va fi:
- pentru cifra de afaceri: A=203-50=153 mii RON
- pentru numărul de personal: A=24-5=19 persoane
- pentru fondul de salarii: A=106-18=88 mii RON
b) stabilirea prin analiză a numărului de grupe
Numărul de grupe se alege direct proporţional cu cifra de afaceri. Pentru cazul concret
avut în vedere se apreciază că se pot forma 5 grupe cu intervale egale r = 5.
c) determinarea mărimii intervalelor de grupare (h), ca raport între amplitudinea
variaţiei (A) şi numărul de grupe (r):
r
Ah
Pentru cazul concret, mărimea intervalelor va fi:
- pentru cifra de afaceri: h = 153/5 = 30,6 ~ 31
- pentru numărul de personal: h = 19/5 = 3,8 ~ 4
- pentru fondul de salarii: h = 88/5 = 17,6 ~ 18
Capitolul 2 29
Pentru repartiţiile aproximativ normale se recomandă utilizarea relaţiei lui Sturges:
n
xxh
lg322,31
minmax
d) formarea intervalelor de grupare prin cumularea succesivă, la limita inferioară, a
mărimii intervalului:
Tabelul nr.2
CIFRA DE AFACERI
VARIANTA I VARIANTA II * VARIANTA III *
50-80 -81 50-81
81-111 81-112 81-112
112-142 112-143 112-143
143-173 143-174 143-174
174-204 174 - 174-204
*limita superioară sau limita inferioară cuprinsă în interval
e) gruparea propriu-zisă, presupune determinarea pentru fiecare grupă a numărului
unităţilor comerciale (frecvenţele absolute) care aparţin grupei respective, respectând criteriul
de grupare.
Tabelul nr.3
Grupe de unităţi după
cifra de afaceri
-mii RON-
ix
Nr.
unităţi
if
Cifra de
afaceri
-mii RON-
Numărul de
personal
Fondul de
salarii
-mii
RON-
50-80 5 328 38 138
80-112 4 379 41 183
112-143 6 774 68 327
143-174 2 320 31 152
174-204 3 569 64 285
TOTAL 20 2370 242 1085
Determinarea frecvenţelor cumulate:
Tabelul nr.4
Frecvenţele cumulate Grupe de unităţi
după cifra de
afaceri
-mii RON- ix
Frecvenţele
absolute Mai mici decât
limita superioară
(crescătoare)
Mai mari decât
limita inferioară
(descrescătoare)
50 - 80 5 5 20
80 - 112 4 9 15
Sistematizarea şi prezentarea datelor statistice 30
112 - 143 6 15 11
143 - 174 2 17 5
174 - 204 3 20 3
TOTAL 20 - -
Gruparea pe intervale neegale – se realizează fără a parcurge etapele de mai sus, în
funcţie de interesul cercetătorului.
Exemplu:
Tabelul nr.5
Grupe de unităţi
după cifra de afaceri
-mii RON- ix
Număr de
societăţi
comerciale
Sub 110 9
110 - 180 8
Peste180 3
TOTAL 20
3. Grupare bidimensională
Pentru a studia legătura dintre variabile, adesea se impune realizarea unei
distribuţii bidimensionale. În astfel de legături se lucrează cu o variabilă efect sau dependentă
y şi o variabilă cauză sau independentă x. Cele două variabile pot fi numerice (cantitative) sau
nenumerice (calitative), iar acestea la rândul lor pot fi nominale sau ordinale.
Atunci când dorim să analizăm distribuţia simultană a indivizilor statistici după două
sau mai multe caracteristici calitative, vorbim despre asociere, ceea ce înseamnă cum se
asociază, în cazul a două caracteristici, anumite stări ale unei caracteristici cu anumite stări ale
celeilalte. Baza acestei analize o constituie tabelul de asociere sau de contingenţă.
Problematica asocierii presupune efectuarea unor analize bivariate sau multivariate.
Presupunând că s-au înregistrat datele pentru două caracteristici x i şi yi şi unităţile au
fost împărţite în funcţie de caracteristica x în p grupe, s-au obţinut distribuţiile condiţionate de
factorul de grupare.
Cele două variabile prezentate în tabel se află într-o relaţie de cauzalitate şi calculând
indicatorii de variaţie corespunzători putem preciza dacă factorul de grupare x este un factor
hotărâtor (determinant) pentru variaţia factorului y.
Tabelul nr. 6
Valorile
caracteristicii de
grupare X
Numărul unităţilor pe variantele
caracteristicii Y
Volumul grupelor
y1 y2 … yj … yq
x1 n11 n12 n1j n1q n1.
x2 n21 n22 n2j n2q n2.
Capitolul 2 31
... ... ... ... ... ...
xi ni1 ni2 nij niq ni.
... ... ... ... ... ...
xp np1 np2 npj npq np.
Total n.1 n.2 n.j n.q n
Frecvenţele nij reprezintă numărul unităţilor statistice purtătoare ale valorilor (X i,Yj).
Frecvenţele ni. reprezintă distribuţia marginală pentru caracteristica x:
;;...;... .
1
.
1
.1
1
1 p
q
j
pji
q
j
ij
q
j
j nnnnnn
Frecvenţele n.j reprezintă distribuţia marginală pentru caracteristica y:
;;...;... .
1
.
1
1.
1
1 q
p
i
iqj
p
i
ij
p
i
i nnnnnn
3. Pentru punctul 3 al aplicaţiei, gruparea societăţilor comerciale după cifra de
afaceri şi numărul de personal se prezintă astfel:
Tabelul nr.7
Grupe de unităţi după numărul de personal Grupe de unităţi
după cifra de afaceri
-mii RON- ix 5 - 8 9 - 12 13 -16 17-20 21-24
TOTAL
if
50 - 80 4 - 1 - - 5
80 - 112 - 4 - - - 4
112 - 143 1 4 - 1 - 6
143 - 174 - - 1 1 - 2
174 - 204 - - - 1 2 3
TOTAL 5 8 2 3 2 20
Caracteristica dihotomică este acea caracteristică care realizează o grupare a
indivizilor în două categorii, cei care posedă o anumită proprietate şi cei care nu o posedă.
Având două caracteristici dihotomice indivizii se repartizează în patru categorii:
Tabelul nr.8
Modalităţile caracteristicii Y
Modalităţile
caracteristicii X
YsauY1
YsauY2
Total
XsauX1 11k
12k .1k
Sistematizarea şi prezentarea datelor statistice 32
XsauX 2
21k 22k .2k
Total 1.k 2.k n
Interpretarea frecvenţelor absolute ijk se poate face astfel: 11k reprezintă indivizii
care posedă modalitatea X1 şi modalitatea Y1, iar 12k reprezintă indivizii care posedă
modalitatea X1 dar nu posedă modalitatea Y1.
Existenţa unei asocieri trebuie urmărită prin calculul mărimilor relative de structură
(ponderea unei grupe în total), astfel încât tabelului de mai sus i se pot ataşa două tabele cu
frecvenţe relative:
Tabelul nr. 9
Modalităţile caracteristicii Y
Modalităţile
caracteristicii X
YsauY1
YsauY2
Total
XsauX1
11p 12p 1
XsauX 2
21p 22p 1
Total 1.p 2.p 1
Interpretarea frecvenţelor ijp se poate face astfel: 11p reprezintă ponderea indivizilor
care posedă modalitatea X1 şi modalitatea Y1 în totalul indivizilor ce posedă modalitatea X1,
iar 12p reprezintă ponderea indivizilor care posedă modalitatea X1 dar nu posedă modalitatea
Y1 în totalul indivizilor ce posedă modalitatea X1.
2
1
.
2,11
2,12,1
j
ij
i
ij
ij
ipentrup
jşiipentruk
kp
iar pentru cele marginale:
nkp jj /..
Tabelul nr. 10
Modalităţile caracteristicii Y
Modalităţile
caracteristicii X
YsauY1
YsauY2
Total
XsauX1
11q 12q .1q
XsauX 2
21q 22q .2q
Total 1 1 1
Interpretarea frecvenţelor ijq se poate face astfel: 11q reprezintă ponderea indivizilor
care posedă modalitatea Y1 şi modalitatea X1 în totalul indivizilor ce posedă modalitatea Y1,
iar 12q reprezintă ponderea indivizilor care posedă modalitatea Y1 dar nu posedă modalitatea
X1 în totalul indivizilor ce posedă modalitatea Y1.
Capitolul 2 33
2
1
.
2,11
2,12,1
i
ij
j
ij
ij
jpentruq
jşiipentruk
kq
iar pentru cele marginale:
nkq ii /..
După modul în care se grupează indivizii, se pot ivi situaţiile:
asociere pozitivă – concentrarea indivizilor pe diagonala principală formată din
celulele (X1, Y1) şi (X2, Y2);
asociere negativă - concentrarea indivizilor pe diagonala secundară formată din
celulele (X1, Y2) şi (X2, Y1);
asociere perfectă – toţi indivizii se plasează pe una din diagonalele tabelului;
asociere maximă – atunci când una din perechile (X,Y) are frecvenţa de apariţie
zero.
Pentru a realiza o distribuţie bidimensională s-a luat în considerare un eşantion
format din 150 de persoane ce au răspuns unor întrebări dintr-un chestionar, printre care: dacă
au văzut reclama la un produs nou lansat pe piaţă şi dacă au cumpărat produsul respect iv.
Tabelul nr. 11
Count
65 15 80
20 50 70
85 65 150
da
nu
RECLAMA
Total
da nu
CUM PA RA
Total
RECLAMA * CUMPARA Crosstabulation
Putem obţine profilele linii, adică pentru fiecare modalitate a variabilei reclama,
ponderea celor care cumpără în totalul liniei:
Sistematizarea şi prezentarea datelor statistice 34
Tabelul nr. 12
65 15 80
81,3% 18,8% 100,0%
20 50 70
28,6% 71,4% 100,0%
85 65 150
56,7% 43,3% 100,0%
Count
% within
RECLAMA
Count
% within
RECLAMA
Count
% within
RECLAMA
da
nu
RECLAMA
Total
da nu
CUMPARA
Total
RECLAMA * CUMPARA Crosstabulation
Putem obţine profilele coloane, adică pentru fiecare modalitate a variabilei cumpără,
ponderea celor care au văzut reclama în totalul coloanei:
Tabelul nr. 13
65 15 80
76,5% 23,1% 53,3%
20 50 70
23,5% 76,9% 46,7%
85 65 150
100,0% 100,0% 100,0%
Count
% within
CUMPA RA
Count
% within
CUMPA RA
Count
% within
CUMPA RA
da
nu
RECLAMA
Total
da nu
CUMPA RA
Total
RECLAMA * CUMPARA Crosstabulation
4. Prezentarea datelor statistice
Rezultatele prelucrării datelor observării de masă se prezintă sub forme
specifice statisticii: tabele, serii, grafice - în care relaţiile dintre fenomenele studiate apar într-
o succesiune logică, corespunzătoare relaţiilor obiective existente. Această sistematizare a
informaţiilor obţinute face posibilă interpretarea statistică a formelor de manifestare a
fenomenenlor şi permite alegerea corectă a metodologiei de calcul al indicatorilor statistici. În
tabele, serii şi grafice se pot întâlni fie indicatori statistici absoluţi, fie indicatori statistici
derivaţi. Cu ajutorul lor se pot caracteriza atât grupele care compun colectivitatea cât şi
întregul ansamblu.
Capitolul 2 35
4.1 Tabele statistice
Tabelele statistice reprezintă o formă de sistematizare a unui ansamblu
de relaţii cantitative despre fenomenele studiate, folosind o reţea de linii paralele,
orizontale şi verticale în care se înscriu indicatorii obţinuţi prin prelucrare.
Ele se pot folosi în dublu scop:
pentru prezentarea rezultatelor cercetării în cadrul indicatorilor absoluţi şi derivaţi,
care s-au obţinut în diferitele faze ale prelucrării datelor statistice;
pentru sistematizarea datelor statistice în vederea aplicării procedeelor de calcul a
indicatorilor derivaţi.
Oricare ar fi destinaţia tabelelor statistice, ele trebuie să fie întocmite după anumite
principii, respectând unele reguli de conţinut şi de formă.
Elementele de conţinut ale unui tabel statistic se referă la subiectul şi predicatul
tabelului. Subiectul tabelului îl constituie colectivitatea statistică la care se referă datele
prezentate. Predicatul tabelului este format din sistemul de caracteristici pentru care s-a făcut
centralizarea datelor şi care permite caracterizarea statistică a fenomenelor studiate în condiţii
specifice de timp şi spaţiu.
Elementele ce ţin de forma unui tabel statistic se regăsesc, în principal, în macheta
tabelului. Macheta tabelului statistic este formată din titlul general, titlurile interioare şi
reţeaua de rânduri şi coloane.
Reţeaua tabelului este formată din linii paralele, orizontale şi verticale, necesare
înscrierii ordonate a datelor statistice. Intervalul dintre două linii orizontale formează un rând,
iar cele cuprinse între două linii verticale formează o coloană. Întretăierea dintre rânduri şi
coloane formează rubricile tabelului în care se înscriu valorile numerice ale indicatorilor
statistici.
Titlul general se trece în partea de sus a tabelului şi trebuie să fie clar, complet şi
concis, atrăgând atenţia asupra relaţiilor ce trebuie să fie analizate în legătură cu subiectul
prezentat. În titlul general trebuie să se precizeze caracteristicile de timp şi spaţiu la care se
referă datele prezentate.
Titlurile interioare se înscriu în capetele coloanelor sau ale rândurilor şi se referă la
elementele componente ale subiectului (de regulă, în capetele rândurilor) şi ale predicatului
(de regulă, în capetele coloanelor).
Notele explicative însoţesc un tabel statistic atunci când este necesar să se precizeze
anumite aspecte legate de sursa de informaţii sau de procedeele de culegere şi prelucrare a
datelor prezentate.
Tabelele statistice des întâlnite sunt: tabele simple, tabele pe grupe; tabele combinate;
tabele cu dublă intrare; tabele de asociaţie.
Tabelele simple sunt cele în care se prezintă indicatorii statistici ai unităţilor statistice
la care se referă datele, ordonaţi după următoarele criterii: cronologic, teritorial şi
organizatoric. Întocmirea unor astfel de tabele nu ridică probleme deosebite în legătură cu
modul de prezentare a indicatorilor, ordonarea făcându-se în funcţie de scop.
Probleme legate de modul de întocmire a unui tabel statistic se pun atunci când
colectivitatea este împărţită în grupe după variaţia uneia sau a mai multor caracteristici sau
când şi predicatul se centralizează pe grupe. Atunci este necesar să se întocmească un tabel în
care să se poată urmări cu uşurinţă succesiunea logică a informaţiilor prezentate, condiţionată
de variaţia caracteristicii de grupare.
Sistematizarea şi prezentarea datelor statistice 36
Tabelul cu dublă intrare se foloseşte atunci când colectivitatea a fost împărţită în
grupe după variaţia a două caracteristici (X,Y) şi au fost centralizate numai frecvenţele de
apariţie ale valorilor X,Y.
Pe baza tabelului cu dublă intrare se pot caracteriza:
forma de variaţie a variabilei X luată independent, folosind distribuţia sa
marginală (vezi capetele rândurilor şi ultima coloană);
forma de variaţie a variabilei Y luată independent, folosind distribuţia sa
marginală (vezi capetele coloanelor şi ultimul rând); distribuţiile condiţionate
ale caracteristicii X în funcţie de Y şi ale caracteristicii Y în funcţie de X.
Din exemplele de mai sus se observă că tabelele 4 şi 5 sunt tabele simple iar tabelul 7
este cu dublă intrare.
4.2 Seriile statistice
Seriile statistice se obţin în urma aplicării metodei grupării folosind una sau mai multe
caracteristici de grupare. De cele mai multe ori seriile statistice trebuie să fie extrase din
tabelele de prezentare a rezultatelor prelucrării datelor statistice.
Seria statistică este o corespondenţă între două şiruri de date statistice
în care primul şir reprezintă variaţia caracteristicii de grupare, iar cel de-al doilea şir
rezultatul centralizării frecvenţelor de apariţie sau a valorilor unei alte caracteristici cu
care se corelează.
Seria statistică poate fi considerată, astfel, ca o funcţie matematică în care valorile
centralizate ale frecvenţelor sau ale caracteristicilor sunt valori dependente (Y) în funcţie de
valorile caracteristicii de grupare (X).
După posibilitatea de caracterizare a fenomenelor, seriile statistice pot fi serii statistice
independente şi serii statistice condiţionate.
Seriile statistice independente sunt acelea care rezultă dintr-o grupare simplă, iar
seriile statistice condiţionate sunt acelea obţinute dintr-o grupare combinată.
Seriile statistice independente se mai numesc şi serii unidimensionale, iar cele
condiţionate - multidimensionale.
După conţinutul caracteristicii de grupare, seriile statistice pot fi:
serii statistice de timp (dinamice sau cronologice);
serii statistice de spaţiu (teritoriale);
serii statistice de distribuţie (de repartiţie).
Seriile statistice cronologice sunt acelea în care se prezintă variaţia unei caracteristici
în funcţie de timp.
Relaţia matematică în acest caz este: yi = f(ti), în care:
yi - reprezintă valorile caracteristicii a cărei variaţie se studiază;
ti - valorile variabilei de timp.
După timpul la care se referă datele prezentate, pot fi: serii cronologice de fluxuri sau
de interval şi serii cronologice de stocuri sau de momente.
Seriile cronologice de fluxuri (intervale) sunt acelea în care valorile caracteristicii
studiate sunt rezultatele diferitelor activităţi depuse în cadrul unui proces social economic pe
luni, trimestre etc., ca de exemplu producţia în unităţi naturale sau valorice, cheltuielile de
producţie, numărul născuţilor etc. Cumulând datele din fiecare unitate de timp se poate obţine
valoarea centralizată a caracteristicii respective pe întreaga perioadă.
Capitolul 2 37
Seriile statistice de stocuri sau de momente se obţin pentru variabile statistice pentru
care este raţional ca însumarea să se facă la anumite momente, ca de exemplu: numărul de
muncitori, valoarea fondurilor fixe, numărul de tractoare, valoarea mijloacelor circulante,
stocurile de mărfuri etc. Caracteristic pentru seria dinamică de momente este faptul că
termenii ei nu se pot cumula deoarece pot exista înregistrări repetate şi valoarea obţinută n-ar
avea sens economic. Caracterizarea statistică pentru întreaga perioadă nu se poate face în
acest caz printr-un indicator totalizator, ci folosind indicatori derivaţi sub formă de mărimi
relative sau medii.
Este necesar ca pentru fiecare serie dinamică să rezulte clar (din titlul ei) dacă datele
prezentate se referă la momente sau la perioade de timp, pentru a putea stabili relaţii corecte
între ele.
De exemplu: exportul şi importul României a avut următoarea evoluţie în perioada
1997-2003 (serii de flux).
Tabelul nr. 14
Ani Export FOB
mil.Euro
Import FOB
mil.Euro
1997 7469 9222
1998 7400 9718
1999 7977 9163
2000 11273 13140
2001 12722 16045
2002 14675 17427
2003 15614 19569
Sursa datelor: Anuarul Statistic al României 2004
Seriile statistice teritoriale sunt cele în care centralizarea frecvenţelor sau a valorilor
individuale ale caracteristicii studiate se face în funcţie de variaţia teritorial administrativă.
De regulă, seriile teritoriale sunt folosite pentru sistematizarea informaţiilor statistice
pe judeţele ţării, pe ţări sau alte forme teritorial administrative. Pe baza seriilor teritoriale se
poate face o ierarhizare a unităţilor teritoriale.
Pornind de la funcţiile de cunoştere care trebuie realizate folosind datele statistice,
seriile teritoriale, de regulă, se întocmesc pentru mai multe şiruri de date, privitor la variaţia
caracteristicilor statistice ce se găsesc într-un raport obiectiv de interdependenţă. Aceste şiruri
apar ca serii statistice interdependente, condiţionate pe teritoriul la care se referă datele.
Tabelul nr. 15
Ţara Export FOB
mil. dolari SUA
România 17618
Polonia 53699
Bulgaria 7534
Slovacia 21960
Slovenia 12767
Ungaria 42532
Sursa datelor: Anuarul Statistic al României 2004
Sistematizarea şi prezentarea datelor statistice 38
Seriile statistice de distribuţie sunt acelea în care se foloseşte pentru gruparea datelor
o caracteristică atributivă (calitativă sau numerică) iar centralizarea se face pentru frecvenţele
la care se înregistrează aceeaşi variantă, sau pentru o altă caracteristică statistică.
Seria de distribuţie formată după variaţia unei caracteristici numerice se mai numeşte
şi serie de variaţie, iar, de regulă, al doilea şir este format din frecvenţele corespunzătoare
grupelor. În acest caz, pot apărea serii de distribuţii de frecvenţe direct pe variante sau pe
intervale de valori.
În cazul unei amplitudini mari a variaţiei se folosesc serii statistice pe intervale de
grupare (egale sau neegale).
Tabelul nr. 16
Distribuţia societăţilor după CA
Grupe de unităţi după
cifra de afaceri
-mii RON-
ix
Nr.
unităţi
if
50-80 5
80-110 4
110-140 6
140-170 2
peste 170 3
TOTAL 20
4.3 Reprezentări grafice
Metoda grafică este folosită în teoria şi practica statistică atât pentru prezentarea unor
date statistice cât şi ca instrument de analiză şi interpretare a fenomenelor studiate. În acest
sens analiza şi generalizarea rezultatelor presupune de cele mai multe ori utilizarea
reprezentărilor grafice.
Într-o accepţiune generală graficele constau în exprimarea datelor
statistice din tabele prin linii sau puncte, figuri geometrice, hărţi, simboluri şi alte
mijloace specifice.
Elementele unui grafic
Întocmirea corectă a unui grafic statistic presupune cunoaşterea şi folosirea
corespunzătoare a următoarelor elemente: titlul graficului; scara de reprezentare; notele
explicative inclusiv legenda; sursa informaţiilor utilizate.
În titlul graficului se sugerează ce relaţii trebuie să fie interpretate vizual pe baza
graficului respectiv. Titlul graficului este indicat să fie scurt, clar, precis şi complet şi, pe cât
posibil să corespundă cu titlul tabelului statistic ale cărui date le reprezintă.
Scara de reprezentare se alege ţinând seama de ordinul de mărime al indicatorilor de
reprezentat, de gradul şi forma de variaţie dintre ei şi de scopul urmărit. Scara de reprezentare
este o linie ale cărei puncte pot fi citite ca numere bine determinate. Ea se compune dintr-o
linie care se numeşte suportul scării şi dintr-un şir de puncte nenumerotate cu ajutorul cărora
Capitolul 2 39
se realizează diviziunea liniei. Liniuţele scării sunt numerele care corespund punctelor
extreme ale scării. Lungimea scării este întreaga distanţă dintre punctele extreme ale scării.
Alegerea unităţii de lungime a scării se face în funcţie de spaţiul destinat figurii
graficului şi în aşa fel, încât să se surprindă forma reală de variaţie a indicatorilor de
reprezentat. Dacă se prezintă corelat mai multe caracteristici statistice, atunci scările de
reprezentare trebuie să fie astfel stabilite, încât să poată cuprinde toate valorile indicatorilor şi
să redea într-o formă armonioasă proporţia reală dintre ele.
Pe suportul scării se trec numai valorile care marchează distanţele proporţionale cu
unitatea de măsură a scării de reprezentare.
Distanţa dintre două puncte învecinate de pe suportul scării poartă numele de interval
grafic iar diferenţa dintre valorile numerice ale acestor puncte reprezintă intervalul numeric.
Notele explicative şi legendele se folosesc pentru a putea interpreta corect graficul.
Notele explicative apar atunci când este necesar să se atragă atenţia asupra aspectelor
metodologice ale calculării indicatorilor reprezentaţi, sau asupra modului de prezentare a lor
în grafic.
Legendele reprezintă explicarea concisă a semnelor convenţionale, haşurilor şi
culorilor folosite.
Sursa de informaţie a datelor din grafic este obligatorie în toate cazurile, când se
folosesc date reale. Ea este trecută în afara graficului şi trebuie să cuprindă toate elementele
de identificare a izvorului informaţiei respective. Când graficele sunt încadrate într-un raport
de analiză sau într-o lucrare de cercetare ştiinţifică, la fel ca şi titlurile, sursele de informaţie
pot să nu apară în mod expres dacă din textul respectiv rezultă aceste elemente.
Tipuri de grafice
Diagrama prin coloane - distribuţia angajaţilor unei firme după numărul de copii este
prezentată în tabelul următor (caracteristică cu variante):
Tabelul nr. 17
Grupe de angajaţi după
nr.de copii Număr angajaţi
0 5
1 17
2 31
3 20
4 11
5 4
6 1
total 89
Sistematizarea şi prezentarea datelor statistice 40
0 1 2 3 4 5 60
5
10
15
20
25
30
35
nr.
an
gaj
aţi
nr. copii
Figura 1. Distribuţia angajaţilor după numărul de copii
Pentru datele din tabelul 14 (serie de timp), graficul se prezintă astfel:
02000400060008000
100001200014000160001800020000
1997 1998 1999 2000 2001 2002 2003
Export FOB mil.Euro Import FOB mil.Euro
Figura 2. Evoluţia exportului şi importului României în perioada 1997-2003
Diagrama circulară, permite vizualizarea ponderii unei componente într-un total.
Pentru datele din tabelul 15 se poate vizualiza ponderea în % a exportului fiecărei ţări în
nivelul total al exportului.
11%
35%
5%14%
8%
27% RomâniaPoloniaBulgariaSlovaciaSloveniaUngaria
Figura 3. Structura exportului pe ţări în anul 2003
Capitolul 2 41
Diagramele prin benzi sunt foarte des folosite datorită expresivităţii lor şi uşurinţei în
executare. Se utilizează pentru seriile teritoriale. Pentru datele din tabelul 15 putem realiza un
top al ţărilor după valorile exportului realizat în anul 2003.
7534
12767
17618
21960
42532
53699
0 10000 20000 30000 40000 50000 60000
Bulgaria
Slovenia
România
Slovacia
Ungaria
Polonia
Export FOB mil. dolari SUA
Figura 4. Topul ţărilor după valorile exportului realizat în anul 2003
Reprezentarea grafică a unei variabile continue - studiul privind vârsta angajaţilor
unei firme a condus la următoarele rezultate:
Tabelul nr. 18
Grupe de
angajaţi după
vârstă
(ani)
Frecvenţe
absolute
Frecvenţe
cumulate
crescător
Frecvenţe
cumulate
descrescător
20 – 30 10 10 73
30 – 40 14 24 63
40 – 50 25 49 49
50 – 60 16 65 24
60 – 70 8 73 8
Total 73 - -
*limita inferioară cuprinsă în interval
Sistematizarea şi prezentarea datelor statistice 42
10
14
25
16
8
0
5
10
15
20
25
30
20 – 30 30 – 40 40 – 50 50 – 60 60 – 70
Vârsta (ani)
Nu
măr
an
gaja
ţi
Figura 5. Distribuţia angajaţilor după vârstă (HISTOGRAMA)
Curba frecvenţelor cumulate - ogivă
0
10
24
49
657373
63
49
24
800
1020304050607080
20 30 40 50 60 70
Vârsta (ani)
Nu
măr
an
gaja
ţi
Frecvenţe cumulate crescător
Frecvenţe cumulate descrescător
Figura 6. Curba frecvenţelor cumulate
Diagramele radiale (polare). O altă problemă care trebuie analizată la seriile
cronologice este şi aceea a sezonalităţii. În statistica social economică se întâlnesc frecvent
fenomene care prezintă variaţii sezoniere săptămânale, trimestriale etc., ca de exemplu:
consumul casnic de gaze naturale, consumul de bere şi băuturi răcoritoare. Fenomenele cu
caracter sezonier sunt specifice îndeosebi activităţilor din turism, comerţ şi agricultură.
Capitolul 2 43
Tabelul nr. 19 (date convenţionale)
Trimestrul I II III IV Media
trimestrială
Producţia de lapte (hl.) 343 487 406 364 400
Trim. II Trim. I
Trim. III Trim. IV
Figura 7. Producţia de lapte pe trimestre
mii $ SUA
10.4
10.510.510.4
10.5
10.3
10.2
10.110.2
10.3
10.3
10.4
9.1
99.39.3
9.3
9.5
8.9 8.7
9
8.9
9.6
9.4
0
5
10
15ian
febr
mar
apr
mai
iun
iul
aug
sept
oct
noi
dec
Cifra de afaceri planificata Cifra de afaceri realizata
Figura 8. Cifra de afaceri planificată şi realizată pe luni
Rezumat
Acest capitol prezintă noţiunile de bază legate de : sistematizarea datelor sub formă de
grupe omogene după una sau mai multe caracteristici necesară calculului indicatorilor
statistici, prezentarea datelor sub formă de tabele, serii, grafice.
Sistematizarea şi prezentarea datelor statistice 44
Termeni importanţi: grupare unidimensională, grupare bidimensională, tabel simplu,
tabel cu dublă intrare, serie de timp, serie de spaţiu, serie de distribuţie, diagrama în coloane,
diagrama circulară, diagrama în bare, diagrama polară.
Teste de autocontrol:
1. Care este rolul sistematizării datelor ?
2. Cum se realizează gruparea unităţilor statistice după o caracteristică cu un
număr mare de variante ?
3. Care este rolul grupărilor bidimensionale ?
4. Definiţi seria statistică.
5. Ce tipuri de serii cunoaşteţi ?
6. Tipuri de grafice.
Capitolul 3 45
Capitolul 3
Tema Serii de distribuţie unidimensionale
Obiectivele 1. Indicatorii statistici – definiţii, tipuri
2. Indicatori statistici calculaţi sub formă de mărimi relative
3. Indicatorii tendinţei centrale
3.1 Mărimi medii
3.1.1 Media aritmetică
3.1.2 Media armonică
3.1.3 Media pătratică
3.1.4 Media geometrică
3.2 Mediana
3.3 Moda (modulul, dominanta)
3.4 Cuartilele
4. Indicatorii variaţiei
4.1 Indicatorii simpli ai variaţiei
4.2 Indicatorii sintetici ai variaţiei
5. Media şi dispersia caracteristicii alternative
6. Asimetria
Mijloace
- citire/învăţare
- întrebări, probleme ce apar, explicaţii
- definiţii, explicaţii ce trebuie reţinute
- situaţii economice concrete, supuse analizei, exemple (sub
lupă)
- teme de casă, aplicaţii practice pentru studenţi
Finalitatea 1. analiza pe baza mărimilor relative
2. analiza pe baza mărimilor medii
3. analiza pe baza indicatorilor variaţiei
Evaluarea - parcurgerea aplicaţiilor propuse
Timp de lucru
necesar
1. Pentru cunoaşterea problemei: 6 ore
2. Pentru rezolvarea temelor: 12 ore + timpul de documentare
Serii de distribuţie unidimensionale 46
Serii de distribuţie unidimensionale
1. Indicatorii statistici – definiţii, tipuri
Principala particularitate a statisticii este aceea că ea studiază fenomenele sub
aspectul cantitativ - numeric, în strânsă interdependenţă cu determinarea lor calitativă, în
condiţii date de timp, loc şi structură organizatorică. Rezultatele cercetării statistice se
concretizează într-un număr mare de expresii numerice interdependente cunoscute sub
denumirea generică de indicatori statistici.
În sensul cel mai larg, orice expresie numerică obţinută într-un proces
concret de cercetare se numeşte indicator statistic.
După etapa în care apar în procesul de cunoaştere statistică, indicatorii pot fi: primari
şi derivaţi.
Indicatorii primari se obţin în cadrul prelucrării primare a datelor statistice ca urmare
a procesului de centralizare a datelor unei observări statistice. Ei au conţinut concret şi formă
concretă de exprimare. De exemplu, volumul producţiei la nivelul unei întreprinderi se
exprimă fie în unităţi naturale, natural-convenţionale, de timp de muncă sau valorice şi
dimensioneasză din acest punct de vedere întreprinderea pe o anumită perioadă de timp. Din
această cauză indicatorii primari se mai numesc şi indicatori absoluţi şi constituie baza
informaţională a cunoaşterii statistice.
Indicatorii derivaţi se obţin în faza de prelucrare statistică a mărimilor absolute prin
aplicarea variatelor metode şi procedee de calcul statistic (comparaţii, abstractizări,
generalizări).
Indicatorii derivaţi au menirea de a pune în lumină şi de a face posibilă analiza
aspectelor calitative ale fenomenelor şi proceselor cercetate. În acest scop, ei exprimă: relaţii
cantitative dintre diferitele caracteristici statistice, dintre diferitele părţi ale unei colectivităţi
sau dintre fenomenele ce se găsesc într-un anumit grad de interdependenţă; valorile tipice care
se formează în mod obiectiv în cadrul aceleiaşi perioade de timp sau în dinamică; gradul şi
forma de variaţie a caracteristicilor cercetate; legăturile de interdependenţă dintre fenomene;
tendinţa obiectivă de manifestare a fenomenelor; rolul şi contribuţia diferiţilor factori la
formarea şi modificarea mărimii unui fenomen complex etc.
2. Indicatori statistici calculaţi sub formă de mărimi relative
Indicatorii relativi se obţin prin aplicarea unui model de comparaţie sub formă
de raport. În statistica social economică, prin mărime relativă înţelegem rezultatul raportării a
doi indicatori statistici absoluţi. Indicatorul din numărătorul raportului se numeşte indicator
raportat, iar cel din numitor, indicator bază de raportare.
Capitolul 3 47
Alegerea formei de exprimare se face astfel încât mărimile relative să fie sugestive.
Putem folosi în acest scop: coeficienţi, procente, promile, prodecimile, procentimile. Folosirea
coeficienţilor se face atunci când ordinul de mărime al celor doi indicatori este apropiat şi
numărătorul este mai mare decât numitorul. De exemplu, avem o unitate comercială cu două
puncte de desfacere, A şi B. Prin punctul A s-a defăcut în luna iunie, 300 mii RON, iar prin
punctul B, 600 mii RON. Comparaţia se poate face luând pe rând ca bază fiecare din cele
două puncte de desfacere şi obţinem doi coeficienţi.
şi 2300
600
5,0600
300
/
/
xx
K
xx
K
A
B
AB
B
A
BA
Evident că în acest caz cel de al doilea raport este mai sugestiv decât primul, adică în
punctul B s-a vândut de două ori mai mult decât în punctul A. Dacă vrem să facem mai
sugestiv primul raport îl exprimăm procentual: %50100
1005,0
.
În cazul în care indicatorul din numărătorul raportului este cu mult mai mic decât cel
din numitorul acestuia, mărimea relativă corespunzătoare se exprimă în promile, adică
rezultatul raportului se înmulţeşte cu 103. În acest fel se exprimă indicatorii cu care se
caracterizează mişcarea naturală a populaţiei. De pildă,
natalitateanumarul nascutilor vii
numarul mediu al populatieix o 1000 %
mortalitateanumarul decedatilor
numarul mediu al populatieix o 1000 %
Dacă numărătorul este şi mai mic comparativ cu numitorul, mărimea relativă se poate
exprima în prodecimile. De exemplu, numărul studenţilor la 10.000 locuitori, numărul de
medici sau paturi de asistenţă medicală la 10.000 locuitori etc. Această exprimare se poate
evita dacă are sens să inversăm raportul. De exemplu, putem spune, fie numărul de medici ce
revine la 10.000 locuitori, fie numărul de locuitori care revine la un medic. Sensul
interpretării va fi şi el inversat. Se apreciază că populaţia unei ţări are un standard de viaţă mai
ridicat dacă are mai mulţi medici la 10000 de locuitori, respectiv dacă are mai puţini locuitori
la un medic.
Mai rar se întâlnesc exprimări în procentimile, câte unităţi din indicatorul raportat
revin la 100.000 unităţi din baza de raportare. Acest mod de exprimare este specific pentru:
reţeaua şcolară, reţeaua de circulaţie a mărfurilor, reţeaua sanitară din mediul rural.
În funcţie de scopul analizei şi de informaţiile de care dispunem, în statistica social
economică se calculează următoarele tipuri de mărimi relative:
mărimi relative de structură;
mărimi relative de coordonare sau corespondenţă;
mărimi relative ale dinamicii;
mărimi relative ale intensităţii.
Mărimile relative de structură se pot calcula de fiecare dată când s-a aplicat metoda
grupării prin urmare calculul lor este posibil atunci când colectivitatea este separată pe două
sau mai multe grupe. De exemplu, presupunem, că o colectivitate este împărţită în k grupe. În
acest caz se pot calcula mărimi relative de structură, cu sensul de greutăţi specifice sau
Serii de distribuţie unidimensionale 48
ponderi, raportând indicatorii absoluţi calculaţi pe grupe la acelaşi indicator calculat pe total
colectivitate.
Notând nivelul absolut al grupelor cu x1, x2 .... xk şi cu i
i
k
x
1
nivelul absolut
(totalizat) al variabilei pe total colectivitate se pot obţine următoarele mărimi relative cu
sensul de ponderi sau greutăţi specifice:
1
1
1
2
2
1 1
* * *
; ...gx
xg
x
xg
x
xii
k
ii
k k
K
ii
k
ii
k
g*
,
1
1 00 pentru mărimi relative exprimate prin coeficient
respectiv:
ii
k
g(%)
*
1
100% când mărimile relative se exprimă procentual.
În mod analog putem calcula mărimi relative de structură pornind de la frecvenţele
absolute. În acest caz mărimile relative din structură calculate au sensul de frecvenţe relative.
Frecvenţele relative se notează cu fi
* şi se calculează ca un raport între numărul
absolut pe fiecare grupă şi numărul total pe întreaga colectivitate.
k
ii
i
i
f
ff
1
*
Această proprietate se foloseşte frecvent în statistica social economică deoarece
frecvenţele absolute referindu-se la fenomene concrete sunt exprimate în unităţi concrete de
măsură, deci necomparabile pentru două sau mai multe variabile interdependente. Eliberându-
se de aspectul concret ele pot fi comparate cu probabilitatea de apariţie a dieferitelor
evenimente şi seria empirică poate fi analizată pe baza proprietăţilor repartiţiilor teoretice.
Mărimile relative de structură se reprezintă grafic printr-o diagramă de structură care
poate fi:
dreptunghiul de structură;
pătratul de structură;
cercul sau semicercul de structură.
Mărimile relative de coordonare sau de corespondenţă se folosesc pentru a
compara două grupe ale aceleiaşi colectivităţi sau două colectivităţi situate în spaţii diferite
dar coexistente în timp. Prin urmare, ori de câte ori este posibil calculul mărimilor relative de
structură devine posibil şi calculul mărimilor relative de coordonare. Şi calculul mărimilor
relative de coordonare presupune împărţirea colectivităţii în două sau mai multe grupe.
Presupunând că o colectivitate este împărţită în două grupe şi nivelul pe grupe al
variabilei studiate îl notăm cu xA şi xB se pot calcula mărimi relative de coordonare de tipul:
A B
A
B
B A
B
A
Kxx
si Kxx
/ /
Mărimile relative de coordonare se folosesc în studiul variaţiei teritoriale şi prin
urmare au caracter de indici teritoriali.
Aceşti indici teritoriali stau la baza comparaţiilor pe plan naţional (între judeţele ţării)
şi pe plan internaţional (între ţări) zone geografice, (continente).
Mărimile relative de coordonare se reprezintă grafic prin benzi şi coloane stabilind în
acest fel relaţiile care există între diferitele părţi ale aceleiaşi colectivităţi.
Capitolul 3 49
Când mărimile relative de coordonare se folosesc în studiul variaţiei teritoriale (pe
judeţe) se reprezintă grafic prin cartograme şi cartodiagrame.
Mărimile relative ale dinamicii se folosesc în scopul caracterizării statistice a
evoluţiei în timp a fenomenului analizat. Mărimile relative ale dinamicii se calculează atunci
când avem două valori ale aceluiaşi indicator înregistrat în unităţi diferite de timp. În funcţie
de baza de comparaţie aleasă putem calcula:
a) mărimi relative ale dinamicii cu bază fixă folosind relaţia:
i
i k
kxx
xx
xx
xx/
. . ; . .... .0
0
1
0
2
0 0
100 100 100 100
b) mărimi relative ale dinamicii cu bază mobilă (variabilă sau în lanţ) pe baza relaţiei:
i i
i
i
k
k
kxx
xx
xx
xx/
. . ; . .... .
1
1
1
0
2
1 1
100 100 100 100
În primul caz putem stabili, pe baza mărimilor relative ale dinamicii calculate,
cuantumul modificărilor faţă de o bază de referinţă semnificativă, iar în cel de-al doilea caz
ritmicitatea cu care se modifică fenomenul studiat.
În activitatea economico-socială mărimea relativă de dinamică se numeşte indice.
Mărimile relative ale dinamicii se exprimă sub formă de coeficient şi cel mai adesea
procentual.
Mărimile relative ale dinamicii se reprezintă grafic prin cronograme (historiograme).
Mărimile relative de intensitate se calculează ca raport între doi indicatori absoluţi
de natură diferită între care există o relaţie de interdependenţă. Un exemplu de mărime
relativă de intensitate poate fi nivelul productivităţii muncii (W), calculat ca raport între
nivelul producţiei (q) şi timpul de muncă consumat pentru producerea acesteia W qT
.
În general o mărime relativă de intensitate poate fi calculată după relaţia:
i
i
i
xy
z
Cele două caracteristici introduse în raport yi şi zi sunt caracteristici primare,
înregistrate direct prin observarea statistică, iar raportul x i, calculat pe fiecare unitate de
observare, este o caracteristică secundară (derivată). Semnificaţia acestei caracteristici constă
în aceea că exprimă câte unităţi din valoarea caracteristicii yi revin la o unitate a valorii
caracteristicii zi.
Probleme rezolvate
De la trei magazine ale unei societăţi s-au cules date referitoare la salariul mediu pe
magazin şi numărul angajaţilor, prezentate în tabelul de mai jos:
Tabelul nr.1
Magazine Salar mediu
(RON/angajat)
Număr angajaţi
Fondul de salarii
(RON)
aug. 2004 aug. 2005 aug. 2004 aug. 2005 aug. 2004 aug. 2005
M1 530 570 25 25 13250 14250
M2 620 620 31 33 19220 20460
Serii de distribuţie unidimensionale 50
M3 580 560 24 20 13920 11200
TOTAL 80 78 46390 45910
Se cere să se calculeze şi să se interpreteze toate mărimile relative permise de date.
Rezolvare
mărimi de structură
pentru caracteristica salar mediu nu se pot calcula deoarece salariile medii nu
se pot aduna pe cele trei magazine;
pentru numărul angajaţilor rezultatele sunt:
Tabelul nr.2
În august 2004 numărul angajaţilor de la magazinul M1 a reprezentat 31.25% din
totalul angajaţilor pe societate. La fel se interpretează rezultatele şi pentru celelalte valori.
31.25%
38.75%
30.00%
M1 M2 M3
Figura 1. Structura angajaţilor în luna august 2004
pentru caracteristica Fond de salarii obţinută prin salar mediu înmulţit cu
numărul angajaţilor, rezulatele se prezintă astfel:
28.56%
41.43%30.01%
M1 M2 M3 Figura 2. Structura fondului de salarii în luna august 2004
Aug. 2004 Aug. 2005
25/80*100 = 31,25% 25/78*100 = 32,05%
31/80*100 = 38,75% 33/78*100 = 42,31%
24/80*100 = 30,00% 20/78*100 = 25,64%
Capitolul 3 51
mărimi de coordonare pentru caracteristica salar mediu se pot face comparaţii între salariile medii ale
celor trei magazine:
169,1530
62085,0
620
5301/22/1 MMMM KsauK
Salariul mediu a fost în august 2004 de 1,169 ori mai mare la magazinul M2
decât la magazinul M1.
numărul angajaţilor în august 2004 a fost de 1,24 ori mai mare (31/25 = 1,24)
la magazinul M2 faţă de M1
fondul de salarii a fost de 1,45 ori mai mare (19220/13250 = 1,45) la
magazinul M2 faţă de M1
mărimi de dinamică
pentru caracteristica salar mediu 1002004
2005
2004/2005 salar
salarI
Tabelul nr.3
% 100%
2004/2005 I
M1 570/530*100 = 107,55 7,55%
M2 620/620*100 = 100,00 0%
M3 560/580*100 = 96,55 -3,45%
La magazinul M1 salariul mediu a crescut în 2005 faţă de 2004 la 107,55% sau a
crescut cu 7,55%;
La magazinul M2 salariul mediu a rămas constant în 2005 faţă de 2004;
La magazinul M3 salariul mediu a scăzut în 2005 faţă de 2004 la 96,55% sau a scăzut
cu 3,45%;
pentru caracteristica Număr angajaţi 100.
.
2004
2005
2004/2005 angajatiNr
angajatiNrI
Tabelul nr.4
% 100%
2004/2005 I
M1 100 0% M2 106,45 6,45% M3 83,33 -16,67
pentru caracteristica Fond de salarii 1002004
2005
2004/2005 Fond
FondI
Tabelul nr.5
% 100%
2004/2005 I
M1 107,55 7,55%
M2 106,45 6,45%
M3 80,46 -19,54
Serii de distribuţie unidimensionale 52
mărimi de intensitate
Se poate calcula salariul mediu pe societate angajatidetotalNr
salariidetotalFondulS
.
pentru anul 2004 salariul mediu pe societate a fost
46390/80 = 579,875 RON/angajat
pentru anul 2005 salariul mediu pe societate a fost
45910/78 = 588,59 RON/angajat
3. Indicatorii tendinţei centrale
Analiza statistică a trăsăturilor esenţiale ale fenomenelor de masă, stabilirea
tendinţelor ce apar în producerea lor necesită calcularea anumitor valori tipice, care să fie
reprezentative pentru întreaga colectivitate studiată.
În funcţie de gradul de variabilitate a valorilor individuale, de sursele de date de care
dispunem şi de nevoile de cunoaştere, în teoria şi practica statistică se utilizează ca principali
indicatori ai tendinţei centrale; mărimile medii; mediana şi modul sau dominanta seriei.
3.1 Mărimi medii
3.1.1 Media aritmetică
Media aritmetică este rezultatul sintetizării într-o singură expresie
numerică a tuturor nivelurilor individuale observate, obţinută prin raportarea valorii
totalizate a caracteristicii la numărul total al unităţilor.
În sens statistic, media aritmetică calculată pentru o colectivitate statistică este
valoarea care s-ar fi înregistrat dacă toţi factorii ar fi influenţat în mod constant în toate
cazurile înregistrate.
Media aritmetică simplă se calculează ca raport între suma nivelurilor individuale
sub care s-a înregistrat caracteristica şi numărul cazurilor individuale luate în observare.
Media se mai poate calcula raportând valoarea totalizată a caracteristicii la numărul total al
unităţilor la care s-a făcut centralizarea. Se foloseşte relaţia:
x
x
na
i
i
n
1 unde:
xi - reprezintă nivelurile individuale ale variabilei;
xi
i
n
1
- reprezintă nivelul centralizat al variabilei;
n - reprezintă numărul unităţilor observate.
Într-o colectivitate statistică se întâlnesc foarte rar cazuri în care numărul variantelor
coincide cu numărul unităţilor. De regulă, fenomenele de masă sunt numeroase şi aceeaşi
valoare individuală poate fi înlocuită de mai multe ori. În acest caz, pentru a putea cuprinde în
Capitolul 3 53
calcul toate valorile individuale trebuie să se ţină seama şi de frecvenţa lor de apariţie iar
media se va calcula ca o medie ponderată utilizând formula:
x
x f
f
i i
i
k
i
i
k
1
1
De reţinut: dacă repartiţia de frecvenţe se prezintă pe intervale de variaţie, xi
reprezintă centrul de interval corespunzător.
Media aritmetică are anumite proprietăţi care au utilitate practică pentru calculul şi
interpretarea valorii ei.
Enunţăm principalele proprietăţi:
a) într-un şir de valori egale, media acestora este egală cu fiecare dintre ele.
x1 = x2 =...= xi =...= xn = xc
x
x
n
nx
nx
c
i
n
cc
1
b) mărimea mediei aritmetice este întotdeauna o valoare cuprinsă în intervalul de
variaţie al variabilei:
x x xmin max
În cazul seriilor de repartiţie pe intervale de variaţie
x x xl L unde:
xl - limita inferioară a primului interval
xL - limita superioară a ultimului interval.
Dacă media se plasează în afara acestor limite, rezultatul este în mod sigur eronat.
c) în cazul unei serii de distribuţie cu frecvenţe, media se încadrează între valorile
extreme ale variabilei oscilând în jurul termenului cu frecvenţa cea mai mare.
d) suma abaterilor nivelurilor individuale ale variabilei aleatoare de la media lor este
egală cu zero:
( )x x x nx x n
x
ni
i
n
i
i
n
i
i
i
n
i
n
1 1
1
1
0 (pentru o serie simplă)
( )x x f x f x f x f f
x f
f
i i
i
k
i i i
i
k
i
k
i i i
i
k i
i
n
i
i
i
ki
k
1 11 1
1
1
1
0 (pentru seria de
frecvenţe).
Proprietăţile de la punctele a-d permit verificarea exactităţii calculelor.
Calculul mediei pentru o repartiţie pe variante.
Repartiţia studenţilor după nota obţinută la examenul de contabilitate a fost:
Tabelul nr.6
Nota xi
Numărul studenţilor fi xifi
5 5 25
Serii de distribuţie unidimensionale 54
6 15 90
7 25 175
8 15 120
9 5 45
TOTAL 65 455
Fiind o serie de repartiţie de frecvenţe trebuie să folosim formula mediei aritmetice
ponderate. xf
f
i
i
xi 455
657
Calculul mediei pentru o repartiţie pe intervale de variaţie egale.
Fiind o serie de repartiţie de frecvenţe vom folosi tot formula mediei aritmetice
ponderate. În cazul prezentat, variabila x este vechimea iar ponderea este numărul de angajaţi
corespunzător fiecărui interval şi care este exprimată atât în mărimi absolute (fi), cât şi în
mărimi relative (f*i). Pentru a calcula valoarea mediei este necesar să se stabilească în
prealabil vechimea medie corespunzătoare fiecărui interval.
Tabelul nr.7
Frecvenţe
Produse de frecvenţe
Vechime
(ani)
Centrul intervalului
Xi
absolute
( )f i
relative
%
( )*f i
x fi i x fi i*
0 - 5 2,5 10 3,33 25 8,325
5 - 10 7,5 40 13,33 300 99,975
10 - 15 12,5 60 20,00 750 250,000
15 - 20 17,5 80 26,67 1400 466,725
20 - 25 22,5 50 16,67 1125 375,075
25 - 30 27,5 30 10,00 825 275,000
30 - 35 32,5 20 6,67 650 216,775
35 - 40 37,5 10 3,33 375 124,875
TOTAL 300
f i
i
k
1
100
f ii
k
*
1
5450
x fi i
i
k
1
1816,75
x fi i
i
k*
1
Considerăm, în mod convenţional, că frecvenţele se distribuie uniform în cadrul
fiecărui interval şi prin urmare vom lucra cu centrul de interval (x i) stabilit ca medie
aritmetică simplă a celor două limite, apoi se efectuează produsele de frecvenţe x fi i şi x fi i*
şi se trece la calculul mediei în cele două variante:
a) utilizând frecvenţele absolute:
xx f
f
i i
i
5450
30018 1666, sau 18,2 ani vechime / ang.
Capitolul 3 55
b) utilizând frecvenţele relative:
xx fi i
*
,,
100
1816 75
10018 2 ani vechime / ang.
Media se exprimă în unităţile de măsură ale variabilei.
În cazul unei serii perfect simetrice media este egală cu varianta de la mijlocul seriei
sau cu mijlocul intervalului cu frecvenţa cea mai mare.
Media este mai exactă când o calculăm direct din valorile sub care s-a înregistrat
caracteristica. Ea este o medie aproximativă când o calculăm pentru seriile pe intervale de
variaţie deoarece în acest caz determinarea ei se bazează pe ipoteza repartizării uniforme a
frecvenţelor în cadrul fiecărui interval, ceea ce nu corespunde realităţii.
Una din condiţiile de aplicare a valorilor medii este aceea de a găsi criterii de alegere
corectă a tipului de medie folosit.
În general este recomandabil să alegem media aritmetică atunci când fenomenul
supus cercetării înregistrează modificări aproximativ în progresie aritmetică.
3.1.2 Media armonică
Media armonică se defineşte ca fiind egală cu valoarea inversă a mediei
aritmetice calculată din valorile inverse ale termenilor aceleiaşi serii.
Deşi derivă din media aritmetică ponderată, în practică se întâlnesc două variante ale
mediei armonice, simplă şi ponderată.
Se folosesc relaţiile de calcul:
xn
x
h
ii
n
1
1
pentru o serie simplă
x
f
xf
h
i
i
k
i
i
i
k
1
1
1 pentru o serie de repartiţie de frecvenţe
Media armonică ponderată se foloseşte de exemplu la calculul indicelui mediu de grup
al preţurilor (când lipsesc informaţii privind volumul fizic al mărfurilor) la calculul salariului
mediu pe întreprinderi când cunoaştem salariul mediu şi fondul de salarii la nivelul secţiilor;
la calculul producţiei medii la hectar la o cultură în cadrul unei asociaţii agricole când se
cunosc recolta medie şi recolta totală pe parcelele acesteia.
Despre patru echipe de angajaţi de la o secţie se cunosc următoarele date:
Tabelul nr.8
Echipa
Salariul mediu
RON/ang.
xi
Fondul de salarii
RON
xifi
1 540 6480
Serii de distribuţie unidimensionale 56
2 558 11160
3 635 14605
4 600 9000
Total 41245
În exemplul prezentat, variantele caracteristicii sunt medii de grupă şi se cere să
determinăm nivelul mediu al salariului pe întreaga secţie.
Fondul de salarii ( )x fi i
Salariul mediu pe fiecare echipă ( )xi =
Numărul angajaţilor (fi)
Deoarece cunoaştem ( )xi şi ( )x fi i vom folosi formula mediei armonice.
21,589
9000600
114605
635
111160
558
16480
540
1
41245
1
1
1
k
i
ii
i
k
i
ii
h
fxx
fx
x RON/ang.
În cazul distribuţiilor de frecvenţe media armonică este indicată a fi folosită când
predomină valorile mici ale seriei, seria prezentând o asimetrie către valorile minime ale
caracteristicii. În acest caz se foloseşte formula mediei armonice ponderate clasice.
3.1.3 Media pătratică
Media pătratică ( )xp este acea valoare care înlocuind termenii seriei
ridicaţi la pătrat nu modifică suma pătratelor lor.
Media pătratică este folosită de obicei atunci când nivelurile variabilei aleatoare
prezintă creşteri din ce în ce mai mari, predomină valorile ridicate ale variabilei şi dorim să le
dăm acestora o importanţă mai mare.
Media pătratică se poate calcula şi în cazul în care termenii seriei au valori pozitive şi
negative.
n
x
x
n
i
i
p
1
2
Această formulă se foloseşte în cazul unei serii simple.
În cazul unei distribuţii de frecvenţe:
x
x f
fp
i
i
k
i
i
i
k
2
1
1
Capitolul 3 57
3.1.4 Media geometrică
Spre deosebire de celelalte medii prezentate până aici, care se bazează pe relaţii de
însumare între termenii seriei, media geometrică se bazează pe relaţia de produs dintre ei.
Media geometrică reprezintă acea valoare cu care, dacă se înlocuiesc toţi termenii
seriei şi se face produsul lor, valoarea la care se ajunge este egală cu produsul termenilor reali,
adică:
x x x xn i
i
n
1 2
1
...
x x x x
n
xg g g g i
i
n
...
1
x x x xg
n
i
i
n
g i
i
n
n
1 1
În cazul unei serii de distribuţie de frecvenţe, fiecare termen trebuie să fie luat în
funcţie de frecvenţa sa.
Deci vom avea:
x x x xf f
k
f
i
f
i
k
k i
1 2
1
1 2, .....
Înlocuind fiecare valoare cu xg obţinem: x x x xg
f
g
f
g
f
i
f
i
k
k i1 2
1
.....
Restrângând obţinem:
( )x x
x x
g
f
i
f
i
k
g i
f
i
kf
i
i
k
i
ii
i
k
1
1
1
1
Media geometrică se foloseşte cel mai frecvent în cazul seriilor dinamice, la calculul
mediilor din mărimile relative ale dinamicii, între care există o relaţie de produs. Se foloseşte
la calculul indicelui mediu de dinamică.
Între mediile prezentate există următoare relaţie de ordine:
x x x xh g a p
3.2 Mediana
Mărimile medii deşi reflectă ceea ce este esenţial şi tipic în nivelul de dezvoltare a
fenomenului nu caracterizează modul de repartiţie a frecvenţelor în cadrul seriei.
De aceea, pentru completarea analizei seriilor de distribuţie este necesar să se
calculeze şi anumite valori medii de poziţie sau medii de structură, printre care mediana şi
modul sunt cele mai frecvent utilizate.
Mediana (Me) reprezintă valoarea centrală a unei serii statistice,
ordonate în mod crescător sau descrescător şi care împarte termenii seriei în două părţi
Serii de distribuţie unidimensionale 58
egale: 50% din numărul termenilor vor fi mai mici decât Me şi 50% se vor plasa peste
valoarea ei.
Indiferent de tipul seriei (simplă = date negrupate sau cu frecvenţe = date grupate) la
calculul medianei se cer rezolvate două aspecte:
aflarea locului medianei;
calculul valorii medianei.
a) Datele sunt cunoscute individual.
În cazul serilor simple locul medianei se află după relaţia: locul Men
1
2 unde n
reprezintă numărul termenilor seriei.
Determinarea medianei necesită ordonarea prealabilă crescătoare sau descrescătoare a
termenilor seriei.
Dacă numărul termenilor este impar (n = 2p+1) mediana este termenul de rang p+1
(valoarea termenului central).
Fie de exemplu, o serie formată din următorii nouă termeni: 8, 8, 9, 9, 9, 10, 10, 13,
14. În acest caz mediana este a cincea valoare, adică Me = 9, adică valoarea termenului
indicat de locul medianei (9+1)/2 = 5.
Dacă numărul termenilor este par, adică n = 2p, orice valoare cuprinsă între termenul
de rang p şi termenul de rang p+1 poate fi considerată ca o mediană. În general, s-a convenit
să se ia ca valoare a Me centrul acestui interval, adică media aritmetică a termenilor de rang p
şi p+1.
De exemplu, dacă se consideră o serie formată din valorile: 8, 9, 9, 10, 12, 13, 13, 14,
15, 16 mediana este situată între termenul cinci şi şase şi este egal cu media aritmetică simplă
a valorii lor adică Me = (12+13)/2 = 12,5
b) Datele sunt grupate pe intervale de valori (clase) şi în consecinţă îşi pierde
individualitatea.
În acest caz determinarea medianei se poate face numai dacă recurgem la o ipoteză
suplimentară: admitem că există o distribuire uniformă a datelor în intervalul fiecărei clase.
Astfel în prealabil se procedează la o interpolare liniară adică se împarte întregul interval de
valori în intervale egale.
Pentru ilustrarea modului de calcul al medianei considerăm seria din tabelul
de mai jos.
Locul medianei în cazul datelor grupate locul Me
f ii
n
1
2
1.
Efectivul total fiind 200 locul Me
200 1
2100 5, .
Mediana este situată între valorile 100 şi 101. Coloana frecvenţelor cumulate ne indică
structura acestor valori în intervalul 32 - 36. Cum în acest interval sunt situate 60 de unităţi
este necesar să repartizăm proporţional aceste 60 de unităţi în intervalul de variaţie egal cu 4
şi să identificăm a 100 -a şi 101-a valoare, care fac parte din grupa de 60. Cu alte cuvinte este
necesar să procedăm în continuare la calculul valorii medianei.
Capitolul 3 59
Tabelul nr.9 Gruparea societăţilor din ramura x după mărimea profitului
Societăţi după
mărimea profitului
(mii RON)
Numărul
societăţilor
Frecvenţe absolute cumulate
crescător descrescător
20 - 24 20 20 200
24 - 28 35 55 180
28 - 32 40 95 145
32 - 36 60 155 105
36 - 40 32 187 45
40 - 44 8 195 13
44 - 48 5 200 5
TOTAL 200
Determinarea valorii se poate realiza în două moduri:
prin calcul algebric;
prin calcul grafic.
Calculul algebric al medianei presupune utilizarea următoarei formule de calcul:
Me x h
ff
f
i
i
i
Me
m
0
1
11
2
h - mărimea intervalului median;
f i
i
Me
1
1
- suma frecvenţelor precedente intervalului median (frecvenţa cumulată a
intervalului precedent celui median)
fm - frecvenţa absolută a intervalului median.
Mediana seriei este deci:
Me
32 4100 5 95
6032 37
,, mii RON
Calculul grafic al medianei se poate realiza în două moduri:
1. Se trasează diagramele frecvenţelor cumulate ascendent şi descendent.Din punctul
de intersecţie al celor două curbe se trasează perpendiculara pe axa absiciselor şi se citeşte
valoarea medianei pe Ox (vezi fig.1.); Me = 32,375 mii RON.
2. Se trasează curba frecvenţelor cumulate crescător. De pe axa ordonatelor din
punctul corespunzător locului medianei =f
i 1
2 (în cazul nostru 100,5) se duce o paralelă
la Ox ce întîlneşte curba în punctul m. Din acest punct se coboară perpendicular pe Ox şi se
obţine astfel valoarea medianei.
Serii de distribuţie unidimensionale 60
0
25
50
75
100
125
150
175
200
20 24 28 32 36 40 44 48
Me
y
Figura 1. Calculul grafic al medianei
0
50
100
150
200
250
20 24 28 32 36 40 44 48
Me
Figura 2. Calculul grafic al medianei
Menţionăm în continuare cîteva proprietăţi ale medianei. Mediana depinde de locul
valorilor în serie, nu de mărimea acestor valori. În felul acesta ea este protejată contra
influenţei valorilor aberante (anormal de mari sau anormal de mici).
Mediana are o largă apliacabilitate în practică, ea serveşte la studiul mortalităţii, la
determinarea duratei medii de viaţă, etc.
Capitolul 3 61
3.3 Moda (modulul, dominanta)
Modulul (Mo) unei distribuţii statistice reprezintă acea valoare a
caracteristicii care corespunde celui mai mare efectiv sau celei mai mari frecvenţe.
Pentru serii simple (date negupate) modul se calculează cu totul întâmplător dacă
întâlnim o valoare a variabilei care se repetă de mai multe ori.
Astfel, în seria (4, 5, 6, 6, 7, 7, 8, 8, 8, 9, 9, 10), valoarea 8 apare cel mai frecvent;
modul este deci Mo = 8.
Modul se poate calcula cu certitudine pentru orice serie de distribuţie de frecvenţă,
indiferent de modul ei de prezentare (pe variante sau pe intervale de variaţie).
Modul se poate calcula fie pe cale algebrică fie prin metoda grafică.
a) Cazul unei serii de distribuţie pe variante.
În acest caz modul este uşor de reperat. În tabelul statistic xi, fi în care este prezentată
seria pe variante, modul este acea valoare a lui x i corespunzătoare frecvenţei maxime.
Calculul grafic al modului presupune reprezentarea grafică a seriei utilizând poligonul
frecvenţelor. În acest caz Mo este acea valoare de pe abscisă care corespunde frecvenţei
maxime (vezi fig. 3).
xi
0
1
2
3
4
5
6
7
8
0 1 2 3 4 5 6 7 8
Mo
fi
Figura 3
Serii de distribuţie unidimensionale 62
xi
0
1
2
3
4
5
6
7
8
0 1 2 3 4 5 6 7 8 9
In te r va l m o d al
f i
Figura 4
Dacă seria prezintă două frecvenţe maxime identice alăturate se defineşte un interval
modal (vezi fig. 4) fără a putea preciza valoarea exactă a modului.
Dacă seria prezintă două sau mai multe frecvenţe maxime aparţinând unor valori
situate la distanţe inegale spunem că seria este bimodală, trimodală etc.
Pentru o serie de distribuţie pe intervale egale valoarea modului trebuie calculată.
Intervalul modal se consideră intervalul care are frecvenţa cea mai mare.
În seria prezentată pentru calculul medianei intervalul modal este cuprins între 32-36
mii RON profit, deoarece aici frecvenţa este maximă (60). Cu aceste precizări se poate
proceda la calculul algebric şi grafic.
a) Calculul algebric al modului se bazează pe relaţia:
Mo x h
0
1
1 2
în care:
x0 - reprezintă limita inferioară a intervalului modal;
h - mărimea intervalului modal;
1 - diferenţa dintre frecvenţa intervalului modal (fm) şi a celui precedent (fm-1)
2 - diferenţa dintre frecvenţa intervalului modal (fm) şi a celui următor (fm+1)
În seria prezentată:
Mo
32 4
60 40
60 40 60 3233 67
( )
( ) ( ), mii RON
Modul prezintă o abatere faţă de medie de 1,81 mii RON (31,86-33,67 = -1,81). Fiind
negativă această abatere arată că frecvenţele termenilor mai mici sunt mai numeroase, în
comparaţie cu frecvenţele termenilor mai mari. Media s-a calculat utilizând formula:
xx f
f
i i
i
6372
20031 86, mii RON profit/societate
b) Pe grafic, valoarea modală se determină folosind histograma prin dreptunghiuri:
Capitolul 3 63
Se procedează astfel: Se construieşte histograma (vezi figura 5). Din intersecţia
segmentelor de dreaptă care unesc vârfurile superioare ale dreptunghiului aferent modului cu
frecvenţele de incidenţă ale acestuia cu dreptunghiurile adiacente, se coboară o perpendiculară
pe abscisă. Punctul găsit indică valoarea modului. De pe grafic rezultă o valoare apropiată de
cea obţinută prin calcul algebric (Mo = 33,7).
Figura 5. Calculul grafic al modului
c) În cazul distribuţiilor moderat asimetrice Mo se mai poate determina şi pornind de
la condiţia care trebuie să fie îndeplinită în acest caz:
x Mo x Me
Mo Me x
3
3 2
( )
În cazul prezentat prin utilizarea acestei relaţii de calcul se obţine:
Mo 332 27 231 86 33 34, , , mii RON
Se observă că valoarea modului nu diferă semnificativ faţă de rezultatele obţinute la
puctele a) şi b) în cazul nostru.
De precizat faptul că modul este o valoare foarte instabilă. Simpla deplasare cu câteva
unităţi (deci reluarea grupării) poate să modifice sensibil valoarea modului.
Observăm că în cazul distribuţiei studiate x Me Mo ( , , , )31 86 32 37 33 67
aspect de care se va ţine seama în aprecierea tipului seriei.
Mediana şi modul se exprimă în aceleaşi unităţi de măsură ca şi variabilele pentru care
se determină şi prezintă avantajul că valoarea lor nu se modifică dacă se închid în mod
convenţional intervalele deschise.
Mediana şi modul pot să fie determinate chiar dacă nu se cunosc limitele extreme ale
primului şi ultimului interval al seriei (limita inferioară a primului interval şi limita superioară
a ultimului interval). Modul este mai puţin exact decât media deoarece nu sunt implicate în
calcul toate valorile variabilei.
Cu toate inconvenientele modul are o largă aplicabilitate practică (mai ales în comerţ)
şi stă la baza calculului şi interpretării gradului de asimetrie a repartiţiei.
Folosirea modului se impune dacă interesează valoarea tipică a unei serii de repartiţie.
La utilizarea modului trebuie să se manifeste precauţie determinată de faptul că:
- modul conţine relativ puţine informaţii: valoarea modală este mai frecventă
decât celelalte valori. Dacă celelalte valori sunt însă aproape tot aşa de
Serii de distribuţie unidimensionale 64
frecvente ca valoarea modală, s-ar putea ca o valoare să devină dominantă
din întâmplare. Deci, se recurge la modul numai dacă o valoare domină în
seria de repartiţie;
- dacă valoarea care domină este extremă, modul nu poate caracteriza tendinţa
centrală.
3.4 Cuartilele
Pentru seriile de distribuţie cu tendinţă pronunţată de asimetrie, caracterizate
printr-o amplitudine mare a variaţiei, se calculează şi alţi indicatori de poziţie cum sunt:
cuartilele, decilele etc.
Cuartilele sunt acele valori ale caracteristicii, care separă seria în patru
părţi egale:
cuartila inferioară, notată cu Q1, este mai mare decât 25% din termenii
seriei şi mai mică decât 75% dintre ei;
cuartila a doua Q2 coincide cu Me şi separă seria în două părţi;
cuartila superioară Q3 este mai mare decât 75% din numărul
termenilor şi mai mică decât 25% din numărul lor.
Analog cu mediana pentru cuartile obţinem:
Tabelul nr.10
Locul cuartilei Valoarea cuartilei
loc Q f i1
1
41 ( )
Q x h
f fpQ
f
i
Q
1 0
1
1
41
1
( )
Q Me2
loc Q f i3
3
41 ( )
Q x h
f fpQ
f
i
Q
3 0
3
3
41
31
( )
în care:
fpQ si fpQ1 3 suma frecvenţelor intervalelor precedente locului pe care
îl ocupă Q1 şi Q3
fQ si fQ1 2 frecvenţa intervalelor care conţin cuartilele res pective.
Capitolul 3 65
Pentru exemplul de mai sus:
Locul Q1 este 25,504
1200
; intervalul cuartilei este 24 – 28
45,2735
2025,504241
Q mii RON
Locul Q3 este 75,1504
)1200(3
; intervalul cuartilei este 32 – 36
71,3560
9575,1504323
Q mii RON
4. Indicatorii variaţiei
Într-o colectivitate statistică valorile individuale (variantele) diferă mai mult
sau mai puţin unele faţă de altele. Ele pot fi mai apropiate sau mai împrăştiate. Comparaţia se
face, în mod practic, cu media seriei, considerată ca fiind valoarea cea mai reprezentativă
pentru colectivitatea studiată. De cele mai multe ori este important de cunoscut cât de departe
sunt valorile variantelor seriei faţă de această medie, sau cu alte cuvinte care este dispersia
variantelor în cadrul seriei.
Se apreciază că dacă variantele au valori mai apropiate de valoarea mediei seriei, deci
prezintă abateri mici, media este reprezentativă.
În practica statistică, de cele mai multe ori, datele care trebuie să fie analizate sunt
extrem de numeroase şi de regulă cu o amplitudine mare a variaţiei. De aceea este necesar să
separăm şi să stabilim intensitatea cu care activează cele două grupe de factori esenţiali şi
întâmplători având drept consecinţă imediată un anumit grad de variabilitate.
Analiza statistică a unei repartiţii poate fi aprofundată prin calculul indicatorilor de
variaţie. Aceşti indicatori trebuie să servească la:
verificarea reprezentativităţii mediei ca valoare tipică a unei serii de date statistice;
verificarea gradului de omogenitate a seriei;
caracterizarea statistică a formei şi gradului de variaţie a unei caracteristici;
compararea în timp şi spaţiu a mai multor serii statistice de distribuţie pentru aceeaşi
caracteristică sau pentru caracteristici interdependente;
cunoaşterea gradului de influenţă a factorilor după care s-a făcut gruparea unităţilor
observate.
Indicatorii variaţiei pot fi calculaţi ca indicatori simpli şi ca indicatori sintetici.
4.1 Indicatorii simpli ai variaţiei
Indicatorii simpli ai variaţiei servesc tocmai pentru a caracteriza gradul de împrăştiere
a unităţilor purtătoare ale caracteristicilor înregistrate. Ei se calculează pentru a măsura
amplitudinea variaţiei şi abaterile valorilor individuale de la media lor. Aceşti indicatori se pot
exprima atât în mărimi absolute - folosind aceleaşi unităţi de măsură ca şi pentru caracteristica
studiată - cât şi în mărimi relative, calculate în raport cu valoarea medie.
Serii de distribuţie unidimensionale 66
Din această grupă a indicatorilor simpli fac parte:
amplitudinea variaţiei (absolută şi relativă)
abaterile individuale (absolute şi relative).
Amplitudinea absolută (Aa) se calculează ca diferenţă între nivelul maxim (xmax) şi
nivelul minim (xmin) al caracteristicii:
Aa = xmax - xmin
Amplitudinea absolută se exprimă în unităţile de măsură ale variabilei respective şi
prin urmare nu poate fi folosită la compararea a două variabile exprimate în unităţi de măsură
diferite.
Amplitudinea relativă a variaţiei (A%) se exprimă de regulă în procente şi se
calculează ca raport între amplitudinea absolută a variaţiei şi nivelul mediu al caracteristicii:
AA
x
a
% 100
Abaterile individuale absolute (di) se calculează ca diferenţă între fiecare variantă
înregistrată şi media aritmetică a acestora după relaţia:
d x x i ni i 1 2, , ...
Abaterile individuale relative (d%) se calculează raportând abaterile absolute la
nivelul mediu al caracteristicii:
dd
x
x x
xi ni
i i
%, , ...
100 100 1 2
În analiza variaţiei, de multe ori, ne limităm la a calcula abaterile maxime într-un sens
sau altul.
Gradul de variaţie al unei caracteristici depinde însă de toate abaterile variantelor
înregistrate şi de frecvenţa lor de apariţie şi prin urmare indicatorii simpli ai variaţiei nu pot
exprima întreaga variaţie a unei caracteristici înregistrate. Din acest motiv caracterizarea
gradului de variaţie se face de obicei cu ajutorul indicatorilor sintetici ai variaţiei care iau în
consideraţie toate abaterile caracteristicii.
4.2 Indicatorii sintetici ai variaţiei
Indicatorii sintetici ai variaţiei, la fel ca indicatorii tendinţei centrale, trebuie să se
bazeze pe toate observaţiile, să fie uşor de înţeles, uşor de calculat, afectaţi cât mai puţin
posibil de fluctuaţiile de selecţie şi adecvaţi unui studiu algebric.
Indicatorii sintetici ai variaţiei sunt: abaterea medie liniară ( )d , abaterea medie
pătratică ( ) , dispersia ( ) 2 şi coeficientul de variaţie (v).
Abaterea medie liniară ( )d se calculează ca o medie aritmetică simplă sau ponderată
din abaterile termenilor seriei de la media lor, luate în valoare absolută.
Formulele de calcul ale abaterii medii liniare sunt:
pentru o serie simplă:
d
x x
n
i
i
n
1
pentru o serie de frecvenţe absolute:
Capitolul 3 67
d
x x f
f
i
i
k
i
i
i
k
1
1
pentru o serie cu frecvenţe relative, exprimate în procente:
d
x x fi
i
k
i
1
100
*%
pentru o serie cu frecvenţe relative, exprimate sub formă de coeficienţi:
d x x fi
i
k
i
1
*
d se exprimă în unităţile de măsură ale variabilei şi deci nu poate fi folosit la
comparaţii.
Abaterea medie liniară prezintă şi dezavantajul că nu ţine seama de faptul că abaterile
mai mari în valoare absolută influenţează în mai mare măsură gradul de variaţie a unei
caracteristici, în comparaţie cu abaterile mai mici. În plus, din punct de vedere algebric nu
este indicat să se renunţe în mod arbitrar la semnul valorilor din care se calculează o valoare
medie. Din aceste considerente se foloseşte ca principal indicator sintetic al variaţiei abaterea
medie pătratică.
Abaterea medie pătratică sau abaterea standard notată cu ( ) se calculează ca o
medie pătratică din abaterile tuturor variantelor seriei de la media lor aritmetică.
Relaţiile de calcul ale abaterii medii pătratice sunt:
pentru o serie simplă:
( )x x
n
i
i
n2
1
pentru o serie de frecvenţe absolute:
( )x x f
f
i
i
k
i
i
i
k
2
1
1
pentru o serie cu frecvenţe relative, exprimate în procente:
( ) %x x fi
i
k
i
2
1
100
pentru o serie cu frecvenţe relative, exprimate sub formă de coeficienţi:
( ) *x x fi
i
k
i2
1
În literatura de specialitate se apreciază că pentru o serie de distribuţie cu tendinţă
clară de normalitate, abaterea medie liniară este egală cu 4/5 din valoarea abaterii medii
pătratice.
Abaterea medie pătratică este un indicator de bază, care se foloseşte în analiza
variaţiei la estimarea erorilor de selecţie, în calcule de corelaţie.
Serii de distribuţie unidimensionale 68
La fel ca abaterea medie liniară, abaterea medie pătratică se exprimă în unitatea de
măsură a variabilei a cărei variaţie o caracterizează. Prin urmare cei doi indicatori nu se pot
folosi pentru compararea gradului de variaţie a două sau mai multe variabile diferite şi în
aceste situaţii se recurge la un alt indicator de variaţie - coeficientul de variaţie.
Coeficientul de variaţie (v) se calculează ca raport între abaterea medie pătratică şi
nivelul mediu al seriei. De obicei se exprimă sub formă de procente. Formula de calcul a
coeficientului de variaţie este:
vx
100
Coeficientul de variaţie se mai poate calcula şi după relaţia:
vd
x100
Coeficientul de variaţie se exprimă de regulă, în procente, ceea ce înseamnă că el este
de fapt expresia relativă fie a lui d , fie a lui .
Semnficaţie: cu cât nivelul lui v este mai apropiat de zero, cu atât variaţia este mai
slabă, colectivitatea este mai omogenă, media având un grad ridicat de reprezentativitate; cu
cât valoarea sa este mai departe de zero cu atât variaţia este mai intensă, colectivitatea este
mai eterogenă, iar media are un nivel de semnificaţie mai scăzut. Se apreciază că, în cazul
unui coeficient de peste 35-40%, media nu mai este reprezentativă şi datele trebuie să fie
separate în serii componente, pe grupe, în funcţie de variaţia unei alte caracteristici de
grupare. Se poate afirma că acest indicator (coeficientul de variaţie) poate fi folosit ca un test
de verificare în aplicarea metodei grupării.
Deşi indicatorul - coeficientul de variaţie - înlătură dezavantajele prezentate de şi
d şi acest indicator are limitele lui. Astfel, acest coeficient este în mod evident neadecvat în
cazul în care media aritmetică este apropiată de zero.
Deşi în literatura de specialitate coeficientul de variaţie se calculează de cele mai
multe ori prin relaţiile menţionate (media fiind indicatorul care respectă cele mai multe din
condiţiile impuse de Yule), acest indicator se poate calcula şi înlocuind media cu mediana sau
modul.
vd
Mev
Mev
d
Mov
Mo 100 100 100 100; ; ; ;
Un alt indicator sintetic al variaţiei, cu o largă utilizare în analiza statistică a
fenomenelor, este dispersia.
Dispersia unei caracteristici se notează cu ( ) 2 şi se calculează ca o medie
aritmetică simplă sau ponderată a pătratelor abaterilor termenilor faţă de media lor.
Formulele de calcul sunt:
pentru o serie simplă:
2
2
1
( )x x
n
i
i
n
pentru o serie de frecvenţe absolute:
2
2
1
1
( )x x f
f
i
i
k
i
i
i
k
pentru o serie cu frecvenţe relative, exprimate în procente:
Capitolul 3 69
2
2
1
100
( ) %x x fi
i
k
i
pentru o serie cu frecvenţe relative, exprimate sub formă de coeficienţi:
2 2
1
( ) *x x fi
i
k
i
Pentru exemplificarea calculării indicatorilor sintetici de variaţie se va folosi
seria de distribuţie de frecvenţe prezentată în tabelul de mai jos.
Tabelul nr.11 Calculul indicatorilor sintetici de variaţie
Intrep.
după
mărimea
profitului
mii RON
Nr.
intrep.
(fi)
Centrul de
interval
(xi)
x x fi i
( )x x fi i 2
20 - 24 20 22 197,20 1944,392
24 - 28 35 26 205,10 1201,886
28 - 32 40 30 74,40 138,384
32 - 36 60 34 128,40 274,776
36 - 40 32 38 196,48 1206,387
40 - 44 8 42 81,12 822,557
44 - 48 5 46 40,40 999,698
TOTAL 200 953,40
6588,080
f i x x fi i ( )x x fi i
2
Profitul mediu pe întreprindere:
x
x f
f
i i
i
k
i
i
k
1
1
6372
20031 86, mii RON/întreprindere
Abaterea medie liniară:
d
x x f
f
i i
i
k
i
i
k
1
1
953 4
2004 767
,, mii RON profit/întreprindere
Dispersia:
Serii de distribuţie unidimensionale 70
94,32200
08,6588)(
1
2
2
k
i
i
ii
f
fxx
Abaterea medie pătratică:
( )
, ,
x x f
f
i i
i
k
i
i
k
2
1
1
32 94 5 739 mii RON profit/întreprindere
Coeficientul de variaţie:
%01,18100 x
v
Pe baza rezultatelor obţinute se poate afirma că media este reprezentativă pentru seria
din care s-a calculat, deoarece s-a obţinut un coeficient de variaţie (18,01%) iar cele mai
multe valori (60
200100 30%) se concentrează în intervalul 32-36 mii RON.
5. Media şi dispersia caracteristicii alternative
În practica de cercetare statistică a fenomenelor social-economice se întâlnesc
caracteristici ale căror variante nu se exprimă numeric (cantitativ) ci prin cuvinte (calitativ) şi
nu admit decât una sau alta dintre alternative. În cazul în care caracteristica urmărită este
alternativă unităţile colectivităţii se împart în două: o grupă care cuprinde acele unităţi la care
se înregistrează forma directă de manifestare a caracteristicii şi o altă parte a colectivităţii la
care se înregistrează opusul formei de manifestare a caracteristicii. De exemplu: starea unei
piese poate fi bună sau rebut, situaţia unui student după susţinerea unui examen poate fi
promovat sau nepromovat, operaţia unui pacient poate fi reuşită sau nereuşită etc. De
menţionat faptul că orice caracteristică nealternativă se poate transforma într-o caracteristică
alternativă prin raportarea la medie sau la un anumit prag. În acest caz unităţile colectivităţii
se vor separa în două grupe: unităţi cu un nivel de dezvoltare mai mic decât media şi a doua
grupă formată din unităţile cu nivel de dezvoltare mai mare decât media.
Pentru caracterizarea statistică a unor variabile de acest gen este necesară o
cuantificare a valorilor. Considerând răspunsurile respective ca find cele două variante ale
caracteristicii, pentru exprimarea lor cantitativă s-au stabilit următoarele valori convenţionale:
pentru DA; x1 = 1
pentru NU; x2 = 0
Pentru distribuţia prezentată în tabel, media caracteristicii se va calcula aplicând
relaţia mediei aritmetice ponderate, astfel:
1 0
M N M
N N M
M
NP
( )
( )
Se observă că media caracteristicii alternative reprezintă tocmai frecvenţa relativă a
răspunsurilor afirmative.
Capitolul 3 71
Tabelul nr.12 Distribuţia de frecvenţe a caracteristicii alternative
Valoarea
caracteristicii
Răspunsul
înregistrat
Frecvenţe absolute Frecvenţe
relative
0 1 2 3
x1 = 1 DA M (numărul unităţilor care
posedă caracteristica) p
M
N
x2 = 0 NU (N-M)
(numărul de unităţi care nu
posedă caracteristica)
qN M
N1 p
Total N=M+(N-M) p+q = 1
Dispersia caracteristicii alternative se obţine pornind de la relaţia de calcul obişnuit al
dispersiei, în care se folosesc elementele specifice:
p
p p o p q
p q
22 21
( ) ( )
Deoarece p + q = 1, atunci (1 - p) = q şi formula devine:
p
q p p q
p q
p q q p
p qp q p p
p q p p
22 2
1
1
( )( )
( )
deci
saup
2
p
2
Dispersia caracteristicii alternative este egală cu produsul dintre cele două frecvenţe
relative.
Abaterea medie pătratică se determină potrivit metodologiei clasice - ca rădăcină
pătrată din dispersie:
p p q
Aceşti indicatori sunt folosiţi pe scară largă în cercetările selective şi mai ales în
controlul statistic al calităţii produselor.
6. Asimetria
Pentru caracterizarea seriilor de distribuţie unidimensionale şi unimodale un
interes deosebit îl prezintă şi cunoaşterea gradului de oblicitate, de îndepărtare a acestor
distribuţii de la simetrie. În practica statistică acest aspect este cunoscut sub numele de
asimetrie.
La interpretarea gradului de asimetrie se porneşte de la poziţia şi valorile pe care le au
cei trei indicatori ai tendinţei centrale: media, mediana şi modul.
Serii de distribuţie unidimensionale 72
Într-o distribuţie simetrică cei trei indicatori: mod, mediană şi media artimetică se
confundă ca în diagrama (a).
y y
x x M M xo e xMM eo
(a) (b) y
x
oe MMx
( c )
O distribuţie nonsimetrică se mai numeşte şi oblică şi ea poate prezenta asimetrie de
stânga sau de dreapta (vezi diagramele b şi c).
Forma repartiţiei se poate analiza:
a) utilizând metoda grafică;
b) calculând indicatorii de asimetrie adecvaţi.
Asimetria se poate analiza în primul rând cu ajutorul metodei grafice. În acest scop se
folosesc: poligonul frecvenţelor şi histograma. După ce s-a construit poligonul frecvenţelor
interpretarea se face ca mai sus.
Reprezentarea grafică a seriei oferă o imagine sugestivă asupra gradului de asimetrie
fără însă a-l putea măsura printr-o valoare numerică. De aceea, se calculează şi indicatorii de
asimetrie, exprimaţi în mărimi absolute şi relative.
Asimetriea absolută se calculează după relaţia:
As x Mo
Se exprimă în unităţile de măsură ale variabilei şi nu poate fi folosit la comparaţii
între serii.
De aceea, pentru a măsura gradul de asimetrie, recurgem la indicatorii de asimetrie
relativi. Din acest grup reţinem un anumit număr de coeficienţi, adică numere fără
dimensiune, permiţând comparaţiile.
Prezentăm în continuare trei coeficienţi de asimetrie ce poartă numele autorilor lor,
Pearson şi Yule.
Karl Pearson, statistician britanic propune la începutul secolului pentru măsurarea
asimetriei trei coeficienţi:
Capitolul 3 73
cx Mo
C
C
C
as
as
as
as
0
0
0
simetrie
serie oblicã la stânga
serie oblicã la dreapta
Acest coeficient poate lua valori cuprinse între -1 şi
+1; cu cât este mai mic în valoare absolută cu atât asimetria este mai mică.
De reţinut: acest coeficient este recomandabil a se folosi numai pentru distribuţii uşor
asimetrice.
În cazul când se cunoaşte mediana seriei, coeficientul de asimetrie ( )Cas se poate
calcula utilizând relaţia:
Cx Me
as
3( )
Acest coeficient se foloseşte când între cei trei indicatori ai tendinţei centrale se
verifică relaţia:
Modul = Media - 3(Media - Mediană)
Acest coeficient poate să ia valori cuprinse între -3 şi +3 şi va arăta un grad mai mare
de simetrie cu cât se va apropia mai mult de 0.
Pearson mai propune şi un alt coeficient pentru calculul gradului de asimetrie al unei
serii formată dintr-un număr foarte mare de observaţii:
C
x x f
f
x x f
f
as
i i
i
i i
i
3
2
2
3
3
2
2
unde
dispersie
3
2
( )
( )
Se observă că primii doi indicatori propuşi de Pearson (şi cei mai utilizaţi) se bazează
pe relaţia care există între cele trei valori ale tendinţei centrale. Dar, asupra asimetriei
influenţează şi celelalte valori medii de poziţie. Pentru a ţine seama şi de influenţa cuartilelor
se foloseşte coeficientul propus de Yule, calculat după formula:
AsQ Me Me Q
Q Me Me Q
( ) ( )
( ) ( )
3 1
3 1
Serii de distribuţie unidimensionale 74
Dacă:
As
As
As
0
0
0
simetrie
simetrie oblicã la stanga
simetrie oblicã la dreapta
Dacă acest coeficient se apropie de 0,1 se apreciază că seria este moderat asimetrică,
iar peste 0,3 se consideră că seria este pronunţat asimetrică.
Rezumat
În concluzie, indicatorii utilizaţi în statistică sunt extrem de numeroşi şi cu
metodologii variate de calcul sub formă de mărimi relative, mărimi medii, indicatori ai
variaţiei absoluţi, relativi şi medii, indici, indicatori ce caracterizează corelaţia etc. Fiecare
dintre aceşti indicatori exprimă anumite trăsături ale colectivităţii şi numai prin utilizarea
combinată a indicatorilor absoluţi şi derivaţi se ajunge la cunoaşterea multilaterală a
fenomenelor studiate în continua lor dezvoltare.
Termeni importanţi: indicator statistic, forme de exprimare, mărime relativă, mărimi
de structură, mărimi de coordonare, mărimi de dinamică, mărimi de intensitate, media
aritmetică, media armonică, media pătratică, media geometrică, mediana, modulul, cuartilele,
amplitudinea, abateri individuale, abaterea medie liniară, abaterea medie pătratică, dispersia,
coeficientul de variaţie, coeficient de asimetrie
Teste de autocontrol:
1. Definiţi mărimile relative.
2. Ce forme de exprimare cunoaşteţi ?
3. Ce sunt mărimile de structură ? Exemple.
4. Ce sunt mărimile de coordonare ? Exemple.
5. Definiţi indicii de evoluţie.
6. Ce sunt mărimile de intensitate ? Exemple.
7. Ce sunt mărimile medii ?
8. Ce tipuri de medii cunoaşteţi şi când le aplicaţi ?
9. Care este rolul indicatorilor variaţiei ?
10. Enumeraţi şi definiţi indicatorii simpli.
11. Interpretaţi indicatorii sintetici.
12. Ce coeficienţi de asimetrie cunoaşteţi ?
Capitolul 3 75
Probleme propuse
1. La un hotel de patru stele s-au înregistrat datele:
Tarif cazare (euro) Nr. înnoptări Tip
cameră Aprilie 2007 Aprilie 2008 Aprilie 2007 Aprilie 2008
Dublă
Single
Garsonieră
Apartament
80
75
110
140
90
75
115
140
250
110
15
7
237
115
15
5
Se cere:
a. Să se calculeze valoarea tarifului la cursul zilei pentru moneda euro.
b. Să se calculeze şi să se interpreteze mărimile relative permise de date.
c. Să se analizeze evoluţia valorii încasate.
2. Pentru doi agenţi economici ce desfăşoară aceeaşi activitate, se cunosc datele:
Agent
economic
Salariul mediu
în perioada curentă (1)
(RON/pers.)
Nr. angajaţi
în perioada curentă (1)
Dinamica fodului de
salarii (1/0)
%
A 830 42 105
B 976 18 90
Se cere:
a. Salariul mediu, pe total, în perioada curentă.
b. Să se reprezinte grafic structura fondului de salarii din perioada curentă.
c. Să se stabilească ce alte tipuri de mărimi relative se pot calcula pe baza datelor
din enunţ.
3. 200 de turişti dintr-o staţiune balneară au fost distribuiţi după durata sejurului astfel:
Durata sejurului
(zile)
Nr. turişti
Sub 4
4 – 7
7 – 10
10 – 13
13 – 16
16 – 19
15
30
45
60
30
20
Total 200
a. Se cere să se calculeze şi să se interpreteze mediana, cuartilele şi modulul.
b. Se cere să se calculeze şi să se interpreteze indicatorii variaţiei şi să se
precizeze dacă media este semnificativă.
Serii de distribuţie bidimensionale 76
Capitolul 4
Tema Serii de distribuţie bidimensionale
Obiectivele 1. Analiza dispersională
2. Analiza ANOVA (testul Fisher - Snedecor)
3. Tesul χ2
Mijloace
- citire/învăţare
- întrebări, probleme ce apar, explicaţii
- definiţii, explicaţii ce trebuie reţinute
- situaţii economice concrete, supuse analizei, exemple (sub
lupă)
- teme de casă, aplicaţii practice pentru studenţi
Finalitatea 1. descompunerea pe factori de influenţă aplicând analiza dispersională
2. analiza influenţei factorilor – testul Fisher
3. testarea dependenţei sau independenţei variabilelor categoriale
Evaluarea - parcurgerea aplicaţiilor propuse
Timp de lucru
necesar
1. Pentru cunoaşterea problemei: 8 ore
2. Pentru rezolvarea temelor: 12 ore + timpul de documentare
Capitolul 4 77
Serii de distribuţie bidimensionale
1. Analiza dispersională
O colectivitate statistică poate fi distribuită după două variabile ce se află într-
o relaţie de cauzalitate. Prin calculând indicatorilor de variaţie corespunzători putem preciza
dacă factorul de grupare (X) este un factor hotărâtor (determinant) pentru variaţia factorului
Y.
În cazul în care s-a aplicat în prealabil metoda grupării se pot calcula atât medii cât şi
indicatori de variaţie (dispersii) pe grupe şi pe total colectivitate. Media şi dispersia pe
întreaga colectivitate se pot calcula fie făcând abstracţie de faptul că ea este compusă din mai
multe grupe, fie luând în calcul indicatorii corespunzători calculaţi la nivelul grupelor.
Aşadar, între indicatorii de variaţie calculaţi la nivelul fiecărei grupe şi cei pe întreaga
colectivitate există anumite relaţii bazate pe regula adunării dispersiilor.
Presupunând că s-au înregistrat datele pentru două caracteristici x i şi yi şi unităţile au
fost împărţite în funcţie de caracteristica x în r grupe, s-au obţinut distribuţiile condiţionate de
factorul de grupare din tabelul 1.
Se observă că frecvenţele pe fiecare grupă se obţin prin însumarea frecvenţelor din
interiorul grupelor, adică:
f n f n f nj
j
m
ij
j
m
i rj
j
m
r1
1
1
1 1
;... ;... ;
Cele două variabile prezentate în tabel se află într-o relaţie de cauzalitate şi calculând
indicatorii de variaţie corespunzători putem preciza dacă factorul de grupare (X) este un factor
hotărâtor (determinant) pentru variaţia factorului Y. De exemplu, putem analiza prin regula
de adunare a dispersiilor, în ce proporţie numărul salariaţilor influenţează variaţia cifrei de
afaceri pentru un anumit număr de agenţi economici sau în ce măsură volumul desfacerilor
influenţează salariul încasat de un anumit număr de vânzători.
Concret, pe baza unor date prezentate în tabel se pot calcula următorii indicatori
statistici:
medii (pe fiecare grupă şi pe total);
dispersii (pe fiecare grupă şi pe total).
Mediile de grupă se notează cu şi se calculează după relaţia:
ri
f
fy
ym
j
ij
m
j
ijj
i ,1
1
1
Serii de distribuţie bidimensionale 78
Distribuţiile condiţionate ale variabilei Y în funcţie de un factor de grupare
Tabelul nr. 1
Valorile
caracte-
risticii de
grupare
X
Numărul unităţilor pe variantele caracteristicii Y
Volumul
grupelor
ni
Medii pe
grupe
(medii
condiţi-
onate)
y1 y2… yj… ym
x1 f11 f12… f1j… f1m n1 ( )y1
x2 f21 f22… f2j… f2m n2 ( )y2
... ... ... ... ... ... ...
xi fi1 fi2… fij… fim ni ( )yi
... ... ... ... ... ... ...
xr fr1 fr2… frj… frm nr ( )yr
Total f1 f2.. fj… fm n fi
i
r
j
j
m
1 1
y
Numărul mediilor de grupă este egal cu numărul grupelor în care s-a separat
colectivitatea (r grupe).
Media pe total (notată cu y0 când datele provin dintr-o observare totală sau y când
datele provin dintr-o observare parţială) sintetizează atât variaţia valorilor individuale ale
colectivităţii totale cât şi valorile mediilor de grupă (medii condiţionate de factorul de
grupare). Prin urmare ea se poate calcula în funcţie de datele de care dispunem după una din
relaţiile:
y
y f
f
sau y
y n
n
j j
j
m
j
j
m
i i
i
r
i
i
r
1
1
1
1
Corespunzător pentru caracteristica yj se pot calcula indicatori care să caracterizeze:
o variaţia valorilor (yj) în jurul mediei lor de grupă ( )y yj i ;
o variaţia valorilor mediilor de grupă în jurul mediei colectivităţii totale
( )y yi ;
o variaţia valorilor (yj) în jurul mediei colectivităţii totale ( )y yj .
La nivelul fiecărei unităţi observate, variaţia totală ( )y yj se poate descompune în
variaţia faţă de media de grupă ( )y yj i plus variaţia mediei de grupă de la media
colectivităţii totale ( )y yj , adică:
( )y yj = ( )y yj i + ( )y yi
Se consideră că variaţia valorilor individuale din fiecare grupă în jurul mediei lor va
măsura gradul de influenţă a factorilor variabili (neînregistraţi, întâmplători) prezenţi în
interiorul grupei deoarece la nivelul grupei, valoarea caracteristicii de grupare este considerată
constantă. În schimb, variaţia mediilor de grupă faţă de media colectivităţii totale este
interpretată ca fiind rezultatul factorului de grupare, deoarece în acest caz factorii variabili din
interiorul grupei s-au păstrat la un nivel constant.
Capitolul 4 79
Pentru determinarea separată atât la nivelul fiecărei grupe, cât şi la nivelul
colectivităţii generale, a intensităţii cu care au influenţat asupra variabilităţii caracteristicii
dependente cele două grupe de factori (întâmplători şi esenţiali), se folosesc următoarele tipuri
de dispersii:
dispersia de grupă ( ) i
2 ;
media dispersiilor de grupă ( )
dispersia dintre grupe ;
dispersia totală ( ) 0
2 .
Dispersia de grupă sau dispersia parţială se calculează pe baza abaterilor tuturor
variantelor dintr-o grupă faţă de media lor, ponderate cu frecvenţele de grupă pe baza relaţiei:
m
j
ij
m
j
ijij
i
f
fyy
1
1
2
2
)(
unde:
yj reprezintă variantele caracteristicii dependente;
yi media de grupă, calculată din aceste variante;
fij frecvenţele corespunzătoare fiecărei variante (interval de valori) din
cadrul grupei.
Dispersia de grupă evidenţiază variaţia caracteristicii dependente (yj) determinată de
acţiunea factorilor întâmplători care acţionează la nivelul grupei respective.
Numărul dispersiilor de grupă este egal cu numărul grupelor ce formează
colectivitatea supusă studiului.
Comparând între ele dispersiile de grupă putem preciza care grupă este mai omogenă.
Astfel, dispersia cu nivelul cel mai scăzut evidenţiază gradul înalt de omogenitate al grupei,
acţiunea redusă a factorilor neânregistraţi (întâmplători) şi deci o variaţie mai slabă; dispersia
cu nivelul cel mai mare reflectă o variaţie pronunţată sub acţiunea intensă a factorilor
întâmplători.
Pentru a sintetiza această variaţie într-un singur indicator calculat pe întreaga
colectivitate se calculează media dispersiilor de grupă.
Media dispersiilor de grupă se calculează ca o medie aritmetică a
dispersiilor parţiale.
Dacă grupele sunt egale ca volum se foloseşte media aritmetică simplă, dacă volumul
diferă de la o grupă la alta se calculează ca o medie aritmetică ponderată utilizând relaţiile:
2
2
1
i
i
r
r sau
2
2
1
1
i
i
r
i
i
i
r
n
n
unde:
i
2 - dispersii de grupă;
ni - volumul grupelor.
Dispersia dintre grupe , se calculează pe baza abaterilor mediilor de
grupă de la media colectivităţii totale şi măsoară gradul de influenţă a factorilor de grupare
asupra variaţiei caracteristicii studiate. Dispersia dintre grupe se calculează după relaţia:
Serii de distribuţie bidimensionale 80
yx
i i
i
r
i
i
r
y y n
n
2 2
2
1
1
( )
Dispersia totală ( ) 0
2 2 y se calculează ca o medie aritmetică ponderată a
pătratului abaterilor fiecărei variante de la media totală, folosind relaţia:
0
2 2
2
1
1
y
j j
j
m
j
j
m
y y f
f
( )
Dispersia totală reflectă variaţia caracteristicii dependente generată de acţiunea
conjugată a celor două grupe de factori - întâmplători şi esenţiali - la nivelul întregii
colectivităţi.
Pornind de la conţinutul dispersiilor prezentate dispersia totală mai poate fi calculată
pe baza relaţiei:
( ) 0
2 2 2 yx
yr
Această relaţie este cunoscută în literatura de specialitate sub denumirea de “regula
adunării dispersilor”.
Coeficientul de determinaţie ( )Ryx
2 se calculează ca raport între dispersia dintre
grupe şi dispersia totală după relaţia:
Ryx
yx2
2
0
2100
Dacă ( )Ryx
2 > 50% admitem că factorul de grupare este hotărâtor (semnificativ
determinant) pentru variaţia factorului determinant (yj).
În mod analog se determină coeficientul de nedeterminaţie după relaţia:
K yx
yr2
2
0
2100
Acest coeficient arată câte procente din variaţia factorului yj este rezultatul acţiunii
tuturor factorilor întâmplători (toţi ceilalţi cu excepţia factorului de grupare).
Menţionăm că în cazul seriilor statistice formate pe baza frecvenţelor relative, în
formulele de calcul ale dispersiilor prezentate se vor înlocui frecvenţele absolute cu
frecvenţele relative corespunzătoare. În acest caz este necesar să se cunoască atât structura
seriilor componente cât şi structura pe grupe a colectivităţii totale.
Vom ilustra modul de calcul şi semnificaţia acestor dispersii pe exemplul
distribuţiei bidimensionale prezentate în tabelul 2.
Capitolul 4 81
Repartiţia agenţilor economici din sectorul de activitate A
după numărul mediu de salariaţi şi profitul obţinut
Tabelul nr. 2
Agenţi
economici
după
numărul
mediu de
salariaţi
Agenţi economici după mărimea profitului
(mii RON)
Total
12 - 16 16 - 20 20 - 24 24 şi peste
sub 10 5 15 5 - 25
10 - 50 - 10 10 - 20
50 şi peste - - - 5 5
Total 5 25 15 5 50
Calculul dispersiilor este precedat de calculul mediilor:
mediile de grupă:
y
y f
fi
j ij
j
m
ij
j
m
1
1
y1
14 5 18 15 22 5
2518
mii RON /agent economic
y2
18 10 22 10
2020
mii RON/agent economic
y3
26 5
526
mii RON/agent economic
media totală:
economic/agentRON mii6,1950
52620202518
:sau
economic/agentRON mii6,1950
52615222518514
1
1
1
1
r
i
i
r
i
ii
m
j
j
m
j
jj
n
ny
y
f
fy
y
Dispersiile de grupă:
Serii de distribuţie bidimensionale 82
1
22 2 2
2
22 2
1
22
14 18 5 18 18 15 22 18 5
256 4
18 20 10 22 20 10
204
26 26 5
50
( ) ( ) ( ),
( ) ( )
( )
Media dispersiilor de grupă:
2
2
1
1
6 4 25 4 20 0 5
504 8
i
i
r
i
i
i
r
n
n
,,
Dispersia între grupe:
yx
i i
i
r
i
i
r
y y n
n
2
2
2
2
1
1
2 2 218 19 6 25 20 19 6 20 26 19 6 5
50
5 44
( )( , ) ( , ) ( , )
,
Din comparaţia celor două tipuri de dispersii ( ) 2 2si rezultă că la nivelul
sectorului de activitate intensitatea variaţiei cifrei de afaceri generată de acţiunea factorului de
grupare “număr de salariaţi” a fost mai mare decât cea generată de acţiunea celorlalţi factori
neînregistraţi.
Dispersia totală ( ) 0
2
0
22 2 2 2
0
2 2 2
14 19 6 5 18 19 6 25 22 19 6 15 26 19 6 5
5010 24
10 24 4 8 5 44
10 24 10 24
( , ) ( , ) ( , ) ( , ),
, , ,
, ,
Coeficientul de determinaţie Ryx
yx2
2
0
2100
5 44
10 24100 53 125% 50%
,
,,
evidenţiază că cea mai mare parte a variaţiei cifrei de afaceri (53,125%) este rezultatul
creşterii numărului mediu al salariaţilor, restul de 46,875% fiind rezultatul acţiunii simultane
a factorilor neluaţi în calcul.
Capitolul 4 83
2. Analiza ANOVA (testul Fisher - Snedecor)
Analiza dispersională poate fi realizată şi cu ajutorul testului Fisher, analiză
ANOVA, test ce pleacă de la ipotezele:
H0 : ryyy ...
21 (medii de grupă egale)
H1 : medii diferite
Pentru a se verifica dacă factorul de grupare are o influenţă semnificativă asupra
variabilei dependente se calculează indicatorii prezentaţi în tabelul 3.
Gradele de libertate reprezintă numărul total de valori independente minus relaţiile
care le leagă. Fie valorile x1, x2, …, xn, spunem că statistica 1
)(1
2
2
n
xx
S
n
i
i
este un
estimator nedeplasat al dispersiei cu n-1 grade de libertate. Valorile x1, x2, …, xn au intrat în
relaţia de calcul a mediei n
x
x
n
i
i 1 .
Tabelul nr. 3 ANOVA
Indicatori Formule de calcul Grade
de
liberta
te
Estimarea
dispersiilor
Criteriul F
Varianţa
sistematică
r
i
ii nyyS1
2
0 )(1
r-1
1
12
1
r
Ss
2
2
2
1
s
sFcalc
Varianţa
reziduală ij
r
i
m
j
ij fyyS 1 1
2)(2
n-r
rn
Ss
22
2
Varianţa
totală
21 SSS n-1
Valoarea Fcalc se compară cu valoarea teoretică Ft extrasă din tabel pentru nivelul de
semnificaţie ales şi (r-1) respectiv (n-r) grade de libertate. Regula de decizie este
următoarea:
dacă tcalc FF se admite ipoteza H0
dacă tcalc FF se respinge H0 şi admite H1, factorul de grupare este
semnificativ.
Serii de distribuţie bidimensionale 84
P( tcalc FF ) α
H0 Ft H1
Figura1. Distribuţia teoretică
Pentru exemplificare vom folosi datele din tabelul 2. Pentru nivelul de
semnificaţie = 0,05 ne propunem să verificăm dacă factorul de grupare este semnificativ,
altfel spus dacă numărul angajaţilor influenţează variaţia profitului.
Tabelul nr. 4
Agenţi
economici după nr.
mediu de salariaţi
Total
Profitul mediu pe
grupe de agenţi
economici
RON/ag.ec.
sub 10 25 18
10 - 50 20 20
peste 50 5 26
Total 50 19,6
Varianţa sistematică S1:
2725)6,1926(20)6,1920(25)6,1918(1 222 S
Varianţa reziduală S2:
2405)2626(10)2022(10)2018(
5)1822(15)1818(5)1814(2
222
222
S
Estimarea dispersiilor:
13613
2722
1
s şi 10,5350
2402
2
s
Criteriul F:
633,2610,5
136calcF
Valoarea calculată pentru criteriul calcF este 26,63 iar 05,0;47;2t
F este 3,23.
Capitolul 4 85
calcF > 05,0;47;2t
F ceea ce ne îndreptăţeşte să respingem ipoteza H0 şi acceptăm H1,
factorul de grupare, numărul angajaţilor, este semnificativ pentru variaţia profitului.
Coeficientul de determinaţie %50%125,53100512
272100
21
12
SS
SR
xy
evidenţiază că cea mai mare parte a variaţiei cifrei de afaceri (53,125%) este rezultatul
creşterii numărului mediu al salariaţilor, restul de 46,875% fiind rezultatul acţiunii simultane
a factorilor neluaţi în calcul.
3. Tesul χ2
Pentru a studia legătura dintre variabile, adesea se impune realizarea unei
distribuţii bidimensionale. În astfel de legături se lucrează cu o variabilă efect sau dependentă
y şi o variabilă cauză sau independentă x. Cele două variabile pot fi numerice (cantitative) sau
nenumerice (calitative), iar acestea la rândul lor pot fi nominale sau ordinale.
Atunci când dorim să analizăm distribuţia simultană a indivizilor statistici după două
sau mai multe caracteristici calitative, vorbim despre asociere, ceea ce înseamnă cum se
asociază, în cazul a două caracteristici, anumite stări ale unei caracteristici cu anumite stări ale
celeilalte. Baza acestei analize o constituie tabelul de asociere sau de contingenţă.
Problematica asocierii presupune efectuarea unor analize bivariate sau multivariate.
Presupunând că s-au înregistrat datele pentru două caracteristici x i şi yi şi unităţile au
fost împărţite în funcţie de caracteristica x în p grupe, s-au obţinut distribuţiile condiţionate de
factorul de grupare.
Cele două variabile prezentate în tabel se află într-o relaţie de cauzalitate şi calculând
indicatorii de variaţie corespunzători putem preciza dacă factorul de grupare x este un factor
hotărâtor (determinant) pentru variaţia factorului y.
Tabelul nr. 5 Tabel de contingenţă
Numărul unităţilor pe variantele caracteristicii Y
Volumul
grupelor
Valorile
caracteristicii de
grupare
X
y1 … yj … yq
x1 n11 ... n1j ... n1q n1.
... ... ... ... ... ...
xi ni1 ... nij ... niq ni.
... ... ... ... ... ...
xp np1 np2 npj npq np.
Total n.1 n.2 n.j n.q n
Serii de distribuţie bidimensionale 86
Frecvenţele nij reprezintă numărul unităţilor statistice purtătoare ale valorilor (X i,Yj).
Frecvenţele ni. reprezintă distribuţia marginală pentru caracteristica x:
;;...;... .
1
.
1
.1
1
1 p
q
j
pji
q
j
ij
q
j
j nnnnnn
Frecvenţele n.j reprezintă distribuţia marginală pentru caracteristica y:
;;...;... .
1
.
1
1.
1
1 q
p
i
iqj
p
i
ij
p
i
i nnnnnn
Cu ajutorul testului 2 se poate analiza dacă două variabile sunt dependente sau
independente, garantând rezultatele cu o probabilitate dinainte stabilită. Pentru a verifica acest
lucru pornim de la ipotezele:
H0: variabile independente – ipoteza nulă, cu alternativa
H1: variabile dependente.
Două variabile sunt independente dacă sunt îndeplinite condiţiile:
)()/()()/( 111111 yYPxXyYPşixXPyYxXP
Testul se poate aplica atât în cazul variabilelor dihotomice cât şi în cazul variabilelor
calitative cu mai multe modalităţi. Revenind la distribuţia din tabelul 5, condiţiile de
independenţă se rezumă la egalitatea rapoartelor:
n
n
n
nsau
n
n
n
n j
i
iji
j
ij .
.
.
.
Din aceste condiţii de independenţă se determină distribuţia teoretică (Expected) ijnt
astfel:
n
nnnt
ij
ij
..
Pentru a verifica dacă cele două variabile sunt independente se calculează mărimea 2
calc cu formula:
p
i
q
j ij
ijij
calcnt
ntn
1 1
2
2)(
Valoarea 2
calc se compară cu valoarea teoretică 2
t , extrasă din tabelul funcţiei
2 , pentru nivelul de semnificaţie ales şi )1()1( qp grade de libertate.
Dacă valoarea 2
calc 2
t , atunci, se respinge ipoteza H0 şi se admite alternativa ei H1,
variabilele sunt dependente.
Capitolul 4 87
P( tcalc22 ) α
H0 2
t H1
Figura 2. Distribuţia teoretică
Pentru a realiza o distribuţie bidimensională s-a luat în considerare un eşantion
format din 150 de persoane ce au răspuns unor întrebări dintr-un chestionar, printre care: dacă
au văzut reclama la un produs nou lansat pe piaţă şi dacă au cumpărat produsul respectiv.
Cu o probabilitate de 0,95 pentru care χ2
t = 3,84 să se verifice dacă cele două variabile
sunt independente.
Distribuţia persoanelor după răspunsurile la cele două întrebări.
Tabelul nr. 6
Aţi cumpărat produsul X ? Aţi văzut reclama la
produsul X ? Da Nu Total
Da 65 15 80
Nu 20 50 70
Total 85 65 150
Se calculează distribuţia teoretică astfel:
3,4585150
8011 n 7,3465
150
8012 n
7,3985150
7021 n 3,3065
150
7022 n
191,423,30
)3,3050(
7,39
)7,3920(
7,34
)7,3415(
3,45
)3,4565( 22222
calc
Valoarea 2
calc 2
t , se respinge ipoteza H0 şi se admite alternativa ei H1, variabilele
sunt dependente.
Serii de distribuţie bidimensionale 88
Rezumat
Colectivităţile cu care operăm în statistica social-economică deşi au un caracter finit
sunt formate de cele mai multe ori dintr-un număr foarte mare de unităţi purtătoare a unor
variabile cu un grad mare de variaţie. Din această cauză unităţile la care s-a făcut observarea
trebuie împărţite în grupe, în funcţie de variaţia factorilor determinanţi.
În cazul în care s-a aplicat în prealabil metoda grupării se pot calcula atât medii cât şi
indicatori de variaţie (dispersii) pe grupe şi pe total colectivitate. Media şi dispersia pe
întreaga colectivitate se pot calcula fie făcând abstracţie de faptul că ea este compusă din mai
multe grupe, fie luând în calcul indicatorii corespunzători calculaţi la nivelul grupelor.
Aşadar, între indicatorii de variaţie calculaţi la nivelul fiecărei grupe şi cei pe întreaga
colectivitate există anumite relaţii ce pot fi studiate aplicând regula adunării dispersiilor,
analiza ANOVA, testul χ2.
Termeni importanţi: media, dispersia, coeficientul de determinaţie, varianţa
sistematică, varianţa reziduală, testul de independenţă.
Teste de autocontrol:
1. Care este rolul analizei dispersionale ?
2. Explicaţi ce măsoară fiecare dispersie în parte.
3. Care este rolul analizei ANOVA ?
4. Explicaţi ce măsoară fiecare varianţă în parte.
5. Care este rolul testului χ2 ?
6. Ce înseamnă distribuţia teoretică ?
Probleme propuse
1. Angajaţii unor unităţi hoteliere au fost distribuiţi după categoria hotelului şi salar
astfel:
Grupe după salarii
( RON)
Hotelul * Hotelul **
Sub 550
550-570
570-590
590-610
610-630
630-650
650-670
670 şi peste
10
12
25
28
15
10
-
-
-
-
20
35
20
15
10
-
100% 100%
Ştiind că volumul colectivităţii este 50 angajaţi, din care 20 la Hotel * şi 30 la Hotel **
se cere:
a. Gradul de omogenitate pe hoteluri după caracteristica salar.
Capitolul 4 89
b. Aplicând regula de adunare a dispersiilor să se precizeze în ce proporţie categoria
hotelului influenţează salariile angajaţilor.
c. Ştiind că Ft = 3,23 se cere să se precizeze în ce proporţie categoria hotelului
influenţează salariile angajaţilor aplicând analiza ANOVA.
2. Distribuţia unităţilor comerciale după suprafaţa comercială şi valoarea încasărilor
este:
Grupe de unit.
după supraf.
Valoarea încasărilor (mii RON)
15-25
25-35
35-45
45-55
mari
mijlocii
mici
-
-
4
-
10
5
7
9
-
9
6
-
a. Să se analizeze omogenitatea seriei de distribuţie corespunzătoare
caracteristicii valoarea încasărilor.
b. Să se calculeze indicatorii variaţiei pentru distribuţia bidimensională
interpretând acţiunea factorilor.
c. să se reprezinte diagrama circulară pentru caracteristica suprafaţa comercială.
3. Despre 400 de salariaţi se cunosc datele:
Subgrupe după salarii (RON)
Total
Grupe după
vechime (ani) 500 - 600 600 - 700 peste 700
sub 5 - 25% 75% 100%
5 - 10 15% 50% 35% 100%
peste 10 90% 10% - 100%
- grupa sub 5 ani deţine o pondere de 25% din total;
- grupa 5 – 10 ani deţine o pondere de 40% din total;
- grupa peste 10 ani deţine o pondere de 35% din total.
Se cere:
a. Aplicând regula de adunare a dispersiilor, să se analizeze acţiunea factorilor
asupra salariilor.
b. Pentru caracteristica vechime în muncă să se determine modulul şi coeficientul
de asimetrie .
4. 150 de personae au fost distribuite după răspunsurile la întrebările unui chestionar
astfel:
Serii de distribuţie bidimensionale 90
Veţi cumpăra produsul X ? Aţi văzut reclama la
produsul X ? Da Nu Nu ştiu Total
Da 47 10 23 80
Nu 18 32 20 70
Total 65 42 43 150
Cu o probabilitate de 0,95 şi 1 grad de libertate pentru care χ2
t = 3,84 să se verifice
dacă cele două variabile sunt independente.
5. Distribuţia turiştilor străini după vârstă şi frecvenţa de vizitare a Braşovului rezultată
dintr-o cercetare pe bază de sondaj a fost:
Vârsta (ani) Frecvenţa de
vizitare a
Braşovului sub 25 26-35 36-45 46-55 56-65 peste 66
Prima oară 7 8 6 7 6 6
A doua oară 5 7 6 6 5 5
A treia oară 8 8 9 10 6 6
A patra oară şi
peste
6 7 8 9 6 5
a. Formulaţi ipotezele statistice.
b. Cu o probabilitate de 0,95 şi 15 grade de libertate pentru care χ2
t,15 = 25 să se
verifice dacă frecvenţa de vizitare a Braşovului depinde de vârstă..
6. Un sondaj de piaţă asupra unui eşantion de 2000 persoane, a stabilit că produsul
alimentar X a pătruns în consumul populaţiei după cum urmează:
Grupe de vârstă
Forma de
consum sub 20 ani
20-35
36-50
peste 50
consum curent
consum ocaz.
215
183
293
192
347
231
265
274
Folosind testul χ2, să se stabilească existenţa sau nonexistenţa legăturii dintre cele
două variabile. Pentru nivelul de semnificaţie α=0,10 şi 3 grade de libertate χ2t = 6,25.
Capitolul 5 91
Capitolul 5
Tema Regresie şi corelaţie
Obiectivele 1. Tipuri de legături între fenomenele social-economice
2. Regresia şi corelaţia liniară
2.1 Calculul coeficienţilor de regresie
2.2 Măsurarea intensităţii corelaţiei
2.3 Semnificaţia estimaţiilor. Intervale de încredere
2.4 Analiza reziduurilor
3. Regresia neliniară
3.1 Tipuri de legături neliniare
3.2 Raportul de corelaţie neliniară
4. Regresia multiplă
5. Metode neparametrice de măsurare a legăturilor dintre fenomene
5.1 Tabelul de asociere şi coeficientul de asociere
5.2 Coeficienţii de corelaţie a rangurilor
Mijloace
- citire/învăţare
- întrebări, probleme ce apar, explicaţii
- definiţii, explicaţii ce trebuie reţinute
- situaţii economice concrete, supuse analizei, exemple (sub
lupă)
- teme de casă, aplicaţii practice pentru studenţi
Finalitatea 1. estimarea coeficienţilor modelelor de regresie
2. interpretarea semnificaţiei modelului ales
3. efectuarea de comparaţii între modele
Evaluarea - parcurgerea aplicaţiilor propuse
Timp de lucru
necesar
1. Pentru cunoaşterea problemei: 6 ore
2. Pentru rezolvarea temelor: 12 ore + timpul de documentare
Regresie şi corelaţie 92
Regresie şi corelaţie
1. Tipuri de legături între fenomenele social-economice
Formele de manifestare ale relaţiilor de interdependenţă sunt extrem de
variate şi adesea destul de greu de sesizat. Pentru a le studia este necesar să fie clasificate în
funcţie de unele criterii, după care se pot deosebi unele de altele.
După natura relaţiei de cauzalitate legăturile dintre fenomene pot fi:
- legături funcţionale, realizate direct între un fenomen - cauză şi un fenomen -
efect. Fenomenul efect depinde de o singură cauză, care poate fi identificată de
câte ori se produce. Rezultă că dacă condiţiile rămân constante, atunci unei valori a
caracteristicii factoriale îi corespunde o singură valoare a caracteristicii rezultative.
Ele se mai numesc şi legături de tip determinist. Relaţia matematică dintre
fenomenul - efect şi fenomenul - cauză, pentru legăturile de tip funcţional este:
y f xi i ( ) ;
- legăturil statistice (stochastice) sunt cele în care fenomenul - efect este rezultatul
combinării influenţei mai multor cauze, care pot acţiona în condiţii egale sau în
condiţii diferite. În această relaţie de multicauzalitate unii factori au caracter
esenţial, alţii întâmplător. Cu cât relaţiile de cauzalitate sunt mai numeroase, cu
atât gradul de variabilitate al fenomenului - efect este mai mare. În astfel de cazuri,
la fiecare valoare a caracteristicii factoriale îi poate corespunde o distribuţie de
valori a caracteristicii rezultative. Relaţia matematică ce exprimă o legătură de tip
stochastic (statistic) este: y f x x xi n ( , ,..., )1 2 în care x x xn1 2, ,..., sunt
caracteristicile - factori care au fost înregistrate şi determină variaţia caracteristicii
rezultative y. Specific legăturilor statistice este faptul că în variaţia unei
caracteristici rezultative există întotdeauna şi o componentă aleatoare, care
apare ca rezultat al interacţiunii dintre factorii esenţiali şi cei întâmplători şi care
poate fi inclusă între cei n factori sau poate fi explicitată în afara lor.
După numărul caracteristicilor - factori luate în studiu, legăturile statistice pot fi:
- legături simple - sunt acelea în care caracteristica rezultativă se studiază numai în
funcţie de o singură caracteristică independentă considerată principală şi variabilă,
iar celelalte caracteristici - factoriale, chiar dacă au fost identificate şi înregistrate,
se consideră cu acţiune constantă în toate cazurile individuale înregistrate.
- legături multiple - presupun să se studieze dependenţa unei caracteristici
rezultative în funcţie de mai mulţi factori înregistraţi. Interpretarea statistică a
legăturilor multiple implică şi analiza legăturilor simple dintre toate caracteristicile
înregistrate pentru calculul corelaţiei multiple.
După conţinutul caracteristicilor incluse în analiza de corelaţie , legăturile pot fi:
- asocierea statistică - exprimă relaţia de interdependenţă dintre două sau mai multe
caracteristici exprimate calitativ sau între o caracteristică calitativă şi una
Capitolul 5 93
numerică. De exemplu, între aptitudini şi profesia aleasă există o legătură de tip
stochastic, sau între gradul de îndemânare şi productivitatea muncii.
- corelaţia statistică - exprimă relaţia de interdependenţă dintre două sau mai multe
caracteristici exprimate numeric şi se poate măsura prin indicatori statistici de
corelaţie.
După direcţia în care se produc, legăturile pot fi:
- directe sau în acelaşi sens se produc atunci când, pe măsură ce se modifică nivelul
de dezvoltare al caracteristicii factoriale, se modifică în acelaşi sens şi nivelul
caracteristicii rezultative.
- inverse sunt acelea în care, pe măsură ce se modifică nivelul de dezvoltare al
caracteristicii factoriale, se modifică în sens contrar nivelul caracteristicii
rezultative.
După forma legăturii, ele pot fi:
- rectiliniare, exprimate prin ecuaţia funcţiei liniei drepte
- curbiliniare, exprimate prin ecuaţia unei funcţii exponenţiale, parabolice,
hiperbolice etc.
După timpul în care se realizează, legăturile statistice pot fi: concomitente
(sincrone) şi cu decalaj (asincrone).
Problemele care trebuie rezolvate în aplicarea metodelor de analiză a corelaţiilor
statistice pot fi sintetizate astfel:
identificarea şi ierarhizarea factorilor care determină în mod obiectiv
variaţia caracteristicii rezultative;
verificarea gradului de cuprindere a unităţilor înregistrate. Dacă
unităţile observate provin dintr-o cercetare parţială de tip selectiv
trebuie ca la interpretarea rezultatelor să se ţină seama de principiile
teoriei probabilităţilor;
sistematizarea datelor observate, astfel încât să nu se modifice gradul şi
forma de variaţie a caracteristicilor la care se aplică metoda corelaţiei;
verificarea existenţei şi formei de legătură dintre caracteristicile
corelate, în vederea alegerii corecte a procedeelor statistice -
matematice de măsurare a dependenţei statistice;
calcularea adecvată a indicatorilor de corelaţie în funcţie de forma de
legătură şi de natura informaţiei de care se dispune;
aplicarea testelor de semnificaţie a indicatorilor de corelaţie pentru
cazul în care ei provin dintr-un sondaj statistic.
2. Regresia şi corelaţia liniară simplă
Pentru a evidenţia legea care se manifestă în fiecare legătură în parte, pentru a
măsura statistic tendinţa sa de manifestare se folosesc ecuaţiile de estimare corespunzătoare
unei funcţii analitice care exprimă forma de legătură dintre caracteristica factorială şi cea
rezultativă. Această funcţie este cunoscută sub denumirea de funcţie de regresie, iar
reprezentarea ei grafică se face prin linia (curba) de regresie.
Regresie şi corelaţie 94
2.1 Calculul coeficienţilor de regresie
În cazul dependenţei liniare, funcţia de regresie este o dreaptă de forma:
xY
Necunoscând parametrii teoretici şi , vom căuta estimaţiile lor a şi b. Dreapta de
regresie estimatoare este:
bxay ˆ
Ecuaţia de regresie y se notează, de obicei ca medie, deoarece mărimea sa exprimă
tendinţa de realizare a corelaţiei dintre cele două variabile x şi y. Dacă, într-adevăr, legătura
este liniară şi factorul este determinant, atunci valorile ecuaţiilor de regresie, calculate pentru
toate unităţile observate pe baza valorii individuale ale variabilei x, trebuie să prezinte abateri
minime faţă de valorile empirice. Pentru măsurarea tendinţei de realizare a legăturii, în ecuaţia
mediei de regresie liniară cei doi parametri au şi ei conţinut de valori medii şi trebuie să fie
reprezentativi pentru cele mai multe din unităţile observate.
Parametrul a are caracter de mărime medie, în sensul că valoarea sa arată la ce nivel
ar fi ajuns valoarea caracteristicii y dacă toţi factorii - mai puţin cel înregistrat - ar fi avut o
acţiune constantă asupra formării ei. În acest caz valorile individuale ale caracteristicii
rezultative ar fi fost egale între ele şi, deci, egale cu media lor.
Parametrul b se mai numeşte şi coeficient de regresie şi exprimă, în sens geometric,
panta liniei drepte. Coeficientul de regresie b arată care este gradul de influenţă a
caracteristicii aleasă drept caracteristică factorială x şi măsoară cu cât se schimbă în medie
variabila y în cazul în care variabila x creşte cu o unitate. Coeficientul de regresie arată nu
numai gradul de influenţă a factorului x asupra variabilei y, ci şi sensul în care se realizează
legătura.
În cazul în care :
- b > 0, atunci legătura de corelaţie este directă, deoarece pe măsură ce cresc
valorile lui x, cresc şi valorile ecuaţiei de regresie calculate.
- b < 0, legătura este de sens invers, adică pe măsură ce creşte valoarea
caracteristicii - factor, scade valoarea caracteristicii rezultative.
- b = 0, cele două variabile sunt independente între ele şi atunci ay ˆ .
Aceasta înseamnă că variabila y nu este în funcţie de variabila x, care s-a
considerat ca factor de influenţă, ci variaţia ei depinde de ceilalţi factori,
care s-au considerat ca fiind cu acţiune constantă pentru toate unităţile
colectivităţii, dar în realitate avem o acţiune determinantă.
Pentru a determina ecuaţia medie de regresie, şi cu ajutorul ei, valorile ecuaţiei
individuale de regresie corespunzătoare tuturor valorilor variabilei x, este necesar să se
calculeze valorile celor doi parametri a şi b.
Dacă factorul x este determinant pentru variabila y, atunci valorile estimate prin
funcţia de regresie trebuie să dea abateri minime faţă de cele înregistrate pentru variabila
rezultativă. Cum aceste abateri se pot produce într-un sens sau altul, ele sunt ridicate la pătrat
şi, din această cauză, metoda de verificare a acestei condiţii se mai numeşte şi metoda celor
mai mici pătrate.
Cu alte cuvinte, dacă y depinde de x, atunci trebuie să se îndeplinească condiţia ca
suma pătratelor abaterilor valorilor empirice de la valorile ecuaţiilor lor de regresie să fie
minimă:
Capitolul 5 95
n
i yyS1i
2 minim)ˆ(
Pentru tendinţa liniară această ecuaţie este:
n
i
ii bxay1
2 minim)]([
Pentru aflarea celor doi parametri care definesc ecuaţia liniei drepte se derivează
această sumă în raport cu derivatele celor doi parametri:
n
i
ii
n
i
ii
xbxayb
s
bxaya
s
1
1
))](([2
)1)](([2
Anulând derivatele parţiale şi simplificând cu 2 se obţine:
n
i
ii
n
i
i
n
i
i
n
i
i
n
i
i
yxxbxa
yxbna
11
2
1
11
Coeficienţii a şi b se obţin cu formulele:
a
y x
x y x
n x
x x
y x x y x
n x x
i i
i i i
i
i i
i i i i i
i i
2
2
2
2 2( )
b
n y
x x y
n x
x x
n x y x y
n x x
i
i i i
i
i i
i i i i
i i
2
2 2( )
Cu valorile a şi b se calculează valoarea ecuaţiei de regresie pentru fiecare valoare a
caracteristicii x. Aceste valori ale ecuaţiilor de regresie se mai numesc şi valorile teoretice ale
caracteristicii y în funcţie de x, iar operaţia de înlocuire a termenilor reali y cu valorile
ecuaţiilor de regresie (valori teoretice) se numeşte ajustare.
Prin ajustarea unei serii statistice de distribuţie se înţelege înlocuirea termenilor
empirici (termeni reali obţinuţi prin observare) cu termeni teoretici, calculaţi pe baza unui
model matematic, care arată tendinţa de variaţie a caracteristicii rezultative, dacă ar fi depins
numai de variaţia lui x considerat.
2.2 Măsurarea intensităţii corelaţiei
Linia de regresie este utilă numai dacă intensitatea corelaţiei este suficient de mare.
Regresie şi corelaţie 96
Coeficientul de corelaţie
Pentru măsurarea intensităţii corelaţiei se poate folosi indicatorul numit coeficient
de corelaţie.
Coeficientul de corelaţie măsoară intensitatea legăturii numai în cazul regresiei
liniare. Estimaţia r a coeficientului teoretic de corelaţie este dată de formula:
yx
n
i
ii
n
yyxx
r
1
))((
care prin dezvoltare devine:
n
i
n
i
n
i
n
i
iiii
n
i
n
i
n
i
iiii
yynxxn
yxyxn
r
1 1 1 1
2222
1 1 1
)([])([
Coeficientul de corelaţie poate lua valori în intervalul –1 şi +1, după cum corelaţia
este negativă, inversă sau pozitivă, directă. Cu cât coeficientul de corelaţie ia valori mai
apropiate de 1 sau –1 cu atât legătura liniară este mai intensă, apropiindu-se de legătura
funcţională. Dacă cele două variabile sunt independente, atunci coeficientul de corelaţie este
egal cu zero.
Raportul de corelaţie liniară simplă
Raportul de corelaţie liniară este indicatorul care permite măsurarea gradului de
intensitate a realizării legăturii dintre caracteristica considerată factor de influenţă şi
caracteristica rezultativă, după ce s-a aplicat metoda regresiei. Calculul său se bazează pe
descompunerea dispersiei totale a caracteristicii y pe factori de influenţă.
2
2
2
2
2
2
)(
)ˆ(
)(
)ˆ(
yy
yy
n
yy
n
yy
Ri
i
i
i
y
xy
xy
sau:
2
2
2
2
2
2
)(
)ˆ(1
)(
)ˆ(
11yy
yy
n
yy
n
yy
Ri
ii
i
ii
y
ry
xy
Raportul de corelaţie poate lua valori de la 0 la +1. În ceea ce priveşte semnul
raportului de corelaţie, acesta se va determina după semnul “b“ din ecuaţia de regresie. Dacă
“b“ este pozitiv, Ryx
va fi luat cu sens pozitiv; dacă “b“ este negativ, atunci Ryx
se va lua
cu semnul minus, iar dacă “b“ este egal cu zero trebuie ca şi Ryx
să fie egal cu zero.
Gradul de intensitate a corelaţiei dintre fenomene se va obţine stabilind greutatea
specifică a dispersiei formată pe baza factorului înregistrat faţă de dispersia totală. Acest
Capitolul 5 97
indicator se numeşte coeficient de determinaţie, se notează cu Ryx
2
şi se calculează după
formula:
Ryx
yx
y
2
2
2
În mod analog se calculează şi coeficientul de nedeterminaţie ( )Kyx
2 ca raport între
dispersia faţă de linia de regresie şi dispersia totală:
K yr
yr
y
2
2
2
2.3 Semnificaţia estimaţiilor. Intervale de încredere
Într-o problemă dată dispunem doar de valori calculate ale estimatorilor a şi b
(coeficienţii liniei de regresie) şi r (coeficientul de corelaţie); valorile pot fi semnificativ
diferite faţă de zero sau numai întâmplător1.
Se pune problema verificării semnificaţiei acestor estimaţii, mai ales în cazul
selecţiilor de volum mic, ceea ce presupune calculul erorilor standard ale celor doi coeficienţi.
Pentru a verifica semnificaţia coeficienţilor liniei empirice de regresie, bxay ˆ ,
trebuie să calculăm erorile standard ale celor doi coeficienţi:
22
)ˆ(1 1 1
2
1
2
ˆ
n
yxbyay
n
yy
S
n
i
n
i
n
i
iiii
n
i
ii
yy
2
1
2
ˆ
)(
1
n
i
i
yya
xx
x
nSS
şi
n
i
i
yy
b
xx
SS
1
2
ˆ
)(
Cunoscând erorile standard Sa şi Sb putem aplica criteriul t definit prin mărimile:
a
cS
at
0 şi respectiv
b
cS
bt
0
care urmează repartiţia Student cu 2 nf grade de libertate. Intervalele de încredere ale
coeficienţilor liniei teoretice de regresie, xY sunt date de relaţiile:
aqaq StaSta
bqbq StbStb
1 Resa I., Petrescu Şt., Precupaş M., Câra Al., Probleme de statistică rezolvate pe calculator, Ed. Facla, 1984
Regresie şi corelaţie 98
unde qt este valoarea variabilei t corespunzătoare nivelului de semnificaţie q şi numărului
gradelor de libertate 2 nf .
Verificarea semnificaţiei coeficientului de corelaţie r se poate face folosind criteriul t,
mai ales când n este mic, prin mărimea:
21
2
r
nrtc
care urmează legea Student cu 2 nf grade de libertate. Limitele de încredere pentru
coeficientul de corelaţie teoretic sunt:
rq Str şi rq Str
unde 1
1 2
n
rS r este eroarea standard iar qt este valoarea variabilei t corespunzătoare
nivelului de semnificaţie q şi numărului gradelor de libertate 1 nf .
2.4 Analiza reziduurilor
Analiza reziduurilor permite verificarea semnificaţiei modelului atât din punct de
vedere al datelor la nivel global, cât şi la nivel individual.
La nivel global, se examinează graficul valorilor ii ex , pentru a controla ipotezele
stabilite la nivelul reziduurilor. La nivel individual, se examinează dacă observaţia este bine
reconstituită de model şi se măsoară influenţa sa asupra construirii dreptei celor mai mici
pătrate.
Analiza grafică
graficul (a) corespunde situaţiei unui model adecvat tipului de legătură;
graficul (b) sugerează că ar fi mai potrivit modelul în care valorile lui Y să fie
înlocuite cu log(Y) sau Y ;
graficul (c) sugerează utilizarea modelului 2cxbxaY .
Măsurarea reziduurilor
Se poate demonstra că eroarea observată ie este o realizare a unei variabile aleatoare
ce urmează o lege normală N(0, ih1 ). Cu cât o observaţie contribuie mai mult la
construirea dreptei de regresie, cu atât varianţa erorii corespunzătoare este mai scăzută.
Pentru a măsura importanţa erorii iii yye se utilizează indicii:
Capitolul 5 99
reziduuri studentizate definite prin i
ii
h
et
1. Se poate spune că observaţia i
nu este bine reconstituită de model dacă valoarea ti este foarte mare în mărime
absolută.
RSTUDENT definit prin i
ii
hi
et
1)(ˆ
*
Referitor la valoarea încasărilor (milioane lei) şi cheltuielile publicitare (sute
mii lei) efectuate de o societate comercială în decursul a cinci luni s -au înregistrat datele:
Tabelul nr. 1 Analiza legăturii dintre cheltuielile publicitare şivaloarea încasărilor
Nr.
crt.
Cheltuieli
publicitare
(sute mii lei)
ix
Valoarea
încasărilor
(mil. lei)
iy
2
ix
ii yx
2
iy
xy i 310ˆ
1
2
3
4
5
5
6
9
12
18
25
30
35
45
65
25
36
81
144
324
125
180
315
540
1170
625
900
1225
2025
4225
25
28
37
46
64
Total
5
1
50i
ix
5
1
200i
iy
5
1
2 610i
ix
5
1
2330i
ii yx
5
1
2 9000i
iy
5
1
200ˆi
iy
Se cere:
a) să se caracterizeze şi să se măsoare legătura dintre variabile;
b) să se testeze semnificaţia coeficienţilor pentru un nivel de semnificaţie 05,0 .
Sistemul de ecuaţii normale devine:
233061050
200505
ba
ba
Din rezolvarea sistemului rezultă coeficienţii: 10a şi 3b .
Coeficientul de regresie b fiind pozitiv ne arată existenţa unei legături directe între
cele două variabile şi anume, pe măsură ce cheltuielile publicitare cresc cu o sută mii lei,
valoarea încasărilor creşte cu trei milioane lei.
Coeficientul de corelaţie:
995,0])200(90005[])50(6105[
2005023305
22
r
arată că între cele două caracteristici există o legătură puternică.
Testarea semnificaţiei coeficienţilor pentru nivelul de semnificaţie de 0,05 şi 5-2 grade
de libertate, pentru care valoarea tabelară a variabilei t este 2,353, conduce la rezultatele:
1741,0bS 23,171741,0
30
b
cS
bt
Regresie şi corelaţie 100
Se observă că valoarea variabilei t calculată este mai mare decât valoarea teoretică
17,23 > 2,353 ceea ce ne îndreptăţeşte să tragem concluzia că acest coeficient de regresie este
semnificativ diferit de zero. Intervalul de încredere pentru coeficientul este:
1741,0353,231741,0353,23
4,359,2
Testarea termenului liber:
9228,1aS 20,59228,1
100
a
cS
at
Se observă că valoarea variabilei t calculată este mai mare decât valoarea teoretică
5,20 > 2,353 ceea ce ne îndreptăţeşte să tragem concluzia că termenul liber este semnificativ
diferit de zero. Intervalul de încredere pentru coeficientul este:
9228,1353,2109228,1353,210
52,1447,5
Testarea coeficientului de corelaţie:
005,0rS 23,1725995,01
995,0
2
ct
Desprindem concluzia că şi coeficientul de corelaţie este semnificativ diferit de zero
qc tt , în care 13,2qt şi corespunde nivelului de semnificaţie 0,05 şi 5-1 grade de
libertate. Intervalul de încredere pentru coeficientul va fi:
005,013,2995,0005,013,2995,0
1984,0
3. Regresia neliniară
În practica statistică se întâlnesc şi legături care nu sunt de formă liniară. În acest caz
se pot întâlni forme variate de legături curbilinii specifice relaţiilor de dependenţă dintre
caracteristica factorială aleasă şi cea rezultativă.
3.1 Tipuri de legături neliniare
Aceste legături neliniare se întâlnesc mai frecvent sub forma unei parabole de
gradul 2, a hiperbolei şi a funcţiei exponenţiale.
Dacă pe grafic se apreciază că legătura statistică este de forma unei parabole de gradul
2, atunci ecuaţia medie de estimare este: 2ˆ cxbxay
Punând aceeaşi condiţie, ca suma pătratelor abaterilor termenilor seriei de la valorile
teoretice să fie minimă, se obţine:
n
i
iii cxbxay1
22 min))((
Capitolul 5 101
iar sistemul de ecuaţii normale:
n
i
ii
n
i
i
n
i
i
n
i
i
n
i
ii
n
i
i
n
i
i
n
i
i
n
i
n
i
n
i
iii
yxxcxbxa
yxxcxbxa
yxcxbna
1
2
1
4
1
3
1
2
11
2
1
2
1
1 1 1
2
Rezolvând sistemul de ecuaţii normale prin metoda determinanţilor se calculează
valoarea celor trei parametri şi, în funcţie de valoarea individuală a lui x, se ajustează valorile
caracteristicii rezultative.
Când pe grafic se constată o corelaţie de forma unei hiperbole trebuie să se aplice
metoda celor mai mici pătrate în care ecuaţia de estimare este de forma:
bx
ay1
ˆ
Sistemul de ecuaţii necesar aflării parametrilor funcţiei este:
n
i
n
i
i
ii
n
i i
n
i
i
n
i i
yxx
bx
a
yx
bna
1 12
1
11
111
1
Apar şi cazuri când legătura dintre cele două variabile este de formă exponenţială ca
de exemplu: x
bay ˆ
Sistemul de ecuaţii normale se determină folosind logaritmii celor doi parametri "a" şi
"b":
bxay loglogˆlog
S-a ajuns la o ecuaţie de estimare de forma unei linii drepte calculată nu pe baza
valorilor empirice ci a logaritmilor lor.
Sistemul de ecuaţii normale va fi cel de la corelaţia liniară simplă, în care valorile
celor doi parametri vor fi înlocuite cu valorile logaritmilor lor, iar valorile caracteristicii
rezultative y cu valorile logaritmilor acestora:
n
i
ii
n
i
i
n
i
i
n
i
i
n
i
i
yxxbxa
yxban
11
2
1
11
logloglog
logloglog
Operaţia de ajustare în acest caz se va face după ce se vor calcula logaritmii ecuaţiilor
individuale de regresie. Ajustarea după o funcţie exponenţială se face prin antilogaritmarea
ecuaţiilor de regresie calculate în funcţie de x i.
Regresie şi corelaţie 102
3.2 Raportul de corelaţie neliniară
Pentru corelaţia neliniară măsurarea gradului de intensitate a legăturii se face numai
prin raportul de corelaţie:
pentru legătura sub forma unei parabole de gradul 2:
2
22
2
2)(
1ˆ
1yy
cxbxay
yy
yyR
i
iii
i
ii
xy
pentru legătura sub formă de hiperbolă:
2
2
2
2 )1
(
1ˆ
1yy
bx
ay
yy
yyR
i
i
i
i
ii
xy
pentru legătura sub forma unei funcţii exponenţiale:
2
2
2
2
1ˆ
1yy
aby
yy
yyR
i
x
i
i
ii
xy
i
În zece unităţi comerciale s-au cules date cu privire la valoarea vânzărilor de
tricotaje şi nivelul relativ al cheltuielilor de circulaţie.
Tabelul nr. 2 Analiza legăturilor neliniare
Valoarea vânzărilor
(mii RON)
Nivelul relativ al
cheltuielilor de circulaţie
(%)
x y
5,1
5,5
6,0
6,5
6,7
7,0
7,0
8,5
11,0
13,0
8
7,2
6,8
6,4
6
5,6
5
4,6
4,2
4,2
Capitolul 5 103
VINZARI
141210864
CHEL
T
9
8
7
6
5
4
Fig ura 1. Graficul legăturii dintre cheltuieli şi vânzări
Graficul sugerează o legătură inversă între cele două variabile. Pentru a putea face
comparaţie între modelul liniar şi modelul hiperbolic au fost selectate ambele metode de
analiză, obţinându-se rezultatele:
Dependent variable.. CHELT Method.. LINEAR
Multiple R ,85395
Analysis of Variance:
DF Sum of Squares Mean Square
Regression 1 11,259261 11,259261
Residuals 8 4,180739 ,522592
F = 21,54502 Signif F = ,0017
-------------------- Variables in the Equation --------------------
Variable B SE B Beta T Sig T
VINZARI -,442581 ,095350 -,853948 -4,642 ,0017
(Constant) 9,176893 ,762589 12,034 ,0000
Dependent variable.. CHELT Method.. INVERSE
Multiple R ,95148
Analysis of Variance:
DF Sum of Squares Mean Square
Regresie şi corelaţie 104
Regression 1 13,978011 13,978011
Residuals 8 1,461989 ,182749
F = 76,48762 Signif F = ,0000
-------------------- Variables in the Equation --------------------
Variable B SE B Beta T Sig T
VINZARI 33,109280 3,785769 ,951479 8,746 ,0000
(Constant) 1,102268 ,553896 1,990 ,0818
CHELT
VINZARI
141210864
9
8
7
6
5
4
3
Observed
Linear
Inverse
Fig ura 2. Valorile observate comparate cu liniile de regresie
Modelul liniar a condus la funcţia xy 442,0176,9ˆ (coficientul b fiind negativ
arată legătură inversă între cele două variabile), raportul de corelaţie R de 0,8539 indică o
legătură puternică iar valoarea F = 21,54 pentru care nivelul de semnificaţie este 0,0017 (mai
mic decât 0,05 ales pentru testarea modelului) arată că modelul este semnificativ.
18,42
ie .
Modelul hiperbolic a condus la funcţia x
y1
1,331,1ˆ , raportul de corelaţie R este
0,9514, valoarea F = 76,48 pentru care nivelul de semnificaţie este 0,0000. 46,12
ie . Din
aceste rezultate deducem că modelul hiperbolic estimează mai bine legătura dintre cele două
variabile.
Capitolul 5 105
4. Regresia multiplă
În cazul fenomenelor de masă se consideră variabila dependentă sau
rezultativă ca fiind o funcţie de mai multe variabile: y f x x xi n 1 2, , ..., , în care variabilele xi
sunt caracteristicile factoriale care determină într-o măsură mai mare sau mai mică variaţia
caracteristicii rezultative y.
Dacă legătura dintre fiecare factor şi variabila rezultativă este de formă liniară, atunci
ecuaţia de estimare va fi:
kkxxx xaxaxaayn
...ˆ22110,...,, 21
în care:
a0 - reprezintă parametrul care exprimă factorii neînregistraţi, consideraţi cu acţiune
constantă, în afara celor consideraţi drept caracteristici factoriale;
a1,a2, ... ,ak - coeficienţii de regresie care arată cât se modifică variabila rezultativă
dacă variabila factorială respectivă se modifică cu o unitate;
x1,x2, ... ,xk - caracteristicile factoriale incluse în raportul de interdependenţă.
Spre exemlificare se va utiliza o corelaţie multiplă în care se vor lua numai două
caracteristici factoriale şi una rezultativă. Având două caracteristici factoriale ecuaţia funcţiei
de regresie liniară multiplă va fi:
2211021ˆ xaxaay xx
al cărei sistem de ecuaţii normale este:
yxxaxxaxa
yxxxaxaxa
yxaxana
2
2
2221120
1212
2
1110
22110
Cunoscând cei trei parametri ai funcţiei de ajustare se calculează pentru fiecare unitate
ecuaţia de regresie pe baza valorilor x1,x2, iar pentru verificarea calculului se aplică relaţia
21
ˆxxii yy .
Unele regresii multiple neliniare pot fi transformate în regresii liniare:
care prin logaritmare devine:
Raportul corelaţiei multiple
Pentru măsurarea gradului de intensitate a corelaţiei se foloseşte şi aici raportul de
corelaţie:
x ...... x x a = y ak
a2
a10
k21 ˆ
xa + ...... + xa + a =y kk110 loglogloglog
Regresie şi corelaţie 106
2
1
2
...
...,
21
21
ˆ1
yy
yyR k
k
xxxi
xxxy
În cazul corelaţiei liniare, raportul de corelaţie multiplă se transformă în coeficient de
corelaţie multiplă.
Coeficientul de corelaţie multiplă poate fi dedus din coeficienţii de corelaţie simplă.
După cum se ştie, în cazul corelaţiei liniare simple, raportul de corelaţie este egal cu
coeficientul de corelaţie R ryx
yx
.
În cazul corelaţiei multiple, raportul de corelaţie liniară sintetizează toate legăturile
liniare simple. Dacă factorii sunt independenţi între ei, atunci raportul de determinaţie
multiplă este egal cu suma rapoartelor de determinaţie simplă. De exemplu, pentru doi factori
există relaţia:
R R Ryx x
yx
yx1 2 1 2
2 2 2
,
Dacă legătura este liniară, atunci se substituie R cu r şi se obţine:
R r ryx x
yx
yx1 2 1 2
2 2 2
,
De unde raportul de corelaţie este:
R r ryx x
yx
yx1 2 1 2
2 2
,
De regulă însă, în cadrul fenomenelor social-economice factorii sunt interdependenţi
între ei şi, de aceea, apare necesitatea luării în considerare a influenţei r ecriproce a factorilor.
Dacă factorii sunt interdependenţi, atunci rx x1 20, şi această influenţă, regăsindu-se
în valoarea coeficientului de corelaţie multiplă, trebuie să fie eliminată.
Raportul de corelaţie liniară multiplă se calculează atunci folosindu-se coeficienţii de
corelaţie simplă, sub forma:
R
r r r r r
ry
x x
yx
yx
yx
yx
x x
x x1 2
1 1 2
1 2
1 2
2
2
2
2
2
1,
Această formulă de calcul se foloseşte, în special, atunci când au fost deja analizate
corelaţiile simple, şi pe baza lor, se trece la măsurarea gradului de intensitate a corelaţiei
multiple. De asemenea, se foloseşte şi pentru verificarea liniarităţii funcţiei de estimare.
Testarea modelului global se face cu statistica:
2
2
1
1
R
R
k
knFcalc
în care k reprezintă numărul variabilelor explicative
Capitolul 5 107
Valoarea calculată cu această formulă se compară cu valoarea tabelară
corespunzătoare nivelului de semnificaţie ales şi gradelor de libertate f1 = k ; f2 = n-k-1. Dacă
Fcalc este mai mare decât Fteoretic se consideră că variabilele X1,X2, ... ,Xk au o influenţă
semnificativă asupra caracteristicii rezultative Y.
Se cunosc datele:
Indicii veniturilor reale Indicii înzestrării opulaţiei
ale populaţiei
% cu maşini electrice de spălat % Vânzările totale de detergenţi
cu baza fixă cu baza fixă (mii tone)
X1 X2 Y
100 100 540
112 110 620
115 119 750
124 129 790
128 136 862
130 147 900
134 150 950
135 156 960
Se cere:
1. să se studieze legătura dintre vânzările totale de detergenţi şi indicii veniturilor reale;
2. să se studieze legătura dintre vânzările totale de detergenţi şi indicii înzestrării
populaţiei cu maşini de spălat;
3. Y în funcţie de X1 şi X2.
Rezolvare
1 .
y = 12.3x - 707.19
0
200
400
600
800
1000
1200
0 20 40 60 80 100 120 140 160
venituri reale %
van
zari
det
erg
enti
mii
to
ne
SUMMARY OUTPUT
Regression Statistics
Multiple R 0.98
R Square 0.96
Standard Error 30.72
Observations 8
Regresie şi corelaţie 108
ANOVA
df SS MS F Significance F
Regression 1 158782.545 158782.5 168.218 1.29E-05
Residual 6 5663.454 943.9
Total 7 164446
Coefficients Standard Error t Stat P-value Lower 95% Upper 95%
Intercept -707.19 116.44 -6.07 0.000905 -992.12 -422.2
X Variable 1 12.3 0.948 12.96 1.29E-05 9.97 14.62
2 .
y = 7.5319x - 189.24
0
200
400
600
800
1000
1200
0 50 100 150 200
Inzeatrarea cu masini de spalat %
vanz
ari d
e de
terg
enti
mii
tone
SUMMARY OUTPUT
Regression Statistics
Multiple R 0.99
R Square 0.97
Standard Error 27.82
Observations 8
ANOVA
df SS MS F
Significance
F
Regression 1 159801.15 159801.2 206.4238 7.1179E-06
Residual 6 4644.85 774.14
Total 7 164446
Coefficients
Standard
Error t Stat P-value Lower 95% Upper 95%
Intercept -189.24 69.31 -2.73 0.03 -358.84 -19.64
X Variable 1 7.53 0.52 14.37 0.00 6.25 8.81
Capitolul 5 109
3 .
SUMMARY OUTPUT
Regression Statistics
Multiple R 0.99
R Square 0.98
Standard Error 26.17
Observations 8
ANOVA
df SS MS F
Significance
F
Regression 2 161022.15 80511.07 117.57 6.255E-05
Residual 5 3423.85 684.77
Total 7 164446
Coefficients
Standard
Error t Stat P-value Lower 95% Upper 95%
Intercept -422.17 186.22 -2.27 0.07 -900.85 56.52
X Variable 1 5.29 3.96 1.34 0.24 -4.89 15.47
X Variable 2 4.37 2.42 1.81 0.13 -1.84 10.59
Cum interpretaţi rezultatele de la punctele 1,2,3 ?
5. Metode neparametrice de măsurare a legăturilor dintre fenomene
După cum s-a arătat în paragrafele precedente, metodele analitice de calcul al
corelaţiilor se utilizează în cazul în care există posibilitatea de a se determina forma de
manifestare a legăturii, verificată pentru un număr suficient de date care tind să se distribuie
normal sau asimptotic normal.
Există, însă, numeroase cazuri când distribuţia caracteristicilor nu este normală şi nici
nu există informaţii despre parametrii funcţiilor studiate. În aceste situaţii nu se mai pot
întrebuinţa formulele indicatorilor analitici de corelaţie, ci trebuie să se folosească alte metode
pentru a putea determina existenţa, direcţia şi intensitatea anumitor legături ce se stabilesc
între două sau mai multe caracteristici. Aceste metode trebuie să elimine ipoteza privind tipul
curbei de distribuţie şi, în consecinţă, să dea posibilitatea unor estimări la cele mai variate
tipuri de distribuţie.
Metodele prin care se rezolvă aceste probleme sunt cunoscute sub denumirea de
metode neparametrice. Aceste metode, pe lângă faptul că pot stabili intensitatea unei legături
făcând abstracţie de tipul de distribuţie, permit, de asemenea, măsurarea intensităţii legăturilor
nu numai pentru caracteristicile cantitative, dar şi pentru caracteristicile calitative, deoarece în
cazul metodelor neparametrice nu se lucrează cu valorile caracteristicilor, ci cu anumite
simboluri sau cu un număr de ordine numit rang.
Dintre metodele neparametrice folosite cel mai frecvent sunt: coeficientul de asociere
şi coeficienţii de corelaţie a rangurilor a lui Spearman şi Kendall.
Regresie şi corelaţie 110
5.1 Tabelul de asociere şi coeficientul de asociere
Una din metodele cele mai simple ale corelaţiei neparametrice o costituie coeficientul
de asociere calculat pe baza tabelului de asociere, care permite - de altfel ca şi celelalte
metode neparametrice - analiza nu numai a caracteristicilor exprimate numeric dar şi a
caracteristicilor calitative. Această metodă se utilizează în special, când unităţile purtătoare
ale caracteristicilor sunt separate în două grupe sau sunt de forma unor caracteristici
alternative (de tipul "da - nu").
Tabelul de asociere este format din două rânduri şi două coloane, de forma:
y
x
y1 y2 Total
x1 a b a+b
x2 c d c+d
Total a+c b+d a+b+c+d
Produsul ad arată gradul de realizare a legăturii directe dintre x şi y, iar produsul bc
gradul de legătură inversă între aceste două caracteristici cercetate.
Pentru stabilirea valorii numerice a coeficientului de asociere, care să indice existenţa
şi intensitatea unei legături, formula cea mai utilizată este cea propusă de Yule:
Qad bc
ad bc
Este evident că în această situaţie apar cazurile:
Ca orice coeficient de corelaţie şi acest indicator poate să ia valori între -1 şi +1,
arătând nu numai gradul de intensitate al asocierii celor două caracteristici, dar şi sensul ei.
Inconvenientul acestei formule este faptul că, în cazul asociaţiei complete, nu se disting cele
patru variante prezentate anterior. De aceea, în acest caz, trebuie făcută menţiunea respectivă
în funcţie de modul de asociere a caracteristicilor în tabelul de asociaţie.
Acest coeficient prezintă avantajul că se poate calcula cu multă rapiditate şi se poate
folosi şi în cazul când datele provin de la unităţile statistice complexe care, în interiorul lor,
Capitolul 5 111
pot prezenta forme diferite de distribuţie, dar pot fi transformate în variabile alternative, ca de
exemplu sub şi peste nivelul mediu.
5.2 Coeficienţii de corelaţie a rangurilor
După cum s-a arătat, coeficienţii de corelaţie a rangurilor prezintă avantajul că ei pot fi
utilizaţi şi în cazul unor distribuţii asimetrice, în cazul unui număr restrâns de unităţi pentru
care nu se poate verifica reprezentativitatea datelor parţiale sau în cazul distribuţiilor unor
unităţi complexe.
Analiza de corelaţie, în acest caz, se bazează pe înlocuirea valorilor empirice cu
rangurile corespunzătoare, ceea ce face posibilă comparaţia dintre variabilele supuse
interdependenţei statistice.
Această metodă neparametrică mai prezintă avantajul că poate cuprinde în analiza
raporturilor de dependenţă dintre fenomene şi caracteristici calitative, care, prin natura lor nu
se pot exprima numeric, dar pot fi "ierarhizate" pe baza unui anumit rang.
Pornind de la ipoteza că între cele două serii de ranguri există concordanţă, seria a
doua care reprezintă rangurile caracteristicii rezultative ar trebui să se ordoneze şi ea tot
crescător, dacă legătura este directă, şi descrescător în raport cu prima serie de ranguri, dacă
legătura este inversă. În cazul existenţei legăturii dintre cele două caracteristici, la aceeaşi
unitate observată trebuie să corespundă acelaşi număr de unităţi care au rang mai mare sau
mai mic decât ele. În cazul lipsei de legătură între caracteristicile studiate, ordinea de
distribuţie a rangurilor celor două caracteristici este diferită.
În mod corespunzător se pot cuprinde în anliză şi distribuţiile paralele ale mai multor
caracteristici, cu care se pot realiza mai multe combinaţii, stabilind coeficienţii de corelaţie a
rangurilor simpli, parţiali şi multipli, urmărind astfel atât procesul complex de formare a
indicatorilor sintetici, cât şi interacţiunea dintre factori.
Cele mai frecvente formule de calcul ale coeficientului de corelaţie a rangurilor sunt
cele ale lui Spearman şi Kendall.
Coeficientul de corelaţie a rangurilor a lui Spearman este o aplicaţie a coeficientului
de corelaţie liniară simplă la distribuţiile celor două şiruri de ranguri.
În cazul corelaţiei rangurilor, cele două serii de valori variabile sunt înlocuite cu două
şiruri de ranguri de la 1 la n, ale căror medii şi dispersii sunt legate între ele. Ţinând seama de
faptul că cele două şiruri de ranguri formează câte o progresie aritmetică 1, 2, 3, ..., n,
înseamnă că:
x yn
1
2
iar:
x x y y nn2 2
2 1
12
Înlocuind în formula coeficientului de corelaţie liniară se obţine formula de calcul a
coeficientului de corelaţie a rangurilor lui Spearman:
rd
n ns
i
1
6 2
3
în care:
d - reprezintă diferenţa de rang între caracteristicile corelate;
n - numărul de unităţi cercetate.
Coeficientul de corelaţie a rangurilor al lui Kendall se calculează după formula:
Regresie şi corelaţie 112
rS
n nk
2
1( ) în care
i i
ii QPS
Pentru rangurile lui y se calculează:
Pi – numărul rangurilor mai mari decât rangul analizat de la acel rang până la sfârşitul
şirului;
Qi - numărul rangurilor mai mici decât rangul analizat de la acel rang până la sfârşitul
şirului.
Coeficientul lui Kendall al corelaţiei rangurilor poate lua valori de la -1 la +1,
indicând, în felul acesta, nu numai gradul de intensitate a legăturii dar şi direcţia ei.
Este de remarcat faptul că, de obicei, coeficientul de corelaţie a rangurilor după
formula lui Kendall este mai mic decât cel al lui Spearman.
Se cunosc date referitoare la numărul locurilor din unităţile de cazare turistică
pe ţări, precum şi densitatea turistică obţinută prin raportarea numărului turiştilor străini sosiţi
în anul 2004 la suprafaţa ţărilor analizate. Se cere să se caracterizeze legătura dintre cele două
variabile aplicând metoda rangurilor.
Tabelul nr. 3 Metoda rangurilor
Număr
locuri
Ranguri pentru
număr locuri
Rx
Densitatea
turistică
Ranguri pentru
densitatea turistică
Ry
România 275941 4 5701 3
Bulgaria 190040 3 15278 4
Turcia 418177 5 22396 5
Ucraina 50414 2 26 1
Georgia 19316 1 872 2
iRx iRy 22 )( iii RyRxd iP iQ
1 2 1 3 1
2 1 1 3 0
3 4 1 1 1
4 3 1 1 0
5 5 0 0 0
i
id 42 i
iP 8 i
iQ 2
Coeficientul Spearman 8,0)15(5
461
2
Valoarea coeficientului indică legătură directă şi puternică între numărul locurilor din
unităţile de cazare şi densitatea turistică.
Coeficientul Kendall 6,0)15(5
)28(2
Capitolul 5 113
Rezumat
În analiza statistică a raporturilor de dependenţă dintre fenomene, problema care se
pune este aceea a măsurării relaţiei care există între două sau mai multe caracteristici cuprinse
în programul unei cercetări concrete a fenomenelor social-economice de masă. Aceasta
presupune, în primul rând, să se constate dacă între caracteristica X - denumită caracteristica
factorială sau independentă - şi caracteristica Y - caracteristica rezultativă sau dependentă -
există sau nu un raport de dependenţă şi în al doilea rând, dacă această relaţie există, să se
exprime printr-un indicator simplu sau sintetic de corelaţie, măsura în care caracteristica
factorială X contribuie la formarea caracteristicii rezultative Y sub aspectul naturii, direcţiei şi
formei de legătură dintre ele.
Termeni importanţi: regresia liniara, coeficient de regresie, raport de corelaţie,
coeficient de determinaţie, regresia neliniară, regresia multiplă
Teste de autocontrol:
1. Enumeraţi tipurile de legături dintre fenomenele economice.
2. Ce semnificaţie are coeficientul regresiei liniare ?
3. Ce rol are testarea semnificaţiei coeficienţilor funcţiei de regresie ?
4. Cum interpretăm coeficientul de determinaţie ?
5. În ce situaţii aplicăm regresia neparametrică ?
Probleme propuse
1. Vânzările de mărfuri şi suprafaţa comercială pentru 10 unităţi economice care aparţin
aceleiaşi societăţi comerciale se caracterizează prin datele:
Nr. crt. al
unităţii
Vânzări
de mărfuri
- mii RON -
Suprafaţa
comercială
- 2m -
1 52 400
2 60 385
3 74 620
4 20 155
5 25 210
6 34 220
7 49 230
8 38 215
9 45 320
10 12 70
Regresie şi corelaţie 114
a) să se caracterizeze şi să se măsoare legătura dintre vânzările de mărfuri
şi suprafaţa comercială folosind metodele parametrice –funcţia liniară;
b) să se reprezinte grafic legătura dintre cele două variabile statistice şi să
se stabilească existenţa şi forma legăturii;
c) să se calculeze coeficientul de corelaţie, coeficientul de determinaţie şi
raportul de corelaţie;
d) să se caracterizeze şi să se măsoare legătura dintre vânzările de mărfuri
şi suprafaţa comercială folosind metodele neparametrice.
2. Despre zece familii se cunosc următoarele date referitoare la veniturile medii lunare şi
cheltuielile cu alimentaţia:
Nr.
crt
Venituri medii
lunare
- RON -
Cheltuieli cu
alimentaţia
- RON -
1 720 320
2 990 380
3 850 400
4 1180 550
5 1920 620
6 1090 410
7 1340 540
8 1250 590
9 1150 600
10 1610 630
Să se caracterizeze şi să se măsoare legătura dintre cele două variabile folosind:
a) graficul de corelaţie;
b) metoda regresiei.
3. La 10 unităţi comerciale s-au înregistrat datele:
Vânzări
(mii RON)
30 59 40 50 20 52 41 10 62 60
Profit
(mii RON)
2,2 3 2 2,5 1,8 2,6 2,3 1,9 3,6 4
Se cere:
1. Să se caracterizeze legătura dintre cele două variabile utilizând metoda grafică;
2. Să se măsoare intensitatea legăturii dintre cele două variabile, utilizând metode
parametrice şi neparametrice;
3. Să se determine ce nivel ar atinge profitul dacă valoarea vânzărilor ar fi de 45 mii
RON.
Capitolul 6 115
Capitolul 6
Tema Analiza seriilor cronologice
Obiectivele 1. Noţiuni, particularităţi
2. Indicatorii statistici utilizaţi în prelucrarea seriilor cronologice
2.1 Indicatori absoluţi
2.2 Indicatori relativi
2.3 Indicatori medii
3. Ajustarea seriilor cronologice
3.1 Ajustarea pe baza mediilor mobile
3.2 Ajustarea prin sporul mediu
3.3 Ajustarea pe baza indicelui mediu de dinamică
3.4 Ajustarea prin metoda celor mai mici pătrate
4. Analiza sezonalităţii
Mijloace
- citire/învăţare
- întrebări, probleme ce apar, explicaţii
- definiţii, explicaţii ce trebuie reţinute
- situaţii economice concrete, supuse analizei, exemple (sub
lupă)
- teme de casă, aplicaţii practice pentru studenţi
Finalitatea 1. analiza evoluţiei fenomenelor în timp pe baza indicatorilor specifici
2. alegerea modelelor de analiză a trendului
3. analiza fenomenelor cu componenta sezonieră
Evaluarea - parcurgerea aplicaţiilor propuse
Timp de lucru
necesar
1. Pentru cunoaşterea problemei: 6 ore
2. Pentru rezolvarea temelor: 12 ore + timpul de documentare
Analiza seriilor cronologice 116
Analiza seriilor cronologice
1. Noţiuni, particularităţi
Una din sarcinile statisticii este aceea de a studia fenomenele şi procesele
social-economice de masă de-a lungul diferitelor perioade de timp sub aspectul evoluţiei
volumului acestora şi al schimbărilor intervenite în structura lor, a interdependenţelor dintre
fenomene de natură diferită etc.
Seria cronologică este formată din două şiruri de date paralele, în care
primul şir arată variaţia caracteristicii de timp, iar cel de-al doilea şir variaţia
fenomenului sau caracteristicii cercetate, de la o unitate de timp la alta. Seriile
cronologice se mai numesc şi serii de timp sau serii ale dinamicii.
Proprietăţile seriilor cronologice:
- variabilitatea termenilor unei serii cronologice provine din faptul că fiecare
termen se obţine prin centralizarea unor date individuale diferite ca nivel de
dezvoltare.
- omogenitatea termenilor trebuie înţeleasă în sensul că în aceeaşi serie nu pot fi
înscrise decât fenomene de acelaşi gen, care sunt rezultatul acţiunii aceloraşi cauze
esenţiale.
- periodicitatea termenilor din care este formată seria, ceea ce înseamnă de fapt
asigurarea continuităţii datelor din punct de vedere a variabilei de timp şi care
poate da posibilitatea interpretării seriei cronologice ca o funcţie analitică (y i=
f(ti)). Variabila de timp poate fi înregistrată cu periodicităţi diferite. De aceea,
alegerea unităţii de timp la care se referă datele unei serii cronologice trebuie
făcută în raport cu scopul cercetării, al conţinutului şi posibilităţilor de măsurare a
fiecărui indicator.
- interdependenţa termenilor unei serii cronologice apare ca urmare a respectării
principiului unităţii de timp şi spaţiu şi structurii organizatorice. Ca atare,
indicatorii prezenţi sunt valori succesive ale aceloraşi fenomene înregistrate la
nivelul aceleiaşi unităţi teritorial administrative sau orice unitate statistică
complexă care poate fi înregistrată autonom. Aceasta face ca valoarea fiecărui
indicator să depindă într-o oarecare măsură de valoarea indicatorului precedent, ca
urmare a faptului că relaţiile de cauzalitate se manifestă în condiţii asemănătoare
de la o unitate de timp la alta.
Luând în considerare toate aceste particularităţi, analiza statistică a seriilor cronologice
trebuie să se bazeze pe un sistem de indicatori, care să caracterizeze multiplele relaţii
cantitative din interiorul seriei şi pe toată perioada la care se referă datele. Ca atare,
problemele care se pun şi trebuie rezolvate la analiza seriilor cronologice sunt:
- alegerea lungimii seriei şi elaborarea ei astfel încât, pe cât posibil,
să îndeplinească condiţia legii numerelor mari, adică să aibă un
Capitolul 6 117
număr suficient de date pentru orizontul de analiză statistică cu care
să se fundamenteze corect prognozele de lungă şi scurtă durată;
- calculul şi analiza unui sistem de indicatori statistici absoluţi,
relativi şi medii necesari caracterizării seriei;
- identificarea trendului (tendinţei) de evoluţie a fenomenelor din
cadrul seriei prin utilizarea metodelor de ajustare statistică şi
testelor de verificare a ipotezelor privind forma obiectivă de
evoluţie pe perioada luată în calcul;
- calculul şi analiza sezonalităţii şi a altor forme de evoluţie cu
caracter ciclic;
- interpolarea şi extrapolarea seriilor cronologice potrivit scopului
cercetării statistice.
În prezentarea dinamică a fenomenelor se pot întâlni mai multe feluri de serii.
Clasificarea seriilor cronologice se face în funcţie de modul de exprimare a indicatorilor şi
după modul de exprimare a timpului la care se referă datele.
În funcţie de modul de exprimare a indicatorilor din care este formată seria, seriile
cronologice pot fi:
- serii cronologice formate din indicatori absoluţi - reprezintă forma de bază a
seriilor dinamice. Pe baza lor se pot obţine indicatorii generalizatori pe întreaga
perioadă;
- serii cronologice formate din indicatori relativi - constituie un mod de
prezentare de regulă procentual. În această situaţie este obligatoriu ca în titlu sau în
afara tabelului să se specifice care este baza de raportare, pentru ca interpretarea
datelor să se facă corect;
- serii cronologice formate din indicatori medii - se folosesc ca mijloc de
prezentare a evoluţiei unor caracteristici calitative ce apar sub formă de categorii
medii.
Seriile cronologice se pot clasifica în funcţie de timpul la care se referă datele în:
- serii cronologice de intervale (perioade) de timp - denumite şi serii de fluxuri,
sunt seriile statistice în care fiecare indicator reprezintă rezultatul unui proces
social-economic pe fiecare perioadă de timp folosită în prezentarea datelor. Astfel
de serii se pot întâlni în prezentarea evoluţiei producţiei, a cifrei de afaceri, a
mărimii investiţiilor, a profitului realizat, a creditului acordat şi/sau rambursat etc.
Ele se întocmesc pentru indicatori însumabili pe o anumită perioadă de timp, care
determină periodicitatea cu care se prezintă termenii seriei. Termenii seriei de
intervale pot fi cumulaţi obţinându-se un indicator totalizator pe întreaga serie sau
pe subperioade;
- serii cronologice de momente(sau de stocuri) - sunt acelea în care fiecare
indicator caracterizează mărimea la care a ajuns caracteristica urmărită sau
volumul colectivităţii în momentul de calcul. De exemplu, populaţia României, la
1 iulie a fiecărui an; valoarea capitalului fix al întreprinderii x la sfârşitul anului;
valoarea capitalului investit în industrie la sfârşitul fiecărui trimestru sau an;
numărul depunătorilor şi depozitelor la sfârşitul fiecărei luni etc. Pentru seria de
momente este caracteristic faptul că termenii ei nu se pot cumula în vederea
obţinerii unui indicator statistic totalizator cu conţinut real pe întreaga perioadă,
deoarece seria de momente cuprinde înregistrări repetate. De exemplu, o parte din
mărfurile de la 1 I se pot găsi şi în stocurile de la 1 II, 1 III etc .
Analiza seriilor cronologice 118
2. Indicatorii statistici utilizaţi în prelucrarea seriilor cronologice
Seriile cronologice se pot caracteriza statistic cu ajutorul unui sistem de
indicatori absoluţi, relativi şi medii. Ei se pot calcula pentru seriile care prezintă continuitate
în ceea ce priveşte variabila de timp, dar prezintă anumite particularităţi pentru seriile de
fluxuri şi cele de stocuri.
În grupa indicatorilor absoluţi ai unei serii cronologice includem:
nivelurile absolute ale termenilor seriei;
nivelul totalizat al acestor termeni;
modificări absolute (creşteri sau descreşteri absolute).
Indicatorii relativi, care caracterizează o serie cronologică sunt:
indicii de dinamică;
ritmul de creştere (scădere);
valoarea absolută a unui procent de creştere (scădere).
Indicatorii medii, rezultaţi din prelucrarea unei serii cronologice sunt:
nivelul mediu al unei serii cronologice;
modificarea medie absolută;
indicele mediu al dinamicii;
ritmul mediu de creştere (descreştere).
2.1 Indicatori absoluţi
Indicatorii absoluţi ai unei serii cronologice se exprimă în unităţile concrete de măsură
ale fenomenului studiat.
Indicatorii de nivel ai seriei – sunt valorile înregistrate ntyt ,1,
Nivelul totalizat al acestor termeni ( pentru seria de flux) - y t
t
n
1
Modificarea absolută (sporul), notat cu - arată cu cât s-a modificat
nivelul caracteristicii în perioada curentă faţă de perioada aleasă ca bază de comparaţie.
cu bază fixă:
11
yytt nt ,2
unde:
ty - nivelul caracteristicii la momentul t;
1y - nivelul caracteristicii la momentul 1, ales bază de comparaţie
cu baza în lanţ:
11
tt yyt
t nt ,2
unde:
Capitolul 6 119
ty - nivelul caracteristicii la momentul t
y t 1 - nivelul caracteristicii la momentul t-1
Proprietate: 1
2
1/1
yyn
n
t
ttn
2.2 Indicatori relativi
Indicele de dinamică – este mărimea relativă care arată de câte ori s-a
modificat un fenomen în timp.
cu bază fixă:
1001
1
y
yI t
t nt ,2
cu baza în lanţ:
1001
1
t
t
y
yI
tt nt ,2
Proprietate:
t
ttn II
11
Ritmul de creştere/scădere – arată cu câte procente s-a modificat
nivelul caracteristicii în perioada curentă faţă de perioada aleasă ca bază de comparaţie.
cu bază fixă:
100(%)11
tt IR nt ,2
cu baza în lanţ:
100(%)11
t
tt
t IR nt ,2
Valoarea absolută a unui procent - exprimă câte unităţi, din sporul
înregistrat revin la fiecare procent din ritmul creşterii sau descreşterii.
cu bază fixă:
1
1
1t
t
t
RV
a
nt ,2
cu bază în lanţ:
Analiza seriilor cronologice 120
1
1
1
tt
tt
tt
RVa nt ,2
2.3 Indicatori medii
Nivelul mediu al termenilor dintr-o serie cronologică. Calculul acestui indicator se
justifică numai dacă termenii seriilor cronologice sunt omogeni, adică în orizontul de timp
analizat aceşti termeni nu prezintă oscilaţii foarte ample. Se calculează:
pentru serii cronologice de intervale (termenii fiind însumabili), se calculează ca o
medie aritmetică simplă:
n
Y
Y
n
tt
1
pentru serii cronologice de momente (de stoc):
- ca o medie cronologică simplă (dacă momentele sunt echidistante):
1
2....
22
13221
n
yyyyyy
Y
nn
CR
- ca o medie cronologică ponderată (dacă momentele sunt inegal distanţate):
121
11
232
121
...
2....
22
n
nnn
CR
ttt
tyy
tyy
tyy
Y
unde:
t1, t2, … tn-1reprezintă lungimea în unităţi de timp dintre două momente
succesive.
Modificarea medie absolută
11
11
n
yy
n
ntt
Indicele mediu de creştere/scădere
1
1
11
nn
n
y
yII
tt
Ritmul mediu de creştere/scădere:
100(%) IR
Capitolul 6 121
Se cunosc datele referitoare la exportul de încălţăminte (modelul A) realizat de
o societate în perioada 2001 – 2005. În scop didactic s-a folosit o serie scurtă, formată numai
din cinci termeni şi doar pentru calculul sistemului de indicatori absoluţi, relativi şi medii.
Tabelul nr.1 Exportul de încălţăminte (modelul A)
Anii Mii perechi
2001 265
2002 269
2003 275
2004 279
2005 282
Seria analizată este formată din n = 5 termeni. Mărimea lor constituie însăşi
indicatorii de nivel ai seriei. Însumând indicatorii de nivel obţinem nivelul totalizat al
termenilor.
Tabelul nr. 2. Calculul indicatorilor absoluţi
Anii
Export
(mii perechi)
Modificări absolute +/- (mii perechi)
yt cu baza fixă
t/1
cu baza în lanţ
t/t-1
2001 265 (y1) - -
2002 269 (y2) 4 4
2003 275 (y3) 10 6
2004 279 (y4) 14 4
2005 282 (y5) 17 3
Total yt
t
1
5
1370 -
175
2
1/
t
tt
Tabelul nr. 3. Calculul indicatorilor relativi
Export
(mii
perechi)
Indicii de dinamică
(%)
Ritmul de creştere
(%)
Valoarea absolută a
1% din creştere
cu bază
fixă
cu bază în
lanţ
cu bază
fixă
cu bază în
lanţ
cu bază
fixă
cu bază în
lanţ
Anii
yt It/1 It/t-1 Rt/1 Rt/t-1 Vat/1 Vat/t-1
2001 265 100,00 - - - - -
2002 269 101,51 101,51 1,51 1,51 2,65 2,65
2003 275 103,77 102,23 3,77 2,23 2,65 2,69
2004 279 105,28 101,45 5,28 1,45 2,65 2,75
2005 282 106,42 101,08 6,42 1,08 2,65 2,79
Analiza seriilor cronologice 122
Folosind împreună indicatorii absoluţi şi relativi se desprind următoarele concluzii în
legătură cu evoluţia exportului:
- exportul a crescut uşor de la un an la altul, cea mai mare creştere ( cu 6 mii
perechi) înregistrându-se în 2003 / 2002 iar cea mai mică (cu 3 mii perechi) în
2005 / 2004;
- exportul a crescut cu 6,42% în anul 2005 faţă de anul 2001.
Indicatorii medii
Nivelul mediu. Dat fiind faptul că termenii unei serii cronologice de intervale de timp
se pot cumula determinându-se nivelul totalizat al caracteristicii pe întreaga perioadă
yt
t
n
1
pentru calculul nivelului mediu vom folosi formula mediei aritmetice simple
(intervalele fiind egale între ele), adică:
y
y
n
t
t
n
1 y
1370
5274 mii perechi /an
În perioada 2001 - 2005 exportul mediu anual reprezintă 274 mii perechi cu o
variaţie cuprinsă între 265 şi 282 mii perechi.
Modificarea medie absolută anuală
t
t
n
1
1
25,44
17
4
3464
mii perechi/anual
Exportul creşte în medie cu 4,25 mii perechi/an.
Indicele mediu de dinamică
0157.10108,1045,10223,10151,14 I sau 101,57%
În perioada 2001-2005 exportul a crescut în medie la 101,57%.
Ritmul mediu de creştere (descreştere)
R I
R
100 100
1 0157 100 100 1 57%, ,
Exportul a crescut între anii 2001-2005 cu un ritm mediu anual de 1,57%.
Capitolul 6 123
3. Ajustarea seriilor cronologice
Evoluţia oricărui fenomen în timp este rezultanta unor influenţe de natură
sistematică şi a altora de tip aleator.
Componentele sistematice sunt:
trendul (tendinţa generală) care se caracterizează prin variaţii de o anumită
consecvenţă privind sensul modificării pe durate relativ lungi (10 - 15 ani);
sezonalitatea se manifestă sub formă de oscilaţii la intervale mai mici de un
an (semestru, trimestru, lună, decadă);
ciclicitatea care se prezintă sub formă de fluctuaţii în jurul tendinţei
înregistrate la perioade mai mari de un an.
Fluctuaţiile ciclice pot fi cauzate de: conjunctura pieţii externe, de factori biologici (în
agricultură), de factori psihologici (moda).
Componentele aleatoare se manifestă sub forma unor abateri întâmplătoare de la ceea
ce are sistematic evoluţia variabilei analizate. Ele sunt rezultatul erorilor de observare sau a
necunoaşterii în totalitate a factorilor sistematici.
Statistica, prin metodele sale specifice trebuie să studieze care este tendinţa de
dezvoltare a fenomenului studiat şi prin ajustare, să se separe influenţa factorilor esenţiali cu
acţiune sistematică, de acţiunea factorilor accidentali, care face ca între termenii empirici şi
cei teoretici să existe abateri.
În teoria şi practica statistică se folosesc mai frecvent următoarele metode şi procedee
de ajustare:
ajustarea pe baza mediilor mobile;
ajustarea pe baza modificării medie absolute;
ajustarea pe baza indicelui mediu de dinamică;
ajustarea prin metode analitice de calcul bazate pe procedeul celor mai mici
pătrate.
3.1 Ajustarea pe baza mediilor mobile
Acest procedeu de ajustare se foloseşte, în special, acolo unde variaţia termenilor unei
serii cronologice prezintă un aspect de regularitate ciclică. Prin calcularea mediilor mobile se
înlătură această variaţie ciclică şi se prezintă seria de date cu o variaţie lină, contin uă.
Mediile mobile sunt medii parţiale, calculate dintr-un număr prestabilit de termeni, în
care se înlocuieşte pe rând primul termen cu termenul ce urmează în seria care trebuie să fie
ajustată.
În practică putem calcula medii mobile dintr-un număr impar de termeni sau/şi dintr-
un număr par de termeni.
Spre exemplificare, vom folosi o serie formată din 8 termeni care urmează să fie
ajustaţi prin procedeul mediilor mobile calculate din trei termeni.
Mediile mobile vor fi:
Yy y y
11 2 3
3
; Y
y y y4
4 5 6
3
;
Yy y y
22 3 4
3
; Y
y y y5
5 6 7
3
;
Yy y y
33 4 5
3
; Y
y y y6
6 7 8
3
;
Analiza seriilor cronologice 124
Ajustarea în acest caz se face după următorul model:
Valori
empirice
(yt) y1 y2 y3 y4 y5 y6 y7 y8
Valori
ajustate Yt - Y1 Y2 Y3 Y4 Y5 Y6 -
În acest caz fiecare medie mobilă se va plasa în dreptul unui termen ce corespunde cu
poziţia termenului central, numărul acestora fiind egal cu: n-(n’-1)
unde:
n reprezintă numărul termenilor seriei ce urmează a fi ajustată.
n’ - numărul termenilor din care se calculează media mobilă.
În cazul considerat: n - (n’ - 1) = 8 - (3 - 1) = 6 medii mobile.
În cel de al doilea caz, când ajustarea se face pe baza mediilor mobile calculate dintr-
un număr par de termeni, mediile mobile se obţin în două trepte:
1) medii mobile provizorii yt care se plasează între termenii seriei;
2) medii mobile definitive sau centrate yt , care se plasează în dreptul termenilor
seriei şi cu care se face ajustarea termenilor seriei iniţiale.
Reluând acelaşi exemplu pentru seria formată din 8 termeni se pot calcula 5 medii
mobile provizorii:
Yy y y y
11 2 3 4
4
; Y
y y y y4
4 5 6 7
3
;
Yy y y y
22 3 4 5
4
; Y
y y y y5
5 6 7 8
4
;
Yy y y y
33 4 5 6
4
;
Pe baza acestora , în etapa a doua se pot calcula medii mobile definitive ca o medie
aritmetică simplă a celor provizorii luate câte două:
YY Y
11 2
2
; Y
Y Y2
2 3
2
; Y
Y Y3
3 4
2
; Y
Y Y4
4 5
2
;
Ajustarea termenilor se face după următorul model:
Valori
empirice
(yt)
y1 y2 y3 y4 y5 y6 y7 y8
Mediile
mobile
provizorii
yt
Y1 Y2 Y3 Y4 Y5
Mediile
mobile
definitive
yt
Y1 Y2 Y3 Y4
Capitolul 6 125
Se observă că se vor calcula n - (n’ - 1) = 8 - (4 - 1) = 5 medii mobile provizorii şi n -
n’ = 8 - 4 = 4 medii mobile definitive.
În ambele situaţii se pierd informaţii despre unii termeni de la începutul şi sfârşitul
seriei ceea ce poate fi considerat un inconvenient al procedeului.
3.2 Ajustarea prin sporul mediu
Ajustarea prin acest procedeu se foloseşte atunci când prelucrând seria de date, se
obţin sporuri individuale cu bază în lanţ apropiate ca valoare unele de altele. Aceasta
corespunde unei creşteri a nivelurilor caracteristicii studiate sub forma unei progresii
aritmetice cu raţia egală cu modificarea medie absolută şi se bazează pe relaţia care există
între primul termen, modificările absolute cu bază în lanţ şi ultimul termen:
trendul ajustat )1(ˆ 1 tyyt nt ,1
Exemplificăm pe baza datelor din tabelul 1.
Tabelul nr. 4 Ajustare cu spor mediu
Ani Export t Ajustare cu spor mediu
2001 265 1 265
2002 269 2 265 + 4,25 = 269,25
2003 275 3 269,25 + 4,25 = 273,5
2004 279 4 273,5 + 4,25 = 277,75
2005 282 5 277,75 + 4,25 = 282
255
260
265
270
275
280
285
2001 2002 2003 2004 2005
mii
pere
ch
i
Valori observate Valori ajustate cu spor mediu
Figura 1. Ajustare cu sporul mediu
Reprezentând pe acelaşi grafic şi valorile reale şi cele ajustate în funcţie de timp se
poate urmări măsura în care procedeul ales corespunde sau nu tendinţei obiective de
dezvoltare a fenomenului studiat.
Analiza seriilor cronologice 126
3.3 Ajustarea pe baza indicelui mediu de dinamică
Acest procedeu se foloseşte atunci când termenii seriei au tendinţa de creştere de
forma unei progresii geometrice, în care raţia poate fi considerată ca egală cu indicele mediu
de dinamică I .
ajustarea pentru estimarea trendului )1(
1ˆ
t
t Iyy nt ,1
Pentru exemplul din tabelul 1 indicele mediu de evoluţie a fost 1, 015666.
Tabelul nr. 5 Ajustare cu indicele mediu
Ani Export t Ajustare cu indicele mediu
2001 265 1 265
2002 269 2 265 x 1,015666 = 269.1514
2003 275 3 269.1514 x 1,015666 = 273.3679
2004 279 4 273.3679 x 1,015666 = 277.6504
2005 282 5 277.6504 x 1,015666 = 282
255
260
265
270
275
280
285
2001 2002 2003 2004 2005
mii p
erec
hi
Valori observate Valori ajustate cu indicele mediu
Figura 2. Ajustare cu indicele mediu
3.4 Ajustarea prin metoda celor mai mici pătrate
În vederea eliminării neajunsurilor prezentate la metodele mecanice, pentru
determinarea cât mai exactă a tendinţei generale de evoluţie a fenomenului este necesar să se
utilizeze o metodă care să ţină seama de toţi termenii seriei cronologice. În acest sens se
apelează la metode analitice care au la bază un model matematic, în care tendinţa centrală a
evoluţiei se exprimă ca o funcţie de timp:
y = f(t) numită funcţie de ajustare, în care:
t - reprezintă valorile variabilei independente (timpul);
Capitolul 6 127
y - reprezintă valorile variabilei dependente (fenomenele) care sunt prezentate
în seria cronologică).
În urma alegerii funcţiei de ajustare, se impune estimarea parametrilor acestei funcţii
utilizând metoda celor mai mici pătrate. Această metodă are ca funcţie obiectiv minimizarea
sumei pătratelor abaterilor valorilor reale de la cele ajustate:
min y Yt t2
t = 1, 2, ... ,n
în cazul funcţiei liniare această condiţie devine:
y a btt ( ) min.2
În scopul determinării celor doi parametri a şi b se rezolvă sistemul de ecuaţii
normale : na b t y
a t b t t y
i i
i i i i
2
Orice fenomen social-economic depinde de o serie de factori a căror influenţă este
prezentată în timp. Timpul serveşte doar la sistematizarea materialului statistic şi se poate
anihila influenţa lui punând condiţia ti =0.
Pentru ti =0, sistemul de ecuaţii normale prezentat anterior devine:
na y
b t t y
i
i i i
2 de unde
ay
n
bt y
t
i
i i
i
2
şi pe baza rezolvării sistemului de ecuaţii se demonstrează că valoarea lui a este egală
chiar cu media seriei:
ay
ny
i
Pentru a satisface condiţia ti =0 trebuie să se considere originea valorilor de timp
ca fiind în centrul seriei.
În cazul când seria este formată dintr-un număr impar de termeni, originea valorilor de
timp va fi chiar în dreptul termenului central şi variaţia de timp se va măsura în intervale
întregi: 0; 1; 2 etc.
În cazul când seria este formată dintr-un număr par de termeni, cei doi termeni din
mijlocul seriei primesc ±0,5 1,5; 2,5 etc.
Analiza seriilor cronologice 128
În exemplul considerat, seria cronologică are 5 termeni.
Tabelul nr. 6 Ajustare cu model liniar
Ani it
Export
iy ii yt 2
it tYt 4,4274
2001 -2 265 -530 4 265.2
2002 -1 269 -269 1 269.6
2003 0 275 0 0 274
2004 1 279 279 1 278.4
2005 2 282 564 4 282.8
Total
i
it 0 i
iy 1370 i
ii yt 44 102 i
it 1370i
tY
4,410
44
2745
1370
2
i
ii
i
t
ytb
n
ya
255
260
265
270
275
280
285
-2 -1 0 1 2
Figura 3. Ajustare cu modelul liniar
4. Analiza sezonalităţii
În manifestarea concretă a fenomenelor economice, variaţiile cele mai mari ale
acestora nu sunt întotdeauna provocate de influenţa unor cauze întâmplătoare. Uneori aceste
variaţii au un caracter de regularitate şi pot fi rezultatul acţiunii unor cauze obiective, legate
de modificarea anotimpurilor.
Capitolul 6 129
Pentru a măsura influenţa valului sezonier este necesar să se cunoască periodicitatea
producerii variaţiei în funcţie de care se vor înregistra datele statistice lunare sau trimestriale.
Pentru a alege corect funcţia de ajustare se reprezintă grafic seria de date.
Figura 4. Model aditiv Fig ura 5. Model multiplicativ
Cele două grafice pun în evidenţă existenţa a trei componente:
Yij - componenta de trend care se determină cu ajutorul funcţiilor analitice;
Sij - componenta sezonieră;
ij - componenta aleatoare.
Dacă amplitudinea oscilaţiilor creşte sau descreşte în progresie aritmetică se va aplica
modelul aditiv, iar dacă amplitudinea oscilaţiilor creşte sau descreşte în progresie
geometrică se va aplica modelul multiplicativ.
În tabelul 5 sunt prezentate cele două modele comparativ.
Tabelul nr. 7
Paşii algoritmului Model aditiv Model
multiplicativ
1. Valorile empirice
2. Calculul valorilor Yij y Y Sij ij ij ij
funcţii analitice
y Y Siij ij ij ij
funcţii analitice
3. Variaţiile sezoniere S y Yij ij ij S
y
Yij
ij
ij
4. Coeficienţii sezonieri
S
S
mj nj
iji
m
1
1, S
S
mj nj
iji
m
1
1,
5. Factor de corecţie
S
n
jj
n
1
S
n
jj
n
1
6. Coeficienţii sezonieri
corectaţi dacă 0 dacă 1
Analiza seriilor cronologice 130
S Sj j
* S
Sj
j*
7. Seria ajustată y Y Sij
a
ij j * y Y Sij
a
ij j *
8. Componentele aleatoare ij ij ij
ay y ij
ij
ij
a
y
y
Consumul de bere, exprimat în mii hl, a înregistrat următoarele valori:
Tabelul nr. 8
Trimestre
Anii I II III IV
2003
2004
2005
36,6 54,7 56,5 34,5
36,3 54,4 59,9 39,0
37,8 58,7 64,0 38,2
Se cere să se determine componentele de trend, să se analizeze sezonalitatea şi să se
prognozeze comsumul de bere pentru trimestrele anului următor.
Figura 6. Evoluţia consumului de bere pe ani şi trimestre
Din reprezentarea grafică se observă faptul că fenomenul are tendinţă de creştere peste
care se suprapun componentele sezoniere. Pentru analiza trendului se foloseşte modelul aditiv.
0
1 0
2 0
3 0
4 0
5 0
6 0
7 0
I I I I I I I V I I I I I I I V I I I I I I I V
trimestre
mii
hl
Capitolul 6 131
Tabelul nr. 9
Trim. yi ti ti2 tiyi Yi=a+bti s
I 35.6 -5.5 30.25 -195.8 44.4 -8.8
II 54.7 -4.5 20.25 -246.15 45.0 9.7
III 56.5 -3.5 12.25 -197.75 45.5 11.0
IV 34.5 -2.5 6.25 -86.25 46.1 -11.6
I 36.3 -1.5 2.25 -54.45 46.6 -10.3
II 54.4 -0.5 0.25 -27.2 47.2 7.2
III 59.9 0.5 0.25 29.95 47.7 12.2
IV 39 1.5 2.25 58.5 48.3 -9.3
I 37.8 2.5 6.25 94.5 48.8 -11.0
II 58.7 3.5 12.25 205.45 49.4 9.3
III 64 4.5 20.25 288 49.9 14.1
IV 38.2 5.5 30.25 210.1 50.5 -12.3
Total 569.6 0 143 78.9
467,4712
12
1 i
iy
a 5517,012
1
2
12
1
i
i
i
ii
t
ty
b
Tabelul nr. 10
Componente sezoniere pe trimestre
Ani I II III IV
2003 -8,8 9,7 11 -11,6
2004 -10,3 7,2 12,2 -9,3
2005 -11 9,3 14,1 -12,3
jS -10,03 8,73 12,43 -11,07
Mărimea = 0,0166 o considerăm aproximativ egală cu zero.
Coeficienţii de sezonalitate scot în evidenţă faptul că la consumul de bere sezonul de
vârf este trimestrul III iar sezonul slab trimestrul IV.
Pentru prognoză se parcurg paşii:
se prognozează componentele de trend;
se corectează cu coeficienţii de sezonalitate.
Tabelul nr. 11
I II III IV
jtp 6.5 7.5 8.5 9.5
jj tpbaYp 51.1 51.6 52.2 52.7
jjj SYpyp 41.0 60.3 64.6 41.6
Analiza seriilor cronologice 132
unde:
tpj – timpul de prognoză
Ypj – componentele de trend prognozate
ypj – valorile finale prognozate.
Rezumat
Analiza seriilor cronologice presupune: stabilirea obiectivului cercetării, culegerea
datelor şi asigurarea comparabilităţii lor în timp, calculul indicatorilor statistici, analiza
trendului, analiza sezonalităţii, efectuarea calculelor de prognoză.
Termeni importanţi: modificare absolută, modificare relativă, mărimi medii,
componente de trend, componente sezoniere, valori prognozate
Teste de autocontrol:
1. Definiţi seria cronologică
2. Ce indicatori absoluţi cunoaşteţi ?
3. Care sunt indicatorii calculaţi sub formă de mărimi relative?Cum se interpretează ?
4. Ce reflectă mărimile medii ?
5. Ce metode de ajustare (analiza trendului) cunoaşteţi ?
Probleme propuse
1. Despre evoluţia cifrei de afaceri a unei societăţi comerciale se cunosc datele:
ANI 2002 2003 2004 2005
% modificării relative a cifrei de
afaceri faţă de anul precedent
+3
+4
+2
+4
Ştiind că cifra de afaceri din 2004 a fost de 80 mii RON, modificarea medie anuală
absolută în perioada 2002-2005 a fost de :
a. 1,2 mii RON/an;
b. 1,2 %/an;
c. 2,5 mii RON/an;
d. 210%/an;
e. 3 mii RON/an.
2. Pe baza unei serii cronologice formată din 11 ani, termeni consecutivi, s-a ajuns
la concluzia că tendinţa de evoluţie a unei variabile este exprimată prin funcţia tYt 60400
(în codiţiile în care 0t ). Valorile estimate ale variabilei analizate pentru următorii trei ani
sunt:
a. 1300; 1480; 1600;
b. 1120; 1180; 1240;
c. 340; 280; 220;
d. 460; 520; 580;
e. 760; 820; 880.
Capitolul 6 133
3. Evoluţia salariului mediu lunar al angajaţilor unei societăţi comerciale pe primele
două trimestre ale unui an au fost următoarele:
Luna Salariul
- RON -
Ianuarie 596
Februarie 601
Martie 609
Aprilie 606
Mai 607
Iunie 612
Să se calculeze indicatorii specifici seriilor cronologice.
4. O societate comercială producătoare de autoturisme a obţinut în ultimele cinci luni,
următoarea producţie fizică:
Luna Autoturisme
- mii buc -
Noiembrie 19
Decembrie 14
Ianuarie 15
Februarie 18
Martie 21
a) Să se analizeze evoluţia producţiei fizice pe cele cinci luni.
b) Să se previzioneze producţia fizică pentru următoarele trei luni.
5. Considerăm următoarele date privind numărul de turişti într -o staţiune:
Anii
Sporul cu baza în lanţ
(mii pers.)
2003 -
2004 +2
2005 -1
2006 +6
2007 +2
2008 +5
Ştiind că în 2008 numărul de turişti a fost cu 5% mai mare decât în 2003, se cere:
a) Să se reconstituie seria care exprimă numărul de turişti pentru fiecare an;
b) Să se calculeze indicatorii relativi şi medii;
c) Să se determine trendul, folosind:
- metoda sporului mediu;
- metode analitice (modelul liniar);
d) Să se previzioneze numărul de turişti pentru anul 2009.
Analiza seriilor cronologice 134
6. Următoarele date se referă la vânzările de maşini de spălat într -un judeţ:
Anul Ritmul cu baza în lanţ (%)
2003 -
2004 +5
2005 +16
2006 - 6
2007 +10
2008 +4
Ştiind că în anul 2004 s-au vândut 2000 de maşini de spălat, se cere:
a) Să se reconstituie seria de valori absolute;
b) Să se calculeze indicatorii relativi şi medii;
c) Să se determine trendul cu metode analitice (modelul liniar);
d) Să se previzioneze volumul vânzărilor pentru anul 2009.
7. Se cunosc datele:
Valoarea încasărilor (mii RON)
Anii I II III IV
2006
2007
2008
43 65 110 180
55 88 125 192
70 92 137 214
Se cere:
1. Reprezentaţi grafic datele din tabel;
2. Efectuaţi analiza sezonalităţii;
3. Prognozaţi valorile pentru trimestrele anului următor.
Capitolul 7 135
Capitolul 7
Tema Metoda indicilor
Obiectivele 1. Noţiunea de indice statistic. Probleme teoretice ale construirii
indicilor
2. Indicii agregaţi. Sisteme de ponderare folosite la construirea
indicilor de grup
3. Indicii de grup calculaţi ca medie a indicilor individuali
4. Indicii calculaţi ca raport a două medii
Mijloace
- citire/învăţare
- întrebări, probleme ce apar, explicaţii
- definiţii, explicaţii ce trebuie reţinute
- situaţii economice concrete, supuse analizei, exemple (sub
lupă)
- teme de casă, aplicaţii practice pentru studenţi
Finalitatea 1. stabilirea variabilei dependente şi a factorilor de influenţă
2. efectuarea analizei cu ajutorul indicilor la nivelul componentelor unui
ansamblu
3. efectuarea analizei la nivelul ansamblului cu descompunerea pe factorii
de influenţă
Evaluarea - parcurgerea aplicaţiilor propuse
Timp de lucru
necesar
1. Pentru cunoaşterea problemei: 4 ore
2. Pentru rezolvarea temelor: 12 ore + timpul de documentare
Metoda indicilor 136
Metoda indicilor
1. Noţiunea de indice statistic. Probleme teoretice ale construirii indicilor
Metoda indicilor face parte din metodele de analiză factorială, prin care se
măsoară variaţia în timp şi în spaţiu a unui fenomen complex în funcţie de modificarea
factorilor de influenţă. Indicii se calculează sub forma unui raport, deci sunt mărimi relative
adimensionale ca urmare a faptului că atât la numărător cât şi la numitor figurează două valori
ale aceluiaşi indicator. Aceasta înseamnă că aplicarea indicilor presupune identificarea
factorilor care determină variaţia fenomenului complex, înregistrarea nivelului acestora pentru
toate unităţile ce compun colectivitatea şi construirea relaţiilor care să permită caracterizarea
modificării relative atât la nivelul întregului ansamblu, cât şi al elementelor sale componente.
Specific metodei indicilor este faptul că variaţia fenomenului complex se descompune
integral pe factorii înregistraţi, ceea ce înseamnă că între nivelul ansamblului şi variaţia
factorilor de influenţă trebuie să existe o relaţie de produs. La aplicarea acestei metode,
factorii luaţi în discuţie se pot grupa după natura lor în două categorii:
factorii cantitativi, de natură extensivă: numărul salariaţilor, cantităţile de
produse, suprafaţa însămânţată etc. notaţi cu fi;
factorii calitativi, de natură intensivă, care sunt înregistraţi sub formă de
caracteristici ale unităţilor luate în calcul. De exemplu: preţurile de vânzare ale
produselor, costurile produselor etc., simbolizaţi cu xi. Cel mai frecvent apar ca
mărimi relative de intensitate calculate ca un raport între o variabilă complexă yi şi
factorul cantitativ fi.
Această separare a factorilor după natura lor este necesară deoarece la construirea
indicilor pentru ansamblul de elemente complexe trebuie avut în vedere faptul că valorile
individuale ale variabilelor înregistrate pot fi însumabile direct sau neînsumabile din punct de
vedere economic. În unele cazuri valorile individuale ale factorilor cantitativi, pot fi însumate
direct (produse de acelaşi fel, numărul angajaţilor, numărul tractoarelor de aceeaşi putere etc.)
iar în altele, acestea nu sunt însumabile (cantităţile de produse diferite, maşinile agricole dintr -
o întreprindere agricolă, cantităţile de produse alimentare cumpărate de o familie într-o lună
etc.). Valorile factorilor calitativi sunt întotdeauna neânsumabile direct. Determinarea
nivelului totalizator al valorilor luate în calculul indicilor, în cazurile în care valorile
individuale nu pot fi însumate direct din punct de vedere economic, necesită folosirea
ponderilor.
Ponderea are rolul de comăsurător al valorilor factorilor neânsumabili şi figurează
întotdeauna în numărătorul şi numitorul raportului cu aceeaşi valoare. Ca atare, elementul
care rămâne constant în numărător şi numitor are denumirea generică de pondere. Ponderea
poate să fie, după caz, atât factorul cantitativ cât şi cel calitativ.
Variabila a cărei variaţie interesează, figurează în numărătorul şi numitorul raportului
cu valorile corespunzătoare diferitelor unităţi de timp sau de spaţiu, iar indicele de grup care
rezultă se numeşte indice factorial.
Dacă se compară nivelul unui fenomen din perioada curentă cu cel dintr-o perioadă
anterioară, rezultă indicele dinamicii. Rezultatul comparării aceluiaşi fenomen, în aceeaşi
Capitolul 7 137
perioadă de timp, situat în două unităţi teritoriale, se concretizează în indici teritoriali sau de
spaţiu.
Conţinutul indicatorului comparat determină denumirea indicilor calculaţi, de exemplu
indicele preţurilor, indicele salariului etc.
Mărimile relative ale dinamicii, ale planului şi de coordonare pot fi considerate drept
indicii individuali, notaţi cu i, dacă exprimă variaţia relativă la nivelul unei singure unităţi de
observare.
Indicii de grup, simbolizaţi cu I, se calculează la nivelul unei grupe sau pe întregul
ansamblu şi exprimă variaţia medie relativă a fenomenului studiat. Ca atare, indicele de grup
nu este o sumă a indicilor individuali respectivi, ci o medie a acestora. Indicii individuali fiind
mărimi relative, media lor poate să fie aritmetică sau armonică.
Privitor la folosirea metodei indicilor, de menţionat că ei se aplică, de regulă, sub
formă de sistem. De exemplu, sistemul indicilor valorii, ai volumului fizic şi ai preţurilor.
Fiecare sistem de indici poate fi privit ca un sistem independent sau ca un subsistem în cadrul
unui sistem mai cuprinzător, fie din punct de vedere organizatoric, fie din punct de vedere al
gradului de cuprindere a caracteristicilor ce se găsesc în relaţii de interdependenţă.
Construirea şi folosirea indicilor de grup în caracterizarea unui fenomen complex
presupune efectuarea unei analize calitative a indicatorului a cărei variaţie se studiază, din
care trebuie să rezulte:
separarea factorilor, în cantitativi (extensivi) şi calitativi (intensivi);
dacă valorile factorilor sunt însumabile direct sau nu;
ce bază de comparaţie trebuie folosită;
sistemul de ponderare care trebuie utilizat;
ce relaţie de calcul poate fi aplicată având în vedere datele de care se
dispune.
În funcţie de aceste elemente, indicii de grup se pot construi sub formă de indici
agregaţi, indici calculaţi ca medie a indicilor individuali şi ca indici determinaţi ca raport a
două medii. La rândul lor aceste forme de indici de grup se particularizează în funcţie de baza
de comparaţie (fixă sau mobilă) şi de ponderile utilizate (constante sau variabile). Desigur că,
fiecare din aceste metode prezintă avantaje şi dezavantaje şi, deci, nu poate fi substituită una
alteia.
2. Indicii agregaţi. Sisteme de ponderare folosite la construirea indicilor de grup
La nivelul unui ansamblu, valorile variabilelor statistice înregistrate pot fi
însumate sau calculate sub formă de mărime medie. În primul caz se obţin valori agregate
care trebuie, prin metoda indicilor, să fie comparate în timp sau spaţiu. Din această comparare
rezultă un indice agregat. Dacă valorile individuale (parţiale) ale agregatului sunt însumabile
direct nu apare nici o problemă deosebită. Dacă nu sunt însumabile, decât printr-un alt
element, atunci acest etalon poartă denumirea de pondere şi ea trebuie să fie aleasă cu
discernământ.
În practica statistică, problemele cele mai dificile apar în legătură cu alegerea şi
folosirea ponderilor la construirea indicilor de grup.
Pe măsura dezvoltării statisticii s-au propus mai multe sisteme de ponderare care au
fost particularizate, de regulă, pe exemplul indicelui volumului fizic sau al preţurilor
producţiei şi circulaţiei mărfurilor. Pentru generalizare însă se vor prezenta sistemele de indici
pentru o variabilă complexă (yi), dependentă de un factor calitativ (x i) şi un factor cantitativ
(fi), adică yi = xi . fi.
Metoda indicilor 138
Având trei variabile înregistrate la nivelul unităţilor complexe care formează în mod
permanent colectivitatea supusă observării, înseamnă că se pot calcula trei indici individuali şi
trei indici de grup.
Indicii individuali se calculează ca indici simpli folosind datele înregistrate pentru
fiecare variabilă la nivelul unităţii de observare folosită iy
yi
f
fi
x
x
y f x
10
1
0
10
1
0
10
1
0
; ; . În
acest caz indicii de grup la nivelul întregului ansamblu se calculează ca indici agregaţi. Pentru
prezentarea diferitelor sisteme de ponderare se presupune că variabila y i este însumabilă direct
şi că se descompune la nivelul fiecărei unităţi în produsul dintre variabila x i - cu caracter de
mărime statistică derivată - şi variabila fi, cu caracter de variabilă cantitativă neînsumabilă
direct. Aceasta înseamnă că pentru indicii de grup ai celor două variabile - factori se va folosi
tot un indice agregat în care succesiv factorul de indexat este variabil, iar celălalt are caracter
de pondere.
Rezultă deci, că într-un sistem de indici - cel puţin la nivelul întregului ansamblu -
indicii factoriali trebuie să cuprindă aceleaşi elemente ca şi indicele variabilei complexe.
În cazul variabilei complexe yi = xi . fi, indicele de grup va fi:
I
y
y
x f
x f
x f
x f
y
i
i
k
i
i
k
i i
i
k
i
i
k
i
10
1
1
0
1
1 1
1
0
1
0
1 1
0 0
în care, k = numărul unităţilor observate.
Pentru a evita încărcarea formulelor cu prea multe simboluri se renunţă în continuare
la i şi k după care se face însumarea, înţelegându-se că însumarea cuprinde toate elementele
constitutive ale colectivităţii.
Indicii factoriali derivaţi din acesta I Iy f y x
10
10
( ) ( )si
trebuie să prezinte variaţia
unui singur factor, iar celălalt să rămână constant, deci să joace rolul de pondere, şi anum e:
Ixf
xfI
x f
x f
y f y x
10
1
0
10
1
0
( ) ( )
si
La rândul lor, ponderile nu sunt elemente abstracte ci ele pot fi din perioada curentă
sau din cea de bază (în cazul indicilor de dinamică).
Un prim sistem de ponderare este acela propus în 1864 de E. Laspeyres, la care
ponderile folosite sunt cele din perioada de bază. În acest caz, indicii factoriali se calculează
pe baza relaţiilor:
pentru factorul cantitativ:
Ix f
x f
y f
10
0 1
0 0
( )
pentru factorul calitativ:
Ix f
x f
y x
10
1 0
0 0
( )
Capitolul 7 139
Adoptarea sau respingerea celor doi indici nu se poate face decât după ce se analizează
conţinutul lor şi măsura în care ei reflectă nişte proporţii reale cu privire la dezvoltarea
fenomenelor la care se referă. Fiecare indice trebuie analizat separat corespunzător cu
conţinutul indicatorilor absoluţi pe care-i conţine şi a relaţiilor de interdependenţă dintre
fenomenul de indexat şi ponderile folosite.
Un alt sistem de ponderare este cel propus în 1874 de H. Paasche, la care ponderile
utilizate sunt cele din perioada curentă:
pentru factorul cantitativ:
Ix f
x f
y f
10
1 1
1 0
( )
pentru factorul calitativ:
Ix f
x f
y x
10
1 1
0 1
( )
Şi aceste formule trebuie analizate în raport cu conţinutul şi scopul analizei.
Un alt indice bazat pe folosirea ponderilor din ambele perioade este indicele ideal al
lui I. Fisher. El a calculat un indice de grup al preţurilor ca o medie geometrică a celor doi
indici agregaţi, de tip Laspeyres şi de tip Paasche. Prin generalizare, pentru indicele variabilei
calitative se obţine:
Ix f
x f
x f
x f
y x
10
1 0
0 0
1 1
0 1
( )
Acest indice prezintă avantajul că se încadrează în intervalul de variaţie al valorilor
indicilor calculaţi pe baza celor două sisteme de ponderare, deci va compensa o parte din
tendinţa de modificare a ponderilor folosite. Practic, prezintă însă dezavantajul că necesită
cunoaşterea separată a tuturor elementelor de calcul şi combinarea tuturor variantelor posibile.
Indicele lui Fisher se poate aplica pentru orice caracteristică statistică a cărei variaţie
se măsoară cu ajutorul unui indice ponderat. Ca atare, indicele factorului cantitativ de tip
Fisher se bazează pe relaţia:
Ix f
x f
x f
x f
y f
10
0 1
0 0
1 1
1 0
( )
Indicele lui Fisher se foloseşte în special în calculul indicilor teritoriali, pe plan
internaţional.
Existenţa în teoria şi practica statistică a mai multor sisteme de ponderare provine din
faptul că nici una din formulele de calcul propuse nu satisface integral nici teoria şi nici
practica folosirii acestei metode pentru studiul variaţiei complexe a fenomenelor1. În plus,
dacă pe plan teoretic problema este mai uşor de rezolvat, pe plan practic apar uneori dificultăţi
aproape de neînlăturat. Este suficient, de exemplu, să fie luat în discuţie indicele preţurilor,
1 În practica statistică se aplică în mod curent fie sistemul propus de Laspeyres fie o variantă care provine din
combinarea sistemului lui Laspeyres şi al lui Paasche. Criteriul ce stă la baza optării pentru una din cele
două variante este, de regulă, existenţa datelor necesare calculării indicilor.
Metoda indicilor 140
care ar trebui să reflecte numai modificarea pură a preţurilor. Relaţia de calcul ar trebui să fie
un indice de tip Laspeyres ( Ix f
x f
x
10
1 0
0 0
, respectiv, Ip q
p q
p
10
1 0
0 0
), care ar corespunde
ipotezei că au rămas neschimbate cantităţile şi s-au modificat numai preţurile. Ori, eforturile
omenirii s-au concentrat totdeauna pentru obţinerea unor cantităţi tot mai mari de bunuri şi
servicii. De aici, problema care se pune este în principal aceea dacă preţul poate fi izolat de
cantitate. Dacă nu, atunci se naşte a doua întrebare, şi anume: interesează variaţia preţurilor
cantităţilor produse vândute, consumate etc. În perioada de bază sau din perioada curentă?
Răspunsul nu poate fi altul decât că producătorul, vânzătorul sau cumpărătorul resimt variaţia
de preţuri atunci când s-a produs, deci în perioada curentă. Ca atare indicele preţurilor ar
trebui să fie calculat ca un indice de tip Paasche ( Ix f
x f
x
10
1 1
0 1
, respectiv, Ip q
p q
p
10
1 1
0 1
).
Mai trebuie verificat dacă aplicând relaţia de sistem, care presupune combinarea unui indice
Paasche cu un indice Laspeyres, este satisfăcută în cazul indicelui volumului fizic prin analiza
direcţiei şi conţinutului acestuia. Cu alte cuvinte, pentru indicele volumului fizic, potrivit
relaţiei de sistem, trebuie folosit un indice Laspeyres ( Ix f
x f
f
10
0 1
0 0
, respectiv,
Ip q
p q
q
10
0 1
0 0
). Acest indice corespunde ipotezei că ar fi rămas neschimbate preţurile şi s-ar
fi modificat numai cantităţile.
Dacă se folosesc cei doi indici cu sisteme diferite de ponderare, apare relaţia de
sistem, şi anume:
Iv
v
q p
q p
q p
q p
q p
q p
v
10
1
0
1 1
0 0
1 0
0 0
1 1
1 0
O problemă care se rezolvă cu ajutorul indicilor este şi aceea a calculării variaţiilor în
mărimi absolute a fenomenelor de indexat. Variaţia absolută se calculează, în general, ca
diferenţă între numărătorul şi numitorul indicelui. În consecinţă, dacă indicele variabilei
complexe este egal cu produsul indicilor factoriali, atunci modificarea absolută a fenomenului
complex este egală cu suma variaţiilor absolute factoriale.
În cazul valorii, volumului fizic şi preţurilor, rela ţia va fi:
v qp v q v p( ) ( ) ( )
în care:
v qp
v q
v p
q p q p
q p q p
q p q p
( )
( )
( )
;
;
1 1 0 0
1 0 0 0
1 1 1 0
Avantajul constă în faptul că este suficient ca din diferite surse de informaţii să se
cunoască doi indici ca să se poată determina al treilea.
Capitolul 7 141
În practică însă folosirea acestui sistem are o restricţie, şi anume: modul în care se
transmite informaţia, periodicitatea transmiterii, pentru cantităţi şi preţuri.
Dacă sistemul informaţional statistic existent permite obţinerea indicatorilor din
numărătorii şi numitorii indicilor respectivi, se pot aplica relaţiile de mai sus. De regulă o
asemenea metodologie se poate aplica fără dificultăţi la nivelul întreprinderilor unde există o
evidenţă privind cantităţile şi preţurile.
Pentru a prezenta metodologia de calcul a indicilor de grup sub formă
agregată, se consideră că o întreprindere produce trei produse pentru care se cunosc cantităţile
produse şi preţurile unitare pentru perioada de bază şi perioada curentă (tabelul 1, col. 1,2,3 şi
4).
Datele tabelului (col. 1-6) permit analizarea modificării relative şi absolute a
cantităţilor şi preţurilor unitare pe fiecare produs şi pe total.
Tabelul nr. 1 Cantitatea (buc.)
Preţ unitar (RON)
Valoarea producţiei (RON)
Produse U/M Perioada
de bază
(q0)
Perioada
curentă
(q1)
Perioada
de bază
(p0)
Perioada
curentă
(p1)
Perioada
de bază
(q0p0)
Perioada
curentă
(q1p1)
Perioada
curentă la
preţurile
perioadei
de bază
(q1p0)
a b 1 2 3 4 5 6 7
A tone 50 52 1000 1100 50000 57200 52000
B buc. 200 220 60 63 12000 13860 13200
C buc. 500 570 100 90 50000 51300 57000
Total - - - - 112000 122360 122200
Modificarea relativă pe fiecare produs se stabileşte pe baza indicilor individuali iar
modificarea absolută se calculează ca diferenţă dintre nivelul din perioada curentă şi cel din
perioada de bază.
iq
q
I
I
I
q
A
q
B
q
C
q
10
1
0
52
501 04
220
200110
570
500114
,
,
,
qA
qB
qC
52 50 2
220 200 20
570 500 70
tone
buc.
buc
ip
p
i
i
i
p
A
p
B
p
C
p
10
1
0
1100
1000110
63
601 05
90
1000 90
,
,
,
RON1010090
RON36063
10010001100
pC
pB
pA RON
Metoda indicilor 142
iq p
q p
i
I
I
v
A
v
B
q
C
q
10
1 1
0 0
57200
500001144
13860
120001155
51300
500001 026
,
,
,
RON1300
RON1860
RON7200
vC
vB
vA
Pe ansamblul celor trei produse, valoarea producţiei a crescut în perioada curentă faţă
de perioada de bază de 1,0925 ori sau a reprezentat în perioada curentă 109,25% faţă de anul
de bază, sau a crescut cu 9,25%. Aceste concluzii rezultă din indicele de grup al valorii
producţiei:
Iv
v
q p
q p
v
10
1
0
1 1
0 0
122360
1120001 0925
, sau 109,25%
Valoarea producţiei a crescut în perioada curentă cu 10360 RON.
v q p q p 1 1 0 0 122360 112000 10360 RON
Pornind de la faptul că, v = q.p, înseamnă că modificarea valorii producţiei trebuie
analizată şi explicată pornind de la schimbările intervenite în nivelul cantităţilor şi preţurilor
unitare la fiecare produs în parte. Evidenţierea influenţei celor doi factori (q şi p) asupra
modificării producţiei, pe ansamblu, presupune calcularea indicelui de grup al volumului fizic
şi al indicelui preţurilor.
Indicele volumului fizic se calculează în practică ca un indice de tip Laspeyres:
Iq p
q p
q
10
1 0
0 0
122360
1120001 091
, sau 109,1%
Rezultă că valoarea producţiei, pe ansamblul celor trei produse trebuia să crească în
condiţiile în care s-ar fi modificat numai producţia fizică (preţurile ar fi rămas la nivelul
anului de bază) de 1,091 ori sau cu 9,1%. În mărime absolută creşterea trebuia să fie de 10200
RON.
v q q p q p( ) 1 0 0 0 122200 112000 10200 RON
sau,
v q q q p q p( ) ( ) . . . 1 0 0 0 21000 20 60 70100 10200 RON
Indicele preţurilor se calculează cu un indice de tip Paasche:
Iq p
q p
p
10
1 1
1 0
122360
1222001 001
, sau 100,1%
Capitolul 7 143
Modificarea preţurilor unitare, în condiţiile folosirii drept pondere a cantităţilor din
perioada curentă, trebuia să conducă la creşterea valorii producţiei cu 0,1%, ceea ce înseamnă
că valoarea producţiei ar fi reprezentat în perioada curentă 100,1% faţă de perioada de bază.
Modificarea absolută a valorii producţiei trebuia să fie, în aceste condiţii, de +160
RON, mărime ce rezultă din:
v p q p q p( ) 1 1 1 0 122360 122200 160 RON
Pornind de la relaţia dintre cei trei indici, indicele valorii este egal cu produsul dintre
indicele volumului fizic şi indicele preţului respectiv:
i i iv q p
10
10
10
şi I I Iv q p
10
10
10
iar modificarea absolută a valorii producţiei este egală
cu suma modificărilor absolute determinate de cei doi factori:
v v q v p ( ) ( )
Contribuţia relativă a celor doi factori la modificarea valorii producţiei se prezintă
astfel:
Tabelul nr. 2
Produse Modificarea absolută (RON) Contribuţia procentuală
totală din care
v q p( , ) v q( ) v p( ) 100 (v p( ) /v ).100
A +1200 +2000 +5200 27,8 72,2
B +1860 +1200 +660 64,5 35,5
C +1300 +7000 -570 538,5 438,5
Total +10360 +10200 +160 98,5 1,5
Rezultă faptul că sporirea valorii producţiei a fost determinată, în principal, de
creşterea producţiei fizice, factor ce deţine 98,5% din creşterea valorii producţiei.
Calcularea indicelui volumului fizic şi al preţurilor sub formă agregată
presupune că se cunosc cantităţile şi preţurile acestora pentru cele două perioade comparate.
În aplicarea acestor relaţii se întâmpină dificultăţi legate de datele furnizate de evidenţa
curentă, pe de o parte şi de produsele nou apărute pe de altă parte. Aşa cum rezultă din analiza
datelor din tabelul 1, un sistem integrat al indicelui valorii, volumului fizic şi al preţurilor nu
se poate obţine decât dacă producţia este comparabilă. Dacă au apărut produse noi sau au fost
eliminate unele produse în perioada curentă, atunci relaţia de sistem I I Iv q p
10
10
10
nu mai este
satisfăcută. Pentru a lărgi cât mai mult gama produselor comparabile, în practică se pune
problema să se calculeze un indice de preţuri independent, iar indicele volumului fizic să se
obţină ca un raport între indicele valorii şi indicele preţurilor.
Problema includerii produselor noi în calculul indicilor se pune şi se rezolvă
diferenţiat în cazul indicelui volumului fizic şi al preţurilor.
La determinarea indicelui volumului fizic cantităţile din perioada curentă şi din
perioada de bază sunt evaluate la aceleaşi preţuri şi anume din perioada de bază q p
q p
1 0
0 0
,
produsele noi însă nu au asemenea preţuri. Necuprinderea lor, din acest motiv, în mărimea
Metoda indicilor 144
agregatului q1p0 ar însemna să se denatureze conştient concluziile privitoare la rezultatele
activităţii unităţii sau ramurii în cauză. În rezolvarea acestei probleme se pot folosi mai mult
căi.
O primă cale ar consta în evaluarea produselor noi la preţurile la care au apărut, deci la
preţurile efective. Aceasta ar însemna, însă, să se folosească două preţuri pentru obţinerea
indicatorului din numărătorul indicelui volumului fizic.
O a doua cale posibilă constă în recalcularea preţurilor produselor noi prin corectarea
preţurilor efective al acestora, pe baza unor indici de preţuri calculaţi pentru producţia
comparabilă, corespunzătoare grupei din care fac parte produsele noi.
Dacă produsele noi nu pot fi încadrate în niciuna din grupele de produse, la evaluarea
şi includerea acestora în calculul indicelui volumului fizic se poate porni de la preţurile
produselor similare, practicate pe piaţa externă.
Determinarea indicelui preţurilor presupune existenţa preţului în cele două perioade
comparate. Existenţa preţurilor însă, este condiţionată de realizarea produsului respectiv, în
ambele perioade. Ca urmare, în calculul indicelui preţurilor se cuprind numai produsele care
s-au produs în ambele perioade.
3. Indicii de grup calculaţi ca medie a indicilor individuali
Calcularea indicelui agregat al volumului fizic şi preţurilor presupune
evaluarea cantităţilor din perioada curentă, atât la preţurile acestei perioade cât şi la cele ale
perioadei de bază. În evidenţa contabilă, producţia, desfacerile etc. se urmăresc însă, în mod
curent, numai la preţurile curente, efective (q1p1). Deci la determinarea indicelui de grup
trebuie să se pornească de la valoarea din cele două perioade şi de la indicii individuali pe
fiecare element al ansamblului, respectiv să se calculeze o medie a mediilor individuale. În
acest caz, indicele de grup calculat ca o medie a indicilor individuali trebuie să fie egal cu
indicele agregat. Aceasta înseamnă că numărătorul sau numitorul indicelui agregat trebuie să
fie ponderea cu care se introduc în calculul indicilor individuali corespunzători.
Indicele de grup al volumului fizic se va calcula ca o medie aritmetică ponderată în
care variabila o reprezintă indicele individual iq
qq i qq q
10
1
0
1 10
0
iar ponderea, valoarea
din perioada de bază (q0p0) pe fiecare element al colectivităţii:
Iq p
q p
i q p
q p
q
q
10
1 0
0 0
0 0
0 0
Din numărătorul raportului rezultă că indicele volumului fizic se poate calcula sub
formă de medie aritmetică, dacă nu au apărut produse noi, deoarece, pentru acestea, nu se pot
calcula indici individuali.
În cazul indicelui preţurilor, cunoscând indicii individuali ai preţurilor
ip
pp
p
i
p
p10
1
0
01
10
şi valoarea din perioada curentă (q1p1) se va utiliza media armonică
ponderată:
Capitolul 7 145
Iq p
q p
q p
iq p
p
p
10
1 1
1 0
1 1
10
1 1
1
În mod similar se calculează indicele mediu aritmetic sau armonic şi al altor variabile
ca: salariul mediu, productivitatea muncii, recolta medie, costul mediu, eficienţa fondurilor
fixe etc., dacă se cunosc indicii individuali şi nivelul totalizator din perioada de bază sau
curentă, pe fiecare element sau grupe de elemente ale colectivităţii. La alegerea formei mediei
este indicat să se aibă în vedere datele disponibile şi folosirea acelor ponderi care nu mai
necesită recalculări.
Relaţiile generale de calcul a indicilor de grup ca medie a ind icilor individuali sunt:
Ii x f
x fi
f
f
y f
f
f
10
10
0 0
0 0
10
1
0
( )
unde:
Ix f
ix f
ix
x
y x
x
x
10
1 1
10
1 1
10
1
01
( )
unde :
În general, indicele de grup al variabilei cantitative se calculează ca o medie aritmetică
a indicilor individuali, iar indicele de grup al variabilei calitative se determină ca o medie
armonică a indicilor individuali.
Dacă în locul datelor complete privind cantităţile şi preţurile unitare cuprinse în
tabelul 1 se dispune doar de valoarea producţiei în perioada curentă şi de modificarea
preţurilor unitare, indicele de grup al preţurilor se poate calcula ca o medie armonică,
ajungându-se la aceeaşi valoare numerică ca şi când s-ar fi folosit indicele agregat. Se
exemplifică prin datele tabelului 3.
Tabelul nr. 3
Produse
Valoarea producţiei
în perioada curentă,
(RON)
Modificarea
preţurilor unitare (%)
R=(ip-1)100
ip=R
p+100 (%)
A 57200 +10 110
B 13860 + 5 105
C 51300 -10 90
Total 122360 - -
Aplicarea indicelui mediu armonic presupune cunoaşterea indicilor individuali ai
preţurilor (ip). Modificarea procentuală a preţurilor este ritmul preţurilor. Deci, indicele
individual al preţurilor se obţine adăugând 100 la ritmul preţurilor (col. 3):
Iq p
iq p
p
p
10
1 1
10
1 1
1
122360
1
11057200
1
1 0513860
1
0 9051300
122360
1222001 001
, , ,
,
Metoda indicilor 146
v p
pp q
ip q( ) 1 1
10
1 1
1122360 122200 160 RON
Similar se poate calcula şi indicele de grup al volumului fizic pornind de la valoarea
din perioada de bază (q0p0) şi indicii individuali iq
10
.
091,1112000
122200
112000
50014,120010,15004,1
00
000
1
01
pq
pqiI
q
q sau 109,1%
Oricare ar fi procedeul de calcul - indici agregaţi sau indici calculaţi ca medie a
indicilor individuali, indicii factoriali trebuie să conducă la acelaşi rezultat.
De reţinut, că cei doi indici calculaţi ca medie aritmetică sau armonică au în vedere
substituirea indicelui agregat. Formula utilizată depinde de sistemul de ponderare acceptat la
calculul indicelui agregat. Cum la indicele de tip Laspeyres valorile numerice din aceeaşi
perioadă sunt în numitor (vezi indicele volumului fizic), el se poate substitui printr-un indice
mediu aritmetic, în timp ce la un indice de tip Paasche, valorile din aceeaşi perioadă sunt în
numărător (vezi indicele preţurilor), el se substituie cu un indice mediu armonic.
4. Indicii calculaţi ca raport a două medii
În practica economică se întâlnesc frecvent cazuri când este necesar să se
calculeze indici de grup pentru variabile calitative care au caracter de medii, valorile
individuale asociindu-se cu valorile unei variabile cantitative ale cărei elemente sunt
însumabile direct şi joacă rolul de frecvenţă, specific acestor variabile calitative este faptul că
valorile individuale sunt rezultatul raportului dintre valorile a două caracteristici de natură
diferită (interdependente), având caracter de mărimi relative de intensitate. Sintetizarea
valorilor unei asemenea caracteristici la nivelul unei grupe sau pe întreaga colectivitate se
realizează prin intermediul mediei, iar indicele de grup se calculează ca un raport a două
medii. Asemenea variabile calitative, cu largă utilizare în practica economică, sunt:
productivitatea muncii; salariul mediu, costul (preţul) mediu pe produs; eficienţa fondurilor
fixe; rata rentabilităţii, durata medie a creditelor etc.
Relaţia generală de calcul a indicelui de grup sub formă de raport a două medii este:
Ix
x
x f
f
x f
fsv
x
1
0
1 1
1
0 0
0
:
Din relaţia de mai sus rezultă că x x0 1 dacă se modifică fie valorile individuale ale
variabilei, fie frecvenţele acesteia, fie şi una şi alta. Variabila de natură cantitativă (f) nu
influenţează însă numai prin variaţia sa individuală ci şi prin modificarea ponderii cu care
apar valorile calitative f
ffi
i
i
*
, deci factorul cantitativ este, în acest caz, şi factor
structural, de unde şi denumirea indicelui de, indice cu structură variabilă.
Capitolul 7 147
Indicele cu structură variabilă se transformă într-un indice agregat dacă se operează cu
frecvenţe relative.
Ix
x
x f
x f
x g
x gsv
x
f
f
1
0
1 1
0 0
1 1
0 0
*
*
în care: x1, x0 sunt valorile caracteristicii pentru care se calculează media, din cele
două perioade;
f g f gf f
1 1 0 0
* *; sunt simbolurile cu care se pot nota frecvenţele relative ce sunt în
acelaşi timp şi greutăţi specifice ale factorului cantitativ f.
Indicele cu structură fixă (ISF) se construieşte pornind de la ipoteza că variază numai
valorile individuale xi iar structura rămâne constantă, fixă.
Dacă se aplică sistemul de ponderare propus de Paasche, indicele se construieşte
folosind ponderile din perioada curentă. Relaţia de calcul, în acest caz va fi:
Ix f
f
x f
fSF
x x( ) :
1 1
1
0 1
1
Prin simplificare cu f1 se obţine un indice agregat, care poate fi transformat şi într-un
indice mediu armonic;
Ix f
x f
x f
ix f
y x
x
10
1 1
0 1
1 1
1 1
1( )
Dacă indicele cu structură fixă se calculează folosind ponderile din perioada de bază,
corespunde sistemului de ponderare propus de Laspeyres. În acest caz, formula de calcul va
fi:
Ix f
f
x f
fSF
x x( ) :
1 0
0
0 0
0
iar indicele fenomenului complex rezultă din relaţia:
Ix f
x f
i x f
x f
y x
x
10
1 0
0 0
10
0 0
0 0
( )
Folosirea uneia sau alteia din variantele pentru calculul indicelui cu structură fixă se
face, în principal, în funcţie de datele disponibile, de scopul analizei şi de modul de
descompunere pe factori utilizat.
Indicele variaţiei structurii, denumit şi indicele modificărilor structurale, se calculează
pornind de la ipoteza că s-a schimbat numai distribuţia factorului cantitativ, deci structura
colectivităţii. În acest caz se pot construi, teoretic două variante de calcul în funcţie de
ponderile utilizate. În practica naţională şi internaţională şi-a găsit aplicabilitate formula de
calcul în care ponderea se face cu perioada de bază, deci indice de tip Laspeyres cu frecvenţe
absolute:
Metoda indicilor 148
Ix f
f
x f
fVS
x f( ) :
0 1
1
0 0
0
respectiv:
Ix f
x fVS
x f( )
*
*
*
0 1
0 0
Sensul în care modificările structurale influenţează variaţia medie este condiţionat de
valorile variabilei calitative în favoarea cărora s-au produs mutaţiile. Astfel, dacă cresc în
importanţă valorile variabilei xi mai mari decât media, modificările structurale sunt însoţite de
creşterea mediei. În schimb, dacă cresc valorile individuale mai mici decât media, aceste
mutaţii favorizează scăderea mediei.
Îndicele cu structură variabilă, cu structură fixă şi al variaţiei structurii formează
împreună un sistem de indici în cadrul căruia se pot stabili o serie de relaţii bine determinate.
Astfel, produsul celor doi indici factoriali este egal cu indicele cu structură variabilă:
I I ISV
x
SF
x x
VF
x f ( ) ( )
Relaţia de mai sus se verifică numai în cazul în care cei doi indici factoriali se
construiesc pe baza considerării sistemelor de ponderare Paasche şi Laspeyres. Pornind de la
cele menţionate mai sus indicele cu structură fixă are la bază ponderi din perioada curentă iar
indicele variaţiei structurii, ponderi din perioada de bază. Se admite ipoteza succesiunii
modificării factorilor: mai întâi factorul cantitativ şi urmat de cel calitativ.
Modificarea absolută a mediei sub influenţa unuia sau altuia din factori se calculează
ca diferenţă dintre numărătorul şi numitorul indicelui factorial corespunzător. Relaţiile de
calcul vor fi:
x xx f
f
x f
fx f x f( ) * *
1 1
1
0 1
1
1 1 0 1
x fx f
f
x f
fx f x f( ) * *
0 1
1
0 0
0
0 1 0 0
Şi în acest caz, modificarea mediei este egală cu suma modificărilor datorate factorilor
de influenţă, respectiv:
x x f x x x f
x x f x x x f
( . ) ( ) ( )
( . ) ( ) ( )* *
Pentru exemplificarea calculului acestor indici medii se vor folosi indicii
salariului mediu. Tabelul 4 prezintă fondul de salarii şi numărul salariaţilor pentru două
unităţi comerciale aprţinând aceluiaşi proprietar :
Capitolul 7 149
Tabelul nr. 4
Unitate
Salar mediu
(RON/pers)
Numarul angjaţilor
Fondul de salarii
(RON) S0N1
comercială S0 S1 N0 N1 FS0 FS1
A 640 700 50 45 32000 31500 28800
B 720 830 70 75 50400 62250 54000
Total 686.67 781.25
0N
120
1N
120
00 NS
82400
11NS
93750
10 NS
82800
Se cere:
1. Dinamica salariului mediu pe fiecare unitate comercială.
2. Salariul mediu pe total în cele doua perioade.
3. Indicii de grup ai salariului mediu cu structură variabilă, cu structură fixă şi cu
variaţia structurii.
Rezolvare:
1. La unitatea comercială A
%38,109100640
700
0
1%
S
SI S 60640700 S RON
Salariul mediu a crescut în perioada curentă faţă de perioada de bază la 109,38%, sau
cu 9,38%, ceea ce în mărime absolută a însemnat o creştere în valoare de 60 RON/angajat.
La unitatea comercială B
%28,115100720
830
0
1%
S
SI S 110720830 S RON
Salariul mediu a crescut în perioada curentă faţă de perioada de bază la 115,28%, sau
cu 15,28%, ceea ce în mărime absolută a însemnat o creştere în valoare de 110 RON/angajat.
2. Salariul mediu pe total în perioada de bază:
0
00
N
NS686.67 RON/angajat
Salariul mediu pe angajat în perioada curentă:
1
11
N
NS781.25 RON/angajat
Metoda indicilor 150
3.
Indicele cu structură variabilă Modificarea absolută
Salariul mediu pe total a crescut de 1,137 ori ceea ce înseamnă în mărime absolută
94,58 RON/angajat.
Indicele cu structură fixă Modificarea absolută
Salariul mediu pe total a crescut de 1,132 ori ceea ce înseamnă în mărime absolută
91,25 RON/angajat ca urmare a modificării salariilor medii pe fiecare unitate comercială.
Indicele cu modificarea structurii Modificarea abs olută
Salariul mediu pe total a crescut de 1,0048 ori ceea ce înseamnă în mărime absolută
3,33 RON/angajat ca urmare a modificării structurii angajaţilor pe fiecare unitate comercia lă.
Rezumat
Metoda indicilor face parte din metodele de analiză factorială. Indicii se calculează sub
forma unui raport, sunt mărimi relative adimensionale ca urmare a faptului că atât la
numărător cât şi la numitor figurează două valori ale aceluiaşi indicator. Aceasta înseamnă că
aplicarea indicilor presupune identificarea factorilor care determină variaţia fenomenului
complex, înregistrarea nivelului acestora pentru toate unităţile ce compun colectivitatea şi
construirea relaţiilor care să permită caracterizarea modificării relative atât la nivelul
întregului ansamblu, cât şi al elementelor sale componente.
Termeni importanţi: Indici individuali, indici de grup, sisteme de ponderare
Teste de autocontrol:
1. În ce situaţii se poate aplica metoda indicilor ?
2. Ce sisteme de ponderare cunoaşteţi ?
3. Ce tipuri de indici se pot calcula cu aceste metode ?
4. Care este rolul lor ?
137,1:0
00
1
11
N
NS
N
NSI S
SV
132,1:1
10
1
11
N
NS
N
NSI S
SF
0048,1:0
00
1
10
N
NS
N
NSI S
MS
58,940
00
1
11
N
NS
N
NSS
SV
25,911
10
1
11
N
NS
N
NSS
SF
33,3:0
00
1
10
N
NS
N
NSS
MS
Capitolul 7 151
Probleme propuse
1. Se cunosc date (convenţionale) asupra volumului vânzărilor în luna martie 200 7 la o
societate comercială, pentru trei produse din nomenclator, cât şi modificarea preţurilor:
Produsul
Valoarea vânzărilor în
perioada curentă
(RON)
Modificarea procentuală a
preţurilor
(%)
1 13860 +5,0
2 51300 -10,0
3 57200 +10,0
Total 122360 -
Modificarea absolută a volumului vânzărilor, cauzată de modificarea preţurilor la
cele trei produse, a fost egală cu:
a. 0 (zero) RON
b. – 80,0 RON
c. +160,0 RON
d. +190,0 RON
e. – 102,0 RON
2. De la un punct de desfacere s-au cules datele următoare:
Produse
Valoarea vânzărilor în ianuarie
2006
– mii RON-
% modificării volumului fizic în
ianuarie 2007 faţă de ianuarie
2006
A 18 +5
B 20 -2
Modificarea absolută totală a vânzărilor în ianuarie 2007 faţă de ianuarie 2006 ca
urmare a modificării volumului fizic este:
a. 500 RON
b. 1,30 RON
c. –500 RON
d. 38 RON
e. 20,76 RON
3. Pentru trei produse realizate de o firmă se cunosc datele:
Cantităţi
- mii buc -
Preţuri
- RON / buc - Produse
2006 2007 2006 2007
A 12.000 9.000 500 480
B 10.000 8.000 220 210
C 3.000 5.000 600 630
Metoda indicilor 152
Se cere:
a) dinamica producţiei fizice, a preţurilor şi a valorii pe produse;
b) indicii de grup ai volumului fizic, preţului şi valorii şi modificările absolute
corespunzătoare.
4. Despre o secţie de producţie a unei firme se cunosc:
Valoarea producţiei
– mii RON -
Secţia
Mai 2007 Mai 2008
Modificarea
volumului fizic -%-
A 800 940 -10
B 1200 1800 +5
C 1000 1100 -40
Se cere:
a) indicii individuali ai valorii, volumului fizic şi preţurilor;
b) indicii de grup ai valorii, volumului fizic şi preţurilor precum şi modificările absolute
corespunzătoare.
5. Despre trei firme se cunosc următoarele date referitoare la numărul de salariaţi şi salariul
nominal:
Salariul mediu nominal
– RON/ang. -
Nr. angajaţi
Firma
Mai 2005 Mai 2006 Mai 2005 Mai 2006
A 1000 1200 400 500
B 850 830 200 180
C 740 820 100 110
Se cere:
a) modificarea salariului, a numărului de salariaţi şi a fondului de salarii pe fiecare firmă;
b) salariul mediu şi modificarea acestuia;
c) indicii cu structură fixă şi de variaţie a structurii;
d) modificarea fondului de salarii pe total şi influenţa factorilor.
6. La un hotel de patru stele s-au înregistrat datele:
Tarif cazare (euro) Nr. înnoptări Tip
cameră Aprilie 2006 Aprilie 2007 Aprilie 2006 Aprilie 2007
Dublă
Single
Garsonieră
Apartament
80
75
110
140
90
75
115
140
250
110
15
7
237
115
15
5
Se cere:
a. Să se calculeze valoarea tarifului la cursul zilei pentru moneda euro.
b. Să se calculeze şi să se interpreteze indicii individuali şi de grup precum şi
mărimile absolute corespunzătoare.
c. Să se analizeze evoluţia valorii încasate.
Bibliografie 153
BIBLIOGRAFIE
1. Andrei, T., Stancu, S., Statistică, teorie şi aplicaţii, Editura ALL, Bucureşti 1995;
2. Baron, T., Biji, E., Tovissi, L., Wagner, P., Isaic Maniu, Al., Korka, M., Porojan, D.,
Statistică teoretică şi economică, Editura Didactică şi Pedagogică, Bucureşti, 1996;
3. Biji E., Wagner P., Lilea E., Petcu N., Vătui M., Statistică, Editura Didactică şi Pedagogică,
Bucureşti ,1999.
4. Duguleană, L., Statistică economică şi socială, teorie şi aplicaţii, Editura Infomarket, Braşov
1999;
5. Isaic Maniu, Al., Mitruţ, C., Voineagu, V., Statistica pentru managementul afacerilor,
Editura Economică 1995;
6. Mitruţ, C., Isaic Maniu, Al., Voineagu, V., Statistică economică, Editura Dacia Europa Nova,
Lugoj 2000;
7. Petcu, N., Statistică în turism 2005, teorie şi aplicaţii, Editura Albastră, Cluj-Napoca 2005;
8. Petcu, N., Statistică teorie şi aplicaţii în SPSS, Editura Infomarket, Braşov, 2003.
9. Vasilescu, N., Statistică generală, metodologie, lucrări practice, programe aplicative,
Editura Amon, Craiova 1996;
10. Vasilescu, N., Vancea, I., Radu, C., Statistica firmei industriale, metodologie, Editura Amon,
Craiova 1996;
11. Voineagu, V., Mitruţ, C., Ţiţan, E., Ghiţă, S., Statistică, Centrul de învăţământ economic
deschis la distanţă, Academia de Studii Economice, Bucureşti 2000.
12. Voineagu V., Furtună F., Voineagu M., Ştefănescu C., Analiza factorială a fenomenelor
social-economice în profil regional, Bucureşti, 2002.
xxx Anuarul Statistic al României