statistica pt ects

Nicoleta PETCU

-

2008 – 2009

Anul I, sem. 2

REPROGRAFIA UNIVERSITĂŢII “TRANSILVANIA” DIN BRAŞOV

PREFAŢĂ

Complexitatea cu care se desfăşoară procesele economice şi sociale, la nivel micro şi

macroeconomic, impune în mod necesar folosirea combinată a tuturor ştiinţelor, printre care şi

statistica.

Lucrarea cuprinde principalele probleme ale metodologiei statisticii economico-

sociale, selectate în funcţie de locul pe care această disciplină îl ocupă în pregătirea studenţilor

din învăţământul economic. Tratată în general, fie ca o ştiinţă de graniţă, fie ca o ştiinţă

metodologică, statistica este indispensabilă pentru cunoaşterea complexă a fenomenelor din

natură şi societate, conceptele sale fiind curente pentru limbajul omului modern. Se poate

spune că în prezent, nu există domeniu în care să nu se afirme: "statisticile de care dispunem

demonstrează că fenomenele cercetate corespund sau infirmă ipoteza pe care ştiinţa de

specialitate din domeniul respectiv a formulat-o".

Cu deosebire statistica îşi găseşte aplicaţie în studierea fenomenelor sociale, a

regularităţilor cu care acestea se produc, a evidenţierii gradului de influenţă a diferiţilor

factori, în studiul dinamicii şi mutaţiilor structurale, în analizele complexe privind realizarea

diferitelor programe de dezvoltare economico-socială, în fundamentarea statistică a deciziilor

financiare şi bancare.

Cursul de statistică se adresează, în primul rând, studenţilor din învăţământul superior

economic. Prin problematica abordată, el poate fi consultat de către toţi economiştii care sunt

interesaţi în cunoaşterea şi folosirea corectă, cu discernământ a metodelor statistice, a

metodologiilor de elaborare a indicatorilor în statistica micro şi macro economică. Prelucrarea

indicatorilor derivaţi şi procedeele de analiză statistică constituie partea principală a

manualului, indiferent dacă sunt tratate ca problematică generală valabilă pentru orice

investigaţie statistică, fie că se referă la un domeniu particular, de cercetare concretă la nivel

micro şi macro economic.

Orientarea pentru partea practică, aplicativă, este ilustrată prin numeroase grafice,

tabele şi modele de calcul şi analiză statistică, aplicaţii la datele concrete, de regulă din

realitatea vieţii noastre economice şi/sau din diferite publicaţii cu caracter oficial.

5

CUPRINS

Pag .

Capitolul 1. Statistica - instrument de cunoaştere a fenomenelor economice.

Observarea statistică ..................................................................................................

1. Obiectul şi metoda statisticii; relaţiile cu celelalte ştiinţe .................................

2. Concepte de bază folosite în statistică ………………………………………...

3. Rolul observării în procesul de cercetare statistică …………………………...

4. Proiectarea observării statistice ……………………………………………….

5. Metode de observare statistică ………………………………………………..

6. Organizarea sistemului informaţional în România ……………………………

7. Erorile observării statistice. Controlul datelor statistice ....................................

Rezumat .................................................................................................................

Termeni importanţi ................................................................................................

Teste de autocontrol ..............................................................................................

Capitolul 2. Sistematizarea şi prezentarea datelor statistice ..................................

1. Tipuri de grupări ...............................................................................................

2. Grupare unidimensională .............................................................. ....................

3. Grupare bidimensională ....................................................................................

4. Prezentarea datelor statistice .............................................................................

4.1 Tabele statistice ...........................................................................................

4.2 Seriile statistice ............................................................................................

4.3 Reprezentări grafice .....................................................................................

Rezumat .................................................................................................................

Termeni importanţi .............................. ..................................................................


Capitolul 3. Serii de distribuţie unidimensionale ...................... ..............................

1. Indicatorii statistici – definiţii, tipuri .................................................................

2. Indicatori statistici calculaţi sub formă de mărimi relative ...............................

3. Indicatorii tendinţei centrale ..............................................................................

3.1 Mărimi medii ...............................................................................................

3.1.1 Media aritmetică .......... .......................................................................

3.1.2 Media armonică ..................................................................................

3.1.3 Media pătratică ...................................... .............................................

3.1.4 Media geometrică ...............................................................................

3.2 Mediana ................................................................................. ......................

3.3 Moda (modulul, dominanta) ........................................................................

3.4 Cuartilele .....................................................................................................

4. Indicatorii variaţiei ............................................................................................

4.1 Indicatorii simpli ai variaţiei .......................................................................

4.2 Indicatorii sintetici ai variaţiei .....................................................................

5. Media şi dispersia caracteristicii alternative ......................................................

10

10

12

14

15

17

21

22

24

24

24

26

26

27

30

34

35

36

38

43

44

44

46

46

46

52

52

52

55

56

57

57

61

64

65

65

66

70

6

6. Asimetria ........................................................ ...................................................

Rezumat .................................................................................................................

Termeni importanţi ............................................................... .................................


Probleme propuse ........................................................................................ ..........

Capitolul 4. Serii de distribuţie bidimensionale .......................................................

1. Analiza dispersională ........................................................................................

2. Analiza ANOVA (testul Fisher - Snedecor) ......................................................

3. Tesul χ2 ............................................................ ............. ....................................

Rezumat ................................................................ .................................................


Teste de autocontrol ..................................................................... .........................

Probleme propuse ..................................................................................................

Capitolul 5. Regresie şi corelaţie ................................................................ ............. ..

1. Tipuri de legături între fenomenele social-economice .................... .......... ......

2. Regresia şi corelaţia liniară ...............................................................................

2.1 Calculul coeficienţilor de regresie ...............................................................

2.2 Măsurarea intensităţii corelaţiei ..................................................................

2.3 Semnificaţia estimaţiilor. Intervale de încredere .......................... ...............

2.4 Analiza reziduurilor .....................................................................................

3. Regresia neliniară ..............................................................................................

3.1 Tipuri de legături neliniare ..........................................................................

3.2 Raportul de corelaţie neliniară .....................................................................

4. Regresia multiplă ..................... ..........................................................................

5. Metode neparametrice de măsurare a legăturilor dintre fenomene ...................

5.1 Tabelul de asociere şi coeficientul de asociere ........................................ .....

5.2 Coeficienţii de corelaţie a rangurilor ...........................................................

Rezumat .................................................................................................................



Probleme propuse ..................... .............................................................................

Capitolul 6. Analiza seriilor cronologice ..................................................................

1. Noţiuni, particularităţi ....................................... ...............................................

2. Indicatorii statistici utilizaţi în prelucrarea seriilor cronologice ........................

2.1 Indicatori absoluţi ................................................................................... .....

2.2 Indicatori relativi .........................................................................................

2.3 Indicatori medii ...........................................................................................

3. Ajustarea seriilor cronologice ............................................................................

3.1 Ajustarea pe baza mediilor mobile ..............................................................

3.2 Ajustarea prin sporul mediu ................... .....................................................

3.3 Ajustarea pe baza indicelui mediu de dinamică ..........................................

3.4 Ajustarea prin metoda celor mai mici pătrate .............................................

4. Analiza sezonalităţii...........................................................................................

Rezumat ................................................................................................................



Probleme propuse ......................... .........................................................................

71

74

74

74

75

77

77

83

85

88

88

88

88

92

92

93

94

95

97

98

100

100

102

105

109

110

111

113

113

113

113

115

115

118

118

119

120

123

123

125

126

126

128

132

132

132

132

7

Capitolul 7. Metoda indicilor .....................................................................................

1. Noţiunea de indice statistic. Probleme teoretice ale construiri i indicilor .........

2. Indicii agregaţi. Sisteme de ponderare folosite la construirea indicilor de

grup .......................................................................................................................

3. Indicii de grup calculaţi ca medie a indicilor individuali ................................

4. Indicii calculaţi ca raport a două medii ............................................................

Rezumat ............................................................................. ...................................

Termeni importanţi ...............................................................................................

Teste de autocontrol .................................................................................... .........

Probleme propuse .................................................................................................

Bibliografie ..................................................................................................................

136

136

137

144

146

150

150

150

151

153

Capitolul 1 9

Capitolul 1

Tema Statistica - instrument de cunoaştere a fenomenelor economice.

Observarea statistică

Obiectivele 1. Obiectul şi metoda statisticii; relaţiile cu celelalte ştiinţe

2. Concepte de bază folosite în statistică

3. Rolul observării în procesul de cercetare statistică

4. Proiectarea observării statistice

5. Metode de observare statistică

6. Organizarea sistemului informaţional în România

7. Erorile observării statistice. Controlul datelor statistice

Mijloace - citire/învăţare

- întrebări, probleme ce apar, explicaţii

- definiţii, explicaţii ce trebuie reţinute

- situaţii economice concrete, supuse analizei, exemple (sub

lupă)

- teme de casă, aplicaţii practice pentru studenţi

Finalitatea - o perspectivă de ansamblu asupra conţinutului cursului

- deprinderea de a defini problema supusă analizei statistice

Evaluarea - parcurgerea aplicaţiilor propuse

Timp de lucru

necesar

1. Pentru cunoaşterea problemei: 4 ore

2. Pentru rezolvarea temelor: 12 ore + timpul de documentare

10 Statistica - instrument de cunoaştere a fenomenelor economice. Observarea statistică

Statistica - instrument de cunoaştere a fenomenelor

economice. Observarea statistică

1. Obiectul şi metoda statisticii; relaţiile cu celelalte ştiinţe

În toate momentele dezvoltării sale, statistica se ocupă de acele fenomene şi

procese care se produc într-un număr mare de cazuri, prezintă în reproducerea lor anumite

regularităţi şi care pot fi denumite fenomene de masă sau fenomene de tip colectiv. Pentru a

înţelege caracterul şi particularităţile acestor fenomene trebuie pornit de la natura raporturilor

de cauzalitate a acestora. În general, în cadrul societăţii ca şi în natură şi în tehnologie,

fenomenele pot să apară ca rezultat al unei singure cauze sau ca rezultat al mai multor cauze

care se manifestă izolat sau în interdependenţă între ele. În primul caz, sunt fenomene univoc

determinate şi de regulă, ele se prezintă ca fenomene simple, identice între ele denumite şi

fenomene tipice. În cel de-al doilea caz, apar ca fenomene multicauzale al căror proces de

formare poate să prezinte grade diferite de complexitate, cu relaţii multiple de

interdependenţă, formând împreună un ansamblu a cărui dimensiune şi structură pot fi

delimitate în timp, în spaţiu şi organizatoric.

Spre deosebire de fenomenele tipice care apar ca rezultat al unei singure cauze,

fenomenele de masă apar ca rezultat al influenţei comune a unui număr mare de cauze

şi condiţii variabile, cu grade şi sensuri diferite de influenţă, ceea ce face ca ele să se

prezinte ca o masă compactă de fenomene atipice, aparent independente între ele.

Fenomenele de masă, aparţinând unei forme superioare de mişcare a materiei se produc sub

acţiunea unor factori cu caracter sistematic, asociaţi cu cei întâmplători şi ca atare

fenomenologia cauzalităţii lor este complexă. Astfel în cadrul fenomenelor simple, univoc

determinate, pe măsură ce se produce cauza se produce şi efectul, dacă condiţiile rămân

neschimbate. Ele apar deci ca fenomene deterministe, certe, ca rezultat al acţiunii unor legi

ale dinamicii, ce pot fi cunoscute cu ajutorul metodei experimentale şi pentru care legea

odată descoperită poate fi verificată pentru fiecare caz în parte.

Fenomenele de masă, în general, apar ca o mulţime de forme individuale diferite, cu

existenţă distinctă, aparent fără nici o legătură de la o formă la alta, dar care analizate

comparativ se constată că au o aceeaşi esenţă. Aceasta se explică în principal prin faptul că ele

sunt generate de o serie de cauze comune care se manifestă de regulă în condiţii diferite.

În consecinţă, la fenomenele de masă din societate, relaţiile de multicauzalitate directă sau

indirectă care le determină fac imposibilă cunoaşterea legilor care le produc şi guvernează,

dacă se iau în studiu izolat doar câteva forme de manifestare a lor, ignorând ansamblul din

care fac parte. Explicaţia constă în faptul că în practică, formele individuale de manifestare

diferă de la o unitate la alta în funcţie de modul în care se asociază şi se combină factorii

sistematici cu cei întâmplători, cei esenţiali cu cei neesenţiali, cei obiectivi cu cei

subiectivi, lăsând impresia că fiecare formă individuală din cadrul ansamblului se produce la

întâmplare, fără să existe o cauzalitate certă. Dar, analizându-le la nivel de ansamblu, ele par

asemănătoare între ele, fiind generate de cauze esenţiale comune, supunându-se aceleiaşi

legi de apariţie şi dezvoltare. La aceasta, trebuie adăugat şi un alt aspect şi anume, relaţiile de

cauzalitate dintre fenomenele sociale au caracter dinamic, ca urmare a modificării

Capitolul 1 11

permanente a condiţiilor în care se manifestă. De aici se poate trage concluzia logică că în

astfel de cazuri legea acţionează atât static când fenomenele de masă sunt circumscrise în

aceleaşi condiţii de timp cât şi dinamic când fenomenele sunt delimitate în spaţiu şi

organizatoric, dar înregistrate în unităţi de timp diferite.

Ca atare, pentru a descoperi legea de apariţie a unor astfel de fenomene nu sunt

suficiente numai metodele experimentale, ca în cazul fenomenelor de tip determinist ci şi

altele, bazate pe o serie de abstractizări succesive, prin care să se reţină numai ceea ce este

esenţial, tipic în forma lor de manifestare prin eliminarea aspectelor întâmplătoare şi

neesenţiale. Aceasta presupune că se iau în studiu toate cazurile individuale deoarece, spre

deosebire de fenomenele care se produc pe baza legilor dinamicii, deci apar ca fenomene

identice, fenomenele de masă având cauze comune de apariţie dar şi unele cauze particulare,

care diferă de la un caz la altul, sunt numai asemănătoare între ele. Principala lor

proprietate este variabilitatea în timp şi în spaţiu şi legea de apariţie a acestora se

manifestă ca tendinţă ce nu poate fi cunoscută şi verificată decât la nivelul ansamblului

şi nu în fiecare caz în parte. Prezenţa printre factorii determinanţi şi a factorilor aleatori face

ca astfel de fenomene să nu poată fi interpretate decât recurgând la principiile teoriei

probabilităţilor. Ca atare, ele pot fi considerate ca fiind fenomene de tip nedeterminist sau

stochastic. În acelaşi timp, sub raport statistic, interpretarea acţiunii factorilor întâmplători nu

se poate realiza decât folosind proprietăţile legii numerelor mari, potrivit căreia variaţiile

întâmplătoare de la tendinţa generală se compensează reciproc dacă există un număr mare de

cazuri individuale de aceeaşi esenţă, luate în studiu.

Fenomenelor de masă le sunt specifice legile statistice - legi care se manifestă sub

formă de tendinţă, faţă de care abaterile întâmplătoare într-un sens sau altul se compensează

reciproc. În consecinţă, este necesar ca în cercetările statistice să se ia toate cazurile

individuale sau un număr suficient de mare, dar reprezentativ pentru întregul ansamblu,

pentru ca ele să poată intra sub acţiunea legii numerelor mari.

Sintetizând cele arătate, se poate conchide că o primă particularitate a statisticii

economico-sociale constă în faptul că: statistica studiază fenomenele social-economice de

masă în cadrul cărora acţionează legile statistice şi care prezintă proprietatea de a fi variabile

în timp şi spaţiu. În literatura de specialitate ele se întâlnesc sub denumirea de fenomene de

masă, fenomene de tip colectiv, fenomene stochastice sau fenomene atipice.

Studierea acestor fenomene reclamă folosirea combinată a mai multor discipline,

printre care şi statistica. În aceste condiţii este necesar să se stabilească unghiul din care

statistica îşi realizează studiile sale, ajungând astfel la cea de-a doua particularitate şi anume:

caracterizarea laturii cantitativ-numerice a fenomenelor social-economice, stabilindu-le

dimensiunea, dinamica, intensitatea, structura şi mutaţiile de structură, raporturile de

interdependenţă şi celelalte aspecte ce pot fi caracterizate numeric în funcţie de locul şi timpul

în care s-au produs în strânsă interdependenţă cu latura lor calitativă.

Deci, operând cu fenomene care apar în cadrul societăţii, statistica contribuie la

procesul de cunoaştere cantitativă pornind de la conţinutul calitativ al acestora. Desigur, în

analiza statistică, accentul cade pe latura cantitativă, dar cercetarea trebuie să pornească de la

înţelegerea trăsăturilor calitative ale fenomenelor. Abstractizările şi generalizările realizate

prin intermediul statisticii în vederea evidenţierii a ceea ce este specific, tipic în manifestările

unui fenomen sunt corecte numai în condiţiile înţelegerii şi respectării integrităţii calitative a

acestuia.

Statistica este ştiinţa care studiază aspectele cantitative ale

determinărilor calitative ale fenomenelor de masă, fenomene care sunt supuse acţiunii


legilor statistice ce se manifestă în condiţii concrete, variabile în timp, spaţiu şi

organizare socio-economică.

Se poate afirma, fără teama de a greşi, că statistica se aplică în toate domeniile în care

fenomenele se pot exprima cantitativ-numeric şi prezintă proprietatea de a fi variabile între ele

ca formă concretă de manifestare.

Proiectarea unei cercetări statistice este o operaţiune de mare amploare, antrenând un

volum mare de resurse materiale, financiare şi umane şi un sistem informaţional bine articulat,

cu funcţionalitate permanentă. Într-o formă sugestivă, se poate urmări, pe etape, procesul de

elaborare şi desfăşurare a unei cercetări statistice.

2. Concepte de bază folosite în statistică

În vederea creării unui cadru comun tuturor formelor de activitate statistică şi

pentru evitarea unor interpretări greşite în statistică se folosesc o serie de noţiuni (concepte)

de bază cu care se operează în mod unitar în toate etapele cercetării şi în toate statisticile

aplicate (de ramură).

Colectivitatea statistică denumită şi populaţie, reprezintă totalitatea elementelor de

aceeaşi natură supuse unui studiu statistic. Masa elementelor se constituie într-o colectivitate,

dacă există o serie de trăsături comune, deci, dacă ele sunt generate de acelaşi complex de

cauze esenţiale. Uneori colectivitatea se defineşte ca totalitatea elementelor care prezintă

aceleaşi caracteristici esenţiale de identificare.

Colectivitatea statistică, astfel definită, are un caracter obiectiv şi finit. Aceasta

înseamnă că în orice cercetare concretă este necesară delimitarea ei. Delimitarea presupune

definirea elementelor din punctul de vedere al conţinutului, spaţiului, timpului şi formei

organizatorice, ceea ce face ca ele să poată fi: statice şi dinamice.

Colectivităţile statice exprimă o stare şi o anumită întindere în spaţiu, formând

împreună un existent (stoc) la un moment dat.

Colectivităţile dinamice exprimă un proces (flux), o devenire în timp. Caracterizarea

lor presupune înregistrarea elementelor componente pe un interval de timp.

Pentru o înţelegere clară a relaţiei dintre colectivităţile statice şi cele dinamice trebuie

subliniat faptul că în ambele cazuri există o mulţime de elemente variabile alături de unele

constante. Astfel, în cazul colectivităţilor statice timpul şi forma organizatorică trebuie să fie

constante, iar în cazul celor dinamice, spaţiul şi forma organizatorică sunt constante.

În analiza fenomenelor statistica poate opera, pentru alegerea şi validarea unor modele

de calcul şi analiză, cu colectivităţi (populaţii) abstracte şi infinite elaborate de către statistica

matematică sau cu colectivităţi ipotetice necesare elaborării unei ipoteze statistice ce urmează

să fie verificat în practică, pe baza unor date empirice.

Unităţile statistice reprezintă elementele constitutive ale colectivităţilor. Ca şi

colectivităţile, unităţile pot fi separate în statice şi dinamice. În cazul celor statice, unităţile

compun efectivul masei de fenomene (de persoane, de animale, de produse în stoc etc.). În

cazul colectivităţilor dinamice, unităţile aparţin aceleiaşi structuri organizatorice, au acelaşi

conţinut dar se produc în condiţii diferite de timp, ceea ce face ca ele să poată fi considerate

ca evenimente ale unui proces economico-social de masă.

Unităţile statistice pot fi simple şi complexe. Cele simple sunt elementele constitutive

ale colectivităţii (persoana, exemplarul de marfă etc.); iar cele complexe sunt rezultatul

organizării sociale şi economice a colectivităţii (familia, echipa, secţia, anul de studiu etc.).

Capitolul 1 13

De reţinut că unităţile statistice fiind entităţi independente şi obiective, pot fi studiate

individual, pe subcolectivităţi sau pe întreaga colectivitate.

Unităţile complexe ale colectivităţii pentru care se culeg date în procesul cunoaşterii

se deosebesc de unităţile de raportare, care pot fi de exemplu: întreprinderi, instituţii şi altele,

care potrivit legislaţiei în vigoare informează sistematic asupra activităţii unităţilor aflate în

structura lor organizatorică. Unităţile unei colectivităţi statistice sunt purtătoare ale unor

caracteristici variabile.

Caracteristicile statistice, denumite şi variabile statistice sau variabile aleatoare,

reprezintă criteriile pe baza cărora se caracterizează unităţile colectivităţii. Aceste criterii pot

fi însuşiri sau trăsături ale unităţilor care definesc ş i delimitează între ele unităţile colectivităţii

şi care urmează să fie înregistrate. Formele concrete de manifestare ale caracteristicilor la

nivelul fiecărei unităţi a colectivităţii se numesc variante sau valori. Numărul de unităţi la

care se înregistrează aceeaşi variantă sau valoare se numeşte frecvenţă sau pondere.

Caracteristicile statistice se diferenţiază după mai multe criterii.

a) După conţinutul lor pot fi de timp, de spaţiu şi atributive.

Caracteristicile de timp arată apartenenţa unităţilor la un moment sau perioadă de

timp.

Caracteristicile de spaţiu arată situarea în teritoriu a unităţii. Se exprimă prin cuvinte

pe baza unui nomenclator al unităţilor teritoriale.

Caracteristicile atributive sunt toate celelalte însuşiri ale unităţilor statistice şi

servesc pentru definirea fenomenelor studiate.

b) După modul de exprimare, ele se separă în caracteristici calitative (exprimate prin

cuvinte) şi caracteristici cantitative (exprimate numeric). De exemplu, profesia şi

vârsta.

După natura variaţiei, cele numerice se împart în caracteristici cu variaţie continuă

şi cu variaţie discontinuă sau discretă.

c) După modul de manifestare la nivelul unităţilor simple pot fi alternative -

manifestarea directă sau opus ei, de exemplu urban-rural - şi nealternative - cu

variante distincte numerice sau calitative, de exemplu salariile şi profesia.

După modul de obţinere şi folosire a datelor pot fi primare - obţinute în procesul de

culegere a datelor şi cu care se caracterizează nivelul de dezvoltare atins la nivelul unităţilor

simple şi complexe şi caracteristici derivate obţinute prin aplicarea unui model de calcul

statistic.

Datele statistice sunt caracterizări numerice ale unităţilor, grupelor şi colectivităţii

obţinute din observare şi prelucrare. În statistică, datele sunt întotdeauna mărimi concrete,

caracterizate printr-o parte noţională care defineşte conţinutul calitativ, valoarea numerică şi

elementele de identificare (de timp, de spaţiu etc.). Mesajul datelor îl reprezintă informaţia.

Obţinerea datelor statistice depinde de modul de organizare şi funcţionare a sistemului

informaţional statistic. Coordonarea ştiinţifică şi metodologică, într-o viziune sistemică, este

asigurată de către organul de statistică publică. În acest sens, informaţia statistică trebuie

privită ca un proces continuu, în care în permanenţă intră date primare, se prelucrează pe

diferite structuri, se stochează, se publică sau se transmit unor beneficiari de informaţii pe

baza unor programe prestabilite.

Datele statistice se pot structura după modul de utilizare a lor în procesul de cercetare

statistică în: date primare (observate) şi date prelucrate (derivate) prin aplicarea unui model de

calcul statistic asupra datelor primare. Suportul datelor statistice îl constituie indicatorii

statistici. Între date şi indicatori statistici există o relaţie de reciprocitate. Deosebirea constă

însă în faptul că datele statistice sunt o expresie generalizatoare în timp ce indicatorii statistici

sunt particularizaţi pe domenii şi de obicei apar şi se folosesc ca sisteme şi subsisteme de

indicatori.


Indicatorii statistici reprezintă expresia numerică a unei determinări calitative

obiective obţinută în urma efectuării unei cercetări statistice raportată la condiţii specifice de

timp, spaţiu şi organizatorice şi se regăsesc cu regularitate în statistica oficială şi în

publicaţiile de specialitate.

Indicatorul statistic măsoară, de regulă, o categorie economică, socială, demografică,

tehnologică etc.

Exprimarea numerică a unei categorii presupune folosirea mai multor indicatori,

fiecare punând în evidenţă anumite aspecte esenţiale ale acesteia. Astfel, productivitatea

muncii poate fi exprimată direct prin producţia fizică, producţia marfă, valoarea adăugată etc.,

obţinută într-o unitate de timp de muncă. Nici unul din aceşti indicatori nu poate caracteriza

însă complet conţinutul acestei categorii complexe, fiecare răspunzând unui anumit aspect

determinat de obiectivul de cunoaştere stabilit.

Pornind de la obiectivul de cunoaştere stabilit trebuie să elaborăm, în primul rând, lista

indicatorilor statistici care trebuie calculaţi.

Indicatorii statistici pot fi obţinuţi prin măsurare şi estimare. Pentru calcularea unor

indicatori macroeconomici dispunem de date pentru unele componente şi pentru celelalte

recurgem la aplicarea unor raţionamente deduse din corelaţiile dintre componente.

Măsurarea presupune exprimarea în unităţi concrete de măsură şi se face atunci când

statistica vine în contact direct cu fenomenele studiate sau preia din alţi purtători de informaţii

date numerice.

Estimarea presupune o caracterizare statistică utilizând un model sau o ipoteză

statistică prin care pe baza datelor parţiale de care se dispune se determină o serie de

indicatori generalizatori. Aceste date pot fi reprezentative şi atunci se poate face o estimare

corectă şi nereprezentativă şi atunci se pot utiliza numai pentru obţinerea unor indicatori

orientativi, fără suport statistic.

Elaborarea indicatorilor statistici se realizează sub îndrumarea şi controlul organului

oficial de statistică din ţara respectivă.

3. Rolul observării în procesul de cercetare statistică

Observarea denumită şi culegerea (înregistrarea) datelor reprezintă prima

etapă a procesului de cercetare statistică.

Observarea statistică constă din culegerea unitară a datelor despre

unele caracteristici în prealabil stabilite de la unităţile care au fost incluse în obiectivul

de cercetare statistică, după un program riguros elaborat.

La efectuarea observării statistice trebuie să se ţină seama de unele recomandări

generale ca:

datele culese cu privire la însuşirile proprii fenomenului observat trebuie să fie

autentice. Pentru realizarea acestui obiectiv este necesar să se ia toate măsurile ca

datele observării să nu conţină erori, pentru ca valoarea indicatorilor generalizatori

obţinuţi pe baza lor să nu fie modificată, iar concluzia statistică să reflecte denaturat

fenomenele studiate.

caracterizarea colectivităţilor supuse studiului se bazează pe observaţii culese pentru

fiecare unitate componentă a colectivităţii. Prin urmare, definirea unităţilor de

Capitolul 1 15

observare (simple şi complexe) trebuie să se facă pe baza unor elemente clare care să

permită înţelegerea unitară a noţiunii respective de către toate persoanele participante

la culegerea datelor;

datele obţinute prin observarea statistică trebuie să îndeplinească atât condiţia de

volum cât şi de calitate. Dacă datele sunt incomplete ca volum nu există siguranţa că

prin prelucrarea lor, oricât de corectă ar fi, se va ajunge la descoperirea legităţilor

obiective după care s-au produs fenomenele;

datele statistice trebuie să se prezinte ca un material informativ complet şi unitar atât

sub aspectul organizatoric cât şi al conţinutului.

Pentru ca activitatea de culegere a datelor să fie eficientă se recomandă stabilirea în

prealabil a unor etape de lucru, a unui program de acţiune.

4. Proiectarea observării statistice

Ca etapă a cercetării, observarea statistică este condiţionată de scopul

cercetării, de particularităţile obiectului studiat şi de tehnica de calcul folosită în procesul de

prelucrare ulterioară a datelor observării.

Principalele probleme, care trebuie rezolvate pentru realizarea unei observări statistice,

se referă la: scopul observării; obiectul observării; programul observării propriu-zise: unitatea

de observare; timpul şi locul observării; formularele; instrucţiunile; problemele organizatorice

necesare desfăşurării normale a operaţiei de culegere a datelor.

Scopul observării este subordonat scopului general pentru care s-a organizat

cercetarea statistică.

Scopul general al cercetării este legat de funcţiile statisticii ca ştiinţă socială şi

activitatea practică de informare. Scopul special al unei observări se determină în funcţie de

necesităţile specifice de informaţii pentru domeniul în care se organizează cercetarea şi care

se încadrează în scopul general al acesteia. Corespunzător obiectivului final urmărit de

cercetarea statistică respectivă se pot delimita obiectivele parţiale care, în cazul observării

statistice, se vor referi concret la volumul şi calitatea datelor necesare.

Obiectul observării îl formează colectivitatea de fenomene despre care urmează să se

culeagă date statistice. Colectivitatea supusă observării trebuie delimitată - aşa cum am

precizat şi mai înainte - ca volum, în timp şi spaţiu, indiferent dacă este o colectivitate statică

sau o colectivitate dinamică. De remarcat este faptul că nu întotdeauna obiectul cercetării

coincide cu obiectul observării. Astfel, în cazul când se foloseşte o observare parţială,

colectivitatea observată este mai mică decât colectivitatea totală. Indiferent însă, de felul

observării utilizate este necesar ca atunci când caracterizarea finală se referă la întreaga

colectivitate să se definească nu numai colectivitatea parţială - pentru care se culeg datele - ci

şi cea totală pentru care se generalizează rezultatele. Definirea colectivităţii statistice trebuie

să se facă după o serie de caracteristici esenţiale, stabile şi care să asigure comparabilitatea

datelor de la o observare la alta.

În cazul fenomenelor cu un grad mai mare de complexitate, colectivitatea se

structurează pe subcolectivităţi cu un grad mai mare de omogenitate (de exemplu, muncitorii

în cadrul personalului unei unităţi economice, numărul studenţilor străini în totalul studenţilor

unei facultăţi etc.). Aceste subcolectivităţi pot fi observate separat sau împreună cu întregul

ansamblu.

Programul propriu-zis al observării este format din totalitatea caracteristicilor

pentru care urmează să se culeagă date de la toate unităţile colectivită ţii.


Programul observării se concretizează în întrebări care sunt înscrise în formulare

statistice şi la care trebuie să se obţină răspunsuri cu privire la nivelul de dezvoltare sau la

forma lor de manifestare.

De menţionat faptul că, în programul observării trebuie să se includă acele

caracteristici care prezintă interes pentru cercetarea statistică şi sunt esenţiale, adică răspund

direct obiectivului stabilit. Întocmirea corectă a unui program de observare este nerealizabilă

fără consultarea specialiştilor din domeniul care face obiectul observării.

Unitatea de observare poate să fie simplă sau complexă. Definirea unităţilor de

observare, indiferent de felul lor, trebuie să se facă pe baza unor elemente clare, care să

permită înţelegerea unitară a noţiunii respective de către toate persoanele care culeg datele.

De asemenea, la definirea unei unităţi de observare trebuie să se ţină seama şi de felul

colectivităţii (statice sau dinamice). Astfel, unităţile colectivităţii statice există la momentul

dat ca entităţi de sine stătătoare, bine determinate, cu o dimensiune precisă. Spre deosebire de

acestea, unităţile colectivităţilor dinamice (fenomenele apar, se dezvoltă, dispar în decursul

unei perioade) pot fi înregistrate numai pe intervalul respectiv, numărul lor la un anumit

moment fiind lipsit de sens.

La definirea unităţii de observare trebuie să se ţină seama şi de necesitatea de a asigura

comparabilitatea datelor pe plan teritorial şi în dinamică.

Timpul observării - pentru efectuarea unitară a observării statistice trebuie să se

precizeze atât timpul la care se referă datele culese, cât şi timpul când se face înregistrarea.

Timpul la care se referă datele nu trebuie confundat cu timpul înregistrării. De regulă,

timpul observării este considerat acela la care se referă datele culese şi poate fi un singur

moment (pentru înregistrările statice) sau o perioadă (pentru înregistrările dinamice).

Alegerea timpului observării se face în funcţie de felul observării, de particularităţile

obiectului şi mai ales de scopul cercetării statistice.

Pentru înregistrările în dinamică se stabileşte timpul observării pentru o perioadă - o

zi, o decadă, o lună, un trimestru etc. - iar completarea formularelor se face după expirarea

timpului la care se referă datele. Este cazul rapoartelor statistice.

Există şi situaţii când timpul observării coincide cu timpul când se înregistrează datele,

cum este cazul fotografierii zilei de lucru a angajatului.

Un alt aspect căruia trebuie să i se acorde o mare importanţă se referă la alegerea

timpului observării. În practica statistică, ca timp al observării se alege perioada în care

colectivităţile prezintă gradul cel mai ridicat de stabilitate. De exemplu, recensământul

populaţiei se efectuează iarna când deplasarea populaţiei este mai redusă. Pentru studiul

cererii de consum a populaţiei pentru anumite bunuri şi servicii, în funcţie de scopul

cercetărilor vom alege o perioadă mai stabilă, în afara sărbătorilor dacă vrem să evidenţiem

componenta stabilă sau altă perioadă dacă vrem să punem în evidenţă şi să determinăm

sezonalitatea atunci când este cazul.

De remarcat faptul că în prelucrarea ulterioară a datelor nu apare decât timpul la care

se referă datele.

Locul observării este precizat în program cu scopul de a găsi mai uşor unităţile de

observare. El coincide, de regulă, cu locul producerii fenomenelor. Cazul în care locul

înregistrării diferă de locul producerii fenomenului se întâlneşte în special când observarea

statistică se realizează prin preluarea datelor din diferite surse deja existente (alte forme de

evidenţă, publicaţii etc.).

În general probleme legate de loc apar în observarea statistică pentru unităţile statistice

complexe, care includ în ele unităţile simple din care sunt formate.

Formulare şi instrucţiuni - pentru a realiza o observare unitară este necesar ca

formularele pe care se culeg datele statistice să fie tipizate şi întocmite pe baza programului

observării, astfel încât să se poată da răspunsuri la toate caracteristicile.

Capitolul 1 17

În practică se folosesc două tipuri de formulare: fişa şi lista. În fişe se trec datele cu

privire la o singură unitate de observare, conform programului. Fişa se foloseşte când

programul de observare este mai bogat şi când unităţile de înregistrare sunt mai răspândite în

spaţiu. Într-o listă se înscriu răspunsurile la caracteristicile din program pentru mai multe

unităţi de observare statistică concentrate în spaţiu. În unele situaţii se pot folosi şi combinat

cele două tipuri de formulare. De exemplu, la recensămintele de populaţie se întocmeşte câte

o fişă pentru fiecare familie, iar persoanele care locuiesc în colectivităţi numeroase (cămine,

armată, spitale) sunt înregistrate în liste.

Normele metodologice şi tehnice privind completarea formularelor sunt imprimate

direct pe ele sau separat în broşuri speciale.

Aceste instrucţiuni de completare a formularelor trebuie să fie cât mai scurte, dar

complete, asigurând înţelegerea uniformă pentru toţi observatorii statistici.

Formularele trebuie să fie întocmite în aşa fel încât să permită codificarea

răspunsurilor la întrebări, în vederea prelucrării ulterioare a datelor folosind o tehnică de

calcul adecvată.

Măsurile organizatorice au drept scop asigurarea unor condiţii cât mai bune pentru

desfăşurarea observării statistice. Mai întâi este necesar să se efectueze din timp o

documentaţie amplă cu privire la experienţa acumulată cu prilejul unor observări similare,

întrucât în ţară sau pe plan mondial valorificarea acestei experienţe are drept rezultat atât

obţinerea unui volum mare de date şi de bună calitate cât şi posibilitatea asigurării

comparabilităţii datelor în timp şi în spaţiu.

Când datele se culeg direct de la populaţie este necesar să se facă popularizarea

acţiunii prin presă, radio şi televiziune pentru a informa populaţia asupra conţinutului şi

scopului observării respective.

Măsurile organizatorice sunt foarte variate de la o observare la alta, în funcţie de

natura specifică a fenomenelor studiate, de sursele de informaţie utilizate, de volumul de date

ce urmează să fie obţinut, de felul şi procedeul de înregistrare folosit. De aceea, planul unei

observări trebuie să se particularizeze pe fiecare cercetare în parte, în funcţie de scopul

acesteia.

5. Metode de observare statistică

În procesul istoric de dezvoltare a statisticii s-au conturat mai multe metode de

observare care de regulă, se folosesc combinat, sub îndrumarea şi controlul organelor oficiale

de statistică, în prezent Institutul Naţional de Statistică). În general metoda de observare a fost

şi este dependentă de modul de organizare şi funcţionare al sistemului informaţional al

statisticii de stat. În acest sens, informaţia statistică poate fi privită ca un proces continuu în

care pe măsură ce intră date, acestea se prelucrează şi sunt transformate în indicatori statistici

care pot fi transmişi în ordine ierarhică organului superior sau stocaţi în băncile de date

statistice, servind frecvent ca mijloace de informare publică despre principalele aspecte şi

fenomene ale dezvoltării economice şi sociale.

Existenţa mai multor metode de observare statistică prezentând particularităţi de

conţinut şi metodologie face posibilă clasificarea lor în funcţie de mai multe criterii.

Un prim criteriu de clasificare este acela al gradului de cuprindere al numărului de

unităţi în procesul de observare. În funcţie de aceasta, întâlnim observări totale şi

observări parţiale. Observarea totală presupune înregistrarea după criterii unitare a datelor -

potrivit programului de observare de la toate unităţile colectivităţii. În acest caz, principala

problemă este aceea a identificării tuturor cazurilor concrete sub care se manifestă fenomenul


studiat. Ţinând seama de posibilităţile de obţinere a informaţiei, observările totale sunt:

recensământul şi raportările statistice cunoscute şi sub denumirea de dări de seamă.

Observările parţiale presupun că datele se obţin numai de la o parte a unităţilor colectivităţii,

parte care poate să fie reprezentativă sau nu în raport cu întreaga colectiv itate.

Un alt criteriu de clasificare are în vedere modul în care este caracterizat

fenomenul. Din acest punct de vedere se întâlnesc observări statice şi observări dinamice.

Observaţiile statice sunt folosite pentru a culege date cu privire la volumul şi structura unei

colectivităţi statice delimitată ca volum şi circumscrisă în aceleaşi condiţii de timp, adică la un

moment dat. Observările dinamice au ca obiect înregistrarea unui proces ce evoluează în timp.

În acest caz trebuie să se stabilească timpul la care se referă datele şi periodicitatea cu care se

face înregistrarea. În cadrul observărilor statice se includ recensămintele şi în general orice

inventariere statistică indiferent de colectivitatea la care se referă, iar celelalte observări

statistice totale sau parţiale, care înregistrează fenomenele în continua lor transformare sunt

observări cu caracter dinamic. De exemplu, bugetele de familie necesare caracterizării

statistice a calităţii vieţii, reprezintă o observare dinamică ca de altfel şi dările de seamă

statistice transmise de agenţii economici. Din punct de vedere al modului de organizare

observările statistice pot fi observări cu caracter permanent, deci, în mod sistematic intră

date statistice în sistemul informaţional şi observări speciale care vin să completeze pe cele

permanente, organizându-se de fiecare dată când este necesar. În general observările cu

caracter permanent reprezintă principala "materie primă"a procesului de cercetare prin

sistemul informaţional statistic, în timp ce observările speciale sunt organizate de către

organul central de statistică pentru lărgirea cadrului de interpretare şi analiză al fenomenelor

complexe existente în societate.

Din punct de vedere al timpului de efectuare se pot întâlni observări curente,

periodice şi unice.

De reţinut că în practica statistică aceste criterii se pot întrepătrunde. Alegerea celei

mai potrivite metode de observare trebuie să se facă în raport cu natura specifică a

fenomenelor studiate cu sursele de informaţie de care dispunem şi pot fi utilizate, cu

mijloacele de prelucrare a informaţiei pe care le avem, precum şi de cantitatea de informaţie

existentă în băncile de date statistice.

Principalele metode de observare statistică sunt:

recensământul;

raportările statistice denumite şi sistemul dărilor de seamă;

observarea selectivă;

ancheta statistică;

observarea părţii principale;

monografia.

Recensământul este cea mai veche metodă de observare statistică. Ea a apărut încă

din antichitate şi avea un caracter demografic. În general reprezintă fotografierea fenomenelor

la un moment dat. Deci, trebuie să alegem un moment critic faţă de care ne raportăm atunci

când culegem datele. Recensămintele populaţiei reprezintă modelul general pentru observările

de acest tip. Ele reprezintă operaţii de mare amploare şi durata de pregătire de 1-2 ani. La

organizarea unui recensământ se ţine seama de experienţa naţională şi internaţională în acest

domeniu concretizate în special în nomenclatoarele care vor fi utilizate la prelucrarea datelor

şi la prezentarea structurată a informaţiei care să permită alinierea statisticii noastre la teoria şi

practica ţărilor avansate.

Recensămintele reprezintă observări cu caracter periodic, periodicitatea recunoscută

pe plan naţional şi internaţional fiind de 5-10 ani. La alcătuirea programului observării trebuie

să se ţină seama de scopul recensământului. În acelaşi timp pentru a putea surprinde mutaţiile

de structură trebuie să asigurăm comparabilitatea datelor pe plan naţional şi internaţional. În

Capitolul 1 19

acest scop, se elaborează un număr mare de nomenclatoare. Pentru a asigura operativitatea

culegerii datelor se folosesc recenzori şi de altă specialitate decât cea statistică, ceea ce

înseamnă că ei trebuie recrutaţi şi instruiţi astfel încât să se folosească norme unitare pe tot

teritoriul.

Teritoriul se împarte în circumscripţii şi sectoare de recensământ, care să permită

combinarea prelucrării centralizate cu cea descentralizată. Pentru buna reuşită a

recensământului se organizează un recensământ de probă cu care ocazie se verifică dacă

normele pe un recenzor sunt bine stabilite şi în timpul preconizat se poate obţine întreaga

cantitate de informaţie.

Prin analogie se pot folosi recensăminte şi în alte domenii ca de exemplu:

- anual, populaţia de vârstă şcolară şi cu opţiunile corespunzătoare;

- anual, recensământul animalelor.

Într-un sens mai larg orice inventariere poate să fie considerată ca un recensământ

statistic.

Raportările statistice curente sunt specifice sistemelor informaţionale în cadrul

cărora sunt cuprinse cu obligaţii permanente de informare întreprinderile, instituţiile şi agenţii

economici, publici şi privaţi. Ele se realizează în concordanţă cu obligaţiile stipulate prin

legea statisticii statului de drept. În aceste raportări, denumite uneori şi dări de seamă sunt

incluşi principalii indicatori cu caracter economic, social-cultural, juridic, de învăţământ şi

alte servicii. Unitatea odată inclusă în sistemul informaţional statistic este obligată de lege să

transmită integral informaţia cerută prin formulare tipizate de raportări statistice, la termenele

fixate şi despre perioada respectivă, în continua desfăşurare a fenomenelor şi activităţilor ce

fac obiectul înregistrărilor pe baza acestei metode de observare.

În consecinţă, trebuie să existe un nomenclator de raportări statistice în care sunt

trecute toate formularele, obligatoriu simbolurile acestora, beneficiarii de informaţii, numărul

de exemplare şi conţinutul indicatorilor. În condiţiile prelucrării automatizate a informaţiei

este necesar ca periodic să se efectueze un proces de raţionalizare a raportărilor statistice,

eliminându-se paralelismele de obţinere a datelor şi informaţiei de prisos.

Valorificarea rezultatelor obţinute prin această metodă de observare se face în scopul

informării populaţiei, a guvernului şi a organismelor internaţionale la care ţara noastră este

afiliată. Este evident faptul că opinia publică într-o economie de piaţă este din ce în ce mai

interesată în legătură cu mersul activităţii economice, a problemelor de investiţii de capital,

probleme privind piaţa muncii, probleme de management şi marketing modern, care nu pot fi

rezolvate decât printr-o statistică corectă şi operativă.

Rezultă că, raportările statistice sunt observări totale pentru unităţile cuprinse în

sistemul informaţional statistic, cu caracter permanent şi surprind în acelaşi timp atât

probleme statice cât şi dinamice. Evident numărul dărilor de seamă şi al indicatorilor la care

se referă sunt mai numeroase pentru unităţile economice şi sociale din sectorul public. Totuşi

informarea opiniei publice asupra economiei naţionale trebuie să cuprindă întregul sistem de

relaţii economice din ţară. Pentru unele aspecte privind activitatea din sectorul privat al

economiei, se folosesc şi unele surse indirecte, în principal statistica fiscală care va ocupa un

loc din ce în ce mai important în furnizarea datelor statistice sub formă de raportări statistice

periodice.

Sondajul reprezentativ cunoscut şi sub denumirea de observare selectivă face parte

din metodele de observare special organizate şi cu caracter parţial. Are ca scop să înlocuiască

o observare totală de mare amploare sau care practic este imposibilă. De exemplu, dacă vrem

să studiem calitatea produselor, durata medie de funcţionare a bunurilor, etc., nu este raţional

să se facă o observare totală. De asemenea, dacă vrem să studiem calitatea vieţii recurgem la

un sondaj pe bază de bugete de familie în care sunt înregistrate veniturile pe surse şi


cheltuielile pe destinaţie pentru un eşantion de familii. Pe baza bugetelor de familie putem

stabili un indice al costului vieţii.

Pentru ca să putem substitui observarea totală prin cea parţială eşantionul trebuie să

îndeplinească condiţia de reprezentativitate. Prin reprezentativitate înţelegem ca eşantionul să

reproducă într-un număr mic de unităţi structura întregii colectivităţi (populaţii). De aici

rezultă că, pentru a aplica corect un sondaj statistic, trebuie să studiem mai întâi structura

populaţiei şi factorii determinanţi, cu caracter esenţial, care au influenţat asupra fenomenelor

pe care le studiem.

În acest sens sondajul statistic este o metodă riguroasă care se bazează pe principiile

teoriei probabilităţilor potrivit căreia putem obţine nu numai caracterizarea statistică a

fenomenelor, dar putem calcula şi erorile probabile de estimare a tendinţelor generale pe baza

datelor de eşantion.

Ancheta statistică este o metodă de observare parţială cu deosebirea că numai cu totul

întâmplător poate să îndeplinească condiţia de reprezentativitate. Ea se bazează pe

completarea benevolă a chestionarelor, ceea ce înseamnă că pe baza rezultatelor ei putem

aprecia unele tendinţe generale fără să putem face o estimare riguroasă a parametrilor

colectivităţii totale. De exemplu, cererea de bunuri de consum se poate studia fie prin sondaje

statistice reprezentative, deci prin metoda selectivă, fie prin anchete statistice. În primul caz

eşantionul se stabileşte prin aplicarea unei scheme probabilistice alegând unităţile care vor

forma eşantionul astfel încât să reprezinte toate straturile populaţiei într-o proporţie

corespunzătoare. Putem folosi pentru studiul cererii de mărfuri şi o anchetă statistică efectuată

la pavilioanele de mostre. În acest caz sunt rugaţi vizitatorii să completeze chestionarele. În

cel de-al doilea caz evident că datele sunt numai orientative deoarece se constată că structura

celor care completează chestionarele prezintă abateri semnificative de la structura populaţiei

totale.

Frecvent cele două metode de observare se folosesc în cercetările cu caracter

sociologic şi în sondajele de opinie publică.

Observarea părţii principale se foloseşte atunci când se studiază o colectivitate care

prezintă variaţii calitative substanţiale de la o grupă la alta, astfel încât unele grupe au o

influenţă hotărâtoare la formarea indicatorilor pe întreaga colectivitate, iar altele au o

influenţă nesemnificativă. În consecinţă în cadrul unei colectivităţi pot fi preponderente

anumite grupe şi în acst caz este suficient să se supună observării numai partea principală a

colectivităţii şi, cu anumite rezerve, să se caracterizeze întregul ansamblu.

Informaţiile culese prin observarea părţii principale nu au caracter reprezentativ, dar

pot da o informaţie orientativă asupra tendinţelor ce se manifestă la nivelul întregului.

Monografia este o observare parţială care se realizează la o unitate complexă sau

pentru o problemă care interesează. De exemplu, se poate întocmi monografia unui oraş,

municipiu, întreprindere.

Rezultă că o monografie statistică înseamnă o caracterizare multilaterală a unităţilor

complexe studiate. Ea se realizează de către o echipă mixtă de specialişti care participă la

toate trei etapele: observarea datelor, prelucrarea lor, analiza şi interpretarea rezultatelor.

În sfârşit, în aplicarea concretă a tuturor metodelor de observare statistică trebuie să se

folosească în mod corespunzător procedeele de culegere statistică a datelor care respectă în

cea mai mare măsură principiul autenticităţii. Astfel, pentru culegerea datelor putem folosi

măsurarea şi/sau observarea directă, interogarea, autoânregistrarea, fie preluarea din alţi

purtători de informaţii.

Măsurarea directă se foloseşte atunci când variabilele incluse în programul observării

se pot obţine direct printr-o operaţie de măsurare cantitativă efectuată nemijlocit de cel care

culege datele. În acest caz, responsabilitatea asupra conţinutului real al indicatorilor revine

celui care completează şi semnează formularele de observare statistică.

Capitolul 1 21

Procedeul interogării se foloseşte atunci când completarea formularelor se face de o

persoană special angajată numită recenzor. Acesta consemnează răspunsurile de la persoanele

intervievate. De aici necesitatea ca recenzorul să aibă talentul de a convinge pe cel căruia îi

solicită informaţia de confidenţialitatea răspunsului şi de faptul că în procesul de prelucrare

ulterioară datele solicitate şi consemnate îşi pierd individualitatea. Ele se regăsesc numai în

indicatori globali sau în expresii numerice cu caracter de medie, structură etc. Rezultă de aici

că responsabilitatea autenticităţii datelor îi revine în principal recenzorului incluzând în acesta

şi măsura în care l-a determinat pe cel intervievat la furnizarea unor date exacte. În ţările în

care cele mai multe informaţii statistice se obţin pe bază de sondaje statistice există instituţii

specializate în astfel de operaţiuni şi ei folosesc în scopul realizării observării statistice ca

recenzori fie angajaţi proprii, fie angajaţi temporari.

Auto-înregistrarea se foloseşte atunci când formularele sunt completate de persoanele

la care se referă datele. Ea se realizează fie atunci când formularele se expediază celor de la

care se culeg datele, fie că se distribuie într-un mod organizat de exemplu: târguri de mostre,

expoziţii. Tot aici se pot încadra şi bugetele de familie care se completează în mod curent de

către un membru al familiei din eşantion. Evident că în acest caz asigurarea veridicităţii

datelor depinde exclusiv de cel care completează formularul.

Procedeul preluării datelor statistice din alţi purtători de informaţii provine din

particularitatea statisticii de a-şi realiza observarea prin cele două căi: contactul direct cu

obiectul observării şi folosirea unor surse de informaţii deja existente. Astfel, statistica poate

să relizeze observarea folosind documente de evidenţă primară, documente contabile şi

financiare, diferite publicaţii statistice. Rezultă în acest caz că statistica fiind beneficiar de

informaţie depinde de autenticitatea datelor înscrise în purtătorii de informaţii utilizaţi. De

regulă, prin sondaj, statistica efectuează un control asupra credibilităţii surselor de informare

utilizate.

Pentru completarea observării statistice curente serviciile de statistică publică au acces

la evidenţele administrative deţinute de serviciile publice - bilanţuri contabile, documente de

impozitare, registre comerciale, registre de evidenţă a populaţiei etc., cu obligaţia de păstrare

a confidenţialităţii datelor incluse în sistemul de indicatori calculate şi publicate de Comisia

Naţională pentru Statistică.

6. Organizarea sistemului informaţional în România

Întreaga activitate a statisticii publice trebuie să se desfăşoare respectând

următoarele principii: autonomiei; confidenţialităţii; transparenţei; specializării;

proporţionalităţii şi deontologiei statistice.

Se cunoaşte că organizarea sistemului informaţional depinde întotdeauna de rolul şi

funcţiile pe care statistica, ca instituţie statală îl are în procesul de conducere şi de luare a

deciziilor atât la nivel macro cât şi în structurile componente ale acestuia. De aici rezultă că

statistica trebuie să-şi organizeze astfel întreaga sa activitate încât să furnizeze în mod curent

sau de câte ori este nevoie date cuprinzătoare pentru informarea opiniei publice, a organelor

puterii de stat cât şi a instituţiilor internaţionale la care ţara noastră este afiliată.

Ca atare, întreaga activitate de statistică trebuie să fie desfăşurată într-o viziune

sistemică şi să fie concretizată într-un sistem de indicatori deschis şi dinamic. Aceasta

presupune de asemenea, că acest sistem să fie organizat pe subsisteme corespunzător

structurilor principale ale economiei naţionale. În principal, în ţara noastră, statistica trebuie

să obţină informaţii şi să le transmită după criteriul de ramură, după criteriul teritorial şi după

criteriul formei de proprietate.


La nivelul fiecărei structuri ierarhice statistica trebuie să asigure pe de o parte

posibilitatea de agregare şi dezagregare a informaţiei, ceea ce nu împiedică o anumită

autonomie. Această autonomie apare în special în structura de ramură şi teritorială în care ea

trebuie să relizeze şi analize complexe al căror obiect îl constituie ramura sau judeţul

respectiv.

Deci, putem considera că obţinerea informaţiei statistice este un proces continuu în

care statistica de stat are legături sistematice cu furnizorii de date statistice şi cu beneficiarii

de informaţii.

Organizarea sistemulul informaţional şi funcţionarea lui depinde în mare măsură de

tehnica de calcul de care se dispune. Prelucrarea automată a datelor statistice impune o

anumită rigurozitate în ceea ce priveşte obţinerea datelor cât şi prelucrarea acestora. În acest

sens, organul statistic trebuie să aibă în componenţa sa şi un departament de calcul şi de

obţinere a indicatorilor, a conţinutului acestora, a gradului lor de cuprindere şi asigurării

comparabilităţii lor pe plan naţional şi internaţional. În acelaşi timp rezultă că la fiecare nivel

de obţinere a informaţiilor statistice trebuie să fie elaboraţi purtători de informaţie şi băncile

de date statistice corespunzătoare. Numai în aceste condiţii sunt posibile să existe relaţii

nemerice strict determinate între indicatorii urmăriţi.

Fiind conceput într-o structură ierarhică între elementele sistemului se obţin indicatori

agregaţi de la bază către vârful sistemului şi indicatori dezagregaţi de la vârful sistemului

către bază. În altă ordine de idei trebuie reţinut că statistica operând cu fenomene variabile în

timp, spaţiu şi organizatoric, nu poate folosi o singură expresie numerică pentru caracterizarea

aceluiaşi fenomen, ci un număr mai mare de indicatori, de regulă cuprinşi într -un sistem.

Elaborarea sistemului şi subsistemelor de indicatori în structura orizontală, verticală şi

transversală este o problemă cu caracter permanent ce trebuie să fie rezolvată de către

statistica de stat pe baza experienţei naţionale şi internaţionale dobândită în domeniul teoriei

economice şi a practicii statistice privind organizarea şi funcţionarea instituţiilor de statistică.

7. Erorile observării statistice. Controlul datelor statistice

Principiul de bază al efectuării unei observaţii statistice este acela al asigurării

autenticităţii datelor. Prin autenticitatea datelor se înţelege corespondenţa deplină între datele

înregistrate şi mărimea obiectivă a fenomenului. Buna organizare a unei observări statistice

trebuie să se reflecte în obţinerea unor date exacte şi în volum complet.

Practica statistică a dovedit că în mod curent se pot produce mai multe feluri de erori

şi anume: erori de observare sau înregistrare; erori de reprezentativitate; erori de modelare

statistică.

Erorile de observare reprezintă abateri între datele înregistrate şi mărimea concretă,

reală a caracteristicilor cuprinse în programul observării. Aceste erori de înregistrare sunt cu

atât mai numeroase cu cât cercetarea este de mai mare amploare şi cuprinde un program

amplu de observare.

Erorile de observare întâmplătoare se produc, de regulă, în ambele sensuri şi sunt

făcute nepremeditat; fie din neânţelegerea corectă a întrebării, fie din lipsa de memorie. Cu

cât observarea se referă la un număr mai mare de unităţi, cu atât posibilităţile de compensare a

acestor erori sunt mai mari şi ca atare ele vor influenţa în mai mică măsură rezultatele de

ansamblu.

Erorile de observare sistematice se produc, de regulă, într-un singur sens şi

influenţează asupra indicatorilor de ansamblu. Erorile sistematice sunt de natură subiectivă şi

provin fie din neânţelegerea fenomenelor, fie din rea credinţă.

Capitolul 1 23

Exemplu de eroare de observare sistematică poate fi menţionat aşa numitul proces de

"aglomerare a vârstelor" terminale între 0 şi 5; populaţia fiind tentată să declare o vârstă

rotunjită la 0 şi 5.

Erorile de reprezentativitate apar atunci când înlocuim o observare totală prin una

parţială. Şi în acest caz întâlnim două categorii de erori: erori întâmplătoare şi erori

sistematice. Erorile întâmplătoare apar datorită faptului că, oricât s-ar respecta principiile

teoriei selecţiei este destul de greu să obţinem eşantioane în structură identică cu cea a

colectivităţii generale. Astfel de erori se produc în ambele sensuri şi ele sunt calculabile

folosind principiile teoriei probabilităţilor dacă la formarea eşantionului am folosi o schemă

probabilistică.

Erorile sistematice apar de regulă când folosim un sistem preferenţial, subiectiv, de

formare a eşantionului. În acest caz, de regulă, erorile se produc într-un singur sens şi

influenţa lor se propagă asupra exactităţii estimaţiei parametrilor colectivităţii totale. Ele pot fi

înlăturate dacă luăm toate măsurile de respectare riguroasă a teoriei selecţiei.

Erorile de modelare statistică sunt specifice prelucrării şi analizei datelor statistice.

Statistica studiază fenomenele complexe care prezintă un grad mare de variaţie

numerică şi pot fi caracterizate statistic prin diferite modele de calcul. Pe lângă banca de date

statistice, statistica dispune şi de o bancă de modele statistice. Ele reprezintă modele teoretice

care trebuie să fie adoptate la specificul fenomenelor. Dacă modelele statistice se aplică

mecanic fără discernământul unei analize calitative, riscăm să ajungem la concluzii care sunt

infirmate de realitatea obiectivă. Aceasta este posibil atunci când în analiza teoretică

prealabilă nu se acordă suficientă atenţie particularităţilor specifice privind conţinutul şi

tendinţele obiective de dezvoltare a fenomenelor studiate sau seriile de date obţinute provin

dintr-un număr insuficient de unităţi observate. În acest din urmă caz nu se respectă cerinţele

legii numerelor mari potrivit căreia legea statistică nu poate să fie evidenţiată decât dacă se

lucrează cu un număr suficient de mare de date în raport cu întreaga colectivitate. De aceea, în

statistică se aplică frecvent metode de verificare a ipotezelor utilizate şi teste de semnificaţie a

indicatorilor. În acest caz operăm frecvent cu noţiunea de eroare d e modelare şi ea poate să fie

interpretată tot în sens probabilistic. În cele mai multe cazuri dispunem de tabele de repartiţie

a erorilor probabile şi prin compararea rezultatelor empirice cu valori tabelare infirmăm sau

validăm rezultatele obţinute.

Pentru eliminarea erorilor, datele statistice sunt supuse unui control care poate fi de

volum, cantitativ, numeric sau logic.

Controlul de volum presupune ca la centrul de prelucrare să se verifice dacă au sosit

toate formularele, cu toate rubricile completate.

Controlul cantitativ-numeric constă în refacerea prin sondaj a unor calcule de obţinere

a unor indicatori înscrişi în formular.

Controlul logic presupune ca pe baza experienţei şi cunoştinţelor din domeniul

respectiv să depistăm eventuale erori printr-o comparaţie vizuală.

Pentru erorile de estimare şi modelare se folosesc modele de verificare a ipotezelor

statistice şi se aplică teste de semnificaţie a valorilor indicatorilor calculaţi. Astfel de cazuri se

vor întâlni în capitolele următoare.

În sfârşit trebuie precizat şi faptul că pentru asigurarea calităţii datelor statistice

comunicate serviciilor de statistică publică, personalul acestora are drept de verificare a

modului de determinare a indicatorilor respectivi şi corespondenţa lor cu evidenţele

deţinătorilor de date primare. În cazul depistării unor erori (abateri) se încheie proces-verbal

de constatare a contravenţiei şi se aplică amenzi.

Controlul datelor statistice face legătura între observarea şi prelucrarea datelor

statistice. De reţinut că, pentru depistarea erorilor în statistică utilizăm şi calculatoarele

electronice existând programe adecvate acestui scop.


Rezumat

Acest capitol prezintă noţiunile de bază necesare organizării unei cercetări statistice:

stabilirea obiectivului cercetării, definirea colectivităţii şi a caracteristicilor necesare analizei,

culegerea datelor conform planului observării.

Termeni importanţi: colectivitatea statistică, caracteristica statistică, unitatea

statistică, indicator statistic, observarea statistică, erorile statistice.

Teste de autocontrol:

1. Ce înţelegeţi prin colectivitate statistică ? Exemplificaţi.

2. Prin ce se caracterizează o colectivitate statistică ?

3. Unitatea statistică. Definiţie, tipuri.

4. Definiţi observarea statistică.

5. Ce tipuri de observări statistice cunoaşteţi ?

6. Ce tipuri de erori statistice cunoaşteţi ?

Capitolul 2 25

Capitolul 2

Tema Sistematizarea şi prezentarea datelor statistice

Obiectivele 1. Tipuri de grupări

2. Grupare unidimensională

3. Grupare bidimensională

4. Prezentarea datelor statistice

4.1 Tabele statistice

4.2 Seriile statistice

4.3 Reprezentări grafice

Mijloace

- citire/învăţare




lupă)


Finalitatea 1. realizarea sistematizării datelor sub formă de grupe omogene după una

sau mai multe caracteristici necesară calculului indicatorilor statistici

2. prezentarea datelor sub formă de tabele, serii, grafice


Timp de lucru

necesar



Sistematizarea şi prezentarea datelor statistice 26

Sistematizarea şi prezentarea datelor statistice

1. Tipuri de grupări

Metoda grupării este considerată ca metodă de bază a cercetărilor statistice.

Această metodă este folosită pentru a putea trece de la o masă amorfă de date individuale

diferite la o omogenizare a acestora.

În sens statistic, prin grupare înţelegem separarea unităţilor

colectivităţii pe grupe omogene. O grupă este considerată statistic omogenă, dacă

unităţile din aceeaşi clasă sau subclasă prezintă variaţii minime fie ca nivel de

dezvoltare, fie ca formă de manifestare.

Această variaţie minimă este interpretată în statistică ca fiind rezultatul influenţei

factorilor aleatori. Ca atare, omogenizarea datelor pe grupe se poate face cu ajutorul unor

caracteristici esenţiale de grupare, care pot fi interpretate şi ca factori determinaţi.

După conţinutul caracteristicii de grupare putem avea: grupări cronologice; grupări

teritoriale; grupări atributive.

Grupările cronologice presupun că s-a folosit drept caracteristică de grupare o

variabilă de timp. Un exemplu de acest fel îl poate constitui gruparea agenţilor economici

după anul înfiinţării. Menţionăm că nu orice însuşire de date după timp poate fi asimilată unei

grupări statistice. Timpul trebuie să determine o structurare calitativă a colectivităţii pentru a

răspunde principiilor grupării statistice.

Grupările teritoriale sunt folosite pentru a separa unităţile colectivităţii în grupe după

un criteriu de spaţiu. Se pot obţine: grupări teritorial-administrative, grupări pe zone

geografice etc. Grupările teritoriale nu pot fi confundate cu o prezentare a datelor după o

caracteristică de spaţiu. Gruparea teritorială respectivă trebuie să se refere la toate unităţile şi

din acest punct de vedere trebuie să fie asigurată omogenizarea datelor.

Grupările atributive se folosesc pentru toate caracteristicile care au format

programul observării, în afara caracteristicilor de timp şi spaţiu.

Ele pot fi caracteristici cantitative (numerice) şi calitative (nenumerice). În cazul

grupării după o caracteristică numerică trebuie determinată amplitudinea variaţiei şi numărul

de grupe r, iar în cazul grupării după o caracteristică nenumerică trebuie stabilit un

nomenclator al grupelor şi subgrupelor. De obicei, noţiunea de grupare include variabilele

statistice şi cu precădere pe cele numerice, în timp ce grupările nenumerice se mai numesc şi

clasificări şi au, de regulă, caracter permanent şi oficial.

La rândul lor grupările după o variabilă numerică se întâlnesc în trei situaţii:

a) amplitudinea variaţiei foarte mică şi în acest caz gruparea se face direct pe variante.

De exemplu: gruparea familiilor după numărul persoanelor, gruparea familiilor după numărul

copiilor, gruparea studenţilor după nota obţinută la examen;

Capitolul 2 27

b) dacă amplitudinea variaţiei este moderată se foloseşte o grupare pe intervale de

variaţie egale. În acest caz, e necesar, să se stabilească numărul de grupe şi mărimea

intervalului de variaţie.

c) dacă amplitudinea variaţiei este foarte mare se recomandă gruparea pe intervale de

variaţie neegale. În acest caz, se face în prealabil o grupare pe intervale egale de variaţie

folosind un număr mai mare de grupe. După ce am efectuat această primă grupare se trece la

restrângerea grupelor încercând să imprimăm un mod de variaţie sistematică, adică se alege

un interval de bază căruia i se aplică multiplicatori din ce în ce mai mari. Astfel, am putea

aprecia că, cu cât valoarea caracteristicii creşte cu atât mai uşor este de asigurat omogenitatea.

În general, gruparea pe intervale neegale urmăreşte să structureze colectivitatea pe tipuri

calitative. De exemplu, dacă se grupează întreprinderile comerciale după volumul

desfacerilor, gruparea o putem face pe intervale neegale şi ne dă posibilitatea structurării

colectivităţii pe întreprinderi mici, mijlocii, mari şi foarte mari.

Grupările şi clasificările pot fi simple şi combinate. Cele simple se obţin atunci când

folosim o singură caracteristică de grupare şi combinate când se folosesc împreună mai multe

caracteristici de grupare.

În mod obligatoriu se folosesc grupări simple pentru toate variabilele cuprinse în

programul observării şi grupări combinate pentru interpretarea interdependenţei statistice

dintre fenomene.

2. Grupare unidimensională

Dintr-o anchetă prin sondaj s-au obţinut următoarele date în legătură cu

activitatea a 20 de societăţi comerciale:

Tabelul nr. 1

Nr

.

crt

.

Cifra de

afaceri -mii

RON-

Număr de

personal

Fondul

de salarii -mii RON-

Nr.

crt.

Cifra de

afaceri -mii

RON-

Număr de

personal

Fondul

de salarii -mii RON-

1. 50 5 22 11. 76 13 37

2. 66 5 31 12. 181 19 89

3. 185 21 90 13. 122 10 63

4. 117 12 50 14. 137 12 58

5. 98 9 47 15. 140 17 71

6. 125 8 33 16. 59 7 18

7. 89 10 40 17. 91 11 36

8. 148 18 64 18. 133 9 52

9. 77 8 29 19. 101 11 60

10. 203 24 106

20. 172 13 88

Se cere:

1. Să se precizeze scopul, obiectul, unitatea şi programul observării;

2. Să se grupeze unităţile comerciale după mărimea cifrei de afaceri pe intervale

egale şi neegale;


3. Să se grupeze unităţile comerciale pe intervale egale după două caracteristici între

care există o legătură;

4. Să se reprezinte grafic repartiţiile obţinute (histograma şi poligonul frecvenţelor).

Rezolvare:

1. Scopul observării – determinarea unui sistem corelat de indicatori care să permită

caracterizarea celor 20 de societăţi comerciale.

Obiectul observării – este constituit din cele 20 de societăţi comerciale.

Unitatea de observare – o formează fiecare societate comercială supusă studiului.

Programul observării – cuprinde cele trei caracteristici: cifra de afaceri, numărul de

personal şi fondul de salarii.

Informaţiile culese sunt supuse prelucrării. Această etapă a cercetării statistice

cuprinde centralizarea informaţiilor, gruparea statistică şi determinarea unor indicatori

statistici.

Centralizarea informaţiilor presupune obţinerea unor indicatori totalizatori pentru

fiecare variabilă numerică (cantitativă) în parte la nivelul populaţiei statistice, adică o

centralizare simplă sau, în funcţie de situaţia concretă, o centralizare a informaţiilor pe grupe,

rezultând mai întâi indicatori parţiali şi apoi pentru întreaga populaţie.

Pentru aplicaţia de mai sus vom avea:

cele 20 de societăţi comerciale au avut o cifră de afaceri de 2370 mi i RON;

un număr de personal de 242 salariaţi;

un fond de salarii de 1084 mii RON.

Pentru a grupa unităţile pe intervale egale trebuie parcurse următoarele etape:

2. Gruparea societăţilor comerciale pe intervale egale:

a) calculul amplitudinii variaţiei:

minmax xxA ,

unde:

maxx - nivelul maxim al variabilei “x”;

minx - nivelul minim al variabilei “x”.

Amplitudinea variaţiei pentru cele trei caracteristici, va fi:

- pentru cifra de afaceri: A=203-50=153 mii RON

- pentru numărul de personal: A=24-5=19 persoane

- pentru fondul de salarii: A=106-18=88 mii RON

b) stabilirea prin analiză a numărului de grupe

Numărul de grupe se alege direct proporţional cu cifra de afaceri. Pentru cazul concret

avut în vedere se apreciază că se pot forma 5 grupe cu intervale egale r = 5.

c) determinarea mărimii intervalelor de grupare (h), ca raport între amplitudinea

variaţiei (A) şi numărul de grupe (r):

r

Ah

Pentru cazul concret, mărimea intervalelor va fi:

- pentru cifra de afaceri: h = 153/5 = 30,6 ~ 31

- pentru numărul de personal: h = 19/5 = 3,8 ~ 4

- pentru fondul de salarii: h = 88/5 = 17,6 ~ 18

Capitolul 2 29

Pentru repartiţiile aproximativ normale se recomandă utilizarea relaţiei lui Sturges:

n

xxh

lg322,31

minmax

d) formarea intervalelor de grupare prin cumularea succesivă, la limita inferioară, a

mărimii intervalului:

Tabelul nr.2

CIFRA DE AFACERI

VARIANTA I VARIANTA II * VARIANTA III *

50-80 -81 50-81

81-111 81-112 81-112

112-142 112-143 112-143

143-173 143-174 143-174

174-204 174 - 174-204

*limita superioară sau limita inferioară cuprinsă în interval

e) gruparea propriu-zisă, presupune determinarea pentru fiecare grupă a numărului

unităţilor comerciale (frecvenţele absolute) care aparţin grupei respective, respectând criteriul

de grupare.

Tabelul nr.3

Grupe de unităţi după

cifra de afaceri

-mii RON-

ix

Nr.

unităţi

if

Cifra de

afaceri

-mii RON-

Numărul de

personal

Fondul de

salarii

-mii

RON-

50-80 5 328 38 138

80-112 4 379 41 183

112-143 6 774 68 327

143-174 2 320 31 152

174-204 3 569 64 285

TOTAL 20 2370 242 1085

Determinarea frecvenţelor cumulate:

Tabelul nr.4

Frecvenţele cumulate Grupe de unităţi

după cifra de

afaceri

-mii RON- ix

Frecvenţele

absolute Mai mici decât

limita superioară

(crescătoare)

Mai mari decât

limita inferioară

(descrescătoare)

50 - 80 5 5 20

80 - 112 4 9 15


112 - 143 6 15 11

143 - 174 2 17 5

174 - 204 3 20 3

TOTAL 20 - -

Gruparea pe intervale neegale – se realizează fără a parcurge etapele de mai sus, în

funcţie de interesul cercetătorului.

Exemplu:

Tabelul nr.5

Grupe de unităţi

după cifra de afaceri

-mii RON- ix

Număr de

societăţi

comerciale

Sub 110 9

110 - 180 8

Peste180 3

TOTAL 20

3. Grupare bidimensională

Pentru a studia legătura dintre variabile, adesea se impune realizarea unei

distribuţii bidimensionale. În astfel de legături se lucrează cu o variabilă efect sau dependentă

y şi o variabilă cauză sau independentă x. Cele două variabile pot fi numerice (cantitative) sau

nenumerice (calitative), iar acestea la rândul lor pot fi nominale sau ordinale.

Atunci când dorim să analizăm distribuţia simultană a indivizilor statistici după două

sau mai multe caracteristici calitative, vorbim despre asociere, ceea ce înseamnă cum se

asociază, în cazul a două caracteristici, anumite stări ale unei caracteristici cu anumite stări ale

celeilalte. Baza acestei analize o constituie tabelul de asociere sau de contingenţă.

Problematica asocierii presupune efectuarea unor analize bivariate sau multivariate.

Presupunând că s-au înregistrat datele pentru două caracteristici x i şi yi şi unităţile au

fost împărţite în funcţie de caracteristica x în p grupe, s-au obţinut distribuţiile condiţionate de

factorul de grupare.

Cele două variabile prezentate în tabel se află într-o relaţie de cauzalitate şi calculând

indicatorii de variaţie corespunzători putem preciza dacă factorul de grupare x este un factor

hotărâtor (determinant) pentru variaţia factorului y.

Tabelul nr. 6

Valorile

caracteristicii de

grupare X

Numărul unităţilor pe variantele

caracteristicii Y

Volumul grupelor

y1 y2 … yj … yq

x1 n11 n12 n1j n1q n1.

x2 n21 n22 n2j n2q n2.

Capitolul 2 31

... ... ... ... ... ...

xi ni1 ni2 nij niq ni.

... ... ... ... ... ...

xp np1 np2 npj npq np.

Total n.1 n.2 n.j n.q n

Frecvenţele nij reprezintă numărul unităţilor statistice purtătoare ale valorilor (X i,Yj).

Frecvenţele ni. reprezintă distribuţia marginală pentru caracteristica x:

;;...;... .

1

.

1

.1

1

1 p

q

j

pji

q

j

ij

q

j

j nnnnnn

Frecvenţele n.j reprezintă distribuţia marginală pentru caracteristica y:

;;...;... .

1

.

1

1.

1

1 q

p

i

iqj

p

i

ij

p

i

i nnnnnn

3. Pentru punctul 3 al aplicaţiei, gruparea societăţilor comerciale după cifra de

afaceri şi numărul de personal se prezintă astfel:

Tabelul nr.7

Grupe de unităţi după numărul de personal Grupe de unităţi

după cifra de afaceri

-mii RON- ix 5 - 8 9 - 12 13 -16 17-20 21-24

TOTAL

if

50 - 80 4 - 1 - - 5

80 - 112 - 4 - - - 4

112 - 143 1 4 - 1 - 6

143 - 174 - - 1 1 - 2

174 - 204 - - - 1 2 3

TOTAL 5 8 2 3 2 20

Caracteristica dihotomică este acea caracteristică care realizează o grupare a

indivizilor în două categorii, cei care posedă o anumită proprietate şi cei care nu o posedă.

Având două caracteristici dihotomice indivizii se repartizează în patru categorii:

Tabelul nr.8

Modalităţile caracteristicii Y

Modalităţile

caracteristicii X

YsauY1

YsauY2

Total

XsauX1 11k

12k .1k


XsauX 2

21k 22k .2k

Total 1.k 2.k n

Interpretarea frecvenţelor absolute ijk se poate face astfel: 11k reprezintă indivizii

care posedă modalitatea X1 şi modalitatea Y1, iar 12k reprezintă indivizii care posedă

modalitatea X1 dar nu posedă modalitatea Y1.

Existenţa unei asocieri trebuie urmărită prin calculul mărimilor relative de structură

(ponderea unei grupe în total), astfel încât tabelului de mai sus i se pot ataşa două tabele cu

frecvenţe relative:

Tabelul nr. 9


Modalităţile

caracteristicii X

YsauY1

YsauY2

Total

XsauX1

11p 12p 1

XsauX 2

21p 22p 1

Total 1.p 2.p 1

Interpretarea frecvenţelor ijp se poate face astfel: 11p reprezintă ponderea indivizilor

care posedă modalitatea X1 şi modalitatea Y1 în totalul indivizilor ce posedă modalitatea X1,

iar 12p reprezintă ponderea indivizilor care posedă modalitatea X1 dar nu posedă modalitatea

Y1 în totalul indivizilor ce posedă modalitatea X1.

2

1

.

2,11

2,12,1

j

ij

i

ij

ij

ipentrup

jşiipentruk

kp

iar pentru cele marginale:

nkp jj /..

Tabelul nr. 10


Modalităţile

caracteristicii X

YsauY1

YsauY2

Total

XsauX1

11q 12q .1q

XsauX 2

21q 22q .2q

Total 1 1 1

Interpretarea frecvenţelor ijq se poate face astfel: 11q reprezintă ponderea indivizilor

care posedă modalitatea Y1 şi modalitatea X1 în totalul indivizilor ce posedă modalitatea Y1,

iar 12q reprezintă ponderea indivizilor care posedă modalitatea Y1 dar nu posedă modalitatea

X1 în totalul indivizilor ce posedă modalitatea Y1.

Capitolul 2 33

2

1

.

2,11

2,12,1

i

ij

j

ij

ij

jpentruq

jşiipentruk

kq

iar pentru cele marginale:

nkq ii /..

După modul în care se grupează indivizii, se pot ivi situaţiile:

asociere pozitivă – concentrarea indivizilor pe diagonala principală formată din

celulele (X1, Y1) şi (X2, Y2);

asociere negativă - concentrarea indivizilor pe diagonala secundară formată din

celulele (X1, Y2) şi (X2, Y1);

asociere perfectă – toţi indivizii se plasează pe una din diagonalele tabelului;

asociere maximă – atunci când una din perechile (X,Y) are frecvenţa de apariţie

zero.

Pentru a realiza o distribuţie bidimensională s-a luat în considerare un eşantion

format din 150 de persoane ce au răspuns unor întrebări dintr-un chestionar, printre care: dacă

au văzut reclama la un produs nou lansat pe piaţă şi dacă au cumpărat produsul respect iv.

Tabelul nr. 11

Count

65 15 80

20 50 70

85 65 150

da

nu

RECLAMA

Total

da nu

CUM PA RA

Total

RECLAMA * CUMPARA Crosstabulation

Putem obţine profilele linii, adică pentru fiecare modalitate a variabilei reclama,

ponderea celor care cumpără în totalul liniei:


Tabelul nr. 12

65 15 80

81,3% 18,8% 100,0%

20 50 70

28,6% 71,4% 100,0%

85 65 150

56,7% 43,3% 100,0%

Count

% within

RECLAMA

Count

% within

RECLAMA

Count

% within

RECLAMA

da

nu

RECLAMA

Total

da nu

CUMPARA

Total


Putem obţine profilele coloane, adică pentru fiecare modalitate a variabilei cumpără,

ponderea celor care au văzut reclama în totalul coloanei:

Tabelul nr. 13

65 15 80

76,5% 23,1% 53,3%

20 50 70

23,5% 76,9% 46,7%

85 65 150

100,0% 100,0% 100,0%

Count

% within

CUMPA RA

Count

% within

CUMPA RA

Count

% within

CUMPA RA

da

nu

RECLAMA

Total

da nu

CUMPA RA

Total


4. Prezentarea datelor statistice

Rezultatele prelucrării datelor observării de masă se prezintă sub forme

specifice statisticii: tabele, serii, grafice - în care relaţiile dintre fenomenele studiate apar într-

o succesiune logică, corespunzătoare relaţiilor obiective existente. Această sistematizare a

informaţiilor obţinute face posibilă interpretarea statistică a formelor de manifestare a

fenomenenlor şi permite alegerea corectă a metodologiei de calcul al indicatorilor statistici. În

tabele, serii şi grafice se pot întâlni fie indicatori statistici absoluţi, fie indicatori statistici

derivaţi. Cu ajutorul lor se pot caracteriza atât grupele care compun colectivitatea cât şi

întregul ansamblu.

Capitolul 2 35

4.1 Tabele statistice

Tabelele statistice reprezintă o formă de sistematizare a unui ansamblu

de relaţii cantitative despre fenomenele studiate, folosind o reţea de linii paralele,

orizontale şi verticale în care se înscriu indicatorii obţinuţi prin prelucrare.

Ele se pot folosi în dublu scop:

pentru prezentarea rezultatelor cercetării în cadrul indicatorilor absoluţi şi derivaţi,

care s-au obţinut în diferitele faze ale prelucrării datelor statistice;

pentru sistematizarea datelor statistice în vederea aplicării procedeelor de calcul a

indicatorilor derivaţi.

Oricare ar fi destinaţia tabelelor statistice, ele trebuie să fie întocmite după anumite

principii, respectând unele reguli de conţinut şi de formă.

Elementele de conţinut ale unui tabel statistic se referă la subiectul şi predicatul

tabelului. Subiectul tabelului îl constituie colectivitatea statistică la care se referă datele

prezentate. Predicatul tabelului este format din sistemul de caracteristici pentru care s-a făcut

centralizarea datelor şi care permite caracterizarea statistică a fenomenelor studiate în condiţii

specifice de timp şi spaţiu.

Elementele ce ţin de forma unui tabel statistic se regăsesc, în principal, în macheta

tabelului. Macheta tabelului statistic este formată din titlul general, titlurile interioare şi

reţeaua de rânduri şi coloane.

Reţeaua tabelului este formată din linii paralele, orizontale şi verticale, necesare

înscrierii ordonate a datelor statistice. Intervalul dintre două linii orizontale formează un rând,

iar cele cuprinse între două linii verticale formează o coloană. Întretăierea dintre rânduri şi

coloane formează rubricile tabelului în care se înscriu valorile numerice ale indicatorilor

statistici.

Titlul general se trece în partea de sus a tabelului şi trebuie să fie clar, complet şi

concis, atrăgând atenţia asupra relaţiilor ce trebuie să fie analizate în legătură cu subiectul

prezentat. În titlul general trebuie să se precizeze caracteristicile de timp şi spaţiu la care se

referă datele prezentate.

Titlurile interioare se înscriu în capetele coloanelor sau ale rândurilor şi se referă la

elementele componente ale subiectului (de regulă, în capetele rândurilor) şi ale predicatului

(de regulă, în capetele coloanelor).

Notele explicative însoţesc un tabel statistic atunci când este necesar să se precizeze

anumite aspecte legate de sursa de informaţii sau de procedeele de culegere şi prelucrare a

datelor prezentate.

Tabelele statistice des întâlnite sunt: tabele simple, tabele pe grupe; tabele combinate;

tabele cu dublă intrare; tabele de asociaţie.

Tabelele simple sunt cele în care se prezintă indicatorii statistici ai unităţilor statistice

la care se referă datele, ordonaţi după următoarele criterii: cronologic, teritorial şi

organizatoric. Întocmirea unor astfel de tabele nu ridică probleme deosebite în legătură cu

modul de prezentare a indicatorilor, ordonarea făcându-se în funcţie de scop.

Probleme legate de modul de întocmire a unui tabel statistic se pun atunci când

colectivitatea este împărţită în grupe după variaţia uneia sau a mai multor caracteristici sau

când şi predicatul se centralizează pe grupe. Atunci este necesar să se întocmească un tabel în

care să se poată urmări cu uşurinţă succesiunea logică a informaţiilor prezentate, condiţionată

de variaţia caracteristicii de grupare.


Tabelul cu dublă intrare se foloseşte atunci când colectivitatea a fost împărţită în

grupe după variaţia a două caracteristici (X,Y) şi au fost centralizate numai frecvenţele de

apariţie ale valorilor X,Y.

Pe baza tabelului cu dublă intrare se pot caracteriza:

forma de variaţie a variabilei X luată independent, folosind distribuţia sa

marginală (vezi capetele rândurilor şi ultima coloană);

forma de variaţie a variabilei Y luată independent, folosind distribuţia sa

marginală (vezi capetele coloanelor şi ultimul rând); distribuţiile condiţionate

ale caracteristicii X în funcţie de Y şi ale caracteristicii Y în funcţie de X.

Din exemplele de mai sus se observă că tabelele 4 şi 5 sunt tabele simple iar tabelul 7

este cu dublă intrare.

4.2 Seriile statistice

Seriile statistice se obţin în urma aplicării metodei grupării folosind una sau mai multe

caracteristici de grupare. De cele mai multe ori seriile statistice trebuie să fie extrase din

tabelele de prezentare a rezultatelor prelucrării datelor statistice.

Seria statistică este o corespondenţă între două şiruri de date statistice

în care primul şir reprezintă variaţia caracteristicii de grupare, iar cel de-al doilea şir

rezultatul centralizării frecvenţelor de apariţie sau a valorilor unei alte caracteristici cu

care se corelează.

Seria statistică poate fi considerată, astfel, ca o funcţie matematică în care valorile

centralizate ale frecvenţelor sau ale caracteristicilor sunt valori dependente (Y) în funcţie de

valorile caracteristicii de grupare (X).

După posibilitatea de caracterizare a fenomenelor, seriile statistice pot fi serii statistice

independente şi serii statistice condiţionate.

Seriile statistice independente sunt acelea care rezultă dintr-o grupare simplă, iar

seriile statistice condiţionate sunt acelea obţinute dintr-o grupare combinată.

Seriile statistice independente se mai numesc şi serii unidimensionale, iar cele

condiţionate - multidimensionale.

După conţinutul caracteristicii de grupare, seriile statistice pot fi:

serii statistice de timp (dinamice sau cronologice);

serii statistice de spaţiu (teritoriale);

serii statistice de distribuţie (de repartiţie).

Seriile statistice cronologice sunt acelea în care se prezintă variaţia unei caracteristici

în funcţie de timp.

Relaţia matematică în acest caz este: yi = f(ti), în care:

yi - reprezintă valorile caracteristicii a cărei variaţie se studiază;

ti - valorile variabilei de timp.

După timpul la care se referă datele prezentate, pot fi: serii cronologice de fluxuri sau

de interval şi serii cronologice de stocuri sau de momente.

Seriile cronologice de fluxuri (intervale) sunt acelea în care valorile caracteristicii

studiate sunt rezultatele diferitelor activităţi depuse în cadrul unui proces social economic pe

luni, trimestre etc., ca de exemplu producţia în unităţi naturale sau valorice, cheltuielile de

producţie, numărul născuţilor etc. Cumulând datele din fiecare unitate de timp se poate obţine

valoarea centralizată a caracteristicii respective pe întreaga perioadă.

Capitolul 2 37

Seriile statistice de stocuri sau de momente se obţin pentru variabile statistice pentru

care este raţional ca însumarea să se facă la anumite momente, ca de exemplu: numărul de

muncitori, valoarea fondurilor fixe, numărul de tractoare, valoarea mijloacelor circulante,

stocurile de mărfuri etc. Caracteristic pentru seria dinamică de momente este faptul că

termenii ei nu se pot cumula deoarece pot exista înregistrări repetate şi valoarea obţinută n-ar

avea sens economic. Caracterizarea statistică pentru întreaga perioadă nu se poate face în

acest caz printr-un indicator totalizator, ci folosind indicatori derivaţi sub formă de mărimi

relative sau medii.

Este necesar ca pentru fiecare serie dinamică să rezulte clar (din titlul ei) dacă datele

prezentate se referă la momente sau la perioade de timp, pentru a putea stabili relaţii corecte

între ele.

De exemplu: exportul şi importul României a avut următoarea evoluţie în perioada

1997-2003 (serii de flux).

Tabelul nr. 14

Ani Export FOB

mil.Euro

Import FOB

mil.Euro

1997 7469 9222

1998 7400 9718

1999 7977 9163

2000 11273 13140

2001 12722 16045

2002 14675 17427

2003 15614 19569

Sursa datelor: Anuarul Statistic al României 2004

Seriile statistice teritoriale sunt cele în care centralizarea frecvenţelor sau a valorilor

individuale ale caracteristicii studiate se face în funcţie de variaţia teritorial administrativă.

De regulă, seriile teritoriale sunt folosite pentru sistematizarea informaţiilor statistice

pe judeţele ţării, pe ţări sau alte forme teritorial administrative. Pe baza seriilor teritoriale se

poate face o ierarhizare a unităţilor teritoriale.

Pornind de la funcţiile de cunoştere care trebuie realizate folosind datele statistice,

seriile teritoriale, de regulă, se întocmesc pentru mai multe şiruri de date, privitor la variaţia

caracteristicilor statistice ce se găsesc într-un raport obiectiv de interdependenţă. Aceste şiruri

apar ca serii statistice interdependente, condiţionate pe teritoriul la care se referă datele.

Tabelul nr. 15

Ţara Export FOB

mil. dolari SUA

România 17618

Polonia 53699

Bulgaria 7534

Slovacia 21960

Slovenia 12767

Ungaria 42532

Sursa datelor: Anuarul Statistic al României 2004


Seriile statistice de distribuţie sunt acelea în care se foloseşte pentru gruparea datelor

o caracteristică atributivă (calitativă sau numerică) iar centralizarea se face pentru frecvenţele

la care se înregistrează aceeaşi variantă, sau pentru o altă caracteristică statistică.

Seria de distribuţie formată după variaţia unei caracteristici numerice se mai numeşte

şi serie de variaţie, iar, de regulă, al doilea şir este format din frecvenţele corespunzătoare

grupelor. În acest caz, pot apărea serii de distribuţii de frecvenţe direct pe variante sau pe

intervale de valori.

În cazul unei amplitudini mari a variaţiei se folosesc serii statistice pe intervale de

grupare (egale sau neegale).

Tabelul nr. 16

Distribuţia societăţilor după CA

Grupe de unităţi după

cifra de afaceri

-mii RON-

ix

Nr.

unităţi

if

50-80 5

80-110 4

110-140 6

140-170 2

peste 170 3

TOTAL 20

4.3 Reprezentări grafice

Metoda grafică este folosită în teoria şi practica statistică atât pentru prezentarea unor

date statistice cât şi ca instrument de analiză şi interpretare a fenomenelor studiate. În acest

sens analiza şi generalizarea rezultatelor presupune de cele mai multe ori utilizarea

reprezentărilor grafice.

Într-o accepţiune generală graficele constau în exprimarea datelor

statistice din tabele prin linii sau puncte, figuri geometrice, hărţi, simboluri şi alte

mijloace specifice.

Elementele unui grafic

Întocmirea corectă a unui grafic statistic presupune cunoaşterea şi folosirea

corespunzătoare a următoarelor elemente: titlul graficului; scara de reprezentare; notele

explicative inclusiv legenda; sursa informaţiilor utilizate.

În titlul graficului se sugerează ce relaţii trebuie să fie interpretate vizual pe baza

graficului respectiv. Titlul graficului este indicat să fie scurt, clar, precis şi complet şi, pe cât

posibil să corespundă cu titlul tabelului statistic ale cărui date le reprezintă.

Scara de reprezentare se alege ţinând seama de ordinul de mărime al indicatorilor de

reprezentat, de gradul şi forma de variaţie dintre ei şi de scopul urmărit. Scara de reprezentare

este o linie ale cărei puncte pot fi citite ca numere bine determinate. Ea se compune dintr-o

linie care se numeşte suportul scării şi dintr-un şir de puncte nenumerotate cu ajutorul cărora

Capitolul 2 39

se realizează diviziunea liniei. Liniuţele scării sunt numerele care corespund punctelor

extreme ale scării. Lungimea scării este întreaga distanţă dintre punctele extreme ale scării.

Alegerea unităţii de lungime a scării se face în funcţie de spaţiul destinat figurii

graficului şi în aşa fel, încât să se surprindă forma reală de variaţie a indicatorilor de

reprezentat. Dacă se prezintă corelat mai multe caracteristici statistice, atunci scările de

reprezentare trebuie să fie astfel stabilite, încât să poată cuprinde toate valorile indicatorilor şi

să redea într-o formă armonioasă proporţia reală dintre ele.

Pe suportul scării se trec numai valorile care marchează distanţele proporţionale cu

unitatea de măsură a scării de reprezentare.

Distanţa dintre două puncte învecinate de pe suportul scării poartă numele de interval

grafic iar diferenţa dintre valorile numerice ale acestor puncte reprezintă intervalul numeric.

Notele explicative şi legendele se folosesc pentru a putea interpreta corect graficul.

Notele explicative apar atunci când este necesar să se atragă atenţia asupra aspectelor

metodologice ale calculării indicatorilor reprezentaţi, sau asupra modului de prezentare a lor

în grafic.

Legendele reprezintă explicarea concisă a semnelor convenţionale, haşurilor şi

culorilor folosite.

Sursa de informaţie a datelor din grafic este obligatorie în toate cazurile, când se

folosesc date reale. Ea este trecută în afara graficului şi trebuie să cuprindă toate elementele

de identificare a izvorului informaţiei respective. Când graficele sunt încadrate într-un raport

de analiză sau într-o lucrare de cercetare ştiinţifică, la fel ca şi titlurile, sursele de informaţie

pot să nu apară în mod expres dacă din textul respectiv rezultă aceste elemente.

Tipuri de grafice

Diagrama prin coloane - distribuţia angajaţilor unei firme după numărul de copii este

prezentată în tabelul următor (caracteristică cu variante):

Tabelul nr. 17

Grupe de angajaţi după

nr.de copii Număr angajaţi

0 5

1 17

2 31

3 20

4 11

5 4

6 1

total 89


0 1 2 3 4 5 60

5

10

15

20

25

30

35

nr.

an

gaj

aţi

nr. copii

Figura 1. Distribuţia angajaţilor după numărul de copii

Pentru datele din tabelul 14 (serie de timp), graficul se prezintă astfel:

02000400060008000

100001200014000160001800020000

1997 1998 1999 2000 2001 2002 2003

Export FOB mil.Euro Import FOB mil.Euro

Figura 2. Evoluţia exportului şi importului României în perioada 1997-2003

Diagrama circulară, permite vizualizarea ponderii unei componente într-un total.

Pentru datele din tabelul 15 se poate vizualiza ponderea în % a exportului fiecărei ţări în

nivelul total al exportului.

11%

35%

5%14%

8%

27% RomâniaPoloniaBulgariaSlovaciaSloveniaUngaria

Figura 3. Structura exportului pe ţări în anul 2003

Capitolul 2 41

Diagramele prin benzi sunt foarte des folosite datorită expresivităţii lor şi uşurinţei în

executare. Se utilizează pentru seriile teritoriale. Pentru datele din tabelul 15 putem realiza un

top al ţărilor după valorile exportului realizat în anul 2003.

7534

12767

17618

21960

42532

53699

0 10000 20000 30000 40000 50000 60000

Bulgaria

Slovenia

România

Slovacia

Ungaria

Polonia

Export FOB mil. dolari SUA

Figura 4. Topul ţărilor după valorile exportului realizat în anul 2003

Reprezentarea grafică a unei variabile continue - studiul privind vârsta angajaţilor

unei firme a condus la următoarele rezultate:

Tabelul nr. 18

Grupe de

angajaţi după

vârstă

(ani)

Frecvenţe

absolute

Frecvenţe

cumulate

crescător

Frecvenţe

cumulate

descrescător

20 – 30 10 10 73

30 – 40 14 24 63

40 – 50 25 49 49

50 – 60 16 65 24

60 – 70 8 73 8

Total 73 - -

*limita inferioară cuprinsă în interval


10

14

25

16

8

0

5

10

15

20

25

30

20 – 30 30 – 40 40 – 50 50 – 60 60 – 70

Vârsta (ani)

Nu

măr

an

gaja

ţi

Figura 5. Distribuţia angajaţilor după vârstă (HISTOGRAMA)

Curba frecvenţelor cumulate - ogivă

0

10

24

49

657373

63

49

24

800

1020304050607080

20 30 40 50 60 70

Vârsta (ani)

Nu

măr

an

gaja

ţi

Frecvenţe cumulate crescător

Frecvenţe cumulate descrescător

Figura 6. Curba frecvenţelor cumulate

Diagramele radiale (polare). O altă problemă care trebuie analizată la seriile

cronologice este şi aceea a sezonalităţii. În statistica social economică se întâlnesc frecvent

fenomene care prezintă variaţii sezoniere săptămânale, trimestriale etc., ca de exemplu:

consumul casnic de gaze naturale, consumul de bere şi băuturi răcoritoare. Fenomenele cu

caracter sezonier sunt specifice îndeosebi activităţilor din turism, comerţ şi agricultură.

Capitolul 2 43

Tabelul nr. 19 (date convenţionale)

Trimestrul I II III IV Media

trimestrială

Producţia de lapte (hl.) 343 487 406 364 400

Trim. II Trim. I

Trim. III Trim. IV

Figura 7. Producţia de lapte pe trimestre

mii $ SUA

10.4

10.510.510.4

10.5

10.3

10.2

10.110.2

10.3

10.3

10.4

9.1

99.39.3

9.3

9.5

8.9 8.7

9

8.9

9.6

9.4

0

5

10

15ian

febr

mar

apr

mai

iun

iul

aug

sept

oct

noi

dec

Cifra de afaceri planificata Cifra de afaceri realizata

Figura 8. Cifra de afaceri planificată şi realizată pe luni

Rezumat

Acest capitol prezintă noţiunile de bază legate de : sistematizarea datelor sub formă de

grupe omogene după una sau mai multe caracteristici necesară calculului indicatorilor

statistici, prezentarea datelor sub formă de tabele, serii, grafice.


Termeni importanţi: grupare unidimensională, grupare bidimensională, tabel simplu,

tabel cu dublă intrare, serie de timp, serie de spaţiu, serie de distribuţie, diagrama în coloane,

diagrama circulară, diagrama în bare, diagrama polară.


1. Care este rolul sistematizării datelor ?

2. Cum se realizează gruparea unităţilor statistice după o caracteristică cu un

număr mare de variante ?

3. Care este rolul grupărilor bidimensionale ?

4. Definiţi seria statistică.

5. Ce tipuri de serii cunoaşteţi ?

6. Tipuri de grafice.

Capitolul 3 45

Capitolul 3

Tema Serii de distribuţie unidimensionale

Obiectivele 1. Indicatorii statistici – definiţii, tipuri

2. Indicatori statistici calculaţi sub formă de mărimi relative

3. Indicatorii tendinţei centrale

3.1 Mărimi medii

3.1.1 Media aritmetică

3.1.2 Media armonică

3.1.3 Media pătratică

3.1.4 Media geometrică

3.2 Mediana

3.3 Moda (modulul, dominanta)

3.4 Cuartilele

4. Indicatorii variaţiei

4.1 Indicatorii simpli ai variaţiei

4.2 Indicatorii sintetici ai variaţiei

5. Media şi dispersia caracteristicii alternative

6. Asimetria

Mijloace





lupă)


Finalitatea 1. analiza pe baza mărimilor relative

2. analiza pe baza mărimilor medii

3. analiza pe baza indicatorilor variaţiei


Timp de lucru

necesar



Serii de distribuţie unidimensionale 46

Serii de distribuţie unidimensionale

1. Indicatorii statistici – definiţii, tipuri

Principala particularitate a statisticii este aceea că ea studiază fenomenele sub

aspectul cantitativ - numeric, în strânsă interdependenţă cu determinarea lor calitativă, în

condiţii date de timp, loc şi structură organizatorică. Rezultatele cercetării statistice se

concretizează într-un număr mare de expresii numerice interdependente cunoscute sub

denumirea generică de indicatori statistici.

În sensul cel mai larg, orice expresie numerică obţinută într-un proces

concret de cercetare se numeşte indicator statistic.

După etapa în care apar în procesul de cunoaştere statistică, indicatorii pot fi: primari

şi derivaţi.

Indicatorii primari se obţin în cadrul prelucrării primare a datelor statistice ca urmare

a procesului de centralizare a datelor unei observări statistice. Ei au conţinut concret şi formă

concretă de exprimare. De exemplu, volumul producţiei la nivelul unei întreprinderi se

exprimă fie în unităţi naturale, natural-convenţionale, de timp de muncă sau valorice şi

dimensioneasză din acest punct de vedere întreprinderea pe o anumită perioadă de timp. Din

această cauză indicatorii primari se mai numesc şi indicatori absoluţi şi constituie baza

informaţională a cunoaşterii statistice.

Indicatorii derivaţi se obţin în faza de prelucrare statistică a mărimilor absolute prin

aplicarea variatelor metode şi procedee de calcul statistic (comparaţii, abstractizări,

generalizări).

Indicatorii derivaţi au menirea de a pune în lumină şi de a face posibilă analiza

aspectelor calitative ale fenomenelor şi proceselor cercetate. În acest scop, ei exprimă: relaţii

cantitative dintre diferitele caracteristici statistice, dintre diferitele părţi ale unei colectivităţi

sau dintre fenomenele ce se găsesc într-un anumit grad de interdependenţă; valorile tipice care

se formează în mod obiectiv în cadrul aceleiaşi perioade de timp sau în dinamică; gradul şi

forma de variaţie a caracteristicilor cercetate; legăturile de interdependenţă dintre fenomene;

tendinţa obiectivă de manifestare a fenomenelor; rolul şi contribuţia diferiţilor factori la

formarea şi modificarea mărimii unui fenomen complex etc.

2. Indicatori statistici calculaţi sub formă de mărimi relative

Indicatorii relativi se obţin prin aplicarea unui model de comparaţie sub formă

de raport. În statistica social economică, prin mărime relativă înţelegem rezultatul raportării a

doi indicatori statistici absoluţi. Indicatorul din numărătorul raportului se numeşte indicator

raportat, iar cel din numitor, indicator bază de raportare.

Capitolul 3 47

Alegerea formei de exprimare se face astfel încât mărimile relative să fie sugestive.

Putem folosi în acest scop: coeficienţi, procente, promile, prodecimile, procentimile. Folosirea

coeficienţilor se face atunci când ordinul de mărime al celor doi indicatori este apropiat şi

numărătorul este mai mare decât numitorul. De exemplu, avem o unitate comercială cu două

puncte de desfacere, A şi B. Prin punctul A s-a defăcut în luna iunie, 300 mii RON, iar prin

punctul B, 600 mii RON. Comparaţia se poate face luând pe rând ca bază fiecare din cele

două puncte de desfacere şi obţinem doi coeficienţi.

şi 2300

600

5,0600

300

/

/

xx

K

xx

K

A

B

AB

B

A

BA

Evident că în acest caz cel de al doilea raport este mai sugestiv decât primul, adică în

punctul B s-a vândut de două ori mai mult decât în punctul A. Dacă vrem să facem mai

sugestiv primul raport îl exprimăm procentual: %50100

1005,0

.

În cazul în care indicatorul din numărătorul raportului este cu mult mai mic decât cel

din numitorul acestuia, mărimea relativă corespunzătoare se exprimă în promile, adică

rezultatul raportului se înmulţeşte cu 103. În acest fel se exprimă indicatorii cu care se

caracterizează mişcarea naturală a populaţiei. De pildă,

natalitateanumarul nascutilor vii

numarul mediu al populatieix o 1000 %

mortalitateanumarul decedatilor

numarul mediu al populatieix o 1000 %

Dacă numărătorul este şi mai mic comparativ cu numitorul, mărimea relativă se poate

exprima în prodecimile. De exemplu, numărul studenţilor la 10.000 locuitori, numărul de

medici sau paturi de asistenţă medicală la 10.000 locuitori etc. Această exprimare se poate

evita dacă are sens să inversăm raportul. De exemplu, putem spune, fie numărul de medici ce

revine la 10.000 locuitori, fie numărul de locuitori care revine la un medic. Sensul

interpretării va fi şi el inversat. Se apreciază că populaţia unei ţări are un standard de viaţă mai

ridicat dacă are mai mulţi medici la 10000 de locuitori, respectiv dacă are mai puţini locuitori

la un medic.

Mai rar se întâlnesc exprimări în procentimile, câte unităţi din indicatorul raportat

revin la 100.000 unităţi din baza de raportare. Acest mod de exprimare este specific pentru:

reţeaua şcolară, reţeaua de circulaţie a mărfurilor, reţeaua sanitară din mediul rural.

În funcţie de scopul analizei şi de informaţiile de care dispunem, în statistica social

economică se calculează următoarele tipuri de mărimi relative:

mărimi relative de structură;

mărimi relative de coordonare sau corespondenţă;

mărimi relative ale dinamicii;

mărimi relative ale intensităţii.

Mărimile relative de structură se pot calcula de fiecare dată când s-a aplicat metoda

grupării prin urmare calculul lor este posibil atunci când colectivitatea este separată pe două

sau mai multe grupe. De exemplu, presupunem, că o colectivitate este împărţită în k grupe. În

acest caz se pot calcula mărimi relative de structură, cu sensul de greutăţi specifice sau


ponderi, raportând indicatorii absoluţi calculaţi pe grupe la acelaşi indicator calculat pe total

colectivitate.

Notând nivelul absolut al grupelor cu x1, x2 .... xk şi cu i

i

k

x

1

nivelul absolut

(totalizat) al variabilei pe total colectivitate se pot obţine următoarele mărimi relative cu

sensul de ponderi sau greutăţi specifice:

1

1

1

2

2

1 1

* * *

; ...gx

xg

x

xg

x

xii

k

ii

k k

K

ii

k

ii

k

g*

,

1

1 00 pentru mărimi relative exprimate prin coeficient

respectiv:

ii

k

g(%)

*

1

100% când mărimile relative se exprimă procentual.

În mod analog putem calcula mărimi relative de structură pornind de la frecvenţele

absolute. În acest caz mărimile relative din structură calculate au sensul de frecvenţe relative.

Frecvenţele relative se notează cu fi

* şi se calculează ca un raport între numărul

absolut pe fiecare grupă şi numărul total pe întreaga colectivitate.

k

ii

i

i

f

ff

1

*

Această proprietate se foloseşte frecvent în statistica social economică deoarece

frecvenţele absolute referindu-se la fenomene concrete sunt exprimate în unităţi concrete de

măsură, deci necomparabile pentru două sau mai multe variabile interdependente. Eliberându-

se de aspectul concret ele pot fi comparate cu probabilitatea de apariţie a dieferitelor

evenimente şi seria empirică poate fi analizată pe baza proprietăţilor repartiţiilor teoretice.

Mărimile relative de structură se reprezintă grafic printr-o diagramă de structură care

poate fi:

dreptunghiul de structură;

pătratul de structură;

cercul sau semicercul de structură.

Mărimile relative de coordonare sau de corespondenţă se folosesc pentru a

compara două grupe ale aceleiaşi colectivităţi sau două colectivităţi situate în spaţii diferite

dar coexistente în timp. Prin urmare, ori de câte ori este posibil calculul mărimilor relative de

structură devine posibil şi calculul mărimilor relative de coordonare. Şi calculul mărimilor

relative de coordonare presupune împărţirea colectivităţii în două sau mai multe grupe.

Presupunând că o colectivitate este împărţită în două grupe şi nivelul pe grupe al

variabilei studiate îl notăm cu xA şi xB se pot calcula mărimi relative de coordonare de tipul:

A B

A

B

B A

B

A

Kxx

si Kxx

/ /

Mărimile relative de coordonare se folosesc în studiul variaţiei teritoriale şi prin

urmare au caracter de indici teritoriali.

Aceşti indici teritoriali stau la baza comparaţiilor pe plan naţional (între judeţele ţării)

şi pe plan internaţional (între ţări) zone geografice, (continente).

Mărimile relative de coordonare se reprezintă grafic prin benzi şi coloane stabilind în

acest fel relaţiile care există între diferitele părţi ale aceleiaşi colectivităţi.

Capitolul 3 49

Când mărimile relative de coordonare se folosesc în studiul variaţiei teritoriale (pe

judeţe) se reprezintă grafic prin cartograme şi cartodiagrame.

Mărimile relative ale dinamicii se folosesc în scopul caracterizării statistice a

evoluţiei în timp a fenomenului analizat. Mărimile relative ale dinamicii se calculează atunci

când avem două valori ale aceluiaşi indicator înregistrat în unităţi diferite de timp. În funcţie

de baza de comparaţie aleasă putem calcula:

a) mărimi relative ale dinamicii cu bază fixă folosind relaţia:

i

i k

kxx

xx

xx

xx/

. . ; . .... .0

0

1

0

2

0 0

100 100 100 100

b) mărimi relative ale dinamicii cu bază mobilă (variabilă sau în lanţ) pe baza relaţiei:

i i

i

i

k

k

kxx

xx

xx

xx/

. . ; . .... .

1

1

1

0

2

1 1

100 100 100 100

În primul caz putem stabili, pe baza mărimilor relative ale dinamicii calculate,

cuantumul modificărilor faţă de o bază de referinţă semnificativă, iar în cel de-al doilea caz

ritmicitatea cu care se modifică fenomenul studiat.

În activitatea economico-socială mărimea relativă de dinamică se numeşte indice.

Mărimile relative ale dinamicii se exprimă sub formă de coeficient şi cel mai adesea

procentual.

Mărimile relative ale dinamicii se reprezintă grafic prin cronograme (historiograme).

Mărimile relative de intensitate se calculează ca raport între doi indicatori absoluţi

de natură diferită între care există o relaţie de interdependenţă. Un exemplu de mărime

relativă de intensitate poate fi nivelul productivităţii muncii (W), calculat ca raport între

nivelul producţiei (q) şi timpul de muncă consumat pentru producerea acesteia W qT

.

În general o mărime relativă de intensitate poate fi calculată după relaţia:

i

i

i

xy

z

Cele două caracteristici introduse în raport yi şi zi sunt caracteristici primare,

înregistrate direct prin observarea statistică, iar raportul x i, calculat pe fiecare unitate de

observare, este o caracteristică secundară (derivată). Semnificaţia acestei caracteristici constă

în aceea că exprimă câte unităţi din valoarea caracteristicii yi revin la o unitate a valorii

caracteristicii zi.

Probleme rezolvate

De la trei magazine ale unei societăţi s-au cules date referitoare la salariul mediu pe

magazin şi numărul angajaţilor, prezentate în tabelul de mai jos:

Tabelul nr.1

Magazine Salar mediu

(RON/angajat)

Număr angajaţi

Fondul de salarii

(RON)

aug. 2004 aug. 2005 aug. 2004 aug. 2005 aug. 2004 aug. 2005

M1 530 570 25 25 13250 14250

M2 620 620 31 33 19220 20460


M3 580 560 24 20 13920 11200

TOTAL 80 78 46390 45910

Se cere să se calculeze şi să se interpreteze toate mărimile relative permise de date.

Rezolvare

mărimi de structură

pentru caracteristica salar mediu nu se pot calcula deoarece salariile medii nu

se pot aduna pe cele trei magazine;

pentru numărul angajaţilor rezultatele sunt:

Tabelul nr.2

În august 2004 numărul angajaţilor de la magazinul M1 a reprezentat 31.25% din

totalul angajaţilor pe societate. La fel se interpretează rezultatele şi pentru celelalte valori.

31.25%

38.75%

30.00%

M1 M2 M3

Figura 1. Structura angajaţilor în luna august 2004

pentru caracteristica Fond de salarii obţinută prin salar mediu înmulţit cu

numărul angajaţilor, rezulatele se prezintă astfel:

28.56%

41.43%30.01%

M1 M2 M3 Figura 2. Structura fondului de salarii în luna august 2004

Aug. 2004 Aug. 2005

25/80*100 = 31,25% 25/78*100 = 32,05%

31/80*100 = 38,75% 33/78*100 = 42,31%

24/80*100 = 30,00% 20/78*100 = 25,64%

Capitolul 3 51

mărimi de coordonare pentru caracteristica salar mediu se pot face comparaţii între salariile medii ale

celor trei magazine:

169,1530

62085,0

620

5301/22/1 MMMM KsauK

Salariul mediu a fost în august 2004 de 1,169 ori mai mare la magazinul M2

decât la magazinul M1.

numărul angajaţilor în august 2004 a fost de 1,24 ori mai mare (31/25 = 1,24)

la magazinul M2 faţă de M1

fondul de salarii a fost de 1,45 ori mai mare (19220/13250 = 1,45) la

magazinul M2 faţă de M1

mărimi de dinamică

pentru caracteristica salar mediu 1002004

2005

2004/2005 salar

salarI

Tabelul nr.3

% 100%

2004/2005 I

M1 570/530*100 = 107,55 7,55%

M2 620/620*100 = 100,00 0%

M3 560/580*100 = 96,55 -3,45%

La magazinul M1 salariul mediu a crescut în 2005 faţă de 2004 la 107,55% sau a

crescut cu 7,55%;

La magazinul M2 salariul mediu a rămas constant în 2005 faţă de 2004;

La magazinul M3 salariul mediu a scăzut în 2005 faţă de 2004 la 96,55% sau a scăzut

cu 3,45%;

pentru caracteristica Număr angajaţi 100.

.

2004

2005

2004/2005 angajatiNr

angajatiNrI

Tabelul nr.4

% 100%

2004/2005 I

M1 100 0% M2 106,45 6,45% M3 83,33 -16,67

pentru caracteristica Fond de salarii 1002004

2005

2004/2005 Fond

FondI

Tabelul nr.5

% 100%

2004/2005 I

M1 107,55 7,55%

M2 106,45 6,45%

M3 80,46 -19,54


mărimi de intensitate

Se poate calcula salariul mediu pe societate angajatidetotalNr

salariidetotalFondulS

.

pentru anul 2004 salariul mediu pe societate a fost

46390/80 = 579,875 RON/angajat

pentru anul 2005 salariul mediu pe societate a fost

45910/78 = 588,59 RON/angajat

3. Indicatorii tendinţei centrale

Analiza statistică a trăsăturilor esenţiale ale fenomenelor de masă, stabilirea

tendinţelor ce apar în producerea lor necesită calcularea anumitor valori tipice, care să fie

reprezentative pentru întreaga colectivitate studiată.

În funcţie de gradul de variabilitate a valorilor individuale, de sursele de date de care

dispunem şi de nevoile de cunoaştere, în teoria şi practica statistică se utilizează ca principali

indicatori ai tendinţei centrale; mărimile medii; mediana şi modul sau dominanta seriei.

3.1 Mărimi medii

3.1.1 Media aritmetică

Media aritmetică este rezultatul sintetizării într-o singură expresie

numerică a tuturor nivelurilor individuale observate, obţinută prin raportarea valorii

totalizate a caracteristicii la numărul total al unităţilor.

În sens statistic, media aritmetică calculată pentru o colectivitate statistică este

valoarea care s-ar fi înregistrat dacă toţi factorii ar fi influenţat în mod constant în toate

cazurile înregistrate.

Media aritmetică simplă se calculează ca raport între suma nivelurilor individuale

sub care s-a înregistrat caracteristica şi numărul cazurilor individuale luate în observare.

Media se mai poate calcula raportând valoarea totalizată a caracteristicii la numărul total al

unităţilor la care s-a făcut centralizarea. Se foloseşte relaţia:

x

x

na

i

i

n

1 unde:

xi - reprezintă nivelurile individuale ale variabilei;

xi

i

n

1

- reprezintă nivelul centralizat al variabilei;

n - reprezintă numărul unităţilor observate.

Într-o colectivitate statistică se întâlnesc foarte rar cazuri în care numărul variantelor

coincide cu numărul unităţilor. De regulă, fenomenele de masă sunt numeroase şi aceeaşi

valoare individuală poate fi înlocuită de mai multe ori. În acest caz, pentru a putea cuprinde în

Capitolul 3 53

calcul toate valorile individuale trebuie să se ţină seama şi de frecvenţa lor de apariţie iar

media se va calcula ca o medie ponderată utilizând formula:

x

x f

f

i i

i

k

i

i

k

1

1

De reţinut: dacă repartiţia de frecvenţe se prezintă pe intervale de variaţie, xi

reprezintă centrul de interval corespunzător.

Media aritmetică are anumite proprietăţi care au utilitate practică pentru calculul şi

interpretarea valorii ei.

Enunţăm principalele proprietăţi:

a) într-un şir de valori egale, media acestora este egală cu fiecare dintre ele.

x1 = x2 =...= xi =...= xn = xc

x

x

n

nx

nx

c

i

n

cc

1

b) mărimea mediei aritmetice este întotdeauna o valoare cuprinsă în intervalul de

variaţie al variabilei:

x x xmin max

În cazul seriilor de repartiţie pe intervale de variaţie

x x xl L unde:

xl - limita inferioară a primului interval

xL - limita superioară a ultimului interval.

Dacă media se plasează în afara acestor limite, rezultatul este în mod sigur eronat.

c) în cazul unei serii de distribuţie cu frecvenţe, media se încadrează între valorile

extreme ale variabilei oscilând în jurul termenului cu frecvenţa cea mai mare.

d) suma abaterilor nivelurilor individuale ale variabilei aleatoare de la media lor este

egală cu zero:

( )x x x nx x n

x

ni

i

n

i

i

n

i

i

i

n

i

n

1 1

1

1

0 (pentru o serie simplă)

( )x x f x f x f x f f

x f

f

i i

i

k

i i i

i

k

i

k

i i i

i

k i

i

n

i

i

i

ki

k

1 11 1

1

1

1

0 (pentru seria de

frecvenţe).

Proprietăţile de la punctele a-d permit verificarea exactităţii calculelor.

Calculul mediei pentru o repartiţie pe variante.

Repartiţia studenţilor după nota obţinută la examenul de contabilitate a fost:

Tabelul nr.6

Nota xi

Numărul studenţilor fi xifi

5 5 25


6 15 90

7 25 175

8 15 120

9 5 45

TOTAL 65 455

Fiind o serie de repartiţie de frecvenţe trebuie să folosim formula mediei aritmetice

ponderate. xf

f

i

i

xi 455

657

Calculul mediei pentru o repartiţie pe intervale de variaţie egale.

Fiind o serie de repartiţie de frecvenţe vom folosi tot formula mediei aritmetice

ponderate. În cazul prezentat, variabila x este vechimea iar ponderea este numărul de angajaţi

corespunzător fiecărui interval şi care este exprimată atât în mărimi absolute (fi), cât şi în

mărimi relative (f*i). Pentru a calcula valoarea mediei este necesar să se stabilească în

prealabil vechimea medie corespunzătoare fiecărui interval.

Tabelul nr.7

Frecvenţe

Produse de frecvenţe

Vechime

(ani)

Centrul intervalului

Xi

absolute

( )f i

relative

%

( )*f i

x fi i x fi i*

0 - 5 2,5 10 3,33 25 8,325

5 - 10 7,5 40 13,33 300 99,975

10 - 15 12,5 60 20,00 750 250,000

15 - 20 17,5 80 26,67 1400 466,725

20 - 25 22,5 50 16,67 1125 375,075

25 - 30 27,5 30 10,00 825 275,000

30 - 35 32,5 20 6,67 650 216,775

35 - 40 37,5 10 3,33 375 124,875

TOTAL 300

f i

i

k

1

100

f ii

k

*

1

5450

x fi i

i

k

1

1816,75

x fi i

i

k*

1

Considerăm, în mod convenţional, că frecvenţele se distribuie uniform în cadrul

fiecărui interval şi prin urmare vom lucra cu centrul de interval (x i) stabilit ca medie

aritmetică simplă a celor două limite, apoi se efectuează produsele de frecvenţe x fi i şi x fi i*

şi se trece la calculul mediei în cele două variante:

a) utilizând frecvenţele absolute:

xx f

f

i i

i

5450

30018 1666, sau 18,2 ani vechime / ang.

Capitolul 3 55

b) utilizând frecvenţele relative:

xx fi i

*

,,

100

1816 75

10018 2 ani vechime / ang.

Media se exprimă în unităţile de măsură ale variabilei.

În cazul unei serii perfect simetrice media este egală cu varianta de la mijlocul seriei

sau cu mijlocul intervalului cu frecvenţa cea mai mare.

Media este mai exactă când o calculăm direct din valorile sub care s-a înregistrat

caracteristica. Ea este o medie aproximativă când o calculăm pentru seriile pe intervale de

variaţie deoarece în acest caz determinarea ei se bazează pe ipoteza repartizării uniforme a

frecvenţelor în cadrul fiecărui interval, ceea ce nu corespunde realităţii.

Una din condiţiile de aplicare a valorilor medii este aceea de a găsi criterii de alegere

corectă a tipului de medie folosit.

În general este recomandabil să alegem media aritmetică atunci când fenomenul

supus cercetării înregistrează modificări aproximativ în progresie aritmetică.

3.1.2 Media armonică

Media armonică se defineşte ca fiind egală cu valoarea inversă a mediei

aritmetice calculată din valorile inverse ale termenilor aceleiaşi serii.

Deşi derivă din media aritmetică ponderată, în practică se întâlnesc două variante ale

mediei armonice, simplă şi ponderată.

Se folosesc relaţiile de calcul:

xn

x

h

ii

n

1

1

pentru o serie simplă

x

f

xf

h

i

i

k

i

i

i

k

1

1

1 pentru o serie de repartiţie de frecvenţe

Media armonică ponderată se foloseşte de exemplu la calculul indicelui mediu de grup

al preţurilor (când lipsesc informaţii privind volumul fizic al mărfurilor) la calculul salariului

mediu pe întreprinderi când cunoaştem salariul mediu şi fondul de salarii la nivelul secţiilor;

la calculul producţiei medii la hectar la o cultură în cadrul unei asociaţii agricole când se

cunosc recolta medie şi recolta totală pe parcelele acesteia.

Despre patru echipe de angajaţi de la o secţie se cunosc următoarele date:

Tabelul nr.8

Echipa

Salariul mediu

RON/ang.

xi

Fondul de salarii

RON

xifi

1 540 6480


2 558 11160

3 635 14605

4 600 9000

Total 41245

În exemplul prezentat, variantele caracteristicii sunt medii de grupă şi se cere să

determinăm nivelul mediu al salariului pe întreaga secţie.

Fondul de salarii ( )x fi i

Salariul mediu pe fiecare echipă ( )xi =

Numărul angajaţilor (fi)

Deoarece cunoaştem ( )xi şi ( )x fi i vom folosi formula mediei armonice.

21,589

9000600

114605

635

111160

558

16480

540

1

41245

1

1

1

k

i

ii

i

k

i

ii

h

fxx

fx

x RON/ang.

În cazul distribuţiilor de frecvenţe media armonică este indicată a fi folosită când

predomină valorile mici ale seriei, seria prezentând o asimetrie către valorile minime ale

caracteristicii. În acest caz se foloseşte formula mediei armonice ponderate clasice.

3.1.3 Media pătratică

Media pătratică ( )xp este acea valoare care înlocuind termenii seriei

ridicaţi la pătrat nu modifică suma pătratelor lor.

Media pătratică este folosită de obicei atunci când nivelurile variabilei aleatoare

prezintă creşteri din ce în ce mai mari, predomină valorile ridicate ale variabilei şi dorim să le

dăm acestora o importanţă mai mare.

Media pătratică se poate calcula şi în cazul în care termenii seriei au valori pozitive şi

negative.

n

x

x

n

i

i

p

1

2

Această formulă se foloseşte în cazul unei serii simple.

În cazul unei distribuţii de frecvenţe:

x

x f

fp

i

i

k

i

i

i

k

2

1

1

Capitolul 3 57

3.1.4 Media geometrică

Spre deosebire de celelalte medii prezentate până aici, care se bazează pe relaţii de

însumare între termenii seriei, media geometrică se bazează pe relaţia de produs dintre ei.

Media geometrică reprezintă acea valoare cu care, dacă se înlocuiesc toţi termenii

seriei şi se face produsul lor, valoarea la care se ajunge este egală cu produsul termenilor reali,

adică:

x x x xn i

i

n

1 2

1

...

x x x x

n

xg g g g i

i

n

...

1

x x x xg

n

i

i

n

g i

i

n

n

1 1

În cazul unei serii de distribuţie de frecvenţe, fiecare termen trebuie să fie luat în

funcţie de frecvenţa sa.

Deci vom avea:

x x x xf f

k

f

i

f

i

k

k i

1 2

1

1 2, .....

Înlocuind fiecare valoare cu xg obţinem: x x x xg

f

g

f

g

f

i

f

i

k

k i1 2

1

.....

Restrângând obţinem:

( )x x

x x

g

f

i

f

i

k

g i

f

i

kf

i

i

k

i

ii

i

k

1

1

1

1

Media geometrică se foloseşte cel mai frecvent în cazul seriilor dinamice, la calculul

mediilor din mărimile relative ale dinamicii, între care există o relaţie de produs. Se foloseşte

la calculul indicelui mediu de dinamică.

Între mediile prezentate există următoare relaţie de ordine:

x x x xh g a p

3.2 Mediana

Mărimile medii deşi reflectă ceea ce este esenţial şi tipic în nivelul de dezvoltare a

fenomenului nu caracterizează modul de repartiţie a frecvenţelor în cadrul seriei.

De aceea, pentru completarea analizei seriilor de distribuţie este necesar să se

calculeze şi anumite valori medii de poziţie sau medii de structură, printre care mediana şi

modul sunt cele mai frecvent utilizate.

Mediana (Me) reprezintă valoarea centrală a unei serii statistice,

ordonate în mod crescător sau descrescător şi care împarte termenii seriei în două părţi


egale: 50% din numărul termenilor vor fi mai mici decât Me şi 50% se vor plasa peste

valoarea ei.

Indiferent de tipul seriei (simplă = date negrupate sau cu frecvenţe = date grupate) la

calculul medianei se cer rezolvate două aspecte:

aflarea locului medianei;

calculul valorii medianei.

a) Datele sunt cunoscute individual.

În cazul serilor simple locul medianei se află după relaţia: locul Men

1

2 unde n

reprezintă numărul termenilor seriei.

Determinarea medianei necesită ordonarea prealabilă crescătoare sau descrescătoare a

termenilor seriei.

Dacă numărul termenilor este impar (n = 2p+1) mediana este termenul de rang p+1

(valoarea termenului central).

Fie de exemplu, o serie formată din următorii nouă termeni: 8, 8, 9, 9, 9, 10, 10, 13,

14. În acest caz mediana este a cincea valoare, adică Me = 9, adică valoarea termenului

indicat de locul medianei (9+1)/2 = 5.

Dacă numărul termenilor este par, adică n = 2p, orice valoare cuprinsă între termenul

de rang p şi termenul de rang p+1 poate fi considerată ca o mediană. În general, s-a convenit

să se ia ca valoare a Me centrul acestui interval, adică media aritmetică a termenilor de rang p

şi p+1.

De exemplu, dacă se consideră o serie formată din valorile: 8, 9, 9, 10, 12, 13, 13, 14,

15, 16 mediana este situată între termenul cinci şi şase şi este egal cu media aritmetică simplă

a valorii lor adică Me = (12+13)/2 = 12,5

b) Datele sunt grupate pe intervale de valori (clase) şi în consecinţă îşi pierde

individualitatea.

În acest caz determinarea medianei se poate face numai dacă recurgem la o ipoteză

suplimentară: admitem că există o distribuire uniformă a datelor în intervalul fiecărei clase.

Astfel în prealabil se procedează la o interpolare liniară adică se împarte întregul interval de

valori în intervale egale.

Pentru ilustrarea modului de calcul al medianei considerăm seria din tabelul

de mai jos.

Locul medianei în cazul datelor grupate locul Me

f ii

n

1

2

1.

Efectivul total fiind 200 locul Me

200 1

2100 5, .

Mediana este situată între valorile 100 şi 101. Coloana frecvenţelor cumulate ne indică

structura acestor valori în intervalul 32 - 36. Cum în acest interval sunt situate 60 de unităţi

este necesar să repartizăm proporţional aceste 60 de unităţi în intervalul de variaţie egal cu 4

şi să identificăm a 100 -a şi 101-a valoare, care fac parte din grupa de 60. Cu alte cuvinte este

necesar să procedăm în continuare la calculul valorii medianei.

Capitolul 3 59

Tabelul nr.9 Gruparea societăţilor din ramura x după mărimea profitului

Societăţi după

mărimea profitului

(mii RON)

Numărul

societăţilor

Frecvenţe absolute cumulate

crescător descrescător

20 - 24 20 20 200

24 - 28 35 55 180

28 - 32 40 95 145

32 - 36 60 155 105

36 - 40 32 187 45

40 - 44 8 195 13

44 - 48 5 200 5

TOTAL 200

Determinarea valorii se poate realiza în două moduri:

prin calcul algebric;

prin calcul grafic.

Calculul algebric al medianei presupune utilizarea următoarei formule de calcul:

Me x h

ff

f

i

i

i

Me

m

0

1

11

2

h - mărimea intervalului median;

f i

i

Me

1

1

- suma frecvenţelor precedente intervalului median (frecvenţa cumulată a

intervalului precedent celui median)

fm - frecvenţa absolută a intervalului median.

Mediana seriei este deci:

Me

32 4100 5 95

6032 37

,, mii RON

Calculul grafic al medianei se poate realiza în două moduri:

1. Se trasează diagramele frecvenţelor cumulate ascendent şi descendent.Din punctul

de intersecţie al celor două curbe se trasează perpendiculara pe axa absiciselor şi se citeşte

valoarea medianei pe Ox (vezi fig.1.); Me = 32,375 mii RON.

2. Se trasează curba frecvenţelor cumulate crescător. De pe axa ordonatelor din

punctul corespunzător locului medianei =f

i 1

2 (în cazul nostru 100,5) se duce o paralelă

la Ox ce întîlneşte curba în punctul m. Din acest punct se coboară perpendicular pe Ox şi se

obţine astfel valoarea medianei.


0

25

50

75

100

125

150

175

200

20 24 28 32 36 40 44 48

Me

y

Figura 1. Calculul grafic al medianei

0

50

100

150

200

250

20 24 28 32 36 40 44 48

Me

Figura 2. Calculul grafic al medianei

Menţionăm în continuare cîteva proprietăţi ale medianei. Mediana depinde de locul

valorilor în serie, nu de mărimea acestor valori. În felul acesta ea este protejată contra

influenţei valorilor aberante (anormal de mari sau anormal de mici).

Mediana are o largă apliacabilitate în practică, ea serveşte la studiul mortalităţii, la

determinarea duratei medii de viaţă, etc.

Capitolul 3 61

3.3 Moda (modulul, dominanta)

Modulul (Mo) unei distribuţii statistice reprezintă acea valoare a

caracteristicii care corespunde celui mai mare efectiv sau celei mai mari frecvenţe.

Pentru serii simple (date negupate) modul se calculează cu totul întâmplător dacă

întâlnim o valoare a variabilei care se repetă de mai multe ori.

Astfel, în seria (4, 5, 6, 6, 7, 7, 8, 8, 8, 9, 9, 10), valoarea 8 apare cel mai frecvent;

modul este deci Mo = 8.

Modul se poate calcula cu certitudine pentru orice serie de distribuţie de frecvenţă,

indiferent de modul ei de prezentare (pe variante sau pe intervale de variaţie).

Modul se poate calcula fie pe cale algebrică fie prin metoda grafică.

a) Cazul unei serii de distribuţie pe variante.

În acest caz modul este uşor de reperat. În tabelul statistic xi, fi în care este prezentată

seria pe variante, modul este acea valoare a lui x i corespunzătoare frecvenţei maxime.

Calculul grafic al modului presupune reprezentarea grafică a seriei utilizând poligonul

frecvenţelor. În acest caz Mo este acea valoare de pe abscisă care corespunde frecvenţei

maxime (vezi fig. 3).

xi

0

1

2

3

4

5

6

7

8

0 1 2 3 4 5 6 7 8

Mo

fi

Figura 3


xi

0

1

2

3

4

5

6

7

8

0 1 2 3 4 5 6 7 8 9

In te r va l m o d al

f i

Figura 4

Dacă seria prezintă două frecvenţe maxime identice alăturate se defineşte un interval

modal (vezi fig. 4) fără a putea preciza valoarea exactă a modului.

Dacă seria prezintă două sau mai multe frecvenţe maxime aparţinând unor valori

situate la distanţe inegale spunem că seria este bimodală, trimodală etc.

Pentru o serie de distribuţie pe intervale egale valoarea modului trebuie calculată.

Intervalul modal se consideră intervalul care are frecvenţa cea mai mare.

În seria prezentată pentru calculul medianei intervalul modal este cuprins între 32-36

mii RON profit, deoarece aici frecvenţa este maximă (60). Cu aceste precizări se poate

proceda la calculul algebric şi grafic.

a) Calculul algebric al modului se bazează pe relaţia:

Mo x h

0

1

1 2

în care:

x0 - reprezintă limita inferioară a intervalului modal;

h - mărimea intervalului modal;

1 - diferenţa dintre frecvenţa intervalului modal (fm) şi a celui precedent (fm-1)

2 - diferenţa dintre frecvenţa intervalului modal (fm) şi a celui următor (fm+1)

În seria prezentată:

Mo

32 4

60 40

60 40 60 3233 67

( )

( ) ( ), mii RON

Modul prezintă o abatere faţă de medie de 1,81 mii RON (31,86-33,67 = -1,81). Fiind

negativă această abatere arată că frecvenţele termenilor mai mici sunt mai numeroase, în

comparaţie cu frecvenţele termenilor mai mari. Media s-a calculat utilizând formula:

xx f

f

i i

i

6372

20031 86, mii RON profit/societate

b) Pe grafic, valoarea modală se determină folosind histograma prin dreptunghiuri:

Capitolul 3 63

Se procedează astfel: Se construieşte histograma (vezi figura 5). Din intersecţia

segmentelor de dreaptă care unesc vârfurile superioare ale dreptunghiului aferent modului cu

frecvenţele de incidenţă ale acestuia cu dreptunghiurile adiacente, se coboară o perpendiculară

pe abscisă. Punctul găsit indică valoarea modului. De pe grafic rezultă o valoare apropiată de

cea obţinută prin calcul algebric (Mo = 33,7).

Figura 5. Calculul grafic al modului

c) În cazul distribuţiilor moderat asimetrice Mo se mai poate determina şi pornind de

la condiţia care trebuie să fie îndeplinită în acest caz:

x Mo x Me

Mo Me x

3

3 2

( )

În cazul prezentat prin utilizarea acestei relaţii de calcul se obţine:

Mo 332 27 231 86 33 34, , , mii RON

Se observă că valoarea modului nu diferă semnificativ faţă de rezultatele obţinute la

puctele a) şi b) în cazul nostru.

De precizat faptul că modul este o valoare foarte instabilă. Simpla deplasare cu câteva

unităţi (deci reluarea grupării) poate să modifice sensibil valoarea modului.

Observăm că în cazul distribuţiei studiate x Me Mo ( , , , )31 86 32 37 33 67

aspect de care se va ţine seama în aprecierea tipului seriei.

Mediana şi modul se exprimă în aceleaşi unităţi de măsură ca şi variabilele pentru care

se determină şi prezintă avantajul că valoarea lor nu se modifică dacă se închid în mod

convenţional intervalele deschise.

Mediana şi modul pot să fie determinate chiar dacă nu se cunosc limitele extreme ale

primului şi ultimului interval al seriei (limita inferioară a primului interval şi limita superioară

a ultimului interval). Modul este mai puţin exact decât media deoarece nu sunt implicate în

calcul toate valorile variabilei.

Cu toate inconvenientele modul are o largă aplicabilitate practică (mai ales în comerţ)

şi stă la baza calculului şi interpretării gradului de asimetrie a repartiţiei.

Folosirea modului se impune dacă interesează valoarea tipică a unei serii de repartiţie.

La utilizarea modului trebuie să se manifeste precauţie determinată de faptul că:

- modul conţine relativ puţine informaţii: valoarea modală este mai frecventă

decât celelalte valori. Dacă celelalte valori sunt însă aproape tot aşa de


frecvente ca valoarea modală, s-ar putea ca o valoare să devină dominantă

din întâmplare. Deci, se recurge la modul numai dacă o valoare domină în

seria de repartiţie;

- dacă valoarea care domină este extremă, modul nu poate caracteriza tendinţa

centrală.

3.4 Cuartilele

Pentru seriile de distribuţie cu tendinţă pronunţată de asimetrie, caracterizate

printr-o amplitudine mare a variaţiei, se calculează şi alţi indicatori de poziţie cum sunt:

cuartilele, decilele etc.

Cuartilele sunt acele valori ale caracteristicii, care separă seria în patru

părţi egale:

cuartila inferioară, notată cu Q1, este mai mare decât 25% din termenii

seriei şi mai mică decât 75% dintre ei;

cuartila a doua Q2 coincide cu Me şi separă seria în două părţi;

cuartila superioară Q3 este mai mare decât 75% din numărul

termenilor şi mai mică decât 25% din numărul lor.

Analog cu mediana pentru cuartile obţinem:

Tabelul nr.10

Locul cuartilei Valoarea cuartilei

loc Q f i1

1

41 ( )

Q x h

f fpQ

f

i

Q

1 0

1

1

41

1

( )

Q Me2

loc Q f i3

3

41 ( )

Q x h

f fpQ

f

i

Q

3 0

3

3

41

31

( )

în care:

fpQ si fpQ1 3 suma frecvenţelor intervalelor precedente locului pe care

îl ocupă Q1 şi Q3

fQ si fQ1 2 frecvenţa intervalelor care conţin cuartilele res pective.

Capitolul 3 65

Pentru exemplul de mai sus:

Locul Q1 este 25,504

1200

; intervalul cuartilei este 24 – 28

45,2735

2025,504241

Q mii RON

Locul Q3 este 75,1504

)1200(3

; intervalul cuartilei este 32 – 36

71,3560

9575,1504323

Q mii RON

4. Indicatorii variaţiei

Într-o colectivitate statistică valorile individuale (variantele) diferă mai mult

sau mai puţin unele faţă de altele. Ele pot fi mai apropiate sau mai împrăştiate. Comparaţia se

face, în mod practic, cu media seriei, considerată ca fiind valoarea cea mai reprezentativă

pentru colectivitatea studiată. De cele mai multe ori este important de cunoscut cât de departe

sunt valorile variantelor seriei faţă de această medie, sau cu alte cuvinte care este dispersia

variantelor în cadrul seriei.

Se apreciază că dacă variantele au valori mai apropiate de valoarea mediei seriei, deci

prezintă abateri mici, media este reprezentativă.

În practica statistică, de cele mai multe ori, datele care trebuie să fie analizate sunt

extrem de numeroase şi de regulă cu o amplitudine mare a variaţiei. De aceea este necesar să

separăm şi să stabilim intensitatea cu care activează cele două grupe de factori esenţiali şi

întâmplători având drept consecinţă imediată un anumit grad de variabilitate.

Analiza statistică a unei repartiţii poate fi aprofundată prin calculul indicatorilor de

variaţie. Aceşti indicatori trebuie să servească la:

verificarea reprezentativităţii mediei ca valoare tipică a unei serii de date statistice;

verificarea gradului de omogenitate a seriei;

caracterizarea statistică a formei şi gradului de variaţie a unei caracteristici;

compararea în timp şi spaţiu a mai multor serii statistice de distribuţie pentru aceeaşi

caracteristică sau pentru caracteristici interdependente;

cunoaşterea gradului de influenţă a factorilor după care s-a făcut gruparea unităţilor

observate.

Indicatorii variaţiei pot fi calculaţi ca indicatori simpli şi ca indicatori sintetici.

4.1 Indicatorii simpli ai variaţiei

Indicatorii simpli ai variaţiei servesc tocmai pentru a caracteriza gradul de împrăştiere

a unităţilor purtătoare ale caracteristicilor înregistrate. Ei se calculează pentru a măsura

amplitudinea variaţiei şi abaterile valorilor individuale de la media lor. Aceşti indicatori se pot

exprima atât în mărimi absolute - folosind aceleaşi unităţi de măsură ca şi pentru caracteristica

studiată - cât şi în mărimi relative, calculate în raport cu valoarea medie.


Din această grupă a indicatorilor simpli fac parte:

amplitudinea variaţiei (absolută şi relativă)

abaterile individuale (absolute şi relative).

Amplitudinea absolută (Aa) se calculează ca diferenţă între nivelul maxim (xmax) şi

nivelul minim (xmin) al caracteristicii:

Aa = xmax - xmin

Amplitudinea absolută se exprimă în unităţile de măsură ale variabilei respective şi

prin urmare nu poate fi folosită la compararea a două variabile exprimate în unităţi de măsură

diferite.

Amplitudinea relativă a variaţiei (A%) se exprimă de regulă în procente şi se

calculează ca raport între amplitudinea absolută a variaţiei şi nivelul mediu al caracteristicii:

AA

x

a

% 100

Abaterile individuale absolute (di) se calculează ca diferenţă între fiecare variantă

înregistrată şi media aritmetică a acestora după relaţia:

d x x i ni i 1 2, , ...

Abaterile individuale relative (d%) se calculează raportând abaterile absolute la

nivelul mediu al caracteristicii:

dd

x

x x

xi ni

i i

%, , ...

100 100 1 2

În analiza variaţiei, de multe ori, ne limităm la a calcula abaterile maxime într-un sens

sau altul.

Gradul de variaţie al unei caracteristici depinde însă de toate abaterile variantelor

înregistrate şi de frecvenţa lor de apariţie şi prin urmare indicatorii simpli ai variaţiei nu pot

exprima întreaga variaţie a unei caracteristici înregistrate. Din acest motiv caracterizarea

gradului de variaţie se face de obicei cu ajutorul indicatorilor sintetici ai variaţiei care iau în

consideraţie toate abaterile caracteristicii.

4.2 Indicatorii sintetici ai variaţiei

Indicatorii sintetici ai variaţiei, la fel ca indicatorii tendinţei centrale, trebuie să se

bazeze pe toate observaţiile, să fie uşor de înţeles, uşor de calculat, afectaţi cât mai puţin

posibil de fluctuaţiile de selecţie şi adecvaţi unui studiu algebric.

Indicatorii sintetici ai variaţiei sunt: abaterea medie liniară ( )d , abaterea medie

pătratică ( ) , dispersia ( ) 2 şi coeficientul de variaţie (v).

Abaterea medie liniară ( )d se calculează ca o medie aritmetică simplă sau ponderată

din abaterile termenilor seriei de la media lor, luate în valoare absolută.

Formulele de calcul ale abaterii medii liniare sunt:

pentru o serie simplă:

d

x x

n

i

i

n

1

pentru o serie de frecvenţe absolute:

Capitolul 3 67

d

x x f

f

i

i

k

i

i

i

k

1

1

pentru o serie cu frecvenţe relative, exprimate în procente:

d

x x fi

i

k

i

1

100

*%

pentru o serie cu frecvenţe relative, exprimate sub formă de coeficienţi:

d x x fi

i

k

i

1

*

d se exprimă în unităţile de măsură ale variabilei şi deci nu poate fi folosit la

comparaţii.

Abaterea medie liniară prezintă şi dezavantajul că nu ţine seama de faptul că abaterile

mai mari în valoare absolută influenţează în mai mare măsură gradul de variaţie a unei

caracteristici, în comparaţie cu abaterile mai mici. În plus, din punct de vedere algebric nu

este indicat să se renunţe în mod arbitrar la semnul valorilor din care se calculează o valoare

medie. Din aceste considerente se foloseşte ca principal indicator sintetic al variaţiei abaterea

medie pătratică.

Abaterea medie pătratică sau abaterea standard notată cu ( ) se calculează ca o

medie pătratică din abaterile tuturor variantelor seriei de la media lor aritmetică.

Relaţiile de calcul ale abaterii medii pătratice sunt:


( )x x

n

i

i

n2

1


( )x x f

f

i

i

k

i

i

i

k

2

1

1


( ) %x x fi

i

k

i

2

1

100


( ) *x x fi

i

k

i2

1

În literatura de specialitate se apreciază că pentru o serie de distribuţie cu tendinţă

clară de normalitate, abaterea medie liniară este egală cu 4/5 din valoarea abaterii medii

pătratice.

Abaterea medie pătratică este un indicator de bază, care se foloseşte în analiza

variaţiei la estimarea erorilor de selecţie, în calcule de corelaţie.


La fel ca abaterea medie liniară, abaterea medie pătratică se exprimă în unitatea de

măsură a variabilei a cărei variaţie o caracterizează. Prin urmare cei doi indicatori nu se pot

folosi pentru compararea gradului de variaţie a două sau mai multe variabile diferite şi în

aceste situaţii se recurge la un alt indicator de variaţie - coeficientul de variaţie.

Coeficientul de variaţie (v) se calculează ca raport între abaterea medie pătratică şi

nivelul mediu al seriei. De obicei se exprimă sub formă de procente. Formula de calcul a

coeficientului de variaţie este:

vx

100

Coeficientul de variaţie se mai poate calcula şi după relaţia:

vd

x100

Coeficientul de variaţie se exprimă de regulă, în procente, ceea ce înseamnă că el este

de fapt expresia relativă fie a lui d , fie a lui .

Semnficaţie: cu cât nivelul lui v este mai apropiat de zero, cu atât variaţia este mai

slabă, colectivitatea este mai omogenă, media având un grad ridicat de reprezentativitate; cu

cât valoarea sa este mai departe de zero cu atât variaţia este mai intensă, colectivitatea este

mai eterogenă, iar media are un nivel de semnificaţie mai scăzut. Se apreciază că, în cazul

unui coeficient de peste 35-40%, media nu mai este reprezentativă şi datele trebuie să fie

separate în serii componente, pe grupe, în funcţie de variaţia unei alte caracteristici de

grupare. Se poate afirma că acest indicator (coeficientul de variaţie) poate fi folosit ca un test

de verificare în aplicarea metodei grupării.

Deşi indicatorul - coeficientul de variaţie - înlătură dezavantajele prezentate de şi

d şi acest indicator are limitele lui. Astfel, acest coeficient este în mod evident neadecvat în

cazul în care media aritmetică este apropiată de zero.

Deşi în literatura de specialitate coeficientul de variaţie se calculează de cele mai

multe ori prin relaţiile menţionate (media fiind indicatorul care respectă cele mai multe din

condiţiile impuse de Yule), acest indicator se poate calcula şi înlocuind media cu mediana sau

modul.

vd

Mev

Mev

d

Mov

Mo 100 100 100 100; ; ; ;

Un alt indicator sintetic al variaţiei, cu o largă utilizare în analiza statistică a

fenomenelor, este dispersia.

Dispersia unei caracteristici se notează cu ( ) 2 şi se calculează ca o medie

aritmetică simplă sau ponderată a pătratelor abaterilor termenilor faţă de media lor.

Formulele de calcul sunt:


2

2

1

( )x x

n

i

i

n


2

2

1

1

( )x x f

f

i

i

k

i

i

i

k


Capitolul 3 69

2

2

1

100

( ) %x x fi

i

k

i


2 2

1

( ) *x x fi

i

k

i

Pentru exemplificarea calculării indicatorilor sintetici de variaţie se va folosi

seria de distribuţie de frecvenţe prezentată în tabelul de mai jos.

Tabelul nr.11 Calculul indicatorilor sintetici de variaţie

Intrep.

după

mărimea

profitului

mii RON

Nr.

intrep.

(fi)

Centrul de

interval

(xi)

x x fi i

( )x x fi i 2

20 - 24 20 22 197,20 1944,392

24 - 28 35 26 205,10 1201,886

28 - 32 40 30 74,40 138,384

32 - 36 60 34 128,40 274,776

36 - 40 32 38 196,48 1206,387

40 - 44 8 42 81,12 822,557

44 - 48 5 46 40,40 999,698

TOTAL 200 953,40

6588,080

f i x x fi i ( )x x fi i

2

Profitul mediu pe întreprindere:

x

x f

f

i i

i

k

i

i

k

1

1

6372

20031 86, mii RON/întreprindere

Abaterea medie liniară:

d

x x f

f

i i

i

k

i

i

k

1

1

953 4

2004 767

,, mii RON profit/întreprindere

Dispersia:


94,32200

08,6588)(

1

2

2

k

i

i

ii

f

fxx

Abaterea medie pătratică:

( )

, ,

x x f

f

i i

i

k

i

i

k

2

1

1

32 94 5 739 mii RON profit/întreprindere

Coeficientul de variaţie:

%01,18100 x

v

Pe baza rezultatelor obţinute se poate afirma că media este reprezentativă pentru seria

din care s-a calculat, deoarece s-a obţinut un coeficient de variaţie (18,01%) iar cele mai

multe valori (60

200100 30%) se concentrează în intervalul 32-36 mii RON.

5. Media şi dispersia caracteristicii alternative

În practica de cercetare statistică a fenomenelor social-economice se întâlnesc

caracteristici ale căror variante nu se exprimă numeric (cantitativ) ci prin cuvinte (calitativ) şi

nu admit decât una sau alta dintre alternative. În cazul în care caracteristica urmărită este

alternativă unităţile colectivităţii se împart în două: o grupă care cuprinde acele unităţi la care

se înregistrează forma directă de manifestare a caracteristicii şi o altă parte a colectivităţii la

care se înregistrează opusul formei de manifestare a caracteristicii. De exemplu: starea unei

piese poate fi bună sau rebut, situaţia unui student după susţinerea unui examen poate fi

promovat sau nepromovat, operaţia unui pacient poate fi reuşită sau nereuşită etc. De

menţionat faptul că orice caracteristică nealternativă se poate transforma într-o caracteristică

alternativă prin raportarea la medie sau la un anumit prag. În acest caz unităţile colectivităţii

se vor separa în două grupe: unităţi cu un nivel de dezvoltare mai mic decât media şi a doua

grupă formată din unităţile cu nivel de dezvoltare mai mare decât media.

Pentru caracterizarea statistică a unor variabile de acest gen este necesară o

cuantificare a valorilor. Considerând răspunsurile respective ca find cele două variante ale

caracteristicii, pentru exprimarea lor cantitativă s-au stabilit următoarele valori convenţionale:

pentru DA; x1 = 1

pentru NU; x2 = 0

Pentru distribuţia prezentată în tabel, media caracteristicii se va calcula aplicând

relaţia mediei aritmetice ponderate, astfel:

1 0

M N M

N N M

M

NP

( )

( )

Se observă că media caracteristicii alternative reprezintă tocmai frecvenţa relativă a

răspunsurilor afirmative.

Capitolul 3 71

Tabelul nr.12 Distribuţia de frecvenţe a caracteristicii alternative

Valoarea

caracteristicii

Răspunsul

înregistrat

Frecvenţe absolute Frecvenţe

relative

0 1 2 3

x1 = 1 DA M (numărul unităţilor care

posedă caracteristica) p

M

N

x2 = 0 NU (N-M)

(numărul de unităţi care nu

posedă caracteristica)

qN M

N1 p

Total N=M+(N-M) p+q = 1

Dispersia caracteristicii alternative se obţine pornind de la relaţia de calcul obişnuit al

dispersiei, în care se folosesc elementele specifice:

p

p p o p q

p q

22 21

( ) ( )

Deoarece p + q = 1, atunci (1 - p) = q şi formula devine:

p

q p p q

p q

p q q p

p qp q p p

p q p p

22 2

1

1

( )( )

( )

deci

saup

2

p

2

Dispersia caracteristicii alternative este egală cu produsul dintre cele două frecvenţe

relative.

Abaterea medie pătratică se determină potrivit metodologiei clasice - ca rădăcină

pătrată din dispersie:

p p q

Aceşti indicatori sunt folosiţi pe scară largă în cercetările selective şi mai ales în

controlul statistic al calităţii produselor.

6. Asimetria

Pentru caracterizarea seriilor de distribuţie unidimensionale şi unimodale un

interes deosebit îl prezintă şi cunoaşterea gradului de oblicitate, de îndepărtare a acestor

distribuţii de la simetrie. În practica statistică acest aspect este cunoscut sub numele de

asimetrie.

La interpretarea gradului de asimetrie se porneşte de la poziţia şi valorile pe care le au

cei trei indicatori ai tendinţei centrale: media, mediana şi modul.


Într-o distribuţie simetrică cei trei indicatori: mod, mediană şi media artimetică se

confundă ca în diagrama (a).

y y

x x M M xo e xMM eo

(a) (b) y

x

oe MMx

( c )

O distribuţie nonsimetrică se mai numeşte şi oblică şi ea poate prezenta asimetrie de

stânga sau de dreapta (vezi diagramele b şi c).

Forma repartiţiei se poate analiza:

a) utilizând metoda grafică;

b) calculând indicatorii de asimetrie adecvaţi.

Asimetria se poate analiza în primul rând cu ajutorul metodei grafice. În acest scop se

folosesc: poligonul frecvenţelor şi histograma. După ce s-a construit poligonul frecvenţelor

interpretarea se face ca mai sus.

Reprezentarea grafică a seriei oferă o imagine sugestivă asupra gradului de asimetrie

fără însă a-l putea măsura printr-o valoare numerică. De aceea, se calculează şi indicatorii de

asimetrie, exprimaţi în mărimi absolute şi relative.

Asimetriea absolută se calculează după relaţia:

As x Mo

Se exprimă în unităţile de măsură ale variabilei şi nu poate fi folosit la comparaţii

între serii.

De aceea, pentru a măsura gradul de asimetrie, recurgem la indicatorii de asimetrie

relativi. Din acest grup reţinem un anumit număr de coeficienţi, adică numere fără

dimensiune, permiţând comparaţiile.

Prezentăm în continuare trei coeficienţi de asimetrie ce poartă numele autorilor lor,

Pearson şi Yule.

Karl Pearson, statistician britanic propune la începutul secolului pentru măsurarea

asimetriei trei coeficienţi:

Capitolul 3 73

cx Mo

C

C

C

as

as

as

as

0

0

0

simetrie

serie oblicã la stânga

serie oblicã la dreapta

Acest coeficient poate lua valori cuprinse între -1 şi

+1; cu cât este mai mic în valoare absolută cu atât asimetria este mai mică.

De reţinut: acest coeficient este recomandabil a se folosi numai pentru distribuţii uşor

asimetrice.

În cazul când se cunoaşte mediana seriei, coeficientul de asimetrie ( )Cas se poate

calcula utilizând relaţia:

Cx Me

as

3( )

Acest coeficient se foloseşte când între cei trei indicatori ai tendinţei centrale se

verifică relaţia:

Modul = Media - 3(Media - Mediană)

Acest coeficient poate să ia valori cuprinse între -3 şi +3 şi va arăta un grad mai mare

de simetrie cu cât se va apropia mai mult de 0.

Pearson mai propune şi un alt coeficient pentru calculul gradului de asimetrie al unei

serii formată dintr-un număr foarte mare de observaţii:

C

x x f

f

x x f

f

as

i i

i

i i

i

3

2

2

3

3

2

2

unde

dispersie

3

2

( )

( )

Se observă că primii doi indicatori propuşi de Pearson (şi cei mai utilizaţi) se bazează

pe relaţia care există între cele trei valori ale tendinţei centrale. Dar, asupra asimetriei

influenţează şi celelalte valori medii de poziţie. Pentru a ţine seama şi de influenţa cuartilelor

se foloseşte coeficientul propus de Yule, calculat după formula:

AsQ Me Me Q

Q Me Me Q

( ) ( )

( ) ( )

3 1

3 1


Dacă:

As

As

As

0

0

0

simetrie

simetrie oblicã la stanga

simetrie oblicã la dreapta

Dacă acest coeficient se apropie de 0,1 se apreciază că seria este moderat asimetrică,

iar peste 0,3 se consideră că seria este pronunţat asimetrică.

Rezumat

În concluzie, indicatorii utilizaţi în statistică sunt extrem de numeroşi şi cu

metodologii variate de calcul sub formă de mărimi relative, mărimi medii, indicatori ai

variaţiei absoluţi, relativi şi medii, indici, indicatori ce caracterizează corelaţia etc. Fiecare

dintre aceşti indicatori exprimă anumite trăsături ale colectivităţii şi numai prin utilizarea

combinată a indicatorilor absoluţi şi derivaţi se ajunge la cunoaşterea multilaterală a

fenomenelor studiate în continua lor dezvoltare.

Termeni importanţi: indicator statistic, forme de exprimare, mărime relativă, mărimi

de structură, mărimi de coordonare, mărimi de dinamică, mărimi de intensitate, media

aritmetică, media armonică, media pătratică, media geometrică, mediana, modulul, cuartilele,

amplitudinea, abateri individuale, abaterea medie liniară, abaterea medie pătratică, dispersia,

coeficientul de variaţie, coeficient de asimetrie


1. Definiţi mărimile relative.

2. Ce forme de exprimare cunoaşteţi ?

3. Ce sunt mărimile de structură ? Exemple.

4. Ce sunt mărimile de coordonare ? Exemple.

5. Definiţi indicii de evoluţie.

6. Ce sunt mărimile de intensitate ? Exemple.

7. Ce sunt mărimile medii ?

8. Ce tipuri de medii cunoaşteţi şi când le aplicaţi ?

9. Care este rolul indicatorilor variaţiei ?

10. Enumeraţi şi definiţi indicatorii simpli.

11. Interpretaţi indicatorii sintetici.

12. Ce coeficienţi de asimetrie cunoaşteţi ?

Capitolul 3 75

Probleme propuse

1. La un hotel de patru stele s-au înregistrat datele:

Tarif cazare (euro) Nr. înnoptări Tip

cameră Aprilie 2007 Aprilie 2008 Aprilie 2007 Aprilie 2008

Dublă

Single

Garsonieră

Apartament

80

75

110

140

90

75

115

140

250

110

15

7

237

115

15

5

Se cere:

a. Să se calculeze valoarea tarifului la cursul zilei pentru moneda euro.

b. Să se calculeze şi să se interpreteze mărimile relative permise de date.

c. Să se analizeze evoluţia valorii încasate.

2. Pentru doi agenţi economici ce desfăşoară aceeaşi activitate, se cunosc datele:

Agent

economic

Salariul mediu

în perioada curentă (1)

(RON/pers.)

Nr. angajaţi

în perioada curentă (1)

Dinamica fodului de

salarii (1/0)

%

A 830 42 105

B 976 18 90

Se cere:

a. Salariul mediu, pe total, în perioada curentă.

b. Să se reprezinte grafic structura fondului de salarii din perioada curentă.

c. Să se stabilească ce alte tipuri de mărimi relative se pot calcula pe baza datelor

din enunţ.

3. 200 de turişti dintr-o staţiune balneară au fost distribuiţi după durata sejurului astfel:

Durata sejurului

(zile)

Nr. turişti

Sub 4

4 – 7

7 – 10

10 – 13

13 – 16

16 – 19

15

30

45

60

30

20

Total 200

a. Se cere să se calculeze şi să se interpreteze mediana, cuartilele şi modulul.

b. Se cere să se calculeze şi să se interpreteze indicatorii variaţiei şi să se

precizeze dacă media este semnificativă.

Serii de distribuţie bidimensionale 76

Capitolul 4

Tema Serii de distribuţie bidimensionale

Obiectivele 1. Analiza dispersională

2. Analiza ANOVA (testul Fisher - Snedecor)

3. Tesul χ2

Mijloace





lupă)


Finalitatea 1. descompunerea pe factori de influenţă aplicând analiza dispersională

2. analiza influenţei factorilor – testul Fisher

3. testarea dependenţei sau independenţei variabilelor categoriale


Timp de lucru

necesar



Capitolul 4 77

Serii de distribuţie bidimensionale

1. Analiza dispersională

O colectivitate statistică poate fi distribuită după două variabile ce se află într-

o relaţie de cauzalitate. Prin calculând indicatorilor de variaţie corespunzători putem preciza

dacă factorul de grupare (X) este un factor hotărâtor (determinant) pentru variaţia factorului

Y.

În cazul în care s-a aplicat în prealabil metoda grupării se pot calcula atât medii cât şi

indicatori de variaţie (dispersii) pe grupe şi pe total colectivitate. Media şi dispersia pe

întreaga colectivitate se pot calcula fie făcând abstracţie de faptul că ea este compusă din mai

multe grupe, fie luând în calcul indicatorii corespunzători calculaţi la nivelul grupelor.

Aşadar, între indicatorii de variaţie calculaţi la nivelul fiecărei grupe şi cei pe întreaga

colectivitate există anumite relaţii bazate pe regula adunării dispersiilor.


fost împărţite în funcţie de caracteristica x în r grupe, s-au obţinut distribuţiile condiţionate de

factorul de grupare din tabelul 1.

Se observă că frecvenţele pe fiecare grupă se obţin prin însumarea frecvenţelor din

interiorul grupelor, adică:

f n f n f nj

j

m

ij

j

m

i rj

j

m

r1

1

1

1 1

;... ;... ;


indicatorii de variaţie corespunzători putem preciza dacă factorul de grupare (X) este un factor

hotărâtor (determinant) pentru variaţia factorului Y. De exemplu, putem analiza prin regula

de adunare a dispersiilor, în ce proporţie numărul salariaţilor influenţează variaţia cifrei de

afaceri pentru un anumit număr de agenţi economici sau în ce măsură volumul desfacerilor

influenţează salariul încasat de un anumit număr de vânzători.

Concret, pe baza unor date prezentate în tabel se pot calcula următorii indicatori

statistici:

medii (pe fiecare grupă şi pe total);

dispersii (pe fiecare grupă şi pe total).

Mediile de grupă se notează cu şi se calculează după relaţia:

ri

f

fy

ym

j

ij

m

j

ijj

i ,1

1

1


Distribuţiile condiţionate ale variabilei Y în funcţie de un factor de grupare

Tabelul nr. 1

Valorile

caracte-

risticii de

grupare

X

Numărul unităţilor pe variantele caracteristicii Y

Volumul

grupelor

ni

Medii pe

grupe

(medii

condiţi-

onate)

y1 y2… yj… ym

x1 f11 f12… f1j… f1m n1 ( )y1

x2 f21 f22… f2j… f2m n2 ( )y2

... ... ... ... ... ... ...

xi fi1 fi2… fij… fim ni ( )yi

... ... ... ... ... ... ...

xr fr1 fr2… frj… frm nr ( )yr

Total f1 f2.. fj… fm n fi

i

r

j

j

m

1 1

y

Numărul mediilor de grupă este egal cu numărul grupelor în care s-a separat

colectivitatea (r grupe).

Media pe total (notată cu y0 când datele provin dintr-o observare totală sau y când

datele provin dintr-o observare parţială) sintetizează atât variaţia valorilor individuale ale

colectivităţii totale cât şi valorile mediilor de grupă (medii condiţionate de factorul de

grupare). Prin urmare ea se poate calcula în funcţie de datele de care dispunem după una din

relaţiile:

y

y f

f

sau y

y n

n

j j

j

m

j

j

m

i i

i

r

i

i

r

1

1

1

1

Corespunzător pentru caracteristica yj se pot calcula indicatori care să caracterizeze:

o variaţia valorilor (yj) în jurul mediei lor de grupă ( )y yj i ;

o variaţia valorilor mediilor de grupă în jurul mediei colectivităţii totale

( )y yi ;

o variaţia valorilor (yj) în jurul mediei colectivităţii totale ( )y yj .

La nivelul fiecărei unităţi observate, variaţia totală ( )y yj se poate descompune în

variaţia faţă de media de grupă ( )y yj i plus variaţia mediei de grupă de la media

colectivităţii totale ( )y yj , adică:

( )y yj = ( )y yj i + ( )y yi

Se consideră că variaţia valorilor individuale din fiecare grupă în jurul mediei lor va

măsura gradul de influenţă a factorilor variabili (neînregistraţi, întâmplători) prezenţi în

interiorul grupei deoarece la nivelul grupei, valoarea caracteristicii de grupare este considerată

constantă. În schimb, variaţia mediilor de grupă faţă de media colectivităţii totale este

interpretată ca fiind rezultatul factorului de grupare, deoarece în acest caz factorii variabili din

interiorul grupei s-au păstrat la un nivel constant.

Capitolul 4 79

Pentru determinarea separată atât la nivelul fiecărei grupe, cât şi la nivelul

colectivităţii generale, a intensităţii cu care au influenţat asupra variabilităţii caracteristicii

dependente cele două grupe de factori (întâmplători şi esenţiali), se folosesc următoarele tipuri

de dispersii:

dispersia de grupă ( ) i

2 ;

media dispersiilor de grupă ( )

dispersia dintre grupe ;

dispersia totală ( ) 0

2 .

Dispersia de grupă sau dispersia parţială se calculează pe baza abaterilor tuturor

variantelor dintr-o grupă faţă de media lor, ponderate cu frecvenţele de grupă pe baza relaţiei:

m

j

ij

m

j

ijij

i

f

fyy

1

1

2

2

)(

unde:

yj reprezintă variantele caracteristicii dependente;

yi media de grupă, calculată din aceste variante;

fij frecvenţele corespunzătoare fiecărei variante (interval de valori) din

cadrul grupei.

Dispersia de grupă evidenţiază variaţia caracteristicii dependente (yj) determinată de

acţiunea factorilor întâmplători care acţionează la nivelul grupei respective.

Numărul dispersiilor de grupă este egal cu numărul grupelor ce formează

colectivitatea supusă studiului.

Comparând între ele dispersiile de grupă putem preciza care grupă este mai omogenă.

Astfel, dispersia cu nivelul cel mai scăzut evidenţiază gradul înalt de omogenitate al grupei,

acţiunea redusă a factorilor neânregistraţi (întâmplători) şi deci o variaţie mai slabă; dispersia

cu nivelul cel mai mare reflectă o variaţie pronunţată sub acţiunea intensă a factorilor

întâmplători.

Pentru a sintetiza această variaţie într-un singur indicator calculat pe întreaga

colectivitate se calculează media dispersiilor de grupă.

Media dispersiilor de grupă se calculează ca o medie aritmetică a

dispersiilor parţiale.

Dacă grupele sunt egale ca volum se foloseşte media aritmetică simplă, dacă volumul

diferă de la o grupă la alta se calculează ca o medie aritmetică ponderată utilizând relaţiile:

2

2

1

i

i

r

r sau

2

2

1

1

i

i

r

i

i

i

r

n

n

unde:

i

2 - dispersii de grupă;

ni - volumul grupelor.

Dispersia dintre grupe , se calculează pe baza abaterilor mediilor de

grupă de la media colectivităţii totale şi măsoară gradul de influenţă a factorilor de grupare

asupra variaţiei caracteristicii studiate. Dispersia dintre grupe se calculează după relaţia:


yx

i i

i

r

i

i

r

y y n

n

2 2

2

1

1

( )

Dispersia totală ( ) 0

2 2 y se calculează ca o medie aritmetică ponderată a

pătratului abaterilor fiecărei variante de la media totală, folosind relaţia:

0

2 2

2

1

1

y

j j

j

m

j

j

m

y y f

f

( )

Dispersia totală reflectă variaţia caracteristicii dependente generată de acţiunea

conjugată a celor două grupe de factori - întâmplători şi esenţiali - la nivelul întregii

colectivităţi.

Pornind de la conţinutul dispersiilor prezentate dispersia totală mai poate fi calculată

pe baza relaţiei:

( ) 0

2 2 2 yx

yr

Această relaţie este cunoscută în literatura de specialitate sub denumirea de “regula

adunării dispersilor”.

Coeficientul de determinaţie ( )Ryx

2 se calculează ca raport între dispersia dintre

grupe şi dispersia totală după relaţia:

Ryx

yx2

2

0

2100

Dacă ( )Ryx

2 > 50% admitem că factorul de grupare este hotărâtor (semnificativ

determinant) pentru variaţia factorului determinant (yj).

În mod analog se determină coeficientul de nedeterminaţie după relaţia:

K yx

yr2

2

0

2100

Acest coeficient arată câte procente din variaţia factorului yj este rezultatul acţiunii

tuturor factorilor întâmplători (toţi ceilalţi cu excepţia factorului de grupare).

Menţionăm că în cazul seriilor statistice formate pe baza frecvenţelor relative, în

formulele de calcul ale dispersiilor prezentate se vor înlocui frecvenţele absolute cu

frecvenţele relative corespunzătoare. În acest caz este necesar să se cunoască atât structura

seriilor componente cât şi structura pe grupe a colectivităţii totale.

Vom ilustra modul de calcul şi semnificaţia acestor dispersii pe exemplul

distribuţiei bidimensionale prezentate în tabelul 2.

Capitolul 4 81

Repartiţia agenţilor economici din sectorul de activitate A

după numărul mediu de salariaţi şi profitul obţinut

Tabelul nr. 2

Agenţi

economici

după

numărul

mediu de

salariaţi

Agenţi economici după mărimea profitului

(mii RON)

Total

12 - 16 16 - 20 20 - 24 24 şi peste

sub 10 5 15 5 - 25

10 - 50 - 10 10 - 20

50 şi peste - - - 5 5

Total 5 25 15 5 50

Calculul dispersiilor este precedat de calculul mediilor:

mediile de grupă:

y

y f

fi

j ij

j

m

ij

j

m

1

1

y1

14 5 18 15 22 5

2518

mii RON /agent economic

y2

18 10 22 10

2020

mii RON/agent economic

y3

26 5

526

mii RON/agent economic

media totală:

economic/agentRON mii6,1950

52620202518

:sau

economic/agentRON mii6,1950

52615222518514

1

1

1

1

r

i

i

r

i

ii

m

j

j

m

j

jj

n

ny

y

f

fy

y

Dispersiile de grupă:


1

22 2 2

2

22 2

1

22

14 18 5 18 18 15 22 18 5

256 4

18 20 10 22 20 10

204

26 26 5

50

( ) ( ) ( ),

( ) ( )

( )

Media dispersiilor de grupă:

2

2

1

1

6 4 25 4 20 0 5

504 8

i

i

r

i

i

i

r

n

n

,,

Dispersia între grupe:

yx

i i

i

r

i

i

r

y y n

n

2

2

2

2

1

1

2 2 218 19 6 25 20 19 6 20 26 19 6 5

50

5 44

( )( , ) ( , ) ( , )

,

Din comparaţia celor două tipuri de dispersii ( ) 2 2si rezultă că la nivelul

sectorului de activitate intensitatea variaţiei cifrei de afaceri generată de acţiunea factorului de

grupare “număr de salariaţi” a fost mai mare decât cea generată de acţiunea celorlalţi factori

neînregistraţi.

Dispersia totală ( ) 0

2

0

22 2 2 2

0

2 2 2

14 19 6 5 18 19 6 25 22 19 6 15 26 19 6 5

5010 24

10 24 4 8 5 44

10 24 10 24

( , ) ( , ) ( , ) ( , ),

, , ,

, ,

Coeficientul de determinaţie Ryx

yx2

2

0

2100

5 44

10 24100 53 125% 50%

,

,,

evidenţiază că cea mai mare parte a variaţiei cifrei de afaceri (53,125%) este rezultatul

creşterii numărului mediu al salariaţilor, restul de 46,875% fiind rezultatul acţiunii simultane

a factorilor neluaţi în calcul.

Capitolul 4 83

2. Analiza ANOVA (testul Fisher - Snedecor)

Analiza dispersională poate fi realizată şi cu ajutorul testului Fisher, analiză

ANOVA, test ce pleacă de la ipotezele:

H0 : ryyy ...

21 (medii de grupă egale)

H1 : medii diferite

Pentru a se verifica dacă factorul de grupare are o influenţă semnificativă asupra

variabilei dependente se calculează indicatorii prezentaţi în tabelul 3.

Gradele de libertate reprezintă numărul total de valori independente minus relaţiile

care le leagă. Fie valorile x1, x2, …, xn, spunem că statistica 1

)(1

2

2

n

xx

S

n

i

i

este un

estimator nedeplasat al dispersiei cu n-1 grade de libertate. Valorile x1, x2, …, xn au intrat în

relaţia de calcul a mediei n

x

x

n

i

i 1 .

Tabelul nr. 3 ANOVA

Indicatori Formule de calcul Grade

de

liberta

te

Estimarea

dispersiilor

Criteriul F

Varianţa

sistematică

r

i

ii nyyS1

2

0 )(1

r-1

1

12

1

r

Ss

2

2

2

1

s

sFcalc

Varianţa

reziduală ij

r

i

m

j

ij fyyS 1 1

2)(2

n-r

rn

Ss

22

2

Varianţa

totală

21 SSS n-1

Valoarea Fcalc se compară cu valoarea teoretică Ft extrasă din tabel pentru nivelul de

semnificaţie ales şi (r-1) respectiv (n-r) grade de libertate. Regula de decizie este

următoarea:

dacă tcalc FF se admite ipoteza H0

dacă tcalc FF se respinge H0 şi admite H1, factorul de grupare este

semnificativ.


P( tcalc FF ) α

H0 Ft H1

Figura1. Distribuţia teoretică

Pentru exemplificare vom folosi datele din tabelul 2. Pentru nivelul de

semnificaţie = 0,05 ne propunem să verificăm dacă factorul de grupare este semnificativ,

altfel spus dacă numărul angajaţilor influenţează variaţia profitului.

Tabelul nr. 4

Agenţi

economici după nr.

mediu de salariaţi

Total

Profitul mediu pe

grupe de agenţi

economici

RON/ag.ec.

sub 10 25 18

10 - 50 20 20

peste 50 5 26

Total 50 19,6

Varianţa sistematică S1:

2725)6,1926(20)6,1920(25)6,1918(1 222 S

Varianţa reziduală S2:

2405)2626(10)2022(10)2018(

5)1822(15)1818(5)1814(2

222

222

S

Estimarea dispersiilor:

13613

2722

1

s şi 10,5350

2402

2

s

Criteriul F:

633,2610,5

136calcF

Valoarea calculată pentru criteriul calcF este 26,63 iar 05,0;47;2t

F este 3,23.

Capitolul 4 85

calcF > 05,0;47;2t

F ceea ce ne îndreptăţeşte să respingem ipoteza H0 şi acceptăm H1,

factorul de grupare, numărul angajaţilor, este semnificativ pentru variaţia profitului.

Coeficientul de determinaţie %50%125,53100512

272100

21

12

SS

SR

xy

evidenţiază că cea mai mare parte a variaţiei cifrei de afaceri (53,125%) este rezultatul

creşterii numărului mediu al salariaţilor, restul de 46,875% fiind rezultatul acţiunii simultane

a factorilor neluaţi în calcul.

3. Tesul χ2

Pentru a studia legătura dintre variabile, adesea se impune realizarea unei

distribuţii bidimensionale. În astfel de legături se lucrează cu o variabilă efect sau dependentă

y şi o variabilă cauză sau independentă x. Cele două variabile pot fi numerice (cantitative) sau

nenumerice (calitative), iar acestea la rândul lor pot fi nominale sau ordinale.

Atunci când dorim să analizăm distribuţia simultană a indivizilor statistici după două

sau mai multe caracteristici calitative, vorbim despre asociere, ceea ce înseamnă cum se

asociază, în cazul a două caracteristici, anumite stări ale unei caracteristici cu anumite stări ale

celeilalte. Baza acestei analize o constituie tabelul de asociere sau de contingenţă.

Problematica asocierii presupune efectuarea unor analize bivariate sau multivariate.


fost împărţite în funcţie de caracteristica x în p grupe, s-au obţinut distribuţiile condiţionate de

factorul de grupare.


indicatorii de variaţie corespunzători putem preciza dacă factorul de grupare x este un factor

hotărâtor (determinant) pentru variaţia factorului y.

Tabelul nr. 5 Tabel de contingenţă

Numărul unităţilor pe variantele caracteristicii Y

Volumul

grupelor

Valorile

caracteristicii de

grupare

X

y1 … yj … yq

x1 n11 ... n1j ... n1q n1.

... ... ... ... ... ...

xi ni1 ... nij ... niq ni.

... ... ... ... ... ...

xp np1 np2 npj npq np.

Total n.1 n.2 n.j n.q n


Frecvenţele nij reprezintă numărul unităţilor statistice purtătoare ale valorilor (X i,Yj).

Frecvenţele ni. reprezintă distribuţia marginală pentru caracteristica x:

;;...;... .

1

.

1

.1

1

1 p

q

j

pji

q

j

ij

q

j

j nnnnnn

Frecvenţele n.j reprezintă distribuţia marginală pentru caracteristica y:

;;...;... .

1

.

1

1.

1

1 q

p

i

iqj

p

i

ij

p

i

i nnnnnn

Cu ajutorul testului 2 se poate analiza dacă două variabile sunt dependente sau

independente, garantând rezultatele cu o probabilitate dinainte stabilită. Pentru a verifica acest

lucru pornim de la ipotezele:

H0: variabile independente – ipoteza nulă, cu alternativa

H1: variabile dependente.

Două variabile sunt independente dacă sunt îndeplinite condiţiile:

)()/()()/( 111111 yYPxXyYPşixXPyYxXP

Testul se poate aplica atât în cazul variabilelor dihotomice cât şi în cazul variabilelor

calitative cu mai multe modalităţi. Revenind la distribuţia din tabelul 5, condiţiile de

independenţă se rezumă la egalitatea rapoartelor:

n

n

n

nsau

n

n

n

n j

i

iji

j

ij .

.

.

.

Din aceste condiţii de independenţă se determină distribuţia teoretică (Expected) ijnt

astfel:

n

nnnt

ij

ij

..

Pentru a verifica dacă cele două variabile sunt independente se calculează mărimea 2

calc cu formula:

p

i

q

j ij

ijij

calcnt

ntn

1 1

2

2)(

Valoarea 2

calc se compară cu valoarea teoretică 2

t , extrasă din tabelul funcţiei

2 , pentru nivelul de semnificaţie ales şi )1()1( qp grade de libertate.

Dacă valoarea 2

calc 2

t , atunci, se respinge ipoteza H0 şi se admite alternativa ei H1,

variabilele sunt dependente.

Capitolul 4 87

P( tcalc22 ) α

H0 2

t H1

Figura 2. Distribuţia teoretică

Pentru a realiza o distribuţie bidimensională s-a luat în considerare un eşantion

format din 150 de persoane ce au răspuns unor întrebări dintr-un chestionar, printre care: dacă

au văzut reclama la un produs nou lansat pe piaţă şi dacă au cumpărat produsul respectiv.

Cu o probabilitate de 0,95 pentru care χ2

t = 3,84 să se verifice dacă cele două variabile

sunt independente.

Distribuţia persoanelor după răspunsurile la cele două întrebări.

Tabelul nr. 6

Aţi cumpărat produsul X ? Aţi văzut reclama la

produsul X ? Da Nu Total

Da 65 15 80

Nu 20 50 70

Total 85 65 150

Se calculează distribuţia teoretică astfel:

3,4585150

8011 n 7,3465

150

8012 n

7,3985150

7021 n 3,3065

150

7022 n

191,423,30

)3,3050(

7,39

)7,3920(

7,34

)7,3415(

3,45

)3,4565( 22222

calc

Valoarea 2

calc 2

t , se respinge ipoteza H0 şi se admite alternativa ei H1, variabilele

sunt dependente.


Rezumat

Colectivităţile cu care operăm în statistica social-economică deşi au un caracter finit

sunt formate de cele mai multe ori dintr-un număr foarte mare de unităţi purtătoare a unor

variabile cu un grad mare de variaţie. Din această cauză unităţile la care s-a făcut observarea

trebuie împărţite în grupe, în funcţie de variaţia factorilor determinanţi.

În cazul în care s-a aplicat în prealabil metoda grupării se pot calcula atât medii cât şi

indicatori de variaţie (dispersii) pe grupe şi pe total colectivitate. Media şi dispersia pe

întreaga colectivitate se pot calcula fie făcând abstracţie de faptul că ea este compusă din mai

multe grupe, fie luând în calcul indicatorii corespunzători calculaţi la nivelul grupelor.

Aşadar, între indicatorii de variaţie calculaţi la nivelul fiecărei grupe şi cei pe întreaga

colectivitate există anumite relaţii ce pot fi studiate aplicând regula adunării dispersiilor,

analiza ANOVA, testul χ2.

Termeni importanţi: media, dispersia, coeficientul de determinaţie, varianţa

sistematică, varianţa reziduală, testul de independenţă.


1. Care este rolul analizei dispersionale ?

2. Explicaţi ce măsoară fiecare dispersie în parte.

3. Care este rolul analizei ANOVA ?

4. Explicaţi ce măsoară fiecare varianţă în parte.

5. Care este rolul testului χ2 ?

6. Ce înseamnă distribuţia teoretică ?

Probleme propuse

1. Angajaţii unor unităţi hoteliere au fost distribuiţi după categoria hotelului şi salar

astfel:

Grupe după salarii

( RON)

Hotelul * Hotelul **

Sub 550

550-570

570-590

590-610

610-630

630-650

650-670

670 şi peste

10

12

25

28

15

10

-

-

-

-

20

35

20

15

10

-

100% 100%

Ştiind că volumul colectivităţii este 50 angajaţi, din care 20 la Hotel * şi 30 la Hotel **

se cere:

a. Gradul de omogenitate pe hoteluri după caracteristica salar.

Capitolul 4 89

b. Aplicând regula de adunare a dispersiilor să se precizeze în ce proporţie categoria

hotelului influenţează salariile angajaţilor.

c. Ştiind că Ft = 3,23 se cere să se precizeze în ce proporţie categoria hotelului

influenţează salariile angajaţilor aplicând analiza ANOVA.

2. Distribuţia unităţilor comerciale după suprafaţa comercială şi valoarea încasărilor

este:

Grupe de unit.

după supraf.

Valoarea încasărilor (mii RON)

15-25

25-35

35-45

45-55

mari

mijlocii

mici

-

-

4

-

10

5

7

9

-

9

6

-

a. Să se analizeze omogenitatea seriei de distribuţie corespunzătoare

caracteristicii valoarea încasărilor.

b. Să se calculeze indicatorii variaţiei pentru distribuţia bidimensională

interpretând acţiunea factorilor.

c. să se reprezinte diagrama circulară pentru caracteristica suprafaţa comercială.

3. Despre 400 de salariaţi se cunosc datele:

Subgrupe după salarii (RON)

Total

Grupe după

vechime (ani) 500 - 600 600 - 700 peste 700

sub 5 - 25% 75% 100%

5 - 10 15% 50% 35% 100%

peste 10 90% 10% - 100%

- grupa sub 5 ani deţine o pondere de 25% din total;

- grupa 5 – 10 ani deţine o pondere de 40% din total;

- grupa peste 10 ani deţine o pondere de 35% din total.

Se cere:

a. Aplicând regula de adunare a dispersiilor, să se analizeze acţiunea factorilor

asupra salariilor.

b. Pentru caracteristica vechime în muncă să se determine modulul şi coeficientul

de asimetrie .

4. 150 de personae au fost distribuite după răspunsurile la întrebările unui chestionar

astfel:


Veţi cumpăra produsul X ? Aţi văzut reclama la

produsul X ? Da Nu Nu ştiu Total

Da 47 10 23 80

Nu 18 32 20 70

Total 65 42 43 150

Cu o probabilitate de 0,95 şi 1 grad de libertate pentru care χ2

t = 3,84 să se verifice

dacă cele două variabile sunt independente.

5. Distribuţia turiştilor străini după vârstă şi frecvenţa de vizitare a Braşovului rezultată

dintr-o cercetare pe bază de sondaj a fost:

Vârsta (ani) Frecvenţa de

vizitare a

Braşovului sub 25 26-35 36-45 46-55 56-65 peste 66

Prima oară 7 8 6 7 6 6

A doua oară 5 7 6 6 5 5

A treia oară 8 8 9 10 6 6

A patra oară şi

peste

6 7 8 9 6 5

a. Formulaţi ipotezele statistice.

b. Cu o probabilitate de 0,95 şi 15 grade de libertate pentru care χ2

t,15 = 25 să se

verifice dacă frecvenţa de vizitare a Braşovului depinde de vârstă..

6. Un sondaj de piaţă asupra unui eşantion de 2000 persoane, a stabilit că produsul

alimentar X a pătruns în consumul populaţiei după cum urmează:

Grupe de vârstă

Forma de

consum sub 20 ani

20-35

36-50

peste 50

consum curent

consum ocaz.

215

183

293

192

347

231

265

274

Folosind testul χ2, să se stabilească existenţa sau nonexistenţa legăturii dintre cele

două variabile. Pentru nivelul de semnificaţie α=0,10 şi 3 grade de libertate χ2t = 6,25.

Capitolul 5 91

Capitolul 5

Tema Regresie şi corelaţie

Obiectivele 1. Tipuri de legături între fenomenele social-economice

2. Regresia şi corelaţia liniară

2.1 Calculul coeficienţilor de regresie

2.2 Măsurarea intensităţii corelaţiei

2.3 Semnificaţia estimaţiilor. Intervale de încredere

2.4 Analiza reziduurilor

3. Regresia neliniară

3.1 Tipuri de legături neliniare

3.2 Raportul de corelaţie neliniară

4. Regresia multiplă

5. Metode neparametrice de măsurare a legăturilor dintre fenomene

5.1 Tabelul de asociere şi coeficientul de asociere

5.2 Coeficienţii de corelaţie a rangurilor

Mijloace





lupă)


Finalitatea 1. estimarea coeficienţilor modelelor de regresie

2. interpretarea semnificaţiei modelului ales

3. efectuarea de comparaţii între modele


Timp de lucru

necesar



Regresie şi corelaţie 92

Regresie şi corelaţie

1. Tipuri de legături între fenomenele social-economice

Formele de manifestare ale relaţiilor de interdependenţă sunt extrem de

variate şi adesea destul de greu de sesizat. Pentru a le studia este necesar să fie clasificate în

funcţie de unele criterii, după care se pot deosebi unele de altele.

După natura relaţiei de cauzalitate legăturile dintre fenomene pot fi:

- legături funcţionale, realizate direct între un fenomen - cauză şi un fenomen -

efect. Fenomenul efect depinde de o singură cauză, care poate fi identificată de

câte ori se produce. Rezultă că dacă condiţiile rămân constante, atunci unei valori a

caracteristicii factoriale îi corespunde o singură valoare a caracteristicii rezultative.

Ele se mai numesc şi legături de tip determinist. Relaţia matematică dintre

fenomenul - efect şi fenomenul - cauză, pentru legăturile de tip funcţional este:

y f xi i ( ) ;

- legăturil statistice (stochastice) sunt cele în care fenomenul - efect este rezultatul

combinării influenţei mai multor cauze, care pot acţiona în condiţii egale sau în

condiţii diferite. În această relaţie de multicauzalitate unii factori au caracter

esenţial, alţii întâmplător. Cu cât relaţiile de cauzalitate sunt mai numeroase, cu

atât gradul de variabilitate al fenomenului - efect este mai mare. În astfel de cazuri,

la fiecare valoare a caracteristicii factoriale îi poate corespunde o distribuţie de

valori a caracteristicii rezultative. Relaţia matematică ce exprimă o legătură de tip

stochastic (statistic) este: y f x x xi n ( , ,..., )1 2 în care x x xn1 2, ,..., sunt

caracteristicile - factori care au fost înregistrate şi determină variaţia caracteristicii

rezultative y. Specific legăturilor statistice este faptul că în variaţia unei

caracteristici rezultative există întotdeauna şi o componentă aleatoare, care

apare ca rezultat al interacţiunii dintre factorii esenţiali şi cei întâmplători şi care

poate fi inclusă între cei n factori sau poate fi explicitată în afara lor.

După numărul caracteristicilor - factori luate în studiu, legăturile statistice pot fi:

- legături simple - sunt acelea în care caracteristica rezultativă se studiază numai în

funcţie de o singură caracteristică independentă considerată principală şi variabilă,

iar celelalte caracteristici - factoriale, chiar dacă au fost identificate şi înregistrate,

se consideră cu acţiune constantă în toate cazurile individuale înregistrate.

- legături multiple - presupun să se studieze dependenţa unei caracteristici

rezultative în funcţie de mai mulţi factori înregistraţi. Interpretarea statistică a

legăturilor multiple implică şi analiza legăturilor simple dintre toate caracteristicile

înregistrate pentru calculul corelaţiei multiple.

După conţinutul caracteristicilor incluse în analiza de corelaţie , legăturile pot fi:

- asocierea statistică - exprimă relaţia de interdependenţă dintre două sau mai multe

caracteristici exprimate calitativ sau între o caracteristică calitativă şi una

Capitolul 5 93

numerică. De exemplu, între aptitudini şi profesia aleasă există o legătură de tip

stochastic, sau între gradul de îndemânare şi productivitatea muncii.

- corelaţia statistică - exprimă relaţia de interdependenţă dintre două sau mai multe

caracteristici exprimate numeric şi se poate măsura prin indicatori statistici de

corelaţie.

După direcţia în care se produc, legăturile pot fi:

- directe sau în acelaşi sens se produc atunci când, pe măsură ce se modifică nivelul

de dezvoltare al caracteristicii factoriale, se modifică în acelaşi sens şi nivelul

caracteristicii rezultative.

- inverse sunt acelea în care, pe măsură ce se modifică nivelul de dezvoltare al

caracteristicii factoriale, se modifică în sens contrar nivelul caracteristicii

rezultative.

După forma legăturii, ele pot fi:

- rectiliniare, exprimate prin ecuaţia funcţiei liniei drepte

- curbiliniare, exprimate prin ecuaţia unei funcţii exponenţiale, parabolice,

hiperbolice etc.

După timpul în care se realizează, legăturile statistice pot fi: concomitente

(sincrone) şi cu decalaj (asincrone).

Problemele care trebuie rezolvate în aplicarea metodelor de analiză a corelaţiilor

statistice pot fi sintetizate astfel:

identificarea şi ierarhizarea factorilor care determină în mod obiectiv

variaţia caracteristicii rezultative;

verificarea gradului de cuprindere a unităţilor înregistrate. Dacă

unităţile observate provin dintr-o cercetare parţială de tip selectiv

trebuie ca la interpretarea rezultatelor să se ţină seama de principiile

teoriei probabilităţilor;

sistematizarea datelor observate, astfel încât să nu se modifice gradul şi

forma de variaţie a caracteristicilor la care se aplică metoda corelaţiei;

verificarea existenţei şi formei de legătură dintre caracteristicile

corelate, în vederea alegerii corecte a procedeelor statistice -

matematice de măsurare a dependenţei statistice;

calcularea adecvată a indicatorilor de corelaţie în funcţie de forma de

legătură şi de natura informaţiei de care se dispune;

aplicarea testelor de semnificaţie a indicatorilor de corelaţie pentru

cazul în care ei provin dintr-un sondaj statistic.

2. Regresia şi corelaţia liniară simplă

Pentru a evidenţia legea care se manifestă în fiecare legătură în parte, pentru a

măsura statistic tendinţa sa de manifestare se folosesc ecuaţiile de estimare corespunzătoare

unei funcţii analitice care exprimă forma de legătură dintre caracteristica factorială şi cea

rezultativă. Această funcţie este cunoscută sub denumirea de funcţie de regresie, iar

reprezentarea ei grafică se face prin linia (curba) de regresie.


2.1 Calculul coeficienţilor de regresie

În cazul dependenţei liniare, funcţia de regresie este o dreaptă de forma:

xY

Necunoscând parametrii teoretici şi , vom căuta estimaţiile lor a şi b. Dreapta de

regresie estimatoare este:

bxay ˆ

Ecuaţia de regresie y se notează, de obicei ca medie, deoarece mărimea sa exprimă

tendinţa de realizare a corelaţiei dintre cele două variabile x şi y. Dacă, într-adevăr, legătura

este liniară şi factorul este determinant, atunci valorile ecuaţiilor de regresie, calculate pentru

toate unităţile observate pe baza valorii individuale ale variabilei x, trebuie să prezinte abateri

minime faţă de valorile empirice. Pentru măsurarea tendinţei de realizare a legăturii, în ecuaţia

mediei de regresie liniară cei doi parametri au şi ei conţinut de valori medii şi trebuie să fie

reprezentativi pentru cele mai multe din unităţile observate.

Parametrul a are caracter de mărime medie, în sensul că valoarea sa arată la ce nivel

ar fi ajuns valoarea caracteristicii y dacă toţi factorii - mai puţin cel înregistrat - ar fi avut o

acţiune constantă asupra formării ei. În acest caz valorile individuale ale caracteristicii

rezultative ar fi fost egale între ele şi, deci, egale cu media lor.

Parametrul b se mai numeşte şi coeficient de regresie şi exprimă, în sens geometric,

panta liniei drepte. Coeficientul de regresie b arată care este gradul de influenţă a

caracteristicii aleasă drept caracteristică factorială x şi măsoară cu cât se schimbă în medie

variabila y în cazul în care variabila x creşte cu o unitate. Coeficientul de regresie arată nu

numai gradul de influenţă a factorului x asupra variabilei y, ci şi sensul în care se realizează

legătura.

În cazul în care :

- b > 0, atunci legătura de corelaţie este directă, deoarece pe măsură ce cresc

valorile lui x, cresc şi valorile ecuaţiei de regresie calculate.

- b < 0, legătura este de sens invers, adică pe măsură ce creşte valoarea

caracteristicii - factor, scade valoarea caracteristicii rezultative.

- b = 0, cele două variabile sunt independente între ele şi atunci ay ˆ .

Aceasta înseamnă că variabila y nu este în funcţie de variabila x, care s-a

considerat ca factor de influenţă, ci variaţia ei depinde de ceilalţi factori,

care s-au considerat ca fiind cu acţiune constantă pentru toate unităţile

colectivităţii, dar în realitate avem o acţiune determinantă.

Pentru a determina ecuaţia medie de regresie, şi cu ajutorul ei, valorile ecuaţiei

individuale de regresie corespunzătoare tuturor valorilor variabilei x, este necesar să se

calculeze valorile celor doi parametri a şi b.

Dacă factorul x este determinant pentru variabila y, atunci valorile estimate prin

funcţia de regresie trebuie să dea abateri minime faţă de cele înregistrate pentru variabila

rezultativă. Cum aceste abateri se pot produce într-un sens sau altul, ele sunt ridicate la pătrat

şi, din această cauză, metoda de verificare a acestei condiţii se mai numeşte şi metoda celor

mai mici pătrate.

Cu alte cuvinte, dacă y depinde de x, atunci trebuie să se îndeplinească condiţia ca

suma pătratelor abaterilor valorilor empirice de la valorile ecuaţiilor lor de regresie să fie

minimă:

Capitolul 5 95

n

i yyS1i

2 minim)ˆ(

Pentru tendinţa liniară această ecuaţie este:

n

i

ii bxay1

2 minim)]([

Pentru aflarea celor doi parametri care definesc ecuaţia liniei drepte se derivează

această sumă în raport cu derivatele celor doi parametri:

n

i

ii

n

i

ii

xbxayb

s

bxaya

s

1

1

))](([2

)1)](([2

Anulând derivatele parţiale şi simplificând cu 2 se obţine:

n

i

ii

n

i

i

n

i

i

n

i

i

n

i

i

yxxbxa

yxbna

11

2

1

11

Coeficienţii a şi b se obţin cu formulele:

a

y x

x y x

n x

x x

y x x y x

n x x

i i

i i i

i

i i

i i i i i

i i

2

2

2

2 2( )

b

n y

x x y

n x

x x

n x y x y

n x x

i

i i i

i

i i

i i i i

i i

2

2 2( )

Cu valorile a şi b se calculează valoarea ecuaţiei de regresie pentru fiecare valoare a

caracteristicii x. Aceste valori ale ecuaţiilor de regresie se mai numesc şi valorile teoretice ale

caracteristicii y în funcţie de x, iar operaţia de înlocuire a termenilor reali y cu valorile

ecuaţiilor de regresie (valori teoretice) se numeşte ajustare.

Prin ajustarea unei serii statistice de distribuţie se înţelege înlocuirea termenilor

empirici (termeni reali obţinuţi prin observare) cu termeni teoretici, calculaţi pe baza unui

model matematic, care arată tendinţa de variaţie a caracteristicii rezultative, dacă ar fi depins

numai de variaţia lui x considerat.

2.2 Măsurarea intensităţii corelaţiei

Linia de regresie este utilă numai dacă intensitatea corelaţiei este suficient de mare.


Coeficientul de corelaţie

Pentru măsurarea intensităţii corelaţiei se poate folosi indicatorul numit coeficient

de corelaţie.

Coeficientul de corelaţie măsoară intensitatea legăturii numai în cazul regresiei

liniare. Estimaţia r a coeficientului teoretic de corelaţie este dată de formula:

yx

n

i

ii

n

yyxx

r

1

))((

care prin dezvoltare devine:

n

i

n

i

n

i

n

i

iiii

n

i

n

i

n

i

iiii

yynxxn

yxyxn

r

1 1 1 1

2222

1 1 1

)([])([

Coeficientul de corelaţie poate lua valori în intervalul –1 şi +1, după cum corelaţia

este negativă, inversă sau pozitivă, directă. Cu cât coeficientul de corelaţie ia valori mai

apropiate de 1 sau –1 cu atât legătura liniară este mai intensă, apropiindu-se de legătura

funcţională. Dacă cele două variabile sunt independente, atunci coeficientul de corelaţie este

egal cu zero.

Raportul de corelaţie liniară simplă

Raportul de corelaţie liniară este indicatorul care permite măsurarea gradului de

intensitate a realizării legăturii dintre caracteristica considerată factor de influenţă şi

caracteristica rezultativă, după ce s-a aplicat metoda regresiei. Calculul său se bazează pe

descompunerea dispersiei totale a caracteristicii y pe factori de influenţă.

2

2

2

2

2

2

)(

)ˆ(

)(

)ˆ(

yy

yy

n

yy

n

yy

Ri

i

i

i

y

xy

xy

sau:

2

2

2

2

2

2

)(

)ˆ(1

)(

)ˆ(

11yy

yy

n

yy

n

yy

Ri

ii

i

ii

y

ry

xy

Raportul de corelaţie poate lua valori de la 0 la +1. În ceea ce priveşte semnul

raportului de corelaţie, acesta se va determina după semnul “b“ din ecuaţia de regresie. Dacă

“b“ este pozitiv, Ryx

va fi luat cu sens pozitiv; dacă “b“ este negativ, atunci Ryx

se va lua

cu semnul minus, iar dacă “b“ este egal cu zero trebuie ca şi Ryx

să fie egal cu zero.

Gradul de intensitate a corelaţiei dintre fenomene se va obţine stabilind greutatea

specifică a dispersiei formată pe baza factorului înregistrat faţă de dispersia totală. Acest

Capitolul 5 97

indicator se numeşte coeficient de determinaţie, se notează cu Ryx

2

şi se calculează după

formula:

Ryx

yx

y

2

2

2

În mod analog se calculează şi coeficientul de nedeterminaţie ( )Kyx

2 ca raport între

dispersia faţă de linia de regresie şi dispersia totală:

K yr

yr

y

2

2

2

2.3 Semnificaţia estimaţiilor. Intervale de încredere

Într-o problemă dată dispunem doar de valori calculate ale estimatorilor a şi b

(coeficienţii liniei de regresie) şi r (coeficientul de corelaţie); valorile pot fi semnificativ

diferite faţă de zero sau numai întâmplător1.

Se pune problema verificării semnificaţiei acestor estimaţii, mai ales în cazul

selecţiilor de volum mic, ceea ce presupune calculul erorilor standard ale celor doi coeficienţi.

Pentru a verifica semnificaţia coeficienţilor liniei empirice de regresie, bxay ˆ ,

trebuie să calculăm erorile standard ale celor doi coeficienţi:

22

)ˆ(1 1 1

2

1

2

ˆ

n

yxbyay

n

yy

S

n

i

n

i

n

i

iiii

n

i

ii

yy

2

1

2

ˆ

)(

1

n

i

i

yya

xx

x

nSS

şi

n

i

i

yy

b

xx

SS

1

2

ˆ

)(

Cunoscând erorile standard Sa şi Sb putem aplica criteriul t definit prin mărimile:

a

cS

at

0 şi respectiv

b

cS

bt

0

care urmează repartiţia Student cu 2 nf grade de libertate. Intervalele de încredere ale

coeficienţilor liniei teoretice de regresie, xY sunt date de relaţiile:

aqaq StaSta

bqbq StbStb

1 Resa I., Petrescu Şt., Precupaş M., Câra Al., Probleme de statistică rezolvate pe calculator, Ed. Facla, 1984


unde qt este valoarea variabilei t corespunzătoare nivelului de semnificaţie q şi numărului

gradelor de libertate 2 nf .

Verificarea semnificaţiei coeficientului de corelaţie r se poate face folosind criteriul t,

mai ales când n este mic, prin mărimea:

21

2

r

nrtc

care urmează legea Student cu 2 nf grade de libertate. Limitele de încredere pentru

coeficientul de corelaţie teoretic sunt:

rq Str şi rq Str

unde 1

1 2

n

rS r este eroarea standard iar qt este valoarea variabilei t corespunzătoare

nivelului de semnificaţie q şi numărului gradelor de libertate 1 nf .

2.4 Analiza reziduurilor

Analiza reziduurilor permite verificarea semnificaţiei modelului atât din punct de

vedere al datelor la nivel global, cât şi la nivel individual.

La nivel global, se examinează graficul valorilor ii ex , pentru a controla ipotezele

stabilite la nivelul reziduurilor. La nivel individual, se examinează dacă observaţia este bine

reconstituită de model şi se măsoară influenţa sa asupra construirii dreptei celor mai mici

pătrate.

Analiza grafică

graficul (a) corespunde situaţiei unui model adecvat tipului de legătură;

graficul (b) sugerează că ar fi mai potrivit modelul în care valorile lui Y să fie

înlocuite cu log(Y) sau Y ;

graficul (c) sugerează utilizarea modelului 2cxbxaY .

Măsurarea reziduurilor

Se poate demonstra că eroarea observată ie este o realizare a unei variabile aleatoare

ce urmează o lege normală N(0, ih1 ). Cu cât o observaţie contribuie mai mult la

construirea dreptei de regresie, cu atât varianţa erorii corespunzătoare este mai scăzută.

Pentru a măsura importanţa erorii iii yye se utilizează indicii:

Capitolul 5 99

reziduuri studentizate definite prin i

ii

h

et

1. Se poate spune că observaţia i

nu este bine reconstituită de model dacă valoarea ti este foarte mare în mărime

absolută.

RSTUDENT definit prin i

ii

hi

et

1)(ˆ

*

Referitor la valoarea încasărilor (milioane lei) şi cheltuielile publicitare (sute

mii lei) efectuate de o societate comercială în decursul a cinci luni s -au înregistrat datele:

Tabelul nr. 1 Analiza legăturii dintre cheltuielile publicitare şivaloarea încasărilor

Nr.

crt.

Cheltuieli

publicitare

(sute mii lei)

ix

Valoarea

încasărilor

(mil. lei)

iy

2

ix

ii yx

2

iy

xy i 310ˆ

1

2

3

4

5

5

6

9

12

18

25

30

35

45

65

25

36

81

144

324

125

180

315

540

1170

625

900

1225

2025

4225

25

28

37

46

64

Total

5

1

50i

ix

5

1

200i

iy

5

1

2 610i

ix

5

1

2330i

ii yx

5

1

2 9000i

iy

5

1

200ˆi

iy

Se cere:

a) să se caracterizeze şi să se măsoare legătura dintre variabile;

b) să se testeze semnificaţia coeficienţilor pentru un nivel de semnificaţie 05,0 .

Sistemul de ecuaţii normale devine:

233061050

200505

ba

ba

Din rezolvarea sistemului rezultă coeficienţii: 10a şi 3b .

Coeficientul de regresie b fiind pozitiv ne arată existenţa unei legături directe între

cele două variabile şi anume, pe măsură ce cheltuielile publicitare cresc cu o sută mii lei,

valoarea încasărilor creşte cu trei milioane lei.

Coeficientul de corelaţie:

995,0])200(90005[])50(6105[

2005023305

22

r

arată că între cele două caracteristici există o legătură puternică.

Testarea semnificaţiei coeficienţilor pentru nivelul de semnificaţie de 0,05 şi 5-2 grade

de libertate, pentru care valoarea tabelară a variabilei t este 2,353, conduce la rezultatele:

1741,0bS 23,171741,0

30

b

cS

bt


Se observă că valoarea variabilei t calculată este mai mare decât valoarea teoretică

17,23 > 2,353 ceea ce ne îndreptăţeşte să tragem concluzia că acest coeficient de regresie este

semnificativ diferit de zero. Intervalul de încredere pentru coeficientul este:

1741,0353,231741,0353,23

4,359,2

Testarea termenului liber:

9228,1aS 20,59228,1

100

a

cS

at

Se observă că valoarea variabilei t calculată este mai mare decât valoarea teoretică

5,20 > 2,353 ceea ce ne îndreptăţeşte să tragem concluzia că termenul liber este semnificativ

diferit de zero. Intervalul de încredere pentru coeficientul este:

9228,1353,2109228,1353,210

52,1447,5

Testarea coeficientului de corelaţie:

005,0rS 23,1725995,01

995,0

2

ct

Desprindem concluzia că şi coeficientul de corelaţie este semnificativ diferit de zero

qc tt , în care 13,2qt şi corespunde nivelului de semnificaţie 0,05 şi 5-1 grade de

libertate. Intervalul de încredere pentru coeficientul va fi:

005,013,2995,0005,013,2995,0

1984,0

3. Regresia neliniară

În practica statistică se întâlnesc şi legături care nu sunt de formă liniară. În acest caz

se pot întâlni forme variate de legături curbilinii specifice relaţiilor de dependenţă dintre

caracteristica factorială aleasă şi cea rezultativă.

3.1 Tipuri de legături neliniare

Aceste legături neliniare se întâlnesc mai frecvent sub forma unei parabole de

gradul 2, a hiperbolei şi a funcţiei exponenţiale.

Dacă pe grafic se apreciază că legătura statistică este de forma unei parabole de gradul

2, atunci ecuaţia medie de estimare este: 2ˆ cxbxay

Punând aceeaşi condiţie, ca suma pătratelor abaterilor termenilor seriei de la valorile

teoretice să fie minimă, se obţine:

n

i

iii cxbxay1

22 min))((

Capitolul 5 101

iar sistemul de ecuaţii normale:

n

i

ii

n

i

i

n

i

i

n

i

i

n

i

ii

n

i

i

n

i

i

n

i

i

n

i

n

i

n

i

iii

yxxcxbxa

yxxcxbxa

yxcxbna

1

2

1

4

1

3

1

2

11

2

1

2

1

1 1 1

2

Rezolvând sistemul de ecuaţii normale prin metoda determinanţilor se calculează

valoarea celor trei parametri şi, în funcţie de valoarea individuală a lui x, se ajustează valorile

caracteristicii rezultative.

Când pe grafic se constată o corelaţie de forma unei hiperbole trebuie să se aplice

metoda celor mai mici pătrate în care ecuaţia de estimare este de forma:

bx

ay1

ˆ

Sistemul de ecuaţii necesar aflării parametrilor funcţiei este:

n

i

n

i

i

ii

n

i i

n

i

i

n

i i

yxx

bx

a

yx

bna

1 12

1

11

111

1

Apar şi cazuri când legătura dintre cele două variabile este de formă exponenţială ca

de exemplu: x

bay ˆ

Sistemul de ecuaţii normale se determină folosind logaritmii celor doi parametri "a" şi

"b":

bxay loglogˆlog

S-a ajuns la o ecuaţie de estimare de forma unei linii drepte calculată nu pe baza

valorilor empirice ci a logaritmilor lor.

Sistemul de ecuaţii normale va fi cel de la corelaţia liniară simplă, în care valorile

celor doi parametri vor fi înlocuite cu valorile logaritmilor lor, iar valorile caracteristicii

rezultative y cu valorile logaritmilor acestora:

n

i

ii

n

i

i

n

i

i

n

i

i

n

i

i

yxxbxa

yxban

11

2

1

11

logloglog

logloglog

Operaţia de ajustare în acest caz se va face după ce se vor calcula logaritmii ecuaţiilor

individuale de regresie. Ajustarea după o funcţie exponenţială se face prin antilogaritmarea

ecuaţiilor de regresie calculate în funcţie de x i.


3.2 Raportul de corelaţie neliniară

Pentru corelaţia neliniară măsurarea gradului de intensitate a legăturii se face numai

prin raportul de corelaţie:

pentru legătura sub forma unei parabole de gradul 2:

2

22

2

2)(

1ˆ

1yy

cxbxay

yy

yyR

i

iii

i

ii

xy

pentru legătura sub formă de hiperbolă:

2

2

2

2 )1

(

1ˆ

1yy

bx

ay

yy

yyR

i

i

i

i

ii

xy

pentru legătura sub forma unei funcţii exponenţiale:

2

2

2

2

1ˆ

1yy

aby

yy

yyR

i

x

i

i

ii

xy

i

În zece unităţi comerciale s-au cules date cu privire la valoarea vânzărilor de

tricotaje şi nivelul relativ al cheltuielilor de circulaţie.

Tabelul nr. 2 Analiza legăturilor neliniare

Valoarea vânzărilor

(mii RON)

Nivelul relativ al

cheltuielilor de circulaţie

(%)

x y

5,1

5,5

6,0

6,5

6,7

7,0

7,0

8,5

11,0

13,0

8

7,2

6,8

6,4

6

5,6

5

4,6

4,2

4,2

Capitolul 5 103

VINZARI

141210864

CHEL

T

9

8

7

6

5

4

Fig ura 1. Graficul legăturii dintre cheltuieli şi vânzări

Graficul sugerează o legătură inversă între cele două variabile. Pentru a putea face

comparaţie între modelul liniar şi modelul hiperbolic au fost selectate ambele metode de

analiză, obţinându-se rezultatele:

Dependent variable.. CHELT Method.. LINEAR

Multiple R ,85395

Analysis of Variance:

DF Sum of Squares Mean Square

Regression 1 11,259261 11,259261

Residuals 8 4,180739 ,522592

F = 21,54502 Signif F = ,0017

-------------------- Variables in the Equation --------------------

Variable B SE B Beta T Sig T

VINZARI -,442581 ,095350 -,853948 -4,642 ,0017

(Constant) 9,176893 ,762589 12,034 ,0000

Dependent variable.. CHELT Method.. INVERSE

Multiple R ,95148

Analysis of Variance:

DF Sum of Squares Mean Square


Regression 1 13,978011 13,978011

Residuals 8 1,461989 ,182749

F = 76,48762 Signif F = ,0000

-------------------- Variables in the Equation --------------------

Variable B SE B Beta T Sig T

VINZARI 33,109280 3,785769 ,951479 8,746 ,0000

(Constant) 1,102268 ,553896 1,990 ,0818

CHELT

VINZARI

141210864

9

8

7

6

5

4

3

Observed

Linear

Inverse

Fig ura 2. Valorile observate comparate cu liniile de regresie

Modelul liniar a condus la funcţia xy 442,0176,9ˆ (coficientul b fiind negativ

arată legătură inversă între cele două variabile), raportul de corelaţie R de 0,8539 indică o

legătură puternică iar valoarea F = 21,54 pentru care nivelul de semnificaţie este 0,0017 (mai

mic decât 0,05 ales pentru testarea modelului) arată că modelul este semnificativ.

18,42

ie .

Modelul hiperbolic a condus la funcţia x

y1

1,331,1ˆ , raportul de corelaţie R este

0,9514, valoarea F = 76,48 pentru care nivelul de semnificaţie este 0,0000. 46,12

ie . Din

aceste rezultate deducem că modelul hiperbolic estimează mai bine legătura dintre cele două

variabile.

Capitolul 5 105

4. Regresia multiplă

În cazul fenomenelor de masă se consideră variabila dependentă sau

rezultativă ca fiind o funcţie de mai multe variabile: y f x x xi n 1 2, , ..., , în care variabilele xi

sunt caracteristicile factoriale care determină într-o măsură mai mare sau mai mică variaţia

caracteristicii rezultative y.

Dacă legătura dintre fiecare factor şi variabila rezultativă este de formă liniară, atunci

ecuaţia de estimare va fi:

kkxxx xaxaxaayn

...ˆ22110,...,, 21

în care:

a0 - reprezintă parametrul care exprimă factorii neînregistraţi, consideraţi cu acţiune

constantă, în afara celor consideraţi drept caracteristici factoriale;

a1,a2, ... ,ak - coeficienţii de regresie care arată cât se modifică variabila rezultativă

dacă variabila factorială respectivă se modifică cu o unitate;

x1,x2, ... ,xk - caracteristicile factoriale incluse în raportul de interdependenţă.

Spre exemlificare se va utiliza o corelaţie multiplă în care se vor lua numai două

caracteristici factoriale şi una rezultativă. Având două caracteristici factoriale ecuaţia funcţiei

de regresie liniară multiplă va fi:

2211021ˆ xaxaay xx

al cărei sistem de ecuaţii normale este:

yxxaxxaxa

yxxxaxaxa

yxaxana

2

2

2221120

1212

2

1110

22110

Cunoscând cei trei parametri ai funcţiei de ajustare se calculează pentru fiecare unitate

ecuaţia de regresie pe baza valorilor x1,x2, iar pentru verificarea calculului se aplică relaţia

21

ˆxxii yy .

Unele regresii multiple neliniare pot fi transformate în regresii liniare:

care prin logaritmare devine:

Raportul corelaţiei multiple

Pentru măsurarea gradului de intensitate a corelaţiei se foloseşte şi aici raportul de

corelaţie:

x ...... x x a = y ak

a2

a10

k21 ˆ

xa + ...... + xa + a =y kk110 loglogloglog


2

1

2

...

...,

21

21

ˆ1

yy

yyR k

k

xxxi

xxxy

În cazul corelaţiei liniare, raportul de corelaţie multiplă se transformă în coeficient de

corelaţie multiplă.

Coeficientul de corelaţie multiplă poate fi dedus din coeficienţii de corelaţie simplă.

După cum se ştie, în cazul corelaţiei liniare simple, raportul de corelaţie este egal cu

coeficientul de corelaţie R ryx

yx

.

În cazul corelaţiei multiple, raportul de corelaţie liniară sintetizează toate legăturile

liniare simple. Dacă factorii sunt independenţi între ei, atunci raportul de determinaţie

multiplă este egal cu suma rapoartelor de determinaţie simplă. De exemplu, pentru doi factori

există relaţia:

R R Ryx x

yx

yx1 2 1 2

2 2 2

,

Dacă legătura este liniară, atunci se substituie R cu r şi se obţine:

R r ryx x

yx

yx1 2 1 2

2 2 2

,

De unde raportul de corelaţie este:

R r ryx x

yx

yx1 2 1 2

2 2

,

De regulă însă, în cadrul fenomenelor social-economice factorii sunt interdependenţi

între ei şi, de aceea, apare necesitatea luării în considerare a influenţei r ecriproce a factorilor.

Dacă factorii sunt interdependenţi, atunci rx x1 20, şi această influenţă, regăsindu-se

în valoarea coeficientului de corelaţie multiplă, trebuie să fie eliminată.

Raportul de corelaţie liniară multiplă se calculează atunci folosindu-se coeficienţii de

corelaţie simplă, sub forma:

R

r r r r r

ry

x x

yx

yx

yx

yx

x x

x x1 2

1 1 2

1 2

1 2

2

2

2

2

2

1,

Această formulă de calcul se foloseşte, în special, atunci când au fost deja analizate

corelaţiile simple, şi pe baza lor, se trece la măsurarea gradului de intensitate a corelaţiei

multiple. De asemenea, se foloseşte şi pentru verificarea liniarităţii funcţiei de estimare.

Testarea modelului global se face cu statistica:

2

2

1

1

R

R

k

knFcalc

în care k reprezintă numărul variabilelor explicative

Capitolul 5 107

Valoarea calculată cu această formulă se compară cu valoarea tabelară

corespunzătoare nivelului de semnificaţie ales şi gradelor de libertate f1 = k ; f2 = n-k-1. Dacă

Fcalc este mai mare decât Fteoretic se consideră că variabilele X1,X2, ... ,Xk au o influenţă

semnificativă asupra caracteristicii rezultative Y.

Se cunosc datele:

Indicii veniturilor reale Indicii înzestrării opulaţiei

ale populaţiei

% cu maşini electrice de spălat % Vânzările totale de detergenţi

cu baza fixă cu baza fixă (mii tone)

X1 X2 Y

100 100 540

112 110 620

115 119 750

124 129 790

128 136 862

130 147 900

134 150 950

135 156 960

Se cere:

1. să se studieze legătura dintre vânzările totale de detergenţi şi indicii veniturilor reale;

2. să se studieze legătura dintre vânzările totale de detergenţi şi indicii înzestrării

populaţiei cu maşini de spălat;

3. Y în funcţie de X1 şi X2.

Rezolvare

1 .

y = 12.3x - 707.19

0

200

400

600

800

1000

1200

0 20 40 60 80 100 120 140 160

venituri reale %

van

zari

det

erg

enti

mii

to

ne

SUMMARY OUTPUT

Regression Statistics

Multiple R 0.98

R Square 0.96

Standard Error 30.72

Observations 8


ANOVA

df SS MS F Significance F

Regression 1 158782.545 158782.5 168.218 1.29E-05

Residual 6 5663.454 943.9

Total 7 164446

Coefficients Standard Error t Stat P-value Lower 95% Upper 95%

Intercept -707.19 116.44 -6.07 0.000905 -992.12 -422.2

X Variable 1 12.3 0.948 12.96 1.29E-05 9.97 14.62

2 .

y = 7.5319x - 189.24

0

200

400

600

800

1000

1200

0 50 100 150 200

Inzeatrarea cu masini de spalat %

vanz

ari d

e de

terg

enti

mii

tone

SUMMARY OUTPUT


Multiple R 0.99

R Square 0.97


Observations 8

ANOVA

df SS MS F

Significance

F

Regression 1 159801.15 159801.2 206.4238 7.1179E-06

Residual 6 4644.85 774.14

Total 7 164446

Coefficients

Standard

Error t Stat P-value Lower 95% Upper 95%

Intercept -189.24 69.31 -2.73 0.03 -358.84 -19.64

X Variable 1 7.53 0.52 14.37 0.00 6.25 8.81

Capitolul 5 109

3 .

SUMMARY OUTPUT


Multiple R 0.99

R Square 0.98


Observations 8

ANOVA

df SS MS F

Significance

F

Regression 2 161022.15 80511.07 117.57 6.255E-05

Residual 5 3423.85 684.77

Total 7 164446

Coefficients

Standard

Error t Stat P-value Lower 95% Upper 95%

Intercept -422.17 186.22 -2.27 0.07 -900.85 56.52

X Variable 1 5.29 3.96 1.34 0.24 -4.89 15.47

X Variable 2 4.37 2.42 1.81 0.13 -1.84 10.59

Cum interpretaţi rezultatele de la punctele 1,2,3 ?

5. Metode neparametrice de măsurare a legăturilor dintre fenomene

După cum s-a arătat în paragrafele precedente, metodele analitice de calcul al

corelaţiilor se utilizează în cazul în care există posibilitatea de a se determina forma de

manifestare a legăturii, verificată pentru un număr suficient de date care tind să se distribuie

normal sau asimptotic normal.

Există, însă, numeroase cazuri când distribuţia caracteristicilor nu este normală şi nici

nu există informaţii despre parametrii funcţiilor studiate. În aceste situaţii nu se mai pot

întrebuinţa formulele indicatorilor analitici de corelaţie, ci trebuie să se folosească alte metode

pentru a putea determina existenţa, direcţia şi intensitatea anumitor legături ce se stabilesc

între două sau mai multe caracteristici. Aceste metode trebuie să elimine ipoteza privind tipul

curbei de distribuţie şi, în consecinţă, să dea posibilitatea unor estimări la cele mai variate

tipuri de distribuţie.

Metodele prin care se rezolvă aceste probleme sunt cunoscute sub denumirea de

metode neparametrice. Aceste metode, pe lângă faptul că pot stabili intensitatea unei legături

făcând abstracţie de tipul de distribuţie, permit, de asemenea, măsurarea intensităţii legăturilor

nu numai pentru caracteristicile cantitative, dar şi pentru caracteristicile calitative, deoarece în

cazul metodelor neparametrice nu se lucrează cu valorile caracteristicilor, ci cu anumite

simboluri sau cu un număr de ordine numit rang.

Dintre metodele neparametrice folosite cel mai frecvent sunt: coeficientul de asociere

şi coeficienţii de corelaţie a rangurilor a lui Spearman şi Kendall.


5.1 Tabelul de asociere şi coeficientul de asociere

Una din metodele cele mai simple ale corelaţiei neparametrice o costituie coeficientul

de asociere calculat pe baza tabelului de asociere, care permite - de altfel ca şi celelalte

metode neparametrice - analiza nu numai a caracteristicilor exprimate numeric dar şi a

caracteristicilor calitative. Această metodă se utilizează în special, când unităţile purtătoare

ale caracteristicilor sunt separate în două grupe sau sunt de forma unor caracteristici

alternative (de tipul "da - nu").

Tabelul de asociere este format din două rânduri şi două coloane, de forma:

y

x

y1 y2 Total

x1 a b a+b

x2 c d c+d

Total a+c b+d a+b+c+d

Produsul ad arată gradul de realizare a legăturii directe dintre x şi y, iar produsul bc

gradul de legătură inversă între aceste două caracteristici cercetate.

Pentru stabilirea valorii numerice a coeficientului de asociere, care să indice existenţa

şi intensitatea unei legături, formula cea mai utilizată este cea propusă de Yule:

Qad bc

ad bc

Este evident că în această situaţie apar cazurile:

Ca orice coeficient de corelaţie şi acest indicator poate să ia valori între -1 şi +1,

arătând nu numai gradul de intensitate al asocierii celor două caracteristici, dar şi sensul ei.

Inconvenientul acestei formule este faptul că, în cazul asociaţiei complete, nu se disting cele

patru variante prezentate anterior. De aceea, în acest caz, trebuie făcută menţiunea respectivă

în funcţie de modul de asociere a caracteristicilor în tabelul de asociaţie.

Acest coeficient prezintă avantajul că se poate calcula cu multă rapiditate şi se poate

folosi şi în cazul când datele provin de la unităţile statistice complexe care, în interiorul lor,

Capitolul 5 111

pot prezenta forme diferite de distribuţie, dar pot fi transformate în variabile alternative, ca de

exemplu sub şi peste nivelul mediu.

5.2 Coeficienţii de corelaţie a rangurilor

După cum s-a arătat, coeficienţii de corelaţie a rangurilor prezintă avantajul că ei pot fi

utilizaţi şi în cazul unor distribuţii asimetrice, în cazul unui număr restrâns de unităţi pentru

care nu se poate verifica reprezentativitatea datelor parţiale sau în cazul distribuţiilor unor

unităţi complexe.

Analiza de corelaţie, în acest caz, se bazează pe înlocuirea valorilor empirice cu

rangurile corespunzătoare, ceea ce face posibilă comparaţia dintre variabilele supuse

interdependenţei statistice.

Această metodă neparametrică mai prezintă avantajul că poate cuprinde în analiza

raporturilor de dependenţă dintre fenomene şi caracteristici calitative, care, prin natura lor nu

se pot exprima numeric, dar pot fi "ierarhizate" pe baza unui anumit rang.

Pornind de la ipoteza că între cele două serii de ranguri există concordanţă, seria a

doua care reprezintă rangurile caracteristicii rezultative ar trebui să se ordoneze şi ea tot

crescător, dacă legătura este directă, şi descrescător în raport cu prima serie de ranguri, dacă

legătura este inversă. În cazul existenţei legăturii dintre cele două caracteristici, la aceeaşi

unitate observată trebuie să corespundă acelaşi număr de unităţi care au rang mai mare sau

mai mic decât ele. În cazul lipsei de legătură între caracteristicile studiate, ordinea de

distribuţie a rangurilor celor două caracteristici este diferită.

În mod corespunzător se pot cuprinde în anliză şi distribuţiile paralele ale mai multor

caracteristici, cu care se pot realiza mai multe combinaţii, stabilind coeficienţii de corelaţie a

rangurilor simpli, parţiali şi multipli, urmărind astfel atât procesul complex de formare a

indicatorilor sintetici, cât şi interacţiunea dintre factori.

Cele mai frecvente formule de calcul ale coeficientului de corelaţie a rangurilor sunt

cele ale lui Spearman şi Kendall.

Coeficientul de corelaţie a rangurilor a lui Spearman este o aplicaţie a coeficientului

de corelaţie liniară simplă la distribuţiile celor două şiruri de ranguri.

În cazul corelaţiei rangurilor, cele două serii de valori variabile sunt înlocuite cu două

şiruri de ranguri de la 1 la n, ale căror medii şi dispersii sunt legate între ele. Ţinând seama de

faptul că cele două şiruri de ranguri formează câte o progresie aritmetică 1, 2, 3, ..., n,

înseamnă că:

x yn

1

2

iar:

x x y y nn2 2

2 1

12

Înlocuind în formula coeficientului de corelaţie liniară se obţine formula de calcul a

coeficientului de corelaţie a rangurilor lui Spearman:

rd

n ns

i

1

6 2

3

în care:

d - reprezintă diferenţa de rang între caracteristicile corelate;

n - numărul de unităţi cercetate.

Coeficientul de corelaţie a rangurilor al lui Kendall se calculează după formula:


rS

n nk

2

1( ) în care

i i

ii QPS

Pentru rangurile lui y se calculează:

Pi – numărul rangurilor mai mari decât rangul analizat de la acel rang până la sfârşitul

şirului;

Qi - numărul rangurilor mai mici decât rangul analizat de la acel rang până la sfârşitul

şirului.

Coeficientul lui Kendall al corelaţiei rangurilor poate lua valori de la -1 la +1,

indicând, în felul acesta, nu numai gradul de intensitate a legăturii dar şi direcţia ei.

Este de remarcat faptul că, de obicei, coeficientul de corelaţie a rangurilor după

formula lui Kendall este mai mic decât cel al lui Spearman.

Se cunosc date referitoare la numărul locurilor din unităţile de cazare turistică

pe ţări, precum şi densitatea turistică obţinută prin raportarea numărului turiştilor străini sosiţi

în anul 2004 la suprafaţa ţărilor analizate. Se cere să se caracterizeze legătura dintre cele două

variabile aplicând metoda rangurilor.

Tabelul nr. 3 Metoda rangurilor

Număr

locuri

Ranguri pentru

număr locuri

Rx

Densitatea

turistică

Ranguri pentru

densitatea turistică

Ry

România 275941 4 5701 3

Bulgaria 190040 3 15278 4

Turcia 418177 5 22396 5

Ucraina 50414 2 26 1

Georgia 19316 1 872 2

iRx iRy 22 )( iii RyRxd iP iQ

1 2 1 3 1

2 1 1 3 0

3 4 1 1 1

4 3 1 1 0

5 5 0 0 0

i

id 42 i

iP 8 i

iQ 2

Coeficientul Spearman 8,0)15(5

461

2

Valoarea coeficientului indică legătură directă şi puternică între numărul locurilor din

unităţile de cazare şi densitatea turistică.

Coeficientul Kendall 6,0)15(5

)28(2

Capitolul 5 113

Rezumat

În analiza statistică a raporturilor de dependenţă dintre fenomene, problema care se

pune este aceea a măsurării relaţiei care există între două sau mai multe caracteristici cuprinse

în programul unei cercetări concrete a fenomenelor social-economice de masă. Aceasta

presupune, în primul rând, să se constate dacă între caracteristica X - denumită caracteristica

factorială sau independentă - şi caracteristica Y - caracteristica rezultativă sau dependentă -

există sau nu un raport de dependenţă şi în al doilea rând, dacă această relaţie există, să se

exprime printr-un indicator simplu sau sintetic de corelaţie, măsura în care caracteristica

factorială X contribuie la formarea caracteristicii rezultative Y sub aspectul naturii, direcţiei şi

formei de legătură dintre ele.

Termeni importanţi: regresia liniara, coeficient de regresie, raport de corelaţie,

coeficient de determinaţie, regresia neliniară, regresia multiplă


1. Enumeraţi tipurile de legături dintre fenomenele economice.

2. Ce semnificaţie are coeficientul regresiei liniare ?

3. Ce rol are testarea semnificaţiei coeficienţilor funcţiei de regresie ?

4. Cum interpretăm coeficientul de determinaţie ?

5. În ce situaţii aplicăm regresia neparametrică ?

Probleme propuse

1. Vânzările de mărfuri şi suprafaţa comercială pentru 10 unităţi economice care aparţin

aceleiaşi societăţi comerciale se caracterizează prin datele:

Nr. crt. al

unităţii

Vânzări

de mărfuri

- mii RON -

Suprafaţa

comercială

- 2m -

1 52 400

2 60 385

3 74 620

4 20 155

5 25 210

6 34 220

7 49 230

8 38 215

9 45 320

10 12 70


a) să se caracterizeze şi să se măsoare legătura dintre vânzările de mărfuri

şi suprafaţa comercială folosind metodele parametrice –funcţia liniară;

b) să se reprezinte grafic legătura dintre cele două variabile statistice şi să

se stabilească existenţa şi forma legăturii;

c) să se calculeze coeficientul de corelaţie, coeficientul de determinaţie şi

raportul de corelaţie;

d) să se caracterizeze şi să se măsoare legătura dintre vânzările de mărfuri

şi suprafaţa comercială folosind metodele neparametrice.

2. Despre zece familii se cunosc următoarele date referitoare la veniturile medii lunare şi

cheltuielile cu alimentaţia:

Nr.

crt

Venituri medii

lunare

- RON -

Cheltuieli cu

alimentaţia

- RON -

1 720 320

2 990 380

3 850 400

4 1180 550

5 1920 620

6 1090 410

7 1340 540

8 1250 590

9 1150 600

10 1610 630

Să se caracterizeze şi să se măsoare legătura dintre cele două variabile folosind:

a) graficul de corelaţie;

b) metoda regresiei.

3. La 10 unităţi comerciale s-au înregistrat datele:

Vânzări

(mii RON)

30 59 40 50 20 52 41 10 62 60

Profit

(mii RON)

2,2 3 2 2,5 1,8 2,6 2,3 1,9 3,6 4

Se cere:

1. Să se caracterizeze legătura dintre cele două variabile utilizând metoda grafică;

2. Să se măsoare intensitatea legăturii dintre cele două variabile, utilizând metode

parametrice şi neparametrice;

3. Să se determine ce nivel ar atinge profitul dacă valoarea vânzărilor ar fi de 45 mii

RON.

Capitolul 6 115

Capitolul 6

Tema Analiza seriilor cronologice

Obiectivele 1. Noţiuni, particularităţi

2. Indicatorii statistici utilizaţi în prelucrarea seriilor cronologice

2.1 Indicatori absoluţi

2.2 Indicatori relativi

2.3 Indicatori medii

3. Ajustarea seriilor cronologice

3.1 Ajustarea pe baza mediilor mobile

3.2 Ajustarea prin sporul mediu

3.3 Ajustarea pe baza indicelui mediu de dinamică

3.4 Ajustarea prin metoda celor mai mici pătrate

4. Analiza sezonalităţii

Mijloace





lupă)


Finalitatea 1. analiza evoluţiei fenomenelor în timp pe baza indicatorilor specifici

2. alegerea modelelor de analiză a trendului

3. analiza fenomenelor cu componenta sezonieră


Timp de lucru

necesar



Analiza seriilor cronologice 116

Analiza seriilor cronologice

1. Noţiuni, particularităţi

Una din sarcinile statisticii este aceea de a studia fenomenele şi procesele

social-economice de masă de-a lungul diferitelor perioade de timp sub aspectul evoluţiei

volumului acestora şi al schimbărilor intervenite în structura lor, a interdependenţelor dintre

fenomene de natură diferită etc.

Seria cronologică este formată din două şiruri de date paralele, în care

primul şir arată variaţia caracteristicii de timp, iar cel de-al doilea şir variaţia

fenomenului sau caracteristicii cercetate, de la o unitate de timp la alta. Seriile

cronologice se mai numesc şi serii de timp sau serii ale dinamicii.

Proprietăţile seriilor cronologice:

- variabilitatea termenilor unei serii cronologice provine din faptul că fiecare

termen se obţine prin centralizarea unor date individuale diferite ca nivel de

dezvoltare.

- omogenitatea termenilor trebuie înţeleasă în sensul că în aceeaşi serie nu pot fi

înscrise decât fenomene de acelaşi gen, care sunt rezultatul acţiunii aceloraşi cauze

esenţiale.

- periodicitatea termenilor din care este formată seria, ceea ce înseamnă de fapt

asigurarea continuităţii datelor din punct de vedere a variabilei de timp şi care

poate da posibilitatea interpretării seriei cronologice ca o funcţie analitică (y i=

f(ti)). Variabila de timp poate fi înregistrată cu periodicităţi diferite. De aceea,

alegerea unităţii de timp la care se referă datele unei serii cronologice trebuie

făcută în raport cu scopul cercetării, al conţinutului şi posibilităţilor de măsurare a

fiecărui indicator.

- interdependenţa termenilor unei serii cronologice apare ca urmare a respectării

principiului unităţii de timp şi spaţiu şi structurii organizatorice. Ca atare,

indicatorii prezenţi sunt valori succesive ale aceloraşi fenomene înregistrate la

nivelul aceleiaşi unităţi teritorial administrative sau orice unitate statistică

complexă care poate fi înregistrată autonom. Aceasta face ca valoarea fiecărui

indicator să depindă într-o oarecare măsură de valoarea indicatorului precedent, ca

urmare a faptului că relaţiile de cauzalitate se manifestă în condiţii asemănătoare

de la o unitate de timp la alta.

Luând în considerare toate aceste particularităţi, analiza statistică a seriilor cronologice

trebuie să se bazeze pe un sistem de indicatori, care să caracterizeze multiplele relaţii

cantitative din interiorul seriei şi pe toată perioada la care se referă datele. Ca atare,

problemele care se pun şi trebuie rezolvate la analiza seriilor cronologice sunt:

- alegerea lungimii seriei şi elaborarea ei astfel încât, pe cât posibil,

să îndeplinească condiţia legii numerelor mari, adică să aibă un

Capitolul 6 117

număr suficient de date pentru orizontul de analiză statistică cu care

să se fundamenteze corect prognozele de lungă şi scurtă durată;

- calculul şi analiza unui sistem de indicatori statistici absoluţi,

relativi şi medii necesari caracterizării seriei;

- identificarea trendului (tendinţei) de evoluţie a fenomenelor din

cadrul seriei prin utilizarea metodelor de ajustare statistică şi

testelor de verificare a ipotezelor privind forma obiectivă de

evoluţie pe perioada luată în calcul;

- calculul şi analiza sezonalităţii şi a altor forme de evoluţie cu

caracter ciclic;

- interpolarea şi extrapolarea seriilor cronologice potrivit scopului

cercetării statistice.

În prezentarea dinamică a fenomenelor se pot întâlni mai multe feluri de serii.

Clasificarea seriilor cronologice se face în funcţie de modul de exprimare a indicatorilor şi

după modul de exprimare a timpului la care se referă datele.

În funcţie de modul de exprimare a indicatorilor din care este formată seria, seriile

cronologice pot fi:

- serii cronologice formate din indicatori absoluţi - reprezintă forma de bază a

seriilor dinamice. Pe baza lor se pot obţine indicatorii generalizatori pe întreaga

perioadă;

- serii cronologice formate din indicatori relativi - constituie un mod de

prezentare de regulă procentual. În această situaţie este obligatoriu ca în titlu sau în

afara tabelului să se specifice care este baza de raportare, pentru ca interpretarea

datelor să se facă corect;

- serii cronologice formate din indicatori medii - se folosesc ca mijloc de

prezentare a evoluţiei unor caracteristici calitative ce apar sub formă de categorii

medii.

Seriile cronologice se pot clasifica în funcţie de timpul la care se referă datele în:

- serii cronologice de intervale (perioade) de timp - denumite şi serii de fluxuri,

sunt seriile statistice în care fiecare indicator reprezintă rezultatul unui proces

social-economic pe fiecare perioadă de timp folosită în prezentarea datelor. Astfel

de serii se pot întâlni în prezentarea evoluţiei producţiei, a cifrei de afaceri, a

mărimii investiţiilor, a profitului realizat, a creditului acordat şi/sau rambursat etc.

Ele se întocmesc pentru indicatori însumabili pe o anumită perioadă de timp, care

determină periodicitatea cu care se prezintă termenii seriei. Termenii seriei de

intervale pot fi cumulaţi obţinându-se un indicator totalizator pe întreaga serie sau

pe subperioade;

- serii cronologice de momente(sau de stocuri) - sunt acelea în care fiecare

indicator caracterizează mărimea la care a ajuns caracteristica urmărită sau

volumul colectivităţii în momentul de calcul. De exemplu, populaţia României, la

1 iulie a fiecărui an; valoarea capitalului fix al întreprinderii x la sfârşitul anului;

valoarea capitalului investit în industrie la sfârşitul fiecărui trimestru sau an;

numărul depunătorilor şi depozitelor la sfârşitul fiecărei luni etc. Pentru seria de

momente este caracteristic faptul că termenii ei nu se pot cumula în vederea

obţinerii unui indicator statistic totalizator cu conţinut real pe întreaga perioadă,

deoarece seria de momente cuprinde înregistrări repetate. De exemplu, o parte din

mărfurile de la 1 I se pot găsi şi în stocurile de la 1 II, 1 III etc .


2. Indicatorii statistici utilizaţi în prelucrarea seriilor cronologice

Seriile cronologice se pot caracteriza statistic cu ajutorul unui sistem de

indicatori absoluţi, relativi şi medii. Ei se pot calcula pentru seriile care prezintă continuitate

în ceea ce priveşte variabila de timp, dar prezintă anumite particularităţi pentru seriile de

fluxuri şi cele de stocuri.

În grupa indicatorilor absoluţi ai unei serii cronologice includem:

nivelurile absolute ale termenilor seriei;

nivelul totalizat al acestor termeni;

modificări absolute (creşteri sau descreşteri absolute).

Indicatorii relativi, care caracterizează o serie cronologică sunt:

indicii de dinamică;

ritmul de creştere (scădere);

valoarea absolută a unui procent de creştere (scădere).

Indicatorii medii, rezultaţi din prelucrarea unei serii cronologice sunt:

nivelul mediu al unei serii cronologice;

modificarea medie absolută;

indicele mediu al dinamicii;

ritmul mediu de creştere (descreştere).

2.1 Indicatori absoluţi

Indicatorii absoluţi ai unei serii cronologice se exprimă în unităţile concrete de măsură

ale fenomenului studiat.

Indicatorii de nivel ai seriei – sunt valorile înregistrate ntyt ,1,

Nivelul totalizat al acestor termeni ( pentru seria de flux) - y t

t

n

1

Modificarea absolută (sporul), notat cu - arată cu cât s-a modificat

nivelul caracteristicii în perioada curentă faţă de perioada aleasă ca bază de comparaţie.

cu bază fixă:

11

yytt nt ,2

unde:

ty - nivelul caracteristicii la momentul t;

1y - nivelul caracteristicii la momentul 1, ales bază de comparaţie

cu baza în lanţ:

11

tt yyt

t nt ,2

unde:

Capitolul 6 119

ty - nivelul caracteristicii la momentul t

y t 1 - nivelul caracteristicii la momentul t-1

Proprietate: 1

2

1/1

yyn

n

t

ttn

2.2 Indicatori relativi

Indicele de dinamică – este mărimea relativă care arată de câte ori s-a

modificat un fenomen în timp.

cu bază fixă:

1001

1

y

yI t

t nt ,2

cu baza în lanţ:

1001

1

t

t

y

yI

tt nt ,2

Proprietate:

t

ttn II

11

Ritmul de creştere/scădere – arată cu câte procente s-a modificat

nivelul caracteristicii în perioada curentă faţă de perioada aleasă ca bază de comparaţie.

cu bază fixă:

100(%)11

tt IR nt ,2

cu baza în lanţ:

100(%)11

t

tt

t IR nt ,2

Valoarea absolută a unui procent - exprimă câte unităţi, din sporul

înregistrat revin la fiecare procent din ritmul creşterii sau descreşterii.

cu bază fixă:

1

1

1t

t

t

RV

a

nt ,2

cu bază în lanţ:


1

1

1

tt

tt

tt

RVa nt ,2

2.3 Indicatori medii

Nivelul mediu al termenilor dintr-o serie cronologică. Calculul acestui indicator se

justifică numai dacă termenii seriilor cronologice sunt omogeni, adică în orizontul de timp

analizat aceşti termeni nu prezintă oscilaţii foarte ample. Se calculează:

pentru serii cronologice de intervale (termenii fiind însumabili), se calculează ca o

medie aritmetică simplă:

n

Y

Y

n

tt

1

pentru serii cronologice de momente (de stoc):

- ca o medie cronologică simplă (dacă momentele sunt echidistante):

1

2....

22

13221

n

yyyyyy

Y

nn

CR

- ca o medie cronologică ponderată (dacă momentele sunt inegal distanţate):

121

11

232

121

...

2....

22

n

nnn

CR

ttt

tyy

tyy

tyy

Y

unde:

t1, t2, … tn-1reprezintă lungimea în unităţi de timp dintre două momente

succesive.

Modificarea medie absolută

11

11

n

yy

n

ntt

Indicele mediu de creştere/scădere

1

1

11

nn

n

y

yII

tt

Ritmul mediu de creştere/scădere:

100(%) IR

Capitolul 6 121

Se cunosc datele referitoare la exportul de încălţăminte (modelul A) realizat de

o societate în perioada 2001 – 2005. În scop didactic s-a folosit o serie scurtă, formată numai

din cinci termeni şi doar pentru calculul sistemului de indicatori absoluţi, relativi şi medii.

Tabelul nr.1 Exportul de încălţăminte (modelul A)

Anii Mii perechi

2001 265

2002 269

2003 275

2004 279

2005 282

Seria analizată este formată din n = 5 termeni. Mărimea lor constituie însăşi

indicatorii de nivel ai seriei. Însumând indicatorii de nivel obţinem nivelul totalizat al

termenilor.

Tabelul nr. 2. Calculul indicatorilor absoluţi

Anii

Export

(mii perechi)

Modificări absolute +/- (mii perechi)

yt cu baza fixă

t/1

cu baza în lanţ

t/t-1

2001 265 (y1) - -

2002 269 (y2) 4 4

2003 275 (y3) 10 6

2004 279 (y4) 14 4

2005 282 (y5) 17 3

Total yt

t

1

5

1370 -

175

2

1/

t

tt

Tabelul nr. 3. Calculul indicatorilor relativi

Export

(mii

perechi)

Indicii de dinamică

(%)

Ritmul de creştere

(%)

Valoarea absolută a

1% din creştere

cu bază

fixă

cu bază în

lanţ

cu bază

fixă

cu bază în

lanţ

cu bază

fixă

cu bază în

lanţ

Anii

yt It/1 It/t-1 Rt/1 Rt/t-1 Vat/1 Vat/t-1

2001 265 100,00 - - - - -

2002 269 101,51 101,51 1,51 1,51 2,65 2,65

2003 275 103,77 102,23 3,77 2,23 2,65 2,69

2004 279 105,28 101,45 5,28 1,45 2,65 2,75

2005 282 106,42 101,08 6,42 1,08 2,65 2,79


Folosind împreună indicatorii absoluţi şi relativi se desprind următoarele concluzii în

legătură cu evoluţia exportului:

- exportul a crescut uşor de la un an la altul, cea mai mare creştere ( cu 6 mii

perechi) înregistrându-se în 2003 / 2002 iar cea mai mică (cu 3 mii perechi) în

2005 / 2004;

- exportul a crescut cu 6,42% în anul 2005 faţă de anul 2001.

Indicatorii medii

Nivelul mediu. Dat fiind faptul că termenii unei serii cronologice de intervale de timp

se pot cumula determinându-se nivelul totalizat al caracteristicii pe întreaga perioadă

yt

t

n

1

pentru calculul nivelului mediu vom folosi formula mediei aritmetice simple

(intervalele fiind egale între ele), adică:

y

y

n

t

t

n

1 y

1370

5274 mii perechi /an

În perioada 2001 - 2005 exportul mediu anual reprezintă 274 mii perechi cu o

variaţie cuprinsă între 265 şi 282 mii perechi.

Modificarea medie absolută anuală

t

t

n

1

1

25,44

17

4

3464

mii perechi/anual

Exportul creşte în medie cu 4,25 mii perechi/an.

Indicele mediu de dinamică

0157.10108,1045,10223,10151,14 I sau 101,57%

În perioada 2001-2005 exportul a crescut în medie la 101,57%.

Ritmul mediu de creştere (descreştere)

R I

R

100 100

1 0157 100 100 1 57%, ,

Exportul a crescut între anii 2001-2005 cu un ritm mediu anual de 1,57%.

Capitolul 6 123

3. Ajustarea seriilor cronologice

Evoluţia oricărui fenomen în timp este rezultanta unor influenţe de natură

sistematică şi a altora de tip aleator.

Componentele sistematice sunt:

trendul (tendinţa generală) care se caracterizează prin variaţii de o anumită

consecvenţă privind sensul modificării pe durate relativ lungi (10 - 15 ani);

sezonalitatea se manifestă sub formă de oscilaţii la intervale mai mici de un

an (semestru, trimestru, lună, decadă);

ciclicitatea care se prezintă sub formă de fluctuaţii în jurul tendinţei

înregistrate la perioade mai mari de un an.

Fluctuaţiile ciclice pot fi cauzate de: conjunctura pieţii externe, de factori biologici (în

agricultură), de factori psihologici (moda).

Componentele aleatoare se manifestă sub forma unor abateri întâmplătoare de la ceea

ce are sistematic evoluţia variabilei analizate. Ele sunt rezultatul erorilor de observare sau a

necunoaşterii în totalitate a factorilor sistematici.

Statistica, prin metodele sale specifice trebuie să studieze care este tendinţa de

dezvoltare a fenomenului studiat şi prin ajustare, să se separe influenţa factorilor esenţiali cu

acţiune sistematică, de acţiunea factorilor accidentali, care face ca între termenii empirici şi

cei teoretici să existe abateri.

În teoria şi practica statistică se folosesc mai frecvent următoarele metode şi procedee

de ajustare:

ajustarea pe baza mediilor mobile;

ajustarea pe baza modificării medie absolute;

ajustarea pe baza indicelui mediu de dinamică;

ajustarea prin metode analitice de calcul bazate pe procedeul celor mai mici

pătrate.

3.1 Ajustarea pe baza mediilor mobile

Acest procedeu de ajustare se foloseşte, în special, acolo unde variaţia termenilor unei

serii cronologice prezintă un aspect de regularitate ciclică. Prin calcularea mediilor mobile se

înlătură această variaţie ciclică şi se prezintă seria de date cu o variaţie lină, contin uă.

Mediile mobile sunt medii parţiale, calculate dintr-un număr prestabilit de termeni, în

care se înlocuieşte pe rând primul termen cu termenul ce urmează în seria care trebuie să fie

ajustată.

În practică putem calcula medii mobile dintr-un număr impar de termeni sau/şi dintr-

un număr par de termeni.

Spre exemplificare, vom folosi o serie formată din 8 termeni care urmează să fie

ajustaţi prin procedeul mediilor mobile calculate din trei termeni.

Mediile mobile vor fi:

Yy y y

11 2 3

3

; Y

y y y4

4 5 6

3

;

Yy y y

22 3 4

3

; Y

y y y5

5 6 7

3

;

Yy y y

33 4 5

3

; Y

y y y6

6 7 8

3

;


Ajustarea în acest caz se face după următorul model:

Valori

empirice

(yt) y1 y2 y3 y4 y5 y6 y7 y8

Valori

ajustate Yt - Y1 Y2 Y3 Y4 Y5 Y6 -

În acest caz fiecare medie mobilă se va plasa în dreptul unui termen ce corespunde cu

poziţia termenului central, numărul acestora fiind egal cu: n-(n’-1)

unde:

n reprezintă numărul termenilor seriei ce urmează a fi ajustată.

n’ - numărul termenilor din care se calculează media mobilă.

În cazul considerat: n - (n’ - 1) = 8 - (3 - 1) = 6 medii mobile.

În cel de al doilea caz, când ajustarea se face pe baza mediilor mobile calculate dintr-

un număr par de termeni, mediile mobile se obţin în două trepte:

1) medii mobile provizorii yt care se plasează între termenii seriei;

2) medii mobile definitive sau centrate yt , care se plasează în dreptul termenilor

seriei şi cu care se face ajustarea termenilor seriei iniţiale.

Reluând acelaşi exemplu pentru seria formată din 8 termeni se pot calcula 5 medii

mobile provizorii:

Yy y y y

11 2 3 4

4

; Y

y y y y4

4 5 6 7

3

;

Yy y y y

22 3 4 5

4

; Y

y y y y5

5 6 7 8

4

;

Yy y y y

33 4 5 6

4

;

Pe baza acestora , în etapa a doua se pot calcula medii mobile definitive ca o medie

aritmetică simplă a celor provizorii luate câte două:

YY Y

11 2

2

; Y

Y Y2

2 3

2

; Y

Y Y3

3 4

2

; Y

Y Y4

4 5

2

;

Ajustarea termenilor se face după următorul model:

Valori

empirice

(yt)

y1 y2 y3 y4 y5 y6 y7 y8

Mediile

mobile

provizorii

yt

Y1 Y2 Y3 Y4 Y5

Mediile

mobile

definitive

yt

Y1 Y2 Y3 Y4

Capitolul 6 125

Se observă că se vor calcula n - (n’ - 1) = 8 - (4 - 1) = 5 medii mobile provizorii şi n -

n’ = 8 - 4 = 4 medii mobile definitive.

În ambele situaţii se pierd informaţii despre unii termeni de la începutul şi sfârşitul

seriei ceea ce poate fi considerat un inconvenient al procedeului.

3.2 Ajustarea prin sporul mediu

Ajustarea prin acest procedeu se foloseşte atunci când prelucrând seria de date, se

obţin sporuri individuale cu bază în lanţ apropiate ca valoare unele de altele. Aceasta

corespunde unei creşteri a nivelurilor caracteristicii studiate sub forma unei progresii

aritmetice cu raţia egală cu modificarea medie absolută şi se bazează pe relaţia care există

între primul termen, modificările absolute cu bază în lanţ şi ultimul termen:

trendul ajustat )1(ˆ 1 tyyt nt ,1

Exemplificăm pe baza datelor din tabelul 1.

Tabelul nr. 4 Ajustare cu spor mediu

Ani Export t Ajustare cu spor mediu

2001 265 1 265

2002 269 2 265 + 4,25 = 269,25

2003 275 3 269,25 + 4,25 = 273,5

2004 279 4 273,5 + 4,25 = 277,75

2005 282 5 277,75 + 4,25 = 282

255

260

265

270

275

280

285

2001 2002 2003 2004 2005

mii

pere

ch

i

Valori observate Valori ajustate cu spor mediu

Figura 1. Ajustare cu sporul mediu

Reprezentând pe acelaşi grafic şi valorile reale şi cele ajustate în funcţie de timp se

poate urmări măsura în care procedeul ales corespunde sau nu tendinţei obiective de

dezvoltare a fenomenului studiat.


3.3 Ajustarea pe baza indicelui mediu de dinamică

Acest procedeu se foloseşte atunci când termenii seriei au tendinţa de creştere de

forma unei progresii geometrice, în care raţia poate fi considerată ca egală cu indicele mediu

de dinamică I .

ajustarea pentru estimarea trendului )1(

1ˆ

t

t Iyy nt ,1

Pentru exemplul din tabelul 1 indicele mediu de evoluţie a fost 1, 015666.

Tabelul nr. 5 Ajustare cu indicele mediu

Ani Export t Ajustare cu indicele mediu

2001 265 1 265

2002 269 2 265 x 1,015666 = 269.1514

2003 275 3 269.1514 x 1,015666 = 273.3679

2004 279 4 273.3679 x 1,015666 = 277.6504

2005 282 5 277.6504 x 1,015666 = 282

255

260

265

270

275

280

285

2001 2002 2003 2004 2005

mii p

erec

hi

Valori observate Valori ajustate cu indicele mediu

Figura 2. Ajustare cu indicele mediu

3.4 Ajustarea prin metoda celor mai mici pătrate

În vederea eliminării neajunsurilor prezentate la metodele mecanice, pentru

determinarea cât mai exactă a tendinţei generale de evoluţie a fenomenului este necesar să se

utilizeze o metodă care să ţină seama de toţi termenii seriei cronologice. În acest sens se

apelează la metode analitice care au la bază un model matematic, în care tendinţa centrală a

evoluţiei se exprimă ca o funcţie de timp:

y = f(t) numită funcţie de ajustare, în care:

t - reprezintă valorile variabilei independente (timpul);

Capitolul 6 127

y - reprezintă valorile variabilei dependente (fenomenele) care sunt prezentate

în seria cronologică).

În urma alegerii funcţiei de ajustare, se impune estimarea parametrilor acestei funcţii

utilizând metoda celor mai mici pătrate. Această metodă are ca funcţie obiectiv minimizarea

sumei pătratelor abaterilor valorilor reale de la cele ajustate:

min y Yt t2

t = 1, 2, ... ,n

în cazul funcţiei liniare această condiţie devine:

y a btt ( ) min.2

În scopul determinării celor doi parametri a şi b se rezolvă sistemul de ecuaţii

normale : na b t y

a t b t t y

i i

i i i i

2

Orice fenomen social-economic depinde de o serie de factori a căror influenţă este

prezentată în timp. Timpul serveşte doar la sistematizarea materialului statistic şi se poate

anihila influenţa lui punând condiţia ti =0.

Pentru ti =0, sistemul de ecuaţii normale prezentat anterior devine:

na y

b t t y

i

i i i

2 de unde

ay

n

bt y

t

i

i i

i

2

şi pe baza rezolvării sistemului de ecuaţii se demonstrează că valoarea lui a este egală

chiar cu media seriei:

ay

ny

i

Pentru a satisface condiţia ti =0 trebuie să se considere originea valorilor de timp

ca fiind în centrul seriei.

În cazul când seria este formată dintr-un număr impar de termeni, originea valorilor de

timp va fi chiar în dreptul termenului central şi variaţia de timp se va măsura în intervale

întregi: 0; 1; 2 etc.

În cazul când seria este formată dintr-un număr par de termeni, cei doi termeni din

mijlocul seriei primesc ±0,5 1,5; 2,5 etc.


În exemplul considerat, seria cronologică are 5 termeni.

Tabelul nr. 6 Ajustare cu model liniar

Ani it

Export

iy ii yt 2

it tYt 4,4274

2001 -2 265 -530 4 265.2

2002 -1 269 -269 1 269.6

2003 0 275 0 0 274

2004 1 279 279 1 278.4

2005 2 282 564 4 282.8

Total

i

it 0 i

iy 1370 i

ii yt 44 102 i

it 1370i

tY

4,410

44

2745

1370

2

i

ii

i

t

ytb

n

ya

255

260

265

270

275

280

285

-2 -1 0 1 2

Figura 3. Ajustare cu modelul liniar

4. Analiza sezonalităţii

În manifestarea concretă a fenomenelor economice, variaţiile cele mai mari ale

acestora nu sunt întotdeauna provocate de influenţa unor cauze întâmplătoare. Uneori aceste

variaţii au un caracter de regularitate şi pot fi rezultatul acţiunii unor cauze obiective, legate

de modificarea anotimpurilor.

Capitolul 6 129

Pentru a măsura influenţa valului sezonier este necesar să se cunoască periodicitatea

producerii variaţiei în funcţie de care se vor înregistra datele statistice lunare sau trimestriale.

Pentru a alege corect funcţia de ajustare se reprezintă grafic seria de date.

Figura 4. Model aditiv Fig ura 5. Model multiplicativ

Cele două grafice pun în evidenţă existenţa a trei componente:

Yij - componenta de trend care se determină cu ajutorul funcţiilor analitice;

Sij - componenta sezonieră;

ij - componenta aleatoare.

Dacă amplitudinea oscilaţiilor creşte sau descreşte în progresie aritmetică se va aplica

modelul aditiv, iar dacă amplitudinea oscilaţiilor creşte sau descreşte în progresie

geometrică se va aplica modelul multiplicativ.

În tabelul 5 sunt prezentate cele două modele comparativ.

Tabelul nr. 7

Paşii algoritmului Model aditiv Model

multiplicativ

1. Valorile empirice

2. Calculul valorilor Yij y Y Sij ij ij ij

funcţii analitice

y Y Siij ij ij ij

funcţii analitice

3. Variaţiile sezoniere S y Yij ij ij S

y

Yij

ij

ij

4. Coeficienţii sezonieri

S

S

mj nj

iji

m

1

1, S

S

mj nj

iji

m

1

1,

5. Factor de corecţie

S

n

jj

n

1

S

n

jj

n

1

6. Coeficienţii sezonieri

corectaţi dacă 0 dacă 1


S Sj j

* S

Sj

j*

7. Seria ajustată y Y Sij

a

ij j * y Y Sij

a

ij j *

8. Componentele aleatoare ij ij ij

ay y ij

ij

ij

a

y

y

Consumul de bere, exprimat în mii hl, a înregistrat următoarele valori:

Tabelul nr. 8

Trimestre

Anii I II III IV

2003

2004

2005

36,6 54,7 56,5 34,5

36,3 54,4 59,9 39,0

37,8 58,7 64,0 38,2

Se cere să se determine componentele de trend, să se analizeze sezonalitatea şi să se

prognozeze comsumul de bere pentru trimestrele anului următor.

Figura 6. Evoluţia consumului de bere pe ani şi trimestre

Din reprezentarea grafică se observă faptul că fenomenul are tendinţă de creştere peste

care se suprapun componentele sezoniere. Pentru analiza trendului se foloseşte modelul aditiv.

0

1 0

2 0

3 0

4 0

5 0

6 0

7 0

I I I I I I I V I I I I I I I V I I I I I I I V

trimestre

mii

hl

Capitolul 6 131

Tabelul nr. 9

Trim. yi ti ti2 tiyi Yi=a+bti s

I 35.6 -5.5 30.25 -195.8 44.4 -8.8

II 54.7 -4.5 20.25 -246.15 45.0 9.7

III 56.5 -3.5 12.25 -197.75 45.5 11.0

IV 34.5 -2.5 6.25 -86.25 46.1 -11.6

I 36.3 -1.5 2.25 -54.45 46.6 -10.3

II 54.4 -0.5 0.25 -27.2 47.2 7.2

III 59.9 0.5 0.25 29.95 47.7 12.2

IV 39 1.5 2.25 58.5 48.3 -9.3

I 37.8 2.5 6.25 94.5 48.8 -11.0

II 58.7 3.5 12.25 205.45 49.4 9.3

III 64 4.5 20.25 288 49.9 14.1

IV 38.2 5.5 30.25 210.1 50.5 -12.3

Total 569.6 0 143 78.9

467,4712

12

1 i

iy

a 5517,012

1

2

12

1

i

i

i

ii

t

ty

b

Tabelul nr. 10

Componente sezoniere pe trimestre

Ani I II III IV

2003 -8,8 9,7 11 -11,6

2004 -10,3 7,2 12,2 -9,3

2005 -11 9,3 14,1 -12,3

jS -10,03 8,73 12,43 -11,07

Mărimea = 0,0166 o considerăm aproximativ egală cu zero.

Coeficienţii de sezonalitate scot în evidenţă faptul că la consumul de bere sezonul de

vârf este trimestrul III iar sezonul slab trimestrul IV.

Pentru prognoză se parcurg paşii:

se prognozează componentele de trend;

se corectează cu coeficienţii de sezonalitate.

Tabelul nr. 11

I II III IV

jtp 6.5 7.5 8.5 9.5

jj tpbaYp 51.1 51.6 52.2 52.7

jjj SYpyp 41.0 60.3 64.6 41.6


unde:

tpj – timpul de prognoză

Ypj – componentele de trend prognozate

ypj – valorile finale prognozate.

Rezumat

Analiza seriilor cronologice presupune: stabilirea obiectivului cercetării, culegerea

datelor şi asigurarea comparabilităţii lor în timp, calculul indicatorilor statistici, analiza

trendului, analiza sezonalităţii, efectuarea calculelor de prognoză.

Termeni importanţi: modificare absolută, modificare relativă, mărimi medii,

componente de trend, componente sezoniere, valori prognozate


1. Definiţi seria cronologică

2. Ce indicatori absoluţi cunoaşteţi ?

3. Care sunt indicatorii calculaţi sub formă de mărimi relative?Cum se interpretează ?

4. Ce reflectă mărimile medii ?

5. Ce metode de ajustare (analiza trendului) cunoaşteţi ?

Probleme propuse

1. Despre evoluţia cifrei de afaceri a unei societăţi comerciale se cunosc datele:

ANI 2002 2003 2004 2005

% modificării relative a cifrei de

afaceri faţă de anul precedent

+3

+4

+2

+4

Ştiind că cifra de afaceri din 2004 a fost de 80 mii RON, modificarea medie anuală

absolută în perioada 2002-2005 a fost de :

a. 1,2 mii RON/an;

b. 1,2 %/an;

c. 2,5 mii RON/an;

d. 210%/an;

e. 3 mii RON/an.

2. Pe baza unei serii cronologice formată din 11 ani, termeni consecutivi, s-a ajuns

la concluzia că tendinţa de evoluţie a unei variabile este exprimată prin funcţia tYt 60400

(în codiţiile în care 0t ). Valorile estimate ale variabilei analizate pentru următorii trei ani

sunt:

a. 1300; 1480; 1600;

b. 1120; 1180; 1240;

c. 340; 280; 220;

d. 460; 520; 580;

e. 760; 820; 880.

Capitolul 6 133

3. Evoluţia salariului mediu lunar al angajaţilor unei societăţi comerciale pe primele

două trimestre ale unui an au fost următoarele:

Luna Salariul

- RON -

Ianuarie 596

Februarie 601

Martie 609

Aprilie 606

Mai 607

Iunie 612

Să se calculeze indicatorii specifici seriilor cronologice.

4. O societate comercială producătoare de autoturisme a obţinut în ultimele cinci luni,

următoarea producţie fizică:

Luna Autoturisme

- mii buc -

Noiembrie 19

Decembrie 14

Ianuarie 15

Februarie 18

Martie 21

a) Să se analizeze evoluţia producţiei fizice pe cele cinci luni.

b) Să se previzioneze producţia fizică pentru următoarele trei luni.

5. Considerăm următoarele date privind numărul de turişti într -o staţiune:

Anii

Sporul cu baza în lanţ

(mii pers.)

2003 -

2004 +2

2005 -1

2006 +6

2007 +2

2008 +5

Ştiind că în 2008 numărul de turişti a fost cu 5% mai mare decât în 2003, se cere:

a) Să se reconstituie seria care exprimă numărul de turişti pentru fiecare an;

b) Să se calculeze indicatorii relativi şi medii;

c) Să se determine trendul, folosind:

- metoda sporului mediu;

- metode analitice (modelul liniar);

d) Să se previzioneze numărul de turişti pentru anul 2009.


6. Următoarele date se referă la vânzările de maşini de spălat într -un judeţ:

Anul Ritmul cu baza în lanţ (%)

2003 -

2004 +5

2005 +16

2006 - 6

2007 +10

2008 +4

Ştiind că în anul 2004 s-au vândut 2000 de maşini de spălat, se cere:

a) Să se reconstituie seria de valori absolute;

b) Să se calculeze indicatorii relativi şi medii;

c) Să se determine trendul cu metode analitice (modelul liniar);

d) Să se previzioneze volumul vânzărilor pentru anul 2009.

7. Se cunosc datele:

Valoarea încasărilor (mii RON)

Anii I II III IV

2006

2007

2008

43 65 110 180

55 88 125 192

70 92 137 214

Se cere:

1. Reprezentaţi grafic datele din tabel;

2. Efectuaţi analiza sezonalităţii;

3. Prognozaţi valorile pentru trimestrele anului următor.

Capitolul 7 135

Capitolul 7

Tema Metoda indicilor

Obiectivele 1. Noţiunea de indice statistic. Probleme teoretice ale construirii

indicilor

2. Indicii agregaţi. Sisteme de ponderare folosite la construirea

indicilor de grup

3. Indicii de grup calculaţi ca medie a indicilor individuali

4. Indicii calculaţi ca raport a două medii

Mijloace





lupă)


Finalitatea 1. stabilirea variabilei dependente şi a factorilor de influenţă

2. efectuarea analizei cu ajutorul indicilor la nivelul componentelor unui

ansamblu

3. efectuarea analizei la nivelul ansamblului cu descompunerea pe factorii

de influenţă


Timp de lucru

necesar



Metoda indicilor 136

Metoda indicilor

1. Noţiunea de indice statistic. Probleme teoretice ale construirii indicilor

Metoda indicilor face parte din metodele de analiză factorială, prin care se

măsoară variaţia în timp şi în spaţiu a unui fenomen complex în funcţie de modificarea

factorilor de influenţă. Indicii se calculează sub forma unui raport, deci sunt mărimi relative

adimensionale ca urmare a faptului că atât la numărător cât şi la numitor figurează două valori

ale aceluiaşi indicator. Aceasta înseamnă că aplicarea indicilor presupune identificarea

factorilor care determină variaţia fenomenului complex, înregistrarea nivelului acestora pentru

toate unităţile ce compun colectivitatea şi construirea relaţiilor care să permită caracterizarea

modificării relative atât la nivelul întregului ansamblu, cât şi al elementelor sale componente.

Specific metodei indicilor este faptul că variaţia fenomenului complex se descompune

integral pe factorii înregistraţi, ceea ce înseamnă că între nivelul ansamblului şi variaţia

factorilor de influenţă trebuie să existe o relaţie de produs. La aplicarea acestei metode,

factorii luaţi în discuţie se pot grupa după natura lor în două categorii:

factorii cantitativi, de natură extensivă: numărul salariaţilor, cantităţile de

produse, suprafaţa însămânţată etc. notaţi cu fi;

factorii calitativi, de natură intensivă, care sunt înregistraţi sub formă de

caracteristici ale unităţilor luate în calcul. De exemplu: preţurile de vânzare ale

produselor, costurile produselor etc., simbolizaţi cu xi. Cel mai frecvent apar ca

mărimi relative de intensitate calculate ca un raport între o variabilă complexă yi şi

factorul cantitativ fi.

Această separare a factorilor după natura lor este necesară deoarece la construirea

indicilor pentru ansamblul de elemente complexe trebuie avut în vedere faptul că valorile

individuale ale variabilelor înregistrate pot fi însumabile direct sau neînsumabile din punct de

vedere economic. În unele cazuri valorile individuale ale factorilor cantitativi, pot fi însumate

direct (produse de acelaşi fel, numărul angajaţilor, numărul tractoarelor de aceeaşi putere etc.)

iar în altele, acestea nu sunt însumabile (cantităţile de produse diferite, maşinile agricole dintr -

o întreprindere agricolă, cantităţile de produse alimentare cumpărate de o familie într-o lună

etc.). Valorile factorilor calitativi sunt întotdeauna neânsumabile direct. Determinarea

nivelului totalizator al valorilor luate în calculul indicilor, în cazurile în care valorile

individuale nu pot fi însumate direct din punct de vedere economic, necesită folosirea

ponderilor.

Ponderea are rolul de comăsurător al valorilor factorilor neânsumabili şi figurează

întotdeauna în numărătorul şi numitorul raportului cu aceeaşi valoare. Ca atare, elementul

care rămâne constant în numărător şi numitor are denumirea generică de pondere. Ponderea

poate să fie, după caz, atât factorul cantitativ cât şi cel calitativ.

Variabila a cărei variaţie interesează, figurează în numărătorul şi numitorul raportului

cu valorile corespunzătoare diferitelor unităţi de timp sau de spaţiu, iar indicele de grup care

rezultă se numeşte indice factorial.

Dacă se compară nivelul unui fenomen din perioada curentă cu cel dintr-o perioadă

anterioară, rezultă indicele dinamicii. Rezultatul comparării aceluiaşi fenomen, în aceeaşi

Capitolul 7 137

perioadă de timp, situat în două unităţi teritoriale, se concretizează în indici teritoriali sau de

spaţiu.

Conţinutul indicatorului comparat determină denumirea indicilor calculaţi, de exemplu

indicele preţurilor, indicele salariului etc.

Mărimile relative ale dinamicii, ale planului şi de coordonare pot fi considerate drept

indicii individuali, notaţi cu i, dacă exprimă variaţia relativă la nivelul unei singure unităţi de

observare.

Indicii de grup, simbolizaţi cu I, se calculează la nivelul unei grupe sau pe întregul

ansamblu şi exprimă variaţia medie relativă a fenomenului studiat. Ca atare, indicele de grup

nu este o sumă a indicilor individuali respectivi, ci o medie a acestora. Indicii individuali fiind

mărimi relative, media lor poate să fie aritmetică sau armonică.

Privitor la folosirea metodei indicilor, de menţionat că ei se aplică, de regulă, sub

formă de sistem. De exemplu, sistemul indicilor valorii, ai volumului fizic şi ai preţurilor.

Fiecare sistem de indici poate fi privit ca un sistem independent sau ca un subsistem în cadrul

unui sistem mai cuprinzător, fie din punct de vedere organizatoric, fie din punct de vedere al

gradului de cuprindere a caracteristicilor ce se găsesc în relaţii de interdependenţă.

Construirea şi folosirea indicilor de grup în caracterizarea unui fenomen complex

presupune efectuarea unei analize calitative a indicatorului a cărei variaţie se studiază, din

care trebuie să rezulte:

separarea factorilor, în cantitativi (extensivi) şi calitativi (intensivi);

dacă valorile factorilor sunt însumabile direct sau nu;

ce bază de comparaţie trebuie folosită;

sistemul de ponderare care trebuie utilizat;

ce relaţie de calcul poate fi aplicată având în vedere datele de care se

dispune.

În funcţie de aceste elemente, indicii de grup se pot construi sub formă de indici

agregaţi, indici calculaţi ca medie a indicilor individuali şi ca indici determinaţi ca raport a

două medii. La rândul lor aceste forme de indici de grup se particularizează în funcţie de baza

de comparaţie (fixă sau mobilă) şi de ponderile utilizate (constante sau variabile). Desigur că,

fiecare din aceste metode prezintă avantaje şi dezavantaje şi, deci, nu poate fi substituită una

alteia.

2. Indicii agregaţi. Sisteme de ponderare folosite la construirea indicilor de grup

La nivelul unui ansamblu, valorile variabilelor statistice înregistrate pot fi

însumate sau calculate sub formă de mărime medie. În primul caz se obţin valori agregate

care trebuie, prin metoda indicilor, să fie comparate în timp sau spaţiu. Din această comparare

rezultă un indice agregat. Dacă valorile individuale (parţiale) ale agregatului sunt însumabile

direct nu apare nici o problemă deosebită. Dacă nu sunt însumabile, decât printr-un alt

element, atunci acest etalon poartă denumirea de pondere şi ea trebuie să fie aleasă cu

discernământ.

În practica statistică, problemele cele mai dificile apar în legătură cu alegerea şi

folosirea ponderilor la construirea indicilor de grup.

Pe măsura dezvoltării statisticii s-au propus mai multe sisteme de ponderare care au

fost particularizate, de regulă, pe exemplul indicelui volumului fizic sau al preţurilor

producţiei şi circulaţiei mărfurilor. Pentru generalizare însă se vor prezenta sistemele de indici

pentru o variabilă complexă (yi), dependentă de un factor calitativ (x i) şi un factor cantitativ

(fi), adică yi = xi . fi.


Având trei variabile înregistrate la nivelul unităţilor complexe care formează în mod

permanent colectivitatea supusă observării, înseamnă că se pot calcula trei indici individuali şi

trei indici de grup.

Indicii individuali se calculează ca indici simpli folosind datele înregistrate pentru

fiecare variabilă la nivelul unităţii de observare folosită iy

yi

f

fi

x

x

y f x

10

1

0

10

1

0

10

1

0

; ; . În

acest caz indicii de grup la nivelul întregului ansamblu se calculează ca indici agregaţi. Pentru

prezentarea diferitelor sisteme de ponderare se presupune că variabila y i este însumabilă direct

şi că se descompune la nivelul fiecărei unităţi în produsul dintre variabila x i - cu caracter de

mărime statistică derivată - şi variabila fi, cu caracter de variabilă cantitativă neînsumabilă

direct. Aceasta înseamnă că pentru indicii de grup ai celor două variabile - factori se va folosi

tot un indice agregat în care succesiv factorul de indexat este variabil, iar celălalt are caracter

de pondere.

Rezultă deci, că într-un sistem de indici - cel puţin la nivelul întregului ansamblu -

indicii factoriali trebuie să cuprindă aceleaşi elemente ca şi indicele variabilei complexe.

În cazul variabilei complexe yi = xi . fi, indicele de grup va fi:

I

y

y

x f

x f

x f

x f

y

i

i

k

i

i

k

i i

i

k

i

i

k

i

10

1

1

0

1

1 1

1

0

1

0

1 1

0 0

în care, k = numărul unităţilor observate.

Pentru a evita încărcarea formulelor cu prea multe simboluri se renunţă în continuare

la i şi k după care se face însumarea, înţelegându-se că însumarea cuprinde toate elementele

constitutive ale colectivităţii.

Indicii factoriali derivaţi din acesta I Iy f y x

10

10

( ) ( )si

trebuie să prezinte variaţia

unui singur factor, iar celălalt să rămână constant, deci să joace rolul de pondere, şi anum e:

Ixf

xfI

x f

x f

y f y x

10

1

0

10

1

0

( ) ( )

si

La rândul lor, ponderile nu sunt elemente abstracte ci ele pot fi din perioada curentă

sau din cea de bază (în cazul indicilor de dinamică).

Un prim sistem de ponderare este acela propus în 1864 de E. Laspeyres, la care

ponderile folosite sunt cele din perioada de bază. În acest caz, indicii factoriali se calculează

pe baza relaţiilor:

pentru factorul cantitativ:

Ix f

x f

y f

10

0 1

0 0

( )

pentru factorul calitativ:

Ix f

x f

y x

10

1 0

0 0

( )

Capitolul 7 139

Adoptarea sau respingerea celor doi indici nu se poate face decât după ce se analizează

conţinutul lor şi măsura în care ei reflectă nişte proporţii reale cu privire la dezvoltarea

fenomenelor la care se referă. Fiecare indice trebuie analizat separat corespunzător cu

conţinutul indicatorilor absoluţi pe care-i conţine şi a relaţiilor de interdependenţă dintre

fenomenul de indexat şi ponderile folosite.

Un alt sistem de ponderare este cel propus în 1874 de H. Paasche, la care ponderile

utilizate sunt cele din perioada curentă:

pentru factorul cantitativ:

Ix f

x f

y f

10

1 1

1 0

( )

pentru factorul calitativ:

Ix f

x f

y x

10

1 1

0 1

( )

Şi aceste formule trebuie analizate în raport cu conţinutul şi scopul analizei.

Un alt indice bazat pe folosirea ponderilor din ambele perioade este indicele ideal al

lui I. Fisher. El a calculat un indice de grup al preţurilor ca o medie geometrică a celor doi

indici agregaţi, de tip Laspeyres şi de tip Paasche. Prin generalizare, pentru indicele variabilei

calitative se obţine:

Ix f

x f

x f

x f

y x

10

1 0

0 0

1 1

0 1

( )

Acest indice prezintă avantajul că se încadrează în intervalul de variaţie al valorilor

indicilor calculaţi pe baza celor două sisteme de ponderare, deci va compensa o parte din

tendinţa de modificare a ponderilor folosite. Practic, prezintă însă dezavantajul că necesită

cunoaşterea separată a tuturor elementelor de calcul şi combinarea tuturor variantelor posibile.

Indicele lui Fisher se poate aplica pentru orice caracteristică statistică a cărei variaţie

se măsoară cu ajutorul unui indice ponderat. Ca atare, indicele factorului cantitativ de tip

Fisher se bazează pe relaţia:

Ix f

x f

x f

x f

y f

10

0 1

0 0

1 1

1 0

( )

Indicele lui Fisher se foloseşte în special în calculul indicilor teritoriali, pe plan

internaţional.

Existenţa în teoria şi practica statistică a mai multor sisteme de ponderare provine din

faptul că nici una din formulele de calcul propuse nu satisface integral nici teoria şi nici

practica folosirii acestei metode pentru studiul variaţiei complexe a fenomenelor1. În plus,

dacă pe plan teoretic problema este mai uşor de rezolvat, pe plan practic apar uneori dificultăţi

aproape de neînlăturat. Este suficient, de exemplu, să fie luat în discuţie indicele preţurilor,

1 În practica statistică se aplică în mod curent fie sistemul propus de Laspeyres fie o variantă care provine din

combinarea sistemului lui Laspeyres şi al lui Paasche. Criteriul ce stă la baza optării pentru una din cele

două variante este, de regulă, existenţa datelor necesare calculării indicilor.


care ar trebui să reflecte numai modificarea pură a preţurilor. Relaţia de calcul ar trebui să fie

un indice de tip Laspeyres ( Ix f

x f

x

10

1 0

0 0

, respectiv, Ip q

p q

p

10

1 0

0 0

), care ar corespunde

ipotezei că au rămas neschimbate cantităţile şi s-au modificat numai preţurile. Ori, eforturile

omenirii s-au concentrat totdeauna pentru obţinerea unor cantităţi tot mai mari de bunuri şi

servicii. De aici, problema care se pune este în principal aceea dacă preţul poate fi izolat de

cantitate. Dacă nu, atunci se naşte a doua întrebare, şi anume: interesează variaţia preţurilor

cantităţilor produse vândute, consumate etc. În perioada de bază sau din perioada curentă?

Răspunsul nu poate fi altul decât că producătorul, vânzătorul sau cumpărătorul resimt variaţia

de preţuri atunci când s-a produs, deci în perioada curentă. Ca atare indicele preţurilor ar

trebui să fie calculat ca un indice de tip Paasche ( Ix f

x f

x

10

1 1

0 1

, respectiv, Ip q

p q

p

10

1 1

0 1

).

Mai trebuie verificat dacă aplicând relaţia de sistem, care presupune combinarea unui indice

Paasche cu un indice Laspeyres, este satisfăcută în cazul indicelui volumului fizic prin analiza

direcţiei şi conţinutului acestuia. Cu alte cuvinte, pentru indicele volumului fizic, potrivit

relaţiei de sistem, trebuie folosit un indice Laspeyres ( Ix f

x f

f

10

0 1

0 0

, respectiv,

Ip q

p q

q

10

0 1

0 0

). Acest indice corespunde ipotezei că ar fi rămas neschimbate preţurile şi s-ar

fi modificat numai cantităţile.

Dacă se folosesc cei doi indici cu sisteme diferite de ponderare, apare relaţia de

sistem, şi anume:

Iv

v

q p

q p

q p

q p

q p

q p

v

10

1

0

1 1

0 0

1 0

0 0

1 1

1 0

O problemă care se rezolvă cu ajutorul indicilor este şi aceea a calculării variaţiilor în

mărimi absolute a fenomenelor de indexat. Variaţia absolută se calculează, în general, ca

diferenţă între numărătorul şi numitorul indicelui. În consecinţă, dacă indicele variabilei

complexe este egal cu produsul indicilor factoriali, atunci modificarea absolută a fenomenului

complex este egală cu suma variaţiilor absolute factoriale.

În cazul valorii, volumului fizic şi preţurilor, rela ţia va fi:

v qp v q v p( ) ( ) ( )

în care:

v qp

v q

v p

q p q p

q p q p

q p q p

( )

( )

( )

;

;

1 1 0 0

1 0 0 0

1 1 1 0

Avantajul constă în faptul că este suficient ca din diferite surse de informaţii să se

cunoască doi indici ca să se poată determina al treilea.

Capitolul 7 141

În practică însă folosirea acestui sistem are o restricţie, şi anume: modul în care se

transmite informaţia, periodicitatea transmiterii, pentru cantităţi şi preţuri.

Dacă sistemul informaţional statistic existent permite obţinerea indicatorilor din

numărătorii şi numitorii indicilor respectivi, se pot aplica relaţiile de mai sus. De regulă o

asemenea metodologie se poate aplica fără dificultăţi la nivelul întreprinderilor unde există o

evidenţă privind cantităţile şi preţurile.

Pentru a prezenta metodologia de calcul a indicilor de grup sub formă

agregată, se consideră că o întreprindere produce trei produse pentru care se cunosc cantităţile

produse şi preţurile unitare pentru perioada de bază şi perioada curentă (tabelul 1, col. 1,2,3 şi

4).

Datele tabelului (col. 1-6) permit analizarea modificării relative şi absolute a

cantităţilor şi preţurilor unitare pe fiecare produs şi pe total.

Tabelul nr. 1 Cantitatea (buc.)

Preţ unitar (RON)

Valoarea producţiei (RON)

Produse U/M Perioada

de bază

(q0)

Perioada

curentă

(q1)

Perioada

de bază

(p0)

Perioada

curentă

(p1)

Perioada

de bază

(q0p0)

Perioada

curentă

(q1p1)

Perioada

curentă la

preţurile

perioadei

de bază

(q1p0)

a b 1 2 3 4 5 6 7

A tone 50 52 1000 1100 50000 57200 52000

B buc. 200 220 60 63 12000 13860 13200

C buc. 500 570 100 90 50000 51300 57000

Total - - - - 112000 122360 122200

Modificarea relativă pe fiecare produs se stabileşte pe baza indicilor individuali iar

modificarea absolută se calculează ca diferenţă dintre nivelul din perioada curentă şi cel din

perioada de bază.

iq

q

I

I

I

q

A

q

B

q

C

q

10

1

0

52

501 04

220

200110

570

500114

,

,

,

qA

qB

qC

52 50 2

220 200 20

570 500 70

tone

buc.

buc

ip

p

i

i

i

p

A

p

B

p

C

p

10

1

0

1100

1000110

63

601 05

90

1000 90

,

,

,

RON1010090

RON36063

10010001100

pC

pB

pA RON


iq p

q p

i

I

I

v

A

v

B

q

C

q

10

1 1

0 0

57200

500001144

13860

120001155

51300

500001 026

,

,

,

RON1300

RON1860

RON7200

vC

vB

vA

Pe ansamblul celor trei produse, valoarea producţiei a crescut în perioada curentă faţă

de perioada de bază de 1,0925 ori sau a reprezentat în perioada curentă 109,25% faţă de anul

de bază, sau a crescut cu 9,25%. Aceste concluzii rezultă din indicele de grup al valorii

producţiei:

Iv

v

q p

q p

v

10

1

0

1 1

0 0

122360

1120001 0925

, sau 109,25%

Valoarea producţiei a crescut în perioada curentă cu 10360 RON.

v q p q p 1 1 0 0 122360 112000 10360 RON

Pornind de la faptul că, v = q.p, înseamnă că modificarea valorii producţiei trebuie

analizată şi explicată pornind de la schimbările intervenite în nivelul cantităţilor şi preţurilor

unitare la fiecare produs în parte. Evidenţierea influenţei celor doi factori (q şi p) asupra

modificării producţiei, pe ansamblu, presupune calcularea indicelui de grup al volumului fizic

şi al indicelui preţurilor.

Indicele volumului fizic se calculează în practică ca un indice de tip Laspeyres:

Iq p

q p

q

10

1 0

0 0

122360

1120001 091

, sau 109,1%

Rezultă că valoarea producţiei, pe ansamblul celor trei produse trebuia să crească în

condiţiile în care s-ar fi modificat numai producţia fizică (preţurile ar fi rămas la nivelul

anului de bază) de 1,091 ori sau cu 9,1%. În mărime absolută creşterea trebuia să fie de 10200

RON.

v q q p q p( ) 1 0 0 0 122200 112000 10200 RON

sau,

v q q q p q p( ) ( ) . . . 1 0 0 0 21000 20 60 70100 10200 RON

Indicele preţurilor se calculează cu un indice de tip Paasche:

Iq p

q p

p

10

1 1

1 0

122360

1222001 001

, sau 100,1%

Capitolul 7 143

Modificarea preţurilor unitare, în condiţiile folosirii drept pondere a cantităţilor din

perioada curentă, trebuia să conducă la creşterea valorii producţiei cu 0,1%, ceea ce înseamnă

că valoarea producţiei ar fi reprezentat în perioada curentă 100,1% faţă de perioada de bază.

Modificarea absolută a valorii producţiei trebuia să fie, în aceste condiţii, de +160

RON, mărime ce rezultă din:

v p q p q p( ) 1 1 1 0 122360 122200 160 RON

Pornind de la relaţia dintre cei trei indici, indicele valorii este egal cu produsul dintre

indicele volumului fizic şi indicele preţului respectiv:

i i iv q p

10

10

10

şi I I Iv q p

10

10

10

iar modificarea absolută a valorii producţiei este egală

cu suma modificărilor absolute determinate de cei doi factori:

v v q v p ( ) ( )

Contribuţia relativă a celor doi factori la modificarea valorii producţiei se prezintă

astfel:

Tabelul nr. 2

Produse Modificarea absolută (RON) Contribuţia procentuală

totală din care

v q p( , ) v q( ) v p( ) 100 (v p( ) /v ).100

A +1200 +2000 +5200 27,8 72,2

B +1860 +1200 +660 64,5 35,5

C +1300 +7000 -570 538,5 438,5

Total +10360 +10200 +160 98,5 1,5

Rezultă faptul că sporirea valorii producţiei a fost determinată, în principal, de

creşterea producţiei fizice, factor ce deţine 98,5% din creşterea valorii producţiei.

Calcularea indicelui volumului fizic şi al preţurilor sub formă agregată

presupune că se cunosc cantităţile şi preţurile acestora pentru cele două perioade comparate.

În aplicarea acestor relaţii se întâmpină dificultăţi legate de datele furnizate de evidenţa

curentă, pe de o parte şi de produsele nou apărute pe de altă parte. Aşa cum rezultă din analiza

datelor din tabelul 1, un sistem integrat al indicelui valorii, volumului fizic şi al preţurilor nu

se poate obţine decât dacă producţia este comparabilă. Dacă au apărut produse noi sau au fost

eliminate unele produse în perioada curentă, atunci relaţia de sistem I I Iv q p

10

10

10

nu mai este

satisfăcută. Pentru a lărgi cât mai mult gama produselor comparabile, în practică se pune

problema să se calculeze un indice de preţuri independent, iar indicele volumului fizic să se

obţină ca un raport între indicele valorii şi indicele preţurilor.

Problema includerii produselor noi în calculul indicilor se pune şi se rezolvă

diferenţiat în cazul indicelui volumului fizic şi al preţurilor.

La determinarea indicelui volumului fizic cantităţile din perioada curentă şi din

perioada de bază sunt evaluate la aceleaşi preţuri şi anume din perioada de bază q p

q p

1 0

0 0

,

produsele noi însă nu au asemenea preţuri. Necuprinderea lor, din acest motiv, în mărimea


agregatului q1p0 ar însemna să se denatureze conştient concluziile privitoare la rezultatele

activităţii unităţii sau ramurii în cauză. În rezolvarea acestei probleme se pot folosi mai mult

căi.

O primă cale ar consta în evaluarea produselor noi la preţurile la care au apărut, deci la

preţurile efective. Aceasta ar însemna, însă, să se folosească două preţuri pentru obţinerea

indicatorului din numărătorul indicelui volumului fizic.

O a doua cale posibilă constă în recalcularea preţurilor produselor noi prin corectarea

preţurilor efective al acestora, pe baza unor indici de preţuri calculaţi pentru producţia

comparabilă, corespunzătoare grupei din care fac parte produsele noi.

Dacă produsele noi nu pot fi încadrate în niciuna din grupele de produse, la evaluarea

şi includerea acestora în calculul indicelui volumului fizic se poate porni de la preţurile

produselor similare, practicate pe piaţa externă.

Determinarea indicelui preţurilor presupune existenţa preţului în cele două perioade

comparate. Existenţa preţurilor însă, este condiţionată de realizarea produsului respectiv, în

ambele perioade. Ca urmare, în calculul indicelui preţurilor se cuprind numai produsele care

s-au produs în ambele perioade.

3. Indicii de grup calculaţi ca medie a indicilor individuali

Calcularea indicelui agregat al volumului fizic şi preţurilor presupune

evaluarea cantităţilor din perioada curentă, atât la preţurile acestei perioade cât şi la cele ale

perioadei de bază. În evidenţa contabilă, producţia, desfacerile etc. se urmăresc însă, în mod

curent, numai la preţurile curente, efective (q1p1). Deci la determinarea indicelui de grup

trebuie să se pornească de la valoarea din cele două perioade şi de la indicii individuali pe

fiecare element al ansamblului, respectiv să se calculeze o medie a mediilor individuale. În

acest caz, indicele de grup calculat ca o medie a indicilor individuali trebuie să fie egal cu

indicele agregat. Aceasta înseamnă că numărătorul sau numitorul indicelui agregat trebuie să

fie ponderea cu care se introduc în calculul indicilor individuali corespunzători.

Indicele de grup al volumului fizic se va calcula ca o medie aritmetică ponderată în

care variabila o reprezintă indicele individual iq

qq i qq q

10

1

0

1 10

0

iar ponderea, valoarea

din perioada de bază (q0p0) pe fiecare element al colectivităţii:

Iq p

q p

i q p

q p

q

q

10

1 0

0 0

0 0

0 0

Din numărătorul raportului rezultă că indicele volumului fizic se poate calcula sub

formă de medie aritmetică, dacă nu au apărut produse noi, deoarece, pentru acestea, nu se pot

calcula indici individuali.

În cazul indicelui preţurilor, cunoscând indicii individuali ai preţurilor

ip

pp

p

i

p

p10

1

0

01

10

şi valoarea din perioada curentă (q1p1) se va utiliza media armonică

ponderată:

Capitolul 7 145

Iq p

q p

q p

iq p

p

p

10

1 1

1 0

1 1

10

1 1

1

În mod similar se calculează indicele mediu aritmetic sau armonic şi al altor variabile

ca: salariul mediu, productivitatea muncii, recolta medie, costul mediu, eficienţa fondurilor

fixe etc., dacă se cunosc indicii individuali şi nivelul totalizator din perioada de bază sau

curentă, pe fiecare element sau grupe de elemente ale colectivităţii. La alegerea formei mediei

este indicat să se aibă în vedere datele disponibile şi folosirea acelor ponderi care nu mai

necesită recalculări.

Relaţiile generale de calcul a indicilor de grup ca medie a ind icilor individuali sunt:

Ii x f

x fi

f

f

y f

f

f

10

10

0 0

0 0

10

1

0

( )

unde:

Ix f

ix f

ix

x

y x

x

x

10

1 1

10

1 1

10

1

01

( )

unde :

În general, indicele de grup al variabilei cantitative se calculează ca o medie aritmetică

a indicilor individuali, iar indicele de grup al variabilei calitative se determină ca o medie

armonică a indicilor individuali.

Dacă în locul datelor complete privind cantităţile şi preţurile unitare cuprinse în

tabelul 1 se dispune doar de valoarea producţiei în perioada curentă şi de modificarea

preţurilor unitare, indicele de grup al preţurilor se poate calcula ca o medie armonică,

ajungându-se la aceeaşi valoare numerică ca şi când s-ar fi folosit indicele agregat. Se

exemplifică prin datele tabelului 3.

Tabelul nr. 3

Produse

Valoarea producţiei

în perioada curentă,

(RON)

Modificarea

preţurilor unitare (%)

R=(ip-1)100

ip=R

p+100 (%)

A 57200 +10 110

B 13860 + 5 105

C 51300 -10 90

Total 122360 - -

Aplicarea indicelui mediu armonic presupune cunoaşterea indicilor individuali ai

preţurilor (ip). Modificarea procentuală a preţurilor este ritmul preţurilor. Deci, indicele

individual al preţurilor se obţine adăugând 100 la ritmul preţurilor (col. 3):

Iq p

iq p

p

p

10

1 1

10

1 1

1

122360

1

11057200

1

1 0513860

1

0 9051300

122360

1222001 001

, , ,

,


v p

pp q

ip q( ) 1 1

10

1 1

1122360 122200 160 RON

Similar se poate calcula şi indicele de grup al volumului fizic pornind de la valoarea

din perioada de bază (q0p0) şi indicii individuali iq

10

.

091,1112000

122200

112000

50014,120010,15004,1

00

000

1

01

pq

pqiI

q

q sau 109,1%

Oricare ar fi procedeul de calcul - indici agregaţi sau indici calculaţi ca medie a

indicilor individuali, indicii factoriali trebuie să conducă la acelaşi rezultat.

De reţinut, că cei doi indici calculaţi ca medie aritmetică sau armonică au în vedere

substituirea indicelui agregat. Formula utilizată depinde de sistemul de ponderare acceptat la

calculul indicelui agregat. Cum la indicele de tip Laspeyres valorile numerice din aceeaşi

perioadă sunt în numitor (vezi indicele volumului fizic), el se poate substitui printr-un indice

mediu aritmetic, în timp ce la un indice de tip Paasche, valorile din aceeaşi perioadă sunt în

numărător (vezi indicele preţurilor), el se substituie cu un indice mediu armonic.

4. Indicii calculaţi ca raport a două medii

În practica economică se întâlnesc frecvent cazuri când este necesar să se

calculeze indici de grup pentru variabile calitative care au caracter de medii, valorile

individuale asociindu-se cu valorile unei variabile cantitative ale cărei elemente sunt

însumabile direct şi joacă rolul de frecvenţă, specific acestor variabile calitative este faptul că

valorile individuale sunt rezultatul raportului dintre valorile a două caracteristici de natură

diferită (interdependente), având caracter de mărimi relative de intensitate. Sintetizarea

valorilor unei asemenea caracteristici la nivelul unei grupe sau pe întreaga colectivitate se

realizează prin intermediul mediei, iar indicele de grup se calculează ca un raport a două

medii. Asemenea variabile calitative, cu largă utilizare în practica economică, sunt:

productivitatea muncii; salariul mediu, costul (preţul) mediu pe produs; eficienţa fondurilor

fixe; rata rentabilităţii, durata medie a creditelor etc.

Relaţia generală de calcul a indicelui de grup sub formă de raport a două medii este:

Ix

x

x f

f

x f

fsv

x

1

0

1 1

1

0 0

0

:

Din relaţia de mai sus rezultă că x x0 1 dacă se modifică fie valorile individuale ale

variabilei, fie frecvenţele acesteia, fie şi una şi alta. Variabila de natură cantitativă (f) nu

influenţează însă numai prin variaţia sa individuală ci şi prin modificarea ponderii cu care

apar valorile calitative f

ffi

i

i

*

, deci factorul cantitativ este, în acest caz, şi factor

structural, de unde şi denumirea indicelui de, indice cu structură variabilă.

Capitolul 7 147

Indicele cu structură variabilă se transformă într-un indice agregat dacă se operează cu

frecvenţe relative.

Ix

x

x f

x f

x g

x gsv

x

f

f

1

0

1 1

0 0

1 1

0 0

*

*

în care: x1, x0 sunt valorile caracteristicii pentru care se calculează media, din cele

două perioade;

f g f gf f

1 1 0 0

* *; sunt simbolurile cu care se pot nota frecvenţele relative ce sunt în

acelaşi timp şi greutăţi specifice ale factorului cantitativ f.

Indicele cu structură fixă (ISF) se construieşte pornind de la ipoteza că variază numai

valorile individuale xi iar structura rămâne constantă, fixă.

Dacă se aplică sistemul de ponderare propus de Paasche, indicele se construieşte

folosind ponderile din perioada curentă. Relaţia de calcul, în acest caz va fi:

Ix f

f

x f

fSF

x x( ) :

1 1

1

0 1

1

Prin simplificare cu f1 se obţine un indice agregat, care poate fi transformat şi într-un

indice mediu armonic;

Ix f

x f

x f

ix f

y x

x

10

1 1

0 1

1 1

1 1

1( )

Dacă indicele cu structură fixă se calculează folosind ponderile din perioada de bază,

corespunde sistemului de ponderare propus de Laspeyres. În acest caz, formula de calcul va

fi:

Ix f

f

x f

fSF

x x( ) :

1 0

0

0 0

0

iar indicele fenomenului complex rezultă din relaţia:

Ix f

x f

i x f

x f

y x

x

10

1 0

0 0

10

0 0

0 0

( )

Folosirea uneia sau alteia din variantele pentru calculul indicelui cu structură fixă se

face, în principal, în funcţie de datele disponibile, de scopul analizei şi de modul de

descompunere pe factori utilizat.

Indicele variaţiei structurii, denumit şi indicele modificărilor structurale, se calculează

pornind de la ipoteza că s-a schimbat numai distribuţia factorului cantitativ, deci structura

colectivităţii. În acest caz se pot construi, teoretic două variante de calcul în funcţie de

ponderile utilizate. În practica naţională şi internaţională şi-a găsit aplicabilitate formula de

calcul în care ponderea se face cu perioada de bază, deci indice de tip Laspeyres cu frecvenţe

absolute:


Ix f

f

x f

fVS

x f( ) :

0 1

1

0 0

0

respectiv:

Ix f

x fVS

x f( )

*

*

*

0 1

0 0

Sensul în care modificările structurale influenţează variaţia medie este condiţionat de

valorile variabilei calitative în favoarea cărora s-au produs mutaţiile. Astfel, dacă cresc în

importanţă valorile variabilei xi mai mari decât media, modificările structurale sunt însoţite de

creşterea mediei. În schimb, dacă cresc valorile individuale mai mici decât media, aceste

mutaţii favorizează scăderea mediei.

Îndicele cu structură variabilă, cu structură fixă şi al variaţiei structurii formează

împreună un sistem de indici în cadrul căruia se pot stabili o serie de relaţii bine determinate.

Astfel, produsul celor doi indici factoriali este egal cu indicele cu structură variabilă:

I I ISV

x

SF

x x

VF

x f ( ) ( )

Relaţia de mai sus se verifică numai în cazul în care cei doi indici factoriali se

construiesc pe baza considerării sistemelor de ponderare Paasche şi Laspeyres. Pornind de la

cele menţionate mai sus indicele cu structură fixă are la bază ponderi din perioada curentă iar

indicele variaţiei structurii, ponderi din perioada de bază. Se admite ipoteza succesiunii

modificării factorilor: mai întâi factorul cantitativ şi urmat de cel calitativ.

Modificarea absolută a mediei sub influenţa unuia sau altuia din factori se calculează

ca diferenţă dintre numărătorul şi numitorul indicelui factorial corespunzător. Relaţiile de

calcul vor fi:

x xx f

f

x f

fx f x f( ) * *

1 1

1

0 1

1

1 1 0 1

x fx f

f

x f

fx f x f( ) * *

0 1

1

0 0

0

0 1 0 0

Şi în acest caz, modificarea mediei este egală cu suma modificărilor datorate factorilor

de influenţă, respectiv:

x x f x x x f

x x f x x x f

( . ) ( ) ( )

( . ) ( ) ( )* *

Pentru exemplificarea calculului acestor indici medii se vor folosi indicii

salariului mediu. Tabelul 4 prezintă fondul de salarii şi numărul salariaţilor pentru două

unităţi comerciale aprţinând aceluiaşi proprietar :

Capitolul 7 149

Tabelul nr. 4

Unitate

Salar mediu

(RON/pers)

Numarul angjaţilor

Fondul de salarii

(RON) S0N1

comercială S0 S1 N0 N1 FS0 FS1

A 640 700 50 45 32000 31500 28800

B 720 830 70 75 50400 62250 54000

Total 686.67 781.25

0N

120

1N

120

00 NS

82400

11NS

93750

10 NS

82800

Se cere:

1. Dinamica salariului mediu pe fiecare unitate comercială.

2. Salariul mediu pe total în cele doua perioade.

3. Indicii de grup ai salariului mediu cu structură variabilă, cu structură fixă şi cu

variaţia structurii.

Rezolvare:

1. La unitatea comercială A

%38,109100640

700

0

1%

S

SI S 60640700 S RON

Salariul mediu a crescut în perioada curentă faţă de perioada de bază la 109,38%, sau

cu 9,38%, ceea ce în mărime absolută a însemnat o creştere în valoare de 60 RON/angajat.

La unitatea comercială B

%28,115100720

830

0

1%

S

SI S 110720830 S RON

Salariul mediu a crescut în perioada curentă faţă de perioada de bază la 115,28%, sau

cu 15,28%, ceea ce în mărime absolută a însemnat o creştere în valoare de 110 RON/angajat.

2. Salariul mediu pe total în perioada de bază:

0

00

N

NS686.67 RON/angajat

Salariul mediu pe angajat în perioada curentă:

1

11

N

NS781.25 RON/angajat


3.

Indicele cu structură variabilă Modificarea absolută

Salariul mediu pe total a crescut de 1,137 ori ceea ce înseamnă în mărime absolută

94,58 RON/angajat.

Indicele cu structură fixă Modificarea absolută


91,25 RON/angajat ca urmare a modificării salariilor medii pe fiecare unitate comercială.

Indicele cu modificarea structurii Modificarea abs olută


3,33 RON/angajat ca urmare a modificării structurii angajaţilor pe fiecare unitate comercia lă.

Rezumat

Metoda indicilor face parte din metodele de analiză factorială. Indicii se calculează sub

forma unui raport, sunt mărimi relative adimensionale ca urmare a faptului că atât la

numărător cât şi la numitor figurează două valori ale aceluiaşi indicator. Aceasta înseamnă că

aplicarea indicilor presupune identificarea factorilor care determină variaţia fenomenului

complex, înregistrarea nivelului acestora pentru toate unităţile ce compun colectivitatea şi

construirea relaţiilor care să permită caracterizarea modificării relative atât la nivelul

întregului ansamblu, cât şi al elementelor sale componente.

Termeni importanţi: Indici individuali, indici de grup, sisteme de ponderare


1. În ce situaţii se poate aplica metoda indicilor ?

2. Ce sisteme de ponderare cunoaşteţi ?

3. Ce tipuri de indici se pot calcula cu aceste metode ?

4. Care este rolul lor ?

137,1:0

00

1

11

N

NS

N

NSI S

SV

132,1:1

10

1

11

N

NS

N

NSI S

SF

0048,1:0

00

1

10

N

NS

N

NSI S

MS

58,940

00

1

11

N

NS

N

NSS

SV

25,911

10

1

11

N

NS

N

NSS

SF

33,3:0

00

1

10

N

NS

N

NSS

MS

Capitolul 7 151

Probleme propuse

1. Se cunosc date (convenţionale) asupra volumului vânzărilor în luna martie 200 7 la o

societate comercială, pentru trei produse din nomenclator, cât şi modificarea preţurilor:

Produsul

Valoarea vânzărilor în

perioada curentă

(RON)

Modificarea procentuală a

preţurilor

(%)

1 13860 +5,0

2 51300 -10,0

3 57200 +10,0

Total 122360 -

Modificarea absolută a volumului vânzărilor, cauzată de modificarea preţurilor la

cele trei produse, a fost egală cu:

a. 0 (zero) RON

b. – 80,0 RON

c. +160,0 RON

d. +190,0 RON

e. – 102,0 RON

2. De la un punct de desfacere s-au cules datele următoare:

Produse

Valoarea vânzărilor în ianuarie

2006

– mii RON-

% modificării volumului fizic în

ianuarie 2007 faţă de ianuarie

2006

A 18 +5

B 20 -2

Modificarea absolută totală a vânzărilor în ianuarie 2007 faţă de ianuarie 2006 ca

urmare a modificării volumului fizic este:

a. 500 RON

b. 1,30 RON

c. –500 RON

d. 38 RON

e. 20,76 RON

3. Pentru trei produse realizate de o firmă se cunosc datele:

Cantităţi

- mii buc -

Preţuri

- RON / buc - Produse

2006 2007 2006 2007

A 12.000 9.000 500 480

B 10.000 8.000 220 210

C 3.000 5.000 600 630


Se cere:

a) dinamica producţiei fizice, a preţurilor şi a valorii pe produse;

b) indicii de grup ai volumului fizic, preţului şi valorii şi modificările absolute

corespunzătoare.

4. Despre o secţie de producţie a unei firme se cunosc:

Valoarea producţiei

– mii RON -

Secţia

Mai 2007 Mai 2008

Modificarea

volumului fizic -%-

A 800 940 -10

B 1200 1800 +5

C 1000 1100 -40

Se cere:

a) indicii individuali ai valorii, volumului fizic şi preţurilor;

b) indicii de grup ai valorii, volumului fizic şi preţurilor precum şi modificările absolute

corespunzătoare.

5. Despre trei firme se cunosc următoarele date referitoare la numărul de salariaţi şi salariul

nominal:

Salariul mediu nominal

– RON/ang. -

Nr. angajaţi

Firma

Mai 2005 Mai 2006 Mai 2005 Mai 2006

A 1000 1200 400 500

B 850 830 200 180

C 740 820 100 110

Se cere:

a) modificarea salariului, a numărului de salariaţi şi a fondului de salarii pe fiecare firmă;

b) salariul mediu şi modificarea acestuia;

c) indicii cu structură fixă şi de variaţie a structurii;

d) modificarea fondului de salarii pe total şi influenţa factorilor.

6. La un hotel de patru stele s-au înregistrat datele:

Tarif cazare (euro) Nr. înnoptări Tip

cameră Aprilie 2006 Aprilie 2007 Aprilie 2006 Aprilie 2007

Dublă

Single

Garsonieră

Apartament

80

75

110

140

90

75

115

140

250

110

15

7

237

115

15

5

Se cere:

a. Să se calculeze valoarea tarifului la cursul zilei pentru moneda euro.

b. Să se calculeze şi să se interpreteze indicii individuali şi de grup precum şi

mărimile absolute corespunzătoare.

c. Să se analizeze evoluţia valorii încasate.

Bibliografie 153

BIBLIOGRAFIE

1. Andrei, T., Stancu, S., Statistică, teorie şi aplicaţii, Editura ALL, Bucureşti 1995;

2. Baron, T., Biji, E., Tovissi, L., Wagner, P., Isaic Maniu, Al., Korka, M., Porojan, D.,

Statistică teoretică şi economică, Editura Didactică şi Pedagogică, Bucureşti, 1996;

3. Biji E., Wagner P., Lilea E., Petcu N., Vătui M., Statistică, Editura Didactică şi Pedagogică,

Bucureşti ,1999.

4. Duguleană, L., Statistică economică şi socială, teorie şi aplicaţii, Editura Infomarket, Braşov

1999;

5. Isaic Maniu, Al., Mitruţ, C., Voineagu, V., Statistica pentru managementul afacerilor,

Editura Economică 1995;

6. Mitruţ, C., Isaic Maniu, Al., Voineagu, V., Statistică economică, Editura Dacia Europa Nova,

Lugoj 2000;

7. Petcu, N., Statistică în turism 2005, teorie şi aplicaţii, Editura Albastră, Cluj-Napoca 2005;

8. Petcu, N., Statistică teorie şi aplicaţii în SPSS, Editura Infomarket, Braşov, 2003.

9. Vasilescu, N., Statistică generală, metodologie, lucrări practice, programe aplicative,

Editura Amon, Craiova 1996;

10. Vasilescu, N., Vancea, I., Radu, C., Statistica firmei industriale, metodologie, Editura Amon,

Craiova 1996;

11. Voineagu, V., Mitruţ, C., Ţiţan, E., Ghiţă, S., Statistică, Centrul de învăţământ economic

deschis la distanţă, Academia de Studii Economice, Bucureşti 2000.

12. Voineagu V., Furtună F., Voineagu M., Ştefănescu C., Analiza factorială a fenomenelor

social-economice în profil regional, Bucureşti, 2002.

xxx Anuarul Statistic al României

statistica pt ects

Documents