carte statistica 2010 gogu emilia ucdc

37
CONF. UNIV. DR. EMILIA GOGU STATISTICA 1 CUPRINS: 1. CAPITOLUL 1. NOłIUNI INTRODUCTIVE ............................................................. 3 1.1. Scurt istoric al apariŃiei şi dezvoltării statisticii............................................................. 3 1.2. Obiectul şi metoda statisticii ........................................................................................... 4 1.3. Concepte de bază folosite în procesul de cercetare statistică ........................................ 5 2. CAPITOLUL 2. PRELUCRAREA PRIMARĂ A DATELOR STATISTICE ŞI PREZENTAREA INFORMAłIILOR OBłINUTE. .............................................................. 6 2.1. Prelucrarea statistică ...................................................................................................... 6 2.2. Gruparea şi clasificarea datelor statistice ...................................................................... 7 2.3. Prezentarea datelor statistice ......................................................................................... 8 3. CAPTOLUL 3. INDICATORII RELATIVI ÎN STATISTICA SOCIAL ECONOMICĂ ........................................................................................................................ 10 3.1. NoŃiune. DefiniŃie. ......................................................................................................... 10 3.2. Tipuri de mărimi relative ............................................................................................. 10 4. INDICATORII TENDINłEI CENTRALE, VARIAłIEI ŞI ASIMETRIEI ............. 13 4.1. Analiza seriilor de repartiŃie (distribuŃie) unidimensionale ........................................ 13 4.2. Indicatori de nivel şi de frecvenŃe ai seriilor de repartiŃie.......................................... 13 4.3. Indicatorii tendinŃei centrale ........................................................................................ 14 4.1.1. Mărimile medii ......................................................................................................... 14 4.1.2. Valori medii de pozi Ńie sau de structură .................................................................... 15 4.4. Indicatorii variaŃiei ....................................................................................................... 15 4.5. Media şi dispersia caracteristicii alternative ............................................................... 16 4.6. Asimetria ....................................................................................................................... 18 4.7. Indicatorii concentrării / diversificării ......................................................................... 22 5. CAPITOLUL 5. ANALIZA SERIILOR STATISTICE INTERDEPENDENTE, REGRESIA ŞI CORELAłIA STATISTICĂ........................................................................ 24 5.1. Tipuri de legături între fenomenele social-economice ................................................. 25 5.2. Metode şi procedee de verificare şi analiză a legăturilor statistice ............................. 27 5.3. Metode analitice (parametrice) de măsurare şi interpretare a legăturilor statistice.. 28 STATISTICA TEORETICĂ Conf. univ. dr. Emilia Gogu

Upload: george

Post on 01-Dec-2015

99 views

Category:

Documents


1 download

DESCRIPTION

suport curs

TRANSCRIPT

Page 1: Carte Statistica 2010 Gogu Emilia UCDC

CONF. UNIV. DR. EMILIA GOGU STATISTICA

1

CUPRINS:

1. CAPITOLUL 1. NO łIUNI INTRODUCTIVE ............................................................. 3

1.1. Scurt istoric al apariŃiei şi dezvoltării statisticii............................................................. 3

1.2. Obiectul şi metoda statisticii........................................................................................... 4

1.3. Concepte de bază folosite în procesul de cercetare statistică ........................................ 5

2. CAPITOLUL 2. PRELUCRAREA PRIMAR Ă A DATELOR STATISTICE ŞI PREZENTAREA INFORMA łIILOR OB łINUTE............................................................... 6

2.1. Prelucrarea statistică ......................................................................................................6

2.2. Gruparea şi clasificarea datelor statistice ...................................................................... 7

2.3. Prezentarea datelor statistice ......................................................................................... 8

3. CAPTOLUL 3. INDICATORII RELATIVI ÎN STATISTICA SOCI AL ECONOMIC Ă ........................................................................................................................ 10

3.1. NoŃiune. DefiniŃie. ......................................................................................................... 10

3.2. Tipuri de mărimi relative ............................................................................................. 10

4. INDICATORII TENDIN łEI CENTRALE, VARIA łIEI ŞI ASIMETRIEI ............. 13

4.1. Analiza seriilor de repartiŃie (distribuŃie) unidimensionale ........................................ 13

4.2. Indicatori de nivel şi de frecvenŃe ai seriilor de repartiŃie.......................................... 13

4.3. Indicatorii tendin Ńei centrale ........................................................................................ 14 4.1.1. Mărimile medii......................................................................................................... 14 4.1.2. Valori medii de poziŃie sau de structură .................................................................... 15

4.4. Indicatorii varia Ńiei ....................................................................................................... 15

4.5. Media şi dispersia caracteristicii alternative ...............................................................16

4.6. Asimetria ....................................................................................................................... 18

4.7. Indicatorii concentrării / diversific ării ......................................................................... 22

5. CAPITOLUL 5. ANALIZA SERIILOR STATISTICE INTERDEPEN DENTE, REGRESIA ŞI CORELA łIA STATISTIC Ă........................................................................ 24

5.1. Tipuri de legături între fenomenele social-economice ................................................. 25

5.2. Metode şi procedee de verificare şi analiză a legăturilor statistice ............................. 27

5.3. Metode analitice (parametrice) de măsurare şi interpretare a legăturilor statistice.. 28

STATISTICA TEORETIC Ă

Conf. univ. dr. Emilia Gogu

Page 2: Carte Statistica 2010 Gogu Emilia UCDC

CONF. UNIV. DR. EMILIA GOGU STATISTICA

2

6. CAPITOLUL 6. ANALIZA STATISTIC Ă A SERIILOR CRONOLOGIC Ă ........... 30

6.1. Seriile cronologice formate din indicatori absoluŃi...................................................... 32

6.2. Serii cronologice formate din indicatori relativi.......................................................... 32

6.3. Serii cronologice formate din indicatori medii ............................................................ 32

6.4. Serii cronologice de intervale (perioade) de timp ........................................................ 33

6.5. Ajustarea seriilor cronologice....................................................................................... 34

6.6. Extrapolarea seriilor cronologice ................................................................................. 37

Page 3: Carte Statistica 2010 Gogu Emilia UCDC

CONF. UNIV. DR. EMILIA GOGU STATISTICA

3

1. CAPITOLUL 1. NO łIUNI INTRODUCTIVE

1.1. Scurt istoric al apariŃiei şi dezvoltării statisticii

Cuvântul statistică are o semnificaŃie multiplă pentru cercetători, specialişti, studenŃi şi

populaŃie în general. Pentru cei mai mulŃi, statistica înseamnă doar o “descriere numerică” a unor date culese despre fenomenele de masă.

De-a lungul istoriei, datele au fost permanent colectate. În timpul civilizaŃiei egiptene, greceşti şi romane datele erau obŃinute în scopul primar al taxării şi înrolării în armată.

Astfel, în antichitate (cu 4-5 milenii î.e.n.) se întâlnesc forme de evidenŃă ce pot fi asimilate înŃelesului modern de recensăminte statistice, în special în China, Egipt, Grecia şi în Imperiul Roman. Recensămintele efectuate de romani (din 5 în 5 ani apoi din 10 în 10 ani) erau cunoscute sub denumirea de “cens”. În Dacia, ocupată de romani, evidenŃele care se făceau asupra populaŃiei, producŃiei şi consumului purtau denumirea de “tabularium”.

Se dezvoltă, de asemenea, evidenŃa cu caracter demografic. În Evul Mediu, instituŃiile bisericeşti, strângeau adesea şi păstrau informaŃii privind căsătoriile, naşterile, decesele.

Pe măsură ce s-au format statele civilizate statistica s-a diferenŃiat faŃă de formele de evidenŃă contabilă.

InformaŃiile şi datele statistice cu care intrăm în contact zilnic şi pe baza cărora se iau decizii sunt de cele mai multe ori rezultatul statisticii.

De regulă statistica ia naştere prin numărarea şi măsurarea acelor fenomene care se produc şi se reproduc într-un număr mare de cazuri

Nu orice expresie numerică obŃinută în urma măsurării şi numărării este statistica sau are de-a face cu statistica. CondiŃia necesara este existenŃa unor fenomene de masă. Statistica se ocupă cu studiul fenomenelor de masă care se mai numesc şi fenomene de tip colectiv, incerte indeterministe sau statistice. Fenomenele de masă prezintă anumite trăsături:

� se produc într-un anumit număr de cazuri. � prezintă un anumit grad de variabilitate în timp şi în spaŃiu. � fenomene multicauzale � sunt guvernate de legi statistice, legi care acŃionează ca tendinŃă şi ele pot fi cunoscute şi verificate numai la nivelul ansamblului.

Statistica studiază latura cantitativă a fenomenelor social-economice de masă în strânsă legătură cu latura calitativă.

Statistica studiază dimensiunea (mărimea) unui fenomen, structura şi mutaŃiile de atribuire intervenite în timp, dinamica (evoluŃia în timp) lui şi relaŃiile de interdependenŃă cu alte fenomene

Pentru studierea fenomenelor statistice folosim metode generale (deducŃia şi inducŃia) şi metode proprii. Pornind de la particularităŃile obiectului de studiu statistica şi-a elaborat de-a lungul timpului şi o metoda proprie de cercetare. Metoda statisticii constă în totalitatea procedeelor şi tehnicilor de culegere a datelor individuale de masă, de sistematizare şi prelucrare a lor şi de analiză şi interpretare a rezultatelor prelucrării.

Ca disciplină de învăŃământ statistica se diferenŃiază în teoria statisticii (statistica generală, statistica teoretică) care este formată din procedee şi metode elaborate de ea şi folosită pentru culegere, prelucrare şi analiză a datelor individuale de masă şi statistica economică care constă în aplicarea metodelor statistice la studiul concret al fenomenelor economice şi sociale.

Page 4: Carte Statistica 2010 Gogu Emilia UCDC

CONF. UNIV. DR. EMILIA GOGU STATISTICA

4

Statistica poate fi privită şi tratată ca o disciplină metodologică şi ea este totalitatea procedeelor şi metodelor utilizate pentru obŃinerea, sistematizarea şi prelucrarea unui număr mare de date empirice (reale) în scopul obŃinerii unui număr redus de expresii relevante pentru întregul ansamblu studiat.

Statistica este importantă pentru economişti şi nu numai, deoarece ea permite comprimarea unui număr mare de date individuale într-un număr mic de indicatori cu ajutorul cărora evidenŃiem ceea ce este esenŃial în nivelul de dezvoltare al fenomenului studiat.

Statistica fiind o disciplină metodologică se poate astfel aplica în diferite domenii de activitate. Indiferent de domeniul de aplicare este necesar ca statistica să opereze cu un sistem unitar de concepte.

Se poate afirma că statistica a apărut în necesitatea de a cunoaşte, în expresie numerică, o serie de fenomene, procese şi activităŃi social-economice.

Modul de gândire statistic ne impune să acceptăm că datele sunt în mod inerent variabile. Astfel gândirea statistică poate fi definită ca totalitatea ideilor orientate asupra căilor de

înŃelegere, control şi reducere a variaŃiei. În procesul istoric de conturare a statisticii moderne pot fi mai multe momente: � statistica practică � statistica descriptivă - care servea pentru descrierea aspectelor numerice ale

populaŃiei şi ale statului. Parte a statisticii ce rezumă datele empirice (intuitive, experimentale, practic, direct) privind fenomenele de masă investigate.

� aritmetica politică – înseamnă elaborarea unor concepte în care societatea este privită în ansamblul ei. Apar astfel noŃiuni de valoare medie şi de tendinŃe. Cele mai multe studii în această perioadă, s-au făcut pentru demografie, privind mişcarea populaŃiei. Astfel pe baza unui număr mare de date s-a elaborat pentru prima dată o regularitate cu privire la proporŃia dintre naşteri şi decese, separat pentru populaŃie feminină şi cea masculină.

Ex. Ca tendinŃă generală, la 1000 de fete se nasc 1005 băieŃi, dar probabilitatea de supravieŃuire este mai mică la băieŃi, astfel încât raportul dintre fetiŃe şi băieŃi este în jurul a 51% de sex feminin şi 49% sex masculin, ceea ce însemnă că speranŃa de viaŃă este mai mare pentru femei.

� calculul probabilităŃilor (statistica matematică) – se ocupă cu elaborarea unor noŃiuni şi modele valabile pentru orice domeniu din natură, societate sau tehnologie.

Statistica reprezintă arta şi ştiinŃa colectării şi înŃelegerii datelor ce caracterizează fenomenele de masă.

1.2. Obiectul şi metoda statisticii

Obiectul statisticii îl constituie studiul fenomenelor şi proceselor social-economice care

prezintă următoarele particularităŃi: � Se produc într-un număr suficient de mare de cazuri (sunt fenomene de masă); � Variază de la un element la altul, de la caz la altul; � Sunt forme individuale de manifestare în timp, în spaŃiu şi ca formă de organizare. Rezultă deci că obiectul de studiu al statisticii îl constituie fenomenele de masa care

prezintă proprietatea de a fi variabile ca forma de manifestare individuală în timp, în spaŃiu şi sub raport organizatoric.

Spre deosebire de fenomenele simple, fenomenele de masă se produc sub influenŃa unor factori sistematici sau întâmplători, esenŃiali sau neesentiali, de acelaşi sens sau de sensuri diferite şi au la baza legile de tip statistic. Pentru a cerceta şi verifică o lege statistică este necesar să fie analizate toate manifestările individuale ale fenomenului supus cercetării. In acest mod se creează condiŃiile necesare pentru manifestarea legii numerelor mari.

Page 5: Carte Statistica 2010 Gogu Emilia UCDC

CONF. UNIV. DR. EMILIA GOGU STATISTICA

5

Legea numerelor mari este un principiu fundamental al cercetării statistice care presupune luarea în considerare a unei colectivităŃi suficient de numeroase de cazuri individuale, astfel încât abaterile întâmplătoare, intr-un sens sau altul, se poate compensa, punându-se în evidenta o anumita marime/valoare care este tipica pentru întreaga colectivitate.

DefiniŃie. "Statistica este ştiinŃa care studiază aspectele cantitative ale determinărilor calitative ale fenomenelor de masă, fenomene care sunt supuse acŃiunii legilor statistice ce se manifesta în condiŃii concrete, variabile în timp şi spaŃiu. "

Fenomenele de masă se mai numesc şi : � fenomene de tip colectiv deoarece legea este valabilă pentru întregul ansamblu şi

numai întâmplător se verifică în fiecare caz în parte, � fenomene de tip statistic sau stochastic pentru că ele se supun legilor statistice1; � fenomene aleatoare pentru că între factorii de influenŃă există şi o componenŃă

aleatoare, � fenomene atipice pentru că forma lor de manifestare individuală este diferită; � fenomene nedeterministe ca urmare a faptului că modul de asociere a factorilor

esenŃiali cu cei neesenŃiali, a celor sistematici cu cei aleatori se poate schimba în timp, în spaŃiu sau ca formă organizaŃională,

Principala proprietate a acestor fenomene este variabilitatea în timp, spaŃiu şi ca formă de

organizare, dar care potrivit legii numerelor mari ea se compensează reciproc faŃă de linia generală de tendinŃă (ce exprimă esenŃialitatea fenomenelor legitatea lor de apariŃie şi dezvoltare).

Fenomenele de masă se întâlnesc în toate comportamentele vieŃii economice şi sociale şi ele nu pot fi studiate decât cu ajutorul metodelor statistice. Rezultatele cercetării lor se regăsesc în datele statistice publicate de Institutul NaŃional de Statistică în anuare, breviare şi buletine statistice precum şi în diferite studii publicate în edituri şi reviste de specialitate şi de OrganizaŃiile InternaŃionale.

Urmărind etapele oricărui proces de cunoaştere, pentru rezolvarea problemelor care fac obiectul sau de studiu, statistica, ca orice ştiinŃa, şi-a elaborat procedee şi metode speciale de cercetare.

Metoda statisticii este formată din totalitatea procedeelor şi operaŃiilor specifici de culegere, prelucrare şi analiză statistică a fenomenelor din realitatea economică şi socială în cadrul cărora activează legile statistice.

Complexitatea şi amploarea cercetării statistice fac necesară perfecŃionarea continuă a metodelor de observare, prelucrare şi analiză. Dezvoltarea metodelor statisticii este strâns legată de progresele înregistrate în teoria probabilităŃilor, statistica matematică şi în domeniul informaticii. Necesitatea prelucrării unui volum mare de date a dus la dezvoltarea maşinilor de calul şi implicit la formarea programelor de calul. (Ex. EXCEL, Statistic, SPPS, SAS.)

1.3. Concepte de bază folosite în procesul de cercetare statistică

În statistică se folosesc o serie de noŃiuni (concepte) de bază cu care se operează în toate etapele cercetării şi în toate statisticile aplicate:

a) Colectivitatea (populaŃia) statistică b) Unitate statistică: c) Caracteristici (variabile) statistice d) Date şi indicatori statistici. e) Măsurarea statistică

1 Legea statistică – lege care acŃionează în cadrul unui ansamblu de unităŃi, de fenomene sau de procese de aceiaşi esenŃă şi exprimă valoarea medie, predominantă purtată de majoritatea elementelor unui ansamblu distribuit după o variabilă.

Page 6: Carte Statistica 2010 Gogu Emilia UCDC

CONF. UNIV. DR. EMILIA GOGU STATISTICA

6

f) Estimare statistică. g) Eroare statistică

2. CAPITOLUL 2. PRELUCRAREA PRIMAR Ă A DATELOR STATISTICE ŞI PREZENTAREA INFORMA łIILOR OB łINUTE.

2.1. Prelucrarea statistică

Prelucrarea statistica – este un proces prin care datele înregistrate sunt sistematizate şi tratate statistic în vederea obŃinerii sistemului de indicatori statistici. ObŃinerea indicatorilor statistici este necesară pentru caracterizarea în expresii numerice generalizatoare, a ceea ce este esenŃial pentru un grup de unităŃi sau pentru întreaga colectivitate, studiate în condiŃii de timp şi de spaŃiu.

Prelucrarea primară înseamnă în acelaşi timp şi centralizarea, sistematizarea şi omogenizarea datelor observării în vederea aplicării modelelor de calcul şi analiză satistică

Sistematizarea datelor înregistrate presupune ordonarea acestora în funcŃie de omogenitatea lor.

Deci la baza sistematizării se află principiul omogenităŃii. (Ex. pentru formularea unei idei sau a unei fraze de compliment – cuvintele trebuiesc alese (grupate), sau (clasificarea studenŃilor după notele obŃinute la examenul de statistică). Principiul omogenităŃii este un principiu de pierdere a informaŃiei pentru a câştiga informaŃie.

Însăşi sistematizarea se realizează prin : a) centralizarea şi b) gruparea statistica a datelor.

a) centralizarea – presupune totalizarea unităŃilor statistice sau a valorilor unei caracteristici la nivelul grupelor tipice sau al colectivităŃii observate. Totalizarea valorilor unei caracteristici se face prin însumarea directa sau prin folosirea unor coeficienŃi de echivalenta (preturi, timpul de munca etc.) În urma centralizării obŃinem mult doriŃii indicatori statistici de nivel (ex, nr. populaŃiei unei localităŃi, valoarea producŃiei)

• Centralizarea simplă şi obŃinerea indicatorilor (agregatelor) generali Variabile însumabile direct Nr.crt.

al unităŃii X1 X2 ………… Xp

1 x11 x21 … xp1

2 x12 x22 … xp2 … … … … … i x1i x2i … xpi

… … … … … n x1n x2n … xpn

Total ∑

=

n

iix

11 ∑

=

n

iix

12

… ∑

=

n

ipix

1

Page 7: Carte Statistica 2010 Gogu Emilia UCDC

CONF. UNIV. DR. EMILIA GOGU STATISTICA

7

Pe orizontală se găseşte fiecare unitate cu toate variantele înregistrate la toate caracteristicile (variabilele) înregistrate, iar pe verticală sunt distribuŃiile de valori ale celor p variabile independente înregistrate.

2.2. Gruparea şi clasificarea datelor statistice

Gruparea statistică – este o centralizare pe grupe a unităŃilor unei colectivităŃii. Se obŃine în baza aplicării metodei grupărilor statistice presupunând principiul omogenităŃii.

Omogenitatea statistică înseamnă ca în grupa (clasa) respectivă să existe variaŃie minimă între variantele înregistrate – variaŃie care poate fi explicată ca fiind influenŃa factorilor aleatori.

În forma grupării statistice – rezultă şiruri de date ordonate după variaŃie, în sens crescător sau descrescător, a caracteristicilor de grupare. � După conŃinutul caracteristicii de grupare putem avea:

• grupări cronologice în cazul în care sistematizarea datelor se face după o variabilă de timp;

• grupări teritoriale când sistematizarea datelor se face după o variabilă de spaŃiu;

• grupări atributive se folosesc pentru toate caracteristicile, în afara caracteristicilor de timp şi spaŃiu.

Caracteristicile atributive pot fi caracteristici cantitative (numerice) şi calitative (nenumerice).

� După numărul variabilelor de grupare pot fi: simple şi combinate. Grupările simple (după o singură variabilă .) pot fi: a) gruparea pe variante dacă amplitudinea variaŃiei este mică şi la nivelul

unităŃilor individuale s-au înregistrat un număr mic de valori distincte (variante);

b) c) gruparea pe intervale de variaŃie egale dacă amplitudinea variaŃiei este

moderată. În acest caz, e necesar, să se stabilească numărul de grupe şi mărimea intervalului de variaŃie.

c) gruparea pe intervale de variaŃie neegale. Prin gruparea pe intervale neegale se

urmăreşte să se structureze colectivitatea pe tipuri calitative, dacă nu se cunosc valorile (pragurile) care separă tipurile calitative, se procedează mai întâi la gruparea pe intervale egale şi apoi se poate folosi criteriul mediei pentru formarea tipurilor calitative “mic”, “mediu”, “mare”. In acest caz se obŃine o grupare tipologică.

Gruparea combinată presupune sistematizarea datelor după două sau mai multe

caracteristici de grupare (cel mult 4) care pot fi variabile numerice şi/sau calitative. Gruparea combinată impune stabilirea ordinii de grupare pe baza relaŃiei de interdependenŃă dintre variabile. Grupele formate după prima caracteristică se regrupează după cea de a doua ş.a.m.d.

Clasificarea (gruparea pentru variabile calitative) se efectuează după variabile nenumerice (calitative) şi presupune includerea în aceeaşi grupă (clasă) a tuturor

Page 8: Carte Statistica 2010 Gogu Emilia UCDC

CONF. UNIV. DR. EMILIA GOGU STATISTICA

8

unităŃilor la care s-a înregistrat aceeaşi formă de manifestare a caracteristicii. De regulă, are un caracter oficial (ex. CAEN) şi în prealabil trebuie stabilit un nomenclator al claselor.

2.3. Prezentarea datelor statistice

Rezultatul sistematizării necesită o prezentare sub o forma cât mai comod de manevrat şi vizualizat, sub forma de :

a) serii, b) tabele c) grafice.

a) Seriile statistice Enumerarea datelor statistice într-o anumită ordine se numeşte serie statistică.

Seria statistică se reprezintă ca două şiruri de date. Primul şir este criteriul de enumerare (valori , variante) al doilea şir conŃine datele numerice. Seriile statistice sunt de următoarele feluri

1. Serii de repartiŃie sau de distribuŃie 2. Serii cronologice (ale dinamicii )sau serii de timp. 3. Serii teritoriale sau de spaŃiu. 4. Serii descriptive sau enumerative (lista candidaŃilor admişi, facultatea, media de

liceu , media examenelor, şcoala absolvită etc.) 5. Serii unidimensionale şi multidimensionale

La rândul lor seriile statistice pot fi atât numerice (cantitative) cât şi nenumerice (calitative).

b) Tabele statistice. Prezentarea datelor sub forma unui tabel statistic permite atât o bună vizualizare cât şi mai ales, efectuarea diverselor calcule în procesul de prelucrare a datelor.

Pot fi tabele cu o singură intrare şi cu două sau mai multe intrări, tabele de lucru şi de prezentare a rezultatelor. În elaborarea unui tabel se identifică următoarele elemente şi reguli principale: � titlul tabelului � macheta tabelului � subiectul tabelului - colectivitatea şi componentele ei � predicatul tabelului - constituie variantele şi indicatorii cu care caracterizăm statistic

colectivitatea studiată. � Unitatea de măsură � Sursa datelor (sub tabel) � Numerotarea tabelelor (sus) c) Reprezentări grafice – Cu ajutorul graficilor se vizualizează informaŃiile statistice facilitând perceperea pe ansamblu a datelor, aspecte privind: variaŃia valorilor observate, repartiŃia lor, legăturile existente între ele, a evoluŃiei valorilor în timp ş.a. Graficul trebuie să cuprindă: � Titlul – (precizându-se şi limitele fenomenului) � Legenda � Sistemul axelor rectingulare (ox, oy, oz) Principalele tipuri de grafice sunt:

Page 9: Carte Statistica 2010 Gogu Emilia UCDC

CONF. UNIV. DR. EMILIA GOGU STATISTICA

9

� grafice de volum � grafice de structură � grafice prin benzi � grafice prin coloane simple sau în aflux � cronogramă (historiogramă) pe scară uniformă sau logaritmică � diagrama polară (radială) � histograma � poligonul frecvenŃelor � curba cumulativă a frecvenŃelor � graficul lui Lorentz � cartograma � cartodiagrama.

Page 10: Carte Statistica 2010 Gogu Emilia UCDC

CONF. UNIV. DR. EMILIA GOGU STATISTICA

10

3. CAPTOLUL 3. INDICATORII RELATIVI ÎN STATISTICA SOCI AL ECONOMIC Ă

3.1. NoŃiune. DefiniŃie.

Indicatorii relativi se obŃin prin aplicarea unui model de comparaŃie sub formă de raport. Deci prin mărimi relative în Ńelegem rezultatul raportării a doi indicatori absoluŃi.

Indicatorul din numărătorul raportului se numeşte indicatorul raportat, iar cel din numitor, indicatorul bază de raportate. Alegerea bazei raportate se face în funcŃie de scopul comparării.

Mărimile relative se pot exprima prin coeficienŃi, %, promile, prodecimile cât şi procentimile.

Ex. Natalitatea = 1000 populatiei almediu nr

viinr.nãscuti ⋅ (5 născuŃi la 1000 persoane); nr

medicilor ce revine la 10.000 locuitori . Mai rar se întâlnesc exprimării în procentimile, adică cât unităŃi din indicatorul raportat revin la 100.000 unităŃi bază de raportare.

Alegerea formei de exprimare se face astfel încât mărimile relative să fie sugestive. Dar forma cea mai obişnuită de exprimare a lor este cea a procentelor care arata câte unităŃi din indicatorul raportat revin la 100 unităŃi ale indicatorului baza de raportare.

Forma de exprimare a mărimilor relative se stabileşte în raport cu gradul de variaŃie al fenomenelor, a scopului urmărit, precum si particularităŃile specifice fenomenului cercetat. Pentru calculul unei mărimi relative, trebuie respectate 3 cerinŃe:

a) între termenii comparaŃi trebuie să existe o legătură firească de condiŃionare sau de cauzalitate;

b) termenii comparaŃi să fie cu adevărat comparabili din punctul de vedere al sferei de cuprindere, ca metodologie de calcul etc;

c) baza de comparaŃie să aibă o anumită semnificaŃie în evoluŃia fenomenului studiat.

În cea mai mare parte mărimile relative în satistică nu prezintă o dificultate de calcul. Cele mai multe dificultăŃi apar în comparaŃiile internaŃionale, unde indicatorii provin din diferite surse sau sunt calculaŃi după metodologii diferite.

3.2. Tipuri de mărimi relative

În principal se pot calcula următoarele tipuri de mărimi relative: a) de structura; b) de coordonare (corespondenŃă); c) de ale dinamicii; d) ale planului (programării). e) de intensitate

a) Mărimea relativă de structură se poate calcula de fiecare dată când s-a aplicat metoda grupării prin urmare calculul lor este posibil atunci când colectivitate este separată înde două sau mai multe grupe. Este un raport dintre o parte la întreg (total).

- daca se determina pentru frecventa fiecărei grupe se numesc ponderi iar daca se determina pentru valorile centralizate ale diferitelor caracteristici se numesc greutăŃi specifice

100**∑

=i

ii x

xx

Page 11: Carte Statistica 2010 Gogu Emilia UCDC

CONF. UNIV. DR. EMILIA GOGU STATISTICA

11

specifice care se obŃin ca mărimi relative de structură raportând frecvenŃa fiecărei grupe (ni , fi )

la totalul frecvenŃelor ( ∑∑==

k

ii

k

ii fn

11

, ) după relaŃia:

- 100**;100**

1

(%)

1

(%)

∑∑==

==k

ii

iik

ii

ii

n

nn

f

ff .

FrecvenŃele relative permit analiza structurii unei serii de distribuŃie în funcŃie de una sau mai multe variabile (caracteristici) şi compararea repartiŃiilor empirice cu cele teoretice.

Având caracter de mărimi relative se pot exprima sub formă de coeficienŃi sau în procente şi fiind “eliberate” de aspectul concret al exprimării unităŃilor centralizate pe grupe devin comparabile pentru orice fel de serie şi mai ales cu probabilităŃile din distribuŃiile teoretice.

b) Mărimile relative de coordonare sau corespondenŃă caracterizează raportul numeric în care se găsesc doi indicatori cu acelaşi conŃinut în spaŃii diferite coexistente în timp.

Pentru o colectivitate împărŃită în două grupe pentru care nivelul pe grupe al variabilei studiate este xA şi xB :

Forma de prezentare ar fi: :A

BAB

B

ABA X

XsauK

X

XK == //

unde: A şi B unităŃi teritoriale. XA şi XB nivelul colectivităŃii de raportate din unitatea A respectiv B

Mărimi relative de coordonare se pot calcula şi pornind de la frecvenŃe:

n

nK

B

ABA =/ sau

n

nK

A

BAB =/

De regulă ei se exprimă în coeficienŃi.

c) ale dinamicii – se obŃine ca raport a doi indicatori al aceluiaşi fenomen dar aflate între două momente /perioade diferite. Pentru a studia în dinamică recurgem la serii cronologice. În generale o serie statistică este formată din 2 şiruri de date în care I şir reprezintă criteriul de sistematizare (factorul e grupare) al II -lea şir variabila dependentă de factorul de grupare Analiza se face atât în bază fixă cât şi mobilă (în lanŃ). * Indicatorii relativi obŃinuŃi prin raportare exprimă indicele de variaŃie

- cu bază fixă 100*0

0/ X

XK i

i =

- cu bază mobilă (în lanŃ) 100*1

1/−

− =i

Iii X

XK

Putem calcula mărimi relative ale dinamicii la nivelul ansamblului, dacă variabila este aditivă direct:

∑∑=

00/ x

xk t

t respectiv ∑∑

−− =

11/

t

ttt x

xk

Ele se exprimă atât sub formă de coeficienŃi dar mai adesea sub formă % .

Reprezentarea grafică: Mărimile relative d. se reprezintă grafic prin: - cronograme (histograme)

d) Mărimile relative ale programării (planific ării)

Page 12: Carte Statistica 2010 Gogu Emilia UCDC

CONF. UNIV. DR. EMILIA GOGU STATISTICA

12

Se calculează la nivelul unităŃilor economice fiind necesar să se elaboreze programe de aprovizionare, producŃie şi desfacere pe termene scurte sau mai lungi.

Calculul mărimilor relative ale planului presupune preluarea din evidenŃele unităŃii economice analizate a informaŃiilor referitoare la:

• nivelul fenomenului analizat în perioada de bază (x0); • nivelul planificat (programat) în perioada curentă (xpl) • nivelul realizat în perioada curentă (x1).

Din compararea sub formă de raport a celor trei indicatori rezultă:

• - coeficientul sarcinii de plan: 0

0/ x

xk pl

pl =

• - coeficientul îndeplinirii planului: x

xk

plpl

1/1 =

• - coeficientul de dinamică: x

xk

0

10/1 =

Între cei trei coeficienŃi există relaŃia: • kkk plpl /10/0/1 .=

Interpretarea valorii mărimilor relative ale planului ca şi a ratei de depăşire (nerealizare) se face în raport cu conŃinutul economic al indicatorului (de creştere sau de reducere obiectivă a fenomenului).

Putem calcula mărimi relative ale planului la nivel de ansamblu, pentru variabile însumabile direct:

• ∑

∑=x

xk

plpl

00/ respectiv

∑∑=

x

xk

plpl

1/1

De cele mai multe ori mărimile relative de dinamică şi mărimile relative ale planului se exprimă procentual.

e) Mărimile relative de intensitate se obŃin prin raportarea a doi indicatori absoluŃi de natura diferita, dar care se află într-un raport de interdependenŃă. RelaŃia de calcul este:

• la nivel parŃial: Z

YXi

i=

Aceste mărimi se pot calcula pentru fiecare grupa de unităŃi în parte sau pentru întreaga colectivitate.

• la nivelul ansamblului: i

Ii Z

YX

∑∑= sau

∑∑=

Z

ZXx

i

i i

Ex: Densitatea populaŃiei (loc/km2,) Productivitatea muncii (lei/munc).

Mărimile relative de intensitate au numerose aplicaŃii în: - industrie ( coeficientul mecanizării, automatizării, utilizării intensive etc.) - agricultură (coeficientul chimizări, irigaŃiilor, recolta medie la ha); - turism (indicatorii eficienŃei activităŃii de turism, productivitatea muncii etc) - demografice (coeficientul mişcării naturale, migratorii a populaŃiei)

Page 13: Carte Statistica 2010 Gogu Emilia UCDC

CONF. UNIV. DR. EMILIA GOGU STATISTICA

13

4. INDICATORII TENDIN łEI CENTRALE, VARIA łIEI ŞI ASIMETRIEI

4.1. Analiza seriilor de repartiŃie (distribuŃie) unidimensionale

Rezultatul grupării şi clasificării unităŃilor colectivităŃii observate în funcŃie de

caracteristici atributive cantitative sau calitative se prezintă sub forma seriilor de repartiŃie (distribuŃie) empirică. Ele se mai numesc simplu repartiŃii sau distribuŃii statistice.

Grupările simple (după o singură caracteristică) conduc la serii statistice independente sau unidimensionale, iar cele combinate la serii statistice condiŃionate sau multidimensionale.

La calculul şi analiza indicatorilor (parametrilor) distribuŃiilor empirice trebuie avute în vedere o serie de proprietăŃi, care se pot întâlni în toate cazurile, dar cu forme specifice fiecărei serii. MenŃionăm în continuare principalele proprietăŃi ale unei serii de repartiŃie: variabilitatea, omogenitatea, independenŃa şi concentrarea/dispersia către/faŃă de una sau mai multe valori ale seriei care stau la baza indicatorilor cu care definim (descriem) seria.

Variabilitatea termenilor unei serii statistice de repartiŃie este determinată de faptul că fenomenele de masă pe care le prezintă nu sunt fenomene univoc determinate, ci ele apar ca rezultat al acŃiunii combinate a mai multor cauze, unele cu caracter esenŃial, altele cu caracter întâmplător, care se manifestă, de regulă, în condiŃii individuale diferite. Cu cât acŃiunea cauzelor aleatoare este mai puternică, cu atât variabilitatea termenilor este mai mare iar gradul de omogenitate este mai mic.

Omogenitatea termenilor unei serii de repartiŃie se explică prin faptul că toate valorile au acelaşi conŃinut, depinzând de acelaşi factor esenŃial. Omogenitatea statistică care poate fi explicată prin influenŃa aleatoare a componenŃei factorilor presupune o variaŃie minimă între termeni. RepartiŃiile empirice pot avea omogenităŃi diferite în funcŃie de modul de combinare a factorilor care determină variabila studiată şi ele trebuie măsurate prin indicatori statistici corespunzători.

Dacă în urma analizei statistice se constată că seria nu prezintă omogenitate, se trage concluzia că această colectivitate este formată din mai multe tipuri calitative şi deci, seria respectivă trebuie separată în două sau mai multe serii componente. În situaŃii de acest gen este necesar să se verifice în ce măsură tendinŃa generală de variaŃie din întreaga colectivitate se regăseşte în forma de variaŃie specifică fiecărei grupe şi să se interpreteze acŃiunea sistematică a factorilor esenŃiali la nivelul fiecărei grupe şi pe ansamblu. Se vor folosi şi în acest scop indicatori medii de variaŃie şi asimetrie parŃiali şi totali prezentaŃi în subcapitolele următoare.

IndependenŃa termenilor unei serii de repartiŃie de frecvenŃe provine din faptul că fiecare valoare individuală se înregistrează pentru o unitate statistică ce reprezintă un element distinct şi obiectiv al unei colectivităŃi statistice. Această independenŃă este relativă deoarece unităŃile statistice aparŃinând aceleiaşi colectivităŃi se supun aceloraşi legi care se manifestă sub formă de tendinŃă. FaŃă de aceasta tendinŃă există abateri într-un sens sau altul, care pentru un număr mare de cazuri, se compensează reciproc. De aceea, este necesar ca prin metode statistice corespunzătoare, să se afle trăsăturile esenŃiale şi comune care leagă aceste valori individuale relativ independente, dar care aparŃin aceleaşi structuri calitative şi care în statistică este cunoscută sub denumirea de ,,legea de repartiŃie a seriei “.

4.2. Indicatori de nivel şi de frecvenŃe ai seriilor de repartiŃie

Caracterizarea statistică a unui fenomen de masă într-o colectivitate statistică presupune

luarea în consideraŃie atât a valorilor individuale (ca forme concrete de manifestare) cât şi a

Page 14: Carte Statistica 2010 Gogu Emilia UCDC

CONF. UNIV. DR. EMILIA GOGU STATISTICA

14

frecvenŃelor de apariŃie a acestora. În acest sens, fiecare serie are o structură condiŃionată de valorile pe care le ia caracteristica (variabila) în condiŃiile date de timp, spaŃiu şi organizatorice. De aceea, analiza seriilor de repartiŃie debutează de obicei cu calculul indicatorilor determinaŃi pe baza frecvenŃelor de apariŃie ale valorilor individuale ale caracteristicii.

Indicatorii de nivel ai seriei pot fi exprimaŃi în cazul variabilelor numerice prin variante în cazul grupării pe variante. În cazul intervalelor de variaŃie se utilizează ca indicator de nivel centrul (mijlocul) intervalului de grupare.

În grupa indicatorilor de frecvenŃă deosebim: frecvenŃe absolute, frecvenŃe relative şi frecvenŃe cumulate.

FrecvenŃele absolute notate în unele lucrări cu "fi" sau "ni " în altele, reprezintă numărul de unităŃi care corespunde grupelor de unităŃi (variante sau intervale de valori) obŃinut ca rezultat al centralizării statistice. FrecvenŃele absolute se exprimă în unităŃi concrete (număr de salariaŃi, număr de agenŃi comerciali, număr de unităŃi turistice, număr de depunători CEC etc.). FrecvenŃele absolute stau la baza calculului frecvenŃelor relative.

FrecvenŃele relative permit analiza structurii unei serii de distribuŃie în funcŃie de una sau mai multe variabile (caracteristici) şi compararea repartiŃiilor empirice cu cele teoretice.

FrecvenŃele cumulate sunt comparabile între ele indiferent de felul de intervalului de grupare. De asemenea ele stau la baza stabilirii medianei şi a celorlalte medii de structură sau poziŃie – indicatori care vor fi prezentaŃi într-un subcapitol din acest capitol.

4.3. Indicatorii tendin Ńei centrale

Analiza statistică a trăsăturilor esenŃiale ale fenomenelor de masă, stabilirea tendinŃelor ce apar în producerea lor necesită calcularea anumitor valori sintetice cu conŃinut de valori tipice, care să fie reprezentative pentru întreaga serie studiată.

În funcŃie de gradul de variabilitate a valorilor individuale, de sursele de date de care dispunem şi de nevoile de cunoaştere, în teoria şi practica statistică se utilizează ca principali indicatori ai tendinŃei centrale: mărimile medii; mediana; şi modul (dominanta) seriei.

4.1.1. Mărimile medii

Media în statistică reprezintă principalul indicator sintetic cu care se caracterizează un număr mare de valori individuale diferite ca forme de manifestare dar având acelaşi conŃinut. În consecinŃă, mărimile medii sunt utilizate ca instrumente principale de cunoaştere a fenomenelor de masă, deoarece numai pe baza lor se poate exprima ceea ce este comun şi general în forma de manifestare a acestor fenomene, în fiecare etapă dată, prin eliminarea a ceea ce este întâmplător şi neesenŃial în producerea lor.

In analiza seriilor de repartiŃie de frecvenŃe se pot calcula următoarele tipuri de medii:

- media aritmetică ( ax sau dacă nu se mai foloseşte şi altă medie simplă x );

- media armonica ( hx );

- media pătratica ( px );

- media geometrică ( gx ). Fiecare poate fi calculată ca medie simplă şi ca medie ponderată. Mediile simple se folosesc în cazul datelor negrupate sau când repartiŃiile au intervale cu

frecvenŃe egale între ele şi deci se pot simplifica. Mediile ponderate se utilizează pentru repartiŃiile în care fiecărei valori a caracteristicii i

se ataşează o frecvenŃă care diferă de la caz la caz. In statistica social-economică , cel mai frecvent se foloseşte media aritmetică.

Page 15: Carte Statistica 2010 Gogu Emilia UCDC

CONF. UNIV. DR. EMILIA GOGU STATISTICA

15

4.1.2. Valori medii de poziŃie sau de structură

Mărimile medii fiind o sinteză a tuturor valorilor seriei reflectă ceea ce este esenŃial şi

tipic în nivelul de dezvoltare a fenomenului fără să caracterizeze şi modul de repartiŃie a frecvenŃelor în cadrul seriei.

De aceea, pentru completarea analizei seriilor de distribuŃie este necesar să se calculeze şi anumite valori medii de poziŃie sau medii de structură, care să evidenŃieze şi forma de repartiŃie a frecvenŃelor. Dintre acestea, mediana şi modul sunt cel mai frecvent utilizate, fiind considerate tot ca indicatori ai tendinŃei centrale.

Mediana (Me) reprezintă valoarea centrală a unei serii statistice, ordonate crescător sau descrescător, care împarte termenii seriei în două părŃi egale.

Indiferent de tipul seriei (simplă sau cu frecvenŃe) la calculul medianei se cer rezolvate două

Modul (Mo) unei distribuŃii statistice reprezintă acea valoare a caracteristicii care corespunde celui mai mare efectiv sau celei mai mari frecvenŃe.

Cu alte cuvinte, modul este valoarea cea mai frecvent întâlnită, motiv pentru care mai este cunoscut în literatura de specialitate şi sub denumirea de dominanta seriei.

Pentru serii simple (date negupate) modul se calculează dacă întâlnim o valoare a variabilei care se repetă de mai multe ori.

Cuartilele sunt acele valori ale caracteristicii, care separă seria în patru părŃi egale: cuartila inferioară, notată cu Q1, este mai mare sau egală de 25% din termenii seriei şi mai mică sau egală de 75% dintre ei; cuartila a doua Q2 coincide cu Me şi separă seria în două părŃi egale ca efectiv; cuartila superioară Q3 este mai mare sau egală de 75% din numărul termenilor şi mai mică sau egală de 25% din numărul lor.

4.4. Indicatorii varia Ńiei

Într-o colectivitate statistică valorile individuale (variantele) diferă mai mult sau mai

puŃin unele faŃă de altele. Ele pot fi mai apropiate sau mai împrăştiate. Or după cum s-a precizat la metodele grupării, valorile pot fi omogene între ele numai dacă prezintă variaŃie minimă şi media ca sinteză a acestor valori va fi o valoare tipică, reprezentativă. De aceea, comparaŃia se face, în principal, cu media aritmetică, considerată ca fiind valoarea cea mai reprezentativă pentru colectivitatea studiată. De cele mai multe ori este important de cunoscut cât de departe sunt valorile variantelor seriei faŃă de această medie, sau cu alte cuvinte care este dispersia variantelor în cadrul seriei sau câmpul de variaŃie a caracteristicii înregistrate.

Se apreciază că dacă variantele au valori mai apropiate de valoarea mediei seriei, deci prezintă abateri mici, media este reprezentativă.

În practica statistică de cele mai multe ori datele care trebuie să fie analizate sunt extrem de numeroase şi de regulă cu o amplitudine mare a variaŃiei. De aceea este necesar să separăm şi să stabilim intensitatea cu care activează cele două grupe de factori esenŃiali şi întâmplători având drept consecinŃă imediată un anumit grad de variabilitate.

Dacă am limita analiza numai la determinarea şi interpretarea mărimii medii nu ar fi posibilă cunoaşterea condiŃiilor concrete în care apar şi se dezvoltă fenomenele şi nici depistarea tendinŃelor evolutive ale variabilităŃii acestor fenomene.

Cu cât fenomenele sunt mai complexe, deci dependente de mai mulŃi factori, cu atât variaŃia este mai mare şi utilizarea mărimilor medii devine insuficientă fără verificări riguroase

Page 16: Carte Statistica 2010 Gogu Emilia UCDC

CONF. UNIV. DR. EMILIA GOGU STATISTICA

16

cu privire la omogenitatea datelor luate în calcul şi în consecinŃă la stabilitatea şi reprezentativitatea lor. O medie este considerată în statistică ca fiind reprezentativă numai atunci când se calculează din valori omogene între ele.

Analiza statistică a unei repartiŃii poate fi aprofundată prin calculul indicatorilor de variaŃie. Aceşti indicatori trebuie să servească la:

verificarea reprezentativităŃii mediei ca valoare tipică a unei serii de date statistice; verificarea gradului de omogenitate a seriei; caracterizarea statistică a formei şi gradului de variaŃie a unei caracteristici; compararea în timp şi spaŃiu a mai multor serii statistice de distribuŃie pentru aceeaşi caracteristică sau pentru caracteristici interdependente care au fost înregistrate pentru aceeaşi colectivitate; cunoaşterea gradului de influenŃă a factorilor după care s-a făcut gruparea unităŃilor observate. Studiul variaŃiei unei serii statistice se bazează în principal pe folosire ca valoarea tipică a mediei aritmetice . În scopuri speciale, sau pentru completarea analizei variaŃiei se poate folosi o altă valoare a tendinŃei centrale (mediana, mediala, modul), sau pe zone de variaŃiei mediile de structură (centilele, decilele). Indicatorii variaŃiei pot fi calculaŃi ca indicatori simpli şi ca indicatori sintetici.

4.5. Media şi dispersia caracteristicii alternative

În practica de cercetare statistică a fenomenelor social-economice se întâlnesc caracteristici ale căror variante nu se exprimă numeric (cantitativ) ci prin cuvinte (calitativ) şi nu admit decât una sau alta dintre alternative. În cazul în care caracteristica urmărită este alternativă unităŃile colectivităŃii se împart în două: o grupă care cuprinde acele unităŃi la care se înregistrează forma directă de manifestare a caracteristicii şi o altă parte a colectivităŃii la care se înregistrează opusul formei de manifestare a caracteristicii. De exemplu: starea unei piese poate fi bună sau defectă, situaŃia unui student după susŃinerea unui examen poate fi promovat sau nepromovat, operaŃia unui pacient poate fi reuşită sau nereuşită etc. De menŃionat faptul că orice caracteristică numerică nealternativă se poate transforma într-o caracteristică alternativă prin raportarea la medie sau la un anumit prag. În acest caz, unităŃile colectivităŃii se vor separa în două grupe: unităŃi cu un nivel de dezvoltare mai mic decât media sau decât o valoare aleasă şi a doua grupă formată din unităŃile cu nivel de dezvoltare mai mare decât media sau peste valoarea aleasă.

Pentru caracterizarea statistică a variabilelor alternative este necesară o cuantificare a valorilor. Considerând răspunsurile respective ca fiind cele două variante ale caracteristicii, pentru exprimarea lor cantitativă s-au stabilit următoarele valori convenŃionale:

pentru DA; x1=1 pentru NU; x2=2 Numărul de unităŃi (frecvenŃele) din cele două grupe este diferit iar distribuŃia lor se

prezintă în tabelul 4.8. Pentru distribuŃia prezentată în tabel, media caracteristicii se va calcula aplicând relaŃia

mediei aritmetice ponderate, astfel:

pN

M

MNN

MN0M1 ==−+

−⋅+⋅)(

)(

Se observă că media caracteristicii alternative reprezintă tocmai frecvenŃa relativă a răspunsurilor afirmative.

Tabelul 4.8 DISTRIBUłIA DE FRECVENłE A CARACTERISTICII ALTERNATIVE

Valoarea Răspunsul FrecvenŃe absolute FrecvenŃe relative

Page 17: Carte Statistica 2010 Gogu Emilia UCDC

CONF. UNIV. DR. EMILIA GOGU STATISTICA

17

caracteristicii înregistrat 0 1 2 3

x1 = 1 DA M (numărul unităŃilor care posedă caracteristica)

x2 = 0 NU (N-M) (numărul de unităŃi care nu

posedă caracteristica)

qN M

N1 p= − = −

Total N=M+(N-M) p+q = 1 Dispersia caracteristicii alternative se obŃine pornind de la relaŃia de calcul obişnuit al

dispersiei, cu frecvenŃe relative, în care se folosesc elementele specifice:

qp

qp0pp1 222p +

⋅−+⋅−=

)()(σ

Deoarece p + q = 1, atunci (1 - p) = q şi formula devine:

σ

σ σ

p

q p p q

p q

p q q p

p qp q p p

p q p p

22 2

1

1

= ⋅ + ⋅+

= ⋅ ⋅ ++

= ⋅ = ⋅ −

= ⋅ = ⋅ −

( )( )

( )

deci

saup2

p2

Dispersia caracteristicii alternative este egală cu produsul dintre cele două frecvenŃe relative.

Abaterea medie pătratic ă se determină potrivit metodologiei clasice - ca rădăcină pătrată din dispersie:

σ p p q= ⋅

Aceşti indicatori sunt folosiŃi pe scară largă în cercetările selective şi mai ales în controlul statistic al calităŃii produselor.

Dispersia şi abaterea medie pătratică a caracteristicii alternative prezintă anumite particularităŃi:

a) dispersia poate lua numai valori cuprinse în intervalul 0 0 252≤ ≤σ p , iar abaterea

medie pătratică numai valori cuprinse în intervalul 0 0 5≤ ≤σ p , ;

b) când p=q dispersia şi abaterea standard ating valorile maxime: σ σp p2 0 25 0 5= =, ; , ;

c) dacă p<q şi p creşte uniform în cadrul intervalului: 0 < p < 0,5 atât σ p2 cât şi σ p

înregistrează o creştere mai rapidă la început şi mai lentă către limita superioară; d) dacă p > q şi p continuă să crească uniform în cadrul intervalului: 0,5 < p < 1,

dispersia şi abaterea medie pătratică înregistrează o scădere în acelaşi ritm în care a avut loc şi creşterea.

În cazul în care colectivitatea este împărŃită în grupe şi se studiază variaŃia unei caracteristici alternative, atunci se calculează dispersiile din fiecare grupă, media lor, dispersia dintre grupe şi dispersia colectivităŃii totale, după formulele:

Dispersia de grupă pentru o caracteristică alternativă (σ pi

2 ) se calculează după

relaŃia:

σ σp i i p i ii ip q p p2 2 1= = −sau ( )

în care :

Page 18: Carte Statistica 2010 Gogu Emilia UCDC

CONF. UNIV. DR. EMILIA GOGU STATISTICA

18

pi - reprezintă mediile caracteristicii alternative din fiecare grupă; qi - frecvenŃele relative ale unităŃilor care nu posedă caracteristica în fiecare grupă. Media dispersiilor de grupă ( )σ p

2 se calculează ca o medie ponderată a dispersiilor

grupelor în care a fost împărŃită colectivitatea:

σ p

i i ii

r

ii

r

p q N

N

2 1

1

= =

=

( )

în care Ni - reprezintă numărul total al unităŃilor observate în fiecare grupă. Dispersia dintre grupe pentru o caracteristică alternativă )( 2

pδ se calculează pe baza

abaterilor mediilor caracteristicii alternative din fiecare grupă şi media pe întreaga colectivitate:

∑ −=

=

=r

1ii

r

1ii

2i

2p

N

Npp )(δ

în care p este media caracteristicii alternative pe întreaga colectivitate (N

Mp = ).

Dispersia totală a caracteristicii alternative ( )σ p2 se calculează pe baza celor două

greutăŃi specifice (p, q) din colectivitatea totală:

σ p p q2 = ⋅

Regula adunării dispersiilor se păstrează şi în cazul unei caracteristici alternative: 2p

2p

2p δσσ +=

4.6. Asimetria

Pentru caracterizarea seriilor de distribuŃie unidimensionale şi unimodale un interes deosebit îl prezintă şi cunoaşterea gradului de oblicitate, de îndepărtare a acestor distribuŃii de la simetrie. În practica statistică acest aspect este cunoscut sub numele de asimetrie.

La interpretarea gradului de asimetrie se porneşte de la poziŃia şi valorile pe care le au cei trei indicatori ai tendinŃei centrale: media, mediana şi modul prin raportare la proprietăŃile distribuŃiei normale.

Într-o distribuŃie simetrică cei trei indicatori: mod, mediană şi media aritmetică se confundă ca în diagrama din figura 4.8.

y y

x x M M xo e= = M M xo e< < Figura 4.8 Figura 4.9 y

Page 19: Carte Statistica 2010 Gogu Emilia UCDC

CONF. UNIV. DR. EMILIA GOGU STATISTICA

19

x x M Me o< <

Figura 4.10 O distribuŃie nonsimetrică se mai numeşte şi oblică şi ea poate prezenta asimetrie de

stânga sau de dreapta (vezi figurile 4.9 şi 4.10). Forma repartiŃiei se poate analiza: a) utilizând metoda grafică; b) calculând indicatorii de asimetrie adecvaŃi. Asimetria se poate analiza în primul rând cu ajutorul metodei grafice. În acest scop se

folosesc: poligonul frecvenŃelor şi histograma. După ce s-a construit poligonul frecvenŃelor interpretarea se face ca mai sus.

La interpretarea asimetriei şi în general a formei de repartiŃie se folosesc proprietăŃile distribuŃiei normale. DistribuŃia normală (curba lui Laplace, Gauss) face parte din cadrul distribuŃiilor în care curba frecvenŃelor se prezintă sub forma unui clopot în secŃiune longitudinală în care frecvenŃele de apariŃie ale unei variabile X scad proporŃional şi simetric în raport cu frecvenŃa maximă, care corespunde valorii centrale. În graficul distribuŃiei normale, ordonata maximă corespunde unui punct pe abscisă în care valoarea caracteristicii este egală cu media, mediana şi modulul seriei.

Legea distribuŃiei normale a fost descoperită de peste 200 de ani de De Moivre. La începutul secolului XIX a fost descoperită independent de Gauss şi Laplace, care au definit proprietăŃile acestui tip de distribuŃie, deosebit de utile pentru interpretarea statistică a fenomenelor de tip colectiv. Fundamentarea observării selective, aplicarea analizei dispersionale, determinarea intervalelor de încredere în cadrul cărora se pot plasa diferiŃi indicatori statistici etc. nu pot fi realizate fără a Ńine seama de proprietăŃile distribuŃiei normale.

DistribuŃia normală poate fi considerată ca o distribuŃie model, în cadrul căreia se pot determina teoretic care sunt frecvenŃele de apariŃie a diferitelor valori ale unei variabile aleatoare X sau valorile acesteia, dacă se presupun cunoscute frecvenŃele acestora. Variabila aleatoare – după cum s-a mai spus – este acea caracteristica care poate lua un număr mare de valori individuale diferite, ca urmare a faptului că apariŃia lor este determinată de influenŃa concomitentă a mai multor factori. Aceste valori pot să apară o singură dată sau de mai multe ori şi prin centralizarea datelor se obŃine distribuŃia de frecvenŃă. În cercetarea statistică se operează cu caracteristici care iau forma unor variabile aleatoare în care trebuie să se Ńină seama atât de nivelurile atinse cât şi de frecvenŃa lor de apariŃie.

În cazul distribuŃiei normale – după cum s-a mai arătat - frecvenŃele de apariŃie ale diferitelor variante în raport cu frecvenŃa de apariŃie a mediei colectivităŃii se distribuie în mod simetric. Sub forma grafică distribuŃia normală se prezintă ca o curbă continuă, simetrică faŃă de ordonata maximă care trece prin vârful curbei şi care corespunde punctului de pe abscisă egal cu valoarea mediei şi a medianei. În acelaşi timp, distribuŃia normală poate fi considerată şi ca o funcŃie matematică în care frecvenŃele sale se exprimă în raport cu variaŃia caracteristicii X, deci:

y=f(x) în care: y – frecvenŃele de apariŃie ale nivelelor individuale ale caracteristicii;

x - valorile individuale ale variabilei aleatoare pentru care se analizează seria de distribuŃie.

Page 20: Carte Statistica 2010 Gogu Emilia UCDC

CONF. UNIV. DR. EMILIA GOGU STATISTICA

20

În cazul distribuŃiei normale, de tip teoretic, valorile caracteristicii X pot lua valori de la -∞ la +∞. Pentru a uşura înŃelegerea acestui tip de distribuŃie se consideră în mod convenŃional ca origine a variaŃiei caracteristicii X, valoarea ei medie (x =0), iar pe grafic se vor reprezenta abaterile individuale ale caracteristicii X faŃă de media seriei (xi- x ), Ńinând seama de frecvenŃele lor de apariŃie. În acelaşi timp, se vor considera frecvenŃele de apariŃie a diferitelor valori ale caracteristicii X drept frecvenŃe relative, care în cazul distribuŃiei teoretice se transformă în probabilităŃi de apariŃie. În cazul distribuŃiei normale teoretice suma probabilităŃilor de apariŃie a tuturor valorilor caracteristicii (X) este egală cu 1.

Pe baza celor arătate şi considerând pe x =0, probabilităŃile de apariŃie se vor distribui în mod simetric de ambele părŃi ale ordonatei maxime. Pe baza acestei probabilităŃi s-au determinat care sunt probabilităŃile de apariŃie a diferitelor abateri (xi- x ), considerând ca erori faŃă de medie, corespunzătoare ordonatei dispuse la un anumit interval faŃă de ordonata maximă, adică:

2

2

2

)(

2

1 σ

σ

xx

i

i

ey−

−⋅

Π=

în care: yi – probabilitatea de apariŃie a abaterii (xi- x ), σ2 – dispersia caracteristicii x; σ - abaterea medie pătratică a caracteristici X Π =3,14 e – baza logaritmilor naturali =2,71828 xi- x - abaterea individuală a caracteristicii Xde la media lor, considerată ca o valoare

scontată câtre care tinde să se concentreze întreaga distribuŃie de frecvenŃă. În mod corespunzător se poate determina şi valoarea ordonatei maxime unde abaterea (xi-

x ), este egală cu zero, deci:

Π=

2

10 σ

y

în care y0 – ordonata maximă considerată în punctul central al seriei. Aplicate unei serii empirice, aceste formule de calcul servesc la determinarea

frecvenŃelor relative teoretice de apariŃie a diferitelor valori ale caracteristicii, considerată ca fiind distribuită normal dacă pentru o serie de distribuŃie se cunoaşte media şi abaterea medie pătratică.

Dacă se cunoaşte şi volumul colectivităŃii (N) în locul frecvenŃelor teoretice relative se pot determina frecvenŃele teoretice absolute înlocuind pe 1 (suma frecvenŃelor relative) cu N (volumul absolut al întregii colectivităŃi). În acest caz frecvenŃa teoretică absolută corespunzătoare unui punct definită prin axa absciselor prin abaterea sa faŃă de mediei va fi:

2

2

2

)(

σ

xx

i

i

eN

y−

−⋅

Π=

Interpretând această formulă rezultă că în cazul distribuŃiei normale, forma de distribuŃie depinde în principal de valorile luate de abaterea media pătratică (σ). Dacă abaterea medie pătratică are o valoare mare, ea corespunde unei variaŃii mari a termenilor seriilor în jurul mediei şi deci gradul de alungire a curbei este mai mare şi invers, deoarece în acest caz abaterile (x-x ) nu fac decât să se mute dintr-o parte în alta pe abscisă. Din această cauză aria de întindere a curbei se poate măsura în unităŃi de abatere normate determinate ca raport între abaterile

individuale şi abaterea medie tip (σ

xx −)

În cazul distribuŃiei normale se demonstrează în mod teoretic, că între distribuŃia dintre diferitele ordonate şi ordonata maximă există o anumită proporŃionalitate şi aceste relaŃii se găsesc calculate şi tabelate. Ele corespund diferitelor probabilităŃi de apariŃie a diferitelor valori în raport cu media şi abaterea lor medie pătratică. Aceasta înseamnă că diferitele valori şi

Page 21: Carte Statistica 2010 Gogu Emilia UCDC

CONF. UNIV. DR. EMILIA GOGU STATISTICA

21

probabilitatea lor de apariŃie se pot măsura în unităŃi de abateri tip şi că, deci, pot fi calculate şi interpretate în sens probabilistic fără să fie necesară cunoaşterea distribuŃiei empirice, cu condiŃia ca variabila să urmeze legea de distribuŃie normală a erorilor.

Într-o distribuŃie normală, cu probabilităŃi de apariŃie perfect simetrice într-un sens şi altul se poate observa pe grafic că punctele de curbură ale curbei se găsesc în dreptul ordonatelor corespunzătoare unităŃilor de măsură ale abaterii medii pătratice şi mărimea medie.

Principalele proprietăŃi ale distribuŃiei normale pot fi astfel enumerate: 1. DistribuŃia normală este simetrică şi continuă, şi indică o colectivitate a cărei

caracteristică este de forma unei variabile aleatoare ale cărei valori oscilează în jurul unei valori centrale ce poate fi calculată ca o medie aritmetică din valorile individuale ale caracteristicii. Între valorile individuale şi mărimea lor medie există o relaŃie de compensare reciprocă a abaterilor într-un sens sau altul, pe baza unor probabilităŃi teoretice egale pentru aceleaşi valori absolute ale abaterilor.

2. În cadrul unei distribuŃii normale, variabila (X) poate lua orice valoare cuprinsă între -∞ şi +∞, dar cu probabilităŃi diferite de apariŃie şi anume ele cresc proporŃional şi simetric în ambele sensuri pe măsură ce se apropie de valoarea lor centrală.

DistribuŃia probabilităŃilor de apariŃie a diferitelor valori ale caracteristicii se pot determina şi măsura în unităŃi de abateri medii pătratice, deoarece punctele de curbură se găsesc unde ordonatele corespund diferitelor valori ale caracteristicii măsurate prin unităŃi de abateri tip. Pe baza acestor relaŃii, dacă distribuŃia este normală, se pot calcula diferitele probabilităŃi de apariŃie corespunzătoare valorilor care trebuie să fie determinate pentru variabila studiată, cunoscându-se dinainte media şi abaterea sa medie pătratică, folosind tabelele de calcul ale funcŃiei lui Laplace.

3. Reprezentarea grafică a curbei distribuŃiei normale arată că ea depinde de mărimea celor doi parametri care o definesc: media (x ) şi abaterea medie pătratică (σ). Dintre cei doi parametrii, influenŃa determinată o are valoarea abaterea mediei pătratice, care poate alungi graficul în ambele sensuri pe când valoarea medie nu produce decât o translaŃie pe graficul respectiv.

Cunoaşterea proprietăŃilor distribuŃiei normale este deosebit de importantă de importantă în interpretarea statistică a fenomenelor. Ea se foloseşte în special în caracterizarea statistică a seriilor de distribuŃie, în analiza dispersională, la verificarea ipotezelor statistice, la efectuarea selecŃiilor în vederea caracterizării întregului ansamblu. Pe baza proprietăŃilor distribuŃiei normale se poate interpreta raportul care există între distribuŃia empirică obŃinută pe baza datelor din observarea statistică şi distribuŃia teoretică stabilită pe baza proprietăŃilor distribuŃiei normale. Această raportare nu se poate face decât dacă variabilele care se cercetează prezintă tendinŃa de distribuŃie simetrică a valorii lor individuale. Pentru a măsura abaterea de la această tendinŃă se calculează indicatorii asimetriei.

Indicatorii cu ajutorul cărora se interpretează care este gradul de asimetrie se pot exprima atât în mărimi absolute cât şi în mărimi relative.

Karl Pearson, statistician britanic propune la începutul secolului pentru măsurarea asimetriei trei coeficienŃi:

⇒<⇒>⇒=

−=dreapta la oblică serie0

stânga la oblică serie 0

simetrică serie0

as

as

as

as

C

C

CMox

Deci, acest coeficient poate lua valori cuprinse între -1 şi +1; cu cât este mai mic în valoare absolută cu atât asimetria este mai mică.

De reŃinut. Acest coeficient este recomandabil a se folosi numai pentru distribuŃii uşor asimetrice.

Page 22: Carte Statistica 2010 Gogu Emilia UCDC

CONF. UNIV. DR. EMILIA GOGU STATISTICA

22

În cazul când se cunoaşte mediana seriei, coeficientul de asimetrie ( )′Cas se poate calcula utilizând relaŃia:

′ = −C

x Meas

3( )

σ

Acest coeficient se foloseşte pentru serii uşor asimetrice când între cei trei indicatori ai tendinŃei centrale se verifică relaŃia:

Modul = Media - 3(Media - Mediană) Acest coeficient poate să ia valori cuprinse între -3 şi +3 şi va arăta un grad mai mare de

simetrie cu cât se va apropia mai mult de 0.

Dacă:

⇒<⇒>⇒=

dreapta la oblică simetrie0

stanga la oblică simetrie0

simetrie 0

As

As

As

Dacă acest coeficient se apropie de 0,1 se apreciază că seria este moderat asimetrică, iar peste 0,3 se consideră că seria este pronunŃat asimetrică.

4.7. Indicatorii concentrării / diversific ării

Analiza seriilor de repartiŃie unidimisionale este continuată cu măsurarea gradului de concentrare a valorilor variabilei. Prin concentrare se înŃelege faptul că o pondere mică (mare) deŃine o pondere mare (mică) din volumul variabilei.

La caracterizarea statistică a concentrării se pot folosi: metoda grafică, măsurarea concentrării prin indicatorii concentrării.

Analiza concentrării / diversificării se bazează pe curba de concentrare denumită şi curba lui Lorenz. Această curbă se construieşte pentru repartiŃiile construite pe intervale de grupare.

Construirea acesteia presupune următoarele etape: 1. Calcularea frecvenŃei relative

100* ⋅=∑ i

ii n

nn

2. Calculul frecvenŃelor relative cumulate crescător (Fi). 3. Determinarea nivelului totalizat al caracteristicii pe fiecare grupă (xini) şi pe total

colectivitate (Σxini). 4. Determinarea greutăŃii specifice (gi) care exprimă ponderea nivelului totalizator al

fiecărei grupe pe total. 5. Calcularea greutăŃii specifice cumulate crescător (gic). 6. Construirea curbei lui Lorenz. Acest tip de grafic se construieşte în sistem de axe şi anume în cadranul I. Pe axa OX se

reprezintă frecvenŃele relative cumulate, iar pe axa OY greutăŃile specifice cumulate. Fiecare pereche de valori (Fi, gic) se reprezintă printr-un punct unind prin segment de

dreaptă doua câte două puncte succesive se obŃine curba de concentrare. SuprafaŃa mărginită de curba de concentrare şi de dreapta egalităŃii perfecte a frecvenŃelor

(dreapta care uneşte punctele de coordonate (0;0) şi (100;100)) se numeşte arie de concentrare. Cu cât aceasta este mai mare cu atât concentrarea este mai puternică.

Pentru a reda în expresie numerică gradul de concentrare se calculează indicatori statistici adecvaŃi.

Cel mai frecvent utilizat este coeficientul de concentrare propus de statisticianul italian Corado Gini potrivit relaŃiei:

C g i ni= =∑ 2 1unde ,

Page 23: Carte Statistica 2010 Gogu Emilia UCDC

CONF. UNIV. DR. EMILIA GOGU STATISTICA

23

Coeficientul Gini ia valori în intervalul 1

1n

,

. Atunci când cele n unităŃi au ponderi

egale în colectivitate, adică repartiŃia studiată este absolut uniformă, rezultă Cn

= 1, iar dacă

variabila cercetată se concentrează într-o singură unitate, C=1. Pentru a înlătura dezavantajul legat de faptul că limita inferioară a intervalului de variaŃie

a indicatorului este variabilă depenzând de numărul termenilor seriei se foloseşte un alt indicator propus de R. Struck:

1

12

−−

= ∑n

gnC i

Interpretarea valorii acestui coeficient se face în intervalul (0;1). Cu cât coeficientul este mai aproape de limita inferioară, el exprimă o mai uniformă repartizare a elementelor colectivităŃi pe tipurile calitative observate.

O apropiere de limita superioară sugerează o concentrare pe un anumit tip sau pe câteva tipuri calitative.

Page 24: Carte Statistica 2010 Gogu Emilia UCDC

CONF. UNIV. DR. EMILIA GOGU STATISTICA

24

5. CAPITOLUL 5. ANALIZA SERIILOR STATISTICE INTERDEPENDENTE, REGRESIA ŞI CORELA łIA STATISTIC Ă

InterdependenŃa dintre fenomenul şi procesele sociale şi economice, folosind variabile

statistice între care se pot stabili relaŃii ca de la cauză la efect, este studiată de toate ştiinŃele ce aparŃin domeniului respectiv, printre care se numără şi statistica economică socială.

Complexitatea fenomenelor economice şi sociale, caracterizarea lor cantitativă şi calitativă determină folosirea combinată a diferitelor ştiinŃe în investigarea relaŃiilor de cauzalitate, care stau la baza apariŃiei şi dezvoltării lor.

Printre metodele şi modelele care s-au impus in studiul interdependenŃei, corelaŃia şi regresia statistică sunt cele care se folosesc cel mai frecvent.

Utilizarea acestor metode este justificată de necesitatea crescândă a reflectării într-o formă numerică adecvată a interdependenŃei obiective dintre fenomenele social-economice în ceea ce priveşte natura, direcŃia şi gradul de intensitate a legăturilor, care se manifestă într-o anumită perioadă de timp sau în dinamică.

Teoretic şi practic se demonstrează în mod ştiinŃific că fenomenele sociale apar şi se dezvoltă ca urmare a unor cauze variate, care pot acŃiona m acelaşi sens sau în sens opus şi cu grad diferit de intensitate. Complexitatea interacŃiunii dintre fenomene este cu atât mai mare, cu cât ele aparŃin unor colectivităŃi mai numeroase Reiese că fenomenele sociale nu sunt, de regulă, fenomene univoc determinate, fiind rezultatul conjugării influenŃei mai multor fenomene-cauză, iar în sistemul acesta de legături nu toate raporturile de dependenŃă au aceeaşi importanŃă, acŃiunea unora dintre factori compensându-se reciproc.

De aceea, în analiza statistică a raporturilor de dependenŃă dintre fenomene, problema care se pune este aceea a măsurării relaŃiei care există între două sau mai multe caracteristici cuprinse în programul unei cercetări concrete a fenomenelor social-economice de masă. Aceasta presupune, în primul rând, să se constate dacă între caracteristica x - denumită caracteristica factorială sau independentă şi caracteristica y caracteristică rezultativă sau dependentă - există sau nu un raport de dependenŃă şi, în al doilea rând, dacă această relaŃie există să se exprime printr-un indicator simplu sau sintetic de corelaŃie, măsura în care caracteristica factorială x contribuie la formarea caracteristicii rezultative y sub aspectul naturii, direcŃiei şi formei de legătură între ele.

În acest stadiu de cercetare statistică analiza calitativă ce trebuie să preceadă aplicarea uneia sau a alteia dintre metodele statistice este deosebit de importantă şi are un vădit caracter interdisciplinar. Aceasta permite ca, din ansamblul de legături existente în mod obiectiv între fenomenele aceleiaşi colectivităŃi statistice, să se desprindă acelea care au caracter permanent şi sunt determinante în formarea nivelurilor concrete de dezvoltare a caracteristicii rezultative. Acest lucru apare cu atât mai necesar, cu cât legitatea de apariŃie şi dezvoltare a fenomenelor social-economice fiind valabilă pentru întregul ansamblu, nu este sesizabilă, de obicei, în cadrul cercetării empirice, decât dacă datele se referă la un număr mare de cazuri individuale concrete, diferite ca forme de manifestare, aparŃinând aceleiaşi colectivităŃi.

Având în vedere toate aceste aspecte, trebuie precizat că metoda corelaŃiei nu poate da rezultate bune decât dacă se lucrează cu un număr suficient de mare de cazuri individuale în care distribuŃia abaterilor este aproximativ normală. Dacă această condiŃie nu este satisfăcută, câmpul de acŃiune a legii numerelor mari este limitat, iar concluziile desprinse în urma obŃinerii anumitor indicatori de corelaŃie pot da naştere unei interpretări eronate, ca urmare a reflectării neveridice a fenomenelor supuse cercetării statistice. Şi cu această ocazie este necesar ca procesul de analiză să pornească de la simplu la complex, de la fenomene la esenŃă, de la o esenŃă de un anumit grad la o esenŃă de grad superior.

Aceasta presupune ca, în analiza legăturilor dintre fenomene, să se folosească metoda abstractizării succesive a factorilor, prin care să se poată studia atât legăturile simple, imediate

Page 25: Carte Statistica 2010 Gogu Emilia UCDC

CONF. UNIV. DR. EMILIA GOGU STATISTICA

25

dintre două fenomene legate printr-o relaŃie de cauzalitate directă, cât şi interacŃiunea dintre factori.

Studiul statistic al interdependenŃei dintre fenomene necesită identificarea legăturilor studiate de la cauză la efect, precum şi legăturile realizate prin intermediul unui şir de cauzalităŃi. în acest sens, este necesar ca relaŃiile de cauzalitate din interiorul fenomenelor complexe să fie studiate şi prezentate tot sub o formă de tendinŃă valabilă la nivelul întregului ansamblu şi nu la nivelul unor valori individuale izolate. Aceasta conduce în mod obligatoriu la folosirea unor metode statistice m care să se Ńină seama de formele de distribuŃie de frecvenŃă ale fenomenelor pentru care se studiază interdependenŃele dintre ele şi care nu pot fi interpretate decât pe baza indicatorilor medii şi a celor de variaŃie.

Înainte de aplicarea modelelor statistice de analiza interdependenŃa, este necesar să facem distincŃia între corelaŃie şi covariaŃie.

CovariaŃia presupune existenŃa unor forme de repartiŃie în timp, spaŃiu sau organizare, pentru 2 sau mai multe variabile, dar care sunt independente între ele.

CorelaŃia se poate defini ca interdependenŃa existentă între diferitele fenomene sau caracteristici exprimate prin numere (cantitativ) sau prin cuvinte (calitativ) manifestată în cadrul fenomenelor social-economice de masă. CorelaŃia presupune găsirea funcŃiei analitice cu care să descriem statistic legătura dintre variabilele studiate. Trebuie precizat că metoda corelaŃiei nu poate da rezultate bune decât dacă se lucrează cu un număr suficient de mare de cazuri individuale în care distribuŃia abaterilor este aproximativ normală.

5.1. Tipuri de legături între fenomenele social-economice

Formele de manifestare a relaŃiilor de interdependenŃă sunt extrem de variate şi adesea destul de greu de sesizat. Pentru a le studia este necesar să fie clasificate în funcŃie de unele criterii, după care se pot deosebi unele de altele.

După natura relaŃiei de cauzalitate, legăturile dintre fenomene pot fi legături func Ńionale şi legături statistice sau stohastice

1. Legăturile funcŃionale sunt univoce, realizate direct între un fenomen-cauză şi un fenomen-efect. Deci, fenomenul-efect depinde de o singură cauză, care poate fi identificată de câte ori se produce, ceea ce înseamnă că, dacă condiŃiile rămân constante, atunci unei valori a caracteristicii factoriale îi corespunde o singură valoare a caracteristicii rezultative. Ele se mai numesc şi legături de tip determinist. RelaŃia matematică dintre fenomenul-efect şi fenomenul-cauză, pentru legăturile de tip funcŃional (determinist) este: yi=f(xi).

Ex Un exemplu de astfel de legătură funcŃională este aceea dintre nivelul productivităŃii muncii şi consumul specific de timp de muncă pentru produsul respectiv în cadrul unei perioade de timp. Se poate, cu uşurinŃă, demonstra că, pe măsură ce scade timpul de producere a unei mărfi, cu atât creşte productivitatea muncii pentru produsul respectiv.

2. legături statistice, denumite şi legături stohastice, de tip nedeterminist descrise prin funcŃia matematică : ),...,,( 21 kiiii xxxfy = şi se referă la fenomene complexe, influenŃate de

mai multe cauze, care se manifestă în condiŃii diferite. Legăturile de tip stohastic sunt cele mai frecvente în domeniul fenomenelor sociale şi

economice. în cazul legăturii statistice, identificând un factor de influenŃă, se poate constata că, pe măsura variaŃiei acestuia, variază într-o măsură mai mare sau mai mică şi caracteristica apreciată şi dependentă de factorul ales.

De exemplu, legătura dintre înzestrarea tehnică a muncii şi productivitatea muncii este o legătură de tip statistic. La o creştere a înzestrării tehnice a muncii se obŃine o creştere diferită a productivităŃii muncii, deoarece productivitatea muncii depinde şi de alŃi factori. Pentru a studia gradul de dependenŃă a productivităŃii muncii de gradul de înzestrare tehnică este necesar ca aici să se folosească metoda abstractizării, în care să se considere că numai acest factor ar fi esenŃial

Page 26: Carte Statistica 2010 Gogu Emilia UCDC

CONF. UNIV. DR. EMILIA GOGU STATISTICA

26

şi variabil, iar ceilalŃi factori ar avea acŃiune comună cu caracter constant, chiar dacă în realitate, ei au o influenŃă hotărâtoare şi variabilă asupra productivităŃii muncii.

Trebuie remarcat că legăturile de tip statistic pot fi reciproce, adică efectul se transformă, la rândul lui, în cauză imediată sau mediată prin intermediul unor relaŃii de cauzalitate în lanŃ.

Pentru a studia legăturile de tip statistic este necesar să se identifice şi să se ierarhizeze factorii esenŃiali, precum şi formele sub care se manifestă relaŃiile de cauzalitate. Acest lucru este posibil numai dacă se înregistrează toate unităŃile care formează colectivitatea de fenomene ce depinde de aceleaşi cauze esenŃiale.

Când analiza relaŃiilor de cauzalitate se studiază pe baza unor observări parŃiale este necesar să se verifice, în prealabil, gradul de reprezentativitate al colectivităŃii de selecŃie şi să se verifice apoi gradul de semnificaŃie al indicatorilor de corelaŃie care s-au calculat, prin aplicarea unor teste de semnificaŃie. Şi aici, interpretarea relaŃiilor de cauzalitate, folosind datele de selecŃie, se face în sens probabilist.

Varietatea formelor de manifestare a legăturilor statistice necesită m continuare o clasificare a lor după mai multe criterii. Un prim criteriu este acela al numărului factorilor înregistraŃi.

După numărul caracteristicilor-factori luate în studiu, legăturile statistice pot fi: legături simple şi legături multiple.

Legăturile simple sunt acelea în care caracteristica rezultativă se studiază numai în funcŃie de o singură caracteristică factorială considerată principală şi variabilă, iar celelalte caracteristici factoriale, chiar dacă au fost identificate şi înregistrate, se consideră cu acŃiune constantă în toate cazurile individuale înregistrate.

Legăturile multiple presupun să se studieze dependenŃa unei caracteristici rezultative în funcŃie de mai mulŃi factori înregistraŃi. Interpretarea statistică a legăturilor multiple implică şi analiza legăturilor simple dintre toate caracteristicile înregistrate pentru calculul corelaŃiei multiple.

După conŃinutul caracteristicilor incluse în analiza de corelaŃie, legăturile pot fi: de asociaŃie şi de corelaŃie.

AsociaŃia statistică exprimă relaŃia de interdependenŃă dintre două sau mai multe caracteristici exprimate calitativ sau între o caracteristică numerică şi una calitativă. De exemplu, între aptitudini şi profesia aleasă există o legătură de tip stocastic sau între gradul de îndemânare şi productivitatea muncii.

La folosirea caracteristicilor calitative este necesar să se găsească o posibilitate de cuantificare, pentru a putea trece apoi la calculul indicatorilor de corelaŃie.

CorelaŃia statistică exprimă relaŃia de interdependenŃă dintre două sau mai multe caracteristici exprimate numeric şi se poate măsura prin indicatori statistici de corelaŃie. De exemplu, între nivelul de productivitate a muncii, vechimea în producŃie şi nivelul salariilor există legături de corelaŃie, care pot fi analizate atât ca legături simple, cât şi ca o legătură multiplă.

După direcŃia în care se produc, legăturile pot fi: directe şi inverse. Legăturile directe sau în acelaşi sens se produc atunci când, pe măsură ce se modifică

nivelul de dezvoltare a caracteristicii factoriale, se modifică în acelaşi sens şi nivelul caracteristicii rezultative. În exemplul precedent, atât productivitatea muncii, cât şi vechimea în producŃie influenŃează m acelaşi sens variaŃia salariaŃilor.

Legăturile inverse sunt acelea în care, pe măsură ce se modifice nivelul de dezvoltare a caracteristicii factoriale, se modifică m sens contrai nivelul caracteristicii rezultative. De exemplu, între nivelul productivităŃi muncii şi nivelul costului unitar există o legătură statistică inversă.

După forma legăturii, ele pot fi: rectiliniare, exprimate prin ecuaŃia funcŃiei liniei drepte şi curbiliniare, exprimate prin ecuaŃia unei funcŃii exponenŃiale, parabolice, hiperbolice etc.

Page 27: Carte Statistica 2010 Gogu Emilia UCDC

CONF. UNIV. DR. EMILIA GOGU STATISTICA

27

Identificarea formei de realizare a legăturii este determinantă pentru măsurarea corectă a corelaŃiei dintre fenomenele social-economice.

După timpul în care se realizează, legăturile statistice pot fi: concomitente (sincrone) şi cu decalaj (asincrone).

Legăturile sincrone (concomitente) sunt cele care pot fi urmărite în dinamică pentru aceeaşi perioadă de timp. De exemplu, dacă se analizează corelaŃia dintre dinamica productivităŃii muncii şi a salariilor, se poate observa că pe măsură ce creşte productivitatea muncii, creşte şi mărimea salariilor încasate de muncitorii aceleiaşi colectivităŃi statistice.

Legături asincrone (cu decalaj) apar atunci când caracteristicile factoriale încep să acŃioneze asupra variaŃiei caracteristicii rezultative, după scurgerea unei perioade timp. De exemplu, între mărimea investiŃiilor în maşini şi instalaŃii şi creşterea productivităŃii muncii există un decalaj necesar asimilării în masă a noilor tehnologii, sau între dezvoltarea unei ramuri noi de producŃie şi mărimea exportului există un decalaj corespunzător asigurării competitivităŃii produselor pe plan internaŃional.

Problemele care trebuie rezolvate în aplicarea metodelor de analiză a corelaŃiilor statistice pot fi sintetizate astfel:

� identificarea şi ierarhizarea factorilor care determină în mod obiectiv variaŃia caracteristicii rezultative;

� verificarea gradului de cuprindere a unităŃilor înregistrate. Dacă unităŃile observate provin dintr-o cercetare parŃială de tip selectiv trebuie ca la interpretarea rezultatelor să se Ńină seama de principiile teoriei probabilităŃilor;

� sistematizarea datelor observate, astfel încât să nu se modifice gradul şi forma de variaŃie a caracteristicile la care se aplică metoda corelaŃiei;

� verificarea existenŃei şi formei de legătură dintre caracteristicile corelate, în vederea alegerii corecte a modelului utilizat la măsurarea dependenŃei statistice;

� calcularea adecvată a indicatorilor de corelaŃie m funcŃie de forma de legătură şi de natura informaŃiei de care se dispune;

� aplicarea testelor de semnificaŃie a indicatorilor de corelaŃie pentru cazul în care ei provin dintr-un sondaj statistic.

Interpretarea rezultatelor şi verificarea ipotezelor şi aplicarea testelor de semnificaŃie a funcŃiilor şi parametrilor lor se face potrivit particularităŃilor fenomenelor studiate în funcŃie de timp, loc şi formă de organizare. Dacă datele provin dintr-un sondaj statistic trebuie să se verifice reprezentativitatea ansamblului şi să se interpreteze probabilistic indicatorii calculaŃi.

5.2. Metode şi procedee de verificare şi analiză a legăturilor statistice

Aplicarea metodei corelaŃiei pentru cercetarea interdependenŃei dintre fenomenele şi procesele sociale şi economice trebuie să Ńină seama de forma obiectivă în care apar şi se dezvoltă legăturile care urmează să fie studiate, precum şi de posibilitatea reflectării lor prin expresii numerice adecvate.

Luând în considerare primul aspect - cunoaşterea formei obiective de manifestare a legăturii -, aceasta se realizează printr-o analiză logică, bazată pe cunoştinŃele teoretice ale disciplinelor de specialitate din domeniul respectiv şi verificată prin metode de calcul şi interpretare statistică.

În ceea ce priveşte cel de-al doilea aspect - posibilitatea reflectării legăturilor statistice prin expresii numerice adecvate -, depinde de natura specifică a fenomenelor care intră în raport de interdependenŃă şi de posibilitatea de măsurare a acestora, respectiv de natura informaŃiei de care se dispune şi se poate folosi în măsurarea şi interpretarea acestor legături.

Page 28: Carte Statistica 2010 Gogu Emilia UCDC

CONF. UNIV. DR. EMILIA GOGU STATISTICA

28

łinând seama de aceste două aspecte, la cercetarea legăturilor dintre fenomene se pot folosi atât metode simple de interpretare a legăturii, cât şi metode analitice, bazate pe interpretarea formei de dependenŃă.

în principal, metodele de analiză a corelaŃiei dintre fenomenele de masă se pot clasifica în două grupe: • metode şi procedee cu ajutorul cărora se pot constata existenŃa sau lipsa corelaŃiei; verifica

direcŃia în care se realizează şi permit o apreciere vizuală a tendinŃei de manifestare a intensităŃii legăturii dintre fenomenele supuse corelaŃiei. Pentru aceasta, cel mai frecvent se pot folosi: metoda seriilor statistice interdependente; metoda grupărilor; metoda grafică; tabelul de corelaŃie; tabelul de asociere; metoda balanŃelor; analiza dispersională;

• metode şi procedee analitice de calcul şi interpretare statistică prin care se măsoară existenŃa şi direcŃia legăturii, precum şi forma şi gradul de intensitate în care se realizează. Aceste metode şi procedee permit, deci, exprimarea raporturilor de interdependenŃă dintre fenomene, printr-un sistem de indicatori de corelaŃie, printre care cei mai folosiŃi sunt ecuaŃiile de regresie, coeficienŃii de corelaŃie simplă, parŃială şi multiplă, coeficienŃii de corelaŃie a rangurilor, coeficienŃii de asociere.

Pentru interpretarea legăturilor dintre fenomene se pot folosi metode de sistematizare şi verificare a legăturilor: A. Metode parametrice simple şi analitice, B. Metode neparametrice A. METODE PARAMETRICE SIMPLE Metodele de sistematizare şi verificare a corelaŃiei sunt:

a) seriile interdependente, b) metoda tabelului de corelaŃie c) metoda grupării, d) metoda grafică, e) metoda balanŃelor

5.3. Metode analitice (parametrice) de măsurare şi interpretare a legăturilor statistice

În paragraful precedent au fost prezentate metodele de verificare a legăturilor dintre fenomenele şi procesele economice de masă, ca momente iniŃiale ale cercetării statistice a corelaŃiile dintre fenomene; cu ajutorul lor se face o sistematizare a informaŃiilor necesare aplicării metodelor analitice de calcul şi interpretare statistică.

Aplicarea metodelor analitice trebuie să aibă în vedere, în primul rând, aspectele scoase în evidenŃă în urma efectuării analizei calitative care trebuie să preceadă orice fel de cercetare statistică, deci cunoaşterea conŃinutului social-economic al relaŃiilor de cauzalitate dintre fenomene şi, în al doilea rând, să folosească cu discernământ concluziile formulate prin aplicarea metodelor simple de corelaŃie, prin care s-au verificat existenŃa, direcŃia şi forma în care se realizează legătura dintre fenomene.

În cazul în care nu se Ńine cont de aceste principii, calculul statistic devine un simplu exerciŃiu formal pentru determinarea unor indicatori de corelaŃie nesemnificativi.

Pentru a evidenŃia legea care se manifestă în fiecare legătură în parte, pentru a măsura statistic tendinŃa sa de manifestare se folosesc ecuaŃiile de estimare corespunzătoare unei funcŃii analitice care exprimă forma de legătură dintre caracteristica factorială şi cea rezultativă. Această funcŃie este cunoscută sub denumirea de funcŃie de regresie, iar reprezentarea ei grafică se face prin linia (curba) de regresie. Alegerea corectă a funcŃiei de regresie, care să exprime cel mai bine legătura dintre cele două caracteristici, este deosebit de importantă pentru determinarea valorii statistice a indicatorilor de corelaŃie. Forma legăturii dintre cele două caracteristici se

Page 29: Carte Statistica 2010 Gogu Emilia UCDC

CONF. UNIV. DR. EMILIA GOGU STATISTICA

29

calculează în funcŃie de modul de corelare a valorilor caracteristicii rezultative cu valorile caracteristicii factoriale alese. Dacă funcŃia de regresie nu a fost aleasă în mod corespunzător, atunci rezultatele analizei, respectiv valorile indicatorilor de corelaŃie, vor fi denaturate.

Pentru alegerea corectă a funcŃiei de regresie este necesar să se reprezinte legătura dintre cele două serii de distribuŃie printr-un grafic de corelaŃie, care să permită interpretarea vizuală a tendinŃei de asociere a celor două caracteristici perechi. Pe baza reprezentării grafice se poate aprecia apoi dacă legătura este de formă rectilinie sau curbilinie. Tot ca instrument de verificare a veridicităŃii funcŃiei de estimare, pentru măsurarea legături dintre cele două variabile în cadrul colectivităŃii înregistrate, se pot folosi şi metodele de analiză dispersională, cu interpretarea corespunzătoare rezultatelor în urma aplicării ei.

FuncŃia de regresie exprimă statistic modul în care caracteristica rezultativă (y) s-ar modifica dacă ar varia numai valorile caracteristicii factoriale (x), iar ceilalŃi factori ar fi consideraŃi cu acŃiune constantă în toate cazurile observate. Celelalte caracteristici, fiind considerate ca neesenŃiale şi cu acŃiune constantă asupra tuturor unităŃilor la care se măsoară raportul de interdependenŃă, înseamnă că influenŃa lor este sintetizată într-o singură valoare cu caracter de medie. Legătura dintre cele două variabile se realizează tot sub formă de tendinŃă, ceea ce înseamnă că pentru estimare se va folosi tot o ecuaŃie medie de tendinŃă corespunzătoare formei identificate pe grafic.

Metoda analizei regresiei şi corelaŃiei s-a născut în legătură cu cercetările din biologie, s-a dezvoltat pe baza experimentelor în genetică şi agrobiologie, extinzându-se apoi la alte domenii ştiinŃifice, tehnice şi economice, cunoscând astăzi aplicaŃii m mai toate domeniile.

ApariŃia şi dezvoltarea acestei metode sunt legate în Anglia de numele lui Francis Galton (1822-1911), biolog şi matematician, şi al lui Karl Pearson (1857-1936) matematician, biolog şi filosof. Primul coeficient de corelaŃie se pare că a fost formulat de matematicianul şi statisticianul francez Auguste Bravaia (1811-1863).

Un promotor al dezvoltării metodelor statistice aplicate a fost revista „Biometrika", înfiinŃată în 1901, unde s-au expus cele mai importante contribuŃii la teoria şi tehnica regresiei şi corelaŃiei.

Un rol important în dezvoltarea metodelor statistice 1-a avut celebra staŃiune Rothamsted, unde au lucrat şi R.A. Fisher, M.G. Kendall şi alŃii.

Problema de la care au plecat Galton şi Pearson, în anii 1890, în analiza regresiei a fost din domeniul eredităŃii. Galton a studiat corelaŃia dintre mărimea medie a părinŃilor şi mărimea medie a copiilor, constatând o strânsă legătură care poate fi studiată cu ajutorul unei funcŃii analitice. Constatând că, în timp, se manifestă o tendinŃă de scădere a înălŃimii descendenŃilor, ecuaŃiile funcŃiei analitice cu care a măsurat această tendinŃă a numit-o ecuaŃie de regresie, iar metoda de calcul şi analiză a corelaŃiei cu ajutorul funcŃiilor analitice de estimare, metoda regresiei.

Această metodă a corelaŃiei din domeniul biologiei s-a extins şi în domeniul agrobiologiei şi, mai târziu, şi în domeniul economic.

IniŃial, regresia şi corelaŃia erau legate numai de repartiŃia normală. Mai târziu s-au cercetat şi fenomene care nu aveau o repartiŃie normală, dar erau corelate între ele. De asemenea, trebuie menŃionat faptul că metoda corelaŃiei s-a aplicat avându-se în vedere două posibilităŃi în funcŃie de volumul datelor de care se dispune: aplicarea în cazul unei colectivităŃi generale şi aplicarea în cazul unui eşantion obŃinut cu ajutorul unor metode de sondaj, pentru corelaŃii simple şi multiple, liniare şi neliniare. În cel de-al doilea caz, după cum s-a mai arătat, interpretarea se face cu ajutorul probabilităŃilor.

Page 30: Carte Statistica 2010 Gogu Emilia UCDC

CONF. UNIV. DR. EMILIA GOGU STATISTICA

30

6. CAPITOLUL 6. ANALIZA STATISTIC Ă A SERIILOR CRONOLOGIC Ă

Una din sarcinile statisticii este aceea de a studia fenomenele şi procesele social-

economice de masă de-a lungul diferitelor perioade de timp sub aspectul evoluŃiei volumului acestora şi al schimbărilor intervenite în structura lor, a interdependenŃelor dintre fenomene de natură diferită etc.

În analiza dezvoltării fenomenelor în timp, statistica foloseşte ca instrument principal de cercetare indicatorii obŃinuŃi din prelucrarea statistică a seriilor cronologice. Calculul acestor indicatori este precedat de elucidarea noŃiunii de "serie cronologică" şi precizarea particularităŃilor acesteia.

Seria cronologică este formată din două şiruri de date paralele, în care primul îşi arată variaŃia caracteristicii de timp, iar cel de-al doilea şir variaŃia fenomenului sau caracteristicii cercetate, de la o unitate de timp la alta. Seriile cronologice se mai numesc şi serii de timp sau serii ale dinamicii.

La analiza seriilor cronologice trebuie avut în vedere unele proprietăŃi ale acestora şi anume:

- variabilitatea, - omogenitatea, - periodicitatea, - interdependenŃa termenilor prezentaŃi.

Variabilitatea termenilor unei serii cronologice provine din faptul că fiecare termen se obŃine prin centralizarea unor date individuale diferite ca nivel de dezvoltare. Aceste diferenŃieri apar pe de o parte ca urmare a acŃiunii factorilor întâmplători şi pe de altă parte ca urmare a faptului că în dinamică legile sociale şi economice se manifestă ca tendinŃă imprimând fenomenelor forme diferite de variaŃie. Cu cât acŃiunea comună a acestor factori este mai puternică cu atât variaŃia în cadrul seriei este mai mare şi tendinŃele de scurtă şi lungă durată mai greu de sesizat.

Având în vedere această trăsătură, este necesar ca analizând o serie cronologică să se măsoare atât gradul şi forma de influenŃă a factorilor esenŃiali, care imprimă fenomenului o lege specifică de evoluŃie, cât şi gradul de abatere de la această tendinŃă generală rezultată din influenŃa factorilor neesenŃiali, cu caracter întâmplător.

Omogenitatea termenilor trebuie înŃeleasă în sensul că în aceeaşi serie nu pot fi înscrise decât fenomene de acelaşi gen, care sunt rezultatul acŃiunii aceloraşi cauze esenŃiale. Asigurarea omogenităŃii observaŃiilor de-a lungul unei perioade de timp presupune menŃinerea aceleiaşi metodologii de calcul şi evaluare a indicatorilor care urmează să fie analizaŃi în dinamică a criteriilor de clasificare a colectivităŃii studiate şi nomenclatoarelor şi lungimii intervalelor de grupare, menŃinerea unităŃii social-economice sau administrativ teritoriale asupra căreia s-au făcut observaŃii, cât şi a unităŃii de măsurare a timpului. Practic, înseamnă că de fiecare dată, când se analizează o serie statistică trebuie să se verifice dacă datele provin din aceeaşi sursă, are acelaşi grad de cuprindere a unităŃilor şi au fost folosite aceleaşi principii şi metode de prelucrare, cu alte cuvinte este asigurată comparabilitatea datelor înscrise în aceeaşi serie.

O altă trăsătură caracteristică a seriilor cronologice o constituie periodicitatea termenilor din care este formată seria, ceea ce înseamnă de fapt asigurarea continuităŃii datelor din punct de vedere a variabilei de timp şi care poate da posibilitatea interpretării

Page 31: Carte Statistica 2010 Gogu Emilia UCDC

CONF. UNIV. DR. EMILIA GOGU STATISTICA

31

seriei cronologice ca o funcŃie analitică (yi=f(ti)). Variabila de timp poate fi înregistrată cu periodicităŃi diferite. De aceea, alegerea unităŃii de timp la care se referă datele unei serii cronologice trebuie făcută în raport cu scopul cercetării, al conŃinutului şi posibilităŃilor de măsurare a fiecărui indicator. De exemplu, producŃia industrială se poate urmări atât în unităŃi de timp mici (ziua, decada, luna) cât şi în unităŃi mari de timp (trimestrul, semestrul, anul).

În cazurile când unele caracteristici sunt influenŃate în variaŃia lor de schimbare a anotimpurilor, cu alte cuvinte apar fenomene cu caracter sezonier (lunar sau trimestrial) este obligatoriu să se folosească o astfel de periodizare a seriei.

În studiul seriilor cronologice, se pune problema atât a alegerii unităŃilor de timp la care se referă fiecare indicator, cât şi a lungimii etapei pentru care se prezintă datele, cu precizarea anului de bază. Ca an de bază se alege acel an care prezintă o anumită semnificaŃie în evoluŃia fenomenului studiat.

InterdependenŃa termenilor unei serii cronologice apare ca urmare a respectării principiului unităŃii de timp şi spaŃiu şi structurii organizatorice. Ca atare, indicatorii prezenŃi sunt valori succesive ale aceloraşi fenomene înregistrate la nivelul aceleiaşi unităŃi teritorial administrative sau orice unitate statistică complexă care poate fi înregistrată autonom. Aceasta face ca valoarea fiecărui indicator să depindă într-o oarecare măsură de valoarea indicatorului precedent, ca urmare a faptului că relaŃiile de cauzalitate se manifestă în condiŃii asemănătoare de la o unitate de timp la alta.

Luând în considerare toate aceste particularităŃi, analiza statistică a seriilor cronologice trebuie să se bazeze pe un sistem de indicatori, care să caracterizeze multiplele relaŃii cantitative din interiorul seriei şi pe toată perioada la care se referă datele. Ca atare, problemele care se pun şi trebuie rezolvate la analiza seriilor cronologice sunt:

� alegerea lungimii seriei şi elaborarea ei astfel încât, pe cât posibil, să îndeplinească condiŃia legii numerelor mari, adică să aibă un număr suficient de date pentru orizontul de analiză statistică cu care să se fundamenteze corect prognozele de lungă şi scurtă durată;

� calculul şi analiza unui sistem de indicatori statistici absoluŃi, relativi şi medii necesari caracterizării seriei;

� identificarea trendului (tendinŃei) de evoluŃie a fenomenelor din cadrul seriei prin utilizarea metodelor de ajustare statistică şi testelor de verificare a ipotezelor privind forma obiectivă de evoluŃie pe perioada luată în calcul;

� calculul şi analiza sezonalităŃii şi a altor forme de evoluŃie cu caracter ciclic; � interpolarea si extrapolarea seriilor cronologice potrivit scopului cercetării

statistice. Aceste probleme se rezolvă diferit de la o serie la alta, în raport cu felul seriei,

lungimea ei şi tendinŃele de lungă şi scurtă durată ce pot fi identificate. Astfel, în prezentarea dinamică a fenomenelor se pot întâlni mai multe feluri de

serii. Clasificarea seriilor cronologice se face în funcŃie de modul de exprimare a indicatorilor şi după modul de exprimare a timpului la care se referă datele.

În funcŃie de modul de exprimare a indicatorilor din care este formată seria, seriile cronologice pot fi: - serii cronologice formate din indicatori absoluŃi; - serii cronologice formate din indicatori relativi; - serii cronologice formate din indicatori medii.

Page 32: Carte Statistica 2010 Gogu Emilia UCDC

CONF. UNIV. DR. EMILIA GOGU STATISTICA

32

6.1. Seriile cronologice formate din indicatori absoluŃi

Reprezintă forma de bază a seriilor dinamice. Pe baza lor se pot obŃine indicatorii generalizatori pe întreaga perioada.

Indicatorii de nivel sunt chiar termenii unei serii formate din indicatori absoluŃi (y1, ...yt, ..., yn.).

Nivelul totalizat al termenilor

=

n

tty

1

, numai pentru seriile de intervale de timp

de mărimi absolute. Modificările absolute

• cu bază fixă(∆t/1): ∆t/1=yt - y1 unde, nt ,2=

• cu bază în lanŃ (bază mobilă sau variabilă) (∆t/t-1): ∆t/t-1=yt - yt-1 unde, nt ,2=

6.2. Serii cronologice formate din indicatori relativi

Constituie un mod de prezentare de regulă procentual. În această situaŃie este obligatoriu ca în titlu sau în afara tabelului să se specifice care este baza de raportare, pentru ca interpretarea datelor să se facă corect.

Indice de dinamică • cu bază fixă (It/1):

11/ y

yI t

t = sau 1001

(%)1/ ⋅=y

yI t

t unde nt ,2=

• cu bază în lanŃ (It/t-1) :

11/

−− =

t

ttt y

yI sau 100

1(%)1/ ⋅=

−−

t

ttt y

yI unde nt ,2=

Ritmul de dinamică • cu bază fixă (Rt/1) :

1001

1

1⋅−=

y

yyR t

t sau %100(%)1/1/ −= tt IR nt ,2=

• cu bază în lanŃ (Rt/t-1) :

1001

11/ ⋅

−=

−−

t

tttt y

yyR sau %100(%)1/1/ −= −− tttt IR nt ,2=

6.3. Serii cronologice formate din indicatori medii

Se folosesc ca mijloc de prezentare a evoluŃiei unor caracteristici calitative ce apar sub forma de categorii medii: productivitatea muncii, randamentul mediu, recolta medie la ha, salariul mediu etc. De asemenea, se folosesc astfel de serii şi pentru unele caracteristici cantitative atunci când ele trebuie incluse în analiza unor fenomene ce se produc în cadrul unui interval de timp, ca de exemplu: valoarea medie anuală a fondurilor fixe, numărul mediu al personalului muncitor.

Nivelului mediu

Page 33: Carte Statistica 2010 Gogu Emilia UCDC

CONF. UNIV. DR. EMILIA GOGU STATISTICA

33

• pentru o serie cronologică de intervale de timp formate din indicatori absoluŃi:

n

yy

n

tt∑

== 1

• pentru o serie de momente cu intervale egale între momente (media cronologică simplă ):

12

......2 1321

+++++++=

n

yyyyy

y

y

nni

cr

• pentru o serie de momente cu intervale neegale între momente (media cronologică ponderată):

∑−

=

−−

++

++

++

= 1

1

11212

11 2

...2

...22

n

ii

nn

iii

cr

d

dy

ddy

ddy

dy

y

Modificarea medie absolută:

11/

−∆

=∆ ∑ −

ntt

sau 1

1

−−

=∆n

yyn

Indicele mediu de dinamică )(I :

11/

−−∏= n

ttII sau 1

1

−= nn

y

yI

Dacă dispunem de mai mulŃi indici medii ce caracterizează mai multe subperioade succesive de timp, indicele mediu ce caracterizează întreaga perioadă se calculează astfel:

∑⋅⋅⋅⋅= =

k

ii

ki

nnk

ni

nn IIIII 1 21 ......21

în care: I - indicele mediu general de dinamică;

iI - indicii medii parŃiali de dinamică; ni - numărul indicilor cu bază în lanŃ ce intră în componenŃa fiecărui indice

mediu parŃial; k - numărul subperioadelor, adică al indicilor medii parŃiali.

Ritmul mediu de dinamică ( ) %100(%) −= IR

6.4. Serii cronologice de intervale (perioade) de timp

Denumite şi serii de fluxuri, sunt seriile statistice în care fiecare indicator

reprezintă rezultatul unui proces social-economic pe fiecare perioadă de timp folosită în prezentarea datelor. Astfel de serii se pot întâlni în prezentarea evoluŃiei producŃiei, a cifrei de afaceri, a mărimii investiŃiilor, a profitului realizat, a creditului acordat şi/sau rambursat etc. Ele se întocmesc pentru indicatori însumabili pe o anumită perioadă de timp, care determină periodicitatea cu care se prezintă termenii seriei. Termenii seriei de intervale pot fi cumulaŃi obŃinându-se un indicator totalizator pe întreaga serie sau pe subperioade.

Page 34: Carte Statistica 2010 Gogu Emilia UCDC

CONF. UNIV. DR. EMILIA GOGU STATISTICA

34

Serii cronologice de momente (sau de stocuri) Sunt acelea în care fiecare indicator caracterizează mărimea la care a ajuns

caracteristica urmărită sau volumul colectivităŃii în momentul de calcul. De exemplu, puterea instalată, exprimată în mii Kw, la sfârşitul fiecărui an; populaŃia României, la 1 iulie a fiecărui an; valoarea capitalului fix al întreprinderii x la sfârşitul anului; valoarea capitalului investit în industrie la sfârşitul fiecărui trimestru sau an; numărul depunătorilor şi depozitelor la sfârşitul fiecărei luni etc.

Pentru seria de elemente este caracteristic faptul că termenii ei nu se pot cumula în vederea obŃinerii unui indicator statistic totalizator cu conŃinut real pe întreaga perioadă, deoarece seria de momente cuprinde înregistrări repetate. De exemplu, o parte din mărfurile de la 1 I se pot găsi şi în stocurile de la 1 II, 1 III etc. Deci, aceşti termeni reprezintă mărimi de stoc. Caracterizarea nivelului atins pe întreaga perioadă nu se poate face, în acest caz, decât pe baza unui indicator mediu.

Scopul analizei datelor unei serii cronologice este acela de a caracteriza modul de dezvoltare a fenomenelor sociale şi economice pe o perioadă expirată, în vederea extrapolării datelor statistice pentru fundamentarea diferitelor calcule de prognoză. Această analiză statistică se realizează în mod diferenŃiat în funcŃie de felul seriei (de stocuri sau de fluxuri); de lungimea seriei şi de periodicitatea cu care este înregistrată variabila de timp. Cea mai cuprinzătoare analiză statistică se realizează pentru seriile cronologice, în care variaŃia de timp este continuă şi pe grafic se poate descrie sub forma unei cronograme (historiograme) şi ca atare poate fi interpretată ca o funcŃie analitică de timp.

6.5. Ajustarea seriilor cronologice

EvoluŃia oricărui fenomen în timp este rezultanta unor influenŃe de natură sistematică şi a altora de tip aleator.

Componentele sistematice sunt: • trendul (tendinŃa generală); • sezonalitatea care se manifestă sub formă de oscilaŃii regulate la intervale mai

mici de un an (semestru, trimestru, lună, decadă); • ciclicitatea care se prezintă sub formă de fluctuaŃii în jurul tendinŃei înregistrate la

perioade mai mari de un an. Componentele aleatoare se manifestă sub forma unor abateri întâmplătoare de la

ceea ce are sistematic evoluŃia variabilei analizate. Prin ajustarea termenilor unei serii de date statistice, se înŃelege operaŃia de

înlocuire a termenilor reali cu termeni teoretici ce exprimă legitatea specifică de dezvoltare obiectivă a fenomenelor la care se referă datele.

Dispersia totală ( )2yσ se calculează după formula:

( )n

yyiy

2

2 ∑ −=σ

Dispersia termenilor seriei de la valorile ajustate ( )2/ ryσ sintetizează influenŃa

factorilor reziduali - factori neînregistraŃi - (în cazul seriilor cronologice toŃi factorii cu excepŃia factorului timp) şi se calculează cu formula:

Page 35: Carte Statistica 2010 Gogu Emilia UCDC

CONF. UNIV. DR. EMILIA GOGU STATISTICA

35

( )n

Yyiti

ry

2

2/

∑ −=σ

în care Yti reprezintă valoarea teoretică a variabilei y în funcŃie de timp.

Dispersia valorilor ajustate de la valoarea medie 2

/ tyσ sintetizează variaŃia

produsă numai de modificarea factorului timp:

( )n

yYit

ty

2

2/∑ −

a. Metode simple de ajustare a seriilor cronologice Metoda mediilor mobile Se foloseşte pentru seriile care prezintă oscilaŃii sezoniere şi ciclice. Mediile mobile sunt medii parŃiale, calculate dintr-un număr prestabilit de termeni,

în care se înlocuieşte pe rând primul termen cu termenul ce urmează în seria care trebuie să fie ajustată.

În practică putem calcula medii mobile dintr-un număr impar de termeni sau dintr-un număr par de termeni în funcŃie de periodicitatea influenŃei factorilor sezonieri.

Când ajustarea se face pe baza mediilor mobile calculate dintr-un număr par de termeni, mediile mobile se obŃin în două trepte: 1. medii mobile provizorii ( )yt care se plasează între termenii seriei;

2. medii mobile definitive sau centrate ( )yt , care se plasează în dreptul termenilor seriei şi cu care se face ajustarea termenilor seriei iniŃiale.

Metoda grafică Acest procedeu presupune reprezentarea grafică a seriei de date empirice prin

cronogramă (historiogramă), urmată de trasarea vizuală a dreptei sau curbei, astfel încât să aibă abateri minime faŃă de poziŃia valorilor reale în grafic.

Metoda modificării medii absolute Ajustarea prin acest procedeu se foloseşte atunci când, prelucrând seria de date, se

obŃin modificări absolute cu bază în lanŃ apropiate ca valoare unele de altele, fără să Ńinem sama de semnul lor.

FuncŃia de ajustare: ∆−+= )1(1 tyYt unde, nt ,1=

sau

∆+= it tyYi 0

unde,: y0 reprezintă termenul luat ca bază de ajustare (acea valoare care se apropie cel

mai mult de dreapta sau curba trasată vizual în grafic); ti reprezintă variabila de timp în raport cu baza de ajustare folosită (poziŃie pe

care termenul respectiv o are faŃă de termenul ales ca bază). Metoda indicelui mediu de dinamică Acest procedeu se foloseşte atunci când termenii seriei au tendinŃa de creştere de

forma unei progresii geometrice, în care raŃia poate fi considerată ca egală cu indicele mediu de dinamică ( )I .

FuncŃia de ajustare: 1

1−⋅= t

t IyY

sau

Page 36: Carte Statistica 2010 Gogu Emilia UCDC

CONF. UNIV. DR. EMILIA GOGU STATISTICA

36

i

i

tt IyY ⋅= 0

unde,: y0 reprezintă termenul luat ca bază de ajustare; ti reprezintă variabila de timp în raport cu baza de ajustare folosită (poziŃie pe

care termenul respectiv o are faŃă de termenul ales ca bază). b. Metode analitice de ajustare Metodele analitice au la bază un model matematic, în care tendinŃa centrală a

evoluŃiei se exprimă ca o funcŃie de timp: yi = f(ti) numită funcŃie de ajustare, în care: ti - reprezintă valorile variabilei independente (timpul); yi - reprezintă valorile variabilei dependente (fenomenele) care sunt prezentate în

seria cronologică. Alegerea tipului de funcŃie care se potriveşte cel mai bine pentru exprimarea

trendului se face pe baza următoarelor criterii aplicabile opŃional: � criteriul bazat pe reprezentarea grafică. Se construieşte cronograma şi se

apreciază forma tendinŃei de evoluŃie; � criteriul diferenŃelor. Se procedează la calculul diferenŃelor absolute cu

bază în lanŃ de ordinul unu, doi etc. până când obŃinem diferenŃele de ordin i aproximativ constante, ajustarea făcându-se după polinomul de gradul i.

Dacă fenomenul cercetat s-a dezvoltat în progresie geometrică, adică indicii cu bază în lanŃ sunt constanŃi (I t/t-1 = constant), admitem că seria cronologică respectivă prezintă o tendinŃă exponenŃială.

În urma alegerii funcŃiei de ajustare după criteriile prezentate se impune estimarea parametrilor acestor funcŃii utilizând metoda celor mai mici pătrate. Această metodă are ca funcŃie obiectiv minimizarea sumei pătratelor abaterilor valorilor reale de la cele ajustate deci:

( )∑ − 2miniti Yy ti= 1, 2, ... ,n timpul

Trend liniar Yti = a + b ti în care: Yti - reprezintă valorile ajustate calculate în funcŃie de valorile caracteristicii

factoriale (ti); a - reprezintă parametrul care are sens de mărime medie şi arată ce nivel ar fi

atins y dacă influenŃa tuturor factorilor cu excepŃia celui înregistrat, ar fi fost constantă pe toată perioada;

b - reprezintă parametrul care sintetizează numai influenŃa caracteristicii factoriale (t):

ti - reprezintă valorile caracteristicii factoriale care, în cazul seriilor cronologice, este timpul.

Parametrii a şi b se determină prin rezolvarea sistemului de ecuaŃii normale obŃinut prin metoda celor mai mici pătrate ( [ ]∑ =+− min)( 2

ii btay ):

=+

=+

∑∑∑∑∑

iiii

ii

yttbta

ytbna2

Page 37: Carte Statistica 2010 Gogu Emilia UCDC

CONF. UNIV. DR. EMILIA GOGU STATISTICA

37

Pentru ti∑ =0, sistemul de ecuaŃii normale devine:

=

=

∑∑∑

iii

i

yttb

yna2

de unde,

=

=

∑∑

2i

ii

i

t

ytb

n

ya

VariaŃia de timp trebuie centrată şi pentru seriile impare se măsoară în unităŃi iar pentru cele pare în jumătăŃi de interval între termenii seriei

Înlocuind valorile calculate ale celor doi parametri în ecuaŃia de regresie şi apoi înlocuind succesiv valorile variabilei timp se obŃin valorile ajustate ale caracteristicii rezultative.

6.6. Extrapolarea seriilor cronologice

Extrapolarea datelor unei serii statistice are la bază metodele şi procedeele folosite

la ajustare. Pentru a face distincŃie între termenii ajustaŃi (Yti) şi cei extrapolaŃi - care sunt

consideraŃi tot termenii teoretici - se vor nota termenii extrapolaŃi cu ,it

Y′ iar variabila de

timp cu ti’. Deci, formulele de calcul vor fi:

• pentru extrapolarea pe baza sporului mediu: ∆+=′ '

0 it tyYi

• pentru extrapolarea pe baza indicelui mediu de creştere: '

0i

i

tt IyY ±⋅=′

Aceste formule se aplică atunci când se folosesc valorile parametrilor ( )I,∆ din perioada expirată. În cazul când aceştia se modifică, formulele se modifică cu un coeficient K, astfel:

∆′+=′ '0 it tyY

i în care: ∆⋅=∆ k'

tt IyY ′±′⋅=′ 0 în care: IkI =′

Coeficientul k poate să fie mai mare sau mai mic decât 1. Dacă k<1, atunci înseamnă că se reduce variaŃia medie absolută sau relativă, după

cum se aplică la primul sau la al doilea procedeu. Dacă k>1, atunci înseamnă că valoarea parametrilor folosiŃi în extrapolare este

mai mare decât în perioada de analizat. Pentru extrapolarea pe baza metodelor analitice de calcul se pune, în primul rând,

condiŃia ca datele să se determine astfel încât să nu modifice originea variaŃiei de timp care este în mijlocul seriei cronologice şi pentru care Σti = 0. Deci, variaŃia de timp se extinde în ambele sensuri, deşi interesează numai tendinŃa obŃinută prin extinderea seriei pentru perioada următoare.