statistica

224
Lect. dr. ec. Remus C-tin BUTĂNESCU-VOLANIN, Statistică descriptivă Sibiu, 2008

Upload: ioananeamtu89

Post on 16-Dec-2015

27 views

Category:

Documents


14 download

DESCRIPTION

introducere

TRANSCRIPT

  • Lect. dr. ec. Remus C-tin BUTNESCU-VOLANIN, Statistic descriptiv Sibiu, 2008

  • Remus BUTNESCU-VOLANIN

    SSTTAATTIISSTTIICC

    DDEESSCCRRIIPPTTIIVV

    EDITURA UNIVERSITII LUCIAN BLAGA SIBIU, 2008

  • Copert i tehnoredactare: Remus C-tin Butnescu-Volanin Refereni tiinifici: Prof. dr. ec. Doina-Maria Simion, Universitatea Lucian Blaga din Sibiu Prof. dr. ec. Dr. H. C. Ioan Bogdan, Universitatea Lucian Blaga din Sibiu & Universitatea Romno-American din Bucureti Prof. dr. ing. i ec. Moise uurea, Universitatea Lucian Blaga din Sibiu Prezentri power-point, precum i aplicaii excel pe marginea textului

    de fa se pot consulta n seciunea Files a grupului de la adresa: http://groups.yahoo.com/group/RemusButanescu-Volanin_Statistica

    Butnescu-Volanin Remus Descrierea CIP a Bibliotecii Naionale a Romniei BUTNESCU, REMUS Statistic descriptiv / Butnescu-Volanin Remus. - Sibiu : Editura Universitii Lucian Blaga din Sibiu, 2008 Bibliogr. ISBN 978-973-739-675-4 519.22(075.8)

  • Cursul de Statistic descriptiv al domnului Butnescu-Volanin

    Remus este o lucrare academic bine documentat, bine structurat i coerent, cuprinznd nou capitole care se succed ntr-o ordine fireasc, de la simplu la complex, dezvoltate n coninutul lor, de la general la particular, pn la nivelul de detaliu obligatoriu necesar pentru cei interesai n abordarea acestei arii teoretice.

    Cursul mbin cunoaterea profund a teoriei cu o excelent experien didactic, lucru care face ca parcurgerea acestuia s devin o adevarat plcere. Frazele scurte i concentrate, metodologia statistic uor lizibil, aspectul tehnic i de punere n pagin a lucrrii, plcut, fac din cursul domnului Butnescu-Volanin un bun suport de abordare, nelegere i asimilare a statisticii. De asemenea, exemplele practice care completeaz coninutul teoretic, selectate i dezvoltate cu atenie, ntregesc nelegerea i faciliteaz formarea deprinderilor de studiu statistic.

    Cursul permite, prin trimiterile de subsol i prin bibliografia bogat, extinderea nvrii particulare spre detalii i spre diverse i variate puncte de vedere.

    Consider lucrarea de fa un excelent material pentru mbogirea cunoaterii statisticii, pentru studeni i pentru oricare specialist interesat. Prof. dr. ec. Doina Maria Simion Facultatea de Stiinte Economice Universitatea Lucian Blaga din Sibiu

    7

  • 8

  • C U P R I N S

    CAPITOLUL 1. Locul statisticii n cunoaterea uman 13

    1.1. Rolul statisticii n cunoaterea uman 15

    1.2. Planificarea cercetrii statistice 15

    1.3. Concepte de baz folosite n statistic 16

    1.4. Datele statistice i nivelurile de msurare a acestora 22

    1.5. Utilizarea calculatorului n prelucrarea i analiza statistic a datelor 24

    1.6. Observarea statistic 25

    1.7. Erorile de observare statistic. Controlul datelor nregistrate 28

    1.8. Prelucrarea primar a datelor statistice. 29

    1.9. Prezentarea rezultatelor prelucrrii primare a datelor 31

    CAPITOLUL 2. Exprimarea n mrimi relative a informaiilor statistice 41

    2.1. Mrimile relative de structur 44

    2.2. Mrimile relative de coordonare (coresponden) 46

    2.3. Mrimile relative de dinamic 46

    2.4. Mrimi relative de intensitate 47

    9

  • CAPITOLUL 3. Descrierea statistic a tendinei centrale: statisticile medii 49

    3.1. Media aritmetic 51

    3.2. Media geometric 58

    3.3. Media ptratic 67

    3.4. Media armonic 73

    3.5. Media generalizat sau media de ordinul "r" 80

    CAPITOLUL 4. Descrierea statistic a tendinei centrale: statisticile de poziie 81

    4.1. Cuantilele 83

    4.2. Mediana 83

    4.3. Moda 90

    4.4. Mediala 98

    CAPITOLUL 5. Descrierea statistic a concentrrii i diversificrii 105

    5.1. Statistici disponibile n descrierea numeric a concentrrii statistice pentru variabile statistice cantitative cu valori pozitive

    108

    5.2. Statistici disponibile pentru descrierea numeric a concentrrii statistice pentru variabile statistice calitative 122

    5.3. Statistici ale diversificrii 128

    10

  • CAPITOLUL 6. Descrierea statistic a variaiei 133

    6.1. Amplitudinea 137

    6.2. Abaterile individuale 138

    6.3. Abaterea medie liniar 140

    6.4. Variana sau dispersia 140

    6.5. Abaterea medie ptratic sau abaterea standard 150

    6.6. Coeficientul de variaie sau de omogenitate 151

    6.7.Alegerea statisticilor de variaie 153

    6.8. Momente centrate i momente necentrate 153

    6.9. Covariana 154

    CAPITOLUL 7. Descrierea statistic a formei repartiiilor statistice unimodale: oblicitatea i kurtosisul 159

    7.1. Statisticile de oblicitate 161

    7.2. Statisticile de kurtosis 169

    CAPITOLUL 8. Descrierea statistic a legturilor dintre fenomene 175

    8.1. Ce este corelaia statistic? 177

    8.2. Coeficientul de corelaie liniar Pearson 177

    11

  • 8.3. Regresia statistic liniar 181

    CAPITOLUL 9. Descrierea statistic a variaiei n timp 195

    9.1. Descrierea statistic a variaiei de nivel pentru repartiiile statistice cronologice 197

    9.2. Descrierea statistic a variaiei de structur pentru repartiiile statistice cronologice. Indicii agregai ponderai 212

    BIBLIOGRAFIE SELECTIV 221

    12

  • LOCUL STATISTICII N CUNOATEREA UMAN 11..

    OBIECTIVELE CAPITOLULUI

    Obiectivul principal al acestui capitol este de a v introduce n lumea statisticii, ajutndu-v:

    s nelegei rolul statisticii n cunoaterea uman; s reinei principalele concepte ale limbajului statistic; s facei distincia ntre preocuprile statisticii descriptive i cele ale statisticii

    infereniale;

    s reinei diferitele niveluri posibile de msurare a datelor.

  • 14

  • 15

    1.1. Rolul statisticii n cunoaterea uman. Conceptele i metodele statistice sunt aplicate de fiecare dat cnd este avut n vedere o anumit generalizare n legtur cu un fenomen studiat, ceea ce impune existena urmtoarelor condiii: 1. Condiia de volum: considerarea unui numr mare de cazuri

    individuale; 2. Condiia de justificare a analizei statistice: existena unui anumit grad

    de variabilitate de la un caz la altul, dat de influenele mai multor factori de natur diferit.

    Generalizrile obinute pe calea studiului statistic sunt reprezentri nedeterministe sau de tip stocastic, lund forma aa-numitelor legi statistice, legi care descriu tendine predominante la nivelul cazurilor individuale aflate n legtur cu fenomenul studiat. Cea mai important lege statistic este legea numerelor mari, formulat pentru prima dat de ctre Jacob Bernoulli (1654-1705) n celebra sa lucrare Ars Conjectandi. Ea se constituie ca un principiu fundamental al cercetrii statistice, afirmnd c ntr-un numr suficient de mare de cazuri individuale, influenele diverilor factori se pot compensa, astfel nct s se ajung la o anumit valoare tipic, reprezentativ pentru ntreg ansamblul. Respectarea acestui principiu presupune, prin urmare, ca n cercetarea statistic s fie luat n considerare un numr suficient de mare de cazuri individuale condiia de volum la care ne-am referit i mai sus astfel nct abaterile ntr-un sens sau altul s se poat compensa. Statistica nu trebuie confundat cu un simplu domeniu al matematicii, dei ea presupune folosirea, ntr-o proporie covritoare, a instrumentarului matematic. Acesta din urm face, de altfel, obiectul unei discipline distincte i mult mai recente, i anume al statisticii matematice, ramur a matematicii care elaboreaz noiunile i metodele folosite n statistic1.

    1.2. Planificarea cercetrii statistice. Un loc important n cercetarea statistic trebuie acordat etapei de planificare a acesteia. Cei care investigheaz trebuie s fie contieni de limitele caracteristice cercetrilor statistice. Astfel de limite sunt, de exemplu, cele determinate de indisponibilitatea tuturor datelor statistice necesare.

    1 Cf. Dicionarului explicativ al limbii romne, Academia Romn, Institutul de Lingvistic "Iorgu Iordan", Editura Univers Enciclopedic, ediia 1998, http://dexonline.ro/

  • 16

    Planificarea unei cercetri statistice poate fi sensibil mbuntit dac este fcut efortul de plasare nu doar n postura de productori ai rezultatelor statistice, ci i n aceea de consumatori ai acestora. n acest fel, se pot identifica mai bine factorii relevani care trebuie studiai pentru atingerea obiectivelor fixate, factori pe baza crora se vor putea defini criteriile de observare statistic, adic variabilele statistice. S presupunem, de pild, c dorim s rspundem la ntrebarea: Sunt brbaii oferi mai buni dect femeile sau invers? n acest caz, ar fi incorect s ncercm s cutm rspunsul analiznd ratele accidentelor de main pe o anumit perioad, pentru a compara rata accidentelor provocate de brbai cu rata accidentelor provocate de femei. Pentru o concluzie corect sunt necesare mai multe criterii. Astfel, accidentele sunt determinate i de nclinaia de expunere la risc, care difer la femei fa de brbai. Este, aadar, incorect s presupunem ca singur factor al accidentelor de main abilitatea de a conduce, nelund n calcul i nclinaia de expunere la risc.

    1.3. Concepte de baz folosite n statistic. Statistica i-a elaborat pe parcursul dezvoltrii sale un limbaj specific. n continuare vor fi prezentate conceptele de baz cu care opereaz statistica. Populaia i unitatea statistic Populaia statistic reprezint mulimea tuturor elementelor a cror observare este necesar pentru obinerea statisticilor dorite. Ea se mai numete i colectivitate statistic sau univers statistic. Definirea populaiei statistice asigur stabilirea explicit a ntinderii i naturii mulimii de date pe baza crora se vor trasa concluziile cercetrii statistice. De aceea este necesar specificarea exact n cadrul etapei de planificare a cercetrii statistice a granielor care definesc n timp i spaiu populaia statistic. Aceste granie se stabilesc n funcie de statisticile care fac obiectul cercetrii. Elementele unei populaii statistice sunt denumite uniti statistice. n tabelul 1.1 sunt prezentate cteva exemple de populaii statistice definite corespunztor informaiilor statisticile dorite. Populaiile statistice pot fi abordate static sau dinamic. Abordarea static este cea prin care populaia statistic este studiat la un anumit moment n timp. n cadrul abordrii dinamice, populaia statistic este observat n devenirea sa n timp.

  • Tabelul 1.1 Exemple de populaii statistice

    Informaii statistice dorite Populaia statisticCea mai mare companie privat din

    Romnia n anul 2006, dup cifra de afaceri

    Companiile private care funcionau n Romnia n

    anul 2006Numrul de cstorii care au avut loc n

    Romnia n anul 2006Cstoriile ncheiate n anul

    2006 n Romnia Traficul mediu de pasageri pentru

    primele 10 aeroporturi din topul ACI (Airports Council International)

    Aeroporturile internaionale participante la topul ACI

    Media vnzrilor lunare pentru automobilele marca Daewoo n prima

    jumtate a anului 2006

    Nivelurile de vnzri nregistrate n primele 6 luni

    ale anului 2006 pentru automobilele marca Daewoo

    Variabilele i repartiiile statistice Variabilele statistice sunt criteriile de interes dup care unitile statistice sunt supuse studiului statistic. Se numesc aa deoarece pot lua valori diferite de la o unitate statistic la alta. n figura 1.1 este prezentat clasificarea variabilelor statistice n funcie de natura lor.

    alternative (de tipul DA/NU)

    cantitative sau numerice

    calitative sau nenumerice

    nealternative (cronologice, teritoriale,

    atributive)

    continue (definite pe intervale)

    discrete (cu valori n salturi)

    Variabile statistice

    Figura 1.1 Clasificarea variabilelor statistice

    17

  • 18

    O problem important n cercetarea statistic o reprezint stabilirea listei de variabile dup care se studiaz populaia statistic. n aceast list trebuie s apar doar variabilele care rspund direct obiectivului propus. Valorile particulare pe care le poate nregistra o variabil statistic la nivelul unitilor statistice se numesc variante. Numrul de apariii ale unei anumite variante statistice n urma efecturii unei observri statistice se numete frecven statistic. Frecvenele statistice se exprim n valori absolute sau relative. Frecvenele statistice relative se obin prin raportarea frecvenelor statistice absolute la totalul frecvenelor nregistrate la nivelul populaiei statistice. Pentru datele grupate, poate fi util i determinarea volumelor statistice, adic a subtotalurilor corespunztoare variantelor nregistrate de ctre o variabil statistic numeric, obinute ca produse ntre variante i frecvenele lor de apariie. Ansamblul format din irul de variante pe care le nregistreaz o variabil statistic la nivelul tuturor unitilor statistice dintr-o populaie statistic, mpreun cu irul de frecvene statistice nregistrate se numete repartiie sau distribuie statistic.

    Tabelul 1.2 Repartiia absolut i repartiia relativ a vnzrilor de autoturisme autohtone nregistrate n Romnia n 20052

    Frecvene absolute Frecvene relative

    Ianuarie 7540 7540 / 113489 = 6,64%

    Februarie 9635 8,49%

    Martie 13314 11,73%

    Aprilie 11186 9,86%

    Mai 10163 8,96%

    Iunie 12981 11,44%

    Iulie 10056 8,86%

    August 2921 2,57%

    Septembrie 7343 6,47%

    Octombrie 10841 9,55%

    Noiembrie 9442 8,32%

    Decembrie 8067 7,11%

    Total 113489 100,00%

    2 Sursa datelor: APIA Asociaia Productorilor i Importatorilor de Automobile.

  • 19

    n afar de repartiiile statistice empirice (reale, experimentale), n cercetarea statistic se folosesc i repartiii statistice teoretice sau probabilistice, pentru care irului de variante ale variabilei statistice i corespunde un ir de probabiliti de apariie. n tabelul 1.2 sunt prezentate repartiiile statistice ale frecvenelor absolute i relative nregistrate n Romnia n anul 2005 pentru vnzrile de autoturisme autohtone. Dac nu se prevd modificri eseniale n evoluia lunar a vnzrilor de autoturisme autohtone pentru anul 2006, se poate considera repartiia frecvenelor relative nregistrate n anul 2005 ca repartiie probabilistic a vnzrilor de autoturisme autohtone pentru anul 2006. Indicatorii statistici sau statisticile Indicatorii statistici sau statisticile sunt valori reprezentative pentru repartiiile statistice, obinute prin diversele operaii numerice (de calcul, cumulare, agregare etc.). Statisticile se pot clasifica n:

    statistici de descriere a tendinei centrale media aritmetic, mediana, modul etc.;

    statistici ale concentrrii abaterea medial-median, indicele de concentrare Gini, energia informaional Onicescu etc.;

    statistici ale diversificrii gradul de diversificare, raportul de diversificare, indicele de diversificare;

    statistici de variaie amplitudinea sau cmpul de variaie, abaterea medie ptratic, dispersia sau variana, coeficientul de variaie etc.;

    statistici de caracterizare a formei repartiiei coeficientul lui Pearson, coeficientul lui Fisher etc.;

    statistici de corelaie covariana, coeficientul de corelaie liniar, raportul de corelaie, raportul de determinaie, coeficientul de corelaie Kendall, coeficientul de corelaie Spearman etc.

    Statistica descriptiv Metodele statisticii descriptive rspund nevoilor de descriere a unei colectiviti de uniti statistice prin valorile lor reprezentative, adic prin statistici. Fac obiectul descrierii statistice acele experiene care sunt n legtur cu fenomene care nu sunt caracterizate de o uniformitate sistematic. n msura n care se poate discerne o regularitate n derularea unui fenomen, recursul la descrierea statistic a acestuia nu mai este

  • 20

    necesar3. De exemplu, scopul statisticii demografice privind durata medie de via a unei populaii nu este acela de a evidenia faptul c toi oamenii sunt muritori, ci de a informa n legtur cu lungimea vieii umane, a crei magnitudine, nu este, conform observaiilor statistice, uniform. Pentru obinerea statisticilor prin care se pot descrie colectivitile statistice studiate este necesar parcurgerea urmtoarelor dou etape:

    centralizarea datelor obinute n urma observrilor statistice; prelucrarea datelor centralizate cu ajutorul tehnicilor de calcul statistice. n urma centralizrii datelor statistice se obin statisticile primare, iar prin prelucrarea, cu ajutorul tehnicilor de calcul statistice, a statisticilor primare, se obin statisticile derivate. Att statisticile primare, ct i statisticile derivate, sunt expresii numerice ale fenomenelor studiate statistic. Statisticile primare descriu n mrimi absolute fenomenele studiate, exprimnd direct nivelurile cantitative ale variabilelor studiate. Ele se pot determina global sau prin cumulare treptat. Centralizarea la nivelul ntregii colectiviti statistice este calea obinerii statisticilor primare globale, iar centralizarea la nivelul grupelor colectivitii statistice asigur obinerea statisticilor primare cumulate. Statisticile primare se exprim n unitile de msur specifice variabilelor studiate (buci, kilograme, metri etc.). Cu ajutorul lor se pot face doar aprecieri globale privind fenomenele studiate. Statisticile derivate sunt necesare pentru evidenierea tendinelor specifice (care intereseaz n cercetrile ntreprinse) manifestate la nivelul colectivitilor statistice studiate. Pentru cunoaterea multilateral, din punct de vedere statistic, a fenomenelor, este necesar utilizarea combinat a statisticilor absolute (primare) i a celor derivate. Am ales pentru exemplificare statisticile primare privind natalitatea, mortalitatea i sporul natural pentru lunile decembrie 2006 i ianuarie 2007, centralizate la nivelul Institului Naional de Statistic din Romnia. Acestea sunt prezentate n tabelul 1.3. Dup cum se poate observa, pe baza statisticilor primare au fost calculate direct n tabelul 1.3 statisticile derivate privind sporul natural i variaia de la o lun la alta, obinndu-se urmtoarele informaii suplimentare:

    - n luna ianuarie 2007 s-a nregistrat un numr de nscui-vii mai mare cu 3.507 fa de luna decembrie 2006;

    3 Ludwig von Mises, The Ultimate Foundation of Economic Science, Van Nostrand Edition, 1962, p. 55: As far as there is discernible regularity in the succession of phenomena, no recourse to statistics is needed.

  • 21

    - n luna ianuarie 2007 s-a nregistrat un numr de decedai mai mare cu 2155 fa de luna decembrie 2006;

    - creterea mai mare a numrului de nscui-vii fa de cea a numrului de decedai a dus la o cretere cu 1.352 a sporului natural (diferena dintre numrul de nscui-vii i numrul de decedai); acesta s-a meninut ns, n continuare, negativ (de la -8.135 a ajuns la -6.783).

    Tabelul 1.3 Statistici ale Institului Naional de Statistic din Romnia

    privind natalitatea, mortalitatea i sporul natural pentru lunile decembrie 2006 i ianuarie 20074

    Numr nscui-viiNumr

    decedai Spor natural

    Decembrie 2006 15288 23423 -8135

    Ianuarie 2007 18795 25578 -6783

    Variaie 3507 2155

    (-6783) (-8135) =

    3507 2155 =

    1352

    Statistica inferenial Statistica modern s-a dezvoltat mai ales prin apariia i dezvoltarea metodelor de investigare parial. Metodele de investigare statistic parial sunt metode ale aa-numitei statistici infereniale. Statistica inferenial i propune s caracterizeze populaia statistic studiat prin observarea doar a uneia sau mai multor pri ale acesteia, denumite eantioane. Bineneles, o astfel de caracterizare nu poate fi dect una estimativ, valorile statistice obinute la nivel de eantion statistic fiind denumite estimatori statistici. Estimarea statisticilor unei populaii prin intermediul unor astfel de metode se numete infereniere statistic (figura 1.2). Eantionul este o parte din ntregul definit de o populaie statistic, parte care, atunci cnd este corect constituit (adic innd cont de principii statistice izvorte din teoria seleciei), este suficient de reprezentativ pentru ntreaga populaie statistic din care provine.

    4 Conform comunicatelor de pres ale Institului Naional de Statistic - nr. 35 din 15 februarie 2007 i, respectiv, nr. 56 din 20 martie 2007, http://www.insse.ro/statistici/comunicate/pop.htm

  • P O P U L A I E d e s c r i s d e s t a t i s t i c a

    E A N T I O N l a n i v e l u l c r u i a s e d e t e r m i n

    e s t i m a t o r u l

    E s t i m a r e a s t a t i s t i c i i

    S E L E C I A a l e a t o a r e a u n u i

    e a n t i o n i c a l c u l u l u n e i

    e s t i m a t o r a l s t a t i s t i c i i

    Figura 1.2 Inferenierea statistic

    1.4. Datele statistice i nivelurile de msurare a acestora. Pentru a fi complete, datele statistice trebuie s conin urmtoarele elemente:

    noiunea, care precizeaz fenomenul sau procesul la care se refer data statistic;

    identificatorii de spaiu, de timp i de organizare; valoarea numeric nsoit, dac este cazul, de unitatea de msur. De exemplu, pentru data statistic venitul mediu pe un membru al familiei Popescu din oraul Sibiu, pe anul 2006, este de 585 RON noiunea este venitul mediu pe un membru al unei familii, identificatorul organizatoric este familia Popescu, identificatorul de spaiu este Sibiu, identificatorul de timp este anul 2006 iar valoarea numeric este 585, cu unitatea de msur RON. Datele statistice sunt purttoare de informaii statistice, acestea din urm constnd n mesajele semnificative oferite de datele statistice. Datele statistice se pot clasifica dup nivelurile de msurare folosite n exprimarea lor n:

    date statistice nominale; date statistice ordinale; date statistice de tip interval; date statistice raionale.

    22

  • 23

    Nivelul de msurare nominal a datelor Valorile numerice corespunztoare datelor aflate pe nivelul nominal de msurare pot fi utilizate doar n clasificri ale acestora. Variabilele statistice generatoare de astfel de date sunt variabilele calitative, adic variabilele ale cror variante sunt reprezentate de diferite atribute nenumerice. S considerm, de pild, variabila profesie, cu urmtoarele 4 variante: 1. profesor; 2. avocat; 3. medic; 4. altele. Valorile numerice 1, 2, 3 i 4 desemnate pentru variante nu pot fi folosite dect pentru clasificarea acestora. Tehnicile statistice care rspund analizei unor astfel de date sunt, prin urmare, foarte limitate. Nivelul de msurare ordinal a datelor Acest nivel de msurare este superior nivelului nominal din punctul de vedere al puterii de prelucrare a datelor. Astfel, pe acest nivel de msurare a datelor se pot efectua, pe lng clasificri, i ordonri ale datelor. Ca exemplu, s considerm variabila statistic calitate, definit de urmtoarele 5 variante: 1. Foarte rea; 2. Rea; 3. Medie; 4. Bun; 5. Foarte bun. Dup cum se observ, valorile numerice asociate variantelor pot fi folosite att pentru clasificarea datelor, ct i pentru ordonarea acestora. Nivelul de msurare pe intervale a datelor Nivelul de msurare pe intervale este superior nivelurilor prezentate anterior, prin faptul c ntre valorile numerice asociate variantelor variabilelor statistice sunt distane egale (intervale), ceea ce d posibilitatea utilizrii de tehnici statistice suplimentare pentru astfel de date statistice. Variabila pe care o alegem ca exemplu este temperatura, avnd ca i variante valorile numerice ale scrii Celsius. Pentru astfel de date nu sunt ns disponibile operaiile aditive sau multiplicative ntre variante. Nivelul de msurare raional al datelor Fa de nivelul de msurare pe intervale, acestui nivel i este caracteristic n plus existena unei valori numerice nule, a unui zero absolut.

  • ntruct, n aceste condiii devin disponibile i operaiile aditive sau multiplicative, nivelul de msurare raional a datelor este cel mai nalt nivel de msurare. Nivelurile de msurare i tehnicile statistice corespunztoare. Tehnicile statistice se pot mpri n:

    tehnici parametrice; tehnici neparametrice. Tehnicile parametrice cer ca datele s fie aflate pe nivelurile de msurare raional sau pe intervale. Dac datele se afl pe niveluri de msurare inferioare ordinal sau nominal atunci sunt disponibile doar tehnicile statistice neparametrice, care pot fi folosite i pentru date aflate pe nivelurile de msurare superioare. n figura 1.3 este sugerat potenialul de analiz statistic pentru cele 4 niveluri de msurare a datelor. Desigur, nivelul raional este caracterizat de potenialul maxim de prelucrare i analiz statistic.

    Raional

    Interval

    Ordinal

    Nominal

    Figura 1.3 Potenialul de analiz statistic pentru cele 4 niveluri de

    msurare a datelor statistice

    1.5. Utilizarea calculatorului n prelucrarea i analiza statistic a datelor

    Dezvoltarea deosebit a calculatoarelor a deschis multe oportuniti noi pentru activitatea de prelucrare i de analiz statistic a unui volum din ce n ce mai mare de date necesare n activitile umane.

    24

  • 25

    Calculatorul permite stocarea, regsirea i transferul rapid a unei mari cantiti de date. n ultimii ani s-au dezvoltat programe tot mai sofisticate dedicate acestor scopuri. Anumite tehnici statistice, foarte utile n luarea deciziilor pe care le implic desfurarea corespunztoare a activitilor umane, sunt n acelai timp foarte greoaie i plictisitoare, predispunnd la multe greeli n ce privete calculele realizate manual sau chiar cu ajutorul unor minicalculatoare. Acest fapt a fcut ca aceste tehnici s fie folosite practic de puini utilizatori nainte de dezvoltarea i utilizarea pe scar larg a calculatoarelor. Astzi sunt disponibile ns multe pachete software dedicate prelucrrii i analizei statistice. Printre cele mai cunoscute pachete software dedicate prelucrrii i analizei statistice se pot meniona: SPSS; STATISTICA; SAS; Minitab etc. Alturi de aceste pachete dedicate, se pot folosi i pachete software de tip "spreadsheet", adic pentru "calcul tabelar", dintre care cel mai cunoscut i folosit este EXCEL. Foarte utile pot fi i aplicaiile statistice on-line. Astfel, pe site-ul aflat la adresa http://www.statistics.com se pot gsi diverse mici aplicaii statistice, o mare parte dintre acestea fiind oferite gratuit spre descrcare i instalare. De asemenea, la adresa http://www.wessa.net se poate folosi un foarte puternic calculator statistic on-line.

    1.6. Observarea statistic Cercetarea statistic se desfoar n urmtoarele trei etape:

    observarea statistic, adic culegerea datelor statistice; prelucrarea datelor obinute n faza precedent; analiza i interpretarea rezultatelor obinute n urma prelucrrii. Aceste etape trebuie abordate mpreun, ca un tot unitar, asigurndu-se astfel premisa reducerii riscului unor erori de culegere, prelucrare sau analiz statistic. Pentru a putea satisface corespunztor necesitile de cercetare statistic, observarea statistic trebuie s ndeplineasc dou condiii:

    condiia de volum, care presupune culegerea datelor de la toate unitile care compun populaia sau eantionul statistic, aa cum au fost definite acestea n etapa de planificare statistic;

  • 26

    condiia de calitate, care presupune nregistrarea de date autentice, reale.

    Dup modul de organizare a lor n timp, observrile statistice se pot clasifica n:

    observri permanente (cum sunt, de exemplu, cele realizate prin raportrile statistice din cadrul Sistemelor Informaionale Statistice (SIS) Naionale);

    observri fr caracter permanent, cum sunt recensmintele, anchetele, monografiile statistice etc.

    Dup numrul unitilor supuse observrii, observrile statistice se pot mpri n:

    observri totale n urma crora se obin date de la toate unitile care compun populaia statistic int (recensminte, rapoarte statistice etc.);

    observri pariale (observri prin sondaj sau prin selecie) prin care se culeg date doar de la o parte (eantion) din unitile care compun populaia statistic int.

    Principalele metode de observare statistic sunt:

    recensmntul; sistemul de raportare statistic; sondajul sau selecia statistic; ancheta statistic; observarea prii principale (panelul); monografia statistic. Recensmntul Recensmntul este cea mai veche metod de observare statistic, constnd n culegerea periodic de date statistice de la toate unitile care compun populaia statistic int. Caracterul periodic (de exemplu, recensmintele demografice se organizeaz, de regul, din 10 n 10 ani) al recensmntului este impus de eforturile mari pe care acesta le presupune. Sistemul de raportare statistic Prin intermediul unui sistem de raportare statistic se dorete o observare permanent a tuturor unitilor statistice componente ale populaiei statistice int.

  • 27

    n cadrul unui sistem de raportare statistic, unitile statistice trebuie s furnizeze permanent datele statistice solicitate, astfel nct s poat fi surprins evoluia n timp a fenomenelor cercetate. Sondajul sau selecia statistic Sondajul sau selecia statistic este o metod de observare statistic parial a populaii statistice int. O observare statistic parial este motivat prin eforturile mai mici pe care aceasta le presupune. n cazul unei asemenea observri se cere ns rezolvat problema reprezentativitii eantionului (partea din populaie care este selectat pentru a fi supus observrii) ales pentru studiu. Cerina de asigurare a reprezentativitii face din alegerea eantionului o problem destul de complex. Ancheta statistic Ancheta statistic este metoda de observare statistic parial n cadrul creia nu se ine cont de problema reprezentativitii eantionului constituit. Ea se bazeaz, de regul, pe distribuirea direct (cu ocazia unor trguri, expoziii etc.) sau indirect (de exemplu, prin pot) de chestionare a cror completare este benevol. Avantajul acestei metode const n economicitatea ei. n schimb, neasigurarea condiiei de reprezentativitate a eantionului face dificil controlul privind erorile statistice ale rezultatelor obinute. n consecin, rezultatele obinute se pot extinde asupra ntregii colectiviti statistice numai cu o aproximaie necontrolabil. Observarea prii principale (masivul principal sau panelul) Observarea prii principale este metoda de observare statistic parial prin care se culeg date numai de la cele mai semnificative uniti ale populaiei statistice int. Prin aceast metod se nltur dezavantajul metodei precedente, asigurndu-se reprezentativitatea unitilor statistice supuse studiului. Spre deosebire de metoda sondajului, unde reprezentativitatea se asigur printr-o eantionare statistic, n cazul metodei observrii prii principale reprezentativitatea se asigur prin stabilirea unei pri din colectivitatea statistic, numit parte principal, masiv principal sau panel, parte supus permanent observrii statistice.

  • 28

    Dificultatea acestei metode const n stabilirea prii principale i n asigurarea receptivitii acesteia la solicitarea permanent de date. Monografia statistic Monografia statistic este, propriu-zis, o metod de cercetare statistic, realizat cu scopul depistrii de noi elementele care apar la nivelul populaiei statistice studiate, ceea ce presupune o anumit aprofundare a etapei de observare statistic. Monografia statistic presupune nu numai culegerea datelor ci i interpretarea acestora. O ontribuie important la dezvoltarea colii statistice monografice a adus-o i sociologul romn Dimitrie Gusti.

    1.7. Erorile de observare statistic. Controlul datelor nregistrate

    Erorile de observare statistic sunt determinate cel mai des de: omisiuni de nregistrare a variantelor particulare ale variabilelor studiate; nelegerea sau transmiterea greit a unor mrimi numerice; culegerea de date conform unor instruciuni greit nelese; nregistrri pe baz de date inexacte (din memorie) etc. n general, erorile de observare statistic se mpart n:

    erori ntmpltoare erori foarte des ntlnite, care se produc de cele mai multe ori din neatenie. Acest gen de erori afecteaz rezultatele observrii ntr-o mic msur deoarece ele se produc n ambele sensuri, compensnd-se;

    erori sistematice erori care se produc n acelai sens, determinnd abateri semnificative de la nivelul real al caracteristicilor studiate. Aceste erori sunt determinate, de cele mai multe ori, de redactarea necorespunztoare a instruciunilor de culegere a datelor.

    Cele dou grupe de erori amintite pot aprea i pe parcursul celorlalte dou etape ale programului de cercetare statistic (prelucrarea primar i analiza datelor statistice). Pentru evitarea apariiei de erori n etapa de observare statistic, se recomand:

    efectuarea unor observri de prob; aplicarea de operaii de control pentru depistarea la timp a eventualelor

    erori. Controlul poate fi de tip aritmetic sau de tip logic. Controlul aritmetic presupune efectuarea de operaii simple de calcul (pe baza unor "chei de calcul") pentru analiza i verificarea unor date derivate. Controlul logic const n testarea concordanei logice ntre variantele

  • 29

    diferitelor variabile nregistrate la aceeai unitate de observare sau ntre diferite variante pentru aceeai variabil;

    instruirea atent a celor nsrcinai cu culegerea datelor; formularea i transmiterea de instruciuni clare, fiind chiar indicat

    menionarea expres a cazurilor cnd riscul de apariie a erorilor este mai mare;

    n cazul observrii indirecte, elaborarea de formulare complete n care s se indice foarte clar ce anume trebuie s se nregistreze.

    1.8. Prelucrarea primar a datelor statistice. Coninutul prelucrrii primare a datelor statistice Pentru obinerea unei prime imagini asupra colectivitii (populaie sau eantion) statistice studiate, dar i pentru asigurarea condiiilor necesare unor prelucrri aprofundate a datelor, este necesar mai nti prelucrarea primar a datelor colectate. Prelucrarea primar este prima faz a prelucrrii statistice a datelor colectate i const n operaii de grupare i centralizare a acestora. n urma prelucrrii primare, se obin primele statistici privind colectivitatea statistic studiat, denumite statistici primare. De asemenea, prelucrarea primar a datelor statistice ofer posibilitatea descrierii grafice, prin intermediul tabelelor i diagramelor statistice, a colectivitii statistice studiate.

    Centralizarea datelor statistice

    Centralizarea datelor statistice se poate realiza global sau pe grupe. Centralizarea global se realizeaz prin cumularea datelor obinute pentru ntreaga colectivitate statistic. Centralizrile globale pot furniza informaii importante, numrndu-se deseori ntre principalele obiective ale cercetrii statistice. De pild, prin centralizarea datelor obinute n urma organizrii unui recensmnt demografic se poate obine numrul de locuitori al unei ri la momentul efecturii acestuia. Centralizarea pe grupe se realizeaz prin cumularea datelor care au fost n prealabil ordonate i grupate dup anumite criterii de interes. Centralizarea pe grupe ofer posibilitatea unei cunoateri detaliate a fenomenului studiat, prin analiza acestuia pe elementele sale de structur. De exemplu, prin centralizarea pe grupe a datelor obinute n urma unui recensmnt demografic se poate obine numrul de locuitori pe judee, pe

  • sexe, pe categorii socio-profesionale etc., n funcie de criteriile stabilite pentru gruparea datelor. Prin gruparea datelor statistice pot fi satisfcute necesiti ale analizei statistice. De exemplu, prin gruparea datelor statistice se pot pune n eviden efectele unei relaii cauzale dintre dou sau mai multe variabile. Gruparea datelor trebuie realizat cu respectarea condiiei de omogenitate. Aceasta nseamn c diferenele nregistrate n interiorul grupei nu pot depi anumite limite fixate anterior.

    Clasificarea gruprilor statistice

    n funcie de numrul criteriilor (variabilelor) de grupare, gruparea poate fi:

    simpl, adic dup un singur criteriu, rezultatul gruprii putnd fi redat printr-un tabel simplu;

    combinat, realizate dup dou sau mai multe variabile concomitent, rezultatul urmnd a fi redat printr-un tabel combinat.

    n funcie de natura criteriilor de grupare, se pot realiza:

    grupri cronologice, realizate dup un criteriu de timp (ziua, luna, anul etc.). Coleciile de date obinute n urma centralizrii datelor dup asemenea criterii se numesc serii statistice cronologice;

    grupri spaiale sau teritoriale, realizate dup un criteriu de spaiu (ara, judeul, zona geografic etc.). Coleciile de date obinute n urma centralizrii datelor dup asemenea criterii se numesc serii statistice teritoriale;

    grupri dup variabile atributive (de exemplu, grupri pe tipuri, pe feluri etc.);

    grupri dup variabile cantitative, care la rndul lor pot fi cu variaie discret (grupri pe variante, pe valori discrete) sau cu variaie continu (grupri pe intervale).

    Gruparea statistic pe intervale egale

    Pentru gruparea datelor pe intervale egale se recomand parcurgerea urmtoarelor etape: 1. Stabilirea amplitudinii variaiei, cu ajutorul relaiei:

    minmax xxA = unde:

    30

  • A reprezint amplitudinea variaiei; =maxx limita superioar de variaie (varianta maxim pe care o poate lua

    variabila statistic); =minx limita inferioar de variaie (varianta minim pe care o poate lua

    variabila statistic). 2. Stabilirea mrimii intervalului de grupare.

    a. dac numrul de grupe este anterior fixat, se folosete relaia:

    g

    minmax

    gi n

    xxnAm ==

    unde:

    im reprezint mrimea intervalului de grupare;

    =gn numrul de grupe; b. dac nu se fixeaz anterior numrul de grupe, se folosete relaia propus de H.A. Sturges:

    nlog322,31xxm minmaxi +

    = unde n reprezint numrul de uniti statistice.

    3. Formarea intervalelor de grupare pornind de la limita inferioar de variaie. Intervalele pot fi deschise doar la unul dintre capete.

    1.9. Prezentarea rezultatelor prelucrrii primare a datelor Gruparea i centralizarea datelor statistice asigur posibilitatea descrierii grafice a colectivitii statistice studiate prin intermediul tabelelor i diagramelor statistice. Asemenea descrieri grafice sunt publicate n rapoarte, buletine sau anuare statistice etc. i pot fi folosite pentru continuarea studiului statistic al datelor respective prin determinarea diverselor statistici, prin analize statistice aprofundate etc.

    Tabelele statistice

    Tabelele statistice se construiesc n aa fel nct s conin urmtoarele elemente:

    31

  • 32

    titlul general, prin care este prezentat, ntr-o form complet, dar i concis, obiectul tabelului. Pentru a fi complet, titlul general trebuie s defineasc populaia statistic att n spaiu, ct i n timp. Concizia titlului general nu trebuie s afecteze, desigur, precizia i claritatea sa;

    titlurile interioare, adic cele ale rndurilor i coloanelor tabelului. Titlurile interioare definesc gruparea sau gruprile datelor statistice prezentate;

    macheta tabelului, adic reeaua de rnduri i coloane (care formeaz rubricile n care se nscriu datele);

    unitile de msur utilizate pentru exprimarea datelor; eventualele note explicative necesare pentru interpretarea corect a

    datelor;

    sursele datelor, a cror cunoatere permite verificarea, de ctre cei interesai, a exactitii informaiilor.

    Dup numrul i natura variabilelor statistice implicate, se ntocmesc:

    tabele simple sau descriptive, prezentnd repartiia populaiei analizate dup o singur variabil statistic. Ele nlesnesc prezentarea datelor statistice ordonate din punct de vedere cronologic, teritorial sau organizatoric;

    tabele combinate, n care datele sunt prezentate n urma gruprilor combinate dup dou sau mai multe variabile. Cnd exist o dependen ntre cele dou variabile, tabelul este unul de corelaie sau de asociere statistic.

    Diagramele statistice

    Calea cea mai expresiv de prezentare a datelor statistice este cea grafic. Prin reprezentarea grafic a datelor statistice se asociaz acestora o imagine spaial, cu caracter convenional, prin care se reliefeaz ceea ce este esenial populaiei statistice care face obiectul cercetrii. Pentru a fi complet, reprezentarea grafic trebuie s conin urmtoarele elemente:

    titlul graficului, care arat la ce se refer reprezentarea grafic, cu specificarea locului i perioadei pentru care sunt prezentate datele;

    axele de coordonate. Coordonatele pot fi rectangulare sau polare (n cazul seriilor cronologice);

    titlurile interioare, care arat ce se msoar pe fiecare ax de coordonate.

  • 33

    reeaua graficului, format din linii paralele, orizontale i verticale, trasate explicit sau subnelese, servind la nscrierea simbolurilor i figurilor. Reelele pot fi aritmetice, logaritmice, semilogaritmice sau polare;

    scara de msur, prin care este stabilit relaia dintre unitatea grafic de msur i unitatea de msur a variabilei (de exemplu: 1 cm = 100.000 de lei). Se folosesc scri de msur uniforme (scara aritmetic, n care diviziunile sunt echidistante) sau neuniforme (scara logaritmic, folosit, n special, pentru reprezentarea grafic a seriilor statistice cronologice);

    legenda, care arat semnificaia simbolurilor folosite n grafic; sursa datelor; una sau mai multe note explicative, indicnd ipotezele de lucru avute n

    vedere la construirea graficului. Principalele tipuri de grafice statistice sunt:

    diagramele statistice; histograma; poligonul frecvenelor; ogiva; cartograma; cronograma; corelograma. Diagramele statistice Principalele tipuri de diagrame statistice sunt:

    diagramele prin benzi; diagramele prin coloane; diagramele de structur; diagramele polar; diagramele n batoane sau bare; diagramele prin suprafee. Diagramele prin benzi Diagramele prin benzi sunt grafice n care datele statistice, grupate prin metodele de grupare prezentate, sunt reprezentate prin ariile unor

  • dreptunghiuri construite cu bazele pe ordonata unui sistem rectangular de axe. Dreptunghiurile (benzile) astfel construite sunt desprite prin spaii egale. Benzile pot fi diferite ntre ele doar prin lungimile lor (limea este egal pentru toate benzile), acestea variind direct proporional cu mrimile valorilor reprezentate. Diagramele prin benzi se folosesc atunci cnd:

    ntre valorile reprezentate exist variaii foarte mari; datele sunt distribuite cronologic inegal. Pentru exemplificare am ales datele din tabelul 1.4, reprezentate grafic n figura 1.4.

    Tabelul 1.4. Numrul societilor nmatriculate n perioada 1991-1994

    Anul Numarul de societi nmatriculate 1991 95947 1992 137411 1993 117025 1994 75179 Total 425562

    Numrul de societi nmatriculate

    95947

    137411

    117025

    75179

    0 50000 100000 150000

    1991

    1992

    1993

    1994

    Figura 1.4 Diagrama prin benzi a societilor nmatriculate n

    perioada 1991-1994 Diagramele prin coloane Cu ajutorul diagramelor prin coloane, datele statistice sunt reprezintate tot prin dreptunghiuri, construite ns pe vertical, cu bazele pe abscis (coloane).

    34

  • Coloanele difer ntre ele doar prin nlime, aceasta fiind direct proporional cu mrimea valorilor reprezentate. Diagramele prin coloane se folosesc cel mai des pentru reprezentarea evoluiei n timp a fenomenelor studiate. n figura 1.5 sunt reprezentate grafic datele din tabelul 1.4, optndu-se de aceast dat pentru o diagram prin coloane.

    Num rul de societi nm atriculate

    95947

    137411117025

    75179

    0

    50000

    100000

    150000

    1991 1992 1993 1994

    Figura 1.5 Diagrama prin coloane a societilor nmatriculate n

    perioada 1991-1994 Diagramele de structur Diagramele de structur se folosesc pentru reprezentarea repartiiilor statistice pe principalele variante considerate. Cu alte cuvinte, sunt puse n eviden ponderile principalelor pri componente ale populaiei statistice analizate. Pentru reprezentarea grafic se folosesc diverse figuri geometrice: cercul, ptratul, dreptunghiul etc. Suprafaa total a figurii corespunde volumului ntregii populaii statistice, n timp ce suprafeele diferitelor poriuni ale figurii corespund prilor componente ale populaiei statistice studiate. n figura 1.6 este reprezentat repartiia pe ani (nu evoluia n timp!) a societilor nmatriculate n perioada 1991-1994, conform datelor din tabelul 1.4, diagrama aleas fiind una de tip "plcint".

    N u m ru l d e u n it i n m a tr ic u la te

    9 5 9 4 7

    1 3 7 4 1 11 1 7 0 2 5

    7 5 1 7 91 9 9 11 9 9 21 9 9 31 9 9 4

    Figura 1.6 Diagrama de tip plcint a societilor nmatriculate n

    perioada 1991-1994

    35

  • n figura 1.7 este redat, tot printr-o diagram de tip plcint, structura rspunsurilor la ntrebarea Cum apreciai c a fost nivelul de trai n 2006 fa de 2005? pe care compania de cercetare a pieei Daedalus Consulting a pus-o celor chestionai n cadrul unui studiu de analiz a percepiei persoanelor din mediul urban cu privire la nivelul de trai din anul 2006, fa de anul 20055.

    Figura 1.7 Structura rspunsurilor la ntrebarea Cum apreciai c a

    fost nivelul de trai n 2006 fa de 2005? conform unui studiu realizat de ctre compania de cercetare a pieei Daedalus Consulting Diagramele prin batoane sau bare Diagramele prin batoane sau bare se folosesc tot pentru reprezentarea structurii populaiei statistice. Ele pot fi confundate cu diagramele prin coloane. Se disting ns prin faptul c valorile variabilei statistice se reprezint prin batoane sau bare verticale care au nlimi care prin nsumare dau valoarea 1 (dac frecvenele relative iau forma coeficienilor) sau 100 (dac frecvenele relative se exprim prin procente). Diagrama polar Se mai numete i diagram radial i se folosete pentru ilustrarea sezonalitii caracteristice anumitor fenomene statistice studiate. Diagrama polar se construiete folosind o reea radial.

    5 Rezultatele studiului au fost preluate din ziarul Adevrul, nr. 5189, din 17 martie 2007, http://www.adevarulonline.ro/articole/oficial-traim-mai-bine/306308

    36

  • 37

    Histograma Histograma se folosete pentru reprezentarea repartiiilor variabilelor statistice definite pe intervale. Ea se construiete ntr-un sistem rectangular de axe astfel:

    pe abscis se reprezint prin segmente de dreapt mrimile intervalelor de grupare;

    pe ordonat se reprezint prin segmente de dreapt frecvenele repartiiei statistice;

    se construiesc dreptunghiuri care au ca baze segmentele de dreapt ce reprezint mrimile intervalelor de grupare i nlimi egale cu segmentele de pe ordonat corespunztoare frecvenelor statistice.

    Pentru exemplificare, s presupunem variabila "vechime n munc", pentru care au fost nregistrate, la nivelul unei firme, valorile din tabelul 1.5. Ca etap preliminar este necesar construirea repartiiei statistice a frecvenelor. Pentru aceasta parcurgem urmtorii pai: a) calculm amplitudinea variabilei statistice:

    A = XMAX XMIN = 35 1 = 34 ani b) stabilim lungimile intervalelor. Alegem mprirea pe intervale egale de lungime L = 5; c) calculm numrul de intervale:

    k = A : L = 34 : 5 = 6,8 7 intervale d) construim cele 7 intervale, considernd ca limit minim valoarea 0 i ca limit maxim valoarea 35. Se obine astfel repartiia frecvenelor absolute din tabelul 1.6. Histograma corespunztoare repartiiei din tabelul 1.6 este prezentat n figura 1.7. Poligonul frecvenelor Poligonul frecvenelor este linia poligonal care unete, n cadrul unui sistem rectangular de axe, punctele de coordonate corespunztoare valorilor nregistrate de ctre variabila statistic studiat. Se poate construi i pornind de la histogram prin unirea mijloacelor bazelor de sus ale dreptunghiurilor acesteia. Poligonul frecvenelor obinut pe baza repartiiei frecvenelor absolute din tabelul 1.6 este prezentat n figura 1.9.

  • Tabelul 1.5 Vechimea n munc nregistrat pentru cei 50 de angajai ai firmei ABC

    20 5 3 11 17 4 30 24 21 16 6 19 19 1 9 5 17 10 20 10

    15 7 2 18 27 23 16 32 35 10 25 29 18 18 11 1 23 19 2 3 2 19 3 9 1 3 8 9 3 22

    Tabelul 1.6 Repartiia variabilei "vechime n munc" pentru cei 50 de

    angajai ai firmei ABC Intervale de variaie (ani) Frecvene absolute

    [0-5] 14 (5-10] 9

    (10-15] 3 (15-20] 13 (20-25] 6 (25-30] 3 (30-35] 2

    Total 50

    14

    9

    3

    13

    63 2

    0

    5

    10

    15

    [0-5] (5-10] (10-15] (15-20] (20-25] (25-30] (30-35] Ani

    Frecvene absolute

    Figura 1.8 Histograma vechimii n munc pentru cei 50 de angajai ai

    firmei ABC

    38

  • Poligonul frecven elor14

    913

    6 2330

    5

    10

    15

    [0-5] (5-10] (10-15] (15-20] (20-25] (25-30] (30-35] Ani

    Frecvene absolute

    Figura 1.9 Poligonul frecvenelor pentru vechimea n munc

    nregistrat pentru cei 50 de angajai ai firmei ABC Ogiva Ogiva este linia poligonal care unete, n cadrul unui sistem rectangular de axe, punctele care au ca i coordonate variantele nregistrate de ctre variabila statistic i frecvenele statistice cumulate determinate pentru acestea. Acestea din urm se obin prin nsumarea treptat a frecvenelor absolute sau relative. Frecvenele absolute cumulate pentru repartiia din tabelul 1.6 sunt calculate n tabelul 1.7. Ogiva obinut pe baza acelorai valori este prezentat n figura 1.10.

    Tabelul 1.7 Frecvene absolute cumulate Intervale de Frecvene Frecvene absolute

    [0-5] 14 14 (5-10] 9 23

    (10-15] 3 26 (15-20] 13 39 (20-25] 6 45 (25-30] 3 48 (30-35] 2 50

    Total 50

    Figura 1.10 Ogiva

    39

  • Cartograma i cartodiagrama Cartogramele sunt grafice care se folosesc pentru evidenierea variaiilor care apar la nivelul diferitelor uniti statistice teritoriale. Ele se reprezint direct pe hri i se folosesc n cazul variabilelor statistice teritoriale. Combinaiile dintre diagrame i cartograme se numesc cartodiagrame. Cronograma Cronograma se folosete n cazul seriilor statistice cronologice. Ea este, de fapt, o diagram pentru care una dintre axe este axa timpului. Corelograma Corelograma se folosete pentru evidenierea legturilor statistice dintre fenomenele cercetate. Este o diagram pentru care pe cele dou axe sunt reprezentate cele dou variabile supuse cercetrii din punctul de vedere al legturii statistice dintre ele. Cel mai des se folosete metoda grafic a "norului de puncte". "Punctele" au ca i coordonate perechile de valori pe care le nregistreaz cele dou variabile studiate din punctul de vedere al corelaiei statistice. n figura 1.11 este reprezentat un astfel de nor de puncte pentru evidenierea legturii statistice dintre variabila "cheltuieli cu reclama" i variabila "vnzri", ale cror valori au fost nregistrate pentru un numr de 8 companii.

    0

    200

    400

    600

    800

    1000

    1200

    0 10 20 30 40 50 60 70

    Cheltuieli cu reclam a

    Vnzr

    i tot

    ale

    Figura 1.11 Corelograma legturii statistice dintre variabilele

    "cheltuieli cu reclama" i "vnzri" pentru 8 companii studiate

    40

  • EXPRIMAREA N MRIMI RELATIVE A INFORMAIILOR STATISTICE

    22..

    OBIECTIVELE CAPITOLULUI

    n acest capitol vor fi prezentate mrimile relative disponibile pentru descrierea comparativ a colectivitilor statistice, ajutndu-v:

    s reinei principalele tipuri de mrimi relative disponibile pentru descrierea statistic;

    s nelegei, prin apelul la exemple, utilitatea apelului la mrimile relative n cercetarea statistic;

    s nelegei cum se alege unitatea de msur statistic n funcie de mrimile relative la care se face apel.

  • 43

    n demersul statistic sunt necesare deseori comparaii prin care se evideniaz:

    relaii cantitative manifestate ntre diferite variabile statistice considerate;

    relaii cantitative manifestate ntre diferite pri ale colectivitilor statistice studiate;

    dinamica manifestat la nivelul colectivitilor statistice studiate; relaii cantitative ntre diferite fenomene supuse studiului. Prin compararea sub form de raport (cel mai des) sau diferen, a dou valori se exprim proporiile unora fa de celelalte (acestea din urm fiind stabilite, astfel, ca baze de raportare). Forma de exprimare a rezultatelor obinute n urma comparrii trebuie aleas n funcie de diferenele de proporie dintre valorile comparate. Astfel, atunci cnd valoarea de comparat este mai mare dect valoarea fixat ca baz de comparaie, rezultatele se vor exprima n uniti. Dac valoarea de comparat este mai mic dect valoarea fixat ca baz de comparaie, rezultatele se vor exprima, cel mai des, n coeficieni sau procente. Se alege exprimarea n procente dac se urmrete descrierea structurii sau a dinamicii fenomenului studiat. Procentele se obin prin nmulirea cu 100 a rezultatelor, obinndu-se astfel comparaii la 100 de uniti. Dac valoarea de comparat este de mii, de zeci de mii sau de sute de mii de ori mai mic dect valoarea fixat, exprimarea se va face n promile, prodecimile sau procentimile. Se obin astfel comparaii la 1.000, 10.000 sau 100.000 de uniti, valorile indicatorilor obinndu-se prin nmulirea rezultatelor cu 1.000, 10.000 sau 100.000. De exemplu, se exprim n promile eficiena folosirii activelor fixe msurat prin indicatorul care arat valoarea produciei ce revine la 1.000 lei active fixe. n prodecimi se va exprima proporia studenilor n ansamblul populaiei, msurat prin indicatorul care arat numrul studenilor ce revin la 10.000 de locuitori. n sfrit, este necesar exprimarea n procentimi a dezvoltrii comerciale n mediul rural, msurat prin indicatorul care arat numrul de magazine ce revin la 100.000 de locuitori din mediul rural. nainte de efectuarea calculelor pe care le presupune evidenierea, prin recursul la mrimile relative, a diferitelor relaii cantitative care intereseaz n demersul statistic, trebuie verificat ndeplinirea condiiei de comparabilitate a fenomenelor studiate. Condiia de comparabilitate se verific n timp, n spaiu, i/sau dup alte criterii specifice. Verificarea condiiei de comparabilitate a fenomenelor studiate constituie premisa alegerii corecte a bazei de comparaie.

  • 44

    Comparabilitatea este dat de o legtur logic ntre fenomenele studiate, legtur care poate fi de condiionare, de coresponden, de cauzalitate sau de alt natur. Nerespectarea condiiei de comparabilitate este cauzat cel mai des de: definiri diferite ale noiunilor din programul de observare statistic; modificri de structur ale populaiilor supuse observaiei; modificri n modul de culegere i prelucrare a datelor statistice; folosirea unor preuri diferite; folosirea unor surse de informaii diferite. Dac nu se pot nltura diferenele de coninut sau de form de exprimare ale valorilor de comparat, diferene care afecteaz comparabilitatea acestora, este necesar renunarea la folosirea mrimilor relative, menionndu-se doar, alturate, valorile nregistrate pentru fenomenele n cauz. Mrimile relative se pot grupa n:

    mrimi relative de structur; mrimi relative de coordonare (denumite i de coresponden); mrimi relative de dinamic (nregistrat, planificat i, respectiv,

    realizat); mrimi relative de intensitate. 2.1. Mrimile relative de structur Atunci cnd criteriile de analiz statistic impun mprirea colectivitii statistice n mai multe grupe, sunt utile informaiile privind structura acesteia. S exemplificm utilitatea unor asemenea informaii pornind de la urmtoarele date statistice privind acoperirea cu localitilor din Romnia cu reele de distribuie a gazului natural. Conform datelor furnizate de Autoritatea Naional de Reglementare n domeniul Gazelor Naturale (ANRGN), din cele 3.140 de localiti (municipii, orae, comune) nregistrate n Romnia, doar 1.822 aveau, la finele anului 2006, sisteme de distribuie a gazelor naturale puse n funciune, n timp ce 665 de localiti au fost conectate la reeaua de distribuie a gazelor naturale n perioada 2000-20061. Pe baza acestor date se pot obine urmtoarele date statistice derivate:

    1 Adevrul, nr. 5196, din 26 Martie 2007.

  • a) la sfritul anului 2006, circa 58% din localitile din Romnia erau alimentate cu gaze naturale:

    b) n perioada 2000-2006, au fost conectate la reeaua de distribuie a

    gazelor naturale circa 21% din localitile din Romnia:

    Aceste dou reazultate sunt exemple de mrimi relative de structur, adic de expresii numerice ale unor comparaii de tip parte-ntreg. Atunci cnd sunt vizate frecvenele de apariie, rezultatele comparaiilor de tip parte-ntreg constau n frecvenele relative nregistrate. Atunci cnd sunt vizate nivelurile nregistrate, rezultatele comparaiilor de tip parte-ntreg constau n ponderi nregistrate. n tabelul 2.1 sunt prezentate relaiile disponibile pentru determinarea mrimilor relative de structur la nivelul unei colectiviti statistice studiate dup o variabil statistic X. Tabelul 2.1 Relaii disponibile pentru determinarea mrimilor relative

    de structur Pentru comparaii

    de frecvene Pentru comparaii

    de volum la nivelul unei serii

    statistice

    Pentru comparaii de volum la nivelul

    unei repartiii statistice

    unde: Ri reprezint frecvena relativ de apariie a variantei i a variabilei X; Fi = frecvena absolut de apariie a variantei i a variabilei X Gi = ponderea nregistrat de varianta i a variabilei X; Xi = nivelul nregistrat de variabila X n varianta i.

    45

  • 2.2. Mrimile relative de coordonare (coresponden) Mrimile relative de coordonare, denumite i mrimi relative de coresponden, se folosesc atunci cnd se compar ntre ele dou grupe diferite ale colectivitii statistice studiate. Prin urmare, mrimile relative de coordonare sunt expresii numerice ale unor comparaii de tip parte-parte, dup o relaie de tipul:

    unde: A i B reprezint nivelurile sau frecvenele nregistrate pentru grupele comparate. 2.3. Mrimile relative de dinamic Mrimile relative de dinamic se folosesc pentru caracterizarea evoluiei nregistrate sau dorite n timp a fenomenului studiat. Mrimile relative de dinamic sunt expresii numerice ale comparaiilor pentru dou momente sau perioade de timp diferite. Ele se mai numesc i indici ai dinamicii. Tabelul 2.2 Relaii de calcul folosite pentru calculul mrimilor relative

    de dinamic

    Mrimi relative de dinamic nregistrat

    Mrimi relative de dinamic planificat

    Mrimi relative de dinamic realizat

    unde:

    V1 reprezint o valoare (nivel sau frecven) nregistrat la momentul sau pentru perioada curent;

    V0 = o valoare (nivel sau frecven) nregistrat la momentul sau pentru perioada care s-a ales ca baz de comparaie;

    VPL = o valoare (nivel sau frecven) planificat pentru un moment sau o perioad de timp din viitor.

    46

  • 47

    Comparaiile se pot realiza i fa de valori planificate, obinndu-se astfel statistici comparative de dinamic planificat. Prin comparaii ale valorilor realizate cu cele planificate se obin mrimi relative de dinamic realizat, care ofer informaii utile pentru aprecierea eficienei managementului diferitelor activiti social-economice. Relaiile care se pot folosi pentru calculul mrimilor relative de dinamic sunt prezentate n tabelul 2.2. 2.4. Mrimi relative de intensitate Mrimile relative de intensitate sunt expresii ale comparaiilor ntre valori nregistrate pentru fenomene de natur diferit, dar ntre care exist o anumit relaie de interdependen. Natura diferit a fenomenelor pentru care se realizeaz comparaii determin necesitatea exprimrii mrimilor relative de intensitate n uniti de msur complexe. De pild, pentru statistica de intensitate productivitatea orar a muncii la nivelul unei secii productive, n condiiile exprimrii cantitii de produse obinute n buci i a cantitii de munc n numr de ore, este necesar exprimarea rezultatului cu ajutorul unitii de msur complexe "buci/or".

  • 48

  • DESCRIEREA STATISTIC A TENDINEI CENTRALE: STATISTICILE MEDII 33..

    OBIECTIVELE CAPITOLULUI

    n acest capitol sunt prezentate statisticile medii disponibile pentru descrierea statistic a tendinei centrale, ajutndu-v:

    s nelegei coninutul informaional al celor 4 statistici medii importante: media aritmetic, media geometric, media ptratic i media armonic;

    s contientizai limitele statisticilor medii n ce privete reprezentativitatea lor pentru colectivitatea statistic studiat;

    s stpnii tehnicile de calcul utilizate pentru determinarea statisticilor medii.

  • 51

    Tendina central care se manifest n comportamentul unitilor unei colectiviti statistice se poate descrie cu ajutorul statisticilor medii i a statisticilor de poziie. Cele dou tipuri de statistici ofer informaii complementare. Statisticile medii Statisticile medii sunt valori reprezentative din punctul de vedere al diferitelor rezultate algebrice semnificative pentru demersul de descriere statistic: suma, produsul, suma ptratelor i suma inverselor. Celor 4 rezultate algebrice le corespund urmtoarele statistici medii:

    media aritmetic; media geometric; media ptratic; media armonic. 3.1. Media aritmetic Media aritmetic este valoarea reprezentativ din punctul de vedere al sumei valorilor nregistrate. Concret, aceasta nseamn c prin nlocuirea tuturor valorilor nregistrate cu media lor aritmetic, suma lor nu se modific. S considerm, de pild, o firm cu 5 angajai, ale cror salarii sunt, n ordine cresctoare, de 620, 675, 710, 735 i 760 RON. Aceste salarii determin un fond de salarii1 de 3.500 RON. ntruct din acest fond cei 5 angajai ar putea fi retribuii n mod egal cu cte 700 RON, nseamn c acest nivel de salarizare reprezint nivelul mediu al salariilor din cadrul firmei (nlocuirea tuturor salariilor iniiale cu salariul mediu nu ar modifica fondul de salarii al firmei). Calculul mediei aritmetice pentru un ir de valori Din definiia mediei aritmetice rezult uor relaiile de calcul ale acesteia, prin egalizarea sumei valorilor nregistrate cu suma care ar rezulta n urma nlocuirii tuturor cu valoarea mediei lor aritmetice. Considernd, astfel, o variabil X pentru care s-a nregistrat irul de valori X1, X2 XN, media aritmetic () se poate determina pornind de la egalitatea: Sum (X1, X2 XN) = Sum (, ) Folosind simbolurile matematice obinuite:

    1 Fondul de salarii este egal cu suma salariilor.

  • S calculm, de exemplu, vechimea medie n munc a celor 50 de angajai ai firmei ABC, pentru care valorile individuale ale vechimii n munc sunt redate n tabelul 1.5:

    Calculul mediei aritmetice pentru repartiii statistice dup variabile discrete n calculul mediei aritmetice pentru repartiii statistice discrete, se ine cont de frecvenele (absolute sau relative) nregistrate pentru fiecare dintre variantele discrete care definesc variabilele statistice:

    52

  • unde: Xi reprezint valoarea i nregistrat de variabila X; Xj = varianta discret j care definete variabila X; Fj = frecvena absolut de apariie a variantei discrete Xj; F = variabila frecvenelor absolute de apariie a variantelor discrete ale variabilei X; R = variabila frecvenelor relative de apariie a variantelor discrete ale variabilei X; k = numrul de variante discrete care definesc variabila statistic X. S presupunem, de exemplu, c n urma unei cercetri statistice asupra unui eantion de 20 familii, s-au centralizat datele din tabelul 3.1, privitoare la variabila discret numr de copii / familie:

    Tabelul 3.1

    Numr de copii (X) 0 1 2 3 4 Total

    Numr de familii (Frecvene absolute, F)

    4 6 8 1 1 20

    Frecvene relative,

    0,20 0,30 0,40 0,05 0,05 1

    Pentru a afla ci copii revin n medie familiilor din eantionul supus observaiei, trebuie mprit numrul total de copii la numrul total de familii care fac parte din eantion. Numrul total de copii al familiilor din eantionul ales se obine prin ponderarea variantelor (discrete) nregistrate de ctre variabila studiat (variabila numr de copii, notat cu X) cu frecvenele de apariie constatate (F).

    53

  • Prin urmare, media aritmetic se determin ca o medie aritmetic ponderat:

    Sunt de reinut dou observaii:

    relaia de calcul a mediei aritmetice ponderate se poate reduce la relaia de calcul a mediei aritmetice pentru un ir de valori;

    valoarea obinut are n primul rnd o semnificaie statistic, relevant mai ales n comparaiile cu mediile nregistrate la nivelul altor colectiviti statistice de interes.

    Calculul mediei aritmetice pentru repartiii statistice dup variabile continue Pentru repartiii statistice continue, media aritmetic se calculeaz cu ajutorul relaiei:

    unde: f(X) este funcia care definete variabila continu X; m = limita inferioar de variaie a variabilei X; M = limita superioar de variaie a variabilei X.

    54

  • Estimarea mediei aritmetice pentru repartiii statistice dup variabile continue definite pe intervale Pentru repartiii statistice continue definite pe intervale, media aritmetic se poate aproxima cu media aritmetic a mediilor convenionale ale intervalelor, ponderate cu frecvenele (abolute sau relative) nregistrate; mediile convenionale ale intervalelor sunt mediile capetelor acestora, adic centrele intervalelor:

    unde C este variabila centrelor intervalelor care definesc variabila statistic; F = frecvenele absolute nregistrate pe intervale; R = frecvenele relative nregistrate pe intervale. De exemplu, vechimea medie n munc a celor 50 de angajai ai firmei ABC, pentru care s-a obinut distribuia din tabelul 1.6, se determin pe baza tabelului 3.2.

    Tabelul 3.2

    Intervale de

    variaie (ani)

    Centre ale intervalelor de variaie

    (C)

    Frecvene absolute

    (F)

    Frecvene relative

    (R)

    Centre ponderate

    cu frecvenele

    absolute (CF)

    Centre ponderate

    cu frecvenele

    relative (CR)

    [0-5] 2,5 14 0,28 35,0 0,70

    (5-10] 7,5 9 0,18 67,5 1,35

    (10-15] 12,5 3 0,06 37,5 0,75

    (15-20] 17,5 13 0,26 227,5 4,55

    (20-25] 22,5 6 0,12 135,0 2,70

    (25-30] 27,5 3 0,06 82,5 1,65

    (30-35] 32,5 2 0,04 65,0 1,30

    Total 50 1,00 650,0 13,00 Pe baza datelor din tabelul 3.2, rezult:

    55

  • Se constat o diferen de 0,6 ani ntre estimarea mediei aritmetice cu media aritmetic ponderat (= 13 ani) i valoarea (real) a mediei aritmetice, calculat pentru cele 50 de valori cunoscute (= 13,6 ani a se vedea paragraful privind Calculul mediei aritmetice pentru un ir de valori). Concluzia care se poate formula este aceea c atunci cnd datele statistice sunt culese grupat, statisticile nu se pot calcula dect cu o anumit aproximaie. Proprieti ale mediei aritmetice Fiind o valoare numeric, media aritmetic se poate calcula doar pentru

    serii statistice cu valori numerice;

    Mrimea mediei aritmetice este unic, o serie neputnd fi caracterizat de dou sau mai multe medii aritmetice;

    Media aritmetic a unui ir de valori egale cu o constant (a) este egal cu acea constant:

    56

  • Media aritmetic a sumei/diferenei dintre dou variabile, este egal cu suma/diferena mediilor aritmetice ale celor dou variabile:

    unde X i Y sunt dou variabile statistice pentru care s-a nregistrat un acelai numr (N) de valori.

    O consecin a celor 2 proprieti anterioare const n faptul c adugarea sau scderea unei constante la toate valorile unui ir de observaii statistice determin creterea sau scderea mediei lor aritmetice cu aceeai constant:

    unde a este o constant; Multiplicarea (sau divizarea) cu o constant a tuturor valorilor

    nregistrate de o variabil statistic (X) determin multiplicarea sau divizarea cu aceeai constant a mediei sale aritmetice:

    Multiplicarea (sau divizarea) cu o constant a tuturor frecvenelor

    absolute (F) ale unei distribuii statistice nu produce modificri n ce privete mrimea mediei aritmetice ponderate2:

    unde b este o constant;

    2 n cazul repartiiilor statistice definite pe intervale, sunt considerate cemtrele intervalelor:

    57

  • Suma abaterilor dintre valorile individuale nregistrate i media lor aritmetic este nul. Aceast proprietate deriv din nsi definiia mediei aritmetice3:

    Media aritmetic este sensibil la aa-numitele valori aberante sau

    deplasate. Valorile aberante sunt valori nereprezentative pentru eantionul sau populaia care face obiectul cercetrii statistice. De exemplu, pentru irul de valori (1, 1, 2, 2, 2, 2, 3, 3, 3, 4, 4, 80) media aritmetic este egal cu 8,92. Dac s-ar elimina valoarea aberant sau nereprezentativ 80 (foarte deplasat de celelalte), media aritmetic a valorilor rmase ar fi egal cu 2,45, valoare cu mult mai reprezentativ pentru irul de valori considerat. Este astfel necesar verificarea atent a reprezentativitii statisticilor obinute n urma unei cercetri. Dac datele sunt colectate corespunztor i apar totui valori aberante, este indicat calculul mediilor pariale, adic pentru fiecare tip calitativ al variabilei statistice studiate.

    3.2. Media geometric Media geometric este valoarea reprezentativ din punctul de vedere al produsului valorilor nregistrate. Concret, aceasta nseamn c prin nlocuirea tuturor valorilor nregistrate cu media lor geometric, produsul lor nu se modific. Prin urmare, media geometric este util doar atunci cnd produsul valorilor nregistrate are semnificaie n cadrul cercetrii realizate. De exemplu, s presupunem c un plasament financiar a adus un profit de 10% n anul 2004, de 50% n anul 2005 i de 30% n anul 2006. Rata medie a profitului obinut n perioada 2004-2006 pe seama acestui plasament financiar nu se poate calcula ca o medie aritmetic, ci ca o medie geometric, ntruct valorile procentuale anuale ale ratelor de profit nregistrate (10%, 50% i 30%) sunt valori care arat multiplicarea de la un an la altul a investiiei financiare realizate. Astfel, suma de bani investit la nceput s-a multiplicat pn la sfritul anului 2004 de 1,10 ori, suma astfel obinut s-a multiplicat n 2005 de 1,50 ori, iar ceea ce a rezultat s-a mai multiplicat n 2006 de 1,30 ori. Dac notm cu s suma de 3 Definiia mediei aritmetice se regsete n relaia (a se vedea paragraful privind calculul mediei aritmetice pentru un ir de valori):

    58

  • bani investit la nceputul perioadei 2004-2006, cu S suma de bani de la sfritul acestei perioadei, adic de la sfritul anului 2006, i cu X variabila multiplicrilor anuale ale sumei investite, atunci exist urmtoarea relaie:

    Se observ c valoarea 1,2897 poate nlocui valorile individuale ale multiplicrilor anuale, ea fiind media geometric a acestora. Media geometric este util n descrierea statistic a dinamicii unui fenomen studiat prin intermediul indicilor de dinamic. Mai precis, este vorba despre relaia dintre indicii cu baz fix i cei cu baz n lan. S considerm, de exemplu, dinamica salariului mediu net pe economie n primele 9 luni ale anului 2006, redat n tabelul 3.3.

    Tabelul 3.3

    Luna Salariu

    mediu net (RON)

    Indici cu baz fix (prin raportare la

    luna ianuarie)

    Indici cu baz n lan (prin raportare la luna precedent)

    ianuarie 826 1,0000000 -februarie 767 0,9285714 0,9285714

    martie 828 1,0024213 1,0795306aprilie 839 1,0157385 1,0132850

    mai 833 1,0084746 0,9928486iunie 835 1,0108959 1,0024010iulie 842 1,0193705 1,0083832

    august 841 1,0181598 0,9988124septembrie 860 1,0411622 1,0225922

    Produs 1,0411622

    59

  • Dup cum se observ n tabelul 3.3, produsul indicilor cu baz n lan este egal cu ultimul indice cu baz fix. Aceasta nseamn c dac toi indicii cu baz n lan ar fi egali cu media lor geometric, indicele de dinamic nregistrat pentru ntreaga perioad a celor 9 luni nu s-ar modifica (a se vedea tabelul 3.4). Calculul mediei geometrice pentru un ir de valori Din definiia mediei geometrice rezult uor relaiile de calcul ale acesteia, prin egalizarea produsului valorilor nregistrate cu produsul care ar rezulta n urma nlocuirii tuturor cu valoarea mediei lor geometrice. Considernd, astfel, o variabil X pentru care s-a nregistrat irul de valori X1, X2 XN, media geometric (g) se poate determina pornind de la egalitatea: Produs (X1, X2 XN) = Produs (g, g g) Folosind simbolurile matematice obinuite:

    n tabelul 3.4 este calculat indicele mediu de dinamic a salariului mediu net pentru primele 9 luni ale anului 2006.

    Tabelul 3.4

    Luna Salariu mediu net (RON) Indici cu

    baz n lan Salariu net n ipoteza unei dinamici constante (RON)

    ianuarie 826 826,00februarie 767 0,9285714 826,00 1,0050549 = 830,18

    martie 828 1,0795306 830,18 1,0050549 = 834,37aprilie 839 1,0132850 834,37 1,0050549 = 838,59

    mai 833 0,9928486 838,59 1,0050549 = 842,83iunie 835 1,0024010 842,83 1,0050549 = 847,09iulie 842 1,0083832 847,09 1,0050549 = 851,37

    august 841 0,9988124 851,37 1,0050549 = 855,67septembrie 860 1,0225922 855,67 1,0050549 = 860,00

    Produs = 1,0411622Medie geometric = 1,0050549

    60

  • 61

    Cu ajutorul indicelui mediu de tfel calculat, se pot determina

    alculul mediei geometrice pentru repartiii statistice dup variabile

    ul mediei geometrice pentru repartiii statistice discrete, se ine

    dinamic asnivelurile pe care le-ar fi nregistrat salariului net n cele 9 luni, n ipoteza unei dinamici constante (a se vedea ultima coloan a tabelului 3.4). Cdiscrete n calculcont de frecvenele (absolute sau relative) nregistrate pentru fiecare dintre variantele care definesc variabilele statistice:

    i reprezint valoarea i nregistrat de variabila X; XXj = varianta discret j care definete variabila X;

  • 62

    te Xj; telor discrete ale

    frecvenelor relative de apariie a variantelor discrete ale

    e variante discrete care definesc variabila statistic X. amica

    Tabelul 3.5

    Anul 2000 2001 2002 2003 2004

    Fj = frecvena absolut de apariie a variantei discreF = variabila frecvenelor absolute de apariie a varianvariabilei X; R = variabilavariabilei X; k = numrul dS presupunem, de exemplu, o firm al crei profit a nregistrat dinprezentat n tabelul 3.5.

    2005

    Profit realizat (mil. RON) 5 6 12 24 60 150

    Indici de dinamic cu baz n lan

    - 1,2 2 2 2,5 2,5

    tabelul 3.6 este prezentat repartiia celor 5 indici cu baz n lan ai

    Tabelul 3.6

    Indici de dinamic cu baz n lan 1,2 2 2

    ndinamicii nregistrate de profitul firmei.

    ,5 Total

    Frecvene absolute (F) 1 2 2 5

    Frecvene relative (R) 0 0 0,,2 ,4 4 1

    e baza acestei repartiii, putem calcula indicele mediu de dinamic a P

    profitului ca o medie geometric ponderat a indicilor de dinamic cu baz n lan:

  • Estimarea mediei geometrice pentru repartiiile statistice dup variabile continue definite pe intervale

    iile statistice dup variabile continue definite pe intervale, edia geometric se poate aproxima cu media geometric a centrelor

    Pentru repartimintervalelor, ponderate cu frecvenele (absolute sau relative) nregistrate:

    unde C este variabila centrelor intervalelor care definesc variabila statistic, F sunt frecvenele absolute nregistrate pe intervale, iar R sunt frecvenele relative nregistrate pe intervale.

    etric se poate calcula doar pentru variabile numerice;

    te unic, un ir de valori neputnd fi ulte medii geometrice;

    dus (multiplicativ);

    Proprieti ale mediei geometrice Fiind o valoare numeric, media geom

    Mrimea mediei geometric escaracterizat de dou sau mai m

    Calculul mediei geometrice are sens numai atunci cnd ntre termenii seriei exist o relaie de pro

    Dac cel puin o valoare a seriei este nul sau negativ, calculul mediei geometrice este lipsit de sens;

    Media geometric este mai mic sau egal cu media aritmetic a acelorai valori:

    Aceast proprietate este exemplificat pentru datele din tabelul 3.2, reluate n tabelul 3.7.

    63

  • Tabelul 3.7

    64

    Intervale de variaie (ani) C F R C

    R

    [0-5] 0,28 1,2925 2,5 14

    (5-10] 7,5 9 0,18 1,4372

    (1 10-15] 2,5 3 0,06 1,1636

    ( 1 13 15-20] 7,5 0,26 2,1047

    (20-25] 22,5 6 0,12 1,4530

    (25-30] 27,5 3 0,06 1,2200

    (30-35] 32,5 2 0,04 1,1494

    Total 50 1,00

    Produs 9,2691

    Media geometric este mai mic dect m metiedia arit c:

    Media geometric a unei variabile X este egal cu valoarea exponenial

    a mediei aritmetice a variabilei X logaritmate:

    Aceast proprietate este util pentru calculul simplificat al mediei geometrice4. Pentru exemplificare, n tabelul 3.8 sunt reluate datele din tabelul 3.2.

    4 n cazul repartiiilor statistice se va recurge, desigur, la ponderarea cu frecvenele absolute (F) sau relative (R):

  • Tabelul 3.8.

    Intervale de variaie (ani) C F R lnC (lnC)R

    [0-5] 2,5 14 0,28 0,9163 0,2566

    (5-10] 7,5 9 0,18 2,0149 0,3627

    (10-15] 12,5 3 0,06 2,5257 0,1515

    (15-20] 17,5 13 0,26 2,8622 0,7442

    (20-25] 22,5 6 0,12 3,1135 0,3736

    (25-30] 27,5 3 0,06 3,3142 0,1989

    (30-35] 32,5 2 0,04 3,4812 0,1392

    Total 50 1,00 2,2267 Media geometric este:

    Produsul raporturilor dintre valorile individuale nregistrate i media lor

    geometric este egal cu 1. Aceast proprietate deriv din definiia mediei geometrice:

    Pentru repartiiile statistice dup variabile continue definite pe intervale, relaia se va aplica asupra centrelor intervalelor (C):

    65

  • Media geometric a produsului/raportului dintre dou variabile, este

    egal cu produsul/raportul mediilor geometrice ale celor dou variabile5:

    Aceast proprietate este exemplificat pentru dou variabile (X i Y) n tabelul 3.9.

    Tabelul 3.9

    X Y XY X / Y 23 11,2 257,6 2,05 34 12,3 418,2 2,76 21 13,4 281,4 1,57 27 12,6 340,2 2,14 36 11,8 424,8 3,05

    produs 15962184 274460,9 4380995404483,25 58,16

    27,58 12,24 337,53 2,25

    produs/raport medii geometrice 337,53 2,25

    O consecin a proprietii anterioare const n faptul c multiplicarea sau divizarea cu o constant a tuturor valorilor unui ir de observaii statistice determin multiplicarea sau divizarea cu aceeai constant a mediei lor geometrice6;

    5 Pentru ca proprietatea s fie aplicabil, se impune condiia ca cele 2 variabile s fie definite de acelai

    numr de variante observate. 6 Proprietatea rezult prin nlocuirea, n relaiile proprietii anterioare, a variabilei Y cu o constant.

    66

  • Multiplicarea (sau divizarea) cu o constant a tuturor frecvenelor absolute (F) ale unei distribuii statistice nu produce modificri n ce privete mrimea mediei geometrice ponderate7:

    unde b este o constant;

    Media geometric este afectat mai tare de valorile mai mici nregistrate. n consecin, media geometric se calculeaz deseori pentru punerea n eviden a valorilor mai mici nregistrate;

    Media geometric se aplic i atunci cnd fenomenul studiat are o evoluie aproximativ exponenial. Cel mai des, media geometric se utilizeaz pentru determinarea indicilor i ritmurilor medii ale dinamicii;

    Ca i media aritmetic, media geometric este sensibil la valorile aberante nregistrate.

    3.3. Media ptratic Media ptratic este valoarea reprezentativ din punctul de vedere al sumei ptratelor valorilor nregistrate. Concret, aceasta nseamn c prin nlocuirea tuturor valorilor nregistrate cu media lor ptratic, suma ptratelor acestora nu se modific. Utilitatea cea mai important a mediei ptratice este n legtur cu determinarea varianei sau dispersiei statistice (a se vedea capitolul 6 Descrierea statistic a variaiei). Calculul mediei ptratice pentru un ir de valori Din definiia mediei ptratice rezult relaiile de calcul ale acesteia, prin egalizarea sumei ptratelor valorilor nregistrate cu suma ptratelor care ar rezulta n urma nlocuirii tuturor cu valoarea mediei lor ptratice. Considernd, astfel, o variabil X pentru care s-a nregistrat setul de valori

    7 n cazul repartiiilor statistice definite pe intervale, sunt considerate cemtrele intervalelor:

    67

  • X1, X2 XN, media ptratic (p) se poate determina pornind de la egalitatea:

    Sum de ptrate (X1, X2 XN) = Sum de ptrate (p, p p) Folosind simbolurile matematice obinuite:

    Calculul mediei ptratice pentru repartiii statistice dup variabile discrete Pentru o repartiie statistic discret, media ptratic se calculeaz ca o medie ptratic a variantelor discrete ponderate fie cu frecvenele absolute, fie cu frecvenele relative:

    68

  • unde: Xi reprezint valoarea i nregistrat de variabila X; Xj = varianta discret j care definete variabila X; Fj = frecvena absolut de apariie a variantei discrete Xj; F = variabila frecvenelor absolute de apariie a variantelor discrete ale variabilei X; R = variabila frecvenelor relative de apariie a variantelor discrete ale variabilei X; k = numrul de variante discrete care definesc variabila statistic X. Calculul mediei ptratice pentru repartiii statistice dup variabile continue Pentru distribuiile statistice continue, media ptratic se calculeaz cu ajutorul relaiei:

    unde: f(X) este funcia care definete variabila continu X; m = limita inferioar de variaie a variabilei X; M = limita superioar de variaie a variabilei X. Estimarea mediei ptratice pentru repartiii statistice dup variabile continue definite pe intervale Pentru repartiiile statistice continue dup variabile definite pe intervale, media ptratic se poate aproxima cu media ptratic a centrelor intervalelor, ponderate cu frecvenele (absolute sau relative) nregistrate:

    69

  • unde C este variabila centrelor intervalelor care definesc variabila statistic, F sunt frecvenele absolute nregistrate pe intervale, iar R sunt frecvenele relative nregistrate pe intervale. Proprieti ale mediei ptratice Fiind o valoare numeric, media ptratic se poate calcula doar pentru

    variabile numerice;

    Pentru un set de valori, media ptratic este unic; Ptratul mediei ptratice pentru un set de valori este egal cu media

    aritmetic a ptratelor acestor valori:

    Aceast proprietate rezult direct din definiia mediei ptratice;

    Media ptratic este mai mare sau egal cu media aritmetic a acelorai valori:

    Aceast proprietate este exemplificat pentru datele din tabelul 3.2, reluate n tabelul 3.10. Pentru repartiia statistic din acest tabel, se poate constata c media ptratic este mai mare dect media aritmetic:

    70

  • Tabelul 3.10

    Intervale de variaie (ani) C C

    2 F R C2F C2R

    [0-5] 2,5 6,25 14 0,28 87,50 1,750

    (5-10] 7,5 56,25 9 0,18 506,25 10,125

    (10-15] 12,5 156,25 3 0,06 468,75 9,375

    (15-20] 17,5 306,25 13 0,26 3981,25 79,625

    (20-25] 22,5 506,25 6 0,12 3037,50 60,750

    (25-30] 27,5 756,25 3 0,06 2268,75 45,375

    (30-35] 32,5 1056,3 2 0,04 2112,50 42,250

    Total 50 1,00 12462,50 249,250

    Multiplicarea sau mprirea cu o constant a tuturor valorilor nregistrate pentru o variabil statistic determin multiplicarea sau divizarea cu aceeai constant a mediei ptratice a acesteia:

    unde a este o constant;

    Multiplicarea (sau divizarea) cu o constant a tuturor frecvenelor absolute care caracterizeaz o repartiie statistic dup o variabil X, nu produce modificri n ce privete mrimea mediei ptratice (ponderate)8 a variabilei X:

    8 n cazul repartiiilor statistice dup variabile continue definite pe intervale, sunt considerate cemtrele intervalelor:

    71

  • unde b este o constant;

    Pentru orice variabil X, ptratul mediei ptratice este egal cu suma dintre ptratul mediei aritmetice a variabilei X i ptratul mediei ptratice a abaterilor nregistrate fa de media aritmetic a variabilei X9:

    9 Ptratul mediei ptratice a abaterilor nregistrate fa de media aritmetic se numete dispersie sau varian statistic (a se vedea capitolul 6, Descrierea statistic a variaiei).

    72

  • unde (X) reprezint media ptratic a variabilei abaterilor (D) nregistrate fa de media aritmetic10. Aceast proprietate poate fi considerat ca argument pentru cea de-a 4-a proprietate (p ).

    Media ptratic este influenat ntr-o msur foarte mare de valorile individuale mai mari. Din acest motiv, ea se calculeaz deseori atunci cnd se dorete punerea n eviden a valorilor individuale mai mari;

    Ca i celelalte medii, media ptratic este sensibil la valorile aberante nregistrate.

    3.4. Media armonic Media armonic este valoarea reprezentativ din punctul de vedere al sumei inverselor valorilor nregistrate. Concret, aceasta nseamn c prin nlocuirea tuturor valorilor nregistrate cu media lor armonic, suma inverselor acestora nu se modific. Media armonic se folosete n cazul unor colecii de valori pariale sau de mrimi relative de structur. n economie, este utilizat, de exemplu, n 10 D = X (X)

    73

  • calculul indicelui mediu armonic al preurilor. Calculul mediei armonice pentru un ir de valori Din definiia mediei armonice rezult relaiile de calcul ale acesteia, prin egalizarea sumei inverselor valorilor nregistrate cu suma inverselor care ar rezulta n urma nlocuirii tuturor cu valoarea mediei lor armonice. Considernd, astfel, o variabil X pentru care s-a nregistrat setul de valori X1, X2 XN, media armonic (h) se poate determina pornind de la egalitatea:

    Sum de inverse (X1, X2 XN) = Sum de inverse (h, h h) Folosind simbolurile matematice obinuite:

    S presupunem, de exemplu, c o persoan parcurge distana de 10 km. astfel:

    5 km cu viteza de 40 km./h.; 3 km cu viteza de 20 km./h.; 2 km cu viteza de 4 km./h. Viteza medie cu care persoana parcurge ntreaga distan de 10 km. trebuie calculat ca o medie armonic (ponderat):

    Dac toat distana ar fi fost parcurs cu aceast vitez medie, durata de timp necesar pentru aceasta ar fi fost egal cu:

    74

  • Aceast durat de timp este echivalent cu durata de timp necesar pentru parcurgerea distanei cu cele 3 viteze diferite, aa cum se poate observa n tabelul 3.11.

    Tabelul 3.11

    Distan (km.) Vitez (km./h.) Durat de timp necesar (h.)

    5 40 5/40 = 0,1253 20 3/20 = 0,1502 4 2/4 = 0,500

    Total 0,775

    Calculul mediei armonice pentru repartiii statistice dup variabile discrete Pentru o repartiie statistic dup o variabil discret, media armonic, la fel ca toate celelalte medii statistice, se calculeaz ca medie armonic a variantelor ponderate fie cu frecvenele absolute, fie cu frecvenele relative:

    75

  • unde: Xi reprezint valoarea i nregistrat de variabila X; Xj = varianta discret j care definete variabila X; Fj = frecvena absolut de apariie a variantei discrete Xj; F = variabila frecvenelor absolute de apariie a variantelor discrete ale variabilei X; R = variabila frecvenelor relative de apariie a variantelor discrete ale variabilei X; k = numrul de variante discrete care definesc variabila statistic X. Calculul mediei armonice pentru repartiii statistice dup variabile continue Pentru repartiii statistice dup variabile continue, media armonic se calculeaz cu ajutorul relaiei:

    unde: f(X) este funcia care definete variabila continu X; m = limita inferioar de variaie a variabilei X; M = limita superioar de variaie a variabilei X. Estimarea mediei armonice pentru repartiii statistice dup variabile continue definite pe intervale Pentru repartiii statistice dup variabile continue definite pe intervale, media armonic se poate aproxima cu media armonic a centrelor intervalelor, ponderate cu frecvenele (absolute sau relative) nregistrate:

    76

  • unde C este variabila centrelor intervalelor care definesc variabila statistic, F sunt frecvenele absolute nregistrate pe intervale, iar R sunt frecvenele relative nregistrate pe intervale. Proprieti ale mediei armonice Fiind o valoare numeric, media armonic se poate calcula doar pentru

    variabile numerice;

    Mrimea mediei armonice este unic, un ir de valori neputnd fi caracterizat de dou sau mai multe medii armonice;

    Pentru aceleai valori, media armonic este cea mai mic dintre cele 4 medii statistice calculate:

    Aceast proprietate este exemplificat pentru datele din tabelul 3.2, reluate n tabelul 3.11.

    Tabelul 3.11

    Intervale de variaie (ani) C 1/C F R (1/C)F (1/C)R

    [0-5] 2,5 0,4000 14 0,28 5,6000 0,1120

    (5-10] 7,5 0,1333 9 0,18 1,2000 0,0240

    (10-15] 12,5 0,0800 3 0,06 0,2400 0,0048

    (15-20] 17,5 0,0571 13 0,26 0,7429 0,0149

    (20-25] 22,5 0,0444 6 0,12 0,2667 0,0053

    (25-30] 27,5 0,0364 3 0,06 0,1091 0,0022