curs statisticĂ unitatea de învăţare nr. 7 de distr.forma seriilor.pdf · analiza variaţiei...

23
CURS STATISTICĂ - Unitatea de învăţare nr. 7 ANALIZA STATISTICĂ A DISTRIBUŢIILOR DE FRECVENŢE. INDICATORII VARIAŢIEI ŞI ASIMETRIEI Cuprins: 1.Obiectivele Unităţii de învăţare. 2.Clasificarea indicatorilor variatiei. 2.1. Indicatorii simpli ai variaţiei. 2.2. Indicatorii sintetici ai variaţiei. 3.Indicatorii asimetriei. 4. Răspunsuri şi comentarii la testele de autoevaluare. 5. Teme de control. 6. Rezumatul Unităţii de învăţare. 7. Bibliografia Unităţii de învăţare. 1. Obiectivele unităţii de învăţare În analiza unei serii statistice ne interesează, pe lângă analiza tendinţei centrale şi analiza variaţiei sau a variabilităţii, precum şi analiza formei distribuţiei. Fenomenele şi procesele economico-sociale sunt complexe, aflându-se sub influenţa unui număr mare de factori esenţiali şi întâmplători, ceea ce face ca media, cel mai utilizat indicator al tendinţei centrale, să nu fie suficientă pentru analiza acestor fenomene. Exemplul 1 Fie următoarele seturi de date: 2 4 6 8 10 12 14 1 1 Me x 5 6 7 8 9 10 11

Upload: truongngoc

Post on 08-Sep-2018

324 views

Category:

Documents


15 download

TRANSCRIPT

Page 1: CURS STATISTICĂ Unitatea de învăţare nr. 7 de distr.forma seriilor.pdf · analiza variaţiei sau a variabilităţii, precum şi analiza formei distribuţiei. Fenomenele şi procesele

CURS STATISTICĂ - Unitatea de învăţare nr. 7

ANALIZA STATISTICĂ A DISTRIBUŢIILOR DE FRECVENŢE.

INDICATORII VARIAŢIEI ŞI ASIMETRIEI

Cuprins:

1.Obiectivele Unităţii de învăţare.

2.Clasificarea indicatorilor variatiei.

2.1. Indicatorii simpli ai variaţiei.

2.2. Indicatorii sintetici ai variaţiei.

3.Indicatorii asimetriei.

4. Răspunsuri şi comentarii la testele de autoevaluare.

5. Teme de control.

6. Rezumatul Unităţii de învăţare.

7. Bibliografia Unităţii de învăţare.

1. Obiectivele unităţii de învăţare

În analiza unei serii statistice ne interesează, pe lângă analiza tendinţei centrale şi

analiza variaţiei sau a variabilităţii, precum şi analiza formei distribuţiei.

Fenomenele şi procesele economico-sociale sunt complexe, aflându-se sub influenţa

unui număr mare de factori esenţiali şi întâmplători, ceea ce face ca media, cel mai utilizat

indicator al tendinţei centrale, să nu fie suficientă pentru analiza acestor fenomene.

☺ Exemplul 1

Fie următoarele seturi de date:

2 4 6 8 10 12 14

11 Mex

5 6 7 8 9 10 11

Page 2: CURS STATISTICĂ Unitatea de învăţare nr. 7 de distr.forma seriilor.pdf · analiza variaţiei sau a variabilităţii, precum şi analiza formei distribuţiei. Fenomenele şi procesele

22 Mex

Se observă că deşi cele două serii au aceeaşi medie şi mediană 2121 MeMexx ,

ele diferă prin modul de împrăştiere a valorilor. De aceea, pe lângă indicatorii tendinţei

centrale se impune şi calculul indicatorilor de variaţie.

In urma parcurgerii acestui capitol, studenţii vor putea :

studia reprezentativitatea mediei pentru o serie de date;

aprecia gradul de omogenitate a seriei;

caracteriza gradului de variaţie a unei serii;

compara în timp şi spaţiu variaţia mai multor serii de repartiţie pentru aceeaşi

caracteristică sau pentru caracteristici diferite care au fost înregistrate pentru aceeaşi

colectivitate;

cunoaşte forma distribuţiei (repartiţiei) de frecvenţe prin comparaţie cu distribuţia

normală

2. Clasificarea indicatorilor variaţiei

Indicatorii variaţiei pentru o serie statistică se clasifică în:

indicatori simpli ai variaţiei – sunt acei indicatori care arată împrăştierea valorilor

una faţă de alta sau împrăştierea valorilor faţă de o anumită valoare;

indicatori sintetici ai variaţiei – care iau în considerare toţi termenii seriei în calculul

lor, sintetizând într-o singură valoare întreaga împrăştiere din serie.

2.1. Indicatorii simpli ai variaţiei

Indicatorii simpli ai variaţiei se exprimă atât în mărimi absolute (având aceleaşi unităţi

de măsură ca şi caracteristica studiată), cât şi în mărimi relative (obţinute prin raportarea

mărimii absolute la medie).

Indicatorii simpli ai variaţiei sunt:

amplitudinea absolută a variaţiei;

amplitudinea relativă a variaţiei;

abaterile individuale absolute;

Page 3: CURS STATISTICĂ Unitatea de învăţare nr. 7 de distr.forma seriilor.pdf · analiza variaţiei sau a variabilităţii, precum şi analiza formei distribuţiei. Fenomenele şi procesele

abaterile individuale relative.

Amplitudinea absolută a variaţiei (Ax) se determină ca diferenţă între valoarea

maximă (xmax) şi valoarea minimă (xmin) a caracteristicii şi arată câmpul maxim de împrăştiere

a valorilor caracteristicii.

Ax = xmax - xmin

Are unitatea de măsură a valorilor caracteristicii şi din acest motiv nu poate fi folosită la

compararea seriilor după caracteristici exprimate în unităţi de măsură diferite.

Se utilizează în etapa de grupare a datelor, mai precis la construirea intervalelor de

variaţie şi se mai utilizează şi la construirea graficelor.

Amplitudinea este foarte sensibilă la valorile extreme. Cu cât acestea sunt mai

îndepărtate cu atât câmpul de împrăştiere a valorilor este mai mare.

Amplitudinea relativă a variaţiei (Ax(%)) se obţine prin raportarea amplitudinii

absolute la medie. Se exprimă în coeficient sau procente, deci pot fi comparate serii după

caracteristici exprimate în unităţi de măsură diferite:

100x

AA x

(%)x

Abaterile individuale absolute care ne arată împrăştierea fiecărei valori de la valoarea

medie:

xxd ii

În practică se utilizează mai mult abaterea absolută maximă şi abaterea absolută

minimă:

0xxd maxmax

0xxd minmin

Abaterile individuale absolute se exprimă prin aceeaşi unitate de măsură ca şi

caracteristica studiată şi pot lua valori negative sau pozitive după cum valoarea individuală

este mai mică sau mai mare ca media.

Dacă di în valoare absolută au valori mari putem concluziona că datele sunt împrăştiate,

adică există o variaţie mare în interiorul seriei.

Suma valorilor abaterilor individuale absolute este nulă:

0xxdn

1ii

n

1ii

Suma abaterilor maxime şi minime luate în modul este egală cu amplitudinea absolută a

variaţiei:

Page 4: CURS STATISTICĂ Unitatea de învăţare nr. 7 de distr.forma seriilor.pdf · analiza variaţiei sau a variabilităţii, precum şi analiza formei distribuţiei. Fenomenele şi procesele

xminmax Add

Dacă în cazul unei serii, abaterea maximă absolută diferă mult de valoarea abaterii

minime absolute luată în modul, atunci pentru seria respectivă trebuie calculaţi pe lângă

indicatorii variaţiei şi indicatorii de asimetrie.

Într-o serie simetrică:

maxmin dd

Abaterile individuale relative se exprimă în coeficienţi sau procente şi se calculează

raportând abaterile individuale absolute la medie:

100x

dd

100x

dd

100x

dd

minmin(%)

maxmax(%)

i(%)i

Toţi aceşti indicatori simpli prezintă dezavantajul că nu sintetizează, într-o singură

valoare, împrăştierea tuturor termenilor din seria analizată.

Pentru a elimina acest dezavantaj calculăm indicatorii sintetici ai variaţiei.

2.2. Indicatorii sintetici ai variaţiei

Indicatorii sintetici ai variaţiei sunt:

abaterea medie liniară d ;

dispersia (varianţa);

abaterea medie pătratică (abatere medie standard sau tip);

coeficientul de variaţie.

Abaterea medie liniară d se calculează ca o medie aritmetică simplă (în cazul seriilor

simple) sau ponderată (în cazul seriilor de distribuţie de frecvenţe) a abaterilor termenilor

seriei de la media lor în valoare absolută.

- pentru o serie simplă:

n

xx

d

n

1ii

- pentru o serie de distribuţie de frecvenţe absolute:

Page 5: CURS STATISTICĂ Unitatea de învăţare nr. 7 de distr.forma seriilor.pdf · analiza variaţiei sau a variabilităţii, precum şi analiza formei distribuţiei. Fenomenele şi procesele

k

1ii

k

1iii

n

nxx

d

În cazul în care seria de distribuţie de frecvenţe este pe intervale, atunci xi este centrul

intervalului.

- pentru o serie de distribuţie de frecvenţe relative:

100

nxx

d

k

1i

*ii

- dacă *in sunt exprimate în procente

k

1i

*ii nxxd - dacă *

in sunt exprimate în coeficienţi

În locul mediei, pot fi folosiţi şi alţi indicatori ai tendinţei centrale.

Dezavantaje ale abaterii medii liniare:

se exprimă în aceeaşi unitate de măsură ca şi caracteristica analizată, deci nu poate fi

utilizată la compararea a două sau mai multe serii după caracteristici exprimate în

unităţi de măsură diferite;

nu ţine seama de semnul algebric;

nu ţine seama de faptul că abaterile mai mari în valoare absolută influenţează în mai

mare măsură gradul de variaţie al unei caracteristici comparativ cu abaterile mici.

Pentru a înlătura aceste dezavantaje se calculează şi alţi indicatori sintetici ai variaţiei.

☺ Exemplul 2

Repartiţia salariaţilor unei întreprinderi după prima obţinută la sfârşitul anului este prezentată

în tabelul următor:

Prima (lei) Nr. salariaţi

ni

Centrul

xi xini xx i ii nxx

sub 100

100 – 200

200 – 300

300 – 400

peste 400

15

20

30

25

10

50

150

250

350

450

750

3.000

7.500

8.750

7.500

+195

+95

5

105

205

2.925

1.900

150

2.625

2.050

Total 100 - 24.500 - 9.650

Page 6: CURS STATISTICĂ Unitatea de învăţare nr. 7 de distr.forma seriilor.pdf · analiza variaţiei sau a variabilităţii, precum şi analiza formei distribuţiei. Fenomenele şi procesele

salariatlei

n

nx

x

i

i

i

ii

/245100

500.245

1

5

1

salariatlei

n

nxx

x

i

i

i

ii

/5,96100

650.95

1

5

1

Prima unui salariat se abate în medie de la prima medie cu 96,5 lei.

Dispersia se calculează ca medie aritmetică simplă (în cazul seriilor simple) sau

ponderată (în cazul seriilor de distribuţie de frecvenţă) a pătratelor abaterilor termenilor seriei

de la tendinţa centrală (cel mai adesea media aritmetică).

- pentru o serie simplă:

n

xxn

1i

2i

2

- pentru o serie de frecvenţe absolute:

k

1ii

k

1ii

2i

2

n

nxx

- pentru o serie de frecvenţe relative:

100

nxxk

1i

*i

2i

2

sau

k

1i

*i

2i

2 nxx

Dacă datele provin din eşantioane de volum redus şi le folosim pentru extinderea rezultatelor

la nivelul colectivităţii generale (le folosim pentru o inferenţă statistică), atunci în calculul

dispersiei la numitor se va folosi (n-1) şi nu “n” fiind astfel dispersia eşantionului un

estimator mai bun al dispersiei în colectivitatea generală:

1n

xx

s

n

1i

2i

2

Page 7: CURS STATISTICĂ Unitatea de învăţare nr. 7 de distr.forma seriilor.pdf · analiza variaţiei sau a variabilităţii, precum şi analiza formei distribuţiei. Fenomenele şi procesele

Dispersia prezintă dezavantajul că este un indicator abstract care nu are o unitate

concretă de măsură. Ea arată modul în care gravitează termenii seriei în jurul tendinţei

centrale (de obicei media). Dacă dispersia unei serii este egală cu 0, atunci acea serie nu

prezintă variaţie, toţi termenii ei fiind egali. Cu cât valoarea dispersiei creşte faţă de zero, cu

atât împrăştierea termenilor seriei creşte şi ea.

Este un indicator deosebit de util în studiile statistice, fiind utilizată în calculul

asimetriei, excesului, boltirii unei serii, precum şi în calculul altor indicatori statistici.

Dispersia caracteristicii alternative:

Varianta xi Frecvenţa

ni Frecvenţe relative

DA

NU

1

0

m

n – m

n

m

w1n

mn

Total - n 1

w1www1w1w

)w1(www1n

mnw

n

mw1

n

)mn(w0mw1

n

nxx

2222

22

2

1ii

2

1ii

2i

2w

Dispersia caracteristicii alternative este egală cu produsul dintre cele două frecvenţe

relative.

☺ Exemplul 3

Prima (lei) Nr. salariaţi (ni)

sub 300

300

65

35

Total 100

Să se calculeze dispersia caracteristicii alternative “salariaţi cu prima sub 300 RON”.

65,0100

65

n

mw

2275,035,065,0)w1(w2w

Dispersia caracteristicii alternative prezintă următoarele particularităţi:

dispersia caracteristicii alternative poate lua valori doar în intervalul:

Page 8: CURS STATISTICĂ Unitatea de învăţare nr. 7 de distr.forma seriilor.pdf · analiza variaţiei sau a variabilităţii, precum şi analiza formei distribuţiei. Fenomenele şi procesele

25,0,02w

când w = 1 – w, adică w = 0,5, dispersia atinge valoarea maximă 25,02w ;

dacă w 1 – w, adică w 0,5 şi w creşte uniform în cadrul intervalului (0, 0,5)

atunci 2w înregistrează o creştere mai rapidă la început şi mai lentă când se apropie

de limita superioară;

dacă w 1 – w, adică w 0,5 şi w creşte uniform în cadrul intervalului (0,5, 1)

atunci 2w înregistrează o scădere în acelaşi ritm în care a avut loc creşterea.

Abaterea medie pătratică (abatere standard, abatere tip sau ecart tip) se calculează

ca o medie pătratică a abaterilor termenilor seriei de la media lor sau ca radical din dispersie.

Abaterea medie pătratică ne arată cu cât în medie se abat termenii unei serii de la

tendinţa centrală (de obicei media):

- pentru o serie simplă:

n

xxn

1i

2i

2

- pentru o serie de frecvenţe absolute:

k

1ii

k

1ii

2i

2

n

nxx

- pentru o serie de frecvenţe relative:

100

nxxk

1i

*i

2i

2

☺ Exemplul 4

Fie 2 serii:

S1: 1 2 3 4 5 6

S2: 101 102 103 104 105 106

Cele două serii au aceeaşi amplitudine, aceeaşi abatere medie liniară şi aceeaşi abatere medie

pătratică. Cu toate acestea, împrăştierea din seria A este mai mare decât cea din seria B.

Page 9: CURS STATISTICĂ Unitatea de învăţare nr. 7 de distr.forma seriilor.pdf · analiza variaţiei sau a variabilităţii, precum şi analiza formei distribuţiei. Fenomenele şi procesele

Este foarte dificil să comparăm serii de date după caracteristici exprimate prin aceeaşi

unitate de măsură deoarece variabilitatea depinde de ordinul de mărime.

Abaterea medie pătratică are aceeaşi semnificaţie ca şi abaterea medie liniară, dar ea

obţinându-se prin ridicarea la pătrat a abaterilor individuale de la tendinţa centrală (medie)

înlătură dezavantajul acordării aceleiaşi importanţe atât abaterilor mari cât şi celor mici.

Abaterea medie pătratică are aceeaşi unitate de măsură cu a caracteristicii studiate, de

aici provenind dezavantajul că nu pot fi comparate colectivităţi după caracteristici exprimate

prin unităţi de măsură diferite.

Deoarece pxx rezultă că d .

În cazul unei serii de distribuţie de frecvenţe simetrică sau uşor asimetrică, adică pentru

o serie cu tendinţă de normalitate între abaterea medie liniară şi abaterea medie pătratică

există relaţia:

8,0d

☺ Exemplu 5

Se utilizează datele din Exemplul 2.

salariat/RON31,120144752

salariat/RON5,96d

8,031,120

5,96dseria este simetrică adică are o repartiţie normală.

Abaterea medie pătratică este un indicator care ne oferă informaţii privind modul de

împrăştiere a termenilor unei serii cu tendinţă de normalitate. Astfel, o regulă empirică spune:

- 68,37% din termenii unei serii se situează în intervalul x,x ;

- 98,45% din termenii unei serii se situează în intervalul 2x,2x ;

- 99,73% din termenii unei serii se situează în intervalul 3x,3x ;

- 99,94% din termeni se găsesc în intervalul 4x,4x

Abaterea medie pătratică este un indicator deosebit de util la estimarea erorilor de

selecţie, la calcule de corelaţie precum şi la orice comparaţie statistică în timp şi spaţiu.

Coeficientul de variaţie este cel mai utilizat şi mai semnificativ indicator pentru

analiza variaţiei. Se calculează ca raport între abaterea medie pătratică sau liniară şi medie.

Page 10: CURS STATISTICĂ Unitatea de învăţare nr. 7 de distr.forma seriilor.pdf · analiza variaţiei sau a variabilităţii, precum şi analiza formei distribuţiei. Fenomenele şi procesele

100x

v

sau 100x

d'v

v v’

Coeficientul de variaţie se exprimă procentual, deci putem aprecia că el reprezintă

exprimarea relativă a lui sau a lui d .

Dacă v = 0 seria este perfect omogenă, toţi termenii seriei sunt egali între ei şi sunt egali

cu media: în acest caz nu există variaţie.

Dacă v 5%, seria este foarte omogenă, variaţia este foarte mică, media este foarte

reprezentativă, iar gruparea a fost foarte bine executată (în cazul seriilor de distribuţie de

frecvenţe).

Dacă v 35%, seria este omogenă.

Dacă v 70-75%, seria este eterogenă, variaţia este foarte mare, media nu este

reprezentativă, iar gruparea trebuie refăcută.

Testul de autoevaluare 1

1.Un auditor bancar a selectat 10 conturi şi a înregistrat sumele existente în fiecare dintre

aceste conturi. Sumele sunt date în Euro:

150 175 195 200 235 240 250 256 275 294

Se cere:

a) să se calculeze suma medie de bani existentă într-un cont

b) să se caracterizeze gradul de omogenitatea al seriei.

Deşi cel mai adesea coeficientul de variaţie se calculează utilizând media (deoarece

respectă cele mai multe din condiţiile impuse de Yule), acest indicator se poate calcula

utilizând şi alţi indicatori ai tendinţei centrale (mediana, mediala, modul).

Acest indicator nu se poate utiliza (adică este lipsit de semnificaţie) în cazul în care

media aritmetică este apropiată de zero sau când valorile termenilor seriei sunt foarte

apropiate.

☺ Exemplul 6

Se utilizează datele din Exemplul 2 şi Exemplul 5.

%35%1,49100245

31,120100

xv

seria nu este omogenă

%3,39100245

5,96100

x

d'v

Page 11: CURS STATISTICĂ Unitatea de învăţare nr. 7 de distr.forma seriilor.pdf · analiza variaţiei sau a variabilităţii, precum şi analiza formei distribuţiei. Fenomenele şi procesele

3. Indicatorii de asimetrie

Asimetria unei serii de distribuţie empirice poate fi determinată atât prin metoda grafică

cât şi prin calculul indicatorilor de asimetrie.

Reprezentarea grafică cea mai utilizată pentru aprecierea asimetriei este poligonul

frecvenţelor, dar graficul ne oferă doar o imagine sugestivă asupra gradului de asimetrie, fără

a putea să-l măsoare printr-o valoare exactă.

x

Pentru distribuţii moderat asimetrice, între x , Me, Mo există următoarea

relaţie: xMe3xMo

Tipuri de repartiţii cu asimetrie pronunţată:

Repartiţii în formă de J se întâlnesc în cazul în care frecvenţele sunt maxime la un capăt

sau altul al intervalului de variaţie.

ni

xi MoMex

ni

xi x Mo Me

ni

xi

Mo Me

Serie perfect simetrică

(Clopotul lui Gauss)

Serie asimetrică cu

asimetrie de stânga sau

pozitivă, predomină

valorile mici

MoMex

Serie asimetrică cu

asimetrie de dreapta sau

negativă, predomină

valorile mari

MoMex

ni

xi 0

ni

xi 0

x

Page 12: CURS STATISTICĂ Unitatea de învăţare nr. 7 de distr.forma seriilor.pdf · analiza variaţiei sau a variabilităţii, precum şi analiza formei distribuţiei. Fenomenele şi procesele

Repartiţie în formă de U se întâlneşte atunci când frecvenţele maxime apar la capetele

intervalului de variaţie, iar frecvenţele minime în centrul intervalului.

Repartiţie complexă obţinută prin suprapunerea a trei repartiţii: una în formă de J şi

două moderat asimetrice. Acest tip de repartiţii apare frecvent când gruparea nu a fost

executată corect.

Indicatorii asimetriei sunt:

- asimetrie absolută:

MoxAs sau Mex3As

Aceşti indicatori au unitatea de măsură a caracteristicii analizate, deci prezintă

dezavantajul că nu pot fi comparate din punct de vedere al asimetriei serii după caracteristici

exprimate prin unităţi de măsură diferite.

Aceşti indicatori pot fi pozitivi (în cazul asimetriei de stânga) sau negativi (în cazul

asimetriei de dreapta).

Datorită faptului că o distribuţie se caracterizează şi prin variabilitate, pentru aceeaşi

asimetrie absolută, o serie care are variabilitatea mai mică va fi mai pronunţat oblică, iar

pentru una cu variabilitatea mai mare, oblicitatea se va atenua.

- asimetrie relativă:

De aceea se calculează coeficientul de asimetrie propus de Pearson (statistician

englez 1857-1936):

ni

xi 0

ni

xi 0

Page 13: CURS STATISTICĂ Unitatea de învăţare nr. 7 de distr.forma seriilor.pdf · analiza variaţiei sau a variabilităţii, precum şi analiza formei distribuţiei. Fenomenele şi procesele

1,1Mox

Cas

Dacă Cas = 0 seria este perfect simetrică:

MoMex

Dacă Cas 0 seria prezintă asimetrie pozitivă sau de stânga:

MoMex (predomină valorile mici)

Dacă Cas 0 seria prezintă asimetrie negativă sau de dreapta:

MoMex (predomină valorile mari)

Cu cât Cas este mai apropiată de 1 seria este mai asimetrică.

Dacă Cas [-0,3; 0,3] seria este uşor sau moderat asimetrică.

Acest coeficient este recomandat numai pentru serii de repartiţie uşor asimetrice.

Dacă se cunoaşte mediana seriei, coeficientul de asimetrie se poate calcula cu relaţia:

3,3

Mex3Cas

Acest indicator este recomandat numai pentru serii de repartiţie uşor asimetrice când

între cei trei indicatori ai tendinţei centrale există relaţia:

xMe3xMo

Cu cât Cas este mai apropiat de 0 cu atât seria este mai simetrică, iar cu cât se apropie

de extremităţile intervalului, asimetria devine mai pronunţată.

Aceşti doi indicatori ai asimetriei sunt cei mai utilizaţi în practică, dar în afară de aceştia

se mai utilizează şi alţi indicatori.

☺ Exemplul 7

Se utilizează datele din Exemplul 2.

0RON55,2166,266245MoxAs asimetrie negativă sau de dreapta

66,266510

10100200hxMo

21

10

300,200Mo

018,031,120

66,21MoxCas

Page 14: CURS STATISTICĂ Unitatea de învăţare nr. 7 de distr.forma seriilor.pdf · analiza variaţiei sau a variabilităţii, precum şi analiza formei distribuţiei. Fenomenele şi procesele

3,0,3,0Cas seria este uşor asimetrică, cu asimetrie negativă sau de dreapta, deci

predomină salariaţii cu prime mari. MoMex

☺ Exersaţi în … Excel

Un profesor doreşte să vadă care au fost rezultatele medii obţinute de studenţii săi la examen. De

asemenea, ar vrea să observe care a fost variaţia notelor. Calculaţi mărimile necesare. Notele obţinute

de studenţi la examen au fost următoarele:

8,1 9,2 3,0 7,9 9,0 6,9 9,6 3,9 9,4 8,8 6,5 7,3 8,4 8,3 9,5 3,8 9,7

9,4 9,3 7,3 7,8 8,6 5,7 9,8 9,3 8,3 9,9 4,2 9,9 5,1 8,4 9,0 8,8 5,9

9,5 7,0 8,1 9,1 7,5 8,2 8,3 6,5 3,4 8,9 4,3 8,5 7,5 6,4 6,4 9,3 8,6

8,4 4,8 8,1 9,6 9,1 9,6 8,3 4,1 10,0 2,5 4,8 7,1 8,9 6,1 7,7 7,6 1,8

5,3 6,9 6,6 9,4 8,0 5,5 8,4 6,6 3,4 9,8 7,2 1,1 3,8 8,5 7,7 9,6 5,0

7,2 8,3 8,7 7,4 9,4 9,0 8,4 9,5 9,0 7,3 9,9 8,5 7,1 3,7 1,6

Rezolvare folosind EXCEL:

1. Se introduc datele. În A1 tastaţi „Nota“.

2. Apăsaţi Tools/Data Analysis şi Descriptive Statistics.

3. Introduceţi Input Range (A1:A101) conţinând şi numele variabilei. Selectaţi Labels in First

Row. 4. Apăsaţi Summary Statistics şi OK.

Se obţin rezultatele: Note

Mean

7.398

Standard Error 0.215022

Median 8.1

Mode 8.4

Standard Deviation 2.150216

Sample Variance 4.62343

Kurtosis 0.393661

Skewness -1.0731

Range 8.9

Minimum 1.1

Maximum 10

Sum 739.8

Count 100

Media notelor obţinute la examen este 7,398 (Mean) cu mediana 8,1 (Median). Modulul este

8,4 (Mode). Acesta este posibil să nu fie singurul, deoarece EXCEL nu afişează decât o singură

valoare.

Cea mai mică notă obţinută a fost 1,1 (Minimum) iar cea mai mare Maximum = 10.

Amplitudinea (diferenţa între valoarea minimă şi cea maximă) este 8,9 (Range).

Variaţia măsurată prin dispersie este 4,62 (Sample Variance) iar abaterea medie pătratică este

2,15 (Standard deviation). Eroarea standard (acest indicator va fi explicat la capitolul de sondaj

statistic) este 0,215 (Standard Error).

Deoarece Skewness este negativ şi mult diferit de zero (-1,07) seria de date este puternic

Page 15: CURS STATISTICĂ Unitatea de învăţare nr. 7 de distr.forma seriilor.pdf · analiza variaţiei sau a variabilităţii, precum şi analiza formei distribuţiei. Fenomenele şi procesele

asimetrică negativ, curba fiind alungită spre stânga.

Kurtosis este 0,39, pozitiv, ceea ce înseamnă că avem o curbă ascuţită (distribuţie

leptocurtică).

Testul de autoevaluare 2

Pentru 200 de agenţi economici se cunosc datele:

Grupe de agenţi economici după mărimea

profilului (mil. lei)

Structura agenţilor economici

(%)

sub 6

6-12

12-18

18-24

24-30

30 şi peste

10

22

25

23

17

3

Total 100

Se cere:

a) să se aprecieze dacă media e reprezentativă;

b) caracterizaţi asimetria distribuţiei;

c) să se calculeze media şi dispersia caracteristicii „profitul ≥18 mil lei”.

Testul de autoevaluare 3

1.Distribuţia salariaţilor unui magazin în funcţie de numărul de zile de concediu de odihnă

dintr-un an se prezintă astfel:

Zile concediu 14 15 16 17 18 19 20

Nr. salariaţi 2 6 10 15 8 5 4

Se cere:

a) să se calculeze indicatorii sintetici ai variaţiei;

b) să se caracterizeze gradul de asimetrie;

c) să se calculeze media şi dispersia caracteristicii “salariaţi care au avut un număr de zile de

concediu mai mare sau egal cu 17”.

2.Un studiu efectuat asupra unui număr de 50 de cutii de brânză topită la cutie dintr-un

magazin a reliefat următoarele informaţii cu privire la numărul de calorii conţinute:

Calorii 75-85 85-95 95-105 105-115 115-125

Nr. cutii cu

brânză topită 5 10 15 14 6

Se cere:

a) să se aprecieze omogenitatea seriei;

b) să se caracterizeze gradul de asimetrie;

Page 16: CURS STATISTICĂ Unitatea de învăţare nr. 7 de distr.forma seriilor.pdf · analiza variaţiei sau a variabilităţii, precum şi analiza formei distribuţiei. Fenomenele şi procesele

c) să se calculeze media şi dispersia caracteristicii “cutii de brânză care au sub 95 de

calorii”

4. Răspunsuri şi comentarii la testele de autoevaluare

Testul de autoevaluare 1

Notăm cu xi = suma existentă în contul i

10,1i

a) Media se calculează ca o medie aritmetică simplă întrucât avem date negrupate:

Euro22710

2270

10

294275256250240235200195175150

10

x

x

10

1ii

b) Gradul de omogenitate al seriei se apreciază prin coeficienţii de variaţie (v, v’).

%12,20100227

68,45100

xv

%56,16100227

6,37100

x

d'v

68,45889,20862

889,2086

10

10

1

2

2

i

i xx

Deoarece v, v’ 35%, apreciem că seria este omogenă, variaţia este mică, media este

reprezentativă.

Testul de autoevaluare 2

1. a) Pentru a aprecia dacă media este reprezentativă, vom utiliza coeficientul de variaţie.

Pentru a calcula coeficientul de variaţie trebuie mai întâi să calculăm media şi abaterea medie

pătratică.

6

1

6

1

i

i

i

ii

n

nx

x

Putem lucra cu relaţia de mai sus dacă calculăm din *

in (din ipoteza, din tabel) şi

200 in (din enunţ) pe in .

Page 17: CURS STATISTICĂ Unitatea de învăţare nr. 7 de distr.forma seriilor.pdf · analiza variaţiei sau a variabilităţii, precum şi analiza formei distribuţiei. Fenomenele şi procesele

100*

i

ii

n

nn , rezultă:

20200100

101 n agenţi economici;

44200100

222 n

50200100

253 n

46200100

234 n

34200100

175 n

6200100

36 n

ix reprezintă centrele de interval

sau putem calcula media utilizând relaţia:

44,16100

333172723212515229103

100

6

1

*

i

iinx

x mil. lei

Profitul mediu al unui agent economic este egal cu 16,44 mil lei.

Centrele de interval ix se determină ca o medie aritmetică simplă a capetelor fiecărui

interval. Rezultatele sunt prezentate în tabelul următor

Mărimea profitului (mil lei) Frecvenţe relative ni*(%) Centre de interval ix

0-6 10 3

6-12 22 9

12-18 25 15

18-24 23 21

24- 17 27

30-36 3 33

Total 100 -

Indicatorul cu ajutorul căruia se apreciază dacă media e reprezentativă este coeficientul de

variaţie.

%17,4810044,16

92,7100

xv

leimil.92,74726,622

Page 18: CURS STATISTICĂ Unitatea de învăţare nr. 7 de distr.forma seriilor.pdf · analiza variaţiei sau a variabilităţii, precum şi analiza formei distribuţiei. Fenomenele şi procesele

7264.62

100

3)44,1633(17)44,1627(23)44,1621(25)44,1615(

100

22)44,169(10)44,163(

1002222

22

6

1

*2

2

i

ii nxx

Interpretarea coeficientului de variaţie 35%<v≤75% media e slab reprezentativă.

b) Asimetria se caracterizează cu ajutorul indicatorilor de asimetrie propuşi de Pearson.

- asimetria absolută: as x Mo =16,44-15,6=0,84 mil. lei

- coeficientul de asimetrie:

106,092,7

84,0

asCas

Cas >0 deci avem serie uşor asimetrică cu asimetrie pozitivă sau de stânga, deci predomină

agenţii economici cu valori mici ale profitului.

c) media şi dispersia caracteristicii „profitul≥18 mil lei”

Avem o caracteristică alternativă sau binară:

- profitul ≥18 mil lei

- profitul <18 mil lei

Varianta xi Frecvenţele relative (*

in)

DA (profitul ≥18 mil lei)

NU (profitul <18 mil lei)

1

0

m = 43

n – m = 57

Total - n = 100

Media caracteristicii alternative:

43,0100

43

n

mw

43% dintre agenţii economici au profitul ≥18 mil.lei.

Dispersia caracteristicii alternative:

2451,0)43,01(43,0)1(2 www

Testul de autoevaluare 3

1. a) Pentru a calcula indicatorii sintetici ai variaţiei, va trebui să calculăm mai întâi

media – care se calculează ca o medie aritmetică ponderată:

Page 19: CURS STATISTICĂ Unitatea de învăţare nr. 7 de distr.forma seriilor.pdf · analiza variaţiei sau a variabilităţii, precum şi analiza formei distribuţiei. Fenomenele şi procesele

concediu zile 04,1750

852

50

42051981815171016615214

n

nx

x7

1ii

7

1iii

Indicatorii sintetici ai variaţiei sunt:

- abaterea medie liniară:

zile1728,150

64,58

50

404,1720504,1719804,17181504,1717

50

1004,1716604,1715204,1714

n

nxx

d7

1ii

7

1iii

Numărul de zile de concediu al unui salariat se abate în medie de la numărul mediu de

zile de concediu cu 1,1728 zile.

- dispersia:

3184,2

50

92,115

50

404,1720504,1719

50

804,17181504,17171004,1716

50

604,1715204,1714

n

nxx

22

222

22

7

1ii

7

1ii

2i

2

- abaterea medie pătratică:

zile5226,13184,22

Numărul de zile de concediu al unui salariat se abate în medie de la numărul mediu de

zile de concediu cu 1,5226 zile.

- coeficientul de variaţie:

%93,810004,17

5226,1100

xv

%88,610004,17

1728,1100

x

d'v

Deoarece v, v’ 35% seria este omogenă, variaţia este mică, media este

reprezentativă.

Page 20: CURS STATISTICĂ Unitatea de învăţare nr. 7 de distr.forma seriilor.pdf · analiza variaţiei sau a variabilităţii, precum şi analiza formei distribuţiei. Fenomenele şi procesele

b) Aprecierea asimetriei:

026,05226,1

1704,17MoxCas

Deoarece Cas 0 avem asimetrie pozitivă sau de stânga, adică mediana şi modul se

găsesc în stânga mediei pe grafic, deci în această serie predomină valorile mici ale

caracteristicii.

Cas [-0,3; 0,3] seria este uşor asimetrică (Cas este foarte apropiat de zero).

c) Avem o caracteristică alternativă:

- salariaţi care au avut un concediu 17 zile;

- salariaţi care au avut un concediu 17 zile.

Varianta xi Frecvenţele absolute

ni

DA (peste 17 zile)

NU (sub 17 zile)

1

0

m = 32

n – m = 18

Total - n = 50

Media caracteristicii alternative:

64,050

32

n

mw

64% dintre salariaţi au avut un concediu 17 zile

Dispersia caracteristicii alternative:

2304,0)64,01(64,0)w1(w2w

2. Se observă că avem o serie de repartiţie de frecvenţă pe intervale egale.

Notăm cu: xi = numărul de calorii

ni = numărul de cutii de brânză topită

Media – se calculează ca o medie aritmetică ponderată

xi reprezintă centrul de interval calculat ca medie aritmetică simplă între limita

inferioară şi limita superioară a fiecărui interval:

calorii 2,10150

5060

50

612014110151001090580

n

nx

x5

1ii

5

1iii

Omogenitatea seriei se apreciază cu ajutorul coeficientului de variaţie:

%46,111002,101

6,11100

xv

calorii6,1156,1342

Page 21: CURS STATISTICĂ Unitatea de învăţare nr. 7 de distr.forma seriilor.pdf · analiza variaţiei sau a variabilităţii, precum şi analiza formei distribuţiei. Fenomenele şi procesele

56,134

50

6728

n

nxx

5

1ii

5

1ii

2i

2

Deoarece v 35% seria este omogenă, variaţia este mică, media este reprezentativă.

b) Gradul de asimetrie:

18,06,11

33,1032,101MoxCas

Deoarece Cas 0 seria prezintă o asimetrie negativă sau de dreapta, deci pe grafic

mediana şi modul se găsesc în dreapta mediei, ceea ce înseamnă că predomină cutiile de

brânză cu multe calorii.

Cas [-0,3; 0,3] seria este uşor asimetrică.

c) Avem o caracteristică alternativă:

- cutii care au sub 95 calorii;

- cutii care au peste 95 calorii.

Varianta xi Frecvenţele absolute

ni

DA (sub 95 calorii)

NU (peste 95 calorii)

1

0

m = 15

n – m = 35

Total - n = 50

Media caracteristicii alternative:

3,050

15

n

mw

30% dintre cutii au sub 95 calorii.

Dispersia caracteristicii alternative:

21,0)3,01(3,0)w1(w2w

5. Teme de control

1. Presupunând că la fiecare termen al unei serii se adaugă aceeaşi constantă “a”:

a) cum se va modifica amplitudinea absolută?

b) cum se va modifica media?

c) cum se va modifica dispersia, dar abaterea medie pătratică?

d) cum se va modifica abaterea medie liniară?

2. Presupunem că fiecare termen al unei serii se multiplică cu aceeaşi constantă “k”:

Page 22: CURS STATISTICĂ Unitatea de învăţare nr. 7 de distr.forma seriilor.pdf · analiza variaţiei sau a variabilităţii, precum şi analiza formei distribuţiei. Fenomenele şi procesele

a) cum se va modifica amplitudinea absolută?

b) cum se va modifica media?

c) cum se va modifica dispersia şi abaterea medie pătratică?

d) cum se va modifica abaterea medie liniară?

3. Preţurile de vânzare pentru un calculator ştiinţific cu aceleaşi caracteristici, fabricat de

aceeaşi firmă, au fost înregistrate în 20 de magazine. Rezultatele sunt redate mai jos şi sunt

exprimate în lei:

10,50 12,75 11,00 16,50 19,30 20,00 16,50 13,90 17,50 18,00

13,50 17,75 18,50 20,00 15,00 14,45 17,85 15,00 17,50 13,50

Se cere:

a) să se caracterizeze gradul de asimetrie al seriei;

b) să se caracterizeze gradul de variaţie al seriei;

4.Despre angajaţii unei sucursale a unei bănci comerciale se cunosc datele:

Grupe de salariaţi după vechime (ani) Nr. salariaţi

0 – 4

4 – 8

8 – 12

12 – 16

16 - 20

2

6

10

8

4

Total 30

Se cere:

a) să se verifice dacă distribuţia salariaţilor după vechime este omogenă;

b) să se caracterizeze gradul de asimetrie;

c) să se calculeze media şi dispersia caracteristicii “salariaţi cu vechimea sub vechimea

medie”.

5.Un studiu privind durata de viaţă în ore a unui produs electrocasnic efectuat pe 100 aparate

a condus la următoarele rezultate:

Durata de viaţă (ore) Structura numărului de aparate electrocasnice

0 – 1000

1000 – 2000

2000 – 3000

3000 – 4000

4000 – 5000

5000 - 6000

8

20

26

22

18

6

Total 100

Se cere:

a) să se aprecieze dacă media este reprezentativă;

Page 23: CURS STATISTICĂ Unitatea de învăţare nr. 7 de distr.forma seriilor.pdf · analiza variaţiei sau a variabilităţii, precum şi analiza formei distribuţiei. Fenomenele şi procesele

b) să se caracterizeze gradul de asimetrie;

c) să se determine media şi dispersia caracteristicii “aparate care au durata de viaţă mai

mică de 3000 ore”.

6. În tabelul următor este prezentată repartiţia gospodăriilor dintr-o localitate în funcţie de

numărul de copii:

Nr. copii 0 1 2 3 4 5 6 7 8

Nr. gospodării 286 380 416 258 112 62 47 12 7

Se cere:să se calculeze numărul mediu de copii pe gospodărie şi să se verifice dacă

media este reprezentativă;

6. Rezumatul Unităţii de învăţare

Fenomenele şi procesele economico-sociale sunt complexe, aflându-se sub influenţa unui număr mare

de factori esenţiali şi întâmplători, ceea ce face ca media, cel mai utilizat indicator al tendinţei

centrale, să nu fie suficientă pentru analiza acestor fenomene. De aceea, pe lângă indicatorii tendinţei

centrale se impune şi calculul indicatorilor de variaţie.

Indicatorii variaţiei pentru o serie statistică se clasifică în:

indicatori simpli ai variaţiei – sunt acei indicatori care arată împrăştierea valorilor una

faţă de alta sau împrăştierea valorilor faţă de o anumită valoare;

indicatori sintetici ai variaţiei – care iau în considerare toţi termenii seriei în calculul lor,

sintetizând într-o singură valoare întreaga împrăştiere din serie.

Cu ajutorul indicatorilor variaţiei putem:

studia reprezentativitatea mediei pentru o serie de date;

aprecia gradul de omogenitate a seriei;

caracteriza gradului de variaţie a unei serii;

compara în timp şi spaţiu a mai multor serii de repartiţie pentru aceeaşi caracteristică sau

pentru caracteristici diferite care au fost înregistrate pentru aceeaşi colectivitate;

cunoaşte gradul de influenţă a factorilor după care s-a efectuat gruparea;

cunoaşte forma distribuţiei (repartiţiei) de frecvenţe prin comparaţie cu distribuţia normală

7. Bibliografia Unităţii de învăţare

1.Chauvat G., Reau J.P., Statistiques descriptives, Armand Colin, Paris, 2004

2. Danciu A.,Niculescu I., Gruiescu M., Statistică economică, Editura Enciclopedică,

Bucureşti, 2009

3. Isaic-Maniu Al., Mitrut C., Voineagu V., Statistică, Editura Universitară, Bucureşti, 2003;

4. Voineagu V., Ţiţan E., Ghiţă S., Boboc C., Todose D. – Statistică. Baze teoretice şi

aplicaţii, Editura Economică, Bucureşti, 2007;

5.Wonnacott T.H., Wonnacott R.J., Statistique, Economica, Paris,1995