indicatori ai formei distribuţieiileana.brudiu.ro/mvr/an i mvr/curs (2020-2021)/12...funcția din...

29
Indicatori ai formei distribuţiei 1. Asimetria 2. Boltirea Atunci când valorile unei serii sunt distribuite nesimetric în jurul mediei, acest fapt este imposibil de surprins cu ajutorul indicatorilor de dispersie. S-au introdus indicatori care să pună în evidenţă şi acest aspect al seriilor de valori: excentricitatea, sau asimetria și boltirea.

Upload: others

Post on 12-Aug-2021

32 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Indicatori ai formei distribuţieiileana.brudiu.ro/MVR/An I MVR/CURS (2020-2021)/12...Funcția din Excel ce calculează asimetria este SKEW() Puteți utiliza următoarele două reguli

Indicatori ai formei distribuţiei

1. Asimetria

2. Boltirea

Atunci când valorile unei serii sunt distribuite nesimetric în jurul

mediei, acest fapt este imposibil de surprins cu ajutorul

indicatorilor de dispersie.

S-au introdus indicatori care să pună în evidenţă şi acest

aspect al seriilor de valori: excentricitatea, sau asimetria și

boltirea.

Page 2: Indicatori ai formei distribuţieiileana.brudiu.ro/MVR/An I MVR/CURS (2020-2021)/12...Funcția din Excel ce calculează asimetria este SKEW() Puteți utiliza următoarele două reguli

Excentricitate. Asimetria

(Engl. Skew, Skweness).

Page 3: Indicatori ai formei distribuţieiileana.brudiu.ro/MVR/An I MVR/CURS (2020-2021)/12...Funcția din Excel ce calculează asimetria este SKEW() Puteți utiliza următoarele două reguli

Asimetria (excetricitatea)ASIMETRIA reprezintă deplasarea pe orizontală a vîrfului curbei

experimentale faţă de curba normală.

Skewness - indicator folosit în analiza distribuției unei serii

de date pentru a indica deviația distribuției empirice în

raport cu o distribuție simetrică in jurul mediei.

Page 4: Indicatori ai formei distribuţieiileana.brudiu.ro/MVR/An I MVR/CURS (2020-2021)/12...Funcția din Excel ce calculează asimetria este SKEW() Puteți utiliza următoarele două reguli

Interpretare:

Skewness > 0 - distributia este inclinata spre stanga, avand

mai multe valori extreme spre dreapta.

Skewness < 0 - distributia este inclinata spre dreapta, avand

mai multe valori extreme spre stanga.

Skewness = 0 - media = mediana, distributia este simetrica

in jurul mediei.

Asimetria se calculează cu formula:

𝑆 =

1𝑛 − 1

σ𝑖=1𝑛 𝑥𝑖 − ҧ𝑥 3

𝜎3

Funcția din Excel ce calculează asimetria este SKEW()

Page 5: Indicatori ai formei distribuţieiileana.brudiu.ro/MVR/An I MVR/CURS (2020-2021)/12...Funcția din Excel ce calculează asimetria este SKEW() Puteți utiliza următoarele două reguli

Puteți utiliza următoarele două reguli pentru a oferi

unele informații despre asimetrie, chiar și atunci când

nu se poate vedea un grafic linie de date (de

exemplu, tot ce ai nevoie este media și mediana):

Regula 1. Dacă media este mai

mică decât valoarea mediană,

datele sunt înclinate spre stânga.

Regula 2. Dacă media este mai

mare decât valoarea mediană,

datele sunt înclinate spre dreapta.

Page 6: Indicatori ai formei distribuţieiileana.brudiu.ro/MVR/An I MVR/CURS (2020-2021)/12...Funcția din Excel ce calculează asimetria este SKEW() Puteți utiliza următoarele două reguli

ASIMETRIA

distribuții bimodale

distribuții unimodale

Page 7: Indicatori ai formei distribuţieiileana.brudiu.ro/MVR/An I MVR/CURS (2020-2021)/12...Funcția din Excel ce calculează asimetria este SKEW() Puteți utiliza următoarele două reguli

xi ni

2,5 1

2,55 1

2,6 1

2,65 1

2,7 4

2,75 6

2,8 10

2,85 12

2,9 20

2,95 35

3 80

3,05 90

3,1 115

3,15 172

3,2 235

3,25 337

3,3 373

3,35 451

3,4 497

3,45 534

3,5 547

3,55 563

3,6 571

3,65 462

3,7 425

3,75 317

3,8 260

3,85 258

3,9 198

3,95 104

4 85

4,05 25

4,1 20

4,15 18

4,2 16

4,25 10

4,3 3

4,35 2

4,4 2

4,45 2

total 6850

media 3,51

mo 3,60

mediana 3,50

Page 8: Indicatori ai formei distribuţieiileana.brudiu.ro/MVR/An I MVR/CURS (2020-2021)/12...Funcția din Excel ce calculează asimetria este SKEW() Puteți utiliza următoarele două reguli

Conceptul de „curbă normală” :

Are formă de „clopot”. Cea mai mare parte a valorilor se concentrează în zona centrală (medie)

Este perfect simetrică pe ambele laturi ale sale

Linia curbei se apropie la infinit de axa X, fără a o atinge vreodată

În conformitate cu proprietatea 2, de fiecare parte a mediei se află exact jumătate dintre valorile distribuţiei

MEDIA, MEDIANA, MODUL au valori apropiateRangul (amplitudinea) = xmax.- xmin.≈ 6 DS.

„distribuţie normală”, care corespunde reprezentării

grafice a unei caracteristici pentru care există un mare

număr de măsurări, tinzând spre infinit.

Page 9: Indicatori ai formei distribuţieiileana.brudiu.ro/MVR/An I MVR/CURS (2020-2021)/12...Funcția din Excel ce calculează asimetria este SKEW() Puteți utiliza următoarele două reguli

Curba normală Laplace – Gauss

Curba ideală de variaţie este simetrică faţă de ordonata

maximă, notată cu „M”, corespunzând mediei aritmetice

Page 10: Indicatori ai formei distribuţieiileana.brudiu.ro/MVR/An I MVR/CURS (2020-2021)/12...Funcția din Excel ce calculează asimetria este SKEW() Puteți utiliza următoarele două reguli

Între [m-s, m+s] se află aproximativ

68% din indivizii unei populaţii

repartizate normal

Între [m-2s, m+2s] se află

aproximativ 95% din indivizii unei

populaţii repartizate normal

Între [m-3s, m+3s] se află peste 99%

din indivizii unei populaţii

repartizate normal

Page 11: Indicatori ai formei distribuţieiileana.brudiu.ro/MVR/An I MVR/CURS (2020-2021)/12...Funcția din Excel ce calculează asimetria este SKEW() Puteți utiliza următoarele două reguli

Curba lui Gauss (curba normală)

• Simetrică faţă de medie

• Are un maxim în dreptul mediei

• Tinde asimptotic la 0 spre plus infinit şi spre minus infinit

• În intervalul [m − s,m + s] se află aproximativ 68% din indivizii populaţiei

• În intervalul [m − 2s,m + 2s] se află aproximativ 95% din indivizii populaţiei

• În intervalul [m − 3s,m + 3s] se află aproximativ 99% din indivizii populaţiei

Page 12: Indicatori ai formei distribuţieiileana.brudiu.ro/MVR/An I MVR/CURS (2020-2021)/12...Funcția din Excel ce calculează asimetria este SKEW() Puteți utiliza următoarele două reguli

Boltirea (excesul)EXCESUL sau boltirea (E) este acea proprietate a curbei modale

de a fi mai mai turtită sau mai ascuţită decît curba normală

corespunzătoare.

Boltirea se caculează

cu formula:

Funcția din Excel ce calculează boltirea este KURT():

𝐾 =1

𝑛−1σ𝑖=1𝑛 𝑥𝑖− ҧ𝑥 4

𝜎4-3

Page 13: Indicatori ai formei distribuţieiileana.brudiu.ro/MVR/An I MVR/CURS (2020-2021)/12...Funcția din Excel ce calculează asimetria este SKEW() Puteți utiliza următoarele două reguli

Kurtosis - indicator folosit in analiza distributiei unei serii

de date pentru a indica gradul de aplatizare sau de

ascutire a unei distributii.

Interpretare:

Kurtosis > 3 - distributie

leptokurtica, mai ascutita decat o

distibutie normala; avand mai

multe valori concentrate in jurul

mediei si cozi mai groase ceeea

ce inseamna probabilitati ridicate

pentru valorile extreme.

Kurtosis < 3 - distributie platikurtica, mai plata decat o distibutie normal

avand valori dispersate pe un interval mai mare in jurul mediei.

Probabilitatea pentru valori extreme este mai mica decat in cazul unei

distributii normale.

Kurtosis = 3 - distributie mezokurtica - exemplu distributia normala.

Page 14: Indicatori ai formei distribuţieiileana.brudiu.ro/MVR/An I MVR/CURS (2020-2021)/12...Funcția din Excel ce calculează asimetria este SKEW() Puteți utiliza următoarele două reguli

Indicatori statistici

fundamentali

SERIILE DE VALORI

DISTRIBUITE RELATIV

SIMETRIC:

SERIILE DISTRIBUITE

ASIMETRIC:

▪ Media

▪ Deviaţia standard.

Media

Deviaţia standard,

dar sunt mai utile

mediana

cuartilele.

Page 15: Indicatori ai formei distribuţieiileana.brudiu.ro/MVR/An I MVR/CURS (2020-2021)/12...Funcția din Excel ce calculează asimetria este SKEW() Puteți utiliza următoarele două reguli

Statistica descriptiva, abordarea practicăTabelul de efective (tabel de evidenta primară).

HGB g/dL

14,5 14,5 15,4 15,2 14,6 14,6 13,5 14,6 13,8 15,2 13,8 13,6

14,7 15,2 12 13,8 12 14,7 14,7 13,8 14,7 15,3 13,8 15,3

12 13,3 15,7 14,7 14,5 13,3 13,7 14,5 16,4 14,6 13,6 14,6

14,1 15,4 14,8 14,8 14,1 14,5 14,6 13,5 13,8 13,8 15,2 15,2

15 14,8 13,5 13,7 13,5 14,7 15 14,6 13,5 14,7 15,3 14,6

Page 16: Indicatori ai formei distribuţieiileana.brudiu.ro/MVR/An I MVR/CURS (2020-2021)/12...Funcția din Excel ce calculează asimetria este SKEW() Puteți utiliza următoarele două reguli

Statistica descriptiva, abordarea practicăSe ordonează (crescător) - funcţia SORT din meniul Data în scopul urmăririi frecvenţei de apariţia a fiecărei valori observate

HGB g/dL

12 13,7 14,5 14,7 15,2

12 13,7 14,5 14,7 15,2

12 13,8 14,5 14,7 15,2

13,3 13,8 14,5 14,7 15,2

13,3 13,8 14,6 14,7 15,2

13,5 13,8 14,6 14,7 15,3

13,5 13,8 14,6 14,7 15,3

13,5 13,8 14,6 14,8 15,3

13,5 13,8 14,6 14,8 15,4

13,5 14,1 14,6 14,8 15,4

13,6 14,1 14,6 15 15,7

13,6 14,5 14,6 15 16,4

Page 17: Indicatori ai formei distribuţieiileana.brudiu.ro/MVR/An I MVR/CURS (2020-2021)/12...Funcția din Excel ce calculează asimetria este SKEW() Puteți utiliza următoarele două reguli

Statistica descriptiva, abordarea practicăSe obţine repartiţia de frecvenţă

HGB g/dL FrecventaFrecvenţa

cumulată

Frecvenţa

relativă

12 3 3 0,05

13,3 2 5 0,03

13,5 5 10 0,08

13,6 2 12 0,03

13,7 2 14 0,03

13,8 7 21 0,12

14,1 2 23 0,03

14,5 5 28 0,08

14,6 8 36 0,13

14,7 7 43 0,12

14,8 3 46 0,05

15 2 48 0,03

15,2 5 53 0,08

15,3 3 56 0,05

15,4 2 58 0,03

15,7 1 59 0,02

16,4 1 60 0,02

Page 18: Indicatori ai formei distribuţieiileana.brudiu.ro/MVR/An I MVR/CURS (2020-2021)/12...Funcția din Excel ce calculează asimetria este SKEW() Puteți utiliza următoarele două reguli

Întocmirea histogramei

0

1

2

3

4

5

6

7

8

9

12 13,3 13,5 13,6 13,7 13,8 14,1 14,5 14,6 14,7 14,8 15 15,2 15,3 15,4 15,7 16,4

HGB g/dL histograma date observate

0

5

10

15

20

25

30

<13 13-14 14-15 15-16 >16

HGB g/dl histograma date grupate

Page 19: Indicatori ai formei distribuţieiileana.brudiu.ro/MVR/An I MVR/CURS (2020-2021)/12...Funcția din Excel ce calculează asimetria este SKEW() Puteți utiliza următoarele două reguli

0

10

20

30

40

50

60

70

0

1

2

3

4

5

6

7

8

9

12 13,3 13,5 13,6 13,7 13,8 14,1 14,5 14,6 14,7 14,8 15 15,2 15,3 15,4 15,7 16,4

HGB g/dL histogramadate observate

Frecventa absoluta Frecvenţa cumulată

0

10

20

30

40

50

60

70

0

5

10

15

20

25

30

<13 13-14 14-15 15-16 >16

HGB g/dl histograma date grupate

Frecventa absoluta Frecventa absoluta Frecvená cumulata

Page 20: Indicatori ai formei distribuţieiileana.brudiu.ro/MVR/An I MVR/CURS (2020-2021)/12...Funcția din Excel ce calculează asimetria este SKEW() Puteți utiliza următoarele două reguli

Calcularea parametrilor tendinţei de grupare (media, mediana şi modulul) şi parametri tendinţei de împrăştiere (varianţa, deviaţia standard şi coeficientul de variaţie)

media =AVERAGE(C2:C61) 14,348

mediana =MEDIAN(C2:C61) 14,600

modulul =MODE(C2:C61) 14,600

varianţa =VAR(C2:C61) 0,747

deviaţia standard =STDEV(C2:C61) 0,864

coeficientul de

variaţie=(B67/B63) % 0,060

Page 21: Indicatori ai formei distribuţieiileana.brudiu.ro/MVR/An I MVR/CURS (2020-2021)/12...Funcția din Excel ce calculează asimetria este SKEW() Puteți utiliza următoarele două reguli

Microsoft Excel permite calcularea automată a statisticilor descriptive folosind opţiunea Data Analysis din meniul Tools.

HGB g/dL

Mean 14,34833

Standard Error 0,111576

Median 14,6

Mode 14,6

Standard Deviation 0,864261

Sample Variance 0,746946

Kurtosis 1,115185

Skewness -0,71676

Range 4,4

Minimum 12

Maximum 16,4

Sum 860,9

Count 60

Largest(1) 16,4

Smallest(1) 12

Confidence Level(95,0%) 0,223262

Page 22: Indicatori ai formei distribuţieiileana.brudiu.ro/MVR/An I MVR/CURS (2020-2021)/12...Funcția din Excel ce calculează asimetria este SKEW() Puteți utiliza următoarele două reguli

Microsoft Excel permite trasarea automată a histogramei folosind opţiunea Data Analysis din meniul Tools.

Page 23: Indicatori ai formei distribuţieiileana.brudiu.ro/MVR/An I MVR/CURS (2020-2021)/12...Funcția din Excel ce calculează asimetria este SKEW() Puteți utiliza următoarele două reguli
Page 24: Indicatori ai formei distribuţieiileana.brudiu.ro/MVR/An I MVR/CURS (2020-2021)/12...Funcția din Excel ce calculează asimetria este SKEW() Puteți utiliza următoarele două reguli

Column1

Mean 14,34833

Standard Error 0,111576

Median 14,6

Mode 14,6

Standard Deviation 0,864261

Sample Variance 0,746946

Kurtosis 1,115185

Skewness -0,71676

Range 4,4

Minimum 12

Maximum 16,4

Sum 860,9

Count 60

Confidence Level(95,0%) 0,223262

HGB g/dL

14,5 14,5 15,4 15,2 14,6 14,6 13,5 14,6 13,8 15,2 13,8 13,6

14,7 15,2 12 13,8 12 14,7 14,7 13,8 14,7 15,3 13,8 15,3

12 13,3 15,7 14,7 14,5 13,3 13,7 14,5 16,4 14,6 13,6 14,6

14,1 15,4 14,8 14,8 14,1 14,5 14,6 13,5 13,8 13,8 15,2 15,2

15 14,8 13,5 13,7 13,5 14,7 15 14,6 13,5 14,7 15,3 14,6

Page 25: Indicatori ai formei distribuţieiileana.brudiu.ro/MVR/An I MVR/CURS (2020-2021)/12...Funcția din Excel ce calculează asimetria este SKEW() Puteți utiliza următoarele două reguli
Page 26: Indicatori ai formei distribuţieiileana.brudiu.ro/MVR/An I MVR/CURS (2020-2021)/12...Funcția din Excel ce calculează asimetria este SKEW() Puteți utiliza următoarele două reguli

Statistica descriptive (rezumat) Populaţie: totalitatea (mulţimea) persoanelor la care se referă un studiu.

Individ: un element al populaţiei studiate.

Variabilă: o caracteristică măsurabilă a unui individ.

Biostatistică: disciplină care studiază caracteristicile unei populaţii şi/sau

compararea unor populaţii, pornind de la date culese pe eşantioane.

Inferenţă statistică: operaţia de generalizare, la nivelul întregii populaţii, a

caracteristicilor obţinute pe un eşantion.

Eşantion (sample): o submulţime a populaţiei, ce cuprinde indivizii pe care

se efectuează măsurătorile.

Eşantion reprezentativ (random sample): eşantion care cuprinde toate

straturile populaţiei în proporţii similare şi are toate caracteristicile

populaţiei.

Page 27: Indicatori ai formei distribuţieiileana.brudiu.ro/MVR/An I MVR/CURS (2020-2021)/12...Funcția din Excel ce calculează asimetria este SKEW() Puteți utiliza următoarele două reguli

Statistica descriptive (rezumat) Variabilă cantitativă / numerică: exprimată printr-un număr, valoare

obţinută prin măsurare cu un instrument; are unităţi de măsură.

Variabilă ordinală / rang (rank variable): exprimat printr-un număr

asociat unei scări convenţionale.

Variabilă nominală / calitativă (count data): exprimată printr-un cuvânt

care exprimă o calitate a variabilei respective.

Variabilă dihotomică: are numai două valori posibile; rezultatul va fi

distribuţia în cele două clase.

Page 28: Indicatori ai formei distribuţieiileana.brudiu.ro/MVR/An I MVR/CURS (2020-2021)/12...Funcția din Excel ce calculează asimetria este SKEW() Puteți utiliza următoarele două reguli

Transformări

În anumite situaţii putem transforma tipul variabilei.

TENSIUNE ARTERIALĂ SISTOLICĂ- EXPRIMATĂ CA VARIABILĂ

- NUMERICĂ

- RANG

- CALITATIVĂ

- DIHOTOMICĂ (0) =NEHIPERTENSIV (1) = HIPERTENSIV

90 100 110 120 130 140 150 160 170

.............0........ .............1........... ...........2............

HIPOTENSIV NORMOTENSIV HIPERTENSIV

Page 29: Indicatori ai formei distribuţieiileana.brudiu.ro/MVR/An I MVR/CURS (2020-2021)/12...Funcția din Excel ce calculează asimetria este SKEW() Puteți utiliza următoarele două reguli

Pentru caracterizarea unui eşantion se calculează două seturi de indicatori statistici:

Indicatori ai tendinţei centrale – cel mai des folosit este media aritmetică m.

Indicatori de dispersie – cel mai des folosit este deviaţia standard s şi reprezintă

gradul de împrăştiere al valorilor individuale în jurul mediei eşantionului.

Alţi indicatori ai tendinţei centrale:

− mediana – valoarea care împarte lotul de valori ordonate în două subintervale

egale ca număr de valori;

− modulul – cea mai frecventă valoare.

Alţi indicatori de dispersie:

− varianţa – pătratul deviaţiei standard;

− coeficientul de variaţie – raportul între deviaţia standard şi media aritmetică.

Cea mai des întâlnită distribuţie a valorilor de studiu este distribuţia normală

(Gauss).

.

În cazul variabilelor ordinale (rang), folosim mediana ca indicator al tendinţei

centrale şi cuartilele (amplitudinea intercuartile) pentru dispersie.

Pentru a caracteriza distribuţiile asimetrice se folosesc coeficienţii de asimetrie

şi exces.