0_curs_1_descrierea caracteristicilor cantitative si calitative

20
1 CURS MASTER SPM DESCRIEREA CARACTERISTICILOR CANTITATIVE ŞI CALITATIVE. Statistica este ştiinţa, ramură a matematicii, care permite aprecierea unor parametrii populaţionali prin studiul unui număr redus de elemente ale populaţiei în studiu (ţintă). O populaţie poate fi definită printr-un şir de valori care pot fi grupate în funcţie de parametrul studiat (glicemie, colesterol, TAD, TAS, etc.). Pentru fiecare astfel de şir se defineşte o variabilă (care va purta nume propriu: glicemie, colesterol, etc.). Practic variabila este considerată o funcţie, ia valori posibil diferite de la un element la altul în funcţie de caracteristicile proprii acestora. Variabila statistică - orice calitate, caracteristic s sau constituent al unei persoane sau lucru, care poate fi măsurată. Sunt clasificate în două grupe: 1. VARIABILE CANTITATIVE (caracteristică măsurabilă) Variabilele cantitative pot fi: Continue – o variabilă măsurabilă care poate lua o infinitate de valori, de obicei într-un interval (TAD, colesterol) Discrete – variabile care nu pot lua decât valori întregi (scor APGAR) Tip interval - Acest tip de măsurătoare permite comparația dintre date. Diferența dintre doua rezultate 4 si 2 este egala cu diferența

Upload: george-carp

Post on 07-Apr-2016

287 views

Category:

Documents


6 download

DESCRIPTION

Curs Info

TRANSCRIPT

Page 1: 0_curs_1_descrierea Caracteristicilor Cantitative Si Calitative

1

CURS MASTER SPM

DESCRIEREA CARACTERISTICILOR CANTITATIVE ŞI CALITATIVE.

Statistica este ştiinţa, ramură a matematicii, care permite aprecierea unor parametrii

populaţionali prin studiul unui număr redus de elemente ale populaţiei în studiu (ţintă). O populaţie poate fi definită printr-un şir de valori care pot fi grupate în funcţie de

parametrul studiat (glicemie, colesterol, TAD, TAS, etc.). Pentru fiecare astfel de şir se defineşte o variabilă (care va purta nume propriu:

glicemie, colesterol, etc.). Practic variabila este considerată o funcţie, ia valori posibil diferite de la un element la altul în funcţie de caracteristicile proprii acestora.

Variabila statistică - orice calitate, caracteristic s sau constituent al unei persoane sau lucru, care poate fi măsurată.

Sunt clasificate în două grupe: 1. VARIABILE CANTITATIVE (caracteristică măsurabilă)

Variabilele cantitative pot fi:

Continue – o variabilă măsurabilă care poate lua o infinitate de valori, de obicei într-un interval (TAD, colesterol)

• Discrete – variabile care nu pot lua decât valori întregi (scor APGAR)

• Tip interval - Acest tip de măsurătoare permite comparația dintre

date. Diferența dintre doua rezultate 4 si 2 este egala cu diferența

Page 2: 0_curs_1_descrierea Caracteristicilor Cantitative Si Calitative

2

dintre 6 si 4. În cazul unui test de inteligenta diferența între 100 IQ si 50 IQ este egala cu diferența dintre 100 IQ si 150 IQ. Deficienta majora a acestei scale este ca valorile respective nu pot fi multiplicate sau divizate. Astfel noi nu putem concluziona ca un subiect care a obținut 150IQ este de 1,5 ori mai inteligent decât un altul care a obținut 100IQ si nici de 3 ori mai inteligent decât unul care a obținut 50IQ.

• Tip raport - Acestea poseda toate calitățile unei scale de interval si are în plus doua noi. Permite multiplicarea sau divizarea datelor (2 kg sunt jumătate din 4kg si dublul unui kg). Acest tip de măsurare indica de asemenea valoarea zero absolut, ce arata lipsa totala a cantității măsurate. Cele mai multe caracteristici fizice (greutate; înălțime; timp de reacție; nivelul adrenalinei) pot fi măsurate astfel.

Ultimele doua tipuri de scale (de interval, respectiv de raport) sunt expresii cantitative ale variabilelor care pot fi supuse analizei statisticii parametrice cu mici excepții.

Pentru a aplica tehnicile de statistica parametrica în cazul variabilelor măsurate prin scale numerice (de interval sau de raport) trebuie sa vedem daca:

• Variabilele implicate sunt distribuite normal în cazul eșantionului selectat;

• Dispersia variabilelor de interes în cadrul eșantionului selectat trebuie sa fie asemănătoare cu dispersia variabilei pentru întreaga populație care îndeplinește caracteristicile eșantionului.

2. VARIABILE CALITATIVE (caracteristică ce nu poate fi măsurată).

La rândul lor variabilele calitative pot fi: • Nominale – grupuri de elemente ce nu pot fi ordonate (grupa

sanguina, culoarea părului)

Nominale ordonate (ordinale)– variabile ce sunt clasificate în mai mult de doua categorii si la care exista o ordine naturala între categorii: evoluția, stadializari, clasificări, scoruri etc.

• Dihotomice (binare) – apar numai două posibilităţi (bolnav / sănătos)

VARIABILE DEPENDENTE, VARIABILE INDEPENDENTE

Ex: o cercetare care vizează numărul orelor de somn la studenţi, în timpul semestrului, comparativ cu perioada de sesiune:

Page 3: 0_curs_1_descrierea Caracteristicilor Cantitative Si Calitative

3

–orele de somn= v. dependentă –perioada din semestru= v. independentă

STATISTICA DESCRIPTIVĂ/STATISTICA INFERENŢIALĂ

Există două ramuri ale statisticii: statistica descriptivă şi statistica inferenţială. Statistica descriptivă (după cum rezultă din denumire) se ocupă cu descrierea

caracteristicile principale ale variabilelor individuale. Valorile pe care variabila le ia se constituie într-o serie statistică.

Statistici bivariate sunt folosite atunci când relaţia dintre două (sau mai multe) variabile este descrisă.

Statisticile inferenţiale reprezintă un aspect cu totul diferit al statisticii. Se aplică

numai pentru a răspunde la întrebarea dacă ne putem baza pe rezultatele obţinute pe un eşantion de cazuri. Folosirea eşantioanelor este caracteristică pentru majoritatea studiilor moderne. Problema cu eşantioanele este că unele dintre ele nu sunt similare cu populaţia din care au fost extrase. Expresiile “statistic semnificativ” şi “statistic nesemnificativ” indică dacă o tendinţă a datelor poate fi acceptată ca substanţială (statistic semnificativ) sau insuficient de substanţială pentru a ne baza pe ea (statistic nesemnificativ). Obţinerea semnificaţiei statistice este puţin probabil să fie rezultatul întâmplării. (susţine concluzii (inferenţe) cu privire la o populaţie, pe baza datelor unui eşantion extras din acea populaţie).

Fiecărei statistici descriptive îi corespunde o statistică inferenţială. De exemplu, coeficientul de corelaţie este un indicator statistic descriptiv indicând direcţia şi intensitatea relaţiei dintre două variabile. Asociat acestui coeficient este statistica inferenţială - semnificaţia coeficientului de corelaţie. Statistica descriptivă este importantă pentru înţelegerea tendinţei datelor - statistica inferenţială se ocupă de încrederea pe care o putem avea în rezultate.

Statistica parametrică/neparametrică Statistica parametrică

• proceduri inferenţiale pe v. măsurate pe scale cantitative (Interval sau Raport)

• se bazează pe estimarea prin eşantionare a parametrilor populaţiei (medie, deviaţie std.)

Statistica neparametrică o proceduri inferenţiale pe v. măsurate pe scală calitative (nominale şi

ordinale) o nu se bazează pe estimarea parametrilor populației

STATISTICA DESCRIPTIVĂ

Statistica descriptivă reprezintă forma cea mai simplă de analiză a caracteristicilor

unei populaţii. Ea include colectarea de date, prezentarea lor sub formă de tabele, întocmirea unor reprezentări grafice şi stabilirea indicatorilor statistici.

Clasificarea rezultatelor obţinute şi prezentarea lor sub o formă facilă, accesibilă, care dă o descriere a fenomenului pe cât de fidelă posibil.

Page 4: 0_curs_1_descrierea Caracteristicilor Cantitative Si Calitative

4

Tabelele şi graficele trebuie în aşa fel întocmite încât să permită o interpretare directă şi uşoară fără a mai necesita texte aplicative suplimentare. Proceduri de organizare, sintetizare şi descrierea datelor: A. Tehnici de organizare şi prezentare a datelor (DESCRIEREA UNEI SERII STATISTICE)

• numerice (analiza de frecvenţe - simplă/grupată) • grafice

B. Indicatori statistici • indicatori ai tendinţei centrale • indicatori ai împrăştierii • indicatori ai formei distribuţiei

A. DESCRIEREA UNEI SERII STATISTICE

1. ORDONAREA DATELOR – crescător sau descrescător Primul tabel care se întocmeşte este tabelul datelor primare în care sunt trecute în

ordinea măsurării caracteristicile cercetate.

2. DETERMINAREA FRECVENŢELOR ABSOLUTE:

• Pentru fiecare valoare distinctă observată x, se calculează numărul F de apariţii, numit frecvenţa absolută (efectivul) valorii.

• Mulţimea valorilor efective ale frecvenţelor respective constituie distribuţia frecvenţei, care se poate prezenta printr-un tabel.

• Numărul total n de cazuri = suma efectivelor fiecărei valori:

p

i

nFi

1

3. EXPRIMAREA FRECVENŢELOR ŞI SUB ALTE FORME: Frecvenţa relativă: Permite să comparăm serii statistice comportând un număr diferit de cazuri. Se raportează frecvenţa absolută calculată la numărul n de cazuri, numit efectivul

total al seriei studiate.

n

Ffr

p

i

rif

1

1

Frecvenţa procentuală: Permite să caracterizăm mai expresiv frecvenţa relativă.

fp = f

r 100

p

i

pif

1

100

Frecvenţa cumulată: Se defineşte ca fiind suma frecvenţei proprii a unei valori observate cu frecvenţele tuturor valorilor inferioare.

Page 5: 0_curs_1_descrierea Caracteristicilor Cantitative Si Calitative

5

4. REALIZAREA TABELULUI DISTRIBUŢIEI DE FRECVENŢE:

Ex. Avem seria: 10, 10, 9, 9, 8, 8, 8, 8, 8, 7, 7, 7, 6, 6, 6, 6, 6, 6, 6, 5, 4, 4, 4, 4, 2 Tipuri de frecvenţe simple • Frecvenţa absolută • Frecvenţa cumulată • Frecvenţa relativă raportată la unitate • Frecvenţa relativă cumulată, raportată la unitate • Frecvenţa relativă procentuală • Frecvenţa relativă cumulată procentuală

Decilele→ împart distribuţia în 10 părţi egale

Page 6: 0_curs_1_descrierea Caracteristicilor Cantitative Si Calitative

6

Quartilele→împart distribuţia în patru părţi egale ca număr de valori) • quartila1 (percentila25) • quartila2 (percentila50) • quartila3 (percentila75)

5. GRUPAREA DATELOR ÎN CLASE:

Când valorile studiate variază continuu, cum este cazul greutăţii şi al înălţimii etc., distribuţia de frecvenţe este foarte dispersată şi nu oferă o interpretare semnificativă a mulţimii de valori. De aceea, se recurge la reducerea numărului de valori posibile, grupând valorile vecine. Mai precis, se împarte domeniul de variaţii posibile într-un număr de intervale sau clase în interiorul cărora se grupează toate valorile care cad în intervalul corespunzător. Principii

• toate intervalele trebuie să fie egale • limitele intervalelor trebuie să cuprindă toate valorile (între limitele intervalelor

alăturate să nu existe „goluri” sau suprapuneri)

Formule de calcul pentru numărul intervalelor de clasă pentru un eşantion dat: Relaţia lui H.A. Sturgers: k = 1 + 3.322 * ln(n)

Relaţia H.B. Mann şi A. Wald (pentru n >100):

𝒌 = 𝟒 ∙ [𝟏

𝟒∙ (𝒏 − 𝟏)]

𝟏𝟓

Page 7: 0_curs_1_descrierea Caracteristicilor Cantitative Si Calitative

7

Dacă dimensiunea eşantionului este mai mică decât 25, atunci nu se aplică împărţirea pe clase. În practică numărul intervalelor de clasă este bine să fie cuprins între 10 şi 20.

LIMITE APARENTE, LIMITE REALE limite aparente

• valori care sunt scoruri posibile ale variabilei (125, 129, etc.) • mijlocul intervalului=(125+129)/2)=127

limite reale • extind mărimea intervalului pentru a lua în considerare natura continuă a scalei de

măsurare • media a două mijloace de interval:(127+122)/2=124.5

distanţa dintre limitele reale este egală cu distanţa dintre limitele aparente

Page 8: 0_curs_1_descrierea Caracteristicilor Cantitative Si Calitative

8

REPREZENTĂRI GRAFICE Cerinţe generale

• focalizarea pe conţinutul şi nu pe forma graficului • este esenţial să fie evitate distorsiunile induse de forma graficului • este recomandabil să fie utilizate grafice care favorizează comparaţii între

variabile şi nu doar reprezentări individuale, “statice”, ale acestora • fiecare grafic trebuie să servească un singur scop, exprimat clar şi evident • se evită graficele redundante • orice grafic va fi însoţit de informaţii statistice şi descrierile necesare pentru a fi

uşor şi corect înţeles • orice grafic trebuie să aibă un titlu, iar axele vor explicit etichetate • un grafic trebuie să scoată în evidenţă datele şi nu abilităţile tehnice de editare

ale celui care l-a creat Forme uzuale

• graficul de tip bară • histograma • poligonul de frecvenţe • graficul frecvenţei cumulate • graficul circular • graficul de tip „stem and leaf” („tulpină şi frunze”)

Graficul de tip bară •Axa orizontală (Ox)

→valorile distribuţiei •Axa verticală (Oy)

→ frecvenţele fiecărei valori, •Exigenţe

- Barele trebuie sa aibă aceeaşi lăţime - Între bare se lasă un spaţiu - Barele pot fi puse în orice ordine - Ordonarea barelor, descrescător sau crescător (grafic Pareto)

Page 9: 0_curs_1_descrierea Caracteristicilor Cantitative Si Calitative

9

histograma

Histogram: Apgar 1 min

Kolmogorov-Smirnov d=.14589, p<.15 ; Lil l iefors p<.01

Expected Normal

1

17

7

11

8

4

9

10

-1 0 1 2 3 4 5 6 7

X <= Category Boundary

0

2

4

6

8

10

12

14

16

18

20

No

. o

f o

bs.

1

17

7

11

8

4

9

10

Pareto Chart of t-Values for Coefficients; df=2

Variable: pH CO

Sigma-restricted parameterization

.0289275

.129605

.2039963

4.6055

p=.05

t-Value (for Coefficient;Absolute Value)

CK 7 zile

CK 24h

CK 4h

CK 72h

CK 48h

CK 12h

0.677008

0.605519

Histogram: GN

Kolmogorov-Smirnov d=.08153, p> .20; Lil l iefors p> .20

Expected Normal

01 1

3

18

25

13

3 3

500 1000 1500 2000 2500 3000 3500 4000 4500 5000

X <= Category Boundary

0

5

10

15

20

25

30

No

. o

f o

bs.

01 1

3

18

25

13

3 3

Page 10: 0_curs_1_descrierea Caracteristicilor Cantitative Si Calitative

10

poligonul de frecvenţe

graficul frecvenţei cumulate

Page 11: 0_curs_1_descrierea Caracteristicilor Cantitative Si Calitative

11

Page 12: 0_curs_1_descrierea Caracteristicilor Cantitative Si Calitative

12

DIAGRAME DE STRUCTURĂ: arată proporţia valorilor unei variabile în cadrul eşantionului (Graficul circular)

DIAGRAMA TUKEY – Stem and Leaf: permite reconstituirea datelor şi evaluarea densităţii datelor în fiecare clasă. Se foloseşte în general pentru a reprezenta variabile care au drept valori numere reale, grupate în intervale de clasă.

Page 13: 0_curs_1_descrierea Caracteristicilor Cantitative Si Calitative

13

B. INDICATORI STATISTICI

Indicatorii care definesc o variabilă (serie) sunt:

Variabile cantitative • măsura tendinței centrale (media, mediana,modul) • măsura dispersiei (deviația standard,varianta) • distribuția normala

Indicatori ai tendinţei centrale: valori tipice, reprezentative, care descriu distribuţia în întregul ei MEDIA ARITMETICĂ: Se aplică datelor care au valori numerice; fiind date observaţiile x1 , x2 , … , xn media aritmetică se va calcula cu formula:

n

x

x

n

i

i 1

Notaţii uzuale: - μ → media populaţiei - m → media eşantionului

MEDIA ARITMETICĂ PONDERATĂ: Fiind date observaţiile x1 , x2 , … , xn pentru care se cunosc frecvenţele absolute F1, F2, … Fn, media aritmetică ponderată se va calcula cu formula:

n

xF

n

xFxFxFx

n

i

ii

nn

12211 ...

Proprietăţile mediei aritmetice - Adăugarea\scăderea unei constante la fiecare valoare a distribuţiei, măreşte\scade

media cu acea valoare - Înmulţirea\împărţirea fiecărei valori a distribuţiei cu o constantă, multiplică\divide

media cu acea constantă - Suma abaterii valorilor de la medie este întotdeauna egală cu zero - Suma pătratului abaterilor de la medie va fi întotdeauna mai mică decât suma

pătratelor abaterilor în raport cu oricare alt punct al distribuţiei.

Page 14: 0_curs_1_descrierea Caracteristicilor Cantitative Si Calitative

14

MEDIA CRONOLOGICĂ, MC: Se foloseşte în cazul seriilor care au variaţii în timp (lunare, semestriale sau anuale):

1

2/...2/ 121

n

xxxxM nn

C

MEDIANA, ME: Se calculează pentru datele care au valori numerice; se ordonează valorile crescător sau descrescător. Corespunde valorii de 50% pe coloana frc%. • În cazul în care şirul are un număr IMPAR de valori: mediana va fi valoarea care împarte

şirul de valori în două părţi egale. • În cazul în care şirul are un număr PAR de valori: mediana se calculează făcând media

aritmetică a celor două valori din mijlocul şirului. Valori nedeterminate şi clase deschise •Valorile „nedeterminate” –valori a căror mărime nu decurge din procesul de măsurare, în acelaşi mod în care rezultă oricare valoare a seriei –Exemplu: testul de asociere verbală (10 sec) •Clase (categorii) deschise –categorii care au una dintre limite „liberă” –Exemplu: Câte ţigări fumezi zilnic? („30 sau mai mult”). În astfel de cazuri se utilizează mediana. MODULUL (dominanta), MO: Este valoarea care are frecvenţa cea mai mare dintr-un şir de observaţii.

- distribuţii unimodale (583254 Mo=5) - distribuţii bimodale (5832254 Mo=5; =2) - distribuţii multimodale (58832254 Mo=5; =2; =8)

VALOAREA CENTRALĂ, Xc: Reprezintă media aritmetică a valorilor extreme din şirul de date studiat.

2

maxmin xxXC

Page 15: 0_curs_1_descrierea Caracteristicilor Cantitative Si Calitative

15

Valori extreme (excesive) ale distribuţiei

• valori excesive, neobişnuit de mari sau de mici faţă de celelalte valori ale unei distribuţii

• Identificare Tratarea valorilor extreme •Stabilirea naturii valorilor extreme:

–erori de înregistrare (tastare); –erori de măsurare; –rezultate influenţate de anomalii ale condiţiilor experimentale. –eşantionul a fost extras dintr-o populaţie asimetrică –valorile respective fac parte din altă populaţie de valori –eşantion prea mic

•Tratarea lor pe una din căile posibile: –eliminare (dacă sunt erori necorectabile); –corectare (dacă este posibil); –utilizarea mediei 5%trim, –transformare (extragerea radicalului din toate valorile distribuţiei, logaritmarea distribuţiei, etc.)

Indicatori ai împrăştierii – descriu caracteristica de împrăştiere a valorilor distribuţiei VARIANŢA (DISPERSIA): Este media pătratelor deviaţiilor (abaterilor) de la medie. Fiind dată o serie de valori x1 , x2 , … , xn , n >30, se calculează cu formula:

n

xx

S

n

i

i

1

2

22

)(

)(

Page 16: 0_curs_1_descrierea Caracteristicilor Cantitative Si Calitative

16

Dacă n < 30, se aplică 0 corecţie a formulei de calcul: 1

)(

)( 1

2

22

n

xx

S

n

i

i

Numitorul (n – 1) = numărul gradelor de libertate ale varianţei. S2 dispersia eşantionului; σ2 dispersia populaţie

• Abaterea standard nu este definită pentru (n-1), ci pentru “n” • Dar suma abaterilor de la medie este întotdeauna 0 • dacă ştim n-1 abateri, o cunoaştem pe ultima • doar primele n-1 abateri pot varia “liber”. • (n-1) sunt definite ca “grade de libertate”

Abaterea standard faţă de medie este mai mică decât abaterea standard faţă de orice altă valoare a unei distribuţii DEVIAŢIA STANDARD: Se defineşte ca fiind rădăcina pătrată a varianţei:

n

xxin

i

2

1

)(

AMPLITUDINEA: Se defineşte ca diferenţa între cea mai mică şi cea mai mare valoare dintr-un şir de valori.

𝑊=𝐴=𝑥𝑚𝑎𝑥−𝑥𝑚𝑖𝑛 Amplitudinea relativă (R%)

• raportul procentual dintre amplitudine şi medie • utilă când cunoaştem plaja teoretică de variaţie a valorilor

CUARTILELE: Sunt 3 valori, notate Q1, Q2 şi Q3, care împart şirul de date în 4 părţi de dimensiune egală. Diferenţa dintre Q3 şi Q1 se numeşte interval cuartilic, Iq = Q3 – Q1.

Page 17: 0_curs_1_descrierea Caracteristicilor Cantitative Si Calitative

17

Q1 se numeşte cuartila inferioară sau mică, Q3 se numeşte cuartila superioară sau mare, iar Q2 este aceeaşi cu mediana şirului. COEFICIENTUL DE VARIAŢIE, CX: Este raportul între deviaţia standard şi media aritmetică a valorilor seriei, utilizat pentru a exprima mai sugestiv gradul de împrăştiere a acestora.

𝐶𝑥 =𝜎

�̅�

Abaterea medie și abaterea standard se exprimă în unitățile de măsură ale variabilei

de referință ca urmare, nu pot fi comparate în mod direct, pentru variabile diferite. - CV poate fi calculat numai pe scale de raport (origine în 0) - CV<15%, împrăştierea este mică şi, deci, media este reprezentativă - CV este între 15%-30%, împrăştierea este mijlocie şi media este suficient de

reprezentativă - CV > 30%, împrăştierea este mare şi media are o reprezentativitate redusă

EROAREA STANDARD:

Se defineşte ca fiind: nn

se2

..

Alegerea indicatorului împrăştierii

- Abaterea standard este cea mai utilizată pentru scale de măsurare interval/raport. Realizează cea mai bună combinaţie între calitatea estimării şi posibilitatea de a fundamenta inferenţe statistice.

- Amplitudinea este un indicator nesigur şi care nici nu poate fi calculat în cazul scalelor nominale

- Pe distribuţii cu valori nedeterminate sau cu intervale deschise, se alege abaterea interquartilă (semi-interquartilă).

Indicatori ai formei distribuţiei –se referă la forma curbei de reprezentare grafică a distribuţiei ASIMETRIA (SKEWNESS): O distribuţie este considerată simetrică, dacă de o parte şi de alta a mediei, frecvenţele au aceleaşi valori. Indicatorul relativ de asimetrie, Sk: (Karl Pearson)

𝑆𝑘 =�̅� − 𝑀𝑜

𝜎

pentru n suficient de mare:

𝑆𝑘 =∑ (

𝑥𝑖 − �̅�𝜎 )

2𝑛𝑖=1

𝑛

pentru n < 30:

𝑆𝑘 =∑ (

𝑥𝑖 − �̅�𝜎 )

2𝑛𝑖=1

𝑛 − 1

Page 18: 0_curs_1_descrierea Caracteristicilor Cantitative Si Calitative

18

Interpretare: Dacă Sk = 0 sau 𝑥 ̅=𝑀_𝑂, distribuţie simetrică. Dacă Sk > 0 sau 𝑥 ̅>𝑀_𝑂, asimetrie pozitivă (la dreapta). Dacă Sk < 0 sau 𝑥 ̅<𝑀_𝑂, asimetrie negativă (la stânga). În cazul unei distribuţii simetrice, media aritmetică, mediana şi modulul sunt egale.

BOLTIREA (KURTOSIS): Compară distribuţia dată cu cea normală, sau gaussiană, d.p.d.v. al înălţimii curbelor. Coeficientul de boltire:

𝛽2 =�̅�4

𝜎4

Coeficientul Fisher:

𝛾2 =∑ (𝑥𝑖 − �̅�)2𝑛𝑖=1

𝑛 − 𝜎4− 3

Page 19: 0_curs_1_descrierea Caracteristicilor Cantitative Si Calitative

19

Interpretare: Dacă β2 = 3 sau ϒ2 = 0, repartiţie mezocurtică (normală). Dacă β 2 > 3 sau ϒ 2 > 0, repartiţie leptocurtică (ascuţită). Dacă β 2 < 3 sau ϒ 2 < 0, repartiţie platicurtică (aplatizată).

Page 20: 0_curs_1_descrierea Caracteristicilor Cantitative Si Calitative

20