2015.03.24_statistica

8
Problema La inceputul celui de-al doilea semestru, 10 studenti au fost intrebati sa raspunda cat au cheltuit pe rechizite. Valorile observate sunt: 13, 15, 17, 18, 17, 13, 14, 13, 12, 13, si reprezinta zeci de lei. Cerinta: 1. Sa se determine si sa se interpreteze ITC 2. Sa se determine si sa se interpreteze curtilele seriei de date 3. Sa se cerceteze daca seria de date contine valori extreme sau outliers Rezolvare: 1. Populatia statistica = multimea studentilor Unitatea statistica = 1 student X – cheltuiala in zeci de lei a unui student pe rechizite, la inceputul celui de-al doilea semestru Volumul esantionului este n=10 studenti - Valorile inregistrate asupra variabilei sunt: {x 1 =13 , x 2 =15,……., x 10 =13} zeci de lei - Serie simpla sau nesistematizata de date numerice - ITC o Media aritmetica o Mediana o Modul MEDIA x = x 1+ x 2++xn n = i=1 n ,xi n = i=1 n ,xi 10 = 145 10 =¿ x =14,5 zeci lei

Upload: zum84

Post on 12-Sep-2015

4 views

Category:

Documents


0 download

DESCRIPTION

15.01.2015 Taxe Si Comisioane Persoane Fizice Valabile Pana La 16.03.2015

TRANSCRIPT

Problema

La inceputul celui de-al doilea semestru, 10 studenti au fost intrebati sa raspunda cat au cheltuit pe rechizite. Valorile observate sunt: 13, 15, 17, 18, 17, 13, 14, 13, 12, 13, si reprezinta zeci de lei.Cerinta:1. Sa se determine si sa se interpreteze ITC2. Sa se determine si sa se interpreteze curtilele seriei de date3. Sa se cerceteze daca seria de date contine valori extreme sau outliers

Rezolvare:1. Populatia statistica = multimea studentilor Unitatea statistica = 1 studentX cheltuiala in zeci de lei a unui student pe rechizite, la inceputul celui de-al doilea semestruVolumul esantionului este n=10 studenti

Valorile inregistrate asupra variabilei sunt: {x1=13, x2=15,., x10=13} zeci de lei Serie simpla sau nesistematizata de date numerice ITC Media aritmetica Mediana Modul

MEDIA = =14,5 zeci leiCheltuiala medie a unui student pe rechizite = 14,8 zeci lei, la nivelul esantionului

MEDIANA Seria de date se ordoneaza crescatorX(1) = notam valoarea de pe prima pozitie din sirul ordonat crescatorX(1) =12, X(2) =13, X(3) =13, X(4) =13, X(5) =13, X(6) =14, X(7) =15, X(8) =17, X(9) =17, X(10) =18 Locul medianei este , dar incadram locul medianei intre 2 numere intregi consecutive: 5 Mo = 13 zeci lei, cu interpretarea ca, cea mai frecventa cheltuiala cu rechizitele este de 13 zeci lei la nivelul esntionului.

2. CUARTILELE unei serii numerice de date statistice sunt niste indicatori medii de pozitie care impart seria de date in 4 parti (quart=sfert) Seria de date se ordoneaza crescator X(1) X(2) . X(n-1) X(n) Cuartila de ordinal 1 sau cuartila inferioara notate Q1 se determina astfel: Locul lui Q1 este , dar pozitia cuartilei se incadreaza intre urmatoarele numere intregi consecutive 2 Q2=Me=13 zeci leiCuartila de ordinal al treilea sau cuartila superioara Q3 se determina astfel: Locul lui Q3 este , dar 8 IQR =4 zeci lei[Q1-1,5IQR; Q3+1,5IQR] = [13-1,54; 17+1,54] = [7; 23] zeci leiSeria de date nu prezinta valori extreme, deoarece toate valorile observate sunt incluse in intervalul [7; 23] SAU nu exista x in multimea de valori observate, astfel incat x sa fie in afara intervalului de la 7 la 23. {x1, x2, ., x10} a.i. [7; 23] zeci lei

Problema 4/pag.8a) Populatia statistica multimea actritelorUnitatea statistica 1 actritaX varsta variabila numerica discreteVolumul esantionului n=39 actrite {x1=50, x2=44, ., xn= x39=33} ani Serie simpla sau nesistematizata de date numerice

ITC Media aritmetica (Mean / Average) = =38,10 ani Mediana ordonam crescator seria de dateX(1) =21, X(2) =24, , X(34) =50, X(35) =60, X(36) =61, X(37) =61, X(38) =74, X(39) =80Locul medianei este => Me=x(20) = 34 aniInterpretare:Jumatate dintre actrite au obtinut premiul Oscar pana la varsta de 34 aniSAUJumatate dintre actritele din esantion au obtinut premiul Oscar dupa varsta de 34 ani. Modul (valoare modala)Exista o prima valoare modala de 26 ani si o a doua de 34 ani => avem 2 valori modale, deoarece aceste valori apar cu frecventa absoluta cea mai mare, fiecare dintre aceste 2 valori ale varstei fiind intalnite cu cea mai mare frecventa la nivelul esantionului, adica cu frecventa 4.Cele mai frecvente varste la care s-a obtinut premiul Oscar sunt: 26 ani si 34 ani. Mo1=26 ani si Mo2= 34 ani Cuartilele seria de date se ordoneaza crescatorX(1) X(2) .. X(38) X(39)Q1 - Locul lui Q1 este => Q1 = x(10) = este a zecea valoare din sirul ordonat crescator = 30 aniAdica, un sfert dintre actrite au castigat premiul Oscar pana la varsta de 30 aniQ2 mediana => Q2=Me=34 ani Q3 locul lui Q3 este => Q3 = x(30) = 41 aniInseamna ca, un sfert dintre actritele din esantion au obtinut premiul Oscar dupa varsta de 41 ani.

IQR (abaterea intercuartilica este lungimea intervalului dintre Q1 si Q3) = Q3-Q1 = 41-30 = 11 ani

Cerinta noua!Sa se cerceteze daca seria de date are valori extreme.X(1) X(2) . X(10) . X(20) . X(30) X(38) X(39)25%Q350%Q125%

IQR=11 ani

Rezolvare cerinta noua[Q1-1,5IQR; Q3+1,5IQR] = [30-1,511; 41+1,511] = [13,7; 57,5]Valorile extreme sau outliers sunt {x(35) =60, x(36) =x(37)=61, x(38)=74, x(39)=80 }, deoarece acestea nu se gasesc in intervalul [13,5; 57,5]

b) Diagrama box-plot (diagrama cu mustati / diagrama cu 5 elemente)

Limita sau marginea inferioara a digramei box-plot este cea mai mica dintre valorile seriei de date, cu proprietatea ca este mai mare sau egala decat Q1-1,5IQR.Liminf box-plot = min {x(i) / x(i) Q1-1,5IQR }1,5 = o data si jumatate abaterea cuartilicaLimsup box-plotLiminf box-plot57,5

50 60 74 80X(34) x(35) X(38) x(39)

21 24X(1) x(2)

Limita sau marginea superioara a diagramei box-plot este cea mai mare dintre valorile observate, cu propritatea ca este Q3+1,5IQRLimsup box-plot= max {x(i) / x(i) Q3+1,5IQR }Q3+1,5IQR = 57,5Limsup box-plot= 50 anix(35) =60, x(36) =61, x(37)=61, x(38)=74, x(39)=80