bazele statisticii (1)

Upload: diana-draghici

Post on 07-Aug-2018

275 views

Category:

Documents


0 download

TRANSCRIPT

  • 8/20/2019 bazele statisticii (1)

    1/38

    Anul I, CSIE 2011-2012Statistica I

    Exercitii pregatitoare pentru testul de la seminar si pentru examen – partea I

    Ex. 1. Următoarea serie de date arată preţul de vânzare sute lei! pentru 1" lucrări de #ra$icăla o licitaţie de o%iecte de artă& '1, (0, )2, "', "2, '), (", (1, *+, "", (), '*, ")Sta%iliţi valoarea de adevăr a următoarelor a$irmaţii, usti$icând răspunsurile&

    a) 2' . dintre lucrarile licitate s-au vandut pentru un pret mai mic de *+ sute de lei/b) umatate dintre lucrarile licitate au un pret mai mic sau e#al cu '* sute lei/c) 2' . dintre lucrari s-au vandut cu cel putin (2 sute de lei/d) pentru )'. dintre o%iecte s-a o%tinut un pret de cel putin "( sute lei/e) precizati care dintre urmatoarele valori& 2', 2, 1(, *0, 12*, +', ,+ sute lei sunt

    outliers in raport cu datele initiale

    Rezolvare:Cele n1" valori ale seriei de date se ordonează crescător& x1!"2,  x2!"",  x"!"',  x*!"),  x'!*+,  x(!'1,  x)!'*,  x+!'),  x!(0,  x10!(1,  x11!(", x12!(),  x1"!)2

    Q1  cuartila de ordinul 1 sau cuartila in$erioara

    3ocul lui Q1 este

    ∉=⋅+

    =⋅+

    '0,"1*

    11"1

    *

    1n

    N, dar " 4 ",'0 4 *

    ( ) ( )*1"   xQ x   ≤≤⇒

     si

    ( ) ( )"(

    2

    ")"'

    2

    *"

    1   =+

    =+

    =  x x

    Q

     sute lei

    ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( )

    .)'

    1"121110+)('*

    "(

    .2'

    "21

    1

     x x x x x x x x x x x x x

    Q

    ≤≤≤≤≤≤≤≤≤≤≤≤↑

    Cu interpretarea&

    • 2' . dintre termenii seriei au valori mai mici decat "( sute lei Q1 este percentila de ordinul 2'!,iar )'. dintre termenii seriei au valori mai mari ca "( sute lei/

    sau• 2'. dintre lucrarile de #ra$ica licitate s-au vandut pentru un pret mai mic decat "( sute lei, iar

    restul de )'. dintre ele s-au vandut cu un pret mai mare de "( sute lei

    Q2 Me  cuartila de ordinul 2 sau mediana seriei de date statistice

    3ocul lui Q2 Me este

    ∈=+

    =+

    )2

    11"

    2

    1n

    N ( )   '*)   ==⇒   x Me

    sute lei

  • 8/20/2019 bazele statisticii (1)

    2/38

    ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( )

    .'0

    '*

    .'0

    1"121110+)('*"21

     Me

     x x x x x x x x x x x x x

    ≤≤≤≤≤≤≤≤≤≤≤≤

    Cu interpretarea&•  umatate dintre termenii seriei au valori mai mici ca '* sute lei  Me este percentila de ordinul '0!,

    iar restul au valori mai mari ca '* sute lei/sau

    •  umatate dintre lucrarile de #ra$ica licitate s-au vandut cu mai putin de '* sute lei, iar restul s-auvandut cu un pret mai mare de '* sute lei

    Q"  cuartila de ordinul " sau cuartila superioara

    3ocul lui Q" este∉=⋅+=⋅+ '0,10"*

    11""*

    1n

    N, dar 10 4 10,'0 4 11

    ( ) ( )11"10   xQ x   ≤≤⇒ si

    ( ) ( )(2

    2

    ("(1

    2

    1110

    "   =+

    =+

    =  x x

    Q

     sute lei

    ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( )

    .)'

    1"1211

    (2

    .2'

    10+)('*"21

    "

     x x x x x x x x x x x x x

    Q

    ≤≤≤≤≤≤≤≤≤≤≤≤↑

    Cu interpretarea&• )' . dintre termenii seriei au valori mai mici decat (2 sute lei Q" este percentila de ordinul )'!,

    iar 2'. dintre termenii seriei au valori mai mari ca (2 sute lei/sau

    • )'. dintre lucrarile de #ra$ica licitate s-au vandut pentru un pret mai mic decat (2 sute lei,iar restul de 2'. dintre ele s-au vandut cu un pret mai mare de (2 sute lei

    ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( )

    .2'

    1"1211

    (2

    .'0

    10+)('*

    "(

    .2'

    "21

    "1

     x x x x x x x x x x x x x

    QQ

    ≤≤≤≤≤≤≤≤≤≤≤≤↑↑

    5umatate din termenii din milocul seriei au valori cuprinse intre Q1"( sute lei siQ"(2 sute lei

    A%aterea intercuatilica este IQRQ"-Q12( sute lei

     Definitie& Spunem ca o valoare x este outlier  pentru un set de date statistice numerice daca&

  • 8/20/2019 bazele statisticii (1)

    3/38

  • 8/20/2019 bazele statisticii (1)

    4/38

    Unde A – nivelul cel mai slab, E – nivelul cel mai inalt.

    Construiti distributia de frecvente absolute si reprezentati-o grac.

    Studiati tendinta centrala a distributiei folosind indicatori adecvati.

    Calculati media si dispersia unei variabile alternative, a carei stare favorabila este data de c

    Ex. !. 6entru " de actrite care au o%tinut premiul 9scar se cunoaste varsta, in ani impliniti,la momentul casti#arii premiului&

    '0, **, "', +0, 2(, 2+, *1, 21, (1, "+, *, "", )*, "0, "", *1, "1, "', *1, *2,"), 2(, "*, "*, "', 2(, (1, (0, "*, 2*, "0, "), "1, 2), ", "*, 2(, 2', "" ani

    Se cere&a) sa se determine si sa se interpreteze indicatorii tendintei centrale si cuartilele acestei

    serii de date/b) sa se construiasca dia#rama %o8-plot sau dia#rama cu mustati %o8-and-:;is

  • 8/20/2019 bazele statisticii (1)

    5/38

    o @edia unei serii simple de date numerice{ }

    n x x x   ,,, 21 este

    n

     x

    n

     x x x x

    n

    i

    i

    n

    ∑==

    +++=   121

     

    In cazul acestei serii, varsta medie a unei actrite din esantion care a casti#at premiul 9scar 

    este

    102',"+"

    1*+(

    ""

    "

    1"21 ===+++

    =∑=i

    i x x x x

     x

     anio 6entru a determina mediana, vom proceda ast$el&

    - seria simpla de date se ordoneaza crescator( ) ( ) ( )n x x x   ≤≤≤   21

    , unde

    ( )   ni x i   ,1,   = este elementul cu ran#ul i din seria ordonata crescator,

    - locul medianei este

    ( )   "*202

    120   ==⇒∈=+  x Men N

     ani5umatate dintre actritele din selectie au o%tunut premiul 9scar la o varsta de cel mult "*de ani umatate dintre actritele din esantion au casti#at premiul 9scar la o varsta de peste"* de ani!

    o E8ista doua valori care au $recventa ma8ima si anume valorile 2( ani si "* ani, care apar  pentru * actrite $iecare

    Nr. crt.

    Varsta actritelor 

    i x

    Varsta actritelor, in ordine crescatoare

    ( )i x

    1  x150  x1!212  x244  x2!243  x"35  x"!254  x*80  x*!265  x'26  x'!266 28 26

    7 41 26

    8 21 27

    9 61 28

    10 38  x10!30Q111 49 3012 33 31

    13 74 31

    14 30 33

    15 33 33

    16 41 33

    17 31 34

    18 35 34

    19 41 34

    20 42  x20!34 Me21 37 35

    22 26 35

    23 34 35

    24 34 37

  • 8/20/2019 bazele statisticii (1)

    6/38

    25 35 37

    26 26 38

    27 61 39

    28 60 41

    29 34 41

    30 24

     x"0!41

    Q"31 30 4232 37 44

    33 31 49

    34 27  x"*!5035 39  x"'!6036 34  x"(!6137 26  x")!6138 25  x"+!7439  x"33  x"!80

    o 6entru determinarea cuartilelor procedam ast$el&

    - locul cuartilei de ordinul 1, Q1, este

    ( )   "0101*

    1101   ==⇒∈=⋅

    + xQ

    nN

      ani/un s$ert dintre actrite au casti#at premiul 9scar la o varsta mai mica saue#ala cu "0 de ani, iar restul la cel putin "0 de ani/

    - locul cuartilei de ordinul ", Q", este

    ( )   *1"0"*

    1"0"  ==⇒∈=⋅+  xQ

    nN

     ani/trei s$erturi dintre actrite au casti#at premiul 9scar la o varsta mai mica saue#ala cu *1 de ani, iar restul la cel putin *1 de ani

    o A%aterea intercuartilica este111"   =−=   QQ IQR

     ani si arata lun#imea intervalului in carese #asesc umatate dintre valorile din milocul seriei de date

    b) 7ia#rama cu mustati %o8-and-:;is

  • 8/20/2019 bazele statisticii (1)

    7/38

    !

    "#$%

    &

    "'e%

    &$

    "#%

    (! )! )$ *& +!

    *  * *  *

    *

    - limita sau mar#inea superioara a dia#ramei %o8-plot este cea mai maredintre valorile seriei de date cu proprietatea ca este mai mica sau e#ala cu

     IQRQ   ⋅+   ',1", adica

    ( ) ( ){ } IQRQ xni x ii plot box   ⋅+≤==−   ',1,1,ma8suplim "&

    o

    ',')',1"

      =⋅+   IQRQ

    o cea mai mare dintre valorile seriei de date, cu proprietatea ca este',')≤

    , este x"*!'0 ani, deci mar#inea superioara este e#ala cu '0

    ani,( )"*'0suplim   x plot box   ==−

    Se o%serva ca intervalul cuprins intre mar#inea in$erioara si cea superioara dia#ramei %o8-plot, adica intervalul de numere reale B21/ '0 nu contine toate valorile o%servate, ina$ara lui ramanand valorile x"'!60,  x"(!61,  x")!61,  x"+!74,  x"!80 ani

    =aloarea  x  este outlier  pentru seria de date statistice numerice daca  x  se #aseste in

    a$ara intervalului[ ] [ ]',')/',1"',1/',1 "1   =⋅+⋅−   IQRQ IQRQ

    , x"'!60,  x"(!61,  x")!61,  x"+!74,  x"!80  sunt outliers si vor $i reprezentate distinct india#rama %o8-plot

    Di# 7ia#rama %o8-plot sau dia#rama cu mustati %o8-and-:;is

  • 8/20/2019 bazele statisticii (1)

    8/38

    Di# 7ia#rama %o8-plot in S6SS

    c) 7ispersia de selectie  sample variance! pentru o serie simpla de date numerice asupravaria%ilei X  este

    ( ) ( )  ( )

    11

    1

    2

    22

    12

    −=

    −−++−

    =∑=

    n

     x x

    n

     x x x x s

    n

    i

    i

    n x

    ,

    adica

    ( ))2(0,1)+

    1"

    '+),()1

    1"

    "

    1

    2

    2 =−

    =−

    −=∑=i

    i

     x

     x x

     s

    ,

    a%aterea standard  standard deviation! este

    "(++,1"2 ==   x x   s s

     ani

    Coe$icientul de variatie este

    ."'.0,"'100   >=⋅= x

     sv   x x

    , ceea ce indica $aptul caseria de date nu este omo#ena, iar media nu este reprezentativa pentru colectivitate, caindicator al tendintei centrale

  • 8/20/2019 bazele statisticii (1)

    9/38

    Nr. crt.Varsta actritelor

    i x   x xi −   ( )

     2 x xi −

    1  x150 11,8974 141,54892  x244 5,8974 34,77973  x"35 -3,1026 9,62594  x*80 41,8974 1755,39515  x'26 -12,1026 146,47206 28 -10,1026 102,0618

    7 41 2,8974 8,3951

    8 21 -17,1026 292,4977

    9 61 22,8974 524,2925

    10 38 -0,1026 0,010511 49 10,8974 118,754112 33 -5,1025 26,0361

    13 74 35,8974 1288,6259

    14 30 -8,1025 65,6515

    15 33 -5,1025 26,0361

    16 41 2,8974 8,3951

    17 31 -7,1025 50,4464

    18 35 -3,1025 9,6259

    19 41 2,8974 8,3951

    20 42 3,8974 15,1900

    21 37 -1,1025 1,2156

    22 26 -12,1025 146,4720

    23 34 -4,1025 16,8310

    24 34 -4,1025 16,8310

    25 35 -3,1025 9,6259

    26 26 -12,1025 146,4720

    27 61 22,8974 524,2925

    28 60 21,8974 479,4977

    29 34 -4,10256 16,8310

    30 24 -14,1025 198,882331 30 -8,1025 65,6515

    32 37 -1,1025 1,2156

    33 31 -7,1025 50,4464

    34 27 -11,1025 123,2669

    35 39 0,8974 0,8053

    36 34 -4,1025 16,8310

    37 26 -12,1025 146,4720

    38 25 -13,1025 171,6771

    39  x"33 -5,1025 26,0361

  • 8/20/2019 bazele statisticii (1)

    10/38

    ∑=

    ="

    1i

    i x

    1486

    ( )∑=

    =−"

    1i

    i   x x

    0

    ( )∑=

    =−"

    1

    2

    i

    i   x x

    6791,5897

    = x38,1025

    =2 x s178,7260

    ==   2 x x   s s13,3688

    = xv35,09%

    d) Asimetria unei serii de distri%uţie de $recvenţe se poate sta%ili&- prin compararea indicatorilor tendintei centrale,

    - prin analiza distantei intre mediana si cele doua cuartile in$erioara si superioara,- prin calculul si interpretarea valorii unui indicator speci$ic, coe$icientul de asimetrie,- se o%servă din reprezentarea #ra$ică prin ;isto#ramă sau poli#onul $recvenţelor

    - Cum x Me   =

  • 8/20/2019 bazele statisticii (1)

    11/38

    ∑=

    =(

    1k 

    k n

    39(n

    Feprezentarea #ra$ica seriei de distri%utie de $recvente pe intervale, adica ;isto#rama si poli#onul $recventelor su#ereaza ca aceasta prezinta asimetrie pronuntata la dreapta sauasimetrie pozitiva, adica predomina valorile mai mici ale varia%ilei de interes, cu coada mailun#ă a distri%uţiei spre valorile mari, care apar cu $recventa mai mica Intre cele " de actritecasti#atoare ale premiului 9scar, predomina cele cu varste relativ mai mici

    e) Indicatorii tendintei centrale, principaliiindicatori ai variatiei si ai $ormei

    distri%utiei pentru o serie simpla de datenumerice pot $i calculati in Excel  si inS6SS, output-urile $iind de $orma&

    9utput-ul "escriptive#tatistics in Excel 

    9utput-ul "escriptive#tatistics in S6SS

    9%servatie&  Analizaboltirii/aplatizării 

     Boltireakurtosis, Gnen#l! e8primăGnălţimea cur%eiHcocoaeiJ!comparativ cudistri%uţia normalăteoretică Kntâlnim,ast$el distribu!iileptocurtice, ascuţitecu HcocoaaJ Gnaltă!

    Varsta actritelor 

    )ean $edia!  = x

    38.1025

    *tandard +rror  2.1407

    )edian  Me34)ode  Mo26

    *tandard eviationa#aterea standard!

    ==   2 x x   s s13.3688

    *a$le Variancedisersia de selectie!

    =2 x s178.7260

    urtosis 2.3830

    *'e/nesscoeicientul de asi$etrie!

    =CAS 1.5734

    ane$litudinea!

    =−=   minma8   x x A x59

    )ini$u$  =

    min x

    21

    )ai$u$  =ma8 x

    80

    *u$   ∑=

    ="

    1i

    i x

    1486

    &ount n(39

    Statistics

    Varsta actritelor scar 

    N Valid 39

    )issin 0

    )ean   = x38.10

    *td. +rror o )ean 2.141

    )edian  Me34.00

    )ode  Mo26a

    *td. eviation   ==   2 x x   s s

    13.369

    Variance   =2 x s178.726

    *'e/ness   =CAS 1.573

    *td. +rror o *'e/ness .378

    urtosis 2.383

    *td. +rror o urtosis .741

    ane   =−=   minma8   x x A x59

    )ini$u$   =min x21

    )ai$u$   =ma8 x80

    *u$ ∑=

    ="

    1i

    i x

    1486

    ercentiles 25   =1Q30.00

    50   == MeQ234.00

    75   ="Q41.00

    a. )ultile $odes eist. e s$allest value is so/n

  • 8/20/2019 bazele statisticii (1)

    12/38

    i distribu!ii platicurtice, aplatizate $oeficientul de boltire sau aplatizare kurtosis! este omăsură a Gmprătierii $iecărei o%servaţii Gn urul unei valori centrale i se determină, peeantion, cu $ormula&

    ( )

    ( )  "

    22

    1

    *

    −⋅

    =

    ∑=

     x

    n

    i

    i

     sn

     x x

    C"A

    , unde

    ( )

    1

    1

    2

    2

    =

    ∑=

    n

     x x

     s

    n

    i

    i

     x

     Defini!ia este ba#at$ pe momentul centrat de ordinul %&

    Interpretarea valorii coe$icientului de aplatizare si %oltire&

     

    7acă0>C"A

    , avem distri%uţie leptocurtică, valorile vari%ilei $iind concentrate %n &urul indicatorilor tendin'ei centrale

     

    7acă0=CA"

    , ceea ce indica o distri%utieleptocurtica cu cocoasa, asa cum se poate vedea si din ;isto#rama sau poli#onul$recventelor!

    Ex. (. Un a#ent al companiei de asi#urari '  vinde contracte de asi#urare de locuinte In luna

    iulie a inc;eiat& 2 contracte cu prime anuale de '0 Eur, " contracte cu prime anuale de (0 Eur,( contracte cu prime de )0 Eur, contracte cu prime de 0 Eur, 1( contracte cu prime anualede 120 Eur, + contracte cu prime anuale de 1"0 Eur si ( contracte cu prime de 1*0 Eur Secere&

    a) Construiţi seria de distri%uţie de $recvenţe i analizaţi #ra$ic tendinţa de normalitate aacesteia

    b) Caracterizaţi omo#enitatea i asimetria distri%uţiei contractelor Gn $uncţie de valoarea primelor anuale

    c) Calculati media si a%aterea standard a varia%ilei alternative care evidentiazacontractele cu prime anuale de valoare mai mica sau e#ala cu 0 Eur

     Rezolvare& a)o 6opulatia statistica este multimea contractelor de asi#urare de locuinte din porto$oliul

    companiei ' o Unitatea statistica este un contract de asi#urare de locuintao =aria%ila statistica sau caracteristica de interes, notata X , este varia%ila ce arata marimei

     primei anuale, in Eur, pentru un contract de asi#urare de locuinta inc;eiat de un a#ent alcompaniei/ varia%ila numerica, continua

    o A#entul a inc;eiat intr-o luna n'0 de contracte, seria de date statistice re$eritoare la primele anuale ale acestor contracte $iind sistematizata intr-o serie de distri%utie de$recvente pe r ) variante distincte Ast$el distri%utia celor n'0 de contracte dupa

    valoarea primei anuale, in Eur, este&

  • 8/20/2019 bazele statisticii (1)

    13/38

    Nr.crt.

    Valoarea

    k  x

     +ur a unei ri$e anuale

    Nu$arul de contracte,

    k n

    ,recventa a#soluta!

    1

    =1 x50 +ur 

    =1n2 contracte

    2=2 x

    60 +ur =2n

    3

    3

    =" x70 +ur 

    ="n6

    4

    =* x90 +ur 

    =*n9

    5

    =' x120 +ur 

    ='n16

    6

    =( x130 +ur 

    =(n8

    7

    =) x140 +ur 

    =)n6

    ∑=

    ==)

    1

    '0k 

    k    nn

     contracte

    sau

       

      

     ==============

    (+1(("contracte2

    1201"01200)0(0Eur '0&

    )('*"21

    )('*"21

    nnnnnnn

     x x x x x x x X 

    ,

    unde∑= ==)

    1'0

    k    nn

     contracte

    o Feprezentarea #ra$ica a acestei serii de distri%utie este poli#onul $recventelor a%solute

  • 8/20/2019 bazele statisticii (1)

    14/38

    o 6oli#onul $recventelor su#ereaza ca distri%utia are tendinta de normalitate, dar prezintaasimetrie la stan#a, coada poli#onului $reventelor a%solute $iind mai alun#ita spre stan#a

    o 6oli#onul $recventelor se mai poate reprezenta si cu autorul $recventelor relative

    Nr.crt.

    Valoarea

    k  x

     +ur a unei ri$e anuale

    Nu$arul de contracte,

    k n

    ,recventa a#soluta! "recventa relativa

    [ ]1,0L ∈=n

    nn   k k 

    1

    =1 x50 +ur 

    =1n2 contracte

    =L1n0,04

    2

    =2 x60 +ur 

    =2n

    3

    =L2n0,06

    3

    =" x70 +ur 

    ="n6

    =L"n0,12

    4

    =* x

    90 +ur 

    =*n

    9

    =L*n0,18

    5=' x

    120 +ur ='n

    16=

    L

    'n0,32

    6

    =( x130 +ur 

    =(n8

    =L(n0,16

    7

    =) x140 +ur 

    =)n6

    0,12

    ∑=

    ==)

    1

    '0k 

    k    nn

     contracte

    ∑=

    =)

    1

    L1

    k n

    =L)n

  • 8/20/2019 bazele statisticii (1)

    15/38

    b)o  Media pentru o serie de distri%utie de $recvente pe r  variante distincte ale varia%ilei de

    interes este

    n

    n x

    nn

    n xn x x

    k k 

    r r 

    ∑=

    ⋅=

    ++⋅++⋅

    =   11

    11

    ,

    unde{ }r k  x

    k   ,1,   =

     sunt variantele distincte o%servate ale varia%ilei, iar

    ∑=

    =r 

    k    nn1

     volumulesantionului

    In cazul nostru,

    2,10('0

    '"10

    '0

    )

    1 ==⋅

    =∑=k 

    k k    n x

     x

     Eur este valoarea medie a unei prime anualacorespunzatoare unui contract de asi#urare de locuinta inc;eiat de respectivul a#ent devanzari

    o  Mediana pentru o serie de distri%utie de $recvente pe r  variante distincte se calculeaza parcur#and urmatorii pasi&

    • Cele r  variante distincte sunt ordonate crescatorr  x x x  

  • 8/20/2019 bazele statisticii (1)

    16/38

    • @ediana este acea valoare distincta cu proprietatea ca $recventa sa a%solutacumulata crescator este prima care depaseste locul medianei

    ',2'20',2'11

    ',2''

    ',2'2

    *

    "

    2

    1

  • 8/20/2019 bazele statisticii (1)

    17/38

    o  Modul  sau valoarea modala pentru o serie de distri%utie de $recvente pe r  variantedistincte este acea varianta sau valoare care apare cu $recventa a%soluta sau relativa ceamai mare&

    • Drecventa a%soluta cea mai mare este&

    { }r k nn k    ,1,ma81( '   ===

    • valoarea modala este deci a '-a varianta sau valoare distincta de

    raspuns a varia%ilei de interes,120' == x Mo

     Eur, aceasta $iind valoarea ceamai des intalnita a unei prime anuale pentru contractele inc;eiate derespectivul a#ent

    o  Felatia in care se #asesc indicatorii tendintei centrale, Mo Me x   =<

    , ca si reprezentatrea#ra$ica pentru poli#onul $recventelor a%solute sau relative, arata ca distri%utia contractelor dupa valoarea primelor anuale prezinta asimetrie ne#ativa, in serie predominand valorilemai mari ale primelor anuale, iar coada distri%utiei este alun#ita spre stan#a

    o 7ispersia in esantion de selectie! pentru o serie de distri%utie de $recvente pe r  intervalede variatie este

    ( ) ( )( )

    ( )

    11

    1

    2

    1

    2

    1

    2

    12

    ⋅−=

    −++⋅−++⋅−

    =∑=

    n

    n x x

    nn

    n x xn x x s

    k k 

    r r  x

    ,

    unde

    { }r k  xk    ,1,   = sunt variantele distincte o%servate ale varia%ilei,

    ∑=

    =r 

    k    nn1

     volumulesantionului

    In cazul nostru,

    ( )+1(",)(2

    1'0

    ")")+

    1'0

    )

    1

    2

    2 =−

    =−

    ⋅−=∑=k 

    k k 

     x

    n x x

     s

    , iar a%aterea standard sau

    a%aterea medie patratica este

    (11,2)2 ==   x x   s s Eur, care arata cu cat se a%at, in medie,

    valorile o%servate $ata de nivelul mediu in esantion al primelor anuale

    o Coe$icientul de variatie in esantion este

    ."0.01,2(1002,10(

    (11,2)100  

  • 8/20/2019 bazele statisticii (1)

    18/38

    unde1=) 

     pentru unitatile statistice din esantion care veri$ica evenimentul $avora%il, iar meste numarul de unitati statistice din esantion care veri$ica evenimentul $avora%il,

    20*"21   =+++=   nnnnm contracte,

    iar 0=)   pentru unitatile statistice din esantion care nu veri$ica evenimentul $avora%il,mn−

      este numarul de unitati statistice din esantion pentru care nu se veri$ica

    evenimentul $avora%il,"0=− mn

     de contracte cu prime anuale mai mari de 0 Eur

    @edia varia%ilei alternative este

    *,0'0

    20 ===n

    m *

    , adica *0. dintre contracte auvalori ale primelor anuale mai mici sau e#ale cu 0 Eur

    7ispersia varia%ilei alternative este

    2*,012 =   

       −⋅=

    nm

    nm s *

    , iar a%aterea standard

    *+,01   ≅   

       −⋅=

    n

    m

    n

    m s *

    Ex. . 7istri%utia a 1100 de a%solventi ai Universitatii din Dlorida dupa salariul casti#at, in N,in primul an dupa terminarea studiilor este urmatoarea serie de distri%utie de $recvente peintervale de variatie&

     Or crt Intervalul de variatie al salariului, N Oumarul de a%solventi1 7200 12500: 302 12500 17800: 693 17800 23100: 3024 23100 28400: 3085 28400 33700: 2636 33700 39000: 957 39000 44300: 208 44300 49600: 69 49600 54900: 5

    10 54900 60200: 111 60200 65500: 1

    Se cere&a) sa se reprezinte #ra$ic aceasta serie de distri%utie/b) sa se determine si sa se interpreteze indicatorii tendintei centrale/c) sa se reprezinte #ra$ic poli#onul $recventelor a%solute cumulate crescator si sa se

    estimeze proportia a%solventilor care&i) au o%tinut un salariu mai mic de 21000 N in primul an de dupa $inalizarea

    studiilor,ii) au o%tinut un salariu mai mic decat media in primul an de dupa $inalizarea

    studiilor,iii) au casti#at in primul an intre 2'000 N si *0000 N,iv) au casti#at mai mult de '2000 N/

    d) sa se sta%ileasca daca media este reprezentativa pentru colectivitate/e) sa se analizeze asimetria acestei distri%utii

  • 8/20/2019 bazele statisticii (1)

    19/38

     Rezolvare& a) 6opulatia statistica este multimea a%solventilor Universitatii din Dlorida, promotiile anilor 

    1+ si 10, asa cum se speci$ica in $isierul +niversit* of (lorida ,raduate salariessaval pro#ramului S6SS

    Unitatea statistica este un a%solvent =aria%ila sau caracteristica de interes, notata  X , este varia%ila ce arata salariul unui

    a%solvent, in N, din primul an de dupa $inalizarea studiilor, varia%ila numerica, continua

    6entru un esantion de volum1100=n

     de a%solventi s-au inre#istrat valorile varia%ilei, iar 

    setul de date s-a sistematizat intr-o serie de distri%utie de $recvente pe11=r 

     intervale devariatie de marime e#ala, data in enuntul pro%lemei

    Feprezentarea #ra$ica a acestei serii de distri%utie de $recvente pe intervale de variatie se poate realiza prin ;isto#rama si poli#onul $recventelor a%solute

    Nr.crt.

    Intervalul k  de variatie*alariul anual al unui

    a#solvent, in ;!

    "recventa a#solutak n

     a intervalului k nu$arul de a#solventi!

  • 8/20/2019 bazele statisticii (1)

    20/38

    Di# Pisto#rama 7istri%utia celor 1100 de a%solventi ai Universitatii din Dloridadupa salariul casti#at in primul an de dupa $inalizarea studiilor

    Di# 6oli#onul $recventelor a%solute 7istri%utia celor 1100 de a%solventi aiUniversitatii din Dlorida dupa salariul casti#at in primul an de dupa $inalizarea studiilor

  • 8/20/2019 bazele statisticii (1)

    21/38

    b) Indicatorii tendintei centrale& media, mediana si modul

    Nr.crt.

    Intervalul k *alariul anual al

    unui

    a#solvent, in ;!

    &entrul

    k  x "recventa a#solutak n

    nu$arul de a#solventi!

    k k    n x   ⋅

    "recventa a#solutacu$ulata crescator 

    a intervalului ',

    k ck    nn (    ++=   1

    1 7200 12500: 9850 30 295500 30

    2 12500 17800: 15150 69 1045350 99

    3 17800 23100: 20450 302 6175900 401

    4 23100 28400: 25750 308 7931000 709

    5 28400 33700: 31050 263 8166150 972

    6 33700 39000: 36350 95 3453250 1067

    7 39000 44300: 41650 20 833000 1087

    8 44300 49600: 46950 6 281700 1093

    9 49600 54900: 52250 5 261250 1098

    10 54900 60200: 57550 1 57550 1099

    11 60200 65500: 62850 1 62850 1100

    ∑=

    ==11

    1k 

    k    nn

    1100

    ∑=

    =⋅11

    1k 

    k k    n x

    28563500

    = x25966,82

    o  Media pentru o serie de distri%utie de $recvente pe r  intervale de variatie este

    n

    n x

    nn

    n xn x x

    k k 

    r r 

    ∑=

    ⋅=

    ++⋅++⋅

    =   11

    11

    ,

    unde{ }r k  x

    k   ,1,   =

     sunt centrele celor r  intervale, iar

    ∑=

    =r 

    k    nn1

     volumul esantionului

    +2,2'((1100

    2+'("'00

    1100

    11

    1 ==⋅

    =⇒∑=k 

    k k    n x

     x

     N a casti#at, in medie, un a%solvent in primul an

    o  Mediana pentru o serie de distri%utie de $recvente pe r  intervale de variatie se calculeaza

     parcur#and urmatorii pasi&

    • Se determina locul medianei, adica

    ',''02

    1=

    +n

    • Se calculeaza $recventele a%solute cumulate crescator ale intervalelor de

    variatie

    k ck    nn (    ++=   1,

    r k    ,1=

    • Intervalul median este primul interval cu proprietatea ca $recventa sa a%solutacumulata crescator depaseste locul medianei

  • 8/20/2019 bazele statisticii (1)

    22/38

    ',''0*01

    ',''0

    ',''0"0

    "

    2

    1

  • 8/20/2019 bazele statisticii (1)

    23/38

    varia%ilei de interes X  este mai mica sau e#ala decat limita superioara( ) supk  x

     a intervalului k 

    de variatie, adica( ) supk cck    x (  (    =

    ,r k    ,1=

    .

    6entru reprezentarea #ra$ica a poli#onului $reventelor a%solute cumulate crescator 

    vom pune in evidenta limitele superioare( ) supk  x

     ale intervalelor de variatie si $recventele lor 

    a%solute cumulate, impreuna cu limita in$erioara a primului interval de variatie( ) in$ 1 x

    , in cazul

    nostru )200 N, a carui $recventa a%soluta cumulata este 0,( )(   ( )   0)200in$ 1   ==   cc   (  x ( 

    , deoarece

     pentru nicio unitate statistica din esantion, nivelul varia%ilei nu este mai mic decat( ) in$ 1 x

    3imitele superioare aleintervalelor de variatie,

    ( ) supk  x

    ( )   k ck k c   nn (  x (    ++==   1sup, adica

    numarul de a%solventi din esantion

    care au casti#at un salariu mai mic sau e#al cu( ) supk  x

     N

    ( ) in$ 1 x

    (7200

    ( )(   ( ))200in$ 1   cc   (  x (    =0

    ( ) sup1 x

    12500( )   ( )12'00sup1   cc   (  x (    =

    30

    ( ) sup2 x

    17800

    ( )(   ( )1)+00sup2   cc   (  x (    =

    99( ) sup" x

    23100( )   ( )2"100sup"   cc   (  x (    =

    (401

    ( ) sup* x

    28400( )(   ( )2+*00sup*   cc   (  x (    =

    (709

    ( ) sup' x

    33700( )(   ( )"")00sup'   cc   (  x (    =

    972

    ( ) sup( x

    39000( )   ( )"000sup(   cc   (  x (    =

    (1067

    ( ) sup) x 44300( )(   ( )**"00

    sup)   cc   (  x (    = (1087( ) sup+ x

    49600( )(   ( )*(00sup+   cc   (  x (    =

    (1093

    ( ) sup x

    54900( )(   ( )'*00sup   cc   (  x (    =

    (1098

    ( ) sup10 x

    60200( )(   ( )(0200sup10   cc   (  x (    =

    (1099

    ( ) sup11 x

    65500( )(   ( )(''00sup11   cc   (  x (    =

    1100

  • 8/20/2019 bazele statisticii (1)

    24/38

  • 8/20/2019 bazele statisticii (1)

    25/38

    Di# Interpolare liniara - detaliu din $i#ura reprezentand poli#onul $recventelor a%solutecumulate crescator, pentru intervalul 17800 23100: N in care se #aseste 21000 N.

    ii)

    ( )+2,2'((c (  este numarul de a%solventi care au o%tinut un salariu mai mic decat

    nivelul mediu= x

    2'((,+2 N al salariului in esantion7in relatia

    ( ) ( )

    ( ) ( )2"1002+*00

    2"100+2,2'((

    2"1002+*00

    2"100+2,2'((

    cc

    cc

     (  ( 

     (  ( 

    −=

    ,

    o%tinem ca( )   '(++,'()+2,2'((   ≅=

    c ( 

     a%solventi,

    adica o proportie de

    .(",'11001100

    '(+=⋅

     dintre cei 1100 de a%solventi din esantionulconsiderat au avut un salariu anual mai mic de nivelul mediu

    iii)

    ( ) ( )   ''"',''2'000*0000   ≅=−   cc   (  ( 

     este numarul de a%solventi care au casti#at in primul an intre 2'000 N si *0000 N, adica '0,+1. dintre cei 1100 de a%solventi

  • 8/20/2019 bazele statisticii (1)

    26/38

    iv)

    ( ) ( )   ')",*'20001100'2000   ≅=−=−   cc   (  ( n a%solventi au casti#at mai mult de '2000

    N, adica o proportie de 0,*'.

    d) @edia varia%ilei de interes in esantion este = x

    25966,82 ;.

    Nr.crt.

    Intervalul k *alariul anual al

    unuia#solvent, in ;!

    &entrul

    k  x "recventa a#solutak n

    nu$arul de a#solventi!

    ( )  k k    n x x   ⋅−

      2

    1 7200 12500: 9850 30

    ( )   =⋅−  1

    2

    1   n x x

    7792556607

    2 12500 17800: 15150 69 8073248049

    3 17800 23100: 20450 302 9191461480

    4 23100 28400: 25750 308 14479361,025 28400 33700: 31050 263 6795583074

    6 33700 39000: 36350 95 10241990557

    7 39000 44300: 41650 20 4919242698

    8 44300 49600: 46950 6 2641763057

    9 49600 54900: 52250 5 3454027755

    10 54900 60200: 57550 1 997497258,9

    11 60200 65500: 62850 1 1360368967

    ∑=

    ==11

    1k 

    k    nn

    1100

    ( )∑=

    =⋅−11

    1

    2

    k k    n x x

    55482218864=2 x s

    50484275,58

    = x s7105,2287

    7ispersia in esantion de selectie! pentru o serie de distri%utie de $recvente pe r  intervale de variatie este

    ( ) ( )

    ( )

    ( )

    11

    1

    2

    1

    2

    1

    2

    12

    ⋅−=

    −++

    ⋅−++⋅−=

    ∑=

    n

    n x x

    nn

    n x xn x x s

    k k 

    r r  x

    ,

    unde{ }r k  xk    ,1,   =

     sunt centrele celor r  intervale,

    ∑=

    =r 

    k    nn1

     volumul esantionului

    ( )'+,'0*+*2)'

    11100

    *''*+221++(

    11100

    11

    1

    2

    2 =−

    =−

    ⋅−=⇒∑=k 

    k k 

     x

    n x x

     s

    , iar a%aterea standard este22+),)10'= x s

     N, care arata cu cat se a%at, in medie, valorile o%servate $ata de nivelul mediual salariului din esantion

  • 8/20/2019 bazele statisticii (1)

    27/38

    Coe$icientul de variatie in esantion este

    ."0."(,2)100+2,2'((

    22+),)10'100  

  • 8/20/2019 bazele statisticii (1)

    28/38

    6 33700 39000: 36350 95 1,06344+=14

    7 39000 44300: 41650 20 7,71494+=13

    8 44300 49600: 46950 6 5,54326+=13

    9 49600 54900: 52250 5 9,07828+=13

    10 54900 60200: 57550 1 3,15041+=13

    11 60200 65500: 62850 1 5,01747+=13

    ∑=

    ==11

    1k 

    k    nn

    1100

    ( )∑=

    =⋅−11

    1

    "

    k k    n x x

    1,82302+=14

    =CAS 0,462

    Cum10  

  • 8/20/2019 bazele statisticii (1)

    29/38

    r k nk    ,1,   =, $recventa a%soluta a intervalului k  de variatie numarul de de%itori restantiei

     pentru care numarul de zile de intarziere apartine intervalului k   de variatie!,nnn r  =++ 1

    /

    [ ]   r k n

    nn   k 

    k   ,1,1/0L =∈=

    , $recventa relativa a intervalului k  de variatie,1   LL

    1  =++  r nn

    /

    r k n

    nn   k k    ,1,100.L =⋅=

    , $recventa relativa e8primata procentual a intervalului k   devariatie sau ponderea de%itorilor cu numarul de zile de intarziere din intervalul sau clasa

    k ,.100..

      LL

    1   =++   r nn/

    •r k nn (  k ck    ,1,1   =++= , este $recventa a%soluta cumulata crescator a intervalului k /

    r k nn (  k ck    ,1,  LL

    1

    L =++=, este $recventa relativa cumulata crescator a intervalului k /

    r k nn (  k ck    ,1.,..  LL

    1

    L =++=, este $recventa relativa e8primata procentual cumulata

    crescator a intervalului k  ponderea cumulata a intervalului k !

     Orcrt

    Intervalul k  devariatie a

    numarului de zilede intarziere a

     platii

    6onderea cumulataa de%itorilor .!

    ...  LL

    1

    L

    k ck    nn (    ++=

    6ondereaintervalului k ,

    .L

    k n

    Drecventarelativa,

    100

    .LL   k k 

    nn   =

    Drecventaa%soluta,

    L

    L

    '00 k 

    k k 

    n

    nnn

    ⋅=

    =⋅=

    1 1'-2' de zile   ==   ..  L

    1L n ( ck 

    2'.2'.   =

    L

    1n0,2' =

    1n12'

    2 2'-"' de zile  =+=   ...   L2

    L

    1

    L

    2   nn ( c)'.

    =.L2n'0.

    =L2n0,'0

    =2n2'0

    " "'-*' de zile  =++=   ...   L"L

    1

    L

    "   nn ( c+'.

    =.L"n10.

    =L"n0,10

    ="n'0

    * *'-'' de zile  =++=   ...   L*

    L

    1

    L

    *   nn ( c".

    =.L*n+.

    =L*n0,0+

    =*n*0

    ' ''-(' de zile  =++=   ...   L'

    L

    1

    L

    '   nn ( c

    +.

    =.L'n

    '.

    =L'n

    0,0'

    ='n

    2'

    =.L1n

  • 8/20/2019 bazele statisticii (1)

    30/38

    ( ('-)' de zile=++=   ...   L(

    L

    1

    L

    (   nn ( c100

    .

    =.L(n2.

    =L(n0,02

    =(n10

    ∑=

    =(

    1

    L.

    k n

    100.

    ∑=

    =(

    1

    L

    k n

    1

    ∑=

    ==(

    1

    '00

    k    nn

    7istri%utia celor '00 de de%itori dupa numarul de zile de intarziere a platii esteurmatoarea serie de distri%utie de $recvente pe intervale&

     Orcrt

    Intervalul k  de variatiea numarului de zilede intarziere a platii

     Oumarul de de%itori$recventa a%soluta!,

    k nCentrul

    k  x

     alintervalului k 

    de variatie

    1 1'-2' de zile

      =1n

    12' de%itori

    =1 x

    20

    2 2'-"' de zile  =

    2n

    2'0=2 x

    "0

    " "'-*' de zile  ="n

    '0=" x

    *0

    * *'-'' de zile  =*n

    *0=* x

    '0

    ' ''-(' de zile  ='n

    2'=' x

    (0

    ( ('-)' de zile  =

    (

    n

    10=

    (

     x

    )0

    ∑=

    ==(

    1

    '00k 

    k    nn

     de%itorib)

    Di# 7istri%utia celor '00 de de%itori dupa numarul de zile de

  • 8/20/2019 bazele statisticii (1)

    31/38

    intarziere a platiiDi# 6oli#onul $recventelor a%solute pentru distri%utia celor 

    '00 de de%itori dupa numarul de zile de intarziere a platilor c)

     Orcrt

    Intervalul k 

     Oumarul de

    de%itori,

    k nCentrul

    k  x  k k    n x   ⋅ ck  (    ( )   k k    n x x   ⋅−

      2

    1 1'-2' de zile

    =1n

    12'

    =1 x

    20

    =⋅   11   n x2500

    =1c ( 125

    ( )   =⋅−   12

    1   n x x

    19220

    2 2'-"' de zile

    =2n2'0

    =2 x"0 7500

    =2c ( 375 1440

    " "'-*' de zile

    ="n'0

    =" x*0 2000

    ="c ( 425 2888

    * *'-'' de zile

    =*n*0

    =* x'0 2000 465 12390,4

    ' ''-(' de zile='n

    2'=' x

    (0 1500 490 19044

    ( ('-)' de zile

    =(n10

    =( x)0

    =⋅   ((   n x700

    =(c ( 500

    ( )   =⋅−  (

    2

    (  n x x

    14137,6

    ∑=

    ==(

    1

    '00k 

    k    nn   ∑=

    =⋅(

    1k 

    k k    n x

    16200

    ( )∑=

    =⋅−(

    1

    2

    k k    n x x

    (69120

    = x32,4

    =2 x s

    138,5170

    ==   2 x x   s s11,7693

    = xv36,33%

    o  Media este'00

    1(200

    (

    1

    (1

    (11 =⋅

    =++

    ⋅++⋅=

    ∑=

    n

    n x

    nn

    n xn x x   k 

    k k 

    , deci*,"2= x

     zile este numarulmediu de zile de intarziere a platilor pentru un de%itor restantier

    o 3ocul medianei este

    ',2'02

    1 =+n

    / primul interval cu proprietatea ca2

    1+≥  n ( ck 

     este

    intervalul 2'-"' de zile, deoarece',2'012'

  • 8/20/2019 bazele statisticii (1)

    32/38

    02,"02'0

    12'',2'0102'   =

    −⋅+=

     zile, adica umatate dintre de%itorii restantieriau intarziat cel putin "0 de zile cu e$ectuarea platilor

    o Intervalul modal este intervalul 2'-"' de zile deoarece are $recventa a%soluta cea mai

    mare{ }(,1,ma82'0 2   ===   k nn k 

    , atunci

    =∆+∆

    ∆⋅+=

    21

    1in$    Mo Mo   - x Mo

    ( ) ( )  +*,2+

    '02'012'2'0

    12'2'0102'   =

    −+−−

    ⋅+=

    zile/ numarul cel mai intalnit de zilede intarziere a platilor celor '00 de de%itori restantieri este de apro8imativ 2

    de zile

    o Felatia in care se #asesc cei trei indicatori ai tendintei centrale este x Me Mo  

  • 8/20/2019 bazele statisticii (1)

    33/38

    iar 0=) 

     pentru unitatile statistice din esantion care nu veri$ica evenimentul $avora%il,mn−

      este numarul de unitati statistice din esantion pentru care nu se veri$ica

    evenimentul $avora%il,*2'=−mn

     de%itori

    @edia varia%ilei alternative este

    1',0'00

    )'===

    n

    m *

    , adica 1'. dintre de%itori auintarziat mai mult de *' de zile

    7ispersia varia%ilei alternative este

    12)',012 = 

      

       −⋅=

    n

    m

    n

    m s *

    , iar a%aterea standard

    "(,01   ≅ 

     

     

     

      −⋅=n

    m

    n

    m s *

    Ex. +. Un cercetător $ace un studiu asupra unor $irme, privind ansele pe care acestea le o$erătinerilor an#aaţi de a promova repede i de a avansa Gn carieră 6entru aceasta el a cuprins Gnstudiu un număr de 20 de companii producătoare de te;nolo#ie de vâr$ i a Gnre#istrat timpulscurs de la an#aarea iniţială a unui salariat Gn $irmă până la prima promovare a acestuiaDirmele au $ost #rupate după mărime, iar datele Gnre#istrate sunt&

    ,-rimeafirmelor

    Num-r de s-pt-mni de la anga&are pn- la primapromovare

    @ici "0/ 2(/ "0/ "2/ "+/ 2*/ "2/ 2+/@edii "*/ "2/ 2'/ "(/ ""@ari *)/ *1/ *"/ *+/ *0/ */ *0

    Se cere&a) să seprecizeze care este #rupa de $irme cu un #rad mai ridicat de omo#enitate/

    b) sa se determine in ce proportie marimea companiei in$luenteaza variatia timpului panala prima promovare a unui salariat

     Rezolvare& a)o 6opulatia statistica este multimea companiilor producatoare de te;nolo#ie de var$o Unitatea statistica este o companie $irma!o Caracteristicile urmarite sunt&

     X  - varia%ila ce arata marimea unei $irme/- varia%ila nenumerica avand r " cate#orii sau variante de raspuns& $irme mici, $irme milocii si

    $irme mari&aceste cate#orii ale varia%ilei R vor determina impartirea populatiei statistice in r  " #rupesi anume&

    .rupa / #rupa $irmelor mici!,

    .rupa 0 #rupa $irmelor milocii!,

    .rupa 1 #rupa $irmelor mari!/- ast$el, varia%ila X , marimea $irmei, se mai numeste si $actor de #rupare

  • 8/20/2019 bazele statisticii (1)

    34/38

    siY  - varia%ila ce arata durata de timp, in saptamani, de la an#aare la prima promovare a unui

    salariat al unei $irme producatoare de te;nolo#ie de var$/- varia%ila numerica de interes

    • 7in .rupa / #rupa $irmelor mici! se selecteaza un su%esantion de volum+1 =n

     $irme pentru care se inre#istreaza valorile varia%ilei ) &

    ?2+/"2/2*/"+/"2/"0/2(/"0>1,1+,1),1(,1',1*,1",12,11,1

      =========n

     * * * * * * * * *

    saptamani

    @edia de selectie de #rupa este

    "0+

    2*0

    1

    1

    ,1

    1

    ,12,11,1

    1

    1

    1 ===+++

    =∑=

    n

     *

    n

     * * * *

    n

     2

     2

    n

     saptamani,dispersia de selectie de #rupa este

    ( ) ( )   ( )  ( )

    2+'),1+11

    1

    1

    2

    1,1

    1

    2

    1,1

    2

    12,1

    2

    11,12

    1

    1

    1 =−

    −=

    −++−+−=

    ∑=

    n

     * *

    n

     * * * * * * s

    n

     2

     2

    n

    ,

    a%aterea standard de selectie de #rupa este2)(2,*2+'),1+211   ===   s s

     saptamani,

    iar coe$icientul de variatie al acestei #rupe este

    .2',1*100"0

    2)(2,*100

    1

    11   =⋅=⋅=

     *

     sv

    • 7in .rupa 0 #rupa $irmelor milocii! se selecteaza un su%esantion de volum'2  =n

     $irme pentru care se inre#istreaza valorile varia%ilei ) &

    ?"","(,2',"2,"*>2,2',2*,2",22,21,2

      ======   n * * * * * * saptamani

    @edia de selectie de #rupa este

    "2'

    1(0

    2

    1

    ,2

    2

    ,22,21,2

    2

    2

    2 ===+++

    =∑=

    n

     *

    n

     * * * *

    n

     2

     2

    n

     saptamani,

    dispersia de selectie de #rupa este

    ( ) ( )   ( )   ( )',1)

    11

    2

    1

    2

    2,2

    2

    2

    2,2

    2

    22,2

    2

    21,22

    2

    2

    2 =−

    −=

    −++−+−=

    ∑=

    n

     * *

    n

     * * * * * * s

    n

     2

     2

    n

    ,

    a%aterea standard de selectie de #rupa este

    1+"",*',1)222   ===   s s

     saptamani,

  • 8/20/2019 bazele statisticii (1)

    35/38

    iar coe$icientul de variatie al acestei #rupe este

    .0),1"100"2

    1+"",*100

    2

    22

      =⋅=⋅= *

     sv

    • 7in .rupa 1 #rupa $irmelor mari! se selecteaza un su%esantion de volum)" =n

     $irme pentru care se inre#istreaza valorile varia%ilei ) &

    ?*0/*/*0/*+/*"/*1/*)>2,"),"(,"',"*,"","2,"1,"

      ========   n * * * * * * * * 

    saptamani

    @edia de selectie de #rupa este

    **)

    "0+

    "

    1

    ,"

    "

    ,"2,"1,"

    "

    "

    " ===+++

    =∑=

    n

     *

    n

     * * * *

    n

     2

     2

    n

     saptamani,

    dispersia de selectie de #rupa este

    ( ) ( )   ( )   ( )"""",1'

    11

    "

    1

    2

    ","

    "

    2

    ","

    2

    "2,"

    2

    "1,"2

    "

    "

    " =−

    −=

    −++−+−=

    ∑=

    n

     * *

    n

     * * * * * * s

    n

     2

     2

    n

    ,

    a%aterea standard de selectie de #rupa este

    1'+,""""",1'2""   ===   s s saptamani,

    iar coe$icientul de variatie al acestei #rupe este

    .+,+100**

    1'+,"100

    "

    ""   =⋅=⋅=

     *

     sv

    Cum coe$icientii de variatie pentru cele trei #rupe sunt mai mici ca "0.-"'., atuncitoate #rupele sunt omo#ene .rupa 1  #rupa $irmelor mari! este mai omo#ena in privintaduratei de timp de la an#aare la prima promovare a unui salariat deoarece are cel mai mic

    coe$icient de variatie12"   vvv  

  • 8/20/2019 bazele statisticii (1)

    36/38

    Di#ura 1 Introducerea datelor si ale#erea "escriptive #tatisticsdin su%meniul Data Analysis

    Dereastra de dialo# este prezentata in Di#ura 2

    Di#ura 2 Dereastra de dialo# pentru "escriptive #tatistics

    9utput-ul consta din urmatorul ta%el, corepunzator prelucrarii datelor din cele trei

    #rupe&

  • 8/20/2019 bazele statisticii (1)

    37/38

    Grupa 1(firme mici)

    Grupa 2 (firme mijlocii)

    Grupa 3(firme mari)

    )ean

    30(

    1 *

    32(

    2 *

    44(

    " *

    *tandard +rror  1,5119 1,8708 1,4800)edian 30 33 43)ode 30 >N? 40

    *tandard eviation

    4,2762(

    2

    11   s s   =4,1833(

    2

    22   s s   =3,9158(

    2

    ""   s s   =

    *a$le Variance18,2857(

    2

    1 s

    17,5(

    2

    2 s

    15,3333(

    2

    " s

    urtosis 0,9406 2,9143 -2,3115*'e/ness 0,5846 -1,5367 0,2332

    ane 14 11 9)ini$u$ 24 25 40)ai$u$ 38 36 49

    *u$

    240(

    ∑=

    1

    1

    ,1

    n

     2

     2 *

    160(

    ∑=

    2

    1,2

    n

     2

     2 *

    308(

    ∑=

    "

    1,"

    n

     2

     2 *

    &ount8(

    1n

    5(2n

    7(

    "n

    b)

    o @edia totala la nivelul intre#ului esantion de volum20"21   =++=   nnnn

      $irme este

    20

    )**'"2+"0

    "21

    ""2211   ⋅+⋅+⋅=++

    ⋅+⋅+⋅=

    nnn

    n *n *n * *

    *,"'=⇒  * saptamani

    o 6e %aza datelor de selectie calculam&• =ariatia dintre #rupe  S um of S 5uares Between .roups!

    ( ) ( ) ( )

    ( ) ( ) ( )   )*,"'**'*,"'"2+*,"'"0   222"

    2"2

    221

    21

    ⋅−+⋅−+⋅−=

    =⋅−+⋅−+⋅−=   n * *n * *n * *SS"

    +,+0+=⇒ SS"

    • =ariatia din interiorul #rupelor  S um of S 5uares W it-in .roups!( ) ( ) ( )

    ( ) ( ) ( )   """",1'1)',1)1'2+'),1+1+

    111   2""2

    22

    2

    11

    ⋅−+⋅−+⋅−==⋅−+⋅−+⋅−=   sn sn snSS' 

    20=⇒  SS' 

    • =ariatia totala

  • 8/20/2019 bazele statisticii (1)

    38/38

    20+,+0+   +=+=   SS' SS"SS6 

    +,10+=⇒ SS6 

    • Coe$icientul de determinatie este"(+,0

    +,10+

    *,*0*2 ===SS6 

    SS" R

    sau, e8primat procentual,

    .+,"(100+,10+

    *,*0*1002.   =⋅=⋅=

    SS6 

    SS" R

     arata ca $actorul de#rupare, tipul companiei, e8plica variatia totala a duratei de timp pana la prima

     promovare in proportie de "(,+., restul de (",2. din variatia totala a timpului sedatoreaza altor $actori care nu au $ost considerati de cercetator

    o 7ispersia de selectie la nivelul intre#ului esantion de volum20=n

     de $irme este

    +"1',')120

    +,10+

    11

    esantionintre#uluinivelullatotala=ariatia2 =−

    =−

    =−

    =n

    SS6 

    n s

     *

    cu o a%atere standard

    (0*),)+"1',')2 ===   * *   s s saptamani,

    iar coe$icientul de variatie este

    .*+,21100*,"'

    (0*),)100   =⋅=⋅=

     *

     sv

      *

     *

    Ex. /. @ana#erul unei a#entii imo%iliare doreste sa e$ectueze o analiza re$eritoare la pretul devanzare zeci mii euro! al caselor din doua zone ale ucurestiului& zona Cotroceni si zona6iata =ictoriei 7atele inre#istrate au $ost prelucrate cu E8cel si s-au o%tinut urmatoarelerezultate&

    Cotroceni Piata Victoriei  

    )ean 38,98 )ean 59,45

    )edian 36,18 )edian 59,8

    )ode 36 )ode 59

    *tandard eviation 12,04 *tandard eviation 17,23

    *a$le Variance 144,93 *a$le Variance 296,88

    urtosis 1,91 urtosis -1,01

    *'e/ness 1,30 *'e/ness 0,09

    ane 53,20 ane 61,37

    )ini$u$ 21,77 )ini$u$ 29,9

    )ai$u$ 74,97 )ai$u$ 91,27

    *u$ 1169,50 *u$ 1783,37

    &ount 30 &ount 30

    a! Caracterizati comparativ celedoua su%colectivitati pe %azaoutput-ului prezentat in

     particular, caracterizaţi

    omo#enitatea i asimetria$iecărei #rupe!/ %! 7eterminati in ce proportie

    zona in$luenteaza pretul devanzare al caselor