cursurile 7 si 8 statistica.pdf

Upload: jason-vlad

Post on 02-Jun-2018

242 views

Category:

Documents


0 download

TRANSCRIPT

  • 8/10/2019 Cursurile 7 si 8 statistica.pdf

    1/16

    1

    STATISTIC

    CURSURILE 7 si 8Msuri statistice descriptive pentru date

    univariate

    - Media si dispersia unei variabile alternative

    - Regula de compunere a variabilitii unei serii mpriten mai multe subserii

  • 8/10/2019 Cursurile 7 si 8 statistica.pdf

    2/16

    2

    Media i dispersia unei variabile de tip alternativ

    Dac variabila este alternativ celor dou variante de

    rspuns li se vor acorda, convenional, valorile numerice1 i 0.

    Datele pot fi sistematizate astfel:

    Varianta de rspuns xi Frecveneni

    Frecvene relative*in

    Afirmativ 1 m fn

    m=

    Negativ 0 n-m fn

    mn=

    1

    Total n 1

  • 8/10/2019 Cursurile 7 si 8 statistica.pdf

    3/16

    3

    Media i dispersia unei variabile de tip alternativ

    Media esteproporia rspunsurilor afirmative (care posed

    caracteristica studiat), n totalul unitilor statistice:

    Dispersia este:

    Dispersia maxim pentru o variabil alternativ este 0,25,(ponderea rspunsurilor afirmative este egal cu cea arspunsurilor negative )

    ( )f

    n

    m

    n

    mnm

    n

    nx

    x iii

    ==+

    ==

    =

    01

    2

    1

    ( ) ( ) ( )( ) ( ) ( )( )ffffffff

    n

    mnfmfss f +=+=

    +== 1111

    01 2222

    22

    ( )ffs f = 12

    5,01 == ff

  • 8/10/2019 Cursurile 7 si 8 statistica.pdf

    4/16

    4

    Exemplu 200 de turiti dintr-o staiune balnear au fost ntrebai

    dac sunt mulumii de serviciile de cazare. Dintreacetia 160 au rspuns afirmativ (m) i 40 negativ.

    Media variabilei alternative este:

    f=m/n=160/200=0,8,

    adic 80% dintre persoanele anchetate (intrebate) suntmulumite de serviciile de cazare.

    Dispersia este:

    ( ) 16,02,08,012 === ffs f

  • 8/10/2019 Cursurile 7 si 8 statistica.pdf

    5/16

    5

    ExempluPentru adecvarea promoiilor la cadourile de srbtori, un magazinrealizeaz un studiu referitor la veniturile clienilor, nivelul sumelor pe

    alocate pentru cadouri si categoria socio-profesional.Datele referitoare la cheltuielile pentru cadouri, in sute lei, nregistratepentru 14 clieni, sunt:

    6,5 2,5 3 3,2 2,2 2,3 3 5 4 5,5 6,5 8 2 7

    Media de selectie 4,3357 sute leiDispersia de selectie 4,1686Abaterea standard 2,0417sute lei

    Coeficientul de variatie 47,09%

  • 8/10/2019 Cursurile 7 si 8 statistica.pdf

    6/16

    6

    Regula de compunere a variabilitii

    Deoarece seria are un grad redus de omogenitate, clienii au fostmprii n 2 grupe, n funcie de categoria socio-profesional astfel:

    Cheltuieli pentru cadouri (sute lei)

    Pensionari (Grupa 1) Salariati (Grupa 2 )2 3

    2,5 5

    3 4

    3,2 5,52,2 6,5

    2,3 8

    6,5

    7

    Pensionari (Grupa 1) Salariati (Grupa 2)Media de selectie 2,5333 sute lei 5,6875 sute lei

    Dispersia de selectie 0,2227 2,7098

    Abaterea standard 0,4719 sute lei 1,6462 sute lei

    Coeficient de variatie 18,63% 28,94%

  • 8/10/2019 Cursurile 7 si 8 statistica.pdf

    7/16

    7

    Regula de compunere a variabilitii

    Consideram ca o unitate statistica este caracterizata de doua variabileXsi Y.

    VariabilaX, in general nenumerica, are rcategorii sau variante de raspuns:Categoria 1, Categoria 2,, Categoria r, care vor determina impartireacolectivitatii generale in rgrupe astfel:

    Grupa 1 (unitatile colectivitatii generale care au ca raspuns Categoria 1 pentru var. X

    Grupa 2 (unitatile colectivitatii generale care au ca raspuns Categoria 2 pentru var. X)

    Grupa r (unitatile colectivitatii generale care au ca raspuns Categoria r pentru var. X)

    Grupele sunt disjuncte iar reuniunea lor este colectivitatea statistica.

    VariabilaXse mai numeste si variabila independenta sau factor de grupare. Cealalta variabila de interes, Y, este variabila numerica, numita si variabila

    dependenta.

    Suntem interesati sa evaluam influenta factorului de grupareXasupra variatieitotale a variabilei numerice Y.

  • 8/10/2019 Cursurile 7 si 8 statistica.pdf

    8/16

    Regula de compunere a variabilitatii Dac populatia statistica este alctuit din mai multe grupe

    componente, variaia total a variabilei numerice Yse poate

    calcula dupa o schem cunoscut sub numele de regula decompunere a variabilitii totale.

    Din fiecare Grupa i, i=1,,r, se extrage cate un subesantion devolum n

    iunitati statistice, pentru care se inregistreaza valorile

    observate asupra variabilei numerice Y.

    Volumul esantionului extras din populatia statistica esten=n1+n2+...+nr

    Abaterea fiecrei valori observate de la media total a seriei de

    date numerice este explicat prin influena factorului degrupare i a altor factori ce acioneaz la nivelul fiecrei grupe.

    Putem cuantifica, astfel, ct din variaia caracteristicii numericestudiate este explicat de factorul de grupare ales.

    8

  • 8/10/2019 Cursurile 7 si 8 statistica.pdf

    9/16

    9

    Regula de compunere a variabilitii

    Dac esantionul de volum neste alcatuit din rsubesantionare extrase din cele rgrupe, volumul

    fiecarui subesantion fiindrin

    i

    ,1, =(

    r

    r

    i

    i nnnnn +++==

    =...

    21

    1 ) se pot determina mediile de selectie degrupa ( iy ) i dispersiile de selectie de grupa (

    2

    is ) astfel:

    Grupele Volumul

    subesantionului

    ( in ) extras din Grupa i

    Valorile

    observate in

    subesantion

    Media de selectie a

    Grupei i

    ( iy )

    Dispersia de selectie a

    Grupei i

    (2

    is )

    Grupa 1 1n 1,12,11,1 ;;; nyyy K

    =

    =

    1

    1

    ,1

    1

    11

    n

    j

    jy

    ny ( )

    =

    =

    1

    1

    21,1

    1

    21

    1

    1 n

    j

    j yy

    ns

    Grupa 22

    n 2,22,21,2 ;;; nyyy K =

    =

    2

    1

    ,2

    2

    2

    1 n

    j

    jyn

    y ( )=

    =

    2

    1

    2

    2,2

    2

    2

    21

    1 n

    j

    j yyn

    s

    M M M MGrupa i

    in

    iniii

    yyy,2,1,

    ;;; K

    ==

    in

    jji

    ii xny 1

    ,

    1

    ( )

    =

    =

    in

    jiji

    ii

    yyn

    s

    1

    2

    ,

    2

    1

    1

    M M M MGrupa r

    rn

    rnrrr

    yyy,2,1,

    ;;; K =

    =

    rn

    j

    jr

    r

    r y

    ny

    1

    ,

    1

    ( )

    =

    =

    rn

    j

    rjr

    r

    r yyn

    s

    1

    2

    ,

    2

    1

    1

  • 8/10/2019 Cursurile 7 si 8 statistica.pdf

    10/16

    10

    Regula de compunere a variabilitii

    Abaterea individual de la media total poate fi descompus astfel:

    ( )yyyyyy iijiji +=

    ,,

    unde:

    r

    rr

    r

    n

    j

    jr

    n

    j

    j

    n

    j

    j

    nnn

    nynyny

    nnn

    yyy

    y

    r

    +++

    +++=

    +++

    +++

    =

    ===

    ...

    ...

    ...

    ...

    21

    2211

    21

    1

    ,

    1

    ,2

    1

    ,1

    21

    este media totala seriei la nivelul intregului esantion de volum n=n1+n2+...+nr.

    Prin ridicarea la ptrat i nsumarea fiecrui termen i folosind proprietile mediei se

    obine:

    ( ) ( ) ( )44 344 2144 344 2144 344 21

    grupedintrevariatia

    1

    2

    grupelorinterioruldinvariatia

    1 1

    2

    ,

    totalavariatia

    1 1

    2

    , == == =

    +=

    r

    i

    ii

    r

    i

    n

    j

    iji

    r

    i

    n

    j

    ji nyyyyyy

    ii

  • 8/10/2019 Cursurile 7 si 8 statistica.pdf

    11/16

    Regula de compunere a variabilitatii

    11

    Se noteaz:

    SSW

    = Sum of Squares Within groupssau

    variatia din interiorul grupelor,adica suma patratelor abaterilor individuale de la mediile de grup

    ( )

    ( ) ( ) ( )

    ( ) ( ) ( ) 2222

    2

    11

    1

    2,

    1

    22,2

    1

    21,1

    1 1

    2

    ,

    1...11

    ...

    21

    rr

    n

    j

    rjr

    n

    j

    j

    n

    j

    j

    r

    i

    n

    j

    iji

    snsnsn

    yyyyyy

    yySSW

    r

    i

    +++=

    +++=

    =

    ===

    = =

    SSB= Sum of Squares Between groups sau variatia dintre grupe,

    adica suma patratelor abaterilor mediilor de grupa de la media totala

    ( )

    ( ) ( ) ( ) rr

    r

    i

    ii

    nyynyynyy

    nyySSB

    +++=

    ==

    2

    2

    2

    21

    2

    1

    1

    2

    ...

  • 8/10/2019 Cursurile 7 si 8 statistica.pdf

    12/16

    12

    Regula de compunere a variabilitii

    SST= Sum of Total Squares sau variatia totala,adica suma patratelor abaterilor individuale ale tuturor valorilor observate in esantion

    fata de media totala

    ( )

    SSBSSWSST

    yySSTr

    i

    n

    j

    ji

    i

    +=

    == =1 1

    2

    ,

  • 8/10/2019 Cursurile 7 si 8 statistica.pdf

    13/16

    13

    Regula de compunere a variabilitii

    Relaia SST= SSW+ SSB

    -

    se numete REGULA DE COMPUNERE A VARIABILITII TOTALEsau identitatea fundamentala a analizei dispersionale

    -

    permite determinarea dispersiei de selectie a esantionului de volum ndupaformula

    1

    2

    =

    n

    SSTs

    y

    -

    permite determinarea msurii n care factorul de grupare influeneazvariaia caracteristicii studiate prin calculul coeficientului dedeterminaie:

    SST

    SSB

    R =2

    sau, n expresie procentual, gradul de determinaie:

    1002

    % =

    SST

    SSBR

  • 8/10/2019 Cursurile 7 si 8 statistica.pdf

    14/16

    14

    Regula de compunere a variabilitii

    Dac variatia dintre grupe SSB are o pondere mai mare n

    variatia total SSTatunci nseamn c factorul de grupareexplic mai mult variaia caracteristicii studiate.

    Dac variatia din interiorul grupelor SSW are o ponderemai mare n variatia total SSTatunci nseamn c variaia

    caracteristicii studiate este influenat de ali factori

    Se poate calcula coeficientul/gradul de nedeterminaie:

    22

    1 RSST

    SSW

    K ==2

    %

    2

    % 100100 RSST

    SSW

    K ==

  • 8/10/2019 Cursurile 7 si 8 statistica.pdf

    15/16

    15

    Exemplu - continuare

    Pentru a analiza n ce proporie categoria socio-profesional influeneaz variaia

    cheltuielilor pentru cadouri se determin:

    Grupa Volumulsubesantionuluiniextras din Grupa i

    Media de selectie aGrupei i

    ( iy )

    Dispersia deselectie a Grupei i

    ( 2is )

    Grupa 1

    (Pensionari)

    n1=6 =1

    y 2,5333 sute lei =2

    1s 0,2227

    Grupa 2 (Salariati) n2=9 =2

    y 5,6875 sute lei =2

    2s 2,7098

    Variatia din interiorul grupeloreste:

    ( ) ( ) ( )

    ( ) ( ) ( ) ( )

    0821,20

    7098,2182227,01611 2

    22

    2

    11

    8

    1

    2

    2,2

    6

    1

    2

    1,1

    2

    1 1

    2

    ,

    =

    +=+=

    =+== === =

    SSW

    snsn

    yyyyyySSW

    j

    j

    j

    j

    i

    n

    j

    iji

    i

  • 8/10/2019 Cursurile 7 si 8 statistica.pdf

    16/16

    Exemplu - continuare

    16

    Media totalala nivelul intregului esantion de volum n=n1+n2=14 clienti este

    14

    7,60

    86

    86875,565333,2

    21

    2211

    =+

    +

    =+

    +

    =nn

    nyny

    y

    3357,4= y sute lei.

    Variatia dintre grupeeste

    ( )

    ( ) ( )

    1101,34

    8)3357,46875,5(6)3357,45333,2( 222

    221

    21

    2

    1

    2

    =

    +=

    =+=

    ===

    SSB

    nyynyy

    nyySSBi

    ii

    Variatia totalaeste SST=SSW+SSB=20,0821+34,1101, deci SST=54,1922

    Coeficientul de determinatie este6294,0

    1922,54

    1101,342===

    SST

    SSBR

    sau %94,622

    % =R , categoria socio-profesionala influenteaza variatia cheltuielilor cu cadourile in

    proportie de 62,94%, restul de 37,06% din variatia totala a cheltuielor cu cadourile fiind influentata

    de alti factori.