legaturi statistice intre variabile

Upload: adina-mihaela

Post on 27-Feb-2018

317 views

Category:

Documents


4 download

TRANSCRIPT

  • 7/25/2019 Legaturi statistice intre variabile

    1/25

    1

    CURS STATISTIC- Unitatea de nvarenr. 9

    LEGTURI STATISTICE DINTRE VARIABILE

    Cuprins:

    1.Noiuni introductive privind legturile statistice dintre variabile.

    2. Tipuri de legturi statistice

    3. Metode simple de stabilire a existenei i a formei de legtur dintre fenomenele i

    procesele economico-sociale

    4. Metode analitice parametrice de msurare a legturilor dintre fenomene i procese

    economico-sociale

    5. Metode neparametrice de msurare a legturilor dintre fenomene

    6. Teste de autoevaluare

    7. Rspunsuri i comentarii la testele de autoevaluare.

    8. Teme de control.

    9. Rezumatul unitii de nvare.

    10. Bibliografia unitii de nvare.

    1. Noiuni introductive privind legturile statistice dintre variabile

    Teoria economic actual, cu ajutorul creia caracterizm i analizm funcionarea

    legturilor mecanismului economic, pune n eviden multiplele interdependene care se

    manifestn activitatea economic. Fundamentarea deciziilor de politic economic i social

    trebuie s in seama deastfel de dependene n egalmsurca fundamentarea deciziilor la

    nivelul agentului economic. De aceea, selectarea dependenelor care au caracter de stabilitate

    i msurarea acestora a constituit o preocupare prioritar a teoriei i cercetrii economice.

    Asupra fenomenelor social-economice acioneaz o multitudine de factori, principali i

    secundari, eseniali i neeseniali, cuantificabili i necuantificabili sau cuantificabili cu

    aproximaie, care se gsesc ntr-o relaie de interdependen reciproc.

  • 7/25/2019 Legaturi statistice intre variabile

    2/25

    2

    2. Tipuri de legturi statistice

    Legturile ce se pot forma sunt legturi stohastice, n care un fenomen este factor de

    influenta, iar cellalt este efect. Statistica, printr-o gam larg de procedee i metode

    specifice, poate studia manifestarea concret a acestor legturi, le poate exprima cantitativ i

    msura intensitatea cu care se produc. Legtura (dependena) statistic se caracterizeaz prin

    faptul c, la modificarea unui factor de influen, factorul influenat rspunde cu o distribuie

    de valori.

    Legturile statistice se pot clasifica astfel:

    1) Dup natura relaiei de cauzalitate distingem:

    a) legturi funcionale. Acestea se manifest ntre dou fenomene n care unul este cauza iarcellalt efectul. Se ntlnesc n natur, tehnic etc. Dac senoteaz fenomenul cauz cu x i

    fenomenul efect cu y atunci relaia matematic este: y = f(x)

    b) legturi statistice(stohastice) apar atunci cnd fenomenul efect este rezultatul combinrii

    influenei mai multor cauze, care pot aciona n condiii egale sau diferite. Relaia matematic

    este: y = f(x1,x2,..,xn), unde: x1, x2, ..., xn sunt valorile fenomenelor cauz care au

    fost nregistrate; y = valorile fenomenului efect.

    Exemplu

    O legatura stohastica este legtura dintre capacitatea de cazare (xi) i valoarea ncasrilor din

    activitatea hotelier (yi). ntre cele dou caracteristici exist o legtur statistic pentru c

    asupra ncasrilor acioneaz i alte cauze: tarifele practicate, gradul de confort etc.

    2) Dup numrul de caracteristici incluse n modelul de corelaie distingem:

    a) legturi simple. Acestea au la baz dou caracteristici: una factorial, iar cealalt

    rezultativ (celelalte caracteristici factoriale chiar dac sunt nregistrate se consider cu

    aciune constant).

    Exemplu

    Un exemplu de legtura simpla este cea dintre suprafaa comercial i valoarea vnzrilor.

    b) legturi multiple. Acestea au n vedere dependena unei caracteristici rezultative n funcie

    de mai muli factori nregistrai sau dependena mai mulor variabile rezultative (y1, y2, .. ,

  • 7/25/2019 Legaturi statistice intre variabile

    3/25

    3

    yn) de o variabil factorial (xi). Ecuaiile de estimare sunt: y = f(x1, x2, x3,...,xn) i y1, y2,...,

    yi,...yn = f(xi).

    Exemplu

    Un exemplu de legtura multipleste cea dintrevaloarea ncasrilor ce depinde de zona de

    amplasare (x1), de categoria de confort (x2), de baza material (x3) etc.

    3) Dup direcia legturii distingem:

    a) legturi directe (pozitive): exist atunci cnd, pe msur ce se modific nivelul de

    dezvoltare al caracteristicii factoriale, se modific n acelai sens i nivelul caracteristicii

    rezultative.

    b) legturi inverse (negative):au n vedere modificri n sens contrar nivelului de dezvoltare

    (o variabil crete iar cealalt scade).

    4) Dup forma de exprimare a variabilelor corelate distingem:

    a) legturi de asociere. Acestea exprim relaia dintre dou sau mai multe caracteristici

    exprimate calitativ (prin cuvinte) sau ntr-o caracteristic calitativ i una cantitativ

    (exprimat numeric).

    b) legturi de corelaie. Exprim relaia de interdependen dintre dou sau mai multe

    caracteristici statistice exprimate numeric.

    5) Dup forma de realizare a legturii distingem:

    a) legturile liniareexprimate printr-o funcie liniar, de gradul intai;

    b) legturile neliniareexprimate printr-o curb (exponenial, parabol, hiperbol etc.);

    6) Dup timpul n care se realizeaz:

    a) legturi sincrone:au loc n acelai timp i se pot urmri n dinamic pentru aceeai

    perioad.

    Exemplu

    O astfel de legatura este legtura dintre dinamica desfacerilor de mrfuri i dinamica

    ctigului mediu salarial.

    b) legturi asincrone: influena caracteristicilor factoriale asupra variaiei caracteristicii

    rezultative apare dup trecerea unei perioade de timp. Forma de realizare a legturii

    corespunde funciei matematice de regresie (de estimare) care se alege pe baza graficului de

    corelaie (corelogramei).

  • 7/25/2019 Legaturi statistice intre variabile

    4/25

    4

    3. Metode simple de stabilire a existenei i a formei de legtur dintrefenomenele i procesele economico-sociale

    Pentru a caracteriza legtura dintre fenomene, se pot folosi mai multe procedee ce se

    ncadreaz n categoria metodelor simple de caracterizare a legturilor. Aceste metode sunt

    uor de aplicat i se bazeaz pe analiza calitativ a variabilelor corelate, oferind informaii

    asupra naturii i trsturilor eseniale ale legturii cercetate.

    Metodele simple de caracterizare a legaturilor stohastice sunt urmatoarele:

    1)Metoda seriilor paralele interdependenteare la baz serii paralele de date, obinute prin

    operaia de centralizare la nivelul unitilor simple sau complexe, fr a fi grupate. Se pot

    folosi serii: de timp, de spaiu i atributive.Aceast metod ne ofer posibilitatea de a stabili

    existena legturii i direcia de realizare a acesteia, prin analiza valorilor perechii x, y.

    Aceast metod este mai puin sugestiv n cazul seriilor formate dintr-un numr foarte mare

    de termeni i implic ntr-o msur important subiectivismul cercettorului.

    2)Metoda grupriloreste o metod de sistematizare a datelor pe baza creia se pot cerceta

    legturile (conexiunile) statistice. Se poate folosi gruparea simpl sau gruparea combinat.

    Exemplu

    Despre 22 de salariai ce activeaz n ramura comerului se cunosc datele:

    Gruparea salariailor dupvechime

    Numr salariaiValoarea ncasrilor

    (mil lei)

    < 5 2 80

    5 - 10 5 83

    10 - 15 7 85

    15 - 20 5 87

    > 20 3 89

    Gruparea simpl presupune gruparea unitilor statistice dup o caracteristicprincipal de grupare i calculul i interpretarea mediilor pariale sau a mrimilor relative

    pariale pentru caracteristica rezultativ. Gruparea combinat se bazeaz pe mprirea

    unitilor statistice n grupe concomitente dup variaia a dou caracteristici de grupare (x,y),

    iar rezultatele gruprii se prezint ntr-un tabelul combinat cu dubl intrare (vezi capitolul II).

    Metoda gruprii trebuie utilizat doar n cazul unui numr mare de observaii statistice, cnd

    aplicarea metodelor analitice de calcul nu se poate face fr o grupare prealabil a datelor

    nregistrate.

  • 7/25/2019 Legaturi statistice intre variabile

    5/25

    5

    I-legtu

    r

    directII-legtur

    inversI-legtu

    r

    directII-legtur

    invers

    3) Metoda tabelului de corelaie presupune utilizarea unui tabel combinat cu dubl

    intrare care ne sugereaz existena legturii, direcia de realizare a ei i unele aprecieri

    empirice privind intensitatea legturii prin analiza modului n care frecvenele comune (nij) se

    distribuie n rubricile interioare ale tabelului. Dac frecvenele n ij tind a se concentra ctre

    cele dou diagonale trasate n tabelul urmtor,legtura ntre xii yjva fi intens. n schimb,

    dac se mprtie la ntmplare n reeaua tabelului, legtura este slab sau poate lipsi. n

    concluzie, procedeul tabelului de corelaie este o combinare a metodei gruprii cu

    principiile de construire i interpretare a unei reprezentri grafice.

    xi \ yj y1, y2, .... yj ... yp Total

    xr

    xr-1

    :

    xi

    :

    x2

    x1

    nij

    nr

    nr-1

    :

    ni

    :

    n2

    n1

    Total n1, n2, .... nj ... np

    4) Metoda grafic. Graficul de corelaie se mai numete corelogram. Pentru

    construcia acestuia se utilizeaz sistemul de axe rectangulare, unde pe axa OX se nscriu

    valorile caracteristicii principale de grupare (x), iar pe axa OY valorile caracteristicii

    secundare de grupare (y). Intersecia abscisei cu ordonata se concretizeaz printr-un numr de

    puncte ce se dispun sub form de nor, numrul punctelor fiind egal cu numrul de uniti

    statistice luate n calcul. Dup modul de distribuire a punctelor n reeaua graficului, printre

    acestea se traseaz vizual o dreapt sau o curb ale crei ecuaii se cunosc. n cazul n care

    curba sau dreapta se traseaz pe prima diagonal, legtura este direct, dac se traseaz peceade a doua diagonal, legtura este invers.Metoda grafic se utilizeaz ca metod empiric

    pentru alegerea funciei matematice ce se analizeaz n cazul regresiei i corelaiei statistice.

    4. Metode analitice de msurare a legturilor dintre fenomene

    Metodele analitice iau n consideraie valorile reale ale varibilelor corelate i parametriicorespunztori acestora. Acestea poart denumirea de metode parametricei sunt:

  • 7/25/2019 Legaturi statistice intre variabile

    6/25

    6

    1) metoda regresiei;

    2) metoda covarianei;

    3) metoda raportului de corelaie;

    4) metoda coeficientului de corelaie;

    5) metoda analizei dispersionale.

    1)Metoda regresieireprezint o metod statistic de analiz a legturii dintre variabile cu ajutorul

    unor funcii, numite funcii de regresie. Funcia de regresie se alege printr-o modalitate empiric

    folosind graficul de corelaie (corelograma) siprin aplicarea testelor de semnificaie (de exemplu:

    testul F de analiz dispersional). n funcie de numrul de variabile incluse n model,

    distingem: regresie unifactorial (o varibil factorial xi i o variabil rezultativ yi) i

    regresie multifactorial (mai multe variabile factoriale i o singur variabil rezultativ).

    a)Regresia unifactorial liniarare la baz ecuaia dreptei (funcia de gradul nti):

    ix bxay i+=

    De menionat c dependena liniar dintre yi i xi se consider o dependen

    stohastic n care unei valori xi i pot corespunde mai multe valori yi. Funcia yxi =

    valorile ajustateale lui yi dup ecuaia dreptei i presupune nlocuirea valorilor empirice cu

    valori teoretice obinute prin calcul n urma aplicrii unei metode sau unui model de calcul

    statistic; xi = variabila factorial; yi = variabila rezultativ; a, b = parametrii ecuaiei de

    regresie care pot fi interpretai n sens geometric i n sens statistic. Parametrul a

    exprim n sens geometric ordonata la origine i poate lua att valori pozitive, ct i valori

    negative. Are caracter de mrime medie, n sensul c valoarea sa arat la ce nivel ar fi ajuns

    valoarea caracteristicii yi dac toi factorii mai puin cel nregistrat xi ar fi avut o

    aciune constant.Parametrul b exprim n sens geometric panta liniei drepte i poart

    denumirea de coeficient de regresie. Msoar cu ct se modific n medie variabila rezultativ

    (yi) dac variabila factorial (xi) se modific cu o unitate (semnul lui b ne indic direcialegturii).Parametrii a i b se determin din sistemul de ecuaii normale obinut prin metoda

    celor mai mici ptrate, care se bazeaz pe minimizarea ptratelor abaterilor dintre valorile

    individuale nregistrate i valorile teoretice (corespunztoare funciei). Aceast funcie

    obiectiv presupune identificarea punctului de extrem (are n vedere determinarea parametrilor

    funciei) si verificarea dac punctul de extrem este minim sau maxim (se realizeaz prin

    semnul derivatei de ordinul II dac este pozitiv (semnific minim) dac este negativ

    (semnific maxim). Relaia de minimizare este: 2xi )yy( i = minim. Pentru tendina liniar

  • 7/25/2019 Legaturi statistice intre variabile

    7/25

    7

    a legturii avem: = 2ii )bxay(f = minim. In functia de mai sus condiia de minim a unei

    funcii de dou derivabile se anuleaz cnd derivatele pariale, n raport cu cei doi parametri

    (a, b), sunt: 0)1)(bxay(2da

    dfii == si 0)x)(bxay(2

    db

    dfiii ==

    =+

    =+

    ii2ii

    ii

    yxxbxa

    yxbna; i = n,1 . Rezolvand sistemul se calculeaza termenul liber, a, si panta

    dreptei, b, dupa metoda determinantilor, astfel:

    ==

    =

    2i

    2i

    iii2ii

    2ii

    i

    2iii

    ii

    )x(xn

    yxxxy

    xx

    xn

    xyx

    xy

    aa

    ;i= n,1

    ==

    =

    2i2i

    iiii

    iii

    i

    iii

    i

    )x(xn

    yxyxn

    yxx

    xn

    yxx

    yn

    bb

    ; i = n,1

    Interpretarea pantei: daca b > 0 legtura de corelaie este direct (pe msur ce

    cresc valorile lui xicresc i valorile ecuaiei de regresie calculate); daca b < 0 legtura de

    corelaie este invers (pe msur ce crete valoarea caracteristicii factoriale (xi) scade valoarea

    caracteristicii rezultative (yi) si daca b = 0 cele dou variabile sunt independente i yxi= 0.

    Funcia de regresie exprim statistic modul n care caracteristica rezultativ (yi) se modific,

    dac ar influena numai caracteristica factorial (xi), iar ceilali factori sunt considerai cuaciune constant.

    a) y b) y

    yxi= -a +bxi yxi= a - bxi

    tg x tg x

    a < 0 i b > 0 legtur direct a > 0 i b < 0 legtur invers

    figura 1.1 figura 1.2

    c) y d) y

    yxi= a yxi= bxi

    a > 0 i b = 0 lipsa legturii a = 0 i b > 0 legtur funcional

    figura 1.3 figura 1.4

  • 7/25/2019 Legaturi statistice intre variabile

    8/25

    8

    Fig. 1 Interpretarea geometric a parametrilor

    Regresia unifactorial liniar se utilizeaz n urmtoarele cazuri:pentru un numr mic de

    informaii negrupate, dar prezentate sub forma a dou serii paralele interdependente (x i i yi) caz

    prezentat anterior sipentru un numr mare de informaii sistematizate pringrupare simpl(x i,yi, nivalori cunoscute) sigrupare combinat(yj, ni, nj, nij, xivalori cunoscute).

    Pentru cazul (1) (grupare simpl) sistemul de ecuaii normale se determin prin analogie

    cu cel prezentat anterior, cu deosebirea c se va ine seam de frecvenele comune (ni) pentru

    cele dou varibile xii yi. Sistemul de ecuaii normale este:

    =+

    =+

    iiii2iii

    iiiii

    nyxnxbnxa

    nynxbna

    2iii

    2ii

    iiiiiiii2i

    )nx(nxn

    nyxnxnynxa

    =

    2iii

    2ii

    iiiiiiii

    )nx(nxn

    nynxnyxn

    b

    =

    Pentru cazul (2) (grupare combinat) rezultatele se prezint ntr-un tabel combinat cu

    dubl intrare, iar sistemul de ecuaii se determin prin analogie cu cel de la cazul (1):

    =+

    =+

    K

    i

    m

    jijji

    K

    ii

    2i

    K

    iii

    m

    jjj

    K

    iii

    K

    i

    m

    jij

    nyxnxbnxa

    nynxbna

    Din rezolvarea sistemului de ecuaii normale se obin formulele uzuale de calcul al

    parametrilor a i b. Legturile dintre fenomene nu se bazeaz mereu pe modele simple de

    regresie pentru c pot exista mai multe variabile factoriale i o singur variabil rezultativ de

    forma: y = f(x1, x2,,xi, , xn). Asemenea legturi poart denumirea de modele de

    regresie multifactoriale care au la baz funcia: liniar, exponenial, hiperbolic, parabolic.

    2) Metoda covarianei se utilizeaz pentru msurarea intensitii legturilor de tip

    statistic ntre dou sau mai multe variabile la nivelul ntregii colectiviti.Covarianaeste un

    indicator sintetic de corelaie simbolizat prin cov(x,y), se obine ca o medie aritmetic a

    produselor abaterilor variabilelor fa de media lor conform relaiei:

    yx

    n

    1iii

    )y,xcov(

    )yy)(xx(n

    1)y,xcov(

    = = . Semnul indicatorului arat direcia legturii: plus (legtura

    direct), minus (legtura indirect), iar covariana nul ne indic lipsa legturii de corelaie

    (variabilele sunt independente). Covariana are ca neajuns faptul c depinde de unitile n

    care se msoar variabilele aleatoare.

    3)Metoda raportului de corelatie

  • 7/25/2019 Legaturi statistice intre variabile

    9/25

    9

    Pentru stabilirea intensitii legturii dintre dou varibile (x i, yi) se calculeaz un

    indicator sintetic de corelaie numit raport de corelaie simbolizat cu Rx/y. Acesta permite

    msurarea gradului de intensitate a realizrii legturii dintre caracteristica considerat factor

    de influen (xi) i caracteristica rezultativ (yi), indiferent de forma legturii: liniar sau

    neliniar.Calculul se bazeaz pe descompunerea variaiei totale (dispersiei) a caracteristicii

    rezultative y astfel:

    )yy( 0i = )yy( ixi + )yy( 0xi

    abaterea ntmpltoare

    abaterea sistematic

    Prin nsumare i ridicare la ptrat se obine:

    =+= 20xxi

    2

    0i )]yy()yy[()yy(

    ii

    ++ 2

    00

    2

    )())((2)(0

    yyyyyyyy iiii xxxixi

    n

    )yy(

    )yy(

    20i

    20i

    =

    =

    n

    )yy(

    )yy(

    2xi

    2xi

    i

    i

    +

    +

    n

    )yy(

    )yy(

    20x

    20x

    i

    i

    2y =2

    ry +

    2

    xy

    Dispersia total: arat

    influena tuturor factorilor

    eseniali i ntmpltori

    care determin

    variaia total a variabilei

    rezultative yi

    Dispersia rezidual: arat

    acea parte din variaia

    variabilei rezultative yi

    datorat aciunii factorilor

    ntmpltori

    Dispersia sistematic:

    arat influena factorului

    xi asupra variaiei

    caracteristicii

    rezultative yi

    Raportul de corelaie se determin pornind de la regula de adunare a dispersiilor

    (prezentat anterior), utiliznd coeficientul de determinaie ( 2 x/yR ) i coeficientul de

    nedeterminaie ( 2 x/yK ): 100R 2y

    2x/y2

    x/y

    = si 100K

    2y

    2r/y2

    r/y

    = . Raportul de corelaie se

    calculeaz ca rdcin ptrat din coeficientul de determinaie astfel:

    =

    /

    /

    =

    =

    =

    ==

    n

    )yy(

    n

    )yy(

    1

    )2(

    1

    )1(

    RR2

    0i

    2xi

    2y

    2r/y

    2y

    2r/y

    2y

    2y

    2x/y2

    x/yx/y

    i

    )3(

    2

    0

    2

    )(

    )(1

    yy

    yy

    i

    xi i ; i = n,1

  • 7/25/2019 Legaturi statistice intre variabile

    10/25

    10

    Formula de calcul simplificat a raportului de corelaie se determin astfel:

    n

    )y(y

    yxbyay1R

    2

    i2i

    iii2i

    x/y

    =

    ; i = n,1 . Raportul de corelaie ia valori n intervalul [0,1]

    = 0 lips de legtur (varibilele sunt necorelate) 0 legatur foarte slab sau poate lipsi

    Ry/x[0,1] = 1 legtur de tip funcional, variabila yi depinde n

    exclusivitate de variabila xi

    1 legtur puternic, intens

    n cazul legturilor de tip invers, semnul raportului de corelaie este dat de ctre semnul

    coeficientului de regresie (b). n funcie de informaiile folosite n calcul i de modelul lor de

    sistematizare, raportul de corelaie se calculeaz n urmtoarele dou cazuri:1) Numr mic de informaii, n care se dau valorile xi, yi, caz n care Ry/xse calculeaz

    dup formulele 1,2,3, explicitate anterior;

    2) Numr mare de informaii:

    a) se dau valorile lui xi, yii nifrecvenele lor comune:

    =

    i2

    i

    i2

    xi

    x/yn)yy(

    n)yy(1R i ; i = n,1

    =

    i

    2ii

    i2i

    iiiiii

    2

    i

    n

    )ny(ny

    nyxbnyany1 ; i = r,1

    b) se dau valorile lui xi, frecvenele dup variabila xi(ni), frecvenele dup variabila

    yj(nj) i frecvena comun nij:

    =

    =

    j2

    0j

    ij2

    xjx/y

    n)yy(

    n)yy(1R i

    =

    j

    2jj

    j2j

    ijjijjj

    2

    j

    n

    )ny(ny

    nyxbnyany1 ; j = m,1 ; i = K,1

    4)Metoda coeficientului de corelaie

    Coeficientul de corelaie este un indicator sintetic prin care se msoar legtura dintre

    dou variabile (xi, yi) statistice a cror distribuie este asimptotic normal sau normal.

    Calculul coeficientului de corelaie se bazeaz n forma iniial pe produsul abaterilor normale

    normate (pentru un numr de date individuale negrupate):

  • 7/25/2019 Legaturi statistice intre variabile

    11/25

    11

    y

    iy

    x

    ix

    yyZ

    xxZ

    =

    =

    Coeficientul de corelaie se calculeaz ca o medie a produselor abaterilor normale

    normate:

    yx

    iiy

    i

    x

    i

    x/yn

    )yy)(xx(

    n

    yyxx

    r

    =

    =

    ; i = n,1

    Dac n relaia (1) vom nlocui:n

    xx i= ;

    n

    yy i

    = ; i = n,1 ;

    n

    )xx( 2ix

    = i

    n

    )yy( 2iy

    = se obine relaia: ry/x=

    ])y(yn][)x(xn[

    yxyxn

    2i

    2i

    2i

    2i

    iiii ; i = n,1 (2)

    Folosind covariana: ry/x=ii yx

    ii )y,xcov(

    Interpretare:

    1) ry/x [-1,1] apreciem din punct de vedere al semnului direcia legturii i din

    punct de vedere al mrimii intensitatea legturii.

    Dac: ry/x = 0 legtura lipsete i variabilele xii yisunt independente;

    ry/x 0 legtura dintre cele dou varibile este slab;

    ry/x= 1 legtur de tip funcional (fie direct dac semnul coeficientului este

    pozitiv, fie invers dac semnul coeficientului este negativ);

    ry/x 1 variabilele sunt puternic corelate, legtura fiind intens.

    2) ry/x = Ry/x se aprecieaz c legtura de corelaie este de forma liniar, ceea ce

    nseamn c se poate folosi fie coeficientul, fie raportul de corelaie.

    3) Valoarea coeficientului de corelaie depinde de forma liniei de regresie, motiv pentru

    care acest indicator este semnificativ pentru corelaiile de tip liniar i mai puin semnificativ

    pentru corelaiile de tip neliniar (n cazul din urm folosindu-se raportul de corelaie).

    4) n cazul legturii liniare se mai poate calcula ca o medie geometric a coeficienilor

    de regresie (b) astfel:

    y/xx/yx/y bbr =

  • 7/25/2019 Legaturi statistice intre variabile

    12/25

    12

    unde:

    2i

    2i

    iiiiy/x

    2i

    2i

    iiiix/y

    )y(yn

    yxyxnb

    )x(xn

    yxyxnb

    =

    =

    ; i = n,1

    Coeficientul de corelaie se calculeaz n funcie de datele folosite n analiz i de moduln care au fost sistematizate informaiile. Astfel:

    a) - numr mic de informaii n care se dau valorile lui xi, yi sub forma a dou serii

    paralele; ry/xse calculeaz dup formula (1), (2) i (3) prezentate anterior.

    b) - numr mare de informaii, cunoscndu-se xi, yi i frecvenele lor comune (ni)

    =

    yxi

    iiix/y

    n

    n)yy)(xx(r ; i = n,1

    unde:

    ====i

    i2

    iy

    i

    i2

    ix

    i

    ii

    i

    ii

    n

    n)yy(;

    n

    n)xx(;

    n

    nyy;

    n

    nxx ; i = n,1

    nlocuind n formula (1) a lui ry/xse obine:

    ])ny(nyn][)nx(nxn[

    nynxnyxnr

    2iii

    2ii

    2iii

    2ii

    iiiiiiii

    x/y

    = ; i = n,1

    c) se cunosc valorile lui xi, yj, ni, nj, nij, obinute prin gruparea combinat, rezultatul

    fiind prezentat ntr-un tabel combinat cu dubl intrare i atunci relaia de calcul devine:

    ])ny(nyn][)nx(nxn[

    nynxnyxn

    r2

    jjj2jj

    2iii

    2ii

    jjiiij

    i

    ji

    j

    ij

    x/y

    = ;m,1j

    n,1i

    =

    =

    5)Metoda analizei dispersionale. Raportul de determinare

    O modalitate eficient folosit n caracterizarea conexiunilor este metoda analizei

    dispersionale(metoda coeficientului de determinare), care se poate folosi n mai multe cazuri

    i anume: la verificarea independenei unui fenomen comercial sau turistic, la verificarea

    stabilitii mediei i dispersiei pentru mai multe eantioane succesive, la verificareadependenei unui fenomen comercial sau turistic de factorii si de influen . Dac analiza

    dispersional se utilizeaz dup aplicarea corelaiei statistice, atunci aceasta este considerat o

    metod prin care se testeaz semnificaia curbei (funciei) de regresie explicitate.Analiza

    dispersional are la baz metoda gruprii, prin care unitile observate se separ n grupe dup

    variaia caracteristicii de grupare (considerat factor de influen).Aplicarea acesteia are la baz

    gruparea combinat (dup cele dou variabile x ii yj). Poate fi utilizat att ca metod simpl

    de caracterizare a corelaiilor, prin care se stabilete dac variabila factorial influeneaz

    semnificativ variabila rezultativ, dar i ca metod analitic de combinare a acesteia cu

  • 7/25/2019 Legaturi statistice intre variabile

    13/25

    13

    analiza regresiei. Analiza dispersional se poate utiliza n urmtoarele situaii: nainte de

    aplicarea metodei corelaiei, caz n care se poate verifica gradul de semnificaie a factorului

    considerat principal pentru producerea variaiei caracteristicii rezultative si dup utilizarea

    metodei regresiei i corelaiei, caz n care se poateverifica corectitudinea funciei matematice

    cu ajutorul creia s-au estimat valorile caracteristicii rezultative n raport cu variaia

    caracteristicii factoriale.

    Pentru prezentarea modelului analizei dispersionale prin care se testeaz forma de

    legtur,pornim de la variaia total a varibilei (Y) care se descompune n urmtoarele trei

    elemente: (yj- 0y ) = (yj- iy ) + ( iy - yxi) + (yxi- 0y ),

    unde: 0y = media total a variabilei Y

    yj= valorile variabilei Y

    iy = mediile condiionate ale variabilei Y

    Yxi= valorile ajustate ale variabilei Y n funcie de X

    Calculul raportului de determinare se bazeaz pe descompunerea variaiei seriei de

    date y1,,yT n funcie de influena factorilor inclui n modelul de regresie i factori aleatori

    nenregistrai: = 2)( yySST i ; relaia anterioara cuantific dispersia seriei valorilor

    variabilei endogene sub aciunea tuturor factorilor de inferen. Influena factorilor de

    regresie este data de ==

    22)( ii eyySSE . Pe baza abaterilor menionate se calculeaz

    dispersiile medii corelate ale variabilei Y, respectiv dispersia total S2y, dispersia n postura

    de estimaii ale dispersieitotale, adic: Pentru msurarea dependenei legturii ntre variabila

    endogen i factorii de regresia se calculeaz raportul de determinare (R2).

    SST

    SSE

    SST

    SSRR == 12

    Calculele necesare determinrii lui R2 sunt realizate din cadrul unei analize dispersionale

    (ANOVA).

    Tabel ANOVA pot fi folosite pentru modelul de regresie

    Sursa variabilei Suma ptratelor Grade de libertate Media sumei ptratelor

    Regresia rezidual SSR

    SSE

    K-1

    T-K

    MSSR=SSR/K-1

    MSSE=SSE/T-K

    TOTAL SST T-1

    Rezultatele ANOVA pot fi folosite pentru construirea testului F

  • 7/25/2019 Legaturi statistice intre variabile

    14/25

    14

    MSSE

    MSSRF=

    F urmeaz o distribuie Fisher cu K-1 i T-K grade de libertate. Pentru un prag de semnificaie

    se stabilete valoarea teoretic F;K-1;T-K

    Dac:

    F cal < F;K-1;T-K influena regresiei difer semnificativ de cea a factorilor reziduali;

    deci modelul este valid.

    F cal > F;K-1;T-K modelul este invalid.

    De asemenea dac:

    F calc > F teoretic atunci apreciem c legtura dintre X, Y este semnificativ i se pot

    aplica n continuare i alte metode de calcul statistic pentru a cuantifica legtura dintre

    X i Y.

    Fcalc < Fteoreticlegtura nu este semnificativ, variabilele sunt necorelate.

    Exemplu

    n vederea estimrii cheltuielilor lunare pentru alimentaia public,

    s-a efectuat o cercetare prin sondaj, pe baza unui eantion de 15%, selectat ntmpltor i

    nerepetat din numrul total de persoane. Persoanele chestionate au fost mprite n cinci

    grupe tipice, dup veniturile medii lunare nete. n urma nregistrrii i prelucrrii datelor, s-auobinut rezultatele:

    Colectivitate general Colectivitate de selecie

    Grupe tipice

    de persoane dupvenituri lunare

    (zeci mii u.m.)

    Numrulpersoanelor

    Cheltuieli medii

    lunare pentru

    alimentaie public(zeci mii u.m.)

    Coeficientul

    de variaieal cheltuielilor

    pentru alimentaiepublic (%)

    Numrulpersoanelor plasate

    peste media

    cheltuielilor pentru

    alimentaie publicpe grupe

    sub 70 1000 8 25 5070-74 1500 7 18 100

    74-78 2000 11 20 15078-82 1200 15 15 95

    peste 82 800 18 22 70Total 6500 - - 465

    Se cereconsidernd c media cheltuielilor lunare pentru cele 6500 de persoane este 11,8 zeci

    mii u.m.:

    1. Precizai dac veniturile lunare reprezint un factor semnificativ al cheltuielilor medii

    pentru alimentaia public; folosind a) regula de adunare a dispersiilor; b) testul F de

    analiz dispersional, tiind c pentru P= 0,99;

  • 7/25/2019 Legaturi statistice intre variabile

    15/25

    15

    2. S se msoare intensitatea legturii dintre veniturile lunare i cheltuielile medii pentru

    alimentaie public pentru persoanele din eantion, folosind un indicator de corelaie adecvat.

    Rezolvare:

    Calculam media generala si dispersiile din fiecare grupa aplicand regula de adunare adispersiilor:

    zecimiiUM1111,211,8

    12018180153001115071508

    in

    in

    iy

    y =++++

    =

    =

    Deoarece dy% = -5%; n= 975 persoane este reprezentativ.

    Regula de adunare a dispersiilor 2202

    0 += ; =+= 4,1906,1434,52

    0

    %721004,19

    06,14100

    20

    22 ===

    R

    Dispersiile de grup: ( ) 42122 === ii ; 6,1

    22 = ; 1,5

    2

    4 = ; 7,152

    5 =

    Media dispersiilor de grup ( )i

    34,5975

    1207,151801,53008,42256,115042

    2

    1 =++++

    ==

    i

    ii

    n

    n

    Dispersia dintre grupe: ( )

    ( ) ( ) ( ) ( ) ++++==

    975

    3001111225117150118 222

    2

    i

    ii

    n

    nyy

    ( ) ( )06,14

    975

    12011181801115 22=

    +++

    Dac %722 =R , adic %282 =k . Pentru ca 22 kR > ; %28%72 > veniturile lunare

    constituie factor semnificativ pentru cheltuielile cu alimentaia public. Pentru certitudine, se

    va folosi testul F de analiz dispersional.

    b) ===z

    zy

    x

    xy

    zy

    xy

    calcnnS

    SF

    2/

    2/

    2

    /

    2/

    : ( ) :1

    2

    =

    r

    nyy ii =

    rn

    n

    i

    ii2

    638970

    5,5206:

    4

    5,13708== , Deoarece teoreticcalc FF > ; 62,4638 > , veniturile lunare

    influeneaz semnificativ cheltuielile pentru alimentaia public.

  • 7/25/2019 Legaturi statistice intre variabile

    16/25

    16

    5. Metode neparametrice de msurare a legaturilor dintre fenomenele

    economico-sociale

    Aceste metode, pe lng faptul c pot stabili intensitatea legturii fcnd abstracie de

    tipul de distribuie, permit msurarea intensitii legturii nu numai pentru caracteristicile

    cantitative, dar i pentru cele calitative. Poart denumirea de metode neparametrice deoarece

    nu iau n calcul ntotdeauna valorile variabilelor corelate i nici parametrii lor corespunzatori.

    n concluzie, se folosesc n urmtoarele situaii: cnd distribuia variabilelor corelate nu e

    normal sau asimptotic normal;cnd nu este cunoscut forma de distribuie a variabilelor;

    cnd variabilele corelate sunt asimetrice, deci prezint asimetriepronunat sicnd avem de-a

    face cu variabile calitative i cantitative care n prealabil necesit o anumit cuantificare.

    Metodele neparametrice uzuale sunt:

    1) Coeficientul de asociere a lui Yulepresupune ntocmirea tabelului de asociere, care

    este un tabel combinat cu dubl intrare utilizat pentru variabilele de tip alternativ (DA/NU;

    F/M; etc.). Tabelulul de asociere este format din dou rnduri i dou coloane:

    n11 n12

    n21 n22

    n care n captul rndurilor se trec valorile celor dou caracteristici asociate, iar n interiorul

    tabelulului se trec frecvenele corespunztoare lor.

    Exemplu:Dac avem n vedere dou variabile statistice x i i yi i considerm c

    sunt variabile de tip alternativ, atunci asocierea dintre xi i yi se prezint astfel:

    yi

    xiDA NU Total

    DA

    NU

    n11

    n21

    n12

    n22

    n11+ n12

    n21+ n22

    Total n11+ n21 n12+ n22

    (n interiorul tabelului se consemneaz concomitent rspunsurile privind cele dou variabile

    corelate xi i yi). Pentru stabilirea valorii numerice a coeficientului de asociere care s

    indice existena i intensitatea legturii, se calculeaz coeficientul lui Yule conform relaiei:

    12212211

    12212211

    nnnn

    nnnnQ

    +

    = ; unde Q [-1,1]

    Dac: Q = 0 lipsa de asociere ntre xi i yi

    Q 0 asociere redus ntre xii yi

    Q 1 asociere puternic ntre xii yi

  • 7/25/2019 Legaturi statistice intre variabile

    17/25

    17

    Q = 1 asociere perfect ntre xii yi

    Produsul n11 n22= arat gradul de realizare a legturii ntre caracteristicile corelate x i i

    yi si produsul n12 n21 = arat lipsa legturii dintre cele dou variabile. Avantajul

    utilizrii: se poate calcula cu mult rapiditate, utilizndu-se i n cazul cnd datele provin de la

    uniti statistice complexe.

    2) Coeficienii de corelaie a rangurilor

    Coeficienii de corelaie se calculeaz nlocuind valorileindividuale ale variabilelor cu

    numrul lor de ordine numit RANG. Rangurile se atribuie dup ce n prealabil s-au ordonat

    datele individuale ale celor dou variabile n ordine cresctoare, astfel nct va trebui s

    vedem dac exist concordan ntre rangurile caracteristicii factoriale de la 1 n i rangurile

    caracteristicii rezultative de la 1 n. Avantajul utilizrii acestora:

    1) pot fi utilizai cu succes i n cazul unor distribuii asimetrice;

    2) pot fi utilizai pentru un numr restrns de uniti pentru care nu se poate verifica

    reprezentativitatea datelor pariale.

    a) Coeficientul de corelaie a rangurilor Spearmaneste o aplicaie a coeficientului de

    corelaie liniar simpl la distribuiile celor dou iruri de ranguri. [3]

    Acesta se calculeaz parcurgnd urmtoarele etape:

    1) se identific cele dou variabile corelate xii yi;

    2) se acord ranguri de regul cresctoare n aceeai manier att pentru variabilaxi ct i

    pentru variabila yi;

    Rangurile sunt numere de ordine care evolueaz n progresie aritmetic cu raia egal cu 1.

    3) se determin diferena dintre ranguri (di) i se ridic la ptrat;

    4) se aplic formula de calcul:nn

    d61r

    3

    2i

    S

    =

    [-1,1] ce msoar intensitatea legturii dintre

    rangurile celor dou variabile corelate, unde: di = diferena dintre rangurile variabilei xi i

    rangurile variabilei yi: Rx-Ry si n = numrul perechilor de valori corelate.Dac: rS = 0 ntre rangurile lui xi respectiv yi nu exist legtur (independen,

    statistic);

    rS 0 legtur foarte slab sau poate lipsi;

    rS 1 legtur puternic;

    rS = 1 legtur funcional.

    b) Coeficientul de corelaie a rangurilor Kendall; pentru a-l determina se folosesc

    valorile variabilelor corelate pentru care se acord ranguri. Etapele de lucru sunt:

  • 7/25/2019 Legaturi statistice intre variabile

    18/25

    18

    1) se identific variabilele corelate xi i yi;

    2) se ordoneaz cresctor variabila xi i, n coresponden cu aceasta, se trec valorile

    corespunzatoare variabilei yi;

    3) se acord ranguri cresctoare n aceeai manier ca i la coeficientul Spearman;

    4) se determin concordana notat cu P i discordana notat cu Q;

    5) se calculeaz scorul sau diferena (S = P Q);

    6) se aplic formula de calcul:)1n(n

    S2rk

    = unde: S = P Q [-1, 1]

    Concordana (P) este mereu pozitiv i reprezint numrul de ranguri superioare fiecarui

    rang considerat al variabilei yi. Discordana (Q) este mereu negativ i reprezint numrul de

    ranguri inferioare fiecrui rang considerat al variabilei yi. Coeficientul rangurilor calculat

    dup formula lui Kendall este de obicei mai mic dect cel calculat dup formula lui

    Spearman, avnd aceeai interpretare.

    Exemplu

    Pentru exemplificare, presupunem c notele nregistrate la examenul de bacalaureat i media

    nregistrat la examenul de admitere la Colegiu Comer pentru 10 candidai se caracterizeaz

    prin datele:

    Mediabacalaureat (xi)

    Mediaadmis

    (yi)

    Ranguri

    Rxi( ) Ryi( )

    2

    id P Q S

    7,007,077,757,807,908,008,158,65

    9,259,80

    6,906,506,007,207,106,807,257,30

    7,807,60

    12345678

    910

    42165378

    109

    90440900

    11

    67744432

    00

    31021000

    00

    36723432

    -1028 37 7 29

    Pentru a caracteriza legtura dintre media la bacalaureat i media la admitere folosind metode

    neparametrice, vom determina cei trei coeficieni prezentai anterior. (Yule, Spearmen,

    Kendall). Pentru coeficientul de asociere Yule, se ntocmete tabelul de asociere, stabilind

    poziia fiecrui candidat fa de media celor 10 candidai: 137,810

    37,81

    n

    xx i === si

    Asocierea dintre xi i yi, n raport cu media, va fi:

  • 7/25/2019 Legaturi statistice intre variabile

    19/25

    19

    yi

    xiSub y Peste y Total

    Sub x n11= 4 n12= 2 6

    Peste x n21= 0 n22= 4 4

    Total 4 6 10

    116

    16

    2044

    2044

    nnnn

    nnnnQ

    12212211

    122122111 ==

    +

    =

    +

    = [-1,1]

    Se poate trage concluzia c asocierea dintre media la bacalaureat i media la admitere

    este direct i foarte intens deoarece Q = 1. Se calculeaz coeficientul Spearman conform

    relaiei: =

    =

    nn

    d61r

    3

    3i

    S 83,0101000

    2861 =

    . Apreciem c legtura dintre rangurile notelor la

    bacalaureat i cele de la admitere este destul de intens, deoarece coeficientul se ncadreazntre 0,8 i 0,9. Calculnd coeficientul de determinaie (rs)

    2= (0,83)2= 0,69 sau 69%, deci,

    influena notelor la bacalaureat asupra mediei la admitere este n proporie de 69%, restul de

    31% reprezint influena altor cauze (factori) care nu au fost luate (luai) n consideraie.

    Se calculeaz coeficientul Kendall conform relaiei: 64,0)110(10

    292

    )1n(n

    S2rk =

    =

    = care se

    interpreteaz n aceeai manier ca i coeficientul Spearman.

    6. Testul de autoevaluare 1

    1. Un numr de 150 de studeni din dou centre universitare particip la un examen de burse

    n strintate. Cei 100 de studeni din prima universitate obin un punctaj mediu de 88 puncte,

    cu un coeficient de variaie de 8%, iar cei din a doua universitate obin un punctaj mediu de

    96 puncte, cu o abatere standard de 0,65 puncte. n ce msur factorul de grupare centrul

    universitar contribuie la variaia punctajelor obinute de studeni? n ce msur difer

    semnificativ punctajul de la un centru universitar la altul?

    2. Pentru zona de amplasare a 2 centre comerciale cu 10 si15 magazine, se cunosc datele:

    Zona de amplasare Numr magazineProfitul mediu pe unmagazin (mil. RON)

    Dispersia profitului

    CentralPeriferie

    1015

    2026

    1222

    S se determine n ce proporie zona de amplasare influeneaz variaia profitului

    3. Din datele furnizate de Ancheta Integrat n Gospodrii se cunosc urmtoarele date pentru

    zece familii.

    FamiliaVenituri lunare ce revin n medie pe o

    perioad pe familie (zeci mii u.m)Cheltuieli pentru achiziionarea

    produsului x (zeci mii u.m)

    1 7,2 3,22 9,9 3,8

  • 7/25/2019 Legaturi statistice intre variabile

    20/25

    20

    3 8,5 4,04 11,8 5,55 19,2 6,26 10,9 4,17 13,4 5,4

    8 12,5 5,99 11,5 6,010 16,1 6,3

    Se cere: S se caracterizeze i s se msoare legtura dintre venituri i cheltuieli

    folosind:

    a) graficul de corelaie;

    b) metoda regresiei;

    c) metoda raportului de corelaie;

    d) metoda coeficientului de corelaie;

    7. Rspunsuri i comentarii la testele de autoevaluare

    1. Rezolvare:

    Se cunosc urmtoarele elemente pentru determinarea coeficientului de determinare

    ( )2R : 1001=n 881=y %81=

    502 =n 962 =y 65,02 =

    Coeficientul de determinare 2R :

    %3010040,4722,14100

    2

    0

    22 ===

    R unde

    Dispersia dintre grupe ( )2 :

    ( )( ) ( )

    22,14150

    5066,909610066,9088 22

    1

    1

    2

    02 =

    +=

    =

    =

    =m

    i

    i

    m

    i

    ii

    n

    nyy

    Media pe total colectivitate ( 0y )

    67,90150

    50,9610088

    1

    1

    0 =+

    =

    =

    =

    =

    m

    i

    i

    m

    i

    ii

    n

    ny

    y puncte

    Media dispersiilor de grup:

    18,33150

    125,4977

    150

    10056,49504225,0

    1

    1

    2

    2==

    +=

    =

    =

    =m

    i

    i

    m

    i

    ii

    i

    n

    n

  • 7/25/2019 Legaturi statistice intre variabile

    21/25

    21

    Deoarece 08,0%81 = , 04,708,08888

    08,0 11

    1

    11 ====

    y

    ( ) ( ) 56,4904,7 2212

    1

    2

    11 ==== , ( ) 4225,065,065,0 22

    22 ===

    Regula de adunare a dispersiilor:

    40,4722,1418,33222 =+=+= ix

    Pentru c coeficientul de determinare este 30%, nseamn c 30% din variaia

    punctajului este explicat de centrul universitar, iar restul de 70% se datoreaz altor factori.

    Deoarece 22 KR < apreciem c centrul universitar nu contribuie semnificativ la variaia

    punctajelor obinute de studeni. Punctajele studenilor nu difer semnificativ de la un centru

    la altul

    2. Rezolvare: Notaii: =ix zona de amplasare; =in numr magazine; =iy profitul

    mediu; =2i dispersia profitului. Pentru a determina n ce proporie factorul principal de

    grupare influeneaz variaia profitului se determin coeficientul de determinare dup relaia:

    %43,3210064,26

    64,8100

    2

    0

    22 ===

    R . Dispersia dintre grupe:

    ( )( ) ( )

    =+

    =

    =

    =

    =

    25

    156,23261076,2320 22

    1

    1

    2

    02

    m

    i

    i

    m

    i

    ii

    n

    nyy

    64,825

    4,866,129=

    +

    Media pe total colectivitate : 6,2325

    590

    25

    15261020

    1

    1

    0 ==+

    =

    =

    =

    =m

    i

    i

    m

    i

    ii

    n

    nyy mil. RON/magazin Media

    dispersiilor de grup: 1825

    330120

    25

    15221012

    1

    1

    2

    2 =+

    =+

    =

    =

    =

    =

    m

    i

    i

    m

    i

    ii

    i

    n

    n

    Regula de adunare a dispersiilor:

    64,261864,8222 =+=+= i

    i

    si 22 KR + = 100 %57,672 =K (coeficientul de non-

    determinare) 22 KR

  • 7/25/2019 Legaturi statistice intre variabile

    22/25

    22

    Diagrama de mprtiere

    Scara: 0X 1 cm = 3 zeci mii u.m. (venituri)

    0Y 1 cm = 1 zeci mii u.m. (cheltuieli)

    b)

    =+

    =+

    iiii

    ii

    yxxbxa

    yxban

    2

    iix xxbaY i ++= 268,0799,1

    =+

    =+

    83,63906,1576121

    4,5012110

    ba

    ba

    ==

    ..268,026786,0..8,179885,1mumiizecib

    mumiizecia Deci funcia de regresie este ix xY i += 268,08,1

    c) ( )( )

    83,0824,11

    59,311

    2

    2

    / ==

    =

    yy

    YyR

    i

    xi

    xyi

    sau

    ( ) 83,0

    10

    4,5084,265

    83,639268,04,508,184,26511

    22

    2

    2

    / =

    =

    =

    n

    yy

    yxbyayR

    i

    i

    iiii

    xy

    d)

    ( )[ ] ( )[ ]=

    =

    2222/

    iiii

    iiii

    xy

    yynxxn

    yxyxnr

    ( )[ ] ( )[ ] 83,0824,0

    4,5084,2651012106,157610

    4,5012183,63910

    22=

    Algoritmul de calcul necesar determinrii abaterilor medii ptratice i a indicatorilor de

    corelaieeste redat n tabelul urmtor:

    Nr. crt. ix iy ( )2

    xxi ( )2

    yyi iiyx

    0 1 2 3 4 51 7,2 3,2 24,01 3,3856 23,042 9,9 3,8 4,84 1,5376 37,623 8,5 4,0 12,96 1,0816 34,04 11.8 5,5 0,09 0,2116 64,95 19,2 6,2 50,41 1,3456 119,046 10,9 4,1 1,44 0,8836 44,69

    7 13,4 5,4 1,69 0,1296 72,368 12,5 5,9 0,16 0,7396 73,759 11,5 6,0 0,36 0,9216 69,0

    10 16,1 6,3 16,0 0,5876 101,43

    Total121

    ix 50,4

    iy 111,96

    ( ) 2

    xxi

    11,824

    ( ) 2yyi 639,83

    iiyx

    7 2

    Y

    6 2

    5 2

    4 2

    3 2

    0 7 2 10 2 13 2 16 2 19 2 X

    ix bxaY +=

    xx

    xx

    xx

    x x

  • 7/25/2019 Legaturi statistice intre variabile

    23/25

    23

    continuare tabelul

    8. Teme de control

    1. Identificai funcia de regresie liniarce modeleazlegtura dintre douvariabile utiliznd

    metoda celor mai mici ptrate. Scriei funcia de regresie. Calculai i comentai interpretarea

    coeficienilor funciei de regresie

    2. Dintr-un sondaj efectuat pe un eantion de 7 gospodrii au rezultat urmtoarele date

    despre fiecare gospodrie referitoare la veniturile zilnice din remunerare ale membrilor

    gospodriei i cheltuielile zilnice ale gospodriei din tabelul urmtor

    Venituri 40 30 20 50 60 40 30Cheltuieli 35 26 18 38 42 30 22

    a. Reprezentai grafic legtura dintre cele douvariabile prin graficul de mprtiere;

    b. Identificai funcia de regresie liniar ce modeleaz legtura dintre cele dou variabile

    utiliznd metoda celor mai mici ptrate. Scriei funcia de regresie. Calculai i comentai

    coeficienii funciei de regresie;

    c.

    Analizai intensitatea legturii dintre cele dou variabile printr-o metod parametric

    adecvat.

    d. Analizai intensitatea legturii dintre cele dou variabile printr-o metod neparametric

    adecvat.

    3. Dintr-un sondaj efectuat pe un eantion de 7 gospodrii au rezultat urmtoarele date

    despre fiecare gospodrie referitoare la veniturile zilnice din remunerare ale membrilor

    gospodriei i cheltuielile zilnice ale gospodriei, n tabelul urmtor:

    Nr. crt. 2ix

    2

    iy ix xY i += 268,08,1 ( )2

    ixi Yy

    0 6 7 8 91 51,84 10,24 3,7 0,252 98,01 14,44 4,5 0,493 72,25 16,00 4,1 0,014 139,24 30,25 5,0 0,255 368,64 38,44 6,9 0,496 118,81 16,81 4,7 0,367 179,56 29,16 5,4 08 156,25 34,81 5,2 0,499 156,25 36,0 4,9 1,2110 259,21 39,69 6,1 0,04

    Total1576,06

    2ix 265,84

    2iy 50,5

    ixY 3,59

    ( ) 2ixi Yy

  • 7/25/2019 Legaturi statistice intre variabile

    24/25

    24

    Numar membrii 4 3 2 5 6 4 3Venit pe membru algospodariei

    350 260 180 380 420 300 220

    Calculai i comentai coeficienii funciei de regresie, reprezentai grafic legtura dintre cele

    douvariabile prin graficul de mprtiere.

    4. Despre un eantion stratificat de angajai de 5%, selectat ntmpltor, nerepetat din totalul

    angajailor unei societi comerciale se cunosc datele:

    Vechime(ani)

    Numrulangajailor

    Vnzri medii zilnice(mii RON)

    Numr de angajai care se plaseazpeste media vnzrilor zilnice

    sub 10 90 500 3010-20 150 640 8020-30 100 980 50

    peste 30 60 25

    TOTAL 400 - 185tiind c pentru grupa de angajai cu peste 30 de ani vechime, vnzrile maxime au

    fost de 1.100 mii RON, abaterea maxim pozitiv a vnzrilor fa de media vnzrilor

    acestei grupe a fost de 250 mii RON iar, pe total, valoarea modal a vnzrilor eantionului a

    fost de 800 mii RON, cu un coeficient de asimetrie (Cas= -0,35), se cere:

    1) S se stabileasc dac factorul principal de grupare (vechimea n munc) este

    semnificativ pentru variaia vnzrilor medii zilnice, folosind coeficientul de determinare i

    cel de nondeterminare.

    2) S se caracterizeze i s se msoare corelaia dintre vechime i vnzrile medii

    zilnice, folosind metoda regresiei bazat pe o funcie de regresie corespunztoare.

    9. Rezumatul Unitii de nvare

    Asupra fenomenelor social-economice acioneaz o multitudine de factori, principali isecundari, eseniali i neeseniali, cuantificabili i necuantificabili sau cuantificabili cu aproximaie,care se gsesc ntr-o relaie de interdependen reciproc. Legturile ce se pot forma sunt legturistohastice, n care un fenomen este factor de influenta, iar cellalt este efect. Statistica, printr-o gamlarg de procedee i metode specifice, poate studia manifestarea concret a acestor legturi, le poateexprima cantitativ i msura intensitatea cu care se produc. Legturile statistice pot fi simple saumultiple, directe sau inverse, de asociere sau de corelaie, liniare sau neliniare, sincrone sauasincrone. Pentru caracterizarea statistic a legturilor dintre variabile se pot folosi dou categoriide metode: metode simple (metoda grafic, metoda tabelului de corelaie, metoda gruprilor, metodaseriilor paralele interdependente) i metode analitice (metoda regresiei, metoda covarianei, metodaraportului de corelaie, metoda coeficientului de corelaie, metoda analizei dispersionale). n afarametodelor analitice menionate mai sus, ce intr n categoria metodelor parametrice, legturile dintre

    variabilele statistice se mai pot analiza cu ajutorul metodelor neparametrice (metoda coeficientului de

  • 7/25/2019 Legaturi statistice intre variabile

    25/25

    asociere al lui Yule, metoda coeficientului de corelaie a rangurilor Spearman i metoda coeficientuluide corelaie a rangurilor Kendall).

    10. Bibliografia Unitii de nvare

    1. Cristache, S.E., erban, D.,Lucrri aplicative de Statistic i Econometrie, Ed. ASE,

    Bucureti, 2007, 433 pg. (191 - 416) ISBN 978 - 973 594 986 2;

    2. Isaic Maniu, Al., Voineagu, V., Mitru, C., Baron, T., ian, E., Matache S., erban D.,

    Voineagu, M., Statistic teoretic. Studii de caz i aplicaii, Ed. Economic, 255 pg. (189 -

    219), Bucureti, 1998, ISBN 973-590-086-6;

    3. Isaic Maniu, Al., Mitru, C., Voineagu, V., Statistica Pentru afaceri, ed. Economic,

    Bucuresti 2003.