numarul mediu de salariati = f(pib, populatie - regiunea 4 si 5 - 8 judete

Upload: szilard58

Post on 05-Apr-2018

226 views

Category:

Documents


0 download

TRANSCRIPT

  • 7/31/2019 Numarul Mediu de Salariati = F(PIB, Populatie - Regiunea 4 Si 5 - 8 Judete

    1/13

    Academia de Studii EconomiceFacultatea de Comer

    Proiect econometrie

    Nr. Mediu de salariai = f(PIB, populaie)Regiunea 4 si 5 (8 judee)

    Bucureti, 2009

  • 7/31/2019 Numarul Mediu de Salariati = F(PIB, Populatie - Regiunea 4 Si 5 - 8 Judete

    2/13

    Regiunea Judeul Populaia la 1

    iulie 2005(nr.persoane)

    Nr. mediu al

    salariailor(mii. pers.)

    PIB regional 2004

    mil. lei (RON)preturi curente

    Sud-Vest Dolj 718874 119 6610,6

    Gorj 384852 79 4659,9Mehedini 303869 47 2684,8

    Olt 483674 69 3759,8Vest Arad 459286 116 6187,3

    Caras Severin 331876 60 3411,3Hunedoara 480459 118 5266,7

    Timis 658837 190 10431,6

    Cerinte:

    a. Realizarea i interpretarea regresiei unifactorialeNr. mediu de salariai = f (populaie)1. S se reprezinte grafic datele2. S se determine modelul de regresie pe baza datelor din eantion3. S se verifice validitatea modelului de regresie pentru un nivel de semnificaie 0,05.4. S se testeze semnificaia parametrilor modelului de regresie, pentru un nivel de semnificaie 0,05.5. S se msoare intensitatea legturii dintre variabile folosind coeficientul de corelaie i raportul de

    corelaie, testnd semnificaia acestora pentru un nivel de semnificaie 0,05.6. Ce pondere din variaia variabilei efect este explicat de variatia variabilei cauz?

    b. Realizarea i interpretarea regresiei multifactoriale Nr. mediu de salariai = f (PIB, populaie)1 S se determine modelul de regresie pe baza datelor din eantion2 S se verifice validitatea modelului de regresie pentru un nivel de semnificaie 0,05.3 S se testeze semnificaia parametrilor modelului de regresie, pentru un nivel de semnificaie 0,05.4 S se msoare intensitatea legturii dintre variabile folosind raportul de corelaie, testnd

    semnificaia acestuia pentru un nivel de semnificaie 0,05.5 Ce pondere din variaia variabilei efect este explicat de variatia variabilelor?

    2

  • 7/31/2019 Numarul Mediu de Salariati = F(PIB, Populatie - Regiunea 4 Si 5 - 8 Judete

    3/13

    Rezolvare:

    a. Realizarea si interpretarea regresiei unifactorialeNr. Mediu de salariati = f (populatie)

    Se identifica cele doua variabile

    xi variabila factorial =populatia (n nr persoane) din regiunile Nord-Vest si Sud - Estyi- variabila dependent = numrul mediu de salariati (mii persoane) din regiunile Nord-Vest si Sud Est

    1.S se reprezinte grafic datele

    Graficulconstruit, denumit corelogram, ne indic existena, forma i direcia legturii dintre cele douvariabile

    Corelograma intre populatia din regiunile SV si V

    si numarul mediu al salariatilor din aceleasi regiuni

    y = 0.0002x - 18.371

    R2 = 0.6235

    0

    20

    40

    60

    80

    100

    120

    140

    160

    180

    200

    0 100000 200000 300000 400000 500000 600000 700000 800000

    Populatia

    Nrmediualsalariatilor

    Scara: 1cm OY = 20 mil persoane1cm OX = 100 000 persoane

    Corelograma evideniaz legtura direct (punctele sunt plasate pe direcia primei bisectoare) i liniar(dreapta de regresie are panta pozitiv) dintre populatia din regiunile SV si V si numarul mediu al salariailordin aceleai regiuni.

    3

  • 7/31/2019 Numarul Mediu de Salariati = F(PIB, Populatie - Regiunea 4 Si 5 - 8 Judete

    4/13

    SUMMARY OUTPUT

    Regression Statistics

    Multiple R 0.789625R Square 0.623507Adjusted R Square 0.560758Standard Error 30.52726

    Observations 8

    ANOVA

    df SS MS F Significanc

    e F

    Regression 1 9260.017 9260.017 9.936558 0.019759Residual 6 5591.483 931.9139

    Total 7 14851.5

    CoefficientsStandard

    Error t Stat P-value Lower 95%Upper95%

    Intercept -18.3707 38.99547 -0.4711 0.654212 -113.789 77.04781

    X Variable 1 0.000247 7.84E-05 3.152231 0.019759 5.53E-05 0.000439

    RESIDUAL OUTPUT

    Observation Predicted Y Residuals

    1 159.3791 -40.37912 76.78835 2.2116453 56.76439 -9.764394 101.2232 -32.22325 95.193 20.8076 63.68944 -3.689447 100.4283 17.57173

    8 144.5343 45.46575

    2. S se determine modelul de regresie pe baza datelor din eantion

    Aplicarea modelului liniar de regresiepresupune utilizarea ecuaiei de regresie liniar: ii bxay +=

    CoefficientsStandard

    Error t Stat P-value Lower 95%Upper95%

    Intercept -18.3707 38.99547 -0.4711 0.654212 -113.789 77.04781

    X Variable 1 0.000247 7.84E-05 3.152231 0.019759 5.53E-05 0.000439

    a = -18.3707b = 0.000247y = -18.3707 + 0.000247xi

    4

  • 7/31/2019 Numarul Mediu de Salariati = F(PIB, Populatie - Regiunea 4 Si 5 - 8 Judete

    5/13

    Interpretare: b = 0.000247 b se numete coeficient de regresie reprezentnd panta liniei drepte b> 0, deci ntre numrul mediu de salariatiipopulatie exist o legtur direct la creterea populaiei cu o persoana, numrul mediu de salariati se mrete cu 0,5495 mii persoane .

    3. S se verifice validitatea modelului de regresie pentru un nivel de semnificaie 0,05.

    ANOVA

    df SS MS F Significanc

    e F

    Regression 1 9260.017 9260.017 9.936558 0.019759Residual 6 5591.483 931.9139

    Total 7 14851.5

    Interpretare rezultate din tabelul ANOVA :

    n acest tabel este calculat testul F pentru validarea modelului de regresie. ntruct F=9.936558, iarSignificance F (pragul de semnificaie) este 0.019759 (valoare mai mic de 0,05), atunci modelul deregresie construit este valid i poate fi utilizat pentru analiza dependenei dintre cele dou variabile.

    4. S se testeze semnificaia parametrilor modelului de regresie, pentru un nivel de semnificaie 0,05.

    CoefficientsStandard

    Error t Stat P-value Lower 95%Upper95%

    Intercept -18.3707 38.99547 -0.4711 0.654212 -113.789 77.04781

    X Variable 1 0.000247 7.84E-05 3.152231 0.019759 5.53E-05 0.000439

    Interpretarea rezultatelor din tabelul : Intercept este termenul liber, deci coeficientul aeste-18.3707. Termenul liber este punctul n care

    variabila explicativ (factorial) este 0. Deci numarul mediu de salariati, dac populatia este 0 va fi

    18.3707 persoane. Deoarece at = -0.4711, iar pragul de semnificaie P-value este 0.654212 > 0,05nseamn c acest coeficient nueste semnificativ. De altfel faptul c limita inferioar a intervaluluide ncredere (-113.789 77.04781) pentru acest parametru este negativ, iar limita superioareste pozitiv arat c parametrul din colectivitatea general este aproximativ zero.

    Coeficientul b este 0.000247, ceea ce nsemn c la creterea a populaiei cu o persoana, numrul

    mediu de salariati va crete cu 0.000247 mii persoane. Deoarece bt = 3.152231, iar pragul desemnificaieP-value este 0.019759 < 0,05 nseamn c acest coeficient este semnificativ. Intervalulde ncredere pentru acest parametru este 5.53E-05 0.000439

    5. S se msoare intensitatea legturii dintre variabile folosind coeficientul de corelaie i raportul de corelaie,testnd semnificaia acestora pentru un nivel de semnificaie 0,05.

    Coeficientul de corelaie r:

    ( ) ( )

    ( ) ( )

    =

    =

    =

    ==

    =

    n

    ii

    n

    ii

    n

    i

    ii

    yx

    xy

    yx

    yyxx

    yyxx

    ss

    s

    ss

    yxr

    1

    2

    1

    2

    1),(covsau

    ( )[ ] ( )[ ]2222

    =

    iiii

    iiii

    yynxxn

    yxyxnr

    5

  • 7/31/2019 Numarul Mediu de Salariati = F(PIB, Populatie - Regiunea 4 Si 5 - 8 Judete

    6/13

    ( ) ( )

    ( ) ( )

    =

    =

    =

    ==

    =

    n

    i

    i

    n

    i

    i

    n

    i

    ii

    yx

    xy

    yxyyxx

    yyxx

    ss

    s

    ss

    yxr

    1

    2

    1

    2

    1),(cov

    Populaia

    la 1 iulie2005(mii

    persoane)

    xi

    Nr.

    mediu alsalariail

    or(mii.pers.)

    yi

    ( )xxi ( )yyi ( )( )yyxx ii ( )2

    xxi ( )2

    yyi

    718,874 119 628626,9

    19,2512101068 3,95172E+11 370,5625

    384,852 79

    -

    89862,3 -20,75 1864642 8075224806 430,5625

    303,869 47

    -89943,2

    -52,754744506 8089785994 2782,563

    483,674 69-

    89763,4-30,75 2760226 8057473837 945,5625

    459,286 116-

    89787,816,25 -1459052 8061852733 264,0625

    331,876 60 -89915,2 -39,75 3574130 8084748698 1580,063

    480,459 118467,459 18,25 8531,127 218517,9167 333,0625

    658,837 190-

    89588,3 90,25-8085341 8026058054 8145,063

    721976,9

    ix798

    iy( ) xxi

    90234,11

    ( )

    0

    yyi ( )( )15508709

    yyxx ii ( )

    114,43567E

    2

    +

    xxi ( )14851,5

    2

    yyi

    6

  • 7/31/2019 Numarul Mediu de Salariati = F(PIB, Populatie - Regiunea 4 Si 5 - 8 Judete

    7/13

    ix iy2

    ix2iy ii yx

    718,874 119 5,1678E+11 1416185546006

    384,852 79 148111,0619 624130403,31

    303,869 47 92336,36916 220914281,84

    483,674 69 233940,5383 476133373,51

    459,286 116 210943,6298 1345653277,18

    331,876 60 110141,6794 360019912,560

    480,459 118 230840,8507 1392456694,16

    658,837 190 434066,1926 36100125179

    721976,9

    ix

    798

    iy = 2ix5,16781E+11

    = 2iy 94452 = iiyx85879128

    r = 0,78 > 0, ceea ce ne arata ca intre populatie si numarul mediu al salariatilor exista o legatura directa puternica

    Testarea semnificaiei coeficientului de corelaie:

    - se stabilete ipoteza nul: H0: r nu este semnificativ statistic;- se stabilete ipoteza alternativ: H1: r este semnificativ statistic;- se calculeaz testul t:

    =

    =

    ==

    22 78,01

    678,0

    1

    2

    r

    nr

    s

    rt

    r

    3,0531

    t0,05;6 = 2,447

    tcalc > t0,05;6Coeficientul de corelaie este semnificativ statistic

    Msurarea intensitii legturii cu raportul de corelaie R:

    7

  • 7/31/2019 Numarul Mediu de Salariati = F(PIB, Populatie - Regiunea 4 Si 5 - 8 Judete

    8/13

    ( )

    ( )78,0

    35,22

    64,79

    1

    2

    1

    2

    ==

    =

    =

    =

    n

    i

    i

    n

    i

    i

    yy

    yy

    R

    Rezultatul R = 0,78 ne arat c, ntre poplulatie i numrul mediu de salariati exist o legtur directputernic.DeoareceR = r = 0,78, apreciem c exist o legtur liniar, puternic i direct ntre cele dou variabile.

    Testarea semnificaiei raportului de corelaie (R) :

    H0: raportul de corelaie nu este semnificativ statistic;H1: raportul de corelaie este semnificativ statistic;

    Decizia: dac 1;; > knkcalc FF , atunci H0 se respinge

    Determinarea lui Fcalculat se face cu relaia :09,46

    1

    13

    78,01

    78,01

    1 2

    2

    =

    =

    =k

    kn

    R

    RF

    Pentru un prag de semnificaie de 5% valoarea tabelat a testului este:99,56;1;05,0118;1;05,01;; === tFF knk

    Deoarece 6;1;05,0FFcalc > , atunci H0 se respinge, deci H1 se accept, ceea ce nseamn c raportul decorelaie (R) este semnificativ statistic.

    6. Ce pondere din variaia variabilei efect este explicat de variaia variabilei cauz?

    Ponderea este data de coeficientul de determinatie (R Square) :

    ( )

    ( )

    =

    =

    =

    =

    =

    n

    i

    i

    n

    i

    i

    y

    e

    y

    xy

    yy

    yy

    R

    1

    2

    1

    2

    2

    2

    2

    2

    /2

    1 = 0.623507 obtinut in EXCEL care reprezinta faptul ca 62% din variatia

    numarului mediu de salariati este explicata de populatie

    8

  • 7/31/2019 Numarul Mediu de Salariati = F(PIB, Populatie - Regiunea 4 Si 5 - 8 Judete

    9/13

    b.Realizarea i interpretarea regresiei multifactoriale Nr. mediu de salariai = f (PIB, populaie)

    Pib-ul obtinut in regiunile SV si V

    Residual Plot

    -50

    0

    50

    0 2000 4000 6000 8000 10000 12000

    Pib-ul obtinut in regiunile SV si VResiduals

    Populatia in regiunile SV si V Residual

    Plot

    -50

    0

    50

    0 200000 400000 600000 800000

    Populatia in regiunile SV si V

    Residuals

    Pib-ul obtinut in regiunile SV si V Line

    Fit Plot

    0500

    0 5000 10000 15000

    Pib-ul obtinut in regiunile SV si

    V

    Nr

    mediu

    al

    sala

    riatilor

    Nr mediu al

    salariatilor

    Predicted Nr

    mediu al

    salariatilor

    Populatia in regiunile SV si V Line Fit

    Plot

    0

    500

    0 500000 1000000

    Populatia in regiunile SV si V

    N

    rmediu

    al

    s

    alariatilo

    r

    Nr mediu al

    salariatilor

    Predicted Nrmediu al

    salariatilor

    9

  • 7/31/2019 Numarul Mediu de Salariati = F(PIB, Populatie - Regiunea 4 Si 5 - 8 Judete

    10/13

    SUMMARYOUTPUT

    Regression Statistics

    Multiple R 0.982622198R Square 0.965546384Adjusted R Square 0.951764938Standard Error 10.1162036

    Observations 8

    ANOVA

    df SS MS F Significance

    F

    Regression 2 14339.81212 7169.906062 70.06132 0.000220337Residual 5 511.687876 102.3375752

    Total 7 14851.5

    CoefficientsStandard

    Error t Stat P-value Lower 95% Upper 95%

    Intercept -0.866836063 13.15907743 -0.06587362 0.950031 -34.69332146 32.95964934Populatia inregiunile SV si V 5.69674E-06 4.30263E-05 0.13240144 0.89983 -0.000104906 0.000116299Pib-ul obtinut inregiunile SV si V 0.018208019 0.002584385 7.04539834 0.00089 0.011564647 0.024851391

    RESIDUALOUTPUT

    Observation

    Predicted Nrmediu al

    salariatilor Residuals

    1 123.5943312 -4.5943312442 86.17311237 -7.1731123653 49.74911549 -2.7491154934 70.3470381 -1.3470380995 114.4080713 1.5919286826 63.13678969 -3.13678969

    7 97.76638642 20.233613588 192.8251554 -2.825155368

    10

  • 7/31/2019 Numarul Mediu de Salariati = F(PIB, Populatie - Regiunea 4 Si 5 - 8 Judete

    11/13

    1. S se determine modelul de regresie pe baza datelor din esantion

    Notam:

    X1 variabila factorial =populatia (n nr persoane) din regiunile Nord-Vest si Sud Est

    X2- variabila factoriala =PIB regional 2004(in mil. lei)Y- variabila dependent = numrul mediu de salariai (mii persoane) din regiunile Nord-Vest si Sud Est

    Ecuaia de regresie este:

    22110, 21 xbxbby xx ++= , unde 21 xxy reprezint valorile ajustate ale variabilei Yn funcie de cele dou variabile

    factorialeX1iX2.

    Coefficients

    Standard

    Error t Stat P-value Lower 95% Upper 95%Intercept -0.866836063 13.15907743 -0.06587362 0.950031 -34.69332146 32.95964934Populaia inregiunile SV si V 5.69674E-06 4.30263E-05 0.13240144 0.89983 -0.000104906 0.000116299PIB-ul obinut inregiunile SV si V 0.018208019 0.002584385 7.04539834 0.00089 0.011564647 0.024851391

    b0 = -0.866836063

    b1 = 5.69674E-06

    b2 = 0.018208019

    iii xxy 21 90.0182080106-5.69674E63-0.8668360 ++=

    Parametrul b0 are caracter de mrime medie, arat c s-a nregistrat o scdere medie de -0.866836063 miipersoane, dac numrul mediu de salariai ar fi fost influenat de ali factori, exceptnd variabileleX1 iX2, inclusen model.Dac populaia ar crete cu o persoan, atunci numrul mediu de salariai ar crete cu 5.69674E-06 mii persoane,iar dac PIB-ul obinut in cele doua regiuni(Sud-vest si Vest) ar crete cu 1 mil. lei, atunci numrul mediu desalariai ar crete cu 0.018208019 mii persoane.

    2. S se verifice validitatea modelului de regresie pentru un nivel de semnificaie 0,05.

    ANOVA

    df SS MS F Significance

    F

    Regression 2 14339.81212 7169.906062 70.06132 0.000220337Residual 5 511.687876 102.3375752

    Total 7 14851.5

    11

  • 7/31/2019 Numarul Mediu de Salariati = F(PIB, Populatie - Regiunea 4 Si 5 - 8 Judete

    12/13

    Interpretare rezultate din tabelulANOVA:n acest tabel este calculat testul F pentru validarea modelului de regresie. ntruct F=70.06132, iarSignificance F (pragul de semnificaie) este 0.000220337 (valoare mai mare de 0,05), atunci modelul deregresie construit este valid i poate fi utilizat pentru analiza dependenei dintre variabile.

    3. S se testeze semnificaia parametrilor modelului de regresie, pentru un nivel de semnificaie 0,05.

    CoefficientsStandard

    Error t Stat P-value Lower 95% Upper 95%

    Intercept -0.866836063 13.15907743 -0.06587362 0.950031 -34.69332146 32.95964934Populatia inregiunile SV si V 5.69674E-06 4.30263E-05 0.13240144 0.89983 -0.000104906 0.000116299Pib-ul obtinut inregiunile SV si V 0.018208019 0.002584385 7.04539834 0.00089 0.011564647 0.024851391

    Interpretarea rezultatelor din tabelul 3:

    Intercept este termenul liber, deci coeficientul b0este-0.866836063. Termenul liber este punctul ncare variabilele explicative (factoriale) sunt 0. Deci numarul mediu de salariati, dac valoarea

    populatie si a PIB-ului ar fi 0, s-ar situa la nivelul -0.866836063 mii persoane. Deoarece 0bt =-0.06587362, iar pragul de semnificaie P-value este 0.950031 > 0,05 nseamn c acest coeficientnueste semnificativ. De altfel faptul c limita inferioar a intervalului de ncredere pentru acest

    parametru este negativ, iar limita superioar este pozitiv -34.69332146 32.95964934) aratc parametrul din colectivitatea general este aproximativ zero.

    Coeficientul b1 este 5.69674E-06, ceea ce nsemn c la creterea populatiei cu o persoana, numarul

    mediu de salariati va crete cu 5.69674E-06 mii persoane. Deoarece 1bt = 0.13240144, iar pragul desemnificaie P-value este 0.89983 > 0,05 nseamn c acest coeficient nu este semnificativ. De

    asemenea, acest parametru este aproximativ zero, deoarece limita inferioar a intervalului dencredere pentru acest parametru este negativ, iar limita superioar este pozitiv ( -0.000104906

    0.000116299). Coeficientul b2 este 0.018208019 i ne arat c, la o cretere cu 1 mil a PIB-ului obtinut in cele doua

    regiuni, numarul mediu de salariati va nregistra o cretere cu 0.018208019 mii persoane. Rezultatul

    2bt =7.04539834 i pragul de semnificaie corespunztorP-value de 0.00089 < 0,05 ne conduce laconcluzia c acest coeficient este semnificativ. Intervalul de incredere pentru acest parametru este-0,04114133 0,2493662.

    4. S se msoare intensitatea legturii dintre variabile folosind raportul de corelaie, testnd semnificaiaacestuia pentru un nivel de semnificaie 0,05.

    R= 0,989430469arat c ntre numarul mediu de salariati i cele 2 variabile luate n studiu (PIB-ul obtinutin cele doua regiuni si populatia) exist o legtur directa foarte puternic.

    Testarea semnificaiei raportului de corelaie (R) :

    H0: raportul de corelaie nu este semnificativ statistic;H1: raportul de corelaie este semnificativ statistic;

    Decizia: dac 1;; > knkcalc FF , atunci H0 se respinge

    Determinarea lui Fcalculat se face cu relaia :

    12

  • 7/31/2019 Numarul Mediu de Salariati = F(PIB, Populatie - Regiunea 4 Si 5 - 8 Judete

    13/13

    49,1481

    6

    98.0*98,01

    98,01

    1 2

    2

    =

    =

    =k

    kn

    R

    RF

    Pentru un prag de semnificaie de 5% valoarea tabelat a testului este:14,56;2;05,0118;2;05,01;; === FFF knk

    Deoarece 6;1;05,0FFcalc > , atunci H0 se respinge, deci H1 se accept, ceea ce nseamn c raportul decorelaie (R) este semnificativ statistic.

    5. Ce pondere din variaia variabilei efect este explicat de variatia variabilelor?

    Ponderea este data de coeficientul de determinatie (R Square) := 0.965546384 obtinut in EXCEL care reprezinta faptul ca 96% din variatia numarului mediu de salariati este

    explicata de populatie si PIB-ul obtinut in cele doua regiuni.

    13