econometrie - curs 6

Upload: geegee-bub

Post on 17-Oct-2015

96 views

Category:

Documents


6 download

DESCRIPTION

curs

TRANSCRIPT

  • ECONOMETRIE CURS 611 NOIEMBRIE 2013Variabile calitativeMulticoliniaritate

  • UTILIZAREA VARIABILELOR CALITATIVE variabilele pe care le-am utilizat n construcia modelului care exprim timpul total de lucru au fost variabile cantitative Frecvent, totui, suntem n situaia s inserm n astfel de modele variabile care nu pot fi msurate n termeni de valori numerice Acestea se numesc variabile calitative

  • EXEMPLU nivelul vnzrilor unui produs care se comercializeaz att n sticle, ct i n pachete variabila independent tipul de recipient ar putea influena variabila dependent nivel al vnzrilor natura containerului este o variabil calitativ pe care nu o putem msura pe baza a ct de mult?

  • PROBLEMA FIRMEI DE CURIERATSe cere un management mai bun Timpul total de lucru pentru oferii companiei analiz i prediciiVariabile luate n calcul: numrul de kilometri care trebuie parcuri i numrul de livrri efectuate eantion pentru 10 zile de munc

  • DATELE PROBLEMEI

    1100 (km)4 (livrri)9,3 (ore)25034,8310048,9410025,855024,268016,877536,688025,999037,6109026,1

  • TABELELE SPSS PENTRU X1 KM PARCURI

    Model SummaryModelRR SquareAdjusted R SquareStd. Error of the Estimate1.776a.601.552 1.09350

    ANOVAbModelSum of SquaresdfMean SquareFSig.1Regression14.434114.434 12.071 .008aResidual9.56681.196Total24.0009

    CoefficientsaModelUnstandardized CoefficientsStandardized Coefficients t Sig. BStd. ErrorBeta1(Constant)1.1281.612 .700 .504VAR00001.067.019.776 3.474 .008

  • PENTRU X1 KILOMETRII PARCURICoeficientul de determinare = 0,60160,10% din variaia timpului lcrat se datoreaz kilometrilor parcuriEroarea standard a estimrii = 1,09350; valoare relativ mic deci punctele sunt apropiate n jurul dreptei de regresiex1 este semnificativ ?- 2,306 < 3,474 < 2,306 (fals), deci resping H0, deci variabila x1 este semnificativSAU, prin alt metod: = 0,05 > 0,008 = sig (din tabelul ANOVA), deci x1 este semnificativa

  • TABELELE SPSS PENTRU X2 NUMR LIVRRI

    Model SummaryModelRR SquareAdjusted R SquareStd. Error of the Estimate1.634a.402.327 1.33964ANOVAbModelSum of SquaresdfMean SquareFSig.1Regression9.64319.643 5.373.049aResidual14.35781.795Total24.0009CoefficientsaModelUnstandardized CoefficientsStandardized Coefficient t Sig. BStd. Error Beta1(Constant)3.8141.274 2.993 .017VAR000011.071.462 .634 2.318 .049

  • PENTRU X2 NUMRUL LIVRRILORCoeficientul de determinare = 0,40240,20% din variaia timpului petrecut la serviciu se datoreaz numrului de livrri efectuateEroarea standard a estimrii = 1,33964, valoare relativ mic deci punctele sunt adunate n jurul dreptei de regresiex2 este semnificativ ?- 2,306 < 2,318 < 2,306 (fals), deci resping H0, deci variabila x2 este semnificativSAU = 0,05 > 0,049 = sig (din tabelul ANOVA), deci x2 este semnificativ

  • TABELELE SPSS PENTRU X1 I X2

    Model SummaryModelRR SquareAdjusted R SquareStd. Error of the Estimate1.889a.790 .729 .84938ANOVAbModelSum of SquaresdfMean SquareFSig.1Regression18.95029.475 13.133.004aResidual5.0507.721Total24.0009CoefficientsaModelUnstandardized CoefficientsStandardized Coefficients t Sig. BStd. Error Beta 1(Constant).0371.326 .028 .979VAR00001.056.016 .649 3.592 .009VAR00002.764.305 .452 2.502 .041

  • PENTRU X1 I X2Odat ce am introdus variabilele n acelai model, coeficientul de determinare multipl a crescut la 0,79079% din variaia timpului petrecut la serviciu se datoreaz distanei parcurse precum i numrului de livrri efectuateEroarea standard a estimrii = 0,84938Odat ce am introdus variabilele n acelai model, eroarea standard a estimrii a sczut la 0,84938

  • OBSERVAIIRegresia n ansamblul ei se dovedete a fi semnificativ pentru c F > (13,133 > 4,74)i ambele variabile i pstreaz semnificaia pentru c n ambele situaii > (3,592 > 2,365 i 2,502 > 2,365)

  • DE ASEMENEA, FOLOSIND SIG. AVEM .Regresia n ansamblul ei se dovedete a fi semnificativ pentru c = 0,05 > 0,004 = sigi ambele variabile i pstreaz semnificaia pentru c n ambele situaii > sig (0,05 > 0,041 i 0,05 > 0,009)

  • OBSERVAIECa urmare a corelaiei slabe dintre cele dou variabile, prezena lor simultan n model aduce beneficii, iar semnificaia ca i contribuia fiecrei variabile n regresie este semnificativa.

  • CONCLUZII:Folosim testul F pentru a testa dac exist o relaie semnificativ ntre y i variabilele independenteFolosim testul t pentru a testa dac parametrii individuali sunt semnificativi

  • VARIABILE CALITATIVE

    Problema firmei de curieratTipul mainii utilizate este de asemenea important n stabilirea timpului de lucru pentru un angajat Avem dou tipuri de maini folosite de curieri: scuter i vanCele dou variabile calitative vor fi notate pe rnd cu 0 i 1

  • Ziua iNr. Km parcuriNumr de livrri Tipul mainii Timp de lucru (y ore) 11004Van9,32503Scuter4,831004Van8,941002Scuter5,85502Scuter4,26801Van6,87753Van6,68802Scuter5,99903Scuter7,610902Van6,1

  • SPSS: 1 = VAN I 0 = SCUTERModel SummaryModelRR SquareAdjusted R SquareStd. Error of the Estimate1.926a.858 .787 .75312

    ANOVAbModelSum of SquaresdfMean SquareFSig.1Regression20.59736.866 12.105.006aResidual3.4036.567Total24.0009

    CoefficientsaModelUnstandardized CoefficientsStandardized Coefficients t Sig. BStd. Error Beta1(Constant).5221.210 .432 .681VAR00001.046.015 .536 3.092 .021VAR00002.710.273 .420 2.606 .040VAR00003.900.528 .290 1.704 .139

  • NOUA ECUAIE ESTIMAT A REGRESIEI

  • OBSERVAIINoua ecuaie de regresie este

    atunci cnd maina este un scuter, ecuaia de regresie se reduce la:

    atunci cnd maina este un van, ecuaia de regresie este:

  • AADAR este de fapt diferena n timpul de lucru care se datoreaz folosirii unui van n loc de un scuter.

  • DIN DATELE CONCRETE DEDUCEM:cea mai bun estimare a diferenei ntre timpul ateptat de lucru care provine din utilizarea unor tipuri diferite de main este de 0,9 ore, adic 54 de minute

  • TESTAREA SEMNIFICAIEItesta semnificaia celei de-a treia variabile n contextul celor dou variabile iniiale stabilim un nivel de semnificaie egal cu 0,05 i ipotezele

  • TESTUL T

  • CONCLUZIInu putem respinge ipoteza nul tipul mainii nu este, de fapt, un factor semnificativ n estimarea timpului de lucru, odat ce numrul de kilometri parcuri i numrul de livrri au fost luate n calcul

  • SPSS: 0 = VAN I 1 = SCUTERModel SummaryModelRR SquareAdjusted R SquareStd. Error of the Estimate1.926a .858 .787 .75312

    ANOVAbModelSum of SquaresdfMean SquareFSig.1Regression20.59736.866 12.105.006aResidual3.4036.567Total24.0009

    CoefficientsaModelUnstandardized CoefficientsStandardized Coefficients t Sig. BStd. Error Beta1(Constant)1.4221.430 .995 .358VAR00001 .046.015 .536 3.092 .021VAR00002 .710.273 .420 2.606 .040VAR00003 -.900.528 -.290 -1.704 .139

  • NOUA ECUAIE ESTIMAT A REGRESIEI

  • OBSERVAIINoua ecuaie de regresie este

    atunci cnd maina este un van, ecuaia de regresie se reduce la:

    atunci cnd maina este un scuter, ecuaia de regresie este:

  • AADAR este de fapt diferena n timpul de lucru care se datoreaz folosirii unui scuter n loc de un van.

  • LA FEL CA MAI DEVREME .

    DIN DATELE CONCRETE DEDUCEM:cea mai bun estimare a diferenei ntre timpul ateptat de lucru care provine din utilizarea unor tipuri diferite de main este de 0,9 ore, adic 54 de minute

  • ANALIZA CORELAIEI DINTRE VARIABILELE INDEPENDENTE

    Model SummaryModel RR Square Adjusted R SquareStd. Error of the Estimate1.280a .079 -.037 19.20480a. Predictors: (Constant), VAR00002

    variabila x1 este considerat ca dependent de x2 coeficientul de determinare este mai mic de 30%

  • TESTAREA PE BAZA TABELELOR SPSSConsiderm un prag de semnificaie = 0,05Valoarea lui t corespunztoare lui , din tabelul distribuiei t pentru n-2 grade de libertate este 2,306 Valoarea lui t corespunztoare lui , din tabelul distribuiei t pentru n-p-1 grade de libertate este 2,365Calculele arat c fiecare model de regresie care include doar una dintre cele dou variabile este destul de semnificativ.

  • Exemplul 2

    n ultimele 12 luni, managerul de la Pizza Shack a publicat o serie de reclame n ziarul local. Informaiie sunt timise la ziar, programate i pltite. Managerul a adunat datele din tabelul urmtor i ar dori s fac o predicie pentru vnzrile de pizza. Se consider un prag de semnificaie 0,01.

  • TABELUL DE DATE PENTRU PROBLEMA 1

    LunaNumrul de anunuri aprute n ziar (x1)Costul anunurilor aprute n ziar (x2)Totalul vnzrilor de pizza (y)Mai1213,943,6Iunie111238Iulie99,330,1August79,739,3Septembrie1212,346,4Octombrie811,434,2Noiembrie69,330,2Decembrie1314,340,7Ianuarie810,238,5Februarie68,422,6Martie811,237,6Aprilie1011,135,2

  • SPSS PENTRU NUMRUL DE ANUNURI N ZIAR (X1)

  • TESTAREA SEMNIFICAIEI LUI X1Pentru un prag de semnificaie 0,01, din tabelul distribuiei t bilateral, avem valoarea lui pentru n 2 = 12 2 = 10 grade de libertate egal cu 3,169Din tabelul coeficienilor, tb1 = 3,952- 3,169 < 3,952 < 3,169 (F), deci resping Ho i X1 semnificativCoeficientul de determinare este 0,610, deci 61% din volumul vnzrilor sunt influenate de numrul anunurilor aprute n ziar

  • SPSS PENTRU COSTUL ANUNURILOR APRUTE N ZIAR (X2)

  • TESTAREA SEMNIFICAIEI LUI X2Pentru un prag de semnificaie 0,01, din tabelul distribuiei t bilateral, avem valoarea lui pentru n 2 = 12 2 = 10 grade de libertate egal cu 3,169Din tabelul coeficienilor, tb1 = 4,538- 3,169 < 4,538 < 3,169 (F), deci resping Ho i X2 semnificativCoeficientul de determinare este 0,673, deci 67,3% din volumul vnzrilor se explic prin costurile anunurilor aprute n ziar

  • TESTM SEMNIFICAIA LUI X1 I X2 N CADRUL REGRESIILOR LINIARE COMPARND VALOAREA LUI SIG CU CEA A LUI ALFA

    Pentru x1, valoarea lui sig din tabelul coeficienilor este 0,003 mai mic dect alfa care este 0,01, deci x1 este semnificativPentru x2, valoarea lui sig din tabelul coeficienilor este 0,001 mai mic dect cea a lui alfa care are valoarea 0,01, deci x2 este semnificativ

  • SPSS PENTRU NUMRUL DE ANUNURI APRUTE N ZIAR I COSTUL ANUNURILOR APRUTE N ZIAR

  • TESTM SEMNIFICAIA REGRESIEI PERANSAMBLUPentru testarea semnificaiei regresiei peransamblu, comparm sig = 0,006 (din tabelul ANOVA) i alfa = 0,01; sig este mai mic dect alfa, deci regresia este semnificativDe asemenea sig pentru x1 din tabelul coeficienilor n cazul regresiei bifactoriale este 0,591 mai mare dect alfa, deci x1 este nesemnificativValoarea lui sig pentru x2 din tabelul coeficienilor n cazul regresiei bifactoriale este 0,180 mai mare dect alfa, deci x2 este nesemnificativ

  • MAI MULT...Am vzul c n cazul regresiei liniare, luate separat, x1 explic 61% din variaia lui y i este semnificativ iar x2 explic 67,3% din variaia lui y i este semnificativ pentru acestaDe asemenea, putem vedea n tabelele precedente c x1 i x2 puse la un loc n regresia bifactorial explic 68,4% Observm c valoarea coeficientului de regresie bifactorial este 68,4% cu numai 1,1 % mai mult dect valoarea coeficientului n cazul regresiei liniare formate din x2 i y

  • CONCLUZIIAvem deci, o regresie bifactorial semnificativ dar x1 i x2 sunt nesemnificativi.De asemenea, nu trebuie s uitm c luate separat n regresii liniare, att x1 ct i x2 erau semnificative pentru yi totui, ce s-a intmplat ?Contradicia este explicat de corelaia puternic dintre cele dou variabile explicative. Costurile pentru anunurile aprute n ziar vor depinde de numrul acestora. Care din variabile explic variaia vnzrilor ?Ambele, deoarece dup cum spuneam, corelaia dintre ele este puternic i nu le putem separa.

  • VARIABILE CALITATIVEManagerul de la Pizza Shack vrea s vad dac ziua n care apare anunul influeneaz sau nu vnzrileConsider astfel reclama fcut n cursul sptmnii (S) i cea facut n week-end (W)Avem urmtoarele date

  • LunaNumrul de anunuri aprute n ziar (x1)Costul anunurilor aprute n ziar (x2)Ziua n care apare anunulTotalul vnzrilor de pizza (y)Mai1213,9S43,6Iunie1112S38Iulie99,3W30,1August79,7S39,3Septembrie1212,3W46,4Octombrie811,4S34,2Noiembrie69,3W30,2Decembrie1314,3W40,7Ianuarie810,2W38,5Februarie68,4S22,6Martie811,2W37,6Aprilie1011,1S35,2

  • SPSS: 1 = N CURSUL SPTMNII I 0 = N WEEK-ENDModel SummaryModelRR SquareAdjusted R SquareStd. Error of the Estimate1.846a.717.6104.00743

    ANOVAbModelSum of SquaresdfMean SquareFSig.1Regression324.7103108.2376.740.014aResidual128.476816.060Total453.18711

    CoefficientsaModelUnstandardized CoefficientsStandardized CoefficientstSig.BStd. ErrorBeta1(Constant)7.0968.599.825.433VAR00001.4581.139.172.402.698VAR000022.3311.491.6661.564.156VAR00003-2.2422.341-.182-.958.366

  • SPSS: 0 = N CURSUL SPTMNII I 1 = N WEEK-ENDModel SummaryModelRR SquareAdjusted R SquareStd. Error of the Estimate1.846a.717.6104.00743ANOVAbModelSum of SquaresdfMean SquareFSig.1Regression324.7103108.2376.740.014aResidual128.476816.060Total453.18711CoefficientsaModelUnstandardized CoefficientsStandardized CoefficientstSig.BStd. ErrorBeta1(Constant)4.8548.770.553.595VAR00001.4581.139.172.402.698VAR000022.3311.491.6661.564.156VAR000032.2422.341.182.958.366

  • CONCLUZIIPentru pragul de semnificaie 0,05 avem = 1,860 Limitele regiunii de acceptare sunt: (- 6,59626, 2,11226) b3 = - 2,242 este n regiunea de acceptareAccept Ho, = 0

    *********************