metoda de regresie liniara simpla

Upload: dragoi-cristian

Post on 04-Apr-2018

291 views

Category:

Documents


1 download

TRANSCRIPT

  • 7/29/2019 Metoda de regresie liniara simpla

    1/22

    Seminar aplicatii ale metodei de

    regresie liniara simpla (unifactoriala)

    Modelare Economica semestrul II,

    an univ. 2010- 2011

    1ME aplicatii seminar - an univ. 2010-2011

  • 7/29/2019 Metoda de regresie liniara simpla

    2/22

    Metode cauzate - Regresia

    Scopul analizei de regresie: de a arta cum este legat o variabil Y de una sau mai

    multe variabile Xi cu ajutorul unei ecuaii care d posibilitatea de a previzionavariabilele dependente n funcie de valorile cunoscute ale variabilelor

    independente Xi.

    Prin analiza de corelaie se urmrete: msurarea gradului de interdependen

    ntre variabila dependent Y i variabilele independente Xi, interdependen

    explicat prin ecuaia de regresie utilizat.

    ME aplicatii seminar - an univ. 2010-2011 2

  • 7/29/2019 Metoda de regresie liniara simpla

    3/22

    Corelatia

    - evaluarea gradului de asociere ntrevariabilele independente, atunci cnd

    ecuaia de regresie conine cel puin douvariabile independente Xi. Aceasta arat nce msurdou valori sunt legate ntre eleintensitatea legturii este exprimat cuajutorul a doi indicatori:

    coeficientul de corelaie (R) msoarputerea relaiei de dependen liniar

    printr-o valoare numeric ntre1 i 1 coeficientul de determinare (R2) - msoar

    reducerea relativ n variaia lui Yce poatefi atribuit cunoaterii factorilor Xi i arelaieiY = f(X).

    De exemplu, o valoare R2=0.76 indicc aproximativ76% din variaia total a variabilei Y poate fi

    explicat prin variabilele dependente X incluse nmodel (o valoare 0.8 este consideratacceptabil).

    ME aplicatii seminar - an univ. 2010-2011 3

  • 7/29/2019 Metoda de regresie liniara simpla

    4/22

    Regresia liniar simpl- exprimat prin ecuaia de regresie:

    Pentru a aprecia semnificaia estimatorilor:

    pentru un set de date de volum se aplictestulStudentcu n-2 grade de libertate

    pentru se aplic testul z al distribuiei normale[1]

    formulnd ipotezele: H0: a=0ib=0iHa : a si b au semnificatiestatistica

    Dac i atunci ipoteza H0 se respinge i se apreciaz ca a ib sunt

    semnificativi din punct de vedere statistic.

    [1]Teorema de limitcentralstabiletec suma (i media) unei mulimi de variabile aleatoare urmeaz o distribuienormal, dac eantionul este suficient de mare, indiferent de forma distribuiei de la care provine variabilaindividual. Teorema este folosit adesea pentru a explica ipoteza de normalitate a termenului de eroare nstudiul econometric, care permite folosirea testului statistic tpentru testarea ipotezelor, deoarece acest termende eroare se presupune cnglobeaz suma unei mulimi aleatoare de factori necunoscui(omii).

    ta

    a

    tb

    b

    30n

    30n

    ii xbaY

    4ME aplicatii seminar - an univ. 2010-2011

  • 7/29/2019 Metoda de regresie liniara simpla

    5/22

    Interpretarea rezultatelor testarea semnificatie coeficientilor de regresie

    Test statistic (statistical test) formula matematica sau functie care se foloseste pentru a stabilidiferentaobservata intre rezultatele obtinute in grupul tratat si cele obtinute in grupul de control suntsuficient de mari pentru a concluziona ca sunt statistic semnificative. Testele statistice determina o valoarecare se asociaza cu valoarea lui P. Exista mai multe tipuri de teste statistice: F, t, Z si chi-patrat. Alegereatipului de studiu depinde de conditiile in care se realizeaza studiul, ex. ce variabile de rezultat exista, daca saunu pacientii din studiu au fost in mod randomizat alesi dintr-o populatie generala sau daca se poate sustineca rezultatele finale intr-o populatie au o distributie normala sau un alt tip de distributie.

    Testarea ipotezei (hypothesis testing) modalitatea de interpretare a rezultatelor unui studiu clinic (trial) careimplica stabilirea probabilitatii ca observarea unui efect la tratament sa fi aparut numai datorita intamplarii(sansei) daca ipoteza specificata se dovedeste adevarata. In mod normal ipoteza specificata este o ipotezanula, care este formulata inainte de inceperea sudiului si presupune ca interventia din studiu nu are un efectreal / adevarat. Testarea ipotezei se foloseste pentru a determina daca ipoteza nula este sau nu respinsa

    Ipoteza nula (null hypothesis) in testarea ipotezei, ipoteza care spune ca interventia nu are nici un efect ex.arata ca nu exista nici o deosebire intre rezultatele obtinute de grupul de tratament si cele din grupul control.Daca testul statistic indica faptul ca valoarea P se afla la sau deasupra unei valori specificate a (ex. 0.01 sau0.05, care reprezinta probabilitatea de a face eroare pozitiva - false-positive error) atunci orice efect observatal tratamentului nu este semnificativ statistic iar ipoteza nula nu poate fi respinsa. Daca valoarea P este maimica decat valoarea specificata a lui a, atunci efectul tratamentului este statistic semnificativ iar ipotezanula va fi respinsa. Daca intervalul de incredere (ex. de 95% sau 99%) include efect 0 al tratamentului ,atunci ipoteza nula nu poate fi respinsa .

    ME aplicatii seminar - an univ. 2010-2011 5

  • 7/29/2019 Metoda de regresie liniara simpla

    6/22

    Interpretarea rezultatelor testarea semnificatie coeficientilor de regresie

    Intervalul de incredere (confidence interval) - stabileste gradul de incertitudine privind estimarea construita. Secalculeaza din diferenta observata intre datele reale obtinute si cele obtinute in grupul de control sidimensiunea esantionului de studiu. Intervalul de incredere este sirul de valori aflate deasupra si sub punctulestimat care este probabil si include valoarea adevarata a efectului tratamentului. Folosirea intervalului deincredere presupune ca un studiu furnizeaza un esantion de observatii (din multe esantioane posibile) care arfi obtinut daca studiul se repeta de mai multe ori. Frecvent se foloseste un interval de incredere de 90% , 95%sau 99%. Astfel exista o probabilitate de 95% ca intervalul de incredere 95% calculat intr-un studiu sa includa

    valoarea reala a efectului tratamentului. De exemplu, in testarea unui tratament medical, daca intervalul deincredere include un efect terapeutic nul ipoteza nula care spune ca nu exista nici un efect al tratamentuluinu poate fi respinsa.

    Semnificatie statistica (statistical significance) concluzia, stabilita cu un test statistic, ca o interventie are unefect real, bazata pe diferenta observata intre rezultatele obtinute in grupul tratat si cele obtinute in grupulde control, grupuri care sunt suficient de mari astfel incat diferentele sa nu fie datorate intamplarii.Semnificatia statistica indica probabilitatea ca diferentele observate sa se datoreasca sansei daca ipoteza nulaeste adevarata; nu furnizeaza informatii despre magnitudinea efectului unui tratament. (Semnificatia

    statistica este necesara dar nu suficienta in stabilirea semnificatiei clinice).

    Valoarea P (Pvalue) in testarea ipotezei, probabilitatea ca o diferenta observata intre rezultatele obtinute ingrupurile de interventie si control sa se datoreze numai intamplarii (sansei) daca ipoteza nula este adevarata.Daca valoarea lui P este mai mica decat valoarea specificata a (in mod uzual 0.01 sau 0.05) aleasa de lainceput in studiu, atunci ipoteza nula va fi respinsa.

    ME aplicatii seminar - an univ. 2010-2011 6

  • 7/29/2019 Metoda de regresie liniara simpla

    7/22

    Semnificaia statistic a parametrilor modeluluiDistribuia t(Student)*1+ se folosete n testele ipotezelor pe eantioane mici i n care variana variabilei respective

    trebuie estimat n raport cu datele. Este o distribuie de probabilitate n form de clopot, n care valoareamedie este egal cu zero, dispersia variabilelor n jurul valorii medii fiind dependent de gradele de libertate*2+

    dictate de mrimea eantionului. Gradele de libertate arat numrul de elemente informaionale care pot variaindependent unul de altul; se spune c un eantion de n observaii are n grade de libertate. De exemplu,calcularea unei medii simple a eantionului implic pierderea unui grad de libertate deoarece variaiileindependente n n-1din observaiile din eantion vor necesita o schimbare compensatorie n cel de al n leagrad de libertate, pentru a se menine valoarea medie a eantionului. Tot astfel, calcularea valorilor pentru unnumr de kparametri n cadrul unui exemplu econometric implic pierderea a kgrade de libertate, rmnnd(n-k).

    Dac erorile sunt distribuite normal se ateapt ca aproximativ 68% dintre valorile lui ys fie situate ntr-un intervalmai mic de (eroarea standard de previziune) uniti fa de valoarea medie, sau 95% la mai puin de 2 sau 99%la mai puin de 3.

    Fiecare din parametrii estimai este caracterizat de o eroare standard deoarece determinarea lor se face pe bazaunui eantion de date; probabil un alt eantion ar duce la obinerea altor valori ale parametrilor modelului.Valoarea aproximativ a statisticii tde verificare a semnificaiei coeficienilor modelului se calculeaz cu relaia:

    Ca regul, se realizeaz excluderea din model a oricrui coeficient pentru care . Orice coeficient pentru care estediferit de zero la un nivel de semnificaie de aproximativ 5%. Includerea n model a unor coeficieni cu valoriabsolute ale statisticii testului tsubstanial mai mici dect 2,0 va spori numrul parametrilor modelului i va

    duce la reducerea preciziei prediciei.

    [1] Testul teste testul cel mai des utilizat n analizele economice cantitative i este definit ca raportul dintre o variabil normal i o variabil mprit la numrul gradelor de libertate.

    [2] Gradele de libertatearat numrul de elemente informaionale care pot varia independent unul de altul. Se spune c uneantion de n observaii are ngrade de libertate. Totui, calcularea mediei simple a eantionului implic pierderea unui grad delibertate deoarece variaiile independente n n-1din observaiile din eantion vor necesita o schimbare compensatorie n cel de al- n -lea grad de libertate, pentru a se menine valoarea medie a eantionului. Tot astfel, calcularea valorilor pentru un numr de kparametri n cadrul unui exemplu econometric implic pierderea a kgrade de libertate, rmnnd (n-k).Gradele de libertate intradesea ca parametri n distribuii de probabilitate (distribuia tsau ) crora le poate afecta alura n mod fundamental.

    uluicoeficientaestimatadardtanseroarea

    ipotezaprinuluicoeficientvaloareaestimatcoeficientt

    7ME aplicatii seminar - an univ. 2010-2011

  • 7/29/2019 Metoda de regresie liniara simpla

    8/22

    Interpretarea riscului de acceptare / respingere a H0

    Eroare de tip I este dat de respingereaipotezei nule atunci cnd, de fapt,aceasta ar fi trebuit acceptat;

    se confirm/valideaz o ipotez care nueste adevrat

    impact: concluzii gresite care pot ducela identificarea unor soluii/deciziiinadecvate

    Eroarea de tip II este urmareaacceptrii ipotezei nule cnd, de fapt,aceasta trebuie respins:

    n fapt, se ignor/ se pierde un efectimportant

    in consecint, se pot trata doualternative/ opiuni ca identice dei, nrealitate, acestea sunt diferite.

    8ME aplicatii seminar - an univ. 2010-2011

  • 7/29/2019 Metoda de regresie liniara simpla

    9/22

    Principiul analizei dispersionaleDATA = FIT + RESIDUAL

    9ME aplicatii seminar - an univ. 2010-2011

  • 7/29/2019 Metoda de regresie liniara simpla

    10/22

    Perform a regression analysis

    Linear regression produces the slope of a line that best fits a single set of data. Based on a year's worthof sales figures, for example, linear regression can tell you the projected sales for March of thefollowing year by giving you the slope and y-intercept (that is, the point where the line crosses the y-axis) of the line that best fits the sales data. By following the line forward in time, you can estimatefuture sales, if you can safely assume that growth will remain linear.

    Exponential regression produces an exponential curve that best fits a set of data that you suspect doesnot change linearly with time. For example, a series of measurements of population growth will nearlyalways be better represented by an exponential curve than by a line.

    Multiple regression is the analysis of more than one set of data, which often produces a more realistic

    projection. You can perform both linear and exponential multiple regression analyses. For example,suppose you want to project the appropriate price for a house in your area based on square footage,number of bathrooms, lot size, and age. Using a multiple regression formula, you can estimate a price,based on a database of information gathered from existing houses.

    Linear regression

    The equation y = mx + b algebraically describes a straight line for a set of data with one independentvariable where x is the independent variable, y is the dependent variable, m represents the slope ofthe line, and b represents the y-intercept.

    If a line represents a number of independent variables in a multiple regression analysis to an expectedresult, the equation of the regression line takes the form y=m1x1+m2x2+...+mnxn+b in which y is thedependent variable,x1 throughxn are n independent variables, m1 through mn are the coefficients ofeach independent variable, and b is a constant.

    10ME aplicatii seminar - an univ. 2010-2011

  • 7/29/2019 Metoda de regresie liniara simpla

    11/22

    Calculating exponential regression

    Unlike linear regression, which plots values along a

    straight line, exponential regression describes a

    curve by calculating the array of values needed to

    plot it.

    The equation that describes an exponential regression

    curve is y = b * m1x1* m2

    x2* * mnxn

    If you have only one independent variable, theequation is y = b * m

    x

    11ME aplicatii seminar - an univ. 2010-2011

  • 7/29/2019 Metoda de regresie liniara simpla

    12/22

    Analysis ToolPak (Pachet de instrumente de

    analiz)

    Instrumentul de analiz Regresie execut analiza de regresieliniar prin utilizarea metodei ptratelor mici pentru agsi o linie care corespunde unui set de observaii. Aveiposibilitatea analizrii modului n care o singur variabildependent este afectat de valorile uneia sau a maimultor variabile independente.

    http://office.microsoft.com/ro-ro/excel-help/despre-instrumentele-de-analiza-statistica-HP005203873.aspx

    12ME aplicatii seminar - an univ. 2010-2011

    http://office.microsoft.com/ro-ro/excel-help/despre-instrumentele-de-analiza-statistica-HP005203873.aspxhttp://office.microsoft.com/ro-ro/excel-help/despre-instrumentele-de-analiza-statistica-HP005203873.aspxhttp://office.microsoft.com/ro-ro/excel-help/despre-instrumentele-de-analiza-statistica-HP005203873.aspxhttp://office.microsoft.com/ro-ro/excel-help/despre-instrumentele-de-analiza-statistica-HP005203873.aspxhttp://office.microsoft.com/ro-ro/excel-help/despre-instrumentele-de-analiza-statistica-HP005203873.aspxhttp://office.microsoft.com/ro-ro/excel-help/despre-instrumentele-de-analiza-statistica-HP005203873.aspxhttp://office.microsoft.com/ro-ro/excel-help/despre-instrumentele-de-analiza-statistica-HP005203873.aspxhttp://office.microsoft.com/ro-ro/excel-help/despre-instrumentele-de-analiza-statistica-HP005203873.aspxhttp://office.microsoft.com/ro-ro/excel-help/despre-instrumentele-de-analiza-statistica-HP005203873.aspxhttp://office.microsoft.com/ro-ro/excel-help/despre-instrumentele-de-analiza-statistica-HP005203873.aspxhttp://office.microsoft.com/ro-ro/excel-help/despre-instrumentele-de-analiza-statistica-HP005203873.aspxhttp://office.microsoft.com/ro-ro/excel-help/despre-instrumentele-de-analiza-statistica-HP005203873.aspxhttp://office.microsoft.com/ro-ro/excel-help/despre-instrumentele-de-analiza-statistica-HP005203873.aspxhttp://office.microsoft.com/ro-ro/excel-help/despre-instrumentele-de-analiza-statistica-HP005203873.aspxhttp://office.microsoft.com/ro-ro/excel-help/despre-instrumentele-de-analiza-statistica-HP005203873.aspxhttp://office.microsoft.com/ro-ro/excel-help/despre-instrumentele-de-analiza-statistica-HP005203873.aspxhttp://office.microsoft.com/ro-ro/excel-help/despre-instrumentele-de-analiza-statistica-HP005203873.aspx
  • 7/29/2019 Metoda de regresie liniara simpla

    13/22

    Lucrul cu EXCEL - Perform a regression analysis

    Linear regression produces the slope of a line that best fits a single set of data.Based on a year's worth of sales figures, for example, linear regression can tell you the projected sales for March

    of the following year by giving you the slope and y-intercept (that is, the point where the line crosses the y-axis) of the line that best fits the sales data. By following the line forward in time, you can estimate futuresales, if you can safely assume that growth will remain linear.

    Exponential regression produces an exponential curve that best fits a set of data that yoususpect does not change linearly with time.

    For example, a series of measurements of population growth will nearly always be better represented by anexponential curve than by a line.

    Multiple regression is the analysis of more than one set of data, which often produces a more

    realistic projection. You can perform both linear and exponential multiple regression analyses.

    Linear regression

    The equation y = mx + b algebraically describes a straight line for a set of data with oneindependent variable where x is the independent variable, y is the dependent variable, mrepresents the slope of the line, and b represents the y-intercept.

    If a line represents a number of independent variables in a multiple regression analysis to an

    expected result, the equation of the regression line takes the form y=m1x1+m2x2+...+mnxn+b inwhich y is the dependent variable, x1 through xn are n independent variables, m1 through mnare the coefficients of each independent variable, and b is a constant.

    Non-Linear regression Unlike linear regression, which plots values along a straight line,exponential regression describes a curve by calculating the array of values needed to plot it.The equation that describes an exponential regression curve isy = b * m1

    x1* m2x2 * * mn

    xn. Ifyou have only one independent variable, the equation isy = b * m

    x

    13ME aplicatii seminar - an univ. 2010-2011

  • 7/29/2019 Metoda de regresie liniara simpla

    14/22

    Studiu de caz previziunea cursului de schimb

    valutar leu-euro februarie 2011-

    Extragere de date info financiar BNR

    MSS - MAPSS - 2010 - 2011 1414ME aplicatii seminar - an univ. 2010-2011

  • 7/29/2019 Metoda de regresie liniara simpla

    15/22

    15ME aplicatii seminar - an univ. 2010-2011

  • 7/29/2019 Metoda de regresie liniara simpla

    16/22

    16ME aplicatii seminar - an univ. 2010-2011

  • 7/29/2019 Metoda de regresie liniara simpla

    17/22

    17ME aplicatii seminar - an univ. 2010-2011

  • 7/29/2019 Metoda de regresie liniara simpla

    18/22

    18ME aplicatii seminar - an univ. 2010-2011

  • 7/29/2019 Metoda de regresie liniara simpla

    19/22

    19ME aplicatii seminar - an univ. 2010-2011

  • 7/29/2019 Metoda de regresie liniara simpla

    20/22

    20ME aplicatii seminar - an univ. 2010-2011

  • 7/29/2019 Metoda de regresie liniara simpla

    21/22

    21ME aplicatii seminar - an univ. 2010-2011

  • 7/29/2019 Metoda de regresie liniara simpla

    22/22

    22ME aplicatii seminar - an univ. 2010-2011