curs bazele statisticii partea i 2015

48
BAZELE STATISTICII - anul universitar 2014-2015 -

Upload: simon-mihai

Post on 16-Nov-2015

66 views

Category:

Documents


6 download

DESCRIPTION

Bazele statisticii

TRANSCRIPT

  • BAZELE STATISTICII - anul universitar 2014-2015 -

  • Programa analiticStatistica descriptivNoiuni fundamentaleAnaliza unei serii statistice unidimensionale, folosind metode grafice i numerice (variabile numerice sau cantitative: indicatori ai tendinei centrale, indicatori ai dispersiei i indicatori ai formei; variabile nenumerice sau calitative).

  • Programa analiticStatistica inferenialNoiuni fundamentaleEstimarea parametrilor unei populaiiTestarea statistic

  • BibliografieAndrei, T., Statistic i econometrie, Ed. Economic, 2003.Brbat, A., Teoria statisticii sociale, Editura Didactic i Pedagogic, Bucureti, 1972.Biji, E.M., Lilea, E., Roca, E., Vtui, M., Statistic aplicat n economie, Editura Universal Dalsi, 2000Jaba, E., Statistica, ed. a 3-a, Ed. Economic, Bucureti, 2002.

  • BibliografieJaba, E., Pintilescu, C. Statistic. Teste gril i probleme, ed. a 2-a, Editura Sedcom Libris, Iai, 2007Jemna, D., Econometrie, Editura Sedcom Libris, Iai, 2012.James T. McClave, P. George Benson, Terry Sincich, Statistics for Business and Economics, Pearson, Education New Jersey , 2008. arc, M., Tratat de statistic aplicat, Editura Didactic i Pedagogic, Bucureti, 1998.Wonnacott, H., Wonnacott, T., Statistiques, Economica, Paris, 1991.

  • 1. Noiuni fundamentale

    1.1. Rolul statisticii n economie1.2. Concepte fundamentale1.3. Tipuri de variabile statistice1.4. Scale de msurare1.5. Metode de culegere a datelor

  • 1.1. Rolul statisticii n economieStatistica descriptiv:Metodele descriptive se refer la descrierea unei populaii sau colectiviti cu ajutorul graficelor, tabelelor i a unor indicatori statistici descriptivi care sintetizeaz informaia de la nivelul tuturor unitilor statistice analizate.

    Statistica inferenial:Metodele infereniale au la baz ideea culegerii datelor, a prelucrrii i analizei acestora de la nivelul unui eantion reprezentativ extras din populaie dup un procedeu tiinific corespunztor. Obiectivul principal al accestor metode este estimarea unor parametri i testarea unor ipoteze care privesc realitatea analizat.

  • 1.2. Concepte fundamentale ale statisticiiPopulaia statisticreprezint o mulime de elemente care pot fi reprezentate de obiecte, persoane, fapte, evenimente sau procese din lumea real.volumul unei populaii se noteaz cu N.

  • b. EantionulReprezint un sub-ansamblu de uniti ale unei populaii extras din populaia statistic dup anumite procedee.Aplicarea acestor procedee trebuie s asigure reprezentativitatea eantionului. Volumul eantionului se noteaz cu n.

    c. Unitile statisticesunt elementele componente ale unei populaii statistice.

  • d. Variabila statisticreprezint nsuirea, trstura esenial purtat de unitile statistice ale unei populaii. se noteaz cu X. Valorile (variantele) variabilei se noteaz cu xi.

    e. Indicatorul statisticeste o mrime statistic, rezultatul numeric al unei numrri, al unei msurri statistice sau al unui calcul asupra datelor obinute printr-o nregistrare statistic.

  • f. Indice statisticeste o mrime statistic relativ care se obine prin compararea, sub form de raport, a dou valori ale unui indicator statistic.

  • 1.3. Tipuri de variabile statistice dup modul de exprimare:

    Variabile numerice (cantitative): variabile discrete; variabile continue.

    Variabile nenumerice (calitative): variabile nominale. Caz particular: variabile alternative (dummy).variabile ordinale.

  • 1.4. Scale de msuraren vederea msurrii unei variabile pentru o unitate statistic, valorilor unei variabile li se atribuie coduri numerice sau simboluri. Scala este reprezentat de aceste coduri sau numere atribuite valorilor variabilei X.

    Tipuri de scale1. Variabile calitativea. Scala nominal presupune acordarea de numere (coduri) fiecrei categorii a unei populaii.

  • 1.4. Scale de msurareeste caracteristic variabilelor nominale.

    b. Scala ordinal presupune ca atribuirea de coduri numerice pentru fiecare categorie s se realizeze n ordine cresctoare sau descresctoare, dup importana lor. este caracteristic variabilelor ordinale.

    2. Variabile cantitativea. Scala interval are ca proprieti identitatea, ordinea i faptul c intervalul ntre numere are un sens.

  • 1.4. Scale de msurarese poate, astfel, compara diferena dintre dou valori ale aceleiai variabile.

    Exemplu: - msurarea temperaturii n sistemul Celsius i n sistemul Fahrenheit: diferena dintre dou temperaturi are un sens.

  • 1.4. Scale de msurareb. Scala raport are aceleai proprieti ca scala interval i, n plus, este caracterizat printr-un punct de referin (zero absolut).diferena i raportul dintre dou valori au sens.

  • 1.5. Metode de culegere a datelorSurse de date statistice

    Anuarul Statistic al Romniei editat de Institutul Naional de Statistic (INS) (www.insse.ro) .

    Oficiul Statistic al Uniunii Europene EUROSTAT.

    Adresa: http://europa.eu.int/comm/eurostat

  • 2. Lucrri de nregistrare statistica. Recensmntul

    b. Rapoarte statistice

    c. Anchete prin sondaj

    d. Monografia statistic

  • 2. Analiza unei serii statistice unidimensionale2.1. Variabile cantitative

    Variabil discret

    A.1. Prezentarea seriei (distribuiei) statisticeseria simpl X:(xi), cu i=1,m , cnd n1=n2= =ni.seria cu frecvene diferite X: , cnd ninj.

    X: , cu fi=ni/n.

  • Frecvene absolute cumulate cresctor (Ni ) sau descresctor (Ni )

    - exprim numrul de uniti statistice cumulate pn la sau peste nivelul considerat al caracteristicii, adic valori xi, respectiv xi.

  • Frecvene relative cumulate cresctor (Fi ) sau descresctor (Fi )

    - exprim ponderea unitilor statistice cumulate pn la sau peste nivelul considerat al caracteristicii, adic valori xi, respectiv xi.

  • A.2. Analiza seriei folosind metode numericePresupune calculul indicatorilor statisticii descriptive, cunoscui i sub denumirea de caracteristici numerice ale unei distribuii.

    A.2.1. Indicatori ai tendinei centrale (mrimi medii)

    a. Definire: mediile sunt acele valori n jurul crora se repartizeaz unitile unei populaii. cele mai importante mrimi medii sunt media aritmetic, modul i mediana.

  • A.2. Analiza seriei folosind metode numericeb. Media aritmetic ( )Media aritmetic este valoarea pe care am observa-o dac unitile statistice ar nregistra aceleai valori ale variabilei (dac nu ar exista variaii ale valorilor nregistrate de unitile statistice).

  • Mod de calcul n cazul seriilor simple i seriilor cu frecvene diferite (variabil discret).Media simpl:

    Media ponderat.

    sau

    Observaie: Media aritmetic este sensibil la prezena valorilor extreme (outliers).

  • Cele mai importante proprieti ale mediei aritmetice:1. Media unei distribuii este o valoare intern:xmin xmax.

    2. Media este o mrime normal: suma abaterilor valorilor individuale ale unei variabile X de la media lor este egal cu zero.

  • c. Modul (Mo) este valoarea variabilei cea mai frecvent observat ntr-o distribuie, adic valoarea xi care corespunde frecvenei maxime (nimax).

    Observaie:modul poate fi aflat doar n cazul seriilor cu frecvene diferite.o distribuie poate avea una, dou sau mai multe valori modale (serii unimodale, bimodale sau plurimodale).

    Interpretare: Cele mai multe uniti nregistreaz valoarea modal.

  • d. Mediana (Me) este acea valoare a variabilei unei serii ordonate, cresctor sau descresctor, pn la care i peste care sunt distribuite n numr egal unitile colectivitii: jumtate din uniti (50%) au valori mai mici dect mediana, iar jumtate (50%) au valori mai mari dect mediana.corespunde locului unitii mediane calculate astfel:

  • Aflarea medianei se face diferit n funcie de tipul seriei:

    1. Serii simple: numr impar de termeni. numr par de termeni.

    2. Serii cu frecvene diferitese calculeaz unitatea median (UMe).se calculeaz se afl prima valoarevaloarea xi corespunztoare acesteia este Me.

    Observaie:mediana nu este influenat de valorile extreme.

  • f. Quartilelesunt valori ale variabilei care mpart volumul eantionului n 4 pri egale.reprezentare grafic i mod de calcul ( Q1, Q2, Q3).

    g. Decilesunt valori ale variabilei care mpart volumul eantionului n 10 pri egale.decila unu (D1) i decila 9 (D9).

  • A.2.2. Indicatori ai dispersiei (variaiei) Definire: dispersia exprim gradul de variaie a valorilor individuale ale unei variabile fa de nivelul mediu.aprecierea fenomenului de dispersie al unei distribuii permite identificarea gradului de reprezentativitate a mediei unei distribuii.

  • Indicatori sintetici ai dispersiei:1. Abaterea medie liniar, respectiv

    arat cu ct variaz, n medie, valorile xi ale variabilei fa de nivelul mediu al distribuiei, n sens pozitiv i negativ.

  • 2. Variana, respectivVariana este ntotdeauna pozitiv, nu are unitate de msur i nu se interpreteaz.Prin ridicarea la ptrat a abaterilor valorilor xi fa de medie crete influena valorilor extreme asupra nivelului varianei.

  • 3. Abaterea standard (s)arat cu ct variaz, n medie, valorile xi ale variabilei fa de nivelul mediu al distribuiei, n sens pozitiv i negativ.se calculeaz ca radical din varian.se exprim n aceeai unitate de msur cu cea a variabilei.

  • 4. Coeficientul de variaie (v)

    se exprim n procente.valori ridicate ale acestui coeficient (v>50%) arat o distribuie eterogen, care se caracterizeaz printr-o variaie mare a valorilor xi fa de nivelul mediu i o medie nereprezentativ.este sensibil fa de valoarea mediei: cu ct media este mai apropiat de zero, cu att coeficientul de variaie este mai dificil de folosit (tinde spre infinit).

  • 5. Intervalul interquartilicIQ=Q3-Q1.- cuprinde 50% din volumul eantionului.

    n mod sintetic, cele mai importante caracteristici numerice ale unei distribuii pot fi cuplate astfel:media - abaterea standard - coeficientul de variaie;mediana - intervalul interquartilic.

  • A.2.3. Indicatori ai formeiAsimetria: - reprezint o deviere de la forma simetric a unei distribuii.

    Asimetria poate fi apreciat:pe cale grafic: curba frecvenelor, diagrama box-plot.pe cale numeric: - prin calculul indicatorilor de asimetrie (Skewness).

    Coeficientul de asimetrie Fisher:, cu

  • Relaii ntre cele trei mrimi medii Arat forma unei distribuii:Cnd distribuia este simetric.Cnd distribuia este asimetric la dreapta (asimetrie pozitiv).Cnd distribuia este asimetric la stnga (asimetrie negativ).

  • 2. Boltirea- este definit prin compararea distribuiei empirice cu distribuia normal din punctul de vedere al variaiei variabilei X i a frecvenei ni.Boltirea poate fi apreciat: pe cale grafic: curba frecvenelor.numeric: prin calculul indicatorilor boltirii (kurtosis).Coeficientul de boltire Fisher:, cu

  • A.3. Analiza seriei folosind metode graficePoligonul frecvenelor: construirea acestuia presupune gsirea locului geometric al punctelor Ai de coordonate (xi,ni) sau (xi,fi) i unirea acestora prin segmente de dreapt.aproximeaz forma unei distribuii.b. Histogramac. Curba frecvenelorpresupune ajustarea printr-o linie curb, continu a histogramei.aproximeaz mai bine forma de distribuie a colectivitii dup variabila considerat, comparativ cu histograma.

  • d. Reprezentarea diagramei box-plot sau box-and-whiskersForma diagramei (D1, Q1, Q2, Q3, D9);

    Avantaje:

    - permite aprecierea nivelului mediu (Me), dispersiei i asimetriei unei distribuiei;- faciliteaz compararea mai multor distribuii (prin reprezentarea simultan a diagramelor).

  • Diagrama box-plot

  • identificarea valorilor extreme i analiza influenei lor asupra rezultatelor statistice (diagrama box-plot).

  • Indicatorii statisticii descriptive n Excel

    Column1Mean8.6Standard Error0.347735Median8Mode10Standard Deviation1.904622Sample Variance3.627586Kurtosis-0.14315Skewness-0.40554Range8Minimum4Maximum12Sum258Count30

  • B. Variabil continuB.1. Prezentarea seriei statisticegruparea unitilor statistice este realizat pe intervale de variaie. Observaie:Gruparea pe intervale de variaie duce la pierderea unei pri a informaiei iniiale.

    B.2. Prelucrarea seriei statistice folosind metode graficea. Histograma

  • b. Poligonul frecvenelorc. Curba frecvenelor

    B.3. Indicatori ai statisticii descriptive - se calculeaz n mod identic, prin discretizarea variabilei (calculul mijlocului intervalelor de variaie).

  • 2. Analiza unei serii univariate

    2.2. Variabil calitativ

    I. Tipuri de variabileVariabile nominaleVariabile ordinale

  • II. Indicatori specifici si reprezentare grafica) Variabile nominale:Pentru a reprezenta structura pe categorii la nivelul unui eantion se calculeaz frecvene relative.Reprezentarea frecvenelor pentru un eantion se realizeaz folosind diagramele: Bar Chart sau Pie Chart.Indicatori specifici: modul.

    b) Variabile ordinale:Reprezentarea frecvenelor pentru un eantion se realizeaz folosind diagramele: Bar Chart sau Pie Chart.Frecvene absolute i relative.Indicatori specifici: modul i quartilele.