ser var tendcentru 2015

Upload: ana-tuchila

Post on 10-Mar-2016

230 views

Category:

Documents


0 download

DESCRIPTION

bios

TRANSCRIPT

  • GRUPAREA MATERIALULUI STATISTIC. SERIA STATISTIC DE VARIAIE. INDICATORII TENDINEI CENTRALE

  • Subiecte n discuieClasificarea i gruparea datelor statisticeSeria statistic de variaie, particulariti, indicatori ai serieiIndicatorii medii

  • PRELUCRAREA PRIMAR A DATELOR STATISTICEDatele statistice obinute n timpul observrii sunt, de regul, variate i de volum mare. Ele trebuie sistematizate, centralizate i grupate pentru a fi pregtite n vederea prelucrrii. Numai n urma prelucrrii statistice pot fi evideniate trsturile i tendinele eseniale din evoluia fenomenelor i proceselor medico -sociale.

    Prelucrarea primar a datelor statistice culese cuprinde operaiile de clasificare, grupare, centralizare, agregare, calcul de caracteristici derivate, precum i construirea de tabele, serii i grafice statistice.

  • CLASIFICAREA I GRUPAREA DATELOR STATISTICEUnitile colectivitii observate sunt repartizate n clase cu caracter omogen. Aceast operaie permite restrngerea volumului mare de date iniiale i evideniaz structura colectivitii analizate. Prin grupare se pierde o parte din informaia iniial, n schimb se nlesnete cunoaterea proprietilor eseniale ale colectivitii i nelegerea legturilor dintre caracteristicile utilizate.

  • CLASIFICAREA I GRUPAREA DATELOR STATISTICEClasificarea trebuie s respecte mai multe reguli:a) completitudinea toate unitile statistice s fie incluse n clasele formate n urma clasificrii;b) omogenitatea a include ntr-o clas numai elemente de acelai tip;c) unicitatea fiecare element s aparin unei singure clase;d) continuitatea variaiei s nu existe clase cu frecven nul n cazul variabilelor cu variaie continu.

  • CLASIFICAREA I GRUPAREA DATELOR STATISTICE

    1. n funcie de numrul caracteristicilor utilizate, gruprile pot fi simple sau combinate.

    Gruprile simple sunt cele realizate dup o singur caracteristic de grupare.

    Gruprile combinate vizeaz simultan dou sau mai multe caracteristici de grupare.

  • CLASIFICAREA I GRUPAREA DATELOR STATISTICE2. Dup coninutul caracteristicii de grupare deosebim grupri:

    cronologice teritoriale de persoan

  • CLASIFICAREA I GRUPAREA DATELOR STATISTICE3. Dup modul de variaie a caracteristicii, gruparea se poate face:

    pe variantepe intervale egale de variaie sau pe intervale inegale de variaie

  • CLASIFICAREA I GRUPAREA DATELOR STATISTICEGruparea pe intervale egale presupune urmtoarele operaiuni: stabilirea caracteristicii de grupare; calcularea amplitudinii variaiei; stabilirea mrimii intervalului de grupare; precizarea limitelor superioare i inferioare ale intervalelor de grupare; determinarea numrului unitilor statistice care sunt incluse n fiecare interval.

  • CLASIFICAREA I GRUPAREA DATELOR STATISTICEAmplitudinea variaiei (A) se stabilete ca diferen ntre valoarea maxim (xmax) i valoarea minim (xmin) nregistrat de caracteristica respectiv:A = xmax xmin

    Mrimea intervalului de grupare (h) se determin pe baza raportului dintre amplitudinea variaiei (A) i numrul de grupe (k) ales:h = A/k

  • CLASIFICAREA I GRUPAREA DATELOR STATISTICEIntervalele de grupare se definesc prin precizarea limitei inferioare i superioare. Determinarea primului interval de grupare pornete de la valoarea minim a caracteristicii (limita inferioar) la care se adaug mrimea intervalului de grupare, obinndu-se limita superioar.

  • 2. SERIA STATISTIC DE VARIAIE- Seria statistic de variaie este irul de valori numerice ale caracteristicii, ordonate cresctor sau descresctor n funcie de mrimea acestora.Seria de variaie reprezint corespondena a dou iruri: cel al variantelor caracteristicii sau intervalelor de valori ale variantelor (x) i cel al frecvenelor (f), motiv pentru care se mai numete i serie de frecvene. Suma frecvenelor variantelor corespunztoare corespunde cu numrul de cazuri cercetate (f = n).

  • PARTICULARITILE SERIEI DE VARIAIEomogenitatea termenilor: variantele individuale sunt de aceeai natur i cu valori apropriate, fiind determinate n cea mai mare msur de aciunea acelorai factori eseniali;independena termenilor seriei: fiecare valoare este specific unui element al colectivitii i nu depinde de valoarea nregistrat la celelalte elemente;

  • PARTICULARITILE SERIEI DE VARIAIEvariabilitatea valorilor individuale: aciunea mai puternic a unor factori ntmpltori determin abaterea mrimilor individuale de la tendina central impus de factorii eseniali;

    forma repartiiei: deriv din modalitatea specific de combinare a influenelor factorilor eseniali i neeseniali; exist serii cu o repartiie relativ uniform a frecvenelor i altele cu unul sau mai multe puncte de concentrare.

  • INDICATORI AI SERIEI DE VARIAIEAnaliza complet a seriilor de distribuie a frecvenelor presupune calcularea urmtorilor indicatori:indicatori de nivel i de frecvene;indicatori medii: media aritmetic, ptratic, armonic, geometric, cronologic; mediana, modul, cuartile, decile, centile;indicatori simpli i sintetici ai variaiei: amplitudinea variaiei, abateri individuale, abatere medie liniar, abaterea medie ptratic (abaterea standard, abaterea tip), dispersia (variana), coeficientul de variaie;D. indicatori ai asimetriei;E. indicatori ai concentrrii.

  • INDICATORII MEDIIIndicatorii medii sunt mrimi tipice, caracteristice, ce definesc un fenomen variabil.

    Pentru ca indicatorii medii s aib coninut real i s fie reprezentativi pentru colectivitatea analizat este necesar s fie ndeplinite cteva condiii: omogenitatea colectivitii; volum suficient de mare de date individuale; forma adecvat a indicatorului.

  • MEDIAMedia este un indicator al tendinei centrale care arat nivelul la care ar fi ajuns caracteristica dac n toate cazurile individuale factorii eseniali i neeseniali ar fi acionat constant. Este valoarea tipic pentru reprezentarea unei colectiviti, dar este posibil s nu coincid cu nici una din valorile individuale nregistrate de caracteristic n colectivitatea respectiv.

  • MEDIA Dup Yule i Kendall condiiile pe care trebuie s le ndeplineasc o mrime medie ar fi:- S fie definit n mod precis, independent de dorina utilizatorului;- S fie expresia, sinteza tuturor observaiilor nregistrate;- S posede proprieti simple, evidente, clare chiar i pentru nespecialiti;- S fie simplu i rapid de calculat;- S fie puin sensibil la fluctuaiile de selecie;- S poat fi studiat rapid cu ajutorul calcului algebric.

  • MEDIA ARITMETIC simplMedia aritmetic simpl este valoarea medie care se obine prin divizarea sumei valorilor individuale dintr-o colectivitate omogen, la numrul total al cazurilor studiate.

  • MEDIA ARITMETIC ponderatMedia aritmetic ponderat este valoarea medie care se obine din suma produsului valorilor dintr-o colectivitate omogen, cu frecvenele corespunztoare, divizat la numrul total al cazurilor studiate.n cazul n care unitile nu sunt grupate pe variante, ci pe intervale de variaie, xi reprezint centrul de interval. Centrul fiecrui interval se determin ca medie aritmetic simpl ntre limita superioar i limita inferioar a intervalului respectiv.

  • PROPRIETILE MEDIEI ARITMETICE1) Definiia dat mediei aritmetice este valabil numai dac valorile individuale nregistrate sunt numerice. Pentru o serie cu valori nenumerice nu se poate calcula media aritmetic;2) Mrimea mediei aritmetice calculate este unic; o serie nu posed mai multe medii aritmetice distincte;3) Mrimea mediei aritmetice poate sau nu s coincid cu vreo valoare individual nregistrat;

  • PROPRIETILE MEDIEI ARITMETICE4) Media are ntotdeauna valoarea cuprins ntre valoarea minim din serie (Xmin) i valoarea maxim (Xmax);5) Suma abaterilor valorilor individuale de la media lor este ntotdeauna egal cu zero (adic distanele fa de centru se balanseaz, se compenseaz reciproc);

  • PROPRIETILE MEDIEI ARITMETICE6) Media aritmetic este legat de toate valorile numerice nregistrate i, n consecin, este sensibil la prezena valorilor aberante.7) Dac o serie este alctuit din mai multe serii componente, pentru care s-au calculat medii pariale, atunci media ntregii serii poate fi calculat ca o medie ponderat din mediile pariale.

  • MEDIA ARMONICSe mai numete momen de ordin -1Pentru un ir simplu de valori:

    Pentru o serie de frecvene sau de date grupate pe intervale de grupare

  • MEDIA GEOMETRICSe utilizeaz atunci, cnd valorile seriei sunt dispuse n progresie geometric. Este cazul mediei unor titruri (utilizate n microbiologie, virusologie, imunologie, serologie) care se succed n proporie geometric: 1/2; 1/4; 1/8; 1/16; 1/32; 1/64 etc. n aceste cazuri se calculeaz media geometric a numitorilor titrurilor.n cazul mediei geometrice se face produsul termenilor seriei, din care se extrage rdcina de un indice egal cu numrul termenilor seriei.

  • INDICATORI DE POZIIE Mediile se calculeaz pe baza tuturor valorilor individuale ale seriei, ceea ce le face sensibile la valorile extreme, mai puin semnificative.

    Uneori, valorile extreme ale seriei sunt excesiv de ndeprtate de centrul seriei, ceea ce afecteaz n mare msur reprezentativitatea mediei.

    Alteori, unitile seriei au tendina de a se concentra la una din extremitile seriei, rezultnd distribuii asimetrice la dreapta sau la stnga.

    Pentru aceasta se calculeaz indicatorii medii de poziie (de structur): mediana; cuartilele; decilele; modulul.

  • MEDIANA Mediana este acea valoare a unei serii statistice ordonate cresctor sau descresctor, care mparte seria n dou pri egale.

    Mediana este valoarea din centrul seriei: jumtate din termeni sunt mai mici sau egali cu mediana, jumtate sunt mai mari sau egali.

    Mediana este o mrime care depinde n primul rnd de numrul termenilor. Se mai numete medie de poziie.

  • MEDIANA Pentru seriile simple, mediana este termenul din mijloc (dac seria are numr impar de termeni) sau se determin, n mod convenional, ca medie aritmetic simpl a celor dou valori din centrul seriei, dac numrul termenilor este parSpre deosebire de medie, mediana nu este influenat de valorile extreme ale seriei; de aceea ea poate nlocui cu succes media atunci cnd apar valori aberante!

  • CUARTILE, DECILE, CENTILECuartilele sunt valori care mpart seria statistic n 4 pri egale (Q1 Q3 ).Decilele sunt mrimile care mpart seria statistic n 10 pri egale (D1 D9).Centilele sunt mrimile care mpart seria statistic n 100 de pri egale (C1 C99).Decilele i, mai ales, centilele se calculeaz doar pentru seriile statistice cu numr mare de grupe i cu amplitudine mare a variaiei. Aceti indicatori sunt utilizai ndeosebi pentru seriile pronunat asimetrice.

  • MODULUL (DOMINANTA)Definiie: Valoarea modal este valoarea cel mai frecvent ntlnit n cadrul colectivitii statistice analizateAvantaje:Poate fi calculat pentru variabile calitative (exprimate prin cuvinte) (de ex.: culoarea ochilor, culoarea prului, starea civil etc.)ansele ca rezultatul s fie o valoare existent n realitate sunt mult mai mari dect la medii

  • MODULUL n cazul seriilor de variaie grupate modulul se calculeaz dup formula: 1Mo = XMo +h 1 + 2unde:XMo limita inferioar a intervalului modal;h mrimea intervalului modal (cu frecvena cea mai mare);1 diferena dintre frecvena intervalului modal i a intervalului precedent;2 diferena dintre frecvena intervalului modal i a intervalului urmtor;

  • MODULULSe consider urmtoarea distribuie:

    SalariuMedici400-6005600-80010800-1000151000-1200301200-140020

  • MODULUL Observaii:1) Pe graficul repartiiei statistice valoarea modal corespunde punctului n care graficul i atinge maximul;2) Are avantajul principal fa de medie i cuantile c se determin rapid si are o semnificaie simpl;3) Exist n practic serii fr modul, precum i serii bimodale sau plurimodale. Aceasta impune separarea unitilor colectivitii n dou distribuii de frecvene.

  • MODULUL Serie de date unimodal:

    Notaf1527312420538646737820910105Total200

    Chart1

    5

    7

    12

    20

    38

    46

    37

    20

    10

    5

    Nota

    Studenti

    Sheet1

    Notani

    15

    27

    312

    420

    538

    646

    737

    820

    910

    105

    Total200

    Sheet1

    0

    0

    0

    0

    0

    0

    0

    0

    0

    0

    Nota

    Studenti

    Sheet2

    Sheet3

  • MODULULSerie de date bimodal:

    Notaf15213322441514677258419271011Total200

    Chart2

    5

    13

    22

    41.5

    14

    7

    25

    41.5

    27

    11

    Nota

    Studenti

    Sheet1

    Notani

    15

    27

    312

    420

    538

    646

    737

    820

    910

    105

    Total200

    Notani

    15

    213

    322

    441.5

    514

    67

    725

    841.5

    927

    1011

    Total207

    Sheet1

    0

    0

    0

    0

    0

    0

    0

    0

    0

    0

    Nota

    Studenti

    Sheet2

    0

    0

    0

    0

    0

    0

    0

    0

    0

    0

    Nota

    Studenti

    Sheet3

  • INDICATORII ASIMETRIEISeriile empirice cu care lucreaz statistica tind deseori ctre modelul repartiiei normale, care este o distribuie perfect simetric.Distribuia perfect simetric se caracterizeaz prin egalitatea dintre medie, median i modul. Frecvenele se distribuie simetric la dreapta i la stnga valorii centrale, care are frecvena maxim. Graficul are form de clopot

  • INDICATORII ASIMETRIEIAsimetria pozitiv este caracteristic acelor colectiviti n care predomin valorile mici ale caracteristicii, de unde rezult urmtoarea relaie de inegalitate:Mo < Me < X .Pentru acest tip de distribuie de frecvene, media reprezint mai bine valorile mici ale seriei, care sunt predominante; dimpotriv, valorile mari sunt mult distanate fa de medie.

  • INDICATORII ASIMETRIEIAsimetria negativ este specific seriilor de distribuie de frecvene n care predomin valorile mari ale caracteristicii, astfel nct:x < Me < Mon acest caz, media este semnificativ pentru valorile mari ale caracteristicii; termenii cu valori mici ai seriei statistice nu sunt bine reprezentai.

  • INDICATORII ASIMETRIEIDistribuiile de frecvene care sunt numai uor asimetrice verific urmtoarea legtur ntre medie, median i modul:Mo = x 3( x Me ).

    *