prelucrarea statistica primara
TRANSCRIPT
PRELUCRAREA STATISTIC Ă PRIMARĂ 2.3.1. Metode primare de sistematizare a datelor statistice
Datele culese sunt colectate la un centru de prelucrare şi sunt supuse unor prelucrări primare,
destinate sistematizării lor şi desprinderii unor concluzii generale. Etapele sistematizării implică:
A. Centralizarea datelor statistice B. Gruparea datelor statistice C. Metode de prezentare a datelor statistice - Tabele statistice; Serii statistice; Grafice statistice; 2.3.2. Tehnici de prelucrare
A. Centralizarea datelor statistice necesită ca datele utilizate să fie comparabile şi aditive, pentru a putea totaliza unităŃile statistice sau valorile unei caracteristici, la nivelul grupelor tipice sau a colectivită-Ńilor observate.
Totalizarea valorilor se face prin însumare directă sau cu ajutorul unor coeficienŃi de echivalenŃă. În urma centralizării, se obŃin indicatori statistici de nivel (ex. producŃia de antibiotice într-un interval dat).
Centralizarea pe subcolectivităŃi omogene are ca scop o cunoaştere mai detaliată a fenomenului, ceea ce este o centralizare pe grupe şi permite analiza fenomenului pe elemente structurale.
B. Gruparea datelor statistice este o centralizare pe grupe omogene a unităŃilor unei
colectivităŃi după variaŃia uneia sau a mai multor caracteristici de grupare. Tehnica grupării necesită parcurgerea următoarelor etape:
a) Alegerea şi folosirea caracteristicilor de grupare Caracteristica de grupare este aceea însuşire care stă la baza împărŃirii colectivităŃilor în grupe
omogene. Drept caracteristică de grupare se alege o caracteristică esenŃială cu un caracter stabil pentru unităŃile colectivităŃii, care exprimă natura fenomenului cercetat şi corespunde scopului urmărit. În funcŃie de numărul caracteristicilor de grupare putem avea:
- grupe simple – cu o singură caracteristică de grupare; - grupe combinate – se realizează prin luarea în considerare a două sau mai multe caracteristici
de grupare, ce se găsesc în relaŃii de interdependenŃă. După natura caracteristicilor de grupare pot fi:
- grupări teritoriale, în care caracteristica de spaŃiu este definitorie (grupare pe Ńări, judeŃe etc.); - grupări cronologice, ce se fac după caracteristica de timp; - grupări după caracteristici atributive, exprimate numeric sau prin cuvinte.
b) Stabilirea numărului de grupe (r). Notăm cu r numărul de grupe ce se va stabili în funcŃie de amplitudinea variaŃiei şi de numărul
de unităŃii ale colectivităŃii. Astfel dacă gruparea se va folosi ca metodă de sistematizare a datelor pentru calcularea indicatorilor derivaŃi şi aplicarea analizei statistice, este indicat să se folosească un număr suficient de mare de grupe (pentru a surprinde corect forma variaŃiei caracteristicilor). Dacă se va analiza structura, mutaŃiile de structură în raport cu tipurile calitative, este indicat să se folosească un număr restrâns de grupe.
În funcŃie de mărimea variaŃiei, caracteristicilor studiate pot fi: - grupări pe variante (se foloseşte când numărul variantelor este redus şi amplitudinea mică); - grupări pe intervale de variaŃie (când numărul unităŃilor colectivităŃii este mare şi
amplitudinea variaŃiei este mare). c) Alegerea intervalului de grupare. Intervalul de variaŃie este un grup omogen de variante, despărŃit de restul colectivului prin cele
două limite ale grupei: inferioară şi superioară. Mărimea intervalului de grupare (h) se află în funcŃie de amplitudinea variaŃiei (A) şi numărul de grupe (r).
A = Xmax – Xmin, unde: Xmax = limita superioară a caracteristicii Xmin = limita inferioară a caracteristici
h = r
A,
h – mărimea intervalului de grupare; r – numărul de grupe. Pentru determinarea mărimii intervalului de grupare, în cazul colectivităŃilor de dimensiuni
relativ mari se poate utiliza şi formula lui Sturges:
h = nlg322,31
A
+ ;
n = numărul de unităŃi statistice ale colectivităŃii analizate. Intervalele de grupare pot fi: egale şi inegale, închise şi deschise, cu variaŃie continuă şi cu
variaŃie directă. Când intervalele de grupare sunt deschise, ele trebuiesc închise în funcŃie de mărimea
intervalului alăturat. În intervalele cu variaŃie continuă, limita superioară a fiecărui interval se repetă ca limită
inferioară a intervalului următor. Pentru a se evita includerea dublă a unor unităŃi, ce au valoarea egală cu una din limitele intervalului, se stabileşte o convenŃie (limită inferioară sau limită superioară inclusă în interval) prin care se precizează limita inclusă în interval.
La intervalele cu variaŃie discretă, limita inferioară este deplasată cu o unitate de măsură faŃă de limita superioară a intervalului precedent.
C. Prezentarea datelor statistice se utilizează pentru perceperea şi înŃelegerea manifestărilor
dintr-o colectivitate, pentru a decide prelucrarea ei ulterioară, pentru popularizarea datelor, cât şi pentru informarea opiniei publice. Aceste metode sunt folosite şi ca mijloace auxiliare, dar eficiente de investigare a legăturilor dintre fenomene şi a formelor de evoluŃie în timp.
Prezentarea se poate face sub formă de: • Serii statistice. Ca rezultat al sistematizării, seria statistică defineşte corespondenŃa dintre
două şiruri de date statistice, în care primul reprezintă variaŃia caracteristicii urmărite, iar al doilea şir cu-prinde frecvenŃele de apariŃie a variantelor caracteristicii. Seria trebuie să ofere informaŃii cu privire la succesiunea, mărirea valorilor înre-gistrate şi a frecvenŃelor corespunzătoare.
Între cele două şiruri există o legătură univocă, în sensul că unei valori individuale oarecare îi corespunde o anumită frecvenŃă, respec-tiv un număr care arată de câte ori se repetă valoarea individuală respectivă.
• Grafice statistice. Graficul este o imagine spaŃială, cu caracter convenŃional, care, prin diferite mijloace plastice de reprezentare, reliefează ceea ce este caracteristic, esenŃial pentru obiectul cercetării. Graficele reprezintă datele şi proporŃiile dintre ele cu ajutorul unor lungimi, suprafeŃe, volume. Principalele metode de reprezentare sunt: figuri geometrice; grafice într-un sistem de coordonate (cadranul I, din sistemul de axe rectangulare); reprezentări cu ajutorul hărŃilor.
Utilizarea graficelor presupune cunoaşterea elementelor con-structive şi respectarea unor reguli şi principii referitoare la proporŃii.
Principalele tipuri de grafice statistice:
• Diagrame prin benzi şi coloane. Se folosesc în scopul popula-rizării unor aspecte din viaŃa social-economică, pentru a reda imaginea unui fenomen în evoluŃia lui în timp, când distanŃele dintre perioade sunt mari şi inegale;
• Diagrame prin figuri geometrice: • Diagrame de suprafaŃă - Grafice prin areale - Diagrame de structură • Diagrame de volum (piramidă, cilindru, stereograme) Graficele prin areale. Se construiesc sub forma unor figuri geometrice în plan, a căror suprafaŃă
este proporŃională cu mărimea caracteristicii. Diagrame de structură. Presupun un raport de proporŃionalitate între suprafaŃa figurii
geometrice şi totalul structurii de 100%. Fiecare figură geometrică se va împărŃi în atâtea părŃi câte are colectivitatea cercetată, părŃile se vor distinge prin haşurarea sau colorarea suprafe-Ńelor respective.
• Diagramele seriilor de timp: diagrame prin coloane, cronograma, diagrame polare. Cronograma se foloseşte pentru a desprinde tendinŃa de dezvoltare a fenomenelor pentru fiecare
etapă dată. În seria dinamică, valorile indicatorilor sunt reprezentate în succesiunea lor în timp. Diagrama polară ajută la interpretarea gradului şi formei de variaŃie sezonieră ce este datorată
schimbării anotimpurilor, începerii şcolilor etc. • Diagramele seriilor de repartiŃie de frecvenŃe. - Pentru seriile de frecvenŃă unidimensionale se folosesc: histograma, poligonul frecvenŃelor,
curba cumulativă a frecvenŃelor (ogivă). - Pentru seriile de frecvenŃă bidimensionale se folosesc: corelograma (diagrama norului de
puncte). • Diagramele seriilor de spaŃiu: cartogramele (hărŃi ale terito-riului), cartodiagramele
(combinaŃie între cartogramă şi diagrame de suprafaŃă), pictogramele (folosesc figuri naturale şi convenŃionale, fotografii – asociate cu diagrame prin areale pentru a mări efectul).
• Tabele statistice constituie un ansamblu de judecăŃi prezentat într-o formă succintă, în cuvinte şi expresii numerice, referitoare la fenomenele şi procesele studiate. Se folosesc atât pentru prezentarea rezultatelor cercetării, cât şi în cadrul analizei indicatorilor derivaŃi. Tabelul trebuie să respecte elementele de conŃinut (subiectul şi predicatul tabelului) şi cele de formă (macheta tabelului). Tabelele statistice sunt variate şi se folosesc în etapa culegerii datelor, în cursul prelucrării sau al analizei statistice.
Principalele tipuri de tabele statistice: 1. tabelul simplu – se foloseşte pentru colectivităŃile nereprezentate in grupe tipice dupa o anumită
caracteristică; 2. tabelul cronologic – un tabel statistic simplu in care se prezintă rezultatele centralizării efectuate
pentru diferite unităŃi de timp; 3. tabelul statistic pe grupe – cuprinde date numerice ale colectivităŃii studiate, despărŃite în grupe
omogene după o singură caracteristică de grupare; 4. tabelul combinat – este tabelul statistic prin care colectivitatea se prezintă împărŃită în grupe după
două sau mai multe caracteristici; 5. tabelul cu dublă intrare – folosit în cazul în care elementele se repartizează concomitent după două
caracteristici de grupare legate intre ele, astfel încât unei valori a oricărei caracteristici îi corespunde o serie de distribuŃie după cealaltă caracteristică de grupare;
6. tabelul de asociere – pentru prezentarea distribuŃiei elementelor unui ansamblu, după două caracteristici corelate logic şi a căror formă de prezentare alternează între doua posibilităŃi.
2.3.4 Indicatorii statistici
Indicatorul statistic este expresia numerică a unor fenomene, procese, activităŃi sau categorii
economice şi sociale, delimitate în timp, spaŃiu şi structură organizatorică. Pentru cunoaşterea fenomenelor de masă, indicatorii statistici îndeplinesc mai multe funcŃii: de măsurare, de comparare, de analiză sau sinteză, de estimare, de verificare a ipotezelor, de testare a semnificaŃiei parametrilor utilizaŃi.
După etapa în care apar în procesul cercetării statistice, indicatorii statistici sunt: Indicatori primari, ce se obŃin în procesul prelucrării primare, prin centralizarea datelor provenite
din observare totală sau parŃială. Indicatori deriva Ńi, ce se obŃin prin comparări, abstractizări, generalizări, prin aplicarea unor
procedee specifice de prelucrare a mărimilor absolute a indicatorilor primari. Ei pun în evidenŃă aspec-tele calitative ale fenomenelor analizate:
- relaŃia dintre părŃile colectivităŃii, dintre caracteristici; - legăturile de interdependenŃă dintre fenomene sau valori tipice; - contribuŃiile diverşilor factori la variaŃia unui fenomen etc. ComparaŃiile dintre date pot fi făcute prin raportare (mărimile relative) sau prin diferenŃă
(modificare absolută). Mărimea relativă (M.R.) este rezultatul comparării, sub formă de raport, a doi indicatori statistici,
şi arată printr-un singur număr câte unităŃi din indicatorul raportat revin la o unitate a indicatorului bază de raportare. Se poate exprima sub formă de:
CoeficienŃi care arată câte unităŃi din indicatorul de raportat revin unei singure unităŃi baza de raportare.
Procente, care arată câte unităŃi din indicatorul bază de raportare revin la 100 de unităŃi din indicatorul de bază de raportare.
În analiza statistică se utilizează în funcŃie de scopul analizei: • Mărimi relative de structur ă (MRS) – sunt numite ponderi sau greutăŃi specifice, frecvenŃe
relative, exprimând raportul dintre parte şi întreg şi se calculează ca raport între fiecare element sau grup de elemente ale colectivităŃii, faŃă de volumul întregii colectivităŃi.
Ponderea sau greutatea specifică:
100x
xg
n
1ii
ii ∗
∑
=
=
,
unde: gi = ponderea xi = elementul sau grupul de elemente Σxi = totalul colectivităŃii
FrecvenŃe relative: 100
n
nn
n
1ii
i*i ∗
∑
=
=
,
unde: ni* = frecvenŃa relativă ni = frecvenŃa absolută Σni = suma frecvenŃelor absolute
Proprietate: Suma frecvenŃelor relative ∑ *in = 1, dacă se exprimă în coeficienŃi/ Suma frecvenŃelor
relative ∑ *in = 100, dacă este în procente.
• Mărimi relative de intensitate (MRI) – evidenŃiază gradul, intensitatea de răspândire a fenomenului , în raport cu variabila la care se raportează. Sunt considerate caracteristici derivate ce se obŃin prin raportarea a doi indicatori absoluŃi, de natură diferită ce se află într-un raport de interdependenŃă cu semnificaŃie economică concretă.
Se poate calcula sub formă de raport:
i
ii z
yx = unde: xi= mărimea de intensitate
z i yi= cei doi indicatori absoluŃi
ex. W = T
Q unde W = productivitatea muncii, Q = producŃia,
T = nr. de salariaŃi • Mărimi relative de coordonare (MRC) – caracterizează raportul în care se află doi indicatori de
acelaşi fel, aparŃinând unor grupe ale aceleaşi colectivităŃi statistice, sau unor colectivităŃi de acelaşi fel, dar situate în spaŃii diferite.
Astfel M.R.C.: B
A
BA X
Xk = sau
A
B
AB X
Xk =
• Mărimi relative ale prevederii (MRPL) – fiind specifice orică-rei economii moderne în economia de piaŃă, se calculează numai la nivelul fiecărei unităŃi sau firme, în funcŃie de programele elaborate privind aprovizionarea, producŃia, desfacerea de mărfuri.
NoŃiuni: X0 = nivelul fenomenului realizat în perioada de baza Xpl = nivelul fenomenului programat pentru perioada
curentă X1 = nivelul fenomenului realizat în perioada curentă În funcŃie de aceste notaŃii putem calcula:
a) Mărimi relative ale sarcinii de plan : 100.X
XK
0
pl
0pl =
b) Mărimi relative ale realizării planului: 100*.X
XK
pl
1
pl1 =
c) Gradul de realizare a producŃiei în perioada curentă faŃă de bază
100*X
XK
0
1
01 =
ToŃi aceşti coeficienŃi ne arată dacă activitatea firmei s-a desfăşurat conform planului stabilit, sau dacă s-au constatat pierderi, ca să se poată interveni în mod util pentru recuperarea lor. Adesea reŃinem numai valoarea ce depăşeşte sau este sub 100%. Acest procent se mai numeşte ritm de creştere sau scădere, sau ritm de depăşire sau realizări a planului.