stefanescu - b s - pied - uni-muenchen.de9.3. analiza legturilor dintre variabile prin intermediul...

211
Munich Personal RePEc Archive Basic Statistics Stefanescu, Răzvan and Dumitriu, Ramona Dunarea de Jos University Galati, Dunarea de Jos University Galati 9 September 2007 Online at https://mpra.ub.uni-muenchen.de/53048/ MPRA Paper No. 53048, posted 12 Mar 2015 20:41 UTC

Upload: others

Post on 21-Jan-2020

11 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: STEFANESCU - B S - PIED - uni-muenchen.de9.3. Analiza legturilor dintre variabile prin intermediul regresiei 9.4. Indicatori de apreciere a sensului i intensit ii legturilor dintre

Munich Personal RePEc Archive

Basic Statistics

Stefanescu, Răzvan and Dumitriu, Ramona

Dunarea de Jos University Galati, Dunarea de Jos University Galati

9 September 2007

Online at https://mpra.ub.uni-muenchen.de/53048/

MPRA Paper No. 53048, posted 12 Mar 2015 20:41 UTC

Page 2: STEFANESCU - B S - PIED - uni-muenchen.de9.3. Analiza legturilor dintre variabile prin intermediul regresiei 9.4. Indicatori de apreciere a sensului i intensit ii legturilor dintre

R�zvan �tef�nescu Ramona Dumitriu

BAZELE STATISTICII

Gala�i, 2007

Page 3: STEFANESCU - B S - PIED - uni-muenchen.de9.3. Analiza legturilor dintre variabile prin intermediul regresiei 9.4. Indicatori de apreciere a sensului i intensit ii legturilor dintre

CUPRINS

Capitolul 1 - Introducere în �tiin�a statisticii 1.1. Obiectul de studiu al �tiin�ei statisticii 1.2. Concepte de baz� ale �tiin�ei statisticii 1.3. Tr�s�turi ale tehnicilor statistice 1.4. Evolu�ia în timp a �tiin�ei statisticii Capitolul 2 – Culegerea datelor statistice 2.1. Coordonatele culegerii datelor statistice 2.2. Instrumente de culegere a datelor statistice Capitolul 3 – Prelucrarea primar� a datelor statistice 3.1. Coordonate a prelucr�rii primare a datelor statistice 3.2. Prelucrarea primar� a datelor cu caracteristici atributive 3.3. Prelucrarea primar� a datelor statistice prin serii în spa�iu 3.4. Prelucrarea primar� a datelor statistice prin serii în timp Capitolul 4 – Valori tipice 4.1. Considera�ii generale asupra valorilor tipice 4.2. M�rimi medii 4.3. Valoarea median� 4.4. Modul unei distribu�ii heterograde Capitolul 5 – Dispersia seriilor statistice 5.1. Coordonate ale studiului dispersiei seriilor statistice 5.2. Indicatori ai dispersiei seriilor statistice Capitolul 6 – Asimetria �i boltirea seriilor statistice 6.1. Conceptul de asimetrie a seriilor statistice 6.2. Evaluarea asimetriei seriilor statistice 6.3. Boltirea distribu�iilor heterograde

Page 4: STEFANESCU - B S - PIED - uni-muenchen.de9.3. Analiza legturilor dintre variabile prin intermediul regresiei 9.4. Indicatori de apreciere a sensului i intensit ii legturilor dintre

Capitolul 7 – Legile fenomenelor colective 7.1. Caracteristici ale legilor fenomenelor colective 7.2. Distribu�ia normal� Capitolul 8 – Cercetarea statistic� prin sondaj 8.1. Coordonate ale cercet�rii statistice prin sondaj 8.2. Tipologia sondajelor statistice 8.3. Inferen�a statistic� pentru sondajele de volum mare 8.4. Inferen�a statistic� asupra sondajelor de volum redus 8.5. Verificarea ipotezelor statistice prin sondaje Capitolul 9 – Analiza statistic� a leg�turilor dintre variabile 9.1. Coordonate ale analizei statistice a leg�turilor dintre variabile 9.2. Tehnici grafice de caracterizare a leg�turilor dintre variabile 9.3. Analiza leg�turilor dintre variabile prin intermediul regresiei 9.4. Indicatori de apreciere a sensului �i intensit��ii leg�turilor dintre variabile Capitolul 10 – Analiza seriilor de timp 10.1. Coordonate ale analizei seriilor de timp 10.2. Indicatori ai analizei seriilor de timp 10.3. Determinarea trendului unei serii de timp Teste gril� Bibliografie selectiv�

Page 5: STEFANESCU - B S - PIED - uni-muenchen.de9.3. Analiza legturilor dintre variabile prin intermediul regresiei 9.4. Indicatori de apreciere a sensului i intensit ii legturilor dintre

Capitolul 1 - Introducere în �tiin�a statisticii De regul�, o prezentare general� a unei �tiin�e se desf��oar� pe

trei coordonate: obiectul de studiu, conceptele de baz� �i metodele utilizate. În plus, în cazul unei �tiin�e aflat� în plin� evolu�ie, a�a cum este în prezent statistica, este indicat� �i abordarea transform�rilor pe care aceasta le-a suferit în timp.

1.1. Obiectul de studiu al �tiin�ei statisticii

Se consider� c� obiectul de studiu al �tiin�ei statisticii este

reprezentat de a�a-numitele fenomene colective – o no�iune destul de complex�. Pentru în�elegerea acesteia, vom începe prin a defini fenomenul drept o evolu�ie a materiei de la o stare la alta. Astfel de evolu�ii se afl� sub influen�a unor condi�ii de mediu, date de ac�iunea unor diver�i factori. În raport cu modul de manifestare, pot fi delimitate dou� categorii de fenomene:

1. fenomene tipice; 2. fenomene colective.

1. Fenomenele tipice au în comun faptul c� în condi�ii de mediu identice vor duce întotdeauna la acelea�i rezultate. Mecanismul unui astfel de fenomen este, de regul�, destul de simplu, cu un num�r redus de factori de influen��. Se spune c� fenomenele tipice sunt guvernate de a�a numite legi deterministe, în care rela�ia cauz�-efect este precis�. Cunoa�terea acestor legi �i a condi�iilor de mediu permite anticiparea cu certitudine a rezultatelor fenomenelor tipice.

2. Fenomenele colective sunt caracterizate prin faptul c� în condi�ii de mediu identice pot conduce la rezultate diferite. În general, mecanismul unui fenomen colectiv este relativ complex, cuprinzând un num�r mare de factori. Despre aceste fenomene se spune c� în loc de a fi guvernate de legi deterministe, depind în mare m�sur� de hazard. Din acest motiv, rezultatele unui fenomen colectiv nu pot fi anticipate decât în condi�ii de incertitudine.

Page 6: STEFANESCU - B S - PIED - uni-muenchen.de9.3. Analiza legturilor dintre variabile prin intermediul regresiei 9.4. Indicatori de apreciere a sensului i intensit ii legturilor dintre

Tabelul 1.1. Tr�s�turi definitorii ale fenomenelor tipice �i ale fenomenelor colective

Tip de fenomene

Aspecte

Fenomene tipice

Fenomene colective

Comportament în condi�ii de mediu

identice

- o singur� form� de manifestare

- mai multe forme de manifestare

Caracteristici ale mecanismelor de

desf��urare

- mecanisme simple, cu un num�r redus de

factori �i cu legi deterministe

- mecanisme complexe, cu factori

de influen�� numero�i, în care intervine hazardul

Certitudinea sau incertitudinea asupra viitoarelor rezultate

- certitudine

- incertitudine

O sintez� a caracteristicilor care permit delimitarea dintre

fenomenele tipice �i cele colective, a�a cum au fost definite anterior, este prezentat� în tabelul 1.1 Totu�i, la o analiz� atent�, pot fi identificate puncte slabe pentru toate cele trei criterii de departajare. Astfel, în practic� este imposibil ca un fenomen s� se produc� de mai multe ori în condi�ii de mediu cu adev�rat identice, ceea ce face îndoielnic� separarea fenomenelor pe baza acestui criteriu. În ce prive�te aspectul mecanismului de desf��urare a fenomenelor, se poate obiecta c�, în fapt, orice fenomen este influen�at, mai mult sau mai pu�in, de o infinitate de factori, fiecare cu un mod de ac�iune diferit, astfel încât mintea omeneasc� nu este capabil� s� în�eleag� legile care îl guverneaz�. În fine, criteriul certitudinii sau incertitudinii asupra viitoarelor rezultate este atacabil deoarece termenul de certitudine are mau mult sens abstract în timp ce în realitate nimic nu este cert. În concluzie, o delimitare riguroas� între fenomenele tipice �i cele colective nu este posibil� din cauza unor limite cognitive care ne împiedic� s� în�elegem pe deplin realitatea.

Într-o anumit� m�sur�, putem dep��i aceste limite construind a�a - numite modele, care sunt reprezent�ri simplificate, aproximative ale realit��ii. Atunci când construim un model al unui fenomen, lu�m în considerare numai factorii a c�ror influen�� o consider�m relevant� pentru desf��urarea fenomenului �i apoi stabilim legi pentru a exprima ac�iunea acestora. În aceast� opera�iune

Page 7: STEFANESCU - B S - PIED - uni-muenchen.de9.3. Analiza legturilor dintre variabile prin intermediul regresiei 9.4. Indicatori de apreciere a sensului i intensit ii legturilor dintre

intervin �i percep�iile noastre, bineîn�eles subiective, asupra fenomenului studiat. Atunci când consider�m c� acesta este apropiat de ideea de fenomen tipic, elabor�m un model în care ac�iunea factorilor de influen�� este exprimat� prin legi deterministe. Un astfel de model are avantajul c� permite folosirea unor tehnici simple în analiza �i previziunea fenomenului studiat, îns� poate da rezultate eronate atunci când impactul unor factori ce nu au fost lua�i în considerare se dovede�te semnificativ. Pe de alt� parte, atunci când consider�m c� o evolu�ie întrune�te în mare m�sur� caracteristicile unui fenomen colectiv, o putem studia elaborând un model în care ac�iunea factorilor de influen�� este exprimat� prin a�a-numite legi stocastice. Practic, printr-o astfel de lege accept�m c� fenomenul studiat poate fi influen�at, pe lâng� factorii pe care i-am considerat relevan�i în cadrul modelului, �i de al�i factori, pe care, din diferite motive, nu i-am introdus în mod explicit în model. Evident, modelele cu legi stocastice induc o complexitate deosebit� analizei �i previziunii fenomenelor studiate îns� ofer�, totodat�, o imagine mai apropiat� de realitate în compara�ie cu modelele cu legi deterministe.

Dintr-o perspectiv� pragmatic�, cea mai important� tr�s�tur� a fenomenelor colective este reprezentat� de incertitudinea asupra mecanismelor de producere �i asupra viitoarelor rezultate. Din acest motiv, studiul acestor fenomene se concentreaz�, în mare m�sur�, asupra modalit��ilor de a face fa�� acestei incertitudini. Chiar dac� nu putem în�elege pe deplin mecanismul unui fenomen colectiv, studiul acestuia ne poate releva o serie de elemente esen�iale ale acestuia, pe care le-am putea folosi în enun�area unor rela�ii cauz�-efect �i în previziunea rezultatelor. În acest scop, cercetarea unui fenomen colectiv poate aborda mai multe aspecte:

- caracterizarea efectelor fenomenului; - identificarea factorilor relevan�i de influen�� asupra

fenomenului �i stabilirea modului de ac�iune a acestora; - estimarea rezultatelor posibile ale fenomenului �i a �anselor

de producere a acestora. De regul�, un proces de cercetare statistic� se desf��oar� în trei

etape: 1. culegerea datelor statistice, în care se înregistreaz� aspecte

ale fenomenului studiat; 2. prelucrarea statistic� a datelor, în care, prin procedee

specifice �tiin�ei statisticii, sunt determina�i indicatori ce caracterizeaz� fenomenul cercetat;

Page 8: STEFANESCU - B S - PIED - uni-muenchen.de9.3. Analiza legturilor dintre variabile prin intermediul regresiei 9.4. Indicatori de apreciere a sensului i intensit ii legturilor dintre

3. analiza statistic�, în care, prin interpretarea indicatorilor statistici sunt relevate tr�s�turile esen�iale ale fenomenului studiat, elaborându-se modele asupra desf��ur�rii acestuia �i previzionându-se evolu�iile viitoare (fig. 1.1.)

Figura 1.1. Etapele unei cercet�ri statistice

1.2. Concepte de baz� ale �tiin�ei statisticii

Rigoarea care ar trebui s� caracterizeze studiul din cadrul unei

�tiin�e este condi�ionat� de aplicarea într-o manier� unitar� a procedeelor de cercetare. Îndeplinirea acestei condi�ii impune ca toate conceptele utilizate în cercetare s� fie definite în mod precis. În ce prive�te �tiin�a statisticii, cercetarea din cadrul acesteia are la baz� mai multe concepte:

a) popula�ia statistic�; b) unitatea statistic�; c) caracteristicile statistice; d) evenimentele; e) variabilele aleatoare; f) func�ii probabilistice.

a) Popula�ia statistic� (numit� �i colectivitate statistic�) este reprezentat� de o mul�ime de elemente studiate pentru a se cerceta starea la un moment dat sau evolu�ia în timp a unuia sau mai multor fenomene. Popula�iile statistice pot îmbr�ca diferite forme, în func�ie de scopurile �i modalit��ile de cercetare a fenomenelor colective. Atunci când se studiaz� starea unui fenomen la un moment dat, elementele popula�iei statistice reflect� manifestarea din acel moment a fenomenului (de exemplu, dac� se analizeaz� salariul mediu, într-o anumit� lun�, pentru o ramur� a economiei na�ionale, popula�ia

Page 9: STEFANESCU - B S - PIED - uni-muenchen.de9.3. Analiza legturilor dintre variabile prin intermediul regresiei 9.4. Indicatori de apreciere a sensului i intensit ii legturilor dintre

statistic� este format� din ansamblul salaria�ilor care lucreaz�, în luna respectiv�, în acea ramur�). În schimb, dac� se cerceteaz� evolu�ia în timp a unui fenomen, elementele popula�iei statistice trebuie s� reflecte dinamica manifest�rii fenomenului în perioada de timp studiat� (de exemplu, pentru a se analiza evolu�ia salariului mediu dintr-o ramur� a economiei na�ionale, pe parcursul unui an, popula�ia statistic� poate fi format� din valorile salariului mediu din acea ramur�, înregistrate în cele dou�sprezece luni ale anului studiat).

În anumite faze ale cercet�rii, o popula�ie statistic� poate fi divizat� în mai multe p�r�i, pentru fiecare dintre acestea fiind aplicate metode diferite de analiz�.

b) O unitate statistic� este o component� a mul�imii care formeaz� o popula�ie statistic�. În func�ie de metodele �i scopurile cercet�rii, o unitate statistic� poate corespunde unui element indivizibil al popula�iei statistice, fiind numit�, în acest caz, unitate simpl�, sau poate consta dintr-un grup de astfel de elemente, situa�ie în care este numit� unitate compus�. De exemplu, dac� popula�ia statistic� este reprezentat� de ansamblul studen�ilor de la o anumit� specializare, pot fi stabilite unit��i simple, fiecare dintre acestea corespunzând unui student, sau pot fi definite unit��i compuse, constând în grupe, ani de studiu etc.

c) Caracteristicile statistice reprezint� însu�irile prin care sunt descrise, în cadrul unei cercet�ri, unit��ile statistice. În raport cu modul de descriere, pot fi delimitate dou� tipuri de caracteristici statistice:

- caracteristici calitative, care descriu unit��ile statistice prin cuvinte;

- caracteristici cantitative, care descriu unit��ile statistice prin numere.

d) În cadrul �tiin�ei statisticii, un eveniment este un rezultat posibil sau o combina�ie de elemente posibile, ale unui fenomen studiat. Acest concept are implica�ii directe în cadrul previziunilor asupra evolu�iilor viitoare ale fenomenelor. În cazul unui fenomen colectiv, care are mai multe rezultate posibile, previziunile se fac sub forma unor mul�imi de evenimente, numite câmpuri. În func�ie de metodele utilizate în cadrul previziunii, elementele unui câmp de evenimente pot fi prezentate sub diferite forme: valori numerice, descrieri în cuvinte etc. Un eveniment este numit elementar atunci când nu poate fi descompus în mai multe evenimente, �i compus, atunci când reprezint� un ansamblu de evenimente elementare. De

Page 10: STEFANESCU - B S - PIED - uni-muenchen.de9.3. Analiza legturilor dintre variabile prin intermediul regresiei 9.4. Indicatori de apreciere a sensului i intensit ii legturilor dintre

exemplu, dac� se arunc� un zar, realizarea unuia dintre cele �ase numere posibile poate fi considerat� drept un eveniment elementar. Prin reuniunea unora dintre acestea pot fi constituite evenimente compuse: ob�inerea unui num�r par, a unui num�r mai mic decât patru etc. Rela�iile dintre evenimente, care sunt foarte importante din perspectiva aprecierii �anselor de producere a acestora, pot fi studiate prin opera�iuni specifice teoriei mul�imilor: reuniuni, intersec�ii etc. Dou� evenimente se numesc mutual exclusive atunci când este imposibil� realizarea lor simultan� (altfel spus, când intersec�ia lor este mul�imea vid�). Astfel, în cazul arunc�rii unui zar evenimentul de ob�inere a num�rului doi este mutual exclusiv cu evenimentul de ob�inere a unui num�r impar îns� nu se afl� în aceea�i rela�ie cu evenimentul de ob�inere a unui num�r mai mic decât trei.

Un câmp de evenimente este numit complet atunci când elementele sale con�in toate rezultatele posibile ale fenomenului studiat. Utilizarea unui câmp complet de evenimente, care este o condi�ie necesar� pentru o previziune riguroas�, este îns� adeseori foarte dificil de realizat în practic�.

e) O variabil� aleatoare este o aplica�ie prin care fiec�rui element al unui câmp de evenimente îi este asociat� o valoare numeric�, ceea ce faciliteaz� cuantificarea efectelor fenomenului studiat. În func�ie de modul în care sunt atribuite valorile numerice, se pot delimita dou� tipuri de variabile aleatoare:

e1) variabile aleatoare discrete; e2) variabile aleatoare continue.

e1) Valorile numerice ale unei variabile aleatoare discrete, care pot fi finite sau infinite, sunt atribuite evenimentelor în mod discontinuu, în salturi. De exemplu, în cazul arunc�rii unui zar, sunt atribuite evenimentelor cele �ase numere posibile, nu �i valorile intermediare dintre acestea.

e2) La o variabil� aleatoare de tip continuu sunt atribuite evenimentelor absolut toate valorile numerice de pe un interval de varia�ie. În acest caz, evident, valorile numerice sunt în mod obligatoriu infinite. De exemplu, dac� se studiaz� cantitatea de precipita�ii care va surveni în cursul unui an, poate fi luat în calcul un interval de varia�ie care s� cuprind� un num�r infinit de valori numerice.

Alegerea între variabilele de tip discret sau continuu pentru a cuantifica efectele unui fenomen se face în func�ie de metodele de cercetare statistic� utilizate. Uneori, cu toate c� rezultatele posibile

Page 11: STEFANESCU - B S - PIED - uni-muenchen.de9.3. Analiza legturilor dintre variabile prin intermediul regresiei 9.4. Indicatori de apreciere a sensului i intensit ii legturilor dintre

ale unui fenomen ar acoperi absolut toate valorile numerice ale unui interval de varia�ie, se prefer�, mai ales atunci când m�sur�torile nu au o precizie prea mare, atribuirea unor valori în salturi pentru elementele câmpului de evenimente. Alteori, de�i evenimentele ar putea fi descrise prin numere întregi, se prefer� s� se opereze cu intervale de valori numerice.

f) Func�iile probabilistice sunt utilizate în scopul cuantific�rii �anselor de apari�ie a rezultatelor posibile ale unui fenomen. O probabilitate poate fi definit� drept o descriere cantitativ�, printr-un num�r mai mare sau egal decât zero �i mai mic sau egal decât 1, a �anselor de producere a unui eveniment. O func�ie probabilistic� este o aplica�ie prin care este asociat� câte o probabilitate pentru fiecare element al unui câmp de evenimente. În general, func�iile probabilistice sunt stabilite asupra unor variabile aleatoare, ceea ce faciliteaz� atribuirea de probabilit��i.

1.3. Tr�s�turi ale tehnicilor statistice

Incertitudinea inerent� în cazul fenomenelor colective,

predispune adeseori la interpret�ri subiective. Pentru a contracara acest neajuns, tehnicile statistice au la baz�, în general, algoritme destul de stricte, cu reguli precise care nu las� prea mult� libertate de ac�iune pentru cei care le utilizeaz�. Ca o consecin��, cercet�rile statistice solicit�, de regul�, o aten�ie deosebit� pentru am�nunte. Aceast� calitate, care îi face uneori pe statisticieni s� par� cam prea pedan�i �i cam prea birocra�i, poate conferi, totu�i, o rigoare deosebit� unui demers �tiin�ific, chiar �i în condi�ii de incertitudine.

Exist� mai multe criterii de clasificare a tehnicilor statistice: a) criteriul etapei de cercetare statistic�; b) criteriul modului de studiere în timp a

fenomenelor; c) criteriul cuprinderii popula�iei statistice în cadrul

cercet�rii. a) În raport cu criteriul etapei de cercetare, tehnicile statistice

pot fi grupate în trei categorii: a1) tehnici de culegere a datelor; a2) tehnici de prelucrare statistic� a datelor; a3) tehnici de analiz� statistic�.

a1) Tehnicile de culegere a datelor sunt folosite pentru a înregistra aspecte ce caracterizeaz� fenomenele studiate. Aceast�

Page 12: STEFANESCU - B S - PIED - uni-muenchen.de9.3. Analiza legturilor dintre variabile prin intermediul regresiei 9.4. Indicatori de apreciere a sensului i intensit ii legturilor dintre

categorie cuprinde variate procedee: interviuri, recens�minte, experimente etc.

a2) Tehnicile de prelucrare statistic� a datelor sunt folosite pentru a se ob�ine informa�ii utilizate în cadrul analizei. Cele mai multe dintre aceste tehnici sunt cantitative, astfel încât informa�iile rezultate îmbrac�, de regul�, forma unor m�rimi numerice.

În raport cu aspectele vizate se pot delimita, în cadrul categoriei tehnicilor de prelucrare statistic� a datelor, mai multe subcategorii: - tehnici statistice de sistematizare a datelor, care faciliteaz�

prelucr�rile statistice ulterioare �i care pot oferi informa�ii asupra amplorii �i intensit��ii fenomenelor studiate;

- tehnici de reprezentare grafic�, pe baza c�rora pot fi sesizate unele aspecte esen�iale ale unui fenomen cercetat: sensul evolu�iei în timp, forma func�iei probabilistice asociate, leg�turile cu alte fenomene etc.;

- tehnici de determinare a valorilor tipice, prin care sunt determinate m�rimi reprezentative pentru o popula�ie statistic�;

- tehnici de calcul al unor indicatori ai dispersiei, asimetriei sau boltirii, pe baza c�rora se poate aprecia m�sura în care valorile tipice sunt reprezentative pentru ansamblul popula�iei statistice;

- tehnici de calcul al unor indicatori ai leg�turilor dintre fenomene, care pot oferi informa�ii asupra factorilor care influen�eaz� un fenomen cercetat;

- tehnici de determinare a unor numere indice, care faciliteaz� compara�iile între unit��ile statistice etc.

a3) Tehnicile de analiz� statistic� sunt utilizate pentru interpretarea informa�iilor ob�inute prin prelucrarea datelor statistice, în vederea în�elegerii fenomenelor studiate. În aceast� categorie sunt incluse procedee de stabilire a legilor de dependen�� a unui fenomen cercetat fa�� de factorii semnificativi de influen��, de prognoz� a evolu�iilor viitoare a fenomenelor colective etc.

b) Pe baza criteriului modului de studiere în timp a fenomenelor pot fi delimitate dou� categorii de tehnici statistice:

b1) tehnici statistice de analiz� static�; b2) tehnici statistice de analiz� dinamic�.

b1) Tehnicile statistice de analiz� static� sunt utilizate pentru a studia starea unui fenomen la un moment dat. Adeseori, analiza static� este asem�nat� cu o fotografiere, care surprinde toate aspectele

Page 13: STEFANESCU - B S - PIED - uni-muenchen.de9.3. Analiza legturilor dintre variabile prin intermediul regresiei 9.4. Indicatori de apreciere a sensului i intensit ii legturilor dintre

obiectului fotografiat f�r� a putea releva îns� transform�rile pe care acesta le-a suferit în timp.

b2) Tehnicile statistice de analiz� dinamic� sunt folosite pentru a studia evolu�ia în timp a unui fenomen. Un procedeu de analiz� dinamic� poate fi asem�nat unei film�ri care surprinde transform�rile în timp.

c) Dup� criteriul cuprinderii popula�iei statistice în cadrul cercet�rii, tehnicile statistice pot fi împ�r�ite în dou� categorii:

c1) tehnici de cercetare statistic� total� c2) tehnici de cercetare statistic� par�ial�.

c1) Tehnicile de cercetare statistic� total� presupun utilizarea unor date provenite de la toate unit��ile unei popula�ii statistice. Astfel de procedee, care sunt avantajoase din perspectiva rigorii demersului �tiin�ific, se pot dovedi, în cazul unui volum mare al popula�iei statistice, deosebit de costisitoare �i de cronofage.

c2) Tehnicile de cercetare statistic� par�ial� presupun utilizarea unor date care provin numai de la anumite unit��i ale popula�iei statistice �i extinderea ulterioar� a informa�iilor astfel ob�inute la nivelul ansamblului popula�iei. De exemplu, sondajele de opinie prin care se estimeaz� convingerile �i op�iunile unei popula�ii la un moment dat, utilizeaz� datele ob�inute pentru o parte infim� a ansamblului colectivit��ii. Cu toate c�, în principiu, confer� unui demers �tiin�ific o rigoare mai mic� decât cercetarea statistic� total�, cercetarea statistic� par�ial� îi este adeseori preferat� acesteia datorit� operativit��ii �i costurilor mici pe care le implic�.

Fiecare dintre categoriile de tehnici statistice prezentate anterior cuprinde o gam� variat� de procedee, ceea ce ridic�, în cadrul unei cercet�ri statistice, problema alegerii metodelor optime. Într-o astfel de decizie sunt luate în considerare, de regul�, trei aspecte:

- costurile implicate; - perioada de timp necesar� pentru aplicare; - acurate�ea rezultatelor. Alegerea este, adeseori, destul de dificil� în condi�iile în care,

în general cele trei criterii de decizie se afl� în rela�ii concuren�iale (de exemplu, un procedeu care asigur� o acurate�e mare a rezultatelor implic�, de regul�, un cost ridicat �i o perioad� lung� de timp pentru implementare).

În principiu, faptul c� tehnicile statistice sunt bazate în mare m�sur� pe tehnici cantitative asigur� o anumit� obiectivitate studiului fenomenelor colective. Totu�i, aceasta nu înseamn� c� cercetarea

Page 14: STEFANESCU - B S - PIED - uni-muenchen.de9.3. Analiza legturilor dintre variabile prin intermediul regresiei 9.4. Indicatori de apreciere a sensului i intensit ii legturilor dintre

statistic� nu este expus� gre�elilor, arbitrariului sau subiectivit��ii. Uneori, tehnicile statistice sunt utilizate gre�it sau sunt chiar manipulate pentru a se ajunge la rezultatele dorite de utilizatori, situa�ii care au condus la comentarii ironice de genul „statistica este �tiin�a prin care se poate demonstra orice” sau, în cuvintele lui Mark Twain: „Exist� trei tipuri de minciuni: simple, gogonate �i statistici”.

1.4. Evolu�ia în timp a �tiin�ei statisticii

Termenul de statistic� (în limba german� statistik, provenit din

italianul statisto) a fost folosit pentru prima oar� de c�tre omul de �tiin�� Gottfried Achenwall, la jum�tatea secolului XVIII, cu sensul de ansamblu de informa�ii organizate într-o form� care s� faciliteze analiza. Totu�i, forme incipiente de cercetare statistic� au fost folosite cu mult înainte de consacrarea termenului de statistic�. Astfel, istoricii au demonstrat c� acum mai bine de 4000 de ani în Egiptul Antic se practicau inventarieri ale averii statului. Tot din perioada antic�, Vechiul Testament ne ofer� informa�ii despre un recens�mânt organizat în Israel de regele David, iar alte date furnizate de istorici descriu înregistr�ri statistice practicate în China Antic� �i Roma Antic�. Aceste înregistr�ri statistice aveau un scop pragmatic: buna conducere a statului necesita informa�ii asupra resurselor materiale, financiare �i umane disponibile. Cu timpul, tehnicile statistice utilizate în administra�ia public� s-au diversificat, devenind totodat� mai sofisticate.

Înc� din Evul Mediu s-au manifestat preocup�ri pentru folosirea tehnicilor statistice nu doar în administra�ia public� ci �i în cadrul cercet�rilor �tiin�ifice. Începutul a fost f�cut cu unele aspecte demografice (natalitatea, mortalitatea etc.) pe care oameni de �tiin�� din acea perioad� (John Grund, Halley �.a.) le-au studiat prin procedee statistice.

Au urmat alte tentative de studiere a unor fenomene colective, care au relevat necesitatea unor tehnici care s� faciliteze o cercetare riguroas�, chiar �i în condi�ii de incertitudine. Astfel de procedee au fost concepute în cadrul �tiin�ei matematicii, ceea ce a f�cut ca mult� vreme statistica s� fie considerat� drept o component� a acesteia. De altfel, delimitarea dintre cele dou� �tiin�e a r�mas pân� ast�zi ambigu�. Exist� matematicieni care privesc statistica drept un capitol al matematicii dup� cum exist� statisticieni care consider� c� matematica este un capitol al statisticii.

Page 15: STEFANESCU - B S - PIED - uni-muenchen.de9.3. Analiza legturilor dintre variabile prin intermediul regresiei 9.4. Indicatori de apreciere a sensului i intensit ii legturilor dintre

Treptat, procedeele statistice au început s� fie folosite frecvent în cadrul cercet�rilor din diferite �tiin�e: fizica, astronomia, chimia, biologia etc., ajungându-se ca pân� la urm� s� fie considerate indispensabile pentru un demers �tiin�ific riguros. Ini�ial erau folosite doar procedee �inând de ceea ce numim ast�zi statistica descriptiv�, care au ca obiect descrierea fenomenelor: reprezent�ri grafice, determinarea valorilor tipice, aprecierea dispersie �i a asimetriei etc. Cu timpul îns�, s-au dezvoltat �i tehnici ale a�a-numitei statistici inductive, care are ca obiect generalizarea rezultatelor unor cercet�ri par�iale.

În ultimele decenii, pe lâng� administra�ia public� �i cercet�rile �tiin�ifice, procedeele statistice au început s� fie folosite pe scar� larg� în conducerea unor organiza�ii din domeniul economic �i social. Tot în ultimele decenii, s-a ini�iat combinarea tehnicilor statistice cu procedee bazate pe inteligen�a artificial�, câ�tigându-se astfel o operativitate deosebit�.

Aplicarea metodelor statistice în diferite domenii de activitate a condus la o diversificare a tehnicilor, acestea trebuind s� fie adaptate condi�iilor în care sunt utilizate. Aceast� situa�ie a condus la o diferen�iere în cadrul �tiin�ei statisticii a dou� componente: statistica matematic� �i statistica aplicat�. Statistica matematic� are ca obiect formularea, pe baza principiilor �tiin�ei matematicii, a unor tehnici de cercetare statistic�. În ce prive�te statistica aplicat�, aceasta are ca obiect adaptarea tehnicilor statisticii matematice la condi�iile concrete ale domeniilor în care sunt utilizate. În cadrul statisticii aplicate se delimiteaz� prin particularit��ile procedeelor, mai multe ramuri: statistica economic�, statistica managerial�, statistica fizicii, statistica biologiei, statistica chimiei, statistica sociologic�, statistica ingineriei, statistica medicinii etc.

Page 16: STEFANESCU - B S - PIED - uni-muenchen.de9.3. Analiza legturilor dintre variabile prin intermediul regresiei 9.4. Indicatori de apreciere a sensului i intensit ii legturilor dintre

Capitolul 2 - Culegerea datelor statistice

2.1. Coordonatele culegerii datelor statistice

Culegerea datelor, care reprezint� începutul unui demers de

cercetare statistic�, are un rol determinant asupra calit��ii acestuia. Indiferent de rigoarea tehnicilor utilizate în etapele ulterioare, dac� datele colectate sunt eronate, rezultatele cercet�rii vor fi, de asemenea eronate, situa�ie cunoscut� sub denumirea de „fenomenul GIGO” (garbage in – garbage out).

Este necesar ca opera�iunile de culegere a datelor s� fie circumscrise unor caracteristici ale cercet�rii statistice din care fac parte: scopul acesteia, caracterul regulat sau extraordinar, domeniul de aplicare, acurate�ea solicitat� etc. Aceste aspecte sunt luate în considerare atunci când se stabilesc principalii parametri ai culegerii datelor: popula�ia statistic�, sursele datelor, caracteristicile statistice la care se vor raporta datele, instrumentele de colectare a datelor �.a.m.d.

Într-o cercetare statistic� pot fi utilizate dou� tipuri de date: - date primare, culese special pentru acel demers; - date secundare, care au fost ob�inute anterior, pentru alte

scopuri. În general, procurarea datelor secundare este mult mai pu�in

costisitoare �i consum� mult mai pu�in timp în compara�ie cu ob�inerea datelor primare. Adeseori, datele secundare sunt preluate din comunicate oficiale ale unor institu�ii publice. De exemplu, în cercet�rile statistice asupra activit��ii unei firme pot fi folosite date asupra unor indicatori macroeconomici: rata infla�iei, rata �omajului, salariul mediu, cursurile valutare �.a.m.d., care au un caracter public. În ciuda avantajelor incontestabile pe care le ofer�, utilizarea datelor secundare este, totu�i, limitat�, acestea având, de regul�, un rol

Page 17: STEFANESCU - B S - PIED - uni-muenchen.de9.3. Analiza legturilor dintre variabile prin intermediul regresiei 9.4. Indicatori de apreciere a sensului i intensit ii legturilor dintre

complementar. Din perspectiva utiliz�rii popula�iei statistice pot fi delimitate dou� forme de culegere a datelor statistice:

a) culegerea datelor prin recens�minte; b) culegerea datelor prin sondaje.

a) Culegerea datelor prin recens�minte presupune investigarea tuturor unit��ilor popula�iei statistice prin care se studiaz� un fenomen. Atunci când num�rul de unit��i statistice este foarte mare (a�a cum este, de exemplu, cazul recens�mintelor asupra popula�iei umane) un recens�mânt necesit� folosirea unui volum mare de personal, nu întotdeauna pe deplin calificat, ceea ce implic� probleme organizatorice importante, costuri ridicate precum �i posibilitatea unor erori de înregistrare semnificative. Din aceste motive, astfel de recens�minte se efectueaz� destul de rar (de exemplu, recens�mintele asupra popula�iei se utilizeaz�, de regul�, o dat� la zece ani). În schimb, atunci când num�rul de unit��i statistice este relativ redus, recens�mântul poate fi un mijloc destul de simplu, de ieftin �i de precis de culegere a datelor statistice (de exemplu, pentru o firm� cu un num�r mic de clien�i nu este prea dificil s� ob�in� date despre to�i ace�tia).

b) Culegerea datelor prin sondaj presupune ca în loc de a se colecta date de la toate unit��ile popula�iei statistice s� fie investigat� doar o parte a acesteia, numit� e�antion, urmând ca în cadrul cercet�rii statistice informa�iile ob�inute pe baza datelor de la e�antion s� fie extinse asupra întregii popula�ii statistice. În compara�ie cu recens�mintele, sondajele necesit�, de regul�, un volum mult mai redus de personal, ceea ce permite ca to�i lucr�torii utiliza�i s� fie califica�i, �i face mai u�oar� coordonarea, implicând totodat� costuri mai mici �i restrângând posibilitatea erorilor de înregistrare. Totu�i, culegerea datelor prin sondaje este expus� a�a-numitelor erori de reprezentativitate, care deriv� din posibilitatea ca e�antionul ales s� nu fie suficient de reprezentativ pentru ansamblul popula�iei statistice.

2.2. Instrumente de culegere a datelor statistice

În acest subcapitol vor fi prezentate succint patru tipuri de

instrumente utilizate destul de frecvent în culegerea datelor statistice: - chestionarea statistic�; - observa�ia statistic�; - experimentul statistic; - panelul statistic.

Page 18: STEFANESCU - B S - PIED - uni-muenchen.de9.3. Analiza legturilor dintre variabile prin intermediul regresiei 9.4. Indicatori de apreciere a sensului i intensit ii legturilor dintre

2.2.1. Chestionarea statistic�

O chestionare statistic� e reprezentat� de un ansamblu de întreb�ri, cuprinse într-un a�a numit chestionar, adresate unor persoane cu privire la percep�iile �i reac�iile acestora fa�� de un fenomen studiat. În cadrul chestion�rii statistice se deta�eaz�, prin importan��, trei aspecte:

- forma de anchetare; - acurate�ea datelor culese; - proiectarea chestionarelor.

2.2.1.1 Forme de anchetare

Din perspectiva formelor de anchetare se pot distinge dou� tipuri de chestion�ri statistice:

a) interviuri; b) chestion�ri scrise.

a) Interviurile îmbrac� forma unor discu�ii purtate cu persoanele anchetate de c�tre lucr�tori specializa�i, numi�i operatori de interviuri. Principalul avantaj al interviurilor const� în faptul c� permite interactivitatea dintre operatorul de interviuri �i persoana intervievat�. În cadrul discu�iilor, operatorul interviurilor îi poate l�muri persoanei anchetate sensul unor întreb�ri dificile, o poate convinge pe aceasta s� ating� subiecte mai delicate sau îi poate adresa întreb�ri suplimentare, neprev�zute în chestionarul stabilit ini�ial, pentru a l�muri anumite aspecte.

Totu�i, în culegerea datelor prin interviuri intervin �i câteva dificult��i semnificative: - operatorul de interviuri trebuie s� fie, în mod obligatoriu, o

persoan� calificat�; - adeseori interviurile consum� perioade de timp destul de lungi; - reticen�a de a acorda interviuri pe care o manifest� unele dintre

persoanele alese pentru a fi anchetate etc. Interviurile pot fi realizate atât pe cale oral� cât �i prin telefon.

Cele pe cale oral� sunt mai costisitoare �i consum� mai mult timp decât cele telefonice îns� faciliteaz� într-o m�sur� mai mare interactivitatea dintre operatorul de interviuri �i persoanele anchetate.

b) Chestion�rile scrise se materializeaz� în distribuirea, c�tre persoanele anchetate, a unui chestionar, cu rug�mintea de a se r�spunde la întreb�rile acestuia. Fa�� de interviuri, chestion�rile

Page 19: STEFANESCU - B S - PIED - uni-muenchen.de9.3. Analiza legturilor dintre variabile prin intermediul regresiei 9.4. Indicatori de apreciere a sensului i intensit ii legturilor dintre

scrise au unele avantaje incontestabile: sunt mai operative, mai u�or de organizat �i mai pu�in costisitoare. În acela�i timp îns�, la aceast� form� de chestionare l�murirea persoanelor anchetate asupra în�elesului unor întreb�ri este mai dificil�.

2.2.1.2. Acurate�ea datelor culese prin chestion�ri statistice

Chestionarea statistic� se diferen�iaz� fa�� de celelalte instrumente ale culegerii de date statistice prin oportunit��ile pe care le ofer� pentru în�elegerea comportamentului uman în leg�tur� cu fenomenele studiate. Totu�i, tocmai faptul c� se afl� în rela�ie direct� cu comportamentul uman face ca acest instrument s� se afle expus într-o m�sur� considerabil� erorilor.

Exist� mai multe surse de erori asupra datelor culese prin chestion�ri statistice: - neîn�elegerea sensului unora dintre întreb�ri; - nesinceritatea sau refuzul de a supune adev�rul la întreb�ri delicate

pentru persoanele anchetate (apartenen�a la o minoritate religioas� sau sexual�, practica de a oferi mit�, metodele manageriale aplicate etc.);

- neseriozitatea unora dintre responden�i etc. Pentru combaterea acestor surse de erori pot fi aplicate

diferite remedii:formularea clar� �i în termeni simpli a întreb�rilor adresate, abordarea cu tact a subiectelor delicate, selectarea prealabil� a persoanelor anchetate etc.

2.2.1.3. Proiectarea chestionarelor statistice

Pentru ca o chestionare statistic� s� î�i ating� obiectivele vizate este indicat� o proiectare minu�ioas� a chestionarelor utilizate, în raport cu aspectele asupra c�rora se dore�te colectarea datelor. Chiar �i în cazul unui interviu, unde întreb�rile iau adeseori na�tere în mod spontan în cadrul discu�iilor, se recomand� preg�tirea din timp a unor întreb�ri cheie. pentru proiectarea chestionarelor statistice pot fi formulate mai multe reguli, a c�ror respectare condi�ioneaz� rigoarea colect�rii datelor.

Regula nr. 1. Întreb�rile trebuie formulate de pe o pozi�ie neutr� fa�� de aspectele abordate

Aceast� neutralitate trebuie s� îng�duie persoanelor anchetate s� î�i exprime opiniile f�r� a fi influen�ate de modul de formulare a

Page 20: STEFANESCU - B S - PIED - uni-muenchen.de9.3. Analiza legturilor dintre variabile prin intermediul regresiei 9.4. Indicatori de apreciere a sensului i intensit ii legturilor dintre

întreb�rilor. De exemplu, o întrebare de genul „Dumneavoastr� dori�i, a�a cum dore�te cea mai mare parte a popula�iei României, integrarea în Uniunea European�?” are dezavantajul c� poate influen�a unele persoane s� r�spund� afirmativ numai ca s� nu apar� ca având o opinie separat� fa�� de majoritate, dup� cum alte persoane vor r�spunde negativ tocmai pentru a se distan�a de majoritate. În practic�, regula formul�rii întreb�rilor de pe o pozi�ie neutr� este înc�lcat� uneori în mod voit, tocmai pentru a se ob�ine anumite rezultate, a�a cum a fost, în trecut, cazul unor sondaje de opinie din România.

Regula nr. 2. Întreb�rile trebuie astfel formulate încât sensul acestora s� fie u�or de în�eles.

Termenii întreb�rilor trebuie stabili�i în func�ie de unele caracteristici ale grupului de persoane anchetat (rela�ia în care se afl� cu aspectele studiate, preg�tirea profesional�, vârsta etc.). În principiu, trebuie evitate formul�rile prea complicate sau cuvintele folosite rar.

Regula nr. 3. Întreb�rile chestionarului trebuie organizate într-o succesiune logic�, de la generalit��i la aspecte particulare

S-a constatat c� o abordare prea brusc� a unor aspecte particulare conduce adeseori la r�spunsuri pripite întrucât persoanele anchetate nu au avut timp s� intre în tem�. Este indicat, din acest motiv, s� se înceap� cu întreb�ri cu caracter general ajungându-se treptat la întreb�ri cu caracter particular. De exemplu, dac� se culeg date asupra cererii poten�iale pentru sortimentele comercializate de o firm� produc�toare de dulciuri se poate porni cu o întrebare de genul „Consuma�i frecvent dulciuri?”, ajungându-se abia în final la întreb�ri de am�nunt, cum ar fi: „Prin ce anume considera�i c� se diferen�iaz� produsele firmei noastre fa�� de alte sortimente de dulciuri?”

Într-o anchet�, unele întreb�ri pot fi adresate doar anumitor categorii de responden�i, stabilite pe baza r�spunsurilor de la unele întreb�ri anterioare. De exemplu, pe baza întreb�rii referitoare la consumul de dulciuri, responden�ii pot fi împ�r�i�i în dou� categorii: cei care consum� frecvent dulciuri �i cei care nu fac aceasta decât rar sau deloc. Pentru persoanele din prima categorie ancheta ar putea fi direc�ionat� pentru ob�inerea de date asupra preferin�elor în materie de dulciuri, cu întreb�ri de genul „În cazul în care consuma�i frecvent dulciuri, care sunt sortimentele dumneavoastr� preferate?”. Pentru responden�ii din a doua categorie este mai important de aflat

Page 21: STEFANESCU - B S - PIED - uni-muenchen.de9.3. Analiza legturilor dintre variabile prin intermediul regresiei 9.4. Indicatori de apreciere a sensului i intensit ii legturilor dintre

motivele re�inerii fa�� de dulciuri, prin întreb�ri de genul: „În cazul în care nu consuma�i frecvent dulciuri, ce anume v� face s� nu le prefera�i?”. Se poate observa c� fiecare din cele dou� întreb�ri începe cu o condi�ie (numit� filtru) folosit� mai ales în cazul chestion�rilor scrise pentru a indica persoanele care vor trebui s� r�spund�.

Regula nr. 4. Tipul întreb�rilor trebuie adaptat la circumstan�ele chestion�rii

În cadrul chestionarelor se disting, în func�ie de forma în care trebuie date r�spunsurile, dou� tipuri de întreb�ri:

- întreb�ri cu r�spuns deschis; - întreb�ri cu variante prestabilite de r�spuns.

Întreb�rile cu r�spuns deschis îl las� pe respondent s� r�spund� în forma pe care o dore�te. De exemplu, în cadrul unei anchete printre studen�i asupra oportunit��ilor oferite de o facultate, o astfel de întrebare ar putea fi formulat� astfel: „De ce a�i ales facultatea noastr�?”, l�sându-se celor interoga�i libertatea în a-�i prezenta motivele. În acest fel poate fi evitat� influen�area persoanelor anchetate în formularea r�spunsurilor. Totu�i, întreb�rile cu r�spuns deschis nu sunt prea potrivite pentru responden�ii care au dificult��i în a-�i exprima opiniile clar �i rapid. Un alt dezavantaj este reprezentat de faptul c� r�spunsurile oferite sunt destul de greu de sistematizat.

Întreb�rile cu variante prestabilite de r�spuns ofer� responden�ilor posibilitatea de a opta între mai multe r�spunsuri posibile. De exemplu, dac� se efectueaz� o anchet� asupra modului în care locuitorii unei localit��i ar primi înfiin�area unui parc de distrac�ii, s-ar putea pune mai multe întreb�ri cu variante prestabilite de r�spuns: „Ave�i cuno�tin�� despre un plan de înfiin�are a unui parc de distrac�ii în localitatea dumneavoastr�? DA/NU”, sau „În cazul în care sunte�i împotriva proiectului parcului de distrac�ii, ce anume ve�i face pentru a v� sus�ine punctul de vedere?

� voi adresa scrisori consilierilor locali; � voi adresa scrisori parlamentarilor din jude�ul nostru; � voi semna o peti�ie împotriva construirii parcului de

distrac�ii; � voi participa la demonstra�ii împotriva construirii

parcului de distrac�ii; � voi participa la tentativele de întrerupere a construc�iei

parcului;

Page 22: STEFANESCU - B S - PIED - uni-muenchen.de9.3. Analiza legturilor dintre variabile prin intermediul regresiei 9.4. Indicatori de apreciere a sensului i intensit ii legturilor dintre

� nu voi face nimic concret.” Uneori, la astfel de întreb�ri se trece la scalarea r�spunsurilor,

pentru a se putea m�sura atitudinea responden�ilor. De exemplu, pentru a se estima cât de mult aprob� sau dezaprob� localnicii înfiin�area unui parc de distrac�ii, ar putea fi formulat� urm�toarea întrebare: „Crede�i c� parcul de distrac�ii ar trebui construit?”, cu urm�toarele r�spunsuri posibile:

Agreez

ideea foarte mult

Agreez ideea

Nu �tiu Dezaprob

ideea

Dezaprob foarte mult

ideea Aceste întreb�ri au avantajul unei sistematiz�ri simple �i

operative a r�spunsurilor. Totu�i, uneori r�spunsurile oferite nu reflect� exact opiniile responden�ilor ci sunt, mai degrab�, cele mai apropiate fa�� de acestea dintre variantele de r�spuns oferite. Aceasta se întâmpl� mai ales atunci când variantele de r�spuns nu sunt suficient de dezvoltate pentru a cuprinde toate nuan�ele opiniilor responden�ilor. De exemplu, datele culese pe baza unei întreb�ri de genul: „Sunte�i de acord cu instalarea de baze ale armatei SUA pe teritoriul României? DA/NU” nu ofer� neap�rat o imagine complet� a opiniilor celor interoga�i. O parte dintre cei care ar da r�spunsuri negative ar putea accepta, în fapt, bazele militare în anumite condi�ii: dreptul de veto al statului român asupra utiliz�rii acestor baze în conflictele militare, valabilitatea jurisdic�iei române�ti pentru militarii americani etc.

2.2.2. Observa�ia statistic�

O observa�ie statistic� este o înregistrare a unor aspecte ale manifest�rii unui fenomen cercetat. Acest instrument de culegere de date statistice este utilizat destul de frecvent în variate domenii: în studiul comportamentului oamenilor sau al altor vie�uitoare, în cercet�ri asupra activit��ii economice, unde se înregistreaz� diferi�i parametri: volumul produc�iei, al vânz�rilor etc., în cercetarea unor procese fizice, chimice etc. Atunci când se cerceteaz� comportamentul oamenilor sau al altor vie�uitoare se recomand�, de regul�, ca observarea statistic� s� se desf��oare f�r� �tirea celor studia�i, tocmai pentru a nu le afecta comportamentul (în acest scop se folosesc film�rile cu camere ascunse, oglinzi cu vedere unilateral�

Page 23: STEFANESCU - B S - PIED - uni-muenchen.de9.3. Analiza legturilor dintre variabile prin intermediul regresiei 9.4. Indicatori de apreciere a sensului i intensit ii legturilor dintre

�.a.m.d.). Pentru înregistrarea unor date ce privesc parametrii tehnici ai unor fenomene pot fi folosite aparate de m�sur� în combina�ie cu tehnologii informa�ionale. În domeniul activit��ii economice, observa�iile statistice sunt circumscrise adeseori unui sistem informa�ional, fiind organizate în raport cu caracteristicile acestuia.

Acurate�ea datelor ob�inute prin observ�ri statistice depinde în mare m�sur� de modalit��ile de înregistrare. La acest instrument de colectare a datelor statistice sunt relevante dou� categorii de erori: erorile umane �i erorile date de deficien�e tehnice.

Principalele avantaje ale observa�iilor statistice sunt reprezentate de costurile în general reduse �i de relativa simplitate a aplic�rii. Totu�i, utilizarea acestui instrument are �i unele limite, în special în cazul cercet�rii comportamentului uman unde poate oferi date asupra manifest�rii dar nu �i asupra motiva�iilor acestuia.

2.2.3. Experimentul statistic Un experiment statistic const� în provocarea, în mod artificial

dar în condi�ii cât mai apropiate de cele naturale, a unui proces, pentru a i se putea studia manifestarea. Experimentele statistice au aplica�ii în diferite domenii: în cercet�ri asupra unor fenomene fizice, chimice, biologice, sociologice, psihologice �.a.m.d., în fundamentarea unor decizii manageriale etc. Caracteristicile unui experiment statistic trebuie adaptate domeniului în care acesta trebuie aplicat. De exemplu, dac� se dore�te ob�inerea de date asupra modului în care ar putea fi primit un sortiment de produs nou, acesta este distribuit, înainte de lansarea pe pia��, unui grup de persoane ale c�ror reac�ii vor fi studiate. Acurate�ea datelor ob�inute prin experimente statistice depinde în mare m�sur� de gradul în care condi�iile de desf��urare a acestora sunt apropiate de condi�iile naturale. Experimentele statistice sunt indicate îndeosebi în cazul unor procese inedite, care nu pot fi studiate pe baza experien�elor din trecut. Totu�i, utilizarea acestora este adeseori destul de complex� �i de costisitoare.

2.3.4. Panelul statistic

Un panel statistic const� în interogarea periodic� a unui grup de persoane cu privire la un acela�i fenomen. Acest instrument este indicat în cercetarea unor procese pentru care este de a�teptat ca percep�iile popula�iei s� se modifice substan�ial în timp: politici

Page 24: STEFANESCU - B S - PIED - uni-muenchen.de9.3. Analiza legturilor dintre variabile prin intermediul regresiei 9.4. Indicatori de apreciere a sensului i intensit ii legturilor dintre

guvernamentale, campanii promo�ionale, lans�ri de sortimente noi de produse etc.

Un panel statistic poate fi considerat drept un ansamblu de chestion�ri efectuate cu regularitate cu acelea�i persoane anchetate. Totu�i, organizarea culegerii de date prin acest instrument este mult mai dificil� decât prin chestion�rile statistice obi�nuite deoarece nu sunt prea u�or de g�sit persoane dispuse s� r�spund� întreb�rilor cu regularitate, uneori de-a lungul unor perioade lungi de timp. În plus, acurate�ea datelor culese poate avea de suferit deoarece tocmai faptul c� au fost alese în grupul supus chestion�rii poate determina schimb�ri în comportamentul unor persoane anchetate. De asemenea, culegerea datelor este expus� �i riscului descomplet�rii, din diferite motive (decese, schimbarea localit��ii de domiciliu etc.) a grupului de persoane anchetate.

Page 25: STEFANESCU - B S - PIED - uni-muenchen.de9.3. Analiza legturilor dintre variabile prin intermediul regresiei 9.4. Indicatori de apreciere a sensului i intensit ii legturilor dintre
Page 26: STEFANESCU - B S - PIED - uni-muenchen.de9.3. Analiza legturilor dintre variabile prin intermediul regresiei 9.4. Indicatori de apreciere a sensului i intensit ii legturilor dintre

Capitolul 3 - Prelucrarea primar� a datelor statistice

3.1. Coordonate ale prelucr�rii primare a datelor statistice

Dup� ce datele statistice au fost culese, este necesar�

transpunerea lor într-o form� care s� faciliteze caracterizarea fenomenelor colective. Ansamblul procedeelor utilizate în acest scop poart� denumirea de prelucrare primar� a datelor statistice. Rezultatele acestor opera�iuni pot îmbr�ca mai multe forme:

• serii statistice; • tabele statistice; • reprezent�ri grafice.

3.1.1. Seriile statistice O serie statistic� este o modalitate de organizare a unei

popula�ii statistice sub forma unui �ir în care fiec�rei unit��i îi sunt asociate valori ale uneia sau mai multor caracteristici. În studiul fenomenelor colective pot fi utilizate forme variate de serii statistice. În continuare, vom prezenta o clasificare a acestora în raport cu dou� criterii: num�rul �i tipul caracteristicilor folosite în descrierea unit��ilor popula�iei.

În func�ie de num�rul caracteristicilor pot fi delimitate dou� tipuri de serii statistice:

- serii unidimensionale, în care unit��ile popula�iei statistice sunt descrise printr-o singur� caracteristic�;

- serii multidimensionale (bidimensionale atunci când se folosesc dou� caracteristici, tridimensionale atunci când sunt folosite trei caracteristici �.a.m.d.), în care unit��ile popula�iei statistice sunt descrise prin mai multe caracteristici. În raport cu tipul caracteristicilor statistice, se pot departaja

trei categorii de serii statistice: o serii atributive, în care sunt utilizate alte tipuri de

caracteristici decât cele de spa�iu sau de timp; o serii de spa�iu, în care caracteristicile utilizate descriu

locul de manifestare a fenomenului studiat; o serii de timp, în care caracteristicile folosite descriu

evolu�ia în timp a fenomenului studiat.

Page 27: STEFANESCU - B S - PIED - uni-muenchen.de9.3. Analiza legturilor dintre variabile prin intermediul regresiei 9.4. Indicatori de apreciere a sensului i intensit ii legturilor dintre

3.1.2. Tabele statistice

Un tabel statistic este un tabel în ale c�rui celule sunt înscrise valorile asociate unei serii statistice, grupate pe linii �i pe coloane în raport cu unit��ile statistice �i caracteristicile folosite în descrierea fenomenului studiat.

Tabelele statistice se pot folosi atât în calculul unor m�rimi cât �i în reprezentarea aspectelor definitorii ale fenomenelor colective. În ambele cazuri, exigen�ele cercet�rii statistice impun câteva reguli în construirea tabelelor.

Tabelul 3.1. Calculul cifrei de afaceri

Nr.

crt. Sortiment de produs

Pre� (pi) [RON/buc]

Cantit��i vândute

(qi)

[buc]

Cifr� de afaceri aferent�

sortimentului (CAi = pi × qi)

[RON] (0) (1) (2) (3) (4) = (2) × (3) 1 Televizor

model 1 100 100 10 000

2 Televizor model 2

50 40 2 000

3 CD player 10 80 800 4 Total x x 12 800

5 Simbol pentru total

x

x �

=

n

iiCA

1

Regula nr. 1: Unit��ile statistice �i caracteristicile statistice

trebuie înscrise în tabele cu elemente de identificare care s� le diferen�ieze în mod clar. Atunci când tabelul serve�te în determinarea unor m�rimi, este indicat� folosirea, pentru caracteristicile utilizate, a unor simboluri, înscrise între paranteze rotunde �i, dac� este cazul, a formulelor de calcul. De exemplu, în tabelul 3.1., care a fost utilizat pentru determinarea cifrei de afaceri a unei firme care comercializeaz� produse electronice, unit��ile statistice sunt reprezentate de sortimentele de produse iar caracteristicile statistice de pre�uri �i de cantit��i vândute. În situa�ia în care firma

Page 28: STEFANESCU - B S - PIED - uni-muenchen.de9.3. Analiza legturilor dintre variabile prin intermediul regresiei 9.4. Indicatori de apreciere a sensului i intensit ii legturilor dintre

comercializeaz� dou� sortimente de televizoare, acestea au trebuit diferen�iate prin precizarea modelului. La cele dou� caracteristici au fost precizate simbolurile, iar în ce prive�te cifra de afaceri a fiec�rui sortiment, dat� de produsul dintre pre� �i cantitatea vândut�, a fost înscris� �i formula de calcul. În coloana prin care s-au calculat cifrele de afaceri pentru cele trei sortimente au fost înscrise totalul acestora (care reprezint� de fapt valoarea m�rimii care trebuia calculat�) �i simbolul asociat acestuia.

Regula nr. 2: Se recomand� ca unit��ilor statistice s� le fie asociat un num�r de ordine (numit �i num�r curent) care s� faciliteze reg�sirea datelor. Atunci când tabelul este utilizat în determinarea unor m�rimi, este indicat ca �i fiec�rei caracteristici statistice s� îi fie asociat un num�r de ordine, înscris în paranteze rotunde, iar pentru valorile calculate în cadrul tabelului s� se indice modul de calcul prin intermediul num�rului de ordine. De exemplu, în tabelul 3.1., formula (4) = (2) × (3) indic� faptul c� pentru fiecare linie care corespunde unei unit��i statistice, valoarea din coloana nr. 4 este dat� de produsul valorilor din coloanele cu numerele de ordine 2 �i 3.

Tabelul 3.2. Indicatori macroeconomici în România în perioada 1990 – 1995

Indicatori U.M. 1990 1991 1992 1993 1994a) 1995 b) 1. Produsul intern brut

mld. lei

857,9 2203,9 6029,2 20035,7 49794,8 72248,9

2. Export FOB total c)

mil. USD

5775,4 4265,7 4363,4 4892,2 6151,3 7519,5

3. Import FOB total c)

mil. USD

9202,5 5372,0 5784,1 6020,1 6562,4 8750,0

4. Rata infla�iei ca nivel la sfâr�itul perioadei 1)

% 37,7 222,8 199,2 295,5 61,7 27,8

5. Rata % - 3,0 8,2 10,4 10,9 8,9

Page 29: STEFANESCU - B S - PIED - uni-muenchen.de9.3. Analiza legturilor dintre variabile prin intermediul regresiei 9.4. Indicatori de apreciere a sensului i intensit ii legturilor dintre

�omajului 2) Sursa: Banca Na�ional� a României, Raport Anual 1995

1) Decembrie an curent fa�� de decembrie an anterior 2) La sfâr�itul perioadei; a) Datele privind conturile na�ionale pentru anul 1994 sunt semidefinite; b) Datele privind conturile na�ionale pentru anul 1995 sunt provizorii; c) Datele operative pentru anul 1995.

Regula nr. 3: Pentru fiecare caracteristic� înscris� într-un

tabel statistic trebuie precizat� unitatea de m�sur�. În func�ie de spa�iul disponibil �i de particularit��ile seriei statistice, unit��ile de m�sur� pot fi înscrise între paranteze p�trate, lâng� denumirea caracteristicii statistice (tabelul 3.1.), într-o linie sau coloan� special� (tabelul 3.2.) sau, atunci când toate caracteristicile statistice din tabel au aceea�i unitate de m�sur�, deasupra col�ului din dreapta al tabelului (tabelul 3.3). Tabelul 3.3. Rate ale dobânzilor practicate în sistemul bancar din România în perioada septembrie – decembrie 1993 - procente pe an -

Nr. crt.

Luna

Rat� medie la credite pentru

clien�i nebancari

Rat� medie la depozite pentru

clien�i nebancari

Rat� medie la opera�iuni

interbancare

1 Sept. 53,8 33,8 ... 2 Oct. 74,4 38,0 ... 3 Nov. 83,6 41,4 61,7 4 Dec. 86,4 42,5 61,3 Sursa: Banca Na�ional� a României, Raport Anual 1995

Regula nr. 4: Într-un tabel statistic trebuie indicate, de regul� prin note explicative, valorile provizorii, care ar putea fi modificate în urma unor calcule ulterioare, în care vor fi folosite date mai precise. De exemplu, în tabelul 3.2., indicatorii macroeconomici determina�i pentru anii 1994 �i 1995 au un caracter provizoriu, întrucât în anul 1996, când au fost calcula�i, nu fuseser� definitivate conturile

Page 30: STEFANESCU - B S - PIED - uni-muenchen.de9.3. Analiza legturilor dintre variabile prin intermediul regresiei 9.4. Indicatori de apreciere a sensului i intensit ii legturilor dintre

na�ionale (în care sunt înregistrate opera�iunile comerciale �i financiare la nivel macroeconomic). S-a luat deci în considerare posibilitatea ca dup� definitivarea conturilor na�ionale s� fie determinate alte valori ale indicatorilor. În plus, valorile exporturilor din anul 1995 nu au o acurate�e foarte ridicat� deoarece în anul 1996, când au fost calculate, nu erau disponibile date complete asupra comer�ului exterior.

Tabelul 3.4. Capitaluri proprii ale societ��ilor bancare din România

în perioada septembrie-decembrie 1995 - milioane lei; sfâr�itul perioadei - Nr. crt.

Luna Capital statutar

Fond de rezerv�

Profit net 1)

Alte fonduri

1 Sept. 636.915 372.718 x 818.059 2 Oct. 648.611 383.219 x 871.610 3 Nov. 661.210 393.918 x 1.001.217 4 Dec. 661.895 408.420 1.134.551 536.971

1) Pân� în luna decembrie 1995 a fost inclus la pozi�ia „Alte

pasive – profit” �i „Alte pasive – V�rs�minte �i prelev�ri din profit” Sursa: Banca Na�ional� a României, Raport Anual 1995

Regula nr. 5: Se recomand� pentru m�rimile la care se

practic� mai multe metode de determinare s� fie precizat, pentru a se

evita confuziile, modalitatea de ob�inere. Aceasta se poate face fie prin indica�ii în celulele tabelului fie prin note explicative în afara celulelor. De exemplu, în tabelul 3.2, pentru rata anual� a infla�iei, indicator ce poate fi determinat în mai multe moduri (prin raportare a nivelului mediu al pre�urilor din anul curent fa�� de cel din anul anterior; prin raportare a nivelului pre�ului de la sfâr�itul anului curent fa�� de cel de la sfâr�itul anului anterior �.a.m.d.) s-a considerat necesar s� se precizeze c� s-a calculat pe baza pre�urilor în vigoare în luna decembrie. De asemenea, pentru rata �omajului, un alt indicator care poate fi calculat în diferite moduri (pe baza num�rului de �omeri de la sfâr�itul perioadei sau a num�rului mediu din perioada analizat�) s-a precizat c� s-au luat în calcul datele culese la sfâr�itul fiec�rui an. În ce prive�te indicatorul profitului net al societ��ilor, prezentat în tabelul 3.4., s-a considerat necesar s� se precizeze c� lipsa valorilor în primele trei luni are drept cauz� „înscrierea, în acea perioad�, a profitului la pozi�ia „Alte pasive” �i nu la cea de „Capitaluri proprii”.

Page 31: STEFANESCU - B S - PIED - uni-muenchen.de9.3. Analiza legturilor dintre variabile prin intermediul regresiei 9.4. Indicatori de apreciere a sensului i intensit ii legturilor dintre

Regula nr. 6: Într-un tabel statistic nu trebuie s� existe celule necompletate. Aceast� regul� a fost instituit� îndeosebi pentru a se evita complet�rile ulterioare, de c�tre alte persoane decât autorii tabelului, �i pentru a nu se oferi imaginea de nefinalizare. Pentru ca celulele tabelului s� poat� fi completate în orice condi�ii, au fost stabilite câteva simboluri speciale: - semnul „…”, atunci când nu se cunosc datele care ar trebui s�

figureze în celule (de exemplu, în tabelul 3.3., acest semn figureaz� pentru valorile ratei medii la opera�iunile interbancare din lunile septembrie �i octombrie deoarece abia din luna noiembrie 2005 s-a trecut la un calcul riguros al parametrilor opera�iunilor interbancare);

- semnul „x”, atunci când într-o celul� nu trebuie s� figureze nici un fel de dat� (de exemplu, în tabelul 3.4. nu este cazul ca în primele trei luni s� se treac� date pentru profitul net ca parte a capitalurilor proprii deoarece în aceast� perioad� profitul era înregistrat la pozi�ia „Alte pasive”);

- semnul „-”, atunci când data are o valoare nul� (de exemplu, în tabelul 3.2. acest semn figureaz� pentru rata �omajului din anul 1990 întrucât, cel pu�in oficial, în acel an nu existau �omeri în România);

- semnul „0”, atunci când prin rotunjire rezult� valoarea zero (de exemplu, pentru valorile subunitare mai mici decât 0,5 în cazul numerelor afi�ate, f�r� zecimale, pentru cele mai mici decât 0,05 pentru numerele afi�ate cu o singur� zecimal� �.a.m.d.).

Regula nr. 7. Pentru datele prezentate într-un tabel statistic

trebuie s� se precizeze sursele din care au fost preluate. Men�ionarea surselor ofer� indicii asupra acurate�ei datelor folosite �i asupra responsabilit��ilor în ce prive�te veridicitatea acestora.

3.1.3. Reprezentarea grafic� a datelor statistice

Reprezent�rile grafice faciliteaz� sesizarea rapid� a unor aspecte esen�iale ale fenomenelor studiate. Sunt folosite, de asemenea, �i în cadrul unor tehnici de determinare a unor indicatori. Astfel de procedee, cu toate c� uneori nu confer� o acurate�e prea mare au, fa�� de calculele analitice, avantajul operativit��ii. Datorit� posibilit��ii de sintez� rapid� pe care o ofer�, reprezent�rile grafice sunt folosite destul de frecvent �i în fundamentarea unor decizii manageriale. În ultimii ani, dezvoltarea tehnologiilor informa�ionale a

Page 32: STEFANESCU - B S - PIED - uni-muenchen.de9.3. Analiza legturilor dintre variabile prin intermediul regresiei 9.4. Indicatori de apreciere a sensului i intensit ii legturilor dintre

f�cut posibil� realizarea operativ� a reprezent�rilor grafice, oricât de complexe ar fi acestea.

Tehnicile de reprezentare grafic� a datelor statistice formeaz� o gam� foarte larg�, diversificat� în raport cu obiectivele cercet�rii �i cu tipurile de date folosite. Marea varietate a acestor procedee, ca �i faptul c� acestea nu sunt folosite prea des în calcule de precizie, au f�cut ca regulile asupra reprezent�rilor grafice s� nu fie la fel de stricte �i de universal valabile precum cele utilizate pentru tabelele statistice. Pot fi, totu�i, men�ionate câteva recomand�ri generale, menite s� induc� o anumit� rigoare în reprezentarea grafic� a datelor statistice:

- pentru datele statistice reprezentate trebuie precizate unit��ile de m�sur�;

- este indicat ca graficele s� fie propor�ionale cu valorile datelor reprezentate iar rela�iile de propor�ionalitate s� fie precizate printr-o a�a-numit� scar� a graficului;

- atunci când se folosesc simboluri, acestea trebuie explicate în cadrul unei a�a – numite legende a graficului;

- pentru datele statistice reprezentate trebuie s� se indice sursele din care s-au ob�inut.

3.2. Prelucrarea primar� a datelor cu caracteristici

atributive

3.2.1. Prelucrarea primar� prin serii atributive simple

O serie atributiv� simpl� prezint� o popula�ie statistic� desemnând pentru fiecare unitate câte o valoare din fiecare caracteristic� atributiv�. Astfel de serii sunt u�or de alc�tuit, îns� utilizarea lor în calculele statistice ulterioare poate fi destul de dificil� în cazul unui num�r mare de unit��i statistice.

Reprezentarea seriilor atributive simple se poate face atât prin tabele cât �i pe cale grafic�. Dintre tehnicile grafice se deta�eaz�, prin acurate�e, reprezent�rile în coordonate carteziene (numite astfel în onoarea lui Descartes, cel care le-a descoperit) în care valorile asociate unit��ilor statistice sunt transpuse într-un sistem de axe. Cel mai adesea se folose�te un sistem de dou� axe: una orizontal�, numit� axa ordonatelor �i una vertical�, numit� axa absciselor. La intersec�ia acestora se afl� punctul de origine, notat cu 0, cu coordonate de valori nule. Reprezent�rile în coordonate carteziene ale seriilor atributive

Page 33: STEFANESCU - B S - PIED - uni-muenchen.de9.3. Analiza legturilor dintre variabile prin intermediul regresiei 9.4. Indicatori de apreciere a sensului i intensit ii legturilor dintre

simple sunt indicate pentru aprecierea influen�ei pe care un factor o are asupra unui fenomen. În acest scop sunt reprezentate dou� caracteristici statistice: - o caracteristic� numit� variabil� independent�, reprezentat� pe

axa absciselor si care reflect� st�rile factorului de influen��; - o caracteristic� numit� variabil� dependent�, reprezentat� pe axa

ordonatelor �i care reflect� manifestarea fenomenului supus influen�ei.

Pentru fiecare ax� a unei reprezent�ri în coordonate carteziene trebuie stabilit� câte o scar� de valori prin raportarea la spa�iul disponibil a valorii absolute maxime a datelor prezentate. Atunci când valoarea absolut� minim� este dep�rtat� de origine se poate câ�tiga spa�iu translatând intervalul de valori mai aproape de intersec�ia axelor. O astfel de opera�iune trebuie indicat� pe grafic prin aplicarea unui simbol al sec�ion�rii la axa la care s-a f�cut translatarea.

Exemplul 3.1. În tabelul 3.5. sunt prezentate valorile suprafe�elor comerciale �i ale vânz�rilor lunare de m�rfuri pentru cele patru puncte de desfacere ale unei firme. Se cere s� se studieze, pe cale grafic�, influen�a pe care suprafa�a comercial� o are asupra vânz�rilor dintr-un punct de desfacere.

Tabelul 3.5. Suprafe�ele comerciale �i vânz�rile lunare de

m�rfuri pentru patru puncte de desfacere Nr. crt.

Suprafa�� comercial� [m2]

Vânz�ri lunare de m�rfuri [mil. RON]

(0) (1) (2) 1 400 0,3 2 420 0,4 3 480 0,7 4 500 0,8

Page 34: STEFANESCU - B S - PIED - uni-muenchen.de9.3. Analiza legturilor dintre variabile prin intermediul regresiei 9.4. Indicatori de apreciere a sensului i intensit ii legturilor dintre

���

���

���

���

Scara: Ox – 1 cm = 50 m2 Oy – 1 cm = 0,1 mil. RON

Figura 3.1. Reprezentarea grafic� a unei serii atributive simple f�r� translatarea intervalului de valori.

Rezolvare: Reprezentarea grafic� s-a f�cut printr-un sistem de

dou� axe: - axa absciselor (Ox) a fost repartizat� variabilei

independente, adic� suprafe�ei comerciale; - axa ordonatelor (Oy) a fost repartizat� variabilei

dependente, adic� vânz�rilor lunare de m�rfuri (fig. 3.1.).

���

���

���

���

Scara: Ox – 1 cm = 10 m2; Oy – 1 cm = 0,1 mil. RON

Fig. 3.2. Reprezentarea grafic� a unei serii atributive simple cu translatarea intervalului de valori

Page 35: STEFANESCU - B S - PIED - uni-muenchen.de9.3. Analiza legturilor dintre variabile prin intermediul regresiei 9.4. Indicatori de apreciere a sensului i intensit ii legturilor dintre

Se poate observa, totu�i, c� pe axa absciselor valoarea minim� a suprafe�ei comerciale este foarte îndep�rtat� de origine, ceea ce deschide posibilitatea ob�inerii de spa�iu suplimentar. Dup� cum se poate observa în figura 3.2., prin translatarea intervalului de valori se poate trece la o scar� de cinci ori mai mic�, ceea ce u�ureaz� interpret�rile.

Reprezent�rile grafice eviden�iaz� faptul c� vânz�rile de m�rfuri sunt cu atât mai mari cu cât suprafa�a comercial� este mai mare (ceea ce are semnifica�ia unei leg�turi directe între cele dou� variabile) iar punctele reprezentate au tendin�a de liniaritate.

Prin reprezent�ri grafice poate fi studiat� �i dependen�a unui fenomen fa�� de mai mul�i factori, folosindu-se mai multe axe, îns� în acest caz analiza devine destul de complex�.

3.2.2. Prelucrarea primar� prin distribu�ii de frecven�e

3.2.2.1. Conceptul de distribu�ie de frecven�e

O distribu�ie de frecven�e este o serie atributiv� care prezint� o popula�ie statistic� prin dou� elemente:

- formele pe care le îmbrac� o caracteristic� atributiv� a popula�iei (sau, în cazul unei serii multidimensionale, caracteristicile atributive ale popula�iei);

- frecven�ele absolute, care reprezint�, pentru fiecare din formele caracteristicii, num�rul de unit��i statistice.

În func�ie de natura caracteristicii atributive pot fi delimitate dou� tipuri de distribu�ii de frecven�e:

- distribu�ii homograde; - distribu�ii heterograde. 3.2.2.1.1. Distribu�ii homograde

La o distribu�ie homograd� caracteristica atributiv� este

calitativ�, adic� nu poate fi exprimat� numeric. De exemplu, în descrierea unei persoane pot fi utilizate mai multe caracteristici calitative: cet��enia, etnia, sexul, religia, profesia, studiile, culoarea ochilor, a p�rului etc. Fiecare dintre aceste caracteristici poate îmbr�ca mai multe st�ri distincte net una fa�� de alta, iar num�rul de unit��i statistice înregistrate pentru o astfel de stare reprezint� frecven�a absolut� asociat� acesteia. De exemplu, seria prezentat� în

Page 36: STEFANESCU - B S - PIED - uni-muenchen.de9.3. Analiza legturilor dintre variabile prin intermediul regresiei 9.4. Indicatori de apreciere a sensului i intensit ii legturilor dintre

tabelul 3.6. este o distribu�ie homograd� în care st�rile caracteristicii calitative sunt reprezentate de cauzele care au determinat plecarea unor angaja�i de la o firm�, iar frecven�ele absolute sunt date de num�rul de persoane asociat fiec�rei cauze. Tabelul 3.6. Num�rul �i cauzele ie�irilor de personal din cadrul unei firme

Nr. crt.

Cauze ale ie�irilor de personal Num�r de persoane

(0) (1) (2) 1 Restructurarea activit��ii 7 2 Pension�ri 17 3 Plec�ri la cerere 6 4 Acte de indisciplin� 4 Unit��ile statistice în raport cu care se face repartizarea

frecven�elor pot îmbr�ca diferite forme în func�ie de scopul în care se realizeaz� distribu�ia. De exemplu, dac� se studiaz� repartizarea suprafe�elor de depozitare a unor materiale de construc�ie, unit��ile statistice pot lua forma unor unit��i de suprafa��. În acest caz, frecven�a absolut� asociat� unui sortiment de material va fi dat� de num�rul de unit��i de suprafa�� ocupate de acesta (tab. 3.7).

Tabelul 3.7. Repartizarea suprafe�elor de depozitare ale unor materiale de construc�ie

Nr. crt.

Sortiment de materiale de construc�ii

Suprafa�� ocupat� [m2]

(0) (1) (2) 1 C�r�mizi 120 2 Bol�ari 40 3 Ciment 20

Este indicat ca elementele unei distribu�ii homograde s� fie organizate în ordinea descresc�toare a frecven�elor astfel încât s� fie eviden�iate (deoarece vor fi citite primele) st�rile cele mai reprezentative (cu cele mai mari frecven�e) ale caracteristicii calitative, a�a cum se poate observa în tabelele 3.6. �i 3.7.

Se pot face îns� excep�ii pentru situa�iile în care exist� o ordine natural� sau conceptual� între st�rile caracteristicii. De exemplu, atunci când se distribuie personalul unei firme în raport cu studiile

Page 37: STEFANESCU - B S - PIED - uni-muenchen.de9.3. Analiza legturilor dintre variabile prin intermediul regresiei 9.4. Indicatori de apreciere a sensului i intensit ii legturilor dintre

absolvite, se începe cu nivelul cel mai redus de preg�tire ajungându-se la cel mai înalt (tabelul 3.8.).

Tabelul 3.8. Distribu�ia personalului unei firme în raport

cu studiile absolvite Nr. crt. Studii absolvite Num�r de angaja�i

(0) (1) (2) 1 Absolven�i de �coli profesionale 20 2 Absolven�i de licee 50 3 Absolven�i de înv���mânt superior 10 Alc�tuirea unei distribu�ii homograde este în general simpl� în

condi�iile în care distinc�ia dintre st�rile unei caracteristici calitative nu este prea dificil�. Practic, o distribu�ie homograd� poate fi realizat� chiar în cadrul opera�iunii de culegere a datelor, prin clasificarea acestora în raport cu st�rile unei caracteristici (sau mai multor caracteristici) calitative. Atunci când sunt utilizate mai multe caracteristici calitative, se alc�tuie�te o distribu�ie homograd� combinat�: se începe cu gruparea dup� o prim� caracteristic� dup� care grupele ob�inute se împart în subgrupe în raport cu o alt� caracteristic� �.a.m.d. În opera�iile de grupare a datelor dup� caracteristici calitative vom folosi urm�toarele nota�ii: x

in este frecven�a absolut� grupei i format� dup� caracteristica x; Kx este num�rul de grupe formate în raport cu caracteristica x.

Exemplul 3.2. În tabelul 3.9. sunt prezentate datele culese

asupra unui grup de 12 angaja�i au unei firme cu privire la trei caracteristici calitative: departamentul care lucreaz�, studiile absolvite �i sexul. Se cere s� se alc�tuiasc� distribu�ii homograde unidimensionale în raport cu cele trei caracteristici precum �i distribu�ii combinate de dou� �i trei caracteristici.

Tabelul 3.9. Date culese asupra unui grup de 12 angaja�i cu

privire la trei caracteristici calitative Nr. crt.

Departamentul în care lucreaz� 1)

Studiile absolvite 2)

Sex 3)

(0) (1) (2) (3) 1 DP SS B 2 DP SL B

Page 38: STEFANESCU - B S - PIED - uni-muenchen.de9.3. Analiza legturilor dintre variabile prin intermediul regresiei 9.4. Indicatori de apreciere a sensului i intensit ii legturilor dintre

3 DP SP B 4 DM SS F 5 DM SS F 6 DM SL B 7 DF SS F 8 DF SS B 9 DR SS B

10 DR SL F 11 DL SS F 12 DL SP B

1) Pentru datele asupra departamentelor în care lucreaz� cei 12 angaja�i au fost folosite urm�toarele simboluri: DP – departamentul de produc�ie; DM – departamentul de marketing; DF – departamentul de finan�e-contabilitate; DR – departamentul rela�iilor cu personalul; DL – departamentul de logistic�.

2) Pentru datele asupra studiilor absolute au fost folosite urm�toarele simboluri: SP – absolvent de �coal� profesional�, SL – absolvent de liceu, SS – absolvent de studii superioare.

3) pentru datele asupra sexului angaja�ilor au fost folosite urm�toarele simboluri: B – sex b�rb�tesc, F – sex femeiesc. Rezolvare: Distribu�iile homograde unidimensionale, destul de simplu de realizat, sunt prezentate în tabelele 3.10., 3.11. �i 3.12.

Tabelul 3.10. Distribu�ia angaja�ilor în raport cu departamentul în care lucreaz�

Nr. crt. Studiile absolvite

Frecven�a absolut� ( x

in ) (0) (1) (2) 1 DP 3 2 DM 3 3 DF 2 4 DR 2 5 DL 2 6 Total 12

7

Simbol pentru total 1

xK

x

i

i

n=

Page 39: STEFANESCU - B S - PIED - uni-muenchen.de9.3. Analiza legturilor dintre variabile prin intermediul regresiei 9.4. Indicatori de apreciere a sensului i intensit ii legturilor dintre

Tabelul 3.11. Distribu�ia angaja�ilor în raport cu studiile absolvite

Nr. crt. Sex

Frecven�a absolut� ( x

in ) (0) (1) (2) 1 SS 7 2 SL 3 3 SP 2 4 Total 12 5 Simbol pentru total

1

yK

y

i

i

n=

Tabelul 3.12. Distribu�ia angaja�ilor dup� sex

Nr. crt. Sex

Frecven�a absolut� ( x

in ) (0) (1) (2) 1 B 7 2 F 5 3 Total 12

4 Simbol pentru total 1

zK

z

i

i

n=

Dintre variantele posibile de distribu�ii combinate dup� dou�

caracteristici, în acest exemplu va fi prezentat�, în tabelul 3.13., gruparea dup� departament �i dup� studiile absolvite.

Tabelul 3.13. Distribu�iile angaja�ilor în raport cu departamentul în

care lucreaz� �i cu studiile absolvite: Studii

absolvite Departament

SS SL SP Total

DP 1 1 1 3 DM 2 1 - 3 DF 2 - - 2 DR 1 1 - 2 DL 1 - 1 2

Page 40: STEFANESCU - B S - PIED - uni-muenchen.de9.3. Analiza legturilor dintre variabile prin intermediul regresiei 9.4. Indicatori de apreciere a sensului i intensit ii legturilor dintre

Total 7 3 2 12

Gruparea combinat� dup� cele trei caracteristici este prezentat� în tabelul 3.14.

Tabelul 3.14. Distribu�ia angaja�ilor dup� cele trei caracteristici

Subgrupe dup� studii absolvite �i sex SS SL SP

Grupe dup� departament B F B F B F

Total

DP 1 - 1 - 1 - 3 DM - 2 1 - - - 3 DF 1 1 - - - - 2 DR 1 - - 1 - - 2 DL - 1 - - 1 - 2 Total 3 4 2 1 2 - 12

3.2.2.1.2. Distribu�ii heterograde

La o distribu�ie heterograd� caracteristica atributiv� este

cantitativ�, adic� poate fi cuantificat�. De exemplu, o persoan� poate fi descris� prin mai multe caracteristici cantitative: în�l�ime, greutate etc. Spre deosebire de distribu�iile homograde, unde distinc�ia dintre st�rile caracteristicilor se face de la sine, la distribu�iile heterograde este necesar� stabilirea unor intervale de varia�ie ale valorilor caracteristicii cantitative. Acestea vor reprezenta formele caracteristicii în raport cu care se vor grupa unit��ile statistice. Frecven�a absolut� a unei grupe va fi dat� de num�rul de unit��i statistice ale c�ror date le încadreaz� în intervalul de valori asociat grupei.

În raport cu tr�s�turile caracteristicii cantitative se pot delimita dou� tipuri de distribu�ii heterograde:

a) distribu�ii heterograde de tip discret; b) distribu�ii heterograde de tip continuu.

a) La o distribu�ie heterograd� de tip discret caracteristica poate lua doar valori num�rabile, în salturi. În tabelul 3.15 este prezentat� o astfel de distribu�ie, în care caracteristica de grupare este num�rul de vânz�tori din cadrul punctelor de desfacere ale unei firme. Pentru valorile discrete ale caracteristicilor este necesar s� se previn� echivocul asupra repartiz�rii unit��ilor statistice pe intervale de varia�ie. În tabelul 3.15, de exemplu, deoarece s-a precizat c� limita

Page 41: STEFANESCU - B S - PIED - uni-muenchen.de9.3. Analiza legturilor dintre variabile prin intermediul regresiei 9.4. Indicatori de apreciere a sensului i intensit ii legturilor dintre

inferioar� este inclus� în interval, un punct de vânzare cu 10 lucr�tori va fi repartizat la a doua grup�, iar unul cu 20 de lucr�tori, la a treia. Astfel de preciz�ri pot fi f�cute �i prin prezentarea intervalelor de varia�ie drept închise sau deschise (tabelul 3.16.).

Tabelul 3.15. Repartizarea punctelor de desfacere ale unei firme în

raport cu num�rul de vânz�tori Nr. crt.

Num�r de vânz�tori

Num�r de puncte

de desfacere

Centru de interval

(0) (1) (2) (3) 1 0 – 5 4 2,5 2 5 – 10 3 7,5 3 10 – 15 2 12,5

Not�: Limita inferioar� este inclus� în interval

b) La o distribu�ie heterograd� de tip continuu se consider�

c� o caracteristic� poate lua orice valoare dintr-un interval. În tabelul 3.16 este prezentat� o distribu�ie de tip continuu în care caracteristica de grupare este reprezentat� de suprafa�a punctelor de vânzare ale unei firme. �i la astfel de serii se recomand� delimitarea f�r� echivoc a intervalelor de varia�ie, de�i, în principiu, nu ar trebui s� apar� confuzii asupra repartiz�rii unit��ilor statistice pe intervale de varia�ie (de exemplu, în ce prive�te tabelul 3.16., este imposibil ca suprafa�a unui punct comercial s� fie exact 50 m2; nu poate fi decât mai mare sau mai mic�, astfel încât se poate încadra u�or la un interval de varia�ie).

Tabelul 3.16. Repartizarea punctelor de desfacere ale unei firme în

raport cu suprafa�a Nr. crt.

Suprafa�a comercial�

Num�r de puncte

de desfacere

Centru de interval

(0) (1) (2) (3) 1 [30 – 50] 3 40 2 [50 – 70] 4 60 3 [70 – 90 ] 2 80

Page 42: STEFANESCU - B S - PIED - uni-muenchen.de9.3. Analiza legturilor dintre variabile prin intermediul regresiei 9.4. Indicatori de apreciere a sensului i intensit ii legturilor dintre

Pentru fiecare grup� a unei distribu�ii heterograde poate fi stabilit� o valoare reprezentativ�, numit� centrul de interval, care reprezint� mijlocul intervalului de varia�ie asociat grupei. O astfel de valoare are semnifica�ia unui rezultat al factorilor ce ac�ioneaz� în mod permanent în cadrul grupei, în absen�a unor factori accidentali, temporari. În general, în determinarea indicatorilor statistici pe baza distribu�iilor heterograde se consider� c� toate unit��ile statistice dintr-o grup� au o valoare a caracteristicii de grupare egal� cu centrul de interval, ceea ce u�ureaz� calculele �i permite relevarea aspectelor esen�iale.

Centrul de interval al unei grupe poate fi calculat prin formula:

21' −−

= iii

XXX (3.1.)

în care: - 'iX este centrul de interval al grupei i;

- 1−iX este limita inferioar� a intervalului de varia�ie asociat grupei i;

- iX este limita superioar� a intervalului de varia�ie asociat grupei i.

În alegerea num�rului �i lungimii intervalelor de varia�ie ale unei distribu�ii heterograde sunt luate în considerare atât aspecte care �in de relevarea factorilor permanen�i �i accidentali de influen�� cât �i considerente ale facilit�rii calculelor. Se apreciaz� c� lungimile mari ale intervalelor de varia�ie permit eviden�ierea factorilor permanen�i de influen�� îns� pot duce la ignorarea efectelor factorilor accidentali, ceea ce impieteaz� asupra acurate�ei analizei statistice. În acela�i timp. lungimile mici ale intervalelor de varia�ie, care reflect� într-o m�sur� mai mare influen�a factorilor accidentali, fac dificil� distinc�ia dintre ace�tia �i factorii permanen�i. Se recomand� s� se evite apari�ia unor grupe cu frecven�a absolut� nul�, iar limitele intervalelor s� nu con�in� prea multe zecimale. Destul de frecvent, pentru facilitarea calculelor, se folosesc distribu�ii heterograde cu intervale de varia�ie egale, numite �i serii de varia�ie cu grupe egale.

Pentru distribu�iile heterograde cu intervale de varia�ie egale, stabilirea grupelor se poate face pornind de la o lungime dat� a intervalelor de varia�ie fie de la un num�r dat al acestor intervale. În alc�tuirea grupelor pe baza lungimii date a intervalelor de varia�ie se poate utiliza un algoritm descris de urm�toarele reguli:

1) se stabilesc limitele varia�iei caracteristicii de grupare:

Page 43: STEFANESCU - B S - PIED - uni-muenchen.de9.3. Analiza legturilor dintre variabile prin intermediul regresiei 9.4. Indicatori de apreciere a sensului i intensit ii legturilor dintre

Xmin, care este cea mai mic� valoare a caracteristicii; Xmax, care este cea mai mare valoare a caracteristicii;

2) se determin� primul interval de varia�ie având ca limit� inferioar� valoarea Xmin, iar ca limit� superioar� valoarea Xmin + dx, unde dx este lungimea aleas� a intervalului de varia�ie;

3) pentru intervalele de varia�ie urm�toare, limita inferioar� va fi reprezentat� de limita superioar� a intervalului anterior, iar limita superioar� se ob�ine ad�ugând la limita inferioar� lungimea intervalului;

4) opera�iunea de stabilire a grupelor se încheie atunci când s-a ajuns la o limit� superioar� de interval care s� fie mai mare sau egal� decât Xmax.

Exemplul 3.3.: În tabelul 3.17. sunt prezentate datele culese asupra productivit��ii muncii pentru un grup de 10 angaja�i ai unei firme. Se cere s� se grupeze aceste date într-o distribu�ie heterograd� în care lungimea fiec�rui interval de varia�ie s� fie egal� cu 20 RON/lun�.

Tabelul 3.17. Date culese asupra productivit��ii muncii pentru un

grup de 12 angaja�i RON/lun�

Nr. crt. Productivitatea medie lunar� a muncii (0) (1) 1 102,46 2 122,38 3 124,21 4 111,42 5 142,04 6 90,75 7 129,46 8 149,28 9 99,00

10 132,42 11 128,61 12 111,62

Rezolvare: Din trecerea în revist� a datelor rezult� limitele

varia�iei caracteristicii de grupare: Xmin = 90,75 RON/lun�; Xmax = 149,28 RON/lun�.

Page 44: STEFANESCU - B S - PIED - uni-muenchen.de9.3. Analiza legturilor dintre variabile prin intermediul regresiei 9.4. Indicatori de apreciere a sensului i intensit ii legturilor dintre

În acest caz, pentru a se opera cu numere rotunde, vom începe alc�tuirea grupelor nu de la 90,75 ci de la 90 RON/lun�. Vor rezulta, astfel, intervalele de varia�ie prezentate în figura 3.3. �i grupele prezentate în tabelul 3.18.

Figura 3.3. Stabilirea intervalelor de varia�ie

Tabelul 3.18. Gruparea angaja�ilor pe baza unor intervale cu o

lungime dat� Nr. crt.

Interval de varia�ie (Xi – 1 ; Xi) [RON/lun�]

Frecven�� absolut� ( )x

in (0) (1) (2) 1 (90 – 110] 3 2 (110 – 130] 6 3 (130 – 150 ] 3 4 Total 12

5

Simbol pentru total �=

Kx

i

xin

1

În alegerea lungimii unui interval de varia�ie poate fi folosit�

formula recomandat� de statisticianul Herbert Sturges:

N

XXdx lg322,31

minmax

×+

−= (3.2.)

unde N este num�rul de unit��i statistice care trebuie grupate. Pentru stabilirea grupelor unei distribu�ii heterograde cu

intervale egale pornind de la num�rul acestora se poate folosi urm�torul algoritm:

1) se stabilesc limitele varia�iei caracteristicii de grupare Xmin �i Xmax;

2) se determin� lungimea unui interval de grupare (dx) pe baza formulei:

x

xK

XXd minmax −

= (3.3.)

unde Kx este num�rul ales de grupe;

Page 45: STEFANESCU - B S - PIED - uni-muenchen.de9.3. Analiza legturilor dintre variabile prin intermediul regresiei 9.4. Indicatori de apreciere a sensului i intensit ii legturilor dintre

3) se împarte intervalul [Xmin ; Xmax] în Kx intervale de varia�ie, fiecare cu lungimea dx.

Este de men�ionat faptul c� valoarea dx nu poate fi rotunjit� prin mic�orare (situa�ie în care exist� riscul ca unele unit��i statistice s� nu mai fie cuprinse în nicio grup�) ci doar prin majorare.

Atunci când sunt utilizate mai multe caracteristici cantitative, se poate proceda la fel ca în cazul distribu�iilor homograde, alc�tuindu-se distribu�ii combinate, în care grupele ob�inute în raport cu o caracteristic� sunt împ�r�ite în subgrupe în raport cu alte caracteristici.

Exemplul 3.4.: În tabelul 3.19 prezentate datele culese asupra cifrei de afaceri �i profitului pentru un grup de 12 firme dintr-o ramur� industrial�. Se cere: a) s� se grupeze datele în trei grupe cu intervale de varia�ie egal� în

raport cu cifra de afaceri; b) s� se grupeze datele în patru grupe cu intervale de varia�ie egal�

în raport cu profitul; c) s� se realizeze gruparea combinat� a datelor în raport cu cele

dou� caracteristici, pe baza grup�rilor anterioare.

Tabelul 3.19. Date asupra cifrei de afaceri �i profitului pentru un grup de 12 firme

mil. RON Nr. crt. Cifr� de afaceri Profit

(0) (1) (2) 1 10,8 2,5 2 29,6 6,0 3 30,0 6,0 4 12,8 4,5 5 10,0 2,0 6 40,0 10,0 7 38,0 9,8 8 24,3 7,2 9 29,8 6,8

10 22,4 5,4 11 32,4 7,5 12 22,8 5,5

Page 46: STEFANESCU - B S - PIED - uni-muenchen.de9.3. Analiza legturilor dintre variabile prin intermediul regresiei 9.4. Indicatori de apreciere a sensului i intensit ii legturilor dintre

Rezolvare: În acest exemplu, pentru facilitarea calculelor, vom nota cu X caracteristica cifrei de afaceri �i cu Y caracteristica profitului.

a) Pentru gruparea dup� caracteristica X se pleac� de la limitele varia�iei:

Xmin = 10,0 mil. RON; Xmax = 40,0 mil. RON �i de la num�rul de grupe Kx = 3 Se ob�ine apoi lungimea unui interval de varia�ie prin formula:

=−

=−

=3

1040minmax

x

xK

XXd 10 mil. RON

Se trece în continuare la determinarea celor trei grupe, prezentate în tabelul 3.20.

Pentru repartizarea unit��ilor statistice asupra grupelor s-a

considerat c� fiecare interval de varia�ie este închis pentru limita inferioar� �i deschis pentru cea superioar�. S-a f�cut o excep�ie pentru ultimul interval (aceast� excep�ie nu face îns� ca lungimile intervalelor de varia�ie s� nu mai fie egale) astfel încât grupa s� includ� �i firma cu cea mai mare cifr� de afaceri.

Tabelul 3.20. Gruparea celor 12 firme în raport cu cifra de afaceri

Nr. crt. Interval de varia�ie (Xi – 1 ; Xi) [mil.

RON]

Frecven�� absolut� ( )x

in

(0) (1) (2) 1 [10 ; 20) 3 2 [20 ; 30) 5 3 [30 ; 40 ] 4 4 Total 12

5 Simbol pentru total �=

Kx

i

xin

1

b) La gruparea dup� caracteristica Y se porne�te de la num�rul

de grupe Ky = 4 �i de limitele varia�iei: ymin = 2; ymax = 10. Se determin� apoi lungimea unui interval de varia�ie prin formula:

Page 47: STEFANESCU - B S - PIED - uni-muenchen.de9.3. Analiza legturilor dintre variabile prin intermediul regresiei 9.4. Indicatori de apreciere a sensului i intensit ii legturilor dintre

max min 10 22

4y

y

y yd

K

− −= = = mil. RON. Sunt stabilite, în continuare,

cele patru grupe, prezentate în tabelul 3.21.

Tabelul 3.21. Gruparea celor 12 firme în raport cu profitul

Nr. crt.

Interval de varia�ie (yi-1; yi) [mil. RON]

Frecven�� absolut�( )y

in

(0) (1) (2) 1 [2-4) 2 2 [4 – 6) 3 3 [6 – 8) 5 4 [8 – 10] 2 5 Total 12

6

Simbol pentru total 1

yK

y

i

i

n=

Din acelea�i considerente ca pentru gruparea dup�

caracteristica X, la gruparea dup� caracteristica Y s-a ales ca intervalul de varia�ie al ultimei grupe s� fie închis la ambele capete. c) Gruparea combinat� a celor 12 firme în raport cu cifra de afaceri �i cu profitul este prezentat� în tabelul 3.22.

Distribu�iile heterograde cu intervale de varia�ie egale sunt, a�a cum a rezultat din exemplele anterioare, u�or de alc�tuit iar utilizarea lor, dup� cum se va vedea în capitolele ulterioare, faciliteaz� calculele statistice. Totu�i, folosirea lor pentru a descrie o popula�ie statistic� nu este întotdeauna posibil�. Uneori, stabilirea unor intervale de varia�ie egale conduce la situa�ii în care în unele grupe frecven�ele absolute sunt foarte mici sau chiar nule. O astfel de situa�ie ar ap�rea dac� s-ar încerca gruparea localit��ilor din România, în intervale de varia�ie egal�, dup� num�rul de locuitori, în condi�iile în care mai mult de jum�tate dintre localit��i au mai pu�in de 100 000 de locuitori, nici o localitate nu se încadreaz� în intervalul cuprins între 500 000 �i 2 000 000 de locuitori, iar o singur� localitate, capitala, are mai mult de 2 000 000 de locuitori. Într-un astfel de caz, rezolvarea poate veni de la folosirea unor intervale inegale de varia�ie, în care frecven�ele s� fie ceva mai uniform distribuite. Pentru stabilirea intervalelor inegale

Page 48: STEFANESCU - B S - PIED - uni-muenchen.de9.3. Analiza legturilor dintre variabile prin intermediul regresiei 9.4. Indicatori de apreciere a sensului i intensit ii legturilor dintre

de varia�ie sunt folosite diverse tehnici: cumularea mai multor intervale egale, intervale cu lungimi aflate în progresie geometric� etc.

Tabelul 3.22. Gruparea combinat� a celor 12 firme în raport cu

cifra de afaceri �i cu profitul

Intervale de varia�ie dup�

profit (yi-1 – yi) [mil. RON]

Intervale de varia�ie dup� cifra de afaceri (xi-1 – xi) [mil. RON]

[2–4) [4–6) [6–8) [8–10] Total

[10 – 20) 2 1 - - 3 [20 – 30) - 2 3 - 5 [30 – 40] - - 2 2 4

Total 2 3 5 2 12

3.2.2.2. Rela�ia dintre distribu�iile de frecven�e �i distribu�iile de probabilitate

Pentru a aborda rela�ia dintre distribu�iile de frecven�e �i distribu�iile de probabilit��i va trebui, mai întâi, s� introducem no�iunea de frecven�� relativ� a unei grupe. Aceasta reprezint� ponderea pe care frecven�a absolut� a unei grupe oarecare, dintr-o distribu�ie de frecven�e, o are în totalul frecven�elor absolute �i poate

fi calculat� prin formula:

�=

=xii K

j

x

j

x

ix

r

n

nn

1

(3.4.)

Page 49: STEFANESCU - B S - PIED - uni-muenchen.de9.3. Analiza legturilor dintre variabile prin intermediul regresiei 9.4. Indicatori de apreciere a sensului i intensit ii legturilor dintre

în care: xri

n este frecven�a relativ� a grupei i; xin este frecven�a

absolut� a grupei i; xk este num�rul de grupe format dup� caracteristica x.

Uneori, frecven�ele relative sunt exprimate într-o form� procentual�, mai ales atunci când se dore�te eviden�ierea ponderii pe care o grup� o are în ansamblul seriei.

În cadrul statisticii, frecven�ele relative sunt utilizate atât pentru eviden�ierea structurii unei popula�ii statistice cât �i în anticiparea evolu�iei unui fenomen colectiv. Anticip�rile au la baz� a�a-numitul postulat al stabilit��ii frecven�elor relative, care enun�� c� dac� se vor face în condi�ii asem�n�toare mai multe culegeri de date statistice, fiecare cu un num�r suficient de mare de unit��i statistice, atunci frecven�ele relative pentru un anumit eveniment nu vor diferi prea mult dintre ele. Altfel spus, revenind la ultimele dou� exemple, dac� în activitatea de produc�ie nu vor surveni schimb�ri importante, este de a�teptat ca �i în viitor rebuturile remaniabile s� reprezinte 15% iar cele definitive 10% din rezultatele produc�iei, tot a�a cum, dac� nu vor interveni schimb�ri importante în activitatea firmei distribuitoare de energie termic�, 80% dintre restan�ierii acesteia vor fi reprezenta�i de familii cu venituri lunare pe membru de familie cuprinse între 100 �i 200 de euro.

Anticip�rile pe baza frecven�elor relative pot îmbr�ca forma probabilit��ilor. Leg�tura dintre cele dou� no�iuni a fost realizat� prin a�a-numita Lege a numerelor mari, formulat� în anul 1713 de c�tre Jacob Bernoulli. În esen��, aceast� lege stipuleaz� c� dac� un eveniment A s-a produs de n ori într-o serie de N experimente identice �i independente (adic� rezultatele unui experiment nu le pot influen�a pe celelalte), atunci se poate considera, cu condi�ia ca N s� fie suficient de mare, c� probabilitatea de realizare a evenimentului A

este dat� de rela�ia: ( )N

nP A = (3.5.)

Num�rul N al experimentelor poate fi asimilat totalului unit��ilor dintr-o popula�ie statistic� (astfel spus, totalului frecven�elor absolute) întrucât unit��ile statistice pot fi considerate drept forme de înregistrare ale manifest�rii unui fenomen studiat. De asemenea, num�rul n care arat� de câte ori s-a produs un eveniment în cadrul experimentelor poate fi asimilat frecven�ei absolute a unei grupe, deoarece o grup� poate fi considerat� drept o reuniune de unit��i statistice pentru care fenomenul studiat s-a manifesta în acela�i mod

Page 50: STEFANESCU - B S - PIED - uni-muenchen.de9.3. Analiza legturilor dintre variabile prin intermediul regresiei 9.4. Indicatori de apreciere a sensului i intensit ii legturilor dintre

(s-a transpus într-un acela�i eveniment). De exemplu, dac� evenimentul este reprezentat de producerea unui rebut remaniabil, grupa asociat� acestuia va cuprinde toate piesele care au fost rebutate dar care pot fi remaniate. De asemenea, dac� evenimentul este reprezentat de faptul c� o familie cu un venit lunar mediu cuprins între 100 �i 200 de euro nu �i-a achitat factura pentru energie termic�, grupa asociat� acestuia va include toate familiile restan�iere cu venituri cuprinse în acea categorie. În aceste condi�ii, rela�ia 3.5. devine:

( )xrK

i

i

xi

A ixn

n

n

N

nP ===

�=1

(3.6.)

ceea ce ar sugera echivalen�a dintre probabilit��i �i frecven�ele relative. Totu�i, aceast� echivalen�� nu poate rezista la o analiz� riguroas� deoarece condi�iile precizate în legea numerelor mari, referitoare la realizarea unui num�r suficient de mare de experimente identice �i independente, nu pot fi îndeplinite în practic�. În consecin��, frecven�ele relative trebuie considerate, mai degrab�, ni�te aproxim�ri ale probabilit��ilor. Estimarea probabilit��ilor pe baza frecven�elor relative, de�i nu are întotdeauna o mare acurate�e, este folosit�, totu�i, destul de frecvent în practic� datorit� facilit��ii calculelor.

3.2.2.3. Reprezentarea grafic� a distribu�iilor de frecven�e În reprezentarea grafic� a distribu�iilor de frecven�e sunt

folosite variate metode. Dintre acestea vom prezenta trei tipuri care se deta�eaz� prin frecven�a utiliz�rii:

- diagrame pentru frecven�e absolute; - diagrame de structur�; - reprezent�ri în coordonate carteziene. 3.2.2.3.1. Reprezentarea grafic� a distribu�iilor de frecven�e Prin diagramele pentru frecven�e absolute pot fi reprezentate

grafic atât distribu�ii homograde cât �i distribu�ii heterograde. În esen��, un astfel de procedeu const� în reprezentarea fiec�rei grupe printr-o figur� geometric� a c�rei suprafa�� este direct propor�ional� cu frecven�a absolut� a grupei. În raport cu figurile geometrice

Page 51: STEFANESCU - B S - PIED - uni-muenchen.de9.3. Analiza legturilor dintre variabile prin intermediul regresiei 9.4. Indicatori de apreciere a sensului i intensit ii legturilor dintre

folosite se pot delimita mai multe tipuri de diagrame pentru frecven�e absolute:

a) diagrame în cercuri; b) diagrame în p�trate; c) diagrame în dreptunghiuri etc.

a) Reprezent�rile grafice prin diagrame în cercuri nu sunt prea facile ca urmare a unor dificult��i în stabilirea unor suprafe�e propor�ionale cu frecven�ele absolute. Dup� cum se �tie, suprafa�a

unui cerc este dat� de rela�ia: 2CC rS ⋅= π

(3.7.) unde: SC este suprafa�a cercului; rC este raza cercului.

În aceste condi�ii, r�d�cinile p�trate ale razelor cercurilor trebuie s� fie propor�ionale cu frecven�ele absolute pentru ca acestea, la rândul lor, s� fie propor�ionale cu suprafe�ele cercurilor. Aceast�

propor�ionalitate se exprim� prin rela�ia: 2ii CC

xiC rSnK ⋅==⋅ π (3.8.)

unde KC este o constant�, care reflect� rela�ia dintre suprafa�a cercului asociat unei grupe i �i frecven�a absolut� a acesteia. Rezult� c� raza cercului asociat unei grupe poate fi calculat� prin formula:

π

xiC

C

nKr

i

×= (3.9.)

Constanta KC, ce reprezint�, în fapt, scara la care se deseneaz� diagrama în cercuri, este aleas� luându-se în considerare spa�iul disponibil �i avantajele oper�rii cu raze exprimate în numere întregi.

b) Reprezent�rile grafice prin diagrame în p�trate sunt

caracterizate prin dificult��i similare celor care apar în cazul diagramelor în cercuri. Dup� cum se �tie, suprafa�a unui p�trat (SP) este dat� de p�tratul laturii sale (aP):

2PP aS = (3.10.)

Reiese c� r�d�cinile p�trate ale laturilor p�tratelor trebuie s� fie propor�ionale cu frecven�ele absolute, astfel încât acestea s� fie, la rândul lor, propor�ionale cu suprafe�ele p�tratelor. Aceast� condi�ie se exprim� prin rela�ia:

2ii PP

xiP aSnK ==⋅ (3.11.)

în care KP este o constant� care reflect� raportul dintre suprafa�a p�tratului asociat unei grupe i �i frecven�a absolut� a acesteia. Rezult� c� latura p�tratului asociat unei grupe poate fi ob�inut� pe baza rela�iei:

Page 52: STEFANESCU - B S - PIED - uni-muenchen.de9.3. Analiza legturilor dintre variabile prin intermediul regresiei 9.4. Indicatori de apreciere a sensului i intensit ii legturilor dintre

xiPP nKa

i⋅= (3.12.)

Scara la care se deseneaz� o diagram� în p�trate, exprimat� prin constanta KP este aleas�, la fel ca în cazul diagramelor în cercuri, luându-se în considerare spa�iul disponibil �i avantajele oper�rii cu laturi ce reprezint� numere întregi.

c) Diagramele în dreptunghiuri sunt mai simplu de desenat

fa�� de cele în cercuri sau în p�trate, motiv pentru care sunt folosite mai frecvent decât acestea. A�a cum se �tie, suprafa�a unui dreptunghi (SD) este dat� de produsul dintre latura sa vertical� ( )

vDl �i latura sa

orizontal� ( )oDl : SD =

vDl × oDl (3.13.)

Dac� se alege pentru toate dreptunghiurile diagramei o aceea�i latur� orizontal�, atunci doar latura vertical� va trebui s� fie propor�ional� cu frecven�a absolut�. Aceast� propor�ionalitate este exprimat� prin rela�ia:

ioivi DDDxiD llSnK ×==⋅ (3.14.)

în care KD este o constant� cu rolul de a reflecta raportul dintre suprafa�a dreptunghiului asociat unei grupe i �i frecven�a absolut� a acesteia. Rezult� c� latura vertical� a dreptunghiului unei grupe poate fi calculat� prin formula:

xi

D

DD n

l

Kl

o

iv×= (3.15.)

Ca �i pentru celelalte diagrame latura orizontal� �i constanta KD sunt alese luând-se în considerare spa�iul disponibil �i avantajele oper�rii cu laturi ce reprezint� numere întregi.

3.2.2.3.2. Diagrame de structur� Prin diagramele de structur� sunt reprezentate ponderile, date

de frecven�ele relative, pe care grupele unei distribu�ii homograde sau heterograde le de�in în ansamblul popula�iei reprezentate. În acest scop sunt folosite diferite figuri geometrice împ�r�ite în sectoare ale c�ror suprafe�e sunt propor�ionale cu frecven�ele relative ale grupelor. În raport cu figurile geometrice utilizate se pot delimita mai multe tipuri de diagrame de structur�:

a) cercul de structur�; b) p�tratul de structur�; c) dreptunghiul de structur�.

Page 53: STEFANESCU - B S - PIED - uni-muenchen.de9.3. Analiza legturilor dintre variabile prin intermediul regresiei 9.4. Indicatori de apreciere a sensului i intensit ii legturilor dintre

a) Reprezentarea unei distribu�ii de frecven�e printr-un cerc de structur� presupune împ�r�irea acestuia în mai multe sectoare, fiecare dintre acestea având o suprafa�� propor�ional� cu frecven�a relativ� a unei grupe. Dup� cum se �tie, suprafa�a unui sector de cerc (SSC) este dat� de rela�ia:

2

360 CSC

SC rU

S ××= π , (3.16.)

unde USC este unghiul sectorului de cerc. În condi�iile în care rC are aceea�i valoare pentru toate

sectoarele, rezult� c� suprafe�ele acestora vor fi diferen�iate prin intermediul unghiurilor. Pentru o grup� i, unghiul asociat sectorului acesteia va fi dat de rela�ia:

360×= xrSC ii

nU (3.17.)

b) Atunci când o distribu�ie de frecven�e este reprezentat� printr-un p�trat de structur�, acesta este împ�r�it în mai multe p�r�i, ale c�ror ponderi în suprafa�a total� sunt egale cu frecven�ele relative ale grupelor.

Reprezentarea este destul de simpl�, prin împ�r�irea unei laturi orizontale sau verticale a p�tratului în raport cu frecven�ele relative

ale grupelor, dup� formula: Pxri lnli×= (3.18.)

unde li este latura por�iunii de p�trat care revine grupei i.

c) Reprezent�rile distribu�iilor de frecven�e prin dreptunghiuri de structur� sunt oarecum asem�n�toare celor care utilizeaz� p�trate de structur�, având avantajul c� permit o eviden�iere mai bun� a ponderii grupelor prin manevrarea raportului dintre lungimile celor dou� titluri.

3.2.2.3.2. Reprezent�ri în coordonate carteziene Reprezent�rile în coordonate carteziene sunt folosite exclusiv

pentru distribu�iile heterograde. Printr-o astfel de tehnic� sunt reprezentate pe o ax� orizontal� intervalele de varia�ie ale grupelor, iar pe o ax� vertical� frecven�ele absolute. În practic� sunt folosite trei variante de reprezent�ri carteziene ale distribu�iilor heterograde:

a) histograma; b) poligonul frecven�elor; c) curba frecven�elor.

Page 54: STEFANESCU - B S - PIED - uni-muenchen.de9.3. Analiza legturilor dintre variabile prin intermediul regresiei 9.4. Indicatori de apreciere a sensului i intensit ii legturilor dintre

a) O histogram� const� în construirea, pentru fiecare grup� dintr-o distribu�ie heterograd�, a câte unui dreptunghi cu latur� orizontal� corespunzând intervalului de varia�ie �i cu latura vertical� propor�ional� cu frecven�a absolut�.

Exemplul 3.5. În tabelul 3.22. este prezentat� o distribu�ie

heterograd� ce descrie repartizarea punctelor de desfacere ale unei firme în raport cu veniturile din vânz�ri. Se cere s� se reprezinte aceste date printr-o histogram�.

Tabelul 3.22. Repartizarea punctelor de desfacere ale unei firme în

raport cu veniturile din vânz�ri

Nr. crt.

Interval de varia�ie ( )ii xx ;1− [mii RON]

Frecven�� absolut� ( )x

in (0) (1) (2) 1 [100 ; 200) 7 2 [200 ; 300) 10 3 [300 ; 400) 14 4 [400 ; 500) 8 5 [500 ; 600) 5

Page 55: STEFANESCU - B S - PIED - uni-muenchen.de9.3. Analiza legturilor dintre variabile prin intermediul regresiei 9.4. Indicatori de apreciere a sensului i intensit ii legturilor dintre

Scara: Ox: 1 cm = 100 mii RON; Oy: 1 cm = 2 puncte de desfacere

Fig. 3.4. Reprezentarea printr-o histogram� a distribu�iei punctelor de vânzare în func�ie de venituri

Rezolvare: în figura 3.4. este prezentat modul de trasare a

histogramei seriei.

b) Desenarea unui poligon al frecven�elor presupune parcurgerea urm�torului algoritm:

1) la grupele distribu�iei heterograde se adaug� dou�, cu frecven�a absolut� nul� �i cu intervale de varia�ie în continuarea celor de la extremit��i;

2) pe axa absciselor se traseaz� intervalele de varia�ie ale grupelor;

3) pentru fiecare grup� se determin� câte un punct având drept coordonat� orizontal� mijlocul intervalului de varia�ie �i drept coordonat� vertical� frecven�a absolut�;

4) punctele astfel ob�inute sunt unite printr-o linie poligonal�.

Page 56: STEFANESCU - B S - PIED - uni-muenchen.de9.3. Analiza legturilor dintre variabile prin intermediul regresiei 9.4. Indicatori de apreciere a sensului i intensit ii legturilor dintre

c) O curb� de frecven�e se ob�ine trasând o linie curb� prin punctele (sau, cel pu�in cât mai aproape de acestea) determinate prin algoritmul folosit pentru desenarea poligonului frecven�elor. Trasarea liniei curbe se poate face fie din ochi, fie prin procedee matematice sofisticate.

Cele trei tehnici prezentate anterior sunt recomandate îndeosebi pentru distribu�iile heterograde cu caracteristici de tip continuu �i cu intervale egale de varia�ie. Atunci când sunt utilizate pentru reprezentarea unor serii cu caracteristici discrete sau cu intervale inegale de varia�ie, aceste procedee pot suferi unele modific�ri. De exemplu, se recomand� ca în cazul seriilor cu caracteristici discrete s� se lase spa�ii libere între reprezent�rile intervalelor de varia�ie pentru a nu se da impresia continuit��ii. De asemenea, pentru seriile cu intervale de varia�ie inegale se recomand� stabilirea coordonatelor verticale astfel încât suprafe�ele dreptunghiurilor delimitate de acestea s� fie propor�ionale cu frecven�ele relative.

Reprezent�rile distribu�iilor heterograde în coordonate carteziene sunt utilizate frecvent în aprecierea formei pe care o îmbrac� func�ia probabilistic� asociat� unui fenomen. De regul�, în cadrul acestor reprezent�ri coordonatele de pe ordonate sunt propor�ionale cu frecven�ele absolute �i, implicit, cu cele relative. Cum frecven�ele relative constituie ni�te aproxim�ri ale probabilit��ilor, rezult� c� reprezent�rile în coordonate carteziene pot fi considerate ni�te aproxim�ri ale func�iilor probabilistice. Forma pe care o are o reprezentare cartezian� constituie un indiciu în alegerea tipului de func�ie probabilistic� asociat fenomenului studiat. În statistica matematic� au fost definite mai multe forme ale distribu�iilor heterograde determinate pe baza reprezent�rilor în coordonate carteziene. În continuare vom prezenta trei dintre acestea:

1) distribu�ia în form� de clopot; 2) distribu�ia în form� de J; 3) distribu�ia în form� de U.

1) O distribu�ie în form� de clopot corespunde unei reparti�ii

normale de tip Gauss-Laplace. În figura 3.5. este reprezentat� grafic o astfel de distribu�ie. Centrului intervalului valoric al seriei îi corespunde o grup� cu frecven�a maxim� iar frecven�ele celorlalte grupe se diminueaz� în raport cu aceasta, spre stânga �i spre dreapta, cu un acela�i ritm, într-o simetrie perfect�. Se poate aprecia c�

Page 57: STEFANESCU - B S - PIED - uni-muenchen.de9.3. Analiza legturilor dintre variabile prin intermediul regresiei 9.4. Indicatori de apreciere a sensului i intensit ii legturilor dintre

aceast� form� de distribu�ie descrie manifestarea în condi�ii naturale a celor mai multe dintre fenomenele colective. Pentru distribu�iile în form� de clopot se consider� c� valorile tipice, situate în intervalul din centru cu frecven�a absolut� maxim�, au un grad mare de reprezentativitate pentru ansamblul seriei, ceea ce u�ureaz� caracterizarea fenomenelor.

Fig. 3.5. Histograma unei distribu�ii în form� de clopot

2) O distribu�ie în form� de J (numit� �i curba lui Pareto, în

onoarea economistului Vilfredo Pareto) este caracterizat� prin dispunerea frecven�ei maxime într-unul din intervalele de varia�ie extreme, frecven�a celorlalte grupe sc�zând treptat �i atingând un minim la cealalt� extremitate (fig. 3.6.). Astfel de situa�ii apar îndeosebi atunci când se studiaz� distribu�iile averilor sau veniturilor în cadrul unor comunit��i polarizate sub aspectul bog��iei, în care o mare parte a familiilor se situeaz� în intervale valorice inferioare ale veniturilor sau averilor. La distribu�iile în form� de J se consider� c� valorile tipice nu au o reprezentativitate prea mare, ceea ce induce unele dificult��i în caracterizarea fenomenelor studiate.

Page 58: STEFANESCU - B S - PIED - uni-muenchen.de9.3. Analiza legturilor dintre variabile prin intermediul regresiei 9.4. Indicatori de apreciere a sensului i intensit ii legturilor dintre

� Fig. 3.7. Histograma unei distribu�ii în form� de J

3) O distribu�ie în form� de U poate fi descris� drept opusul

unei distribu�ii în form� de clopot. În figura 3.7. este prezentat� histograma unei astfel de distribu�ii. În centrul intervalului valoric al seriei se afl� o grup� cu frecven�a minim�, frecven�ele celorlalte grupe crescând treptat în raport cu aceasta, spre stânga �i spre dreapta, într-o simetrie perfect�. Astfel de distribu�ii se întâlnesc destul de rar, în studiul unor fenomene meteorologice, biologice etc. Se consider� c� valorile tipice ale unei distribu�ii în form� de U nu au un grad mare de reprezentativitate pentru ansamblul seriei, ceea ce face dificil studiul fenomenului.

Page 59: STEFANESCU - B S - PIED - uni-muenchen.de9.3. Analiza legturilor dintre variabile prin intermediul regresiei 9.4. Indicatori de apreciere a sensului i intensit ii legturilor dintre

Fig. 3.7. Histograma unei distribu�ii în form� de U Cele trei forme prezentate mai sus sunt, într-o anumit� m�sur�,

ni�te abstractiz�ri, care apar, în realitate, destul de rar într-o „form� pur�”. Adeseori, în practic�, o distribu�ie heterograd� este încadrat� în una dintre aceste forme abstracte, cu toate c� nu îi întrune�te toate însu�irile. De exemplu, sunt considerate drept distribu�ii în form� de clopot sau în form� de U serii care nu sunt perfect simetrice, sau drept distribu�ii în form� de J serii la care frecven�ele nu cresc sau descresc continuu.

3.3. Prelucrarea primar� a datelor statistice prin serii

în spa�iu

O serie în spa�iu este un �ir de date asupra unui fenomen,

diferen�iate pe baza locurilor în care acesta s-a manifestat. În practic�, sunt întâlnite destul de frecvent fenomene care se manifest� diferit în locuri diferite. De exemplu, un produs nou lansat poate fi primit foarte bine în unele regiuni �i mai pu�in bine în alte regiuni. Printr-o serie în spa�iu, astfel de diferen�e pot fi relevate �i puse în leg�tur� cu unele circumstan�e care le-au favorizat. Alc�tuirea seriilor în spa�iu este condi�ionat� de posibilitatea de ob�inere a datelor simultan din mai multe locuri. În cazul în care datele asupra manifest�rii unui fenomen în spa�iu sunt culese în perioade de timp diferite, compara�iile dintre acestea pentru relevarea diferen�elor î�i pierd din rigoare. Datele pe baza c�rora se constituie seriile în spa�iu pot îmbr�ca variate forme: cantitative, calitative, cronologice etc. Aceste serii pot fi atât unidimensionale cât �i multidimensionale. Într-o anumit� m�sur�, o serie în spa�iu poate fi considerat� drept o distribu�ie homograd�, în care locul joac� rolul unei caracteristici atributive calitative.

Pentru reprezent�rile grafice ale seriilor în spa�iu pot fi utilizate atât tehnicile de reprezentare specifice distribu�iilor homograde (diagrame de reprezentare a frecven�elor absolute, diagrame de structur� etc.) cât �i o tehnic� special�, numit� cartogram�. Aceasta const� în reprezentarea unor aspecte ale seriilor în spa�iu prin intermediul unor h�r�i geografice (la nevoie stilizate), în care sunt eviden�iate locurile pentru care s-au cules date. Adeseori, frecven�ele absolute sunt descrise prin pictograme – simboluri ale datelor prezentate.

Page 60: STEFANESCU - B S - PIED - uni-muenchen.de9.3. Analiza legturilor dintre variabile prin intermediul regresiei 9.4. Indicatori de apreciere a sensului i intensit ii legturilor dintre

3.4. Prelucrarea primar� a datelor statistice prin serii

în timp

3.4.1. Conceptul de serie în timp O serie în timp (numit� �i serie cronologic�) poate fi definit�

drept un �ir prin care sunt prezentate date cu privire la st�rile unui fenomen în diferite momente sau perioade de timp ale manifest�rii sale. �irul este ordonat, de regul�, în ordinea cronologic� a momentelor �i perioadelor de timp. Seriile în timp sunt practic indispensabile pentru analiza dinamic� prin care sunt studia�i parametrii unor evolu�ii. Datele prezentate printr-o serie în timp pot îmbr�ca diferite forme:date calitative, date cantitative de tip discret sau continuu, date asupra locurilor în care se manifest� fenomenul studiat etc.

În alc�tuirea unei serii în timp trebuie luate în considerare momentele �i perioadele de timp pentru care se culeg datele precum �i modalit��ile de prezentare a acestora. În func�ie de scopurile analizei dinamice, orizontul de timp pentru care se culeg datele statistice poate lua diverse valori: de la câteva secunde, a�a cum se întâmpl� când se studiaz� anumite procese fizice sau chimice, pân� la mai multe decenii, atunci când se cerceteaz� unele evolu�ii în domeniul social sau economic. De regul�, cu cât orizontul de timp pentru care se culeg datele este mai mare, cu atât prelucrarea acestora este mai complex�. De exemplu, pentru datele exprimate în unit��i monetare �i care privesc perioade lungi de timp trebuie luat� în considerare diminuarea puterii de cump�rare a banilor, ca urmare a infla�iei, astfel încât valorile acestora sunt prelucrate pentru a permite compara�iile în raport cu o aceea�i valoare a banilor.

Momentele �i perioadele de timp în care se culeg date sunt stabilite, de regul�, prin împ�r�irea orizontului de timp în intervale cu lungimi egale (sau, cel pu�in, aproximativ egale). Lungimea acestor intervale este aleas� în raport cu unele tr�s�turi ale fenomenului studiat (regularitate, durat� etc.) �i cu posibilit��ile de culegere a datelor. De exemplu, în analiza economic�, momentele pentru care sunt culese datele sunt stabilite adeseori la sfâr�it de an, întrucât bilan�urile contabile ale firmelor se alc�tuiesc, de regul�, pe baza situa�iei din aceast� perioad�.

Uneori, prin seriile în timp sunt studiate nu doar tendin�ele generale ale unor evolu�ii ci �i varia�iile periodice ale fenomenelor

Page 61: STEFANESCU - B S - PIED - uni-muenchen.de9.3. Analiza legturilor dintre variabile prin intermediul regresiei 9.4. Indicatori de apreciere a sensului i intensit ii legturilor dintre

cercetate. Astfel de varia�ii periodice se produc ca urmare a unor factori ce ac�ioneaz� semnificativ numai în anumite perioade de timp: în unele anotimpuri ale unui an, în unele zile ale s�pt�mânii, în anumite ore dintr-o zi etc. De exemplu, în cursul unui an, vânz�rile de înghe�at� înregistreaz�, de regul�, valori maxime în lunile de var� �i valori minime în lunile de iarn�. De asemenea, în cursul unei s�pt�mâni, vânz�rile de bilete la cinematografe sunt, de regul�, mai mari în zilele de sâmb�t� �i duminic� fa�� de celelalte zile. Varia�iile periodice ale unui fenomen sunt cercetate, de regul�, pe baza unor date culese la intervale de timp determinate prin divizarea celor alese pentru ob�inerea datelor asupra tendin�ei generale.

În func�ie de modul de prezentare a datelor se pot delimita dou� tipuri de serii în timp:

- serii în timp simple, la care datele reflect� situa�ia unui

fenomen în momentul sau perioada de timp pentru care au fost culese;

- seriile în timp cumulate, la care datele reflect� situa�ia unui fenomen pân� la momentul sau perioada pentru care au fost culese.

În domeniul economic, seriile în timp cumulative sunt folosite îndeosebi pentru a se eviden�ia realizarea unor planific�ri: pentru venituri sau cheltuieli bugetare, pentru nivelul produc�iei etc. O serie în timp cumulat� poate fi ob�inut� dintr-o serie în timp simpl�, adunând, la valoarea numeric� a datei pentru un anumit moment, valorile numerice ale datelor pentru momentele anterioare. De exemplu, în tabelul 3.30. este prezentat� situa�ia îndeplinirii planului pentru primul semestru al anului 2005 la produc�ia unui sortiment, pe baza a trei indicatori: produc�ia efectiv� lunar�, produc�ia efectiv� cumulat� pentru fiecare lun� �i ponderea produc�iei efective cumulate pentru produc�ia planificat� pentru întregul semestru.

Tabelul 3.30. Situa�ia îndeplinirii planului pentru produc�ia unui

sortiment, în primele �ase luni ale anului 2005 Produc�ia efectiv�

[buc��i] Nr. crt.

Luna Lunar�

Cumulat� de la 1 ianuarie 2005

Pondere a produc�iei efective cumulat�

în produc�ia planificat� pentru întregul semestru1

Page 62: STEFANESCU - B S - PIED - uni-muenchen.de9.3. Analiza legturilor dintre variabile prin intermediul regresiei 9.4. Indicatori de apreciere a sensului i intensit ii legturilor dintre

(0) (1) (2) (3) (4) = (3)/10.000 1 Ianuarie 1 900 1 900 0,19 2 Februarie 1 100 3 000 0,30 3 Martie 2 200 4 200 0,42 4 Aprilie 2 500 6 700 0,67 5 Mai 2 700 8 400 0,84 6 Iunie 1 400 9 800 0,98

1) Pentru întregul semestru al anului 2005 a fost planificat� o produc�ie de 10 000 buc��i

3.4.2. Reprezentarea grafic� a seriilor în timp Dintre tehnicile aplicat în reprezentarea grafic� a seriilor în

timp se deta�eaz�, prin frecven�a utiliz�rii, dou� categorii: - reprezent�rile în coordonate carteziene; - reprezent�rile prin diagrame polare.

3.4.2.1. Reprezent�rile grafice ale seriilor în timp prin coordonate carteziene

Reprezent�rile grafice ale seriilor în timp prin coordonate carteziene (numite �i historiograme sau cronograme) sunt asem�n�toare celor folosite pentru reprezentarea seriilor atributive sau seriilor de loc, cu deosebirea c� pe axa absciselor coordonatele corespund unor momente sau perioade de timp. Distan�ele dintre reprezent�rile momentelor sau perioadelor de timp pe axa absciselor trebuie s� fie propor�ionale (sau, cel pu�in, aproximativ propor�ionale) cu intervalele de timp dintre acestea . Pe axa ordonatelor sunt reprezentate, la o scar� convenabil�, valorile datelor culese. Fiec�rei perechi de date �i momente (sau perioade) de timp îi corespunde un punct ob�inut prin intersectarea dreptelor trasate perpendicular pe cele dou� axe, în dreptul valorilor corespunz�toare. Exist� mai multe variante de reprezentare grafic� a seriilor în timp prin coordonate carteziene:

- historiograma prin linii drepte, care unesc punctele corespunz�toare coordonatelor datelor culese �i momentelor (sau perioadelor) de timp;

- historiograma prin linii curbe, care unesc acelea�i puncte (acest tip de reprezentare este mai greu de realizat îns�

Page 63: STEFANESCU - B S - PIED - uni-muenchen.de9.3. Analiza legturilor dintre variabile prin intermediul regresiei 9.4. Indicatori de apreciere a sensului i intensit ii legturilor dintre

sugereaz� într-o m�sur� mai mare decât precedentul continuitatea evolu�iei de la o perioad� de timp la alta);

- historiograma prin bare, care const� în reprezentarea datelor prin dreptunghiuri cu latura vertical� egal� cu coordonatele de pe abscis� �i cu latura orizontal�, cu o m�rime convenabil�, pozi�ionat� în dreptul coordonatelor de pe abscis�.

3.4.2.2. Reprezent�rile grafice ale seriilor în timp prin diagrame polare

Reprezent�rile grafice prin diagrame polare îmbrac� forma unor sectoare de cerc, concentrice dar cu raze diferite. Sunt utilizate dou� forme de reprezentare a valorilor prin diagrame polare: - prin propor�ionalitatea dintre suprafe�ele sectoarelor de cerc �i

valorile pe care acesta le reprezint�; - prin propor�ionalitatea dintre razele sectoarelor de cerc �i valorile

pe care acestea le reprezint�. În practic�, este folosit� mai frecvent a doua form� de

reprezentare, care este mai facil�. De regul�, unghiurile sectoarelor de cerc sunt propor�ionale cu intervalele de timp la care se refer�. În consecin��, atunci când aceste intervale sunt aproximativ egale, unghiul unui sector de cerc este ob�inut prin împ�r�irea celor 360o ale unui cerc la num�rul de intervale de timp.

Spre deosebire de historiograme, care sugereaz�, în mare m�sur�, un traseu parcurs de la început pân� la sfâr�it, diagramele polare, la care nu se face o delimitare clar� între un moment de început �i unul de sfâr�it, sugereaz�, mai degrab�, un proces reluat permanent. Sunt, din acest motiv, indicate pentru studiul varia�iilor periodice ale unor fenomene.

Page 64: STEFANESCU - B S - PIED - uni-muenchen.de9.3. Analiza legturilor dintre variabile prin intermediul regresiei 9.4. Indicatori de apreciere a sensului i intensit ii legturilor dintre

Capitolul 4 – Valori tipice

4.1. Considera�ii generale asupra valorilor tipice

Într-un capitol anterior am definit valorile tipice drept m�rimi

reprezentative pentru caracteristicile unei popula�ii statistice. În cadrul cercet�rilor statistice, aceste m�rimi servesc la identificarea tr�s�turilor esen�iale ale fenomenelor colective.

Valorile tipice îmbrac� o form� numeric�, ceea ce constituie un avantaj considerabil din perspectiva cuantific�rii acestor tr�s�turi. Totu�i, tocmai aceast� însu�ire duce la unele constrângeri în folosirea lor. Dac� în ce prive�te datele cantitative, valorile tipice sunt destul de u�or de identificat, în cazul datelor calitative e nevoie de procedee destul de complexe pentru a le transpune într-o form� numeric�.

În cercet�rile statistice sunt folosite mai multe categorii de m�rimi prin care s� fie reprezentat ansamblul unit��ilor unei popula�ii statistice. În acest capitol vor fi abordate doar trei tipuri de m�rimi dintre cele utilizate frecvent în practic�: - m�rimile medii, care sunt ob�inute raportând toate valorile unei

serii la num�rul unit��ilor statistice; - valoarea median�, calculat� în raport cu pozi�ia central� dintr-o

serie ordonat�; - modul (numit �i dominanta) calculat în raport cu frecven�a

maxim� dintr-o distribu�ie heterograd�. În mod obligatoriu, valorile tipice sunt determinate pe baza

seriilor statistice. Din acest motiv, modalit��ile de calcul ale acestor m�rimi trebuie adaptate la tipurile seriilor statistice. În cazul seriilor simple, valorile tipice sunt determinate în raport cu num�rul �i valorile asociate unit��ilor statistice. În schimb, pentru distribu�iile heterograde valorile tipice sunt calculate pe baza intervalelor de varia�ie �i frecven�elor asociate grupelor.

Page 65: STEFANESCU - B S - PIED - uni-muenchen.de9.3. Analiza legturilor dintre variabile prin intermediul regresiei 9.4. Indicatori de apreciere a sensului i intensit ii legturilor dintre

Un alt aspect important al valorilor tipice, abordat �i în capitolele anterioare, este constituit de reprezentativitatea pe care o astfel de m�rime o are pentru ansamblul popula�iei statistice pe care o caracterizeaz�. În cadrul statisticii matematice au fost dezvoltate mai multe criterii de apreciere a reprezentativit��ii valorilor tipice în raport cu particularit��ile seriilor statistice. Pe baza acestora se poate aprecia, pentru o serie statistic� anume, care sunt m�rimile care îi caracterizeaz� aspectele esen�iale.

4.2. M�rimi medii

M�rimile medii sunt considerate drept indicatorii care reflect�

în cea mai mare m�sur� impactul factorilor esen�iali de influen�� asupra fenomenelor colective. În acest subcapitol vor fi prezentate succint patru categorii de m�rimi medii:

- media aritmetic�; - media geometric�; - media armonic�; - mediile de ordin superior.

4.2.1. Media aritmetic�

4.2.1.1. Calculul mediilor aritmetice În raport cu tipurile seriilor statistice se pot delimita dou�

modalit��i de calcul al mediei aritmetice: a) modalit��i specifice seriilor simple; b) modalit��i specifice distribu�iilor

heterograde. a) Pentru o serie simpl�, media aritmetic� este ob�inut�

raportând totalul valorilor la num�rul de unit��i statistice. În acest caz,

formula de calcul are forma: N

X

X

N

ii�

== 10 (4.1.)

în care: 0X este media aritmetic�, dup� o caracteristic� a seriei simple; Xi este valoarea caracteristicii X asociat� unit��ii statistice i; N

este num�rul de unit��i statistice din cadrul seriei simple. b) Pentru o distribu�ie heterograd�, calculul mediei aritmetice

are la baz� intervalele de varia�ie �i frecven�ele asociate grupelor. Formula de calcul este urm�toarea:

Page 66: STEFANESCU - B S - PIED - uni-muenchen.de9.3. Analiza legturilor dintre variabile prin intermediul regresiei 9.4. Indicatori de apreciere a sensului i intensit ii legturilor dintre

=

=

=x

x

K

i

Xi

K

i

Xii

n

nX

X

1

1

'

(4.2.)

unde: - X este media aritmetic� a distribu�iei heterograde în raport

cu caracteristica X; - KX este num�rul de grupe al seriei în raport cu caracteristica

X;

- 'iX este centrul de interval al grupei i format� dup�

caracteristica X;

- Xin este frecven�a absolut� a grupei i.

Exemplul 4.1. În tabelul 4.1. este prezentat� o distribu�ie heterograd�, care descrie repartizarea angaja�ilor unei firme în raport cu veniturile salariale ale acestora. Se cere s� se determine venitul salarial mediu pentru angaja�ii firmei.

Tabelul 4.1. Repartizarea angaja�ilor unei firme în raport cu

veniturile salariale

Nr. crt. Grupe dup� venituri salariale

[RON/lun�] Frecven�� absolut�

( Xin )

(0) (1) (2) 1 [300 – 500) 20 2 [500 – 700) 50 3 [700 – 900) 80 4 [900 – 1.100) 40 5 [1 100 – 1 300) 10

Rezolvare:

În tabelul 4.2. este prezentat calculul termenilor formulei 4.2.

În raport cu ace�tia rezult�:

770200

000.154

1

1

'

==

=

=

=

x

x

K

i

Xi

K

i

Xii

n

nX

X RON/lun�

Page 67: STEFANESCU - B S - PIED - uni-muenchen.de9.3. Analiza legturilor dintre variabile prin intermediul regresiei 9.4. Indicatori de apreciere a sensului i intensit ii legturilor dintre

Tabelul 4.2. Calcule intermediare pentru determinarea mediei

aritmetice

Nr. crt.

Grupe dup� venituri salariale

[RON/lun�]

Frecven�� absolut�

( Xin )

Centru de interval ( 'X ) [RON/lun�]

XinX ×'

[RON/lun�]

(0) (1) (2) (3) (4)=(3)x(2) 1 [300 – 500) 20 400 8.000 2 [500 – 700) 50 600 30.000 3 [700 – 900) 80 800 64.000 4 [900 – 1.100) 40 1.000 40.000 5 [1.100 – 1.300) 10 1.200 12.000 6 Total 200 × 154.000 7

Simbol pentru

total

�=

xK

i

x

in1

× �=

⋅xK

i

Xii nX

1

'

De�i diferit� de modalitatea de calcul pentru seriile simple,

formula de determinare a mediei aritmetice pentru distribu�iile heterograde are la baz�, la fel ca prima, raportarea sumei valorilor la num�rul total de unit��i statistice. Pentru a demonstra aceasta, vom reaminti ceea ce am men�ionat într-un capitol anterior, anume c� în unele calcule statistice se consider� c� toate unit��ile statistice dintr-o grup� au o valoare egal� cu cea a centrului intervalului de varia�ie. În aceste condi�ii, suma valorilor din acea grup� este dat� de produsul dintre num�rul de unit��i statistice (adic� frecven�a absolut� a grupei) �i centrul intervalului de varia�ie. Rezult� c� suma tuturor valorilor seriilor, care poate fi ob�inut� adunând sumele valorilor din toate grupele seriei, este reprezentat� de num�r�torul din rela�ia (4.2.).

Pe de alt� parte, num�rul total de unit��i statistice ale unei distribu�ii heterograde poate fi ob�inut adunând frecven�ele absolute ale tuturor grupelor (altfel spus, se însumeaz� toate unit��ile, din fiecare grup�), ceea ce reprezint� valoarea numitorului din rela�ia (4.2.).

În concluzie, rela�ia (4.2.) prin care se calculeaz� mediile aritmetice ale distribu�iilor heterograde, poate fi considerat� drept un raport dintre suma valorilor �i num�rul de unit��i statistice.

Media aritmetic� a unei serii simple �i cea a unei distribu�ii heterograde pot diferi substan�ial atunci când aproximarea valorilor

Page 68: STEFANESCU - B S - PIED - uni-muenchen.de9.3. Analiza legturilor dintre variabile prin intermediul regresiei 9.4. Indicatori de apreciere a sensului i intensit ii legturilor dintre

unei grupe prin centrul de interval al acesteia este mult îndep�rtat� de realitate. De regul�, cu cât num�rul de grupe este mai mare cu atât diferen�a dintre cele dou� medii aritmetice este mai mic�.

4.2.1.2. Reprezentativitatea mediilor aritmetice Media aritmetic� este considerat� drept cea mai reprezentativ�

valoare pentru impactul factorilor esen�iali de influen�� asupra unui fenomen ce se manifest� în condi�ii de normalitate. Adeseori, fenomenele sunt comparate �i încadrate doar pe baza acestei valori tipice. Totu�i, o analiz� care nu folose�te decât media aritmetic� are dezavantajul c� las� nesesizat aspectul omogenit��ii manifest�rii fenomenelor colective. De exemplu, dou� grupe de studen�i pot s� fie caracterizate în raport cu rezultatul la un examen printr-o aceea�i not� medie egal� cu �apte, ob�inut� îns� în condi�ii diferite. S� presupunem c� la prima grup� to�i studen�ii au ob�inut nota �apte, ceea ce înseamn� o omogenitate perfect�. În schimb, s� presupunem pentru a doua grup� c� jum�tate din efectiv a ob�inut nota zece în timp ce cealalt� jum�tate a ob�inut nota patru, ceea ce înseamn� o dispersare semnificativ� a valorilor. În primul caz, media aritmetic� se confund� cu notele, fiind, astfel, foarte reprezentativ� pentru acestea. În al doilea caz, notele sunt destul de îndep�rtate de media aritmetic�, ceea ce face ca aceasta s� fie mai pu�in reprezentativ� pentru studen�ii grupei. Acest exemplu a vizat valori organizate în serii simple. Pentru distribu�iile de frecven�e, situa�ia este ceva mai complex� întrucât trebuie luat� în considerare atât dispersarea valorilor din cadrul fiec�rei grupe cât �i dispersarea centrelor intervalelor de varia�ie. Cu cât valorile din cadrul unei grupe sunt mai dispersate, cu atât centrul de interval este mai pu�in reprezentativ pentru acestea. De asemenea, o dispersare semnificativ� a centrelor intervalelor de varia�ie face ca media aritmetic� a distribu�iei heterograde s� fie mai pu�in apropiat� de aceste valori.

În aprecierea reprezentativit��ii unei medii aritmetice pentru o distribu�ie heterograd� poate fi luat� în considerare �i forma acesteia din urm�. Astfel, la distribu�iile în form� de clopot se consider� c� media aritmetic�, situat� în intervalul cu cea mai mare frecven��, are un grad mare de reprezentativitate pentru valorile seriei. În schimb, pentru distribu�iile în form� de J sau de U, media aritmetic�, amplasat� nu neap�rat într-un interval de frecven�� maxim�, are, de regul�, un grad redus de reprezentativitate.

Page 69: STEFANESCU - B S - PIED - uni-muenchen.de9.3. Analiza legturilor dintre variabile prin intermediul regresiei 9.4. Indicatori de apreciere a sensului i intensit ii legturilor dintre

4.2.2. Media geometric� Media geometric� este o m�rime folosit� pentru a caracteriza

aspectele esen�iale ale unui fenomen ale c�rui efecte pot fi asimilate unei progresii geometrice. Astfel de situa�ii apar îndeosebi în cazul evolu�iilor schimburilor comerciale interna�ionale pentru anumite perioade, a vânz�rilor unor produse în faza de lansare, a unor fenomene demografice etc. Se consider� c� la astfel de evolu�ii media geometric� poate surprinde, uneori chiar într-o m�sur� mai mare fa�� de media aritmetic�, aspectele esen�iale.

Media geometric� a unei serii simple notat� cu 0gX , este dat� de formula:

N

N

i

ig XX ∏=

=1

0 (4.3.)

În practic�, atunci când N este foarte mare, extragerea unei r�d�cini de un asemenea ordin poate fi destul de complicat�. Din acest motiv, adeseori se prefer� logaritmarea rela�iei (4.3.) care devine:

( ) �∏∏===

=��

���

�=��

��

�=

XK

ii

N

ii

N

N

iig x

NX

NXX

111

ln1

ln1

lnln 0 (4.4.)

Pentru o distribu�ie heterograd�, dac� se consider� c� toate unit��ile dintr-o grup� au o valoare egal� cu centrul intervalului de varia�ie, media geometric�, notat� cu gX , este dat� de rela�ia:

�= = ∏

=

XK

i

Xi X x

in K

i

n

ig XX 1

1

' (4.5.)

Logaritmând aceast� valoare, din acelea�i considerente pentru care se logaritmeaz� �i media geometric� a unei serii simple, rezult�:

( ) ( )� ⋅

=��

���

=���

���

� �=

=

==

=∏∏=

X

X

xi

X

XK

i

Xi X x

iK

ii

XiK

i

Xi

n

iK

i

Xi

n K

i

n

ig Xn

n

X

n

XX1

'

1

'

1

1

' ln1

ln1

lnln 1 (4.6.)

4.2.3. Media armonic� Media armonic� este un indicator folosit pentru a descrie

fenomene ale c�ror efecte pot fi asimilate unei func�ii hiperbolice.

Page 70: STEFANESCU - B S - PIED - uni-muenchen.de9.3. Analiza legturilor dintre variabile prin intermediul regresiei 9.4. Indicatori de apreciere a sensului i intensit ii legturilor dintre

Pentru o serie simpl�, media armonic�, notat� cu 0hX , este dat� de

rela�ia:

�=

=N

i i

h

X

NX

1

10 (4.7.)

Media armonic� a unei distribu�ii heterograde, notat� cu hX , poate fi calculat� prin formula:

=

=

=X

X

K

i

Xi

i

K

i

Xi

h

nX

n

X

1'

1

10 (4.8.)

4.2.4. Medii de ordin superior O medie de ordin superior este indicat� pentru a caracteriza

aspectele esen�iale ale unor fenomene ale c�ror efecte pot fi asimilate unor func�ii polinomiale.

Pentru o serie simpl�, o medie de ordin p, notat� cu 0pX , este dat� de rela�ia:

p

pi

p

N

XX

�=0 (4.9.)

Media de ordin p a unei distribu�ii heterograde, notat� cu pX , poate fi calculat� prin formula:

pK

i

Xi

K

i

Xi

pi

pX

X

n

nX

X

=

=

=

1

1 (4.10)

La fel ca în cazul mediilor geometrice, uneori, pentru

simplificarea calculelor, se procedeaz� la logaritmarea formulelor mediilor de ordin superior.

4.3. Valoarea median�

O valoare median� (numit� uneori, mai simplu, doar median�)

este o m�rime ce ocup� locul central într-o serie statistic� ordonat� împ�r�ind-o în dou� grupe de frecven�e egale.

Page 71: STEFANESCU - B S - PIED - uni-muenchen.de9.3. Analiza legturilor dintre variabile prin intermediul regresiei 9.4. Indicatori de apreciere a sensului i intensit ii legturilor dintre

4.3.1. Determinarea valorii mediane Modalit��ile de determinare a valorii mediane se diferen�iaz� în

raport cu tipul seriei: simpl� sau distribu�ie heterograd�.

4.3.1.1. Calculul valorii mediane pentru serii simple În cazul unei serii simple ordonate, valoarea median�, notat� cu

Mexo, este reprezentat�, a�a cum reiese din defini�ia acestei m�rimi,

de termenul (sau termenii) care ocup� locul central. Atunci când seria are un num�r impar de unit��i, valoarea median� este u�or de determinat, întrucât un singur termen de�ine pozi�ia central�. În schimb, atunci când seria are un num�r par de unit��i, în mijlocul acesteia se vor afla doi termeni, iar valoarea median� va fi dat� de media aritmetic� a acestora.

Exemplul 4.2. Se dau dou� serii simple: - prima serie cuprinde numerele: 50; 42; 48; 38; 41; - a doua serie cuprinde numerele:47; 61; 63; 62; 34; 37. Se cere s� se determine valorile mediane ale celor dou� serii. Rezolvare: Prin ordonare, prima serie devine: 38; 41; 42; 48;

50. Fiind o serie cu un num�r impar de termeni, valoarea median� este reprezentat� de termenul aflat în centru, adic� Mex

o = 42. Tot prin ordonare, a doua serie devine: 34; 37; 47; 61; 62; 63. Fiind o serie cu un num�r par de termeni, valoarea median� este dat� de media aritmetic� a celor doi termeni ce ocup� pozi�ia central�, adic�:

542

6147

243

0=

+=

+=

yyM

y

l.

4.3.1.2. Determinarea valorii mediane pentru distribu�ii heterograde

Pentru distribu�iile heterograde, valorile mediane pot fi

determinate prin dou� modalit��i: - pe cale analitic�; - pe cale grafic�.

Page 72: STEFANESCU - B S - PIED - uni-muenchen.de9.3. Analiza legturilor dintre variabile prin intermediul regresiei 9.4. Indicatori de apreciere a sensului i intensit ii legturilor dintre

4.3.1.2.1. Calculul analitic al valorii mediane a unei distribu�ii heterograde

La o distribu�ie heterograd� determinarea valorii mediane,

notat� cu xeM , presupune parcurgerea urm�torului algoritm:

Pasul 1. Se calculeaz� o m�rime numit� unitatea median� a

seriei, notat� cu UMex, prin formula:

2

11

+���

����

=

�=

x

e

K

i

xi

M

x

n

U (4.11.)

Pasul 2. Se calculeaz�, pentru fiecare grup�, o m�rime numit�

frecven�a absolut� cumulat�, notat� cu ixN prin adunarea, la

frecven�a absolut� a grupei, a frecven�elor absolute ale grupelor anterioare:

�=

=i

j

xjx nN

i1

(4.12.) Pasul 3. Se stabile�te intervalul de varia�ie în care se g�se�te

valoarea median�, numit interval median, care corespunde primei grupe pentru care frecven�a absolut� cumulat� este mai mare decât unitatea median�;

Pasul 4. Se calculeaz� valoarea median� prin formula:

xM

x

M

M

xMxe

e

eM

e

e

e n

NUdxM 1

1−

−⋅+= − (4.13.)

unde:

1−eMx este limita inferioar� a intervalului median;

eMxd este lungimea intervalului median;

1−eMxN este frecven�a absolut� cumulat� a intervalului anterior

intervalului median; xMe

n este frecven�a absolut� a intervalului median.

Exemplul 4.3. Se cere s� se calculeze pe cale analitic� valoarea median� a seriei prezentate în tabelul 4.1.

Page 73: STEFANESCU - B S - PIED - uni-muenchen.de9.3. Analiza legturilor dintre variabile prin intermediul regresiei 9.4. Indicatori de apreciere a sensului i intensit ii legturilor dintre

Rezolvare: În tabelul 4.3. sunt prezentate valorile frecven�elor

absolute cumulate. Unitatea median� reprezint�:

5,1002

1200

2

11

=+

=

+���

����

=

�=

x

e

K

i

xi

M

x

n

U

Prima grup� pentru care

ixN > eMxU corespunde intervalului

[700 , 900) care a fost, astfel, desemnat drept interval median.

Tabelul 4.3. Calcule intermediare pentru determinarea valorii

mediane

Nr. crt.

Grupe de venituri salariale

[RON/lun�]

Frecven��

absolut� ( xin )

Frecven�� absolut� cumulat�

(Ni)

(0) (1) (2) (3) 1 [300 – 500) 20 20 2 [500 – 700) 50 70 3 [700 – 900) 80 150 4 [900 – 1.100) 40 190 5 [1.100 – 1.300) 10 200 6 Total 200 ×

7

Simbol pentru total

�=

xK

i

xin

1

×

Se determin�, în continuare, valoarea median�:

25,77680

705,1002007001

1 =−

+=−

⋅+= −

− xM

x

M

MxM

xe

e

eM

e

e

e n

NUdxM

RON/lun�

Page 74: STEFANESCU - B S - PIED - uni-muenchen.de9.3. Analiza legturilor dintre variabile prin intermediul regresiei 9.4. Indicatori de apreciere a sensului i intensit ii legturilor dintre

4.3.1.2.2. Determinarea pe cale grafic� a valorii mediane pentru o distribu�ie heterograd�

Pentru determinarea valorilor mediane ale distribu�iilor

heterograde sunt folosite în practic� mai multe tehnici grafice. În acest subcapitol vom prezenta doar una dintre acestea, utilizat� destul de frecvent datorit� simplit��ii sale. Tehnica are la baz� urm�torul algoritm: Pasul 1. Într-un sistem de coordonate carteziene sunt prezentate intervalele de varia�ie, pe axa absciselor, �i frecven�ele absolute cumulate, pe axa ordonatelor.

Pasul 2. Sunt trasate puncte care reflect� rela�ia dintre intervalele de varia�ie �i frecven�ele absolute cumulate astfel:

- limitei superioare a unui interval de varia�ie îi corespunde frecven�a absolut� cumulat� a grupei;

- limitei inferioare a aceluia�i interval de varia�ie îi corespunde frecven�a absolut� cumulat� a grupei anterioare (face excep�ie prima grup�, la care limitei inferioare a intervalului de varia�ie îi va corespunde o valoare nul� pe axa ordonatelor). Pasul 3. Punctele trasate anterior sunt unite printr-o linie dreapt� poligonal�, rezultând astfel o reprezentare grafic� numit� ogiv�.

Pasul 4. Se traseaz� o linie dreapt� perpendicular� pe axa ordonatelor în dreptul coordonatei care reprezint� jum�tate din frecven�a absolut� cumulat� a ultimei grupe.

Pasul 5. La intersec�ia dintre ogiv� �i linia dreapt� trasat� anterior se coboar� o perpendicular� pe axa absciselor, pe care o va intersecta într-un punct ce corespunde valorii mediane a seriei. Exemplul 4.4. Se cere s� se determine pe cale grafic� valoarea median� a seriei prezentate în tabelul 4.1.

Rezolvare: Pe baza intervalelor de varia�ie �i a frecven�elor absolute cumulate, acestea din urm� determinate în tabelul 4.3., a fost desenat�, în figura 4.1., ogiva distribu�iei heterograde. A fost trasat�

Page 75: STEFANESCU - B S - PIED - uni-muenchen.de9.3. Analiza legturilor dintre variabile prin intermediul regresiei 9.4. Indicatori de apreciere a sensului i intensit ii legturilor dintre

apoi o linie dreapt� perpendicular� pe axa ordonatelor, în dreptul coordonatei 100, care reprezint� jum�tate din frecven�a absolut� cumulat� a ultimei grupe. Aceast� linie dreapt� a intersectat ogiva în punctul notat cu M, de la care s-a coborât o perpendicular� pe axa absciselor pe care a întâlnit-o într-un punct ce corespunde valorii mediane.

xeM

Fig. 4.1. Determinarea pe cale grafic� a valorii mediane a unei

distribu�ii heterograde

4.3.2. Utilizarea valorilor mediane în caracterizarea fenomenelor colective

O m�rime care împarte o serie statistic� ordonat� în dou� grupe

de frecven�e egale are semnifica�ia unui nivel mijlociu pentru ansamblul valorilor seriei. Cu toate acestea, mediana reflect�, în compara�ie cu media aritmetic�, într-o m�sur� mult mai mic� tr�s�turile esen�iale ale fenomenelor colective. În consecin��, valoarea median� este folosit� mai degrab� pentru a completa caracteriz�rile

Page 76: STEFANESCU - B S - PIED - uni-muenchen.de9.3. Analiza legturilor dintre variabile prin intermediul regresiei 9.4. Indicatori de apreciere a sensului i intensit ii legturilor dintre

f�cute prin intermediul valorilor medii, mai ales când acestea nu sunt foarte reprezentative pentru fenomenele studiate.

O valoare median� este foarte apropiat� de media aritmetic� atunci când seria statistic� este dispus� relativ simetric. În cazul unei simetrii perfecte, media aritmetic� împarte în dou� seria ordonat�, confundându-se, în fapt, cu valoarea median�. Dup� cum se va vedea într-un capitol ulterior, rela�ia dintre valoarea median� �i media aritmetic� este utilizat� în aprecierea gradului de reprezentativitate al valorilor tipice.

4.4. Modul unei distribu�ii heterograde

Modul unei distribu�ii heterograde (numit �i dominant�) este o

m�rime care exprim� valoarea cu cea mai mare frecven�� din cadrul seriei.

4.4.1. Determinarea modului unei distribu�ii heterograde Se consider� c� modul unei distribu�ii heterograde trebuie s� se

afle în interiorul unui interval cu frecven�a mai mare decât cea a intervalelor învecinate. Un astfel de interval este numit interval

modal. În raport cu situa�ia intervalelor modale se pot delimita trei tipuri de distribu�ii heterograde:

- serii unimodale, care au doar câte un interval modal (fig. 4.2.a.);

- serii plurimodale cu un singur interval modal principal, care au mai multe intervale modale îns� dintre acestea doar unul, numit principal, are frecven�a absolut� maxim�, celelalte intervale modale fiind numite secundare (fig. 4.3.b.);

- serii plurimodale cu mai multe intervale modale principale, care au mai multe intervale modale cu frecven�a absolut� maxim� (fig. 4.2.c.).

Page 77: STEFANESCU - B S - PIED - uni-muenchen.de9.3. Analiza legturilor dintre variabile prin intermediul regresiei 9.4. Indicatori de apreciere a sensului i intensit ii legturilor dintre

Fig. 4.2. Histograme ale unor tipuri de distribu�ii heterograde

a) serie unimodal�; b) serie plurimodal� cu un singur interval modal

principal; c) serie plurimodal� cu mai multe intervale

modale principale În lucr�rile din cadrul statisticii matematice pot fi întâlnite mai

multe puncte de vedere asupra abord�rii seriilor cu mai multe intervale modale. Dup� unele dintre acestea, rigoarea unei analize

Page 78: STEFANESCU - B S - PIED - uni-muenchen.de9.3. Analiza legturilor dintre variabile prin intermediul regresiei 9.4. Indicatori de apreciere a sensului i intensit ii legturilor dintre

statistice solicit� ca într-o serie s� nu fie decât un singur interval modal. Pentru a se ajunge la aceasta, seriile cu mai multe intervale modale pot fi transformate prin diferite procedee: schimbarea num�rului de grupe, trecerea la intervale de varia�ie inegale �.a.m.d. Dup� alte opinii, analiza seriilor statistice se poate face �i cu mai multe valori ale modului.

În determinarea modului unei distribu�ii heterograde se pot folosi dou� modalit��i:

- prin calcul analitic; - prin tehnici grafice.

4.4.1.1. Calculul analitic al modului unei distribu�ii heterograde

Pentru calculul analitic al modului unei distribu�ii heterograde

poate fi aplicat urm�torul algoritm: Pasul 1. Se stabile�te intervalul modal pentru care se va calcula modul; Pasul 2. Se determin� diferen�a dintre frecven�a absolut� a

intervalului modal �i frecven�a absolut� a intervalului anterior intervalului modal, notat� cu �1 (atunci când intervalul modal corespunde primei grupe, se poate considera c� aceasta este precedat� de o grup� cu frecven�a nul�);

Pasul 3. Se determin� diferen�a dintre frecven�a absolut� a intervalului modal �i frecven�a absolut� a intervalului ulterior intervalului modal, notat� cu �2 (atunci când intervalul modal corespunde ultimei grupe se poate considera c� aceasta este urmat� de o grup� cu frecven�a absolut� nul�);

Pasul 4. Se calculeaz� valoarea modului prin formula:

21

11

0

0 ∆+∆

∆+= −

M

xMxo dxM (4.14.)

unde:

10 −Mx este limita inferioar� a intervalului modal; 0Mxd este

lungimea intervalului modal Exemplul 4.5. Se cere s� se determine, prin calcul analitic, modul seriei statistice prezentat� în tabelul 4.1.

Rezolvare: Seria prezentat� în tabelul 4.1. este unimodal�, iar frecven�a maxim� corespunde intervalului [700 , 900). Cele dou� diferen�e vor avea valorile:

Page 79: STEFANESCU - B S - PIED - uni-muenchen.de9.3. Analiza legturilor dintre variabile prin intermediul regresiei 9.4. Indicatori de apreciere a sensului i intensit ii legturilor dintre

305080231 =−=−=∆ xxnn ; 404080432 =−=−=∆ xx

nn . Aplicând rela�ia (4.14.) rezult� valoarea modului seriei:

71,7854030

30200700

21

11

0

0=

++=

∆+∆

∆+= −

MxM

xo dxM RON/lun�.

4.4.1.2. Determinarea pe cale grafic� a modului unei distribu�ii heterograde

În acest subcapitol va fi prezentat� o tehnic� grafic� de determinare a modului preferat� în practic� datorit� simplit��ii sale. Aceast� tehnic� este descris� de urm�torul algoritm:

Pasul 1. Se deseneaz� histograma distribu�iei heterograde; Pasul 2. Sunt stabilite, pe baza histogramei, intervalele modale; Pasul 3. Pentru dreptunghiul care corespunde unui interval

modal sunt trasate dou� linii drepte: - una din col�ul din dreapta sus al dreptunghiului intervalului

modal pân� la col�ul din dreapta sus al dreptunghiului intervalului anterior intervalului modal;

- alta din col�ul din stânga sus al intervalului modal pân� la col�ul din stânga sus al intervalului ulterior intervalului modal;

Pasul 4. La intersec�ia celor dou� linii drepte trasate anterior se coboar� o perpendicular� pe axa absciselor, pe care o va intersecta în punctul ce corespunde valorii modului.

Page 80: STEFANESCU - B S - PIED - uni-muenchen.de9.3. Analiza legturilor dintre variabile prin intermediul regresiei 9.4. Indicatori de apreciere a sensului i intensit ii legturilor dintre

xM 0

Fig. 4.3. Determinarea pe cale grafic� a modului unei distribu�ii heterograde

Exemplul 4.6. Se cere s� se determine pe cale grafic� modul

seriei prezentate în tabelul 4.1. Rezolvare: În figura 4.3. este prezentat� histograma seriei. Se

poate observa c� seria are un singur interval modal, ce corespunde dreptunghiului cu cea mai mare latur� vertical�. Din col�urile acestuia A �i B se traseaz� dou� linii drepte c�tre col�urile dreptunghiurilor învecinate, respectiv D. La intersec�ia celor dou� linii se afl� punctul M din care se coboar� o perpendicular� c�tre axa absciselor pe care o va intersecta într-un punct ce corespunde modului seriei.

4.4.2. Utilizarea modului în caracterizarea fenomenelor colective

Rolul pe care modul unei serii statistice îl are în caracterizarea

fenomenelor studiate deriv� din leg�tura, prezentat� anterior, dintre frecven�e �i probabilit��i. Valoarea cu cea mai mare frecven�� are semnifica�ia rezultatului cel mai probabil al unui fenomen, de care trebuie s� se �in� seama în cercet�rile statistice. Totu�i, a�a cum se

Page 81: STEFANESCU - B S - PIED - uni-muenchen.de9.3. Analiza legturilor dintre variabile prin intermediul regresiei 9.4. Indicatori de apreciere a sensului i intensit ii legturilor dintre

întâmpl� �i cu valoarea median�, în compara�ie cu media aritmetic�, modul reflect� într-o m�sur� mult mai mic� tr�s�turile esen�iale ale fenomenelor studiate. �i tot la fel ca în cazul valorii mediane, modul unei serii este folosit mai mult pentru a completa caracteriz�rile f�cute pe baza valorilor medii, în special când acestea nu sunt foarte reprezentative.

Rela�ia dintre un mod al unei distribu�ii de frecven�e �i media aritmetic� a acesteia trebuie analizat� diferen�iat, în raport cu num�rul �i tipul intervalelor modale. Astfel, la seriile unimodale, valoarea modului este apropiat� de cea a mediei aritmetice atunci când unicul interval modal este situat în centrul intervalului de valori, iar seria este dispus� simetric în raport cu acesta (în cazul unei simetrii perfecte, valoarea modului ajunge chiar s� se confunde cu cea a mediei aritmetice). Petru seriile plurimodale cu un singur interval modal principal, valoarea modului din acesta este de asemenea apropiat� de cea a mediei aritmetice atunci când intervalul modal principal este situat în centrul seriei care are o dispunere simetric� (�i în acest caz, dac� simetria este perfect�, valoarea modului ajunge s� se confunde cu cea a mediei aritmetice). În ce prive�te seriile plurimodale cu mai multe intervale modale principale, rela�ia dintre valorile modurilor �i media aritmetic� este ceva mai complex� �i trebuie analizat� pe baza aspectelor concrete ale distribu�iilor de frecven�e. Pentru acest tip de serii poate fi men�ionat, ca un caz particular, distribu�ia în form� de U, la care media aritmetic� este egal dep�rtat� fa�� de cele dou� valori ale modului.

La fel ca în cazul valorii mediane, compara�iile dintre valoarea unui mod �i cea a mediei aritmetice servesc în evaluarea simetriei unei serii statistice, aspect care va fi abordat într-un capitol ulterior.

Page 82: STEFANESCU - B S - PIED - uni-muenchen.de9.3. Analiza legturilor dintre variabile prin intermediul regresiei 9.4. Indicatori de apreciere a sensului i intensit ii legturilor dintre

Capitolul 5 - Dispersia seriilor statistice

5.1. Coordonate ale studiului dispersiei seriilor

statistice

În capitolele anterioare s-a men�ionat c� valorile tipice ale unei

serii statistice sunt cu atât mai pu�in reprezentative cu cât împr��tierea (sau dispersia) seriei este mai mare. Astfel, dispersia unei serii devine un indicator important, cu toat� c� nu singurul, al reprezentativit��ii valorilor tipice.

O cercetare statistic� riguroas� î�i propune ca în afar� de a studia reprezentativitatea valorilor tipice în termeni generali sau intuitivi, s� transpun� acest aspect într-o form� cuantificabil�, care s� permit� compara�iile �i clasific�rile. Din acest motiv, în cercet�rile statistice este practic inerent� determinarea unor m�rimi numerice care exprim� dispersia seriilor. În general, aceste m�rimi sunt calculate pe baza diferen�elor (abaterilor) valorilor unei serii fa�� de anumite valori tipice, în special fa�� de media aritmetic�.

La o distribu�ie de frecven�e reprezentativitatea valorilor tipice este influen�at�, a�a cum s-a men�ionat în capitolul anterior, nu doar de dispersia centrelor de interval ci �i de reprezentativitatea pe care acestea, la rândul lor, o au în raport cu valorile din grupe. Din acest motiv, studiul reprezentativit��ii unei valori tipice pentru o distribu�ie de frecven�e poate cuprinde �i evaluarea dispersiei valorilor din fiecare grup�.

Page 83: STEFANESCU - B S - PIED - uni-muenchen.de9.3. Analiza legturilor dintre variabile prin intermediul regresiei 9.4. Indicatori de apreciere a sensului i intensit ii legturilor dintre

5.2. Indicatori ai dispersiilor seriilor statistice

În acest subcapitol vor fi prezentate succint cinci m�rimi

folosite destul de frecvent în practic� pentru evaluarea dispersiei: - abaterea medie liniar�; - varian�a; - abaterea medie p�tratic�; - coeficientul de varia�ie în raport cu abaterea medie liniar�; - coeficientul de varia�ie în raport cu abaterea medie p�tratic�.

5.2.1. Abaterea medie liniar� Abaterea medie liniar� este un indicator care exprim� nivelul

mediu al diferen�elor (abaterilor) dintre valorile unei serii �i o valoare tipic� a acesteia. De regul� abaterile sunt stabilite în raport cu media aritmetic� a seriei; ceva mai rar sunt calculate �i în func�ie de valoarea median�.

Media abaterilor fa�� de o valoare tipic� nu poate fi exprimat� pe baza simplei însum�ri a acestora întrucât diferen�ele pozitive �i cele negative s-ar anula reciproc (se poate chiar demonstra c� în cazul unei serii simple suma diferen�elor fa�� de media aritmetic� este nul�). Din acest motiv sunt folosite valorile absolute ale acestor diferen�e. În raport cu tipul seriilor statistice se pot delimita dou� modalit��i de determinare a abaterilor medii liniare:

a) pentru seriile simple; b) pentru distribu�iile heterograde.

a) Calculul abaterii medii liniare a unei serii simple, are la baz�

formula: N

xx

d

N

ioi

x

�=

= 10

(5.1.)

în care:

0xd este abaterea medie liniar� a unei serii simple în raport cu o

caracteristic� x; N este num�rul de unit��i statistice ale seriei; xi este valoarea caracteristicii x pentru o unitate statistic� i; 0x este media aritmetic� a seriei.

Page 84: STEFANESCU - B S - PIED - uni-muenchen.de9.3. Analiza legturilor dintre variabile prin intermediul regresiei 9.4. Indicatori de apreciere a sensului i intensit ii legturilor dintre

Exemplul 5.1. În tabelul 5.1. este prezentat� o serie statistic� simpl� care descrie productivitatea medie a muncii pentru un grup de �ase angaja�i ai unei firme. Se cere s� se calculeze abaterea medie liniar� a seriei.

Tabelul 5.1. Productivitatea medie a muncii pentru

un grup de angaja�i Nr. crt. Productivitatea medie a muncii

(xi) [RON/lun�] (0) (1) 1 700 2 700 3 630 4 870 5 620 6 680

Rezolvare: În tabelul 5.2. sunt prezentate valorile intermediare

utilizate în calculul abaterii medii liniare. Determinarea abaterii medii liniare necesit�, mai întâi, calculul

mediei aritmetice:

7006

200.410 ===�=

N

x

x

N

ii

RON/lun�

Pe baza valorilor intermediare calculate prin tabelul 5.1. poate

fi determinat� abaterea medie liniar� a seriei:

7,566

34010

0==

=�

=

N

xx

d

N

i

i

x RON/lun�,

ceea ce înseamn� c�, în medie, valorile seriei simple difer� cu 56,7 RON/lun� fa�� de media aritmetic�.

Page 85: STEFANESCU - B S - PIED - uni-muenchen.de9.3. Analiza legturilor dintre variabile prin intermediul regresiei 9.4. Indicatori de apreciere a sensului i intensit ii legturilor dintre

Tabelul 5.2. Valori intermediare utilizate în calculul abaterii medii liniare a unei serii simple

RON/lun�

Nr. crt.

xi Abatere fa�� de media

aritmetic� ( )oi xx − oi xx −

(0) (1) (3) (4) 1 700 – – 2 700 – – 3 630 - 70 70 4 870 170 170 5 620 - 80 80 6 680 - 20 20

Total 4.200 × 340

Simbol pentru total

�=

n

iix

1

× �Ν

=

−1

0i

i xx

b) Determinarea abaterii medii liniare a unei distribu�ii

heterograde, are la baz� rela�ia:

=

=

⋅−

=x

x

K

i

xi

K

i

xii

x

n

nxx

d

1

1

'

(5.2.)

în care: - xd este abaterea medie liniar� a distribu�iei heterograde; - Kx este num�rul de grupe formate în raport cu caracteristica

x; - '

ix este centrul intervalului de varia�ie al unei grupe i; - x este media aritmetic� a distribu�iei heterograde în raport

cu caracteristica x; - x

in este frecven�a absolut� a grupei i. Exemplul 5.2. În tabelul 5.3. este prezentat� o distribu�ie

heterograd� care descrie repartizarea unui grup de întreprinderi în raport cu cifra de afaceri. Se cere s� se calculeze abaterea medie liniar� a seriei.

Page 86: STEFANESCU - B S - PIED - uni-muenchen.de9.3. Analiza legturilor dintre variabile prin intermediul regresiei 9.4. Indicatori de apreciere a sensului i intensit ii legturilor dintre

Tabelul 5.3. Repartizarea unui grup de întreprinderi în raport cu cifra de afaceri

Nr. crt.

Interval de varia�ie [mil. euro]

Frecven�� absolut� ( )x

in (0) (1) (2) 1 [2 ; 6) 15 2 [6 ; 10) 25 3 [10 ; 14) 30 4 [14 ; 18) 20 5 [18 ; 22) 10

Rezolvare: În tabelul 5.4. sunt prezentate valorile intermediare

care servesc în determinarea abaterii medii liniare. Ca �i în exemplul precedent, determinarea abaterii medii liniare demareaz� cu calculul

mediei aritmetice: 4,11100

140.1'

1

1 ==

=

=

=

x

x

K

i

xi

K

i

xi

n

nx

x mil. euro

Tabelul 5.4. Valori intermediare utilizate în calculul abaterii medii

liniare a unei distribu�ii heterograde

Nr. crt.

Interval de varia�ie

[mil. euro]

Frecven�� absolut�

( )xin

Centru de

interval ( )'ix

[mil. euro]

( )xii nx ⋅'

Abatere fa�� de media aritmetic�

( )xxi −'

xii nxx ⋅−'

(0) (1) (2) (3) (4) = (3) × (2) (5) (6) = |(5)|×(2) 1 [2 ; 6) 15 4 60 - 7,4 111 2 [6 ; 10) 25 8 200 - 3,4 85 3 [10 ; 14) 30 12 360 0,6 18 4 [14 ; 18) 20 16 320 4,6 92 5 [18 ; 22) 10 20 200 8,6 86 6 Total 100 × 1.140 × 392

7 Simbol pentru total

�=

xK

i

xin

1

× �=

⋅xK

i

xii nx

1

' × ( )�

=

⋅−xK

i

xii nxx

1

'

În raport cu valorile intermediare calculate prin tabelul 5.4. se

determin� abaterea medie liniar� a distribu�iei heterograde:

Page 87: STEFANESCU - B S - PIED - uni-muenchen.de9.3. Analiza legturilor dintre variabile prin intermediul regresiei 9.4. Indicatori de apreciere a sensului i intensit ii legturilor dintre

92,3100

392

1

1

'

==

⋅−

=

=

=

x

x

K

i

xi

K

i

xii

x

n

nxx

d mil. euro,

ceea ce înseamn� c�, în medie, cifra de afaceri a unei firme difer� cu 3,92 milioane de euro fa�� de cifra de afaceri medie.

Abaterea medie liniar� a unei serii poate lua, dup� cum se poate observa din formulele sale de calcul, doar valori pozitive. Cu cât valoarea sa este mai mare cu atât seria este mai dispersat�, iar media sa aritmetic� este mai pu�in reprezentativ�. Totu�i, faptul c� aceast� m�rime nu îmbrac� o form� relativ� induce unele dificult��i în compara�iile dintre seriile statistice sau în clasificarea acestora în raport cu dispersia.

5.2.2. Varian�a Varian�a unei serii este o m�rime care exprim� nivelul mediu al

p�tratelor diferen�elor dintre valorile seriei �i media aritmetic� a acesteia. Prin utilizarea p�tratelor diferen�elor nu mai este posibil� anularea reciproc� a acestora, astfel încât nu mai este necesar� folosirea valorilor absolute. La fel ca în cazul abaterii medii liniare, calculul varian�ei se diferen�iaz�, în raport cu tipurile de serii statistice, în dou� forme:

a) pentru seriile simple; b) pentru distribu�iile heterograde.

a) Calculul varian�ei unei serii simple are la baz� formula:

( )

N

xxN

ii

x

�=

= 1

20

20

σ (5.3.)

unde 20xσ este varian�a seriei simple.

Exemplul 5.3. Se cere s� se calculeze varian�a seriei simple prezentate în tabelul 5.1.

Rezolvare: În exemplul 5.1. a fost calculat� deja media aritmetic� a seriei simple 0x = 700 RON/lun�. Pe baza acesteia sunt calculate valorile intermediare pentru determinarea varian�ei, care sunt prezentate în tabelul 5.5. În raport cu acestea rezult� o valoare a varian�ei:

Page 88: STEFANESCU - B S - PIED - uni-muenchen.de9.3. Analiza legturilor dintre variabile prin intermediul regresiei 9.4. Indicatori de apreciere a sensului i intensit ii legturilor dintre

( )( )21

20

2 RON/lun�7,766.66

600.400

==

=�=

N

xxN

ii

xσ , ceea ce

înseamn� c� diferen�a la p�trat a valorilor seriei fa�� de media aritmetic� are un nivel mediu de 6.766,7 (RON/lun�)2.

Tabelul 5.5. Valori intermediare utilizate în calculul varian�ei unei

serii simple Nr. crt.

xi [RON/lun�] 0xxi − [RON/lun�]

( )20xxi − [RON2/lun�2]

(0) (1) (2) (3) = (2)2

1 700 – 2 700 – 3 630 - 70 4 900 4 870 170 28 900 5 620 - 80 6 400 6 680 - 20 400

Total 4 200 × 40 600

Simbol pentru total

�=

n

iix

1

× ( )�=

−N

ii xx

1

20

b) Determinarea varian�ei unei distribu�ii heterograde se

bazeaz� pe rela�ia:

( )

=

=

⋅−

=x

x

K

i

xi

K

i

xii

x

n

nxx

1

1

2'

2σ (5.4.)

unde 2xσ este varian�a distribu�iei heterograde.

Exemplul 5.4. Se cere s� se calculeze varian�a distribu�iei

heterograde prezentat� în tabelul 5.3. Rezolvare: �i în acest caz, vom profita de faptul c� într-un

exemplu anterior a fost calculat� media aritmetic� a distribu�iei heterograde, 4,11=x mil. euro.

Page 89: STEFANESCU - B S - PIED - uni-muenchen.de9.3. Analiza legturilor dintre variabile prin intermediul regresiei 9.4. Indicatori de apreciere a sensului i intensit ii legturilor dintre

Tabelul 5.6. Valori intermediare utilizate în calculul varian�ei unei

distribu�ii heterograde

Nr. crt.

Interval de varia�ie

[mil. euro]

xxi −' [mil. euro]

xin ( )2' xxi −

[(mil. euro)2] ( ) x

ii nxx ⋅−2'

[(mil. euro)2]

(0) (1) (3) (2) (4) = (2)2 (5) = (4) × (3) 1 [2 ; 6) - 7,4 15 54,76 821,4 2 [6 ; 10) - 3,4 25 11,56 289,0 3 [10 ; 14) 0,6 30 0,36 10,8 4 [14 ; 18) 4,6 20 21,16 423,2 5 [18 ; 22) 8,6 10 73,96 739,6 6 Total × 100 × 2.284

7 Simbol pentru total

× �=

xK

i

xin

1

× ( )�=

⋅−xK

i

xii nxx

1

2'

În tabelul 5.6. sunt prezentate valorile intermediare în calculul

varian�ei. În raport cu acestea a rezultat o valoare a varian�ei:

( )84,22

100

284.2

1

1

2'

2 ==

⋅−

=

=

=

x

x

K

i

xi

K

i

xii

x

n

nxx

σ (mil. euro)2, ceea ce

înseamn� c� p�tratul diferen�ei dintre cifra de afaceri a unei firme �i media cifrei de afaceri din cadrul grupului de firme are un nivel mediu de 22,84 (mil. euro)2.

Din formulele de calcul ale varian�ei se poate observa c� aceast� m�rime nu poate lua decât valori pozitive. O serie statistic� este cu atât mai dispersat� cu cât varian�a sa este mai mare.

Modul de calcul al varian�ei induce unele deosebiri fa�� de abaterea medie liniar� în ce prive�te exprimarea dispersiei unei serii statistice. Faptul c� se opereaz� cu abateri ridicate la p�trat face ca unitatea de m�sur� a varian�ei s� fie reprezentat� de p�tratul unit��ii de m�sur� a caracteristicii. În plus, aceea�i ridicare la p�trat face ca abaterile mari s� contribuie la valoarea varian�ei în propor�ii mult mai mari decât abaterile mici. În aceste condi�ii, varian�a exprim� într-o m�sur� mai mare fa�� de abaterea medie liniar� amploarea dispersiei unei serii statistice.

Page 90: STEFANESCU - B S - PIED - uni-muenchen.de9.3. Analiza legturilor dintre variabile prin intermediul regresiei 9.4. Indicatori de apreciere a sensului i intensit ii legturilor dintre

La fel ca în cazul abaterii medii liniare, faptul c� varian�a are o form� absolut� cauzeaz� unele dificult��i în compara�iile dintre seriile statistice sau în clasificarea acestora pe baza dispersiei.

5.2.3. Abaterea medie p�tratic� Abaterea medie p�tratic� are semnifica�ia unei medii de ordinul

doi (numit� �i medie p�tratic�) a diferen�elor dintre valorile unei serii statistice �i media aritmetic� a acesteia. În fapt, abaterea medie p�tratic� poate fi ob�inut�, atât pentru seriile simple cât �i pentru distribu�iile heterograde, extr�gând r�d�cina p�trat� din valoarea varian�ei. La seriile simple, abaterea medie p�trat�, notat� cu

0xσ ,

este dat� de rela�ia:

( )21

20

00 x

N

ii

xN

xx

σσ =

=�= (5.5.)

Pentru o distribu�ie heterograd�, abaterea medie p�tratic� este notat� cu xσ �i poate fi calculat� prin formula:

( )2

1

1

2'

xK

i

xi

K

i

xii

xx

x

n

nxx

σσ =

⋅−

=

=

= (5.6.)

Exemplul 5.5. Se cere s� se calculeze abaterile medii p�tratice ale seriilor prezentate în tabelele 5.1. �i 5.3.

Rezolvare: Pentru ambele serii, determinarea abaterii medii p�tratice este simpl� în condi�iile în care în exemplele anterioare au fost calculate varian�ele. Pentru seria simpl� a rezultat o abatere medie p�tratic�:

26,827,766.6200

=== xxσσ RON/lun�

Pentru distribu�ia heterograd�, s-a ob�inut o abatere medie p�tratic�:

78,484,222 === xx σσ mil. euro.

Formulele de calcul asociate abaterii medii p�tratice indic� faptul c� aceast� m�rime nu poate avea decât valori pozitive. Cu cât o

Page 91: STEFANESCU - B S - PIED - uni-muenchen.de9.3. Analiza legturilor dintre variabile prin intermediul regresiei 9.4. Indicatori de apreciere a sensului i intensit ii legturilor dintre

serie statistic� este mai dispersat�, cu atât abaterea medie p�tratic� a acesteia va fi mai mare.

Media p�tratic� este, în mod obligatoriu, mai mare sau egal� fa�� de media aritmetic�, ceea ce face ca întotdeauna abaterea medie p�tratic� a unei serii s� fie mai mare sau egal� fa�� de abaterea medie liniar� a seriei. La fel ca în cazul varian�ei, abaterile mari contribuie la valoarea abaterii medii p�tratice într-o propor�ie mult mai mare decât abaterile mici. În consecin��, abaterea medie p�tratic� exprim�, în compara�ie cu abaterea medie liniar�, într-o m�sur� mult mai mare amploarea dispersiei unei serii statistice. Abaterea medie p�tratic� se deosebe�te de varian�� prin faptul c� este exprimat� în unitatea de m�sur� a caracteristicii, ceea ce face mai facil� aprecierea nivelului abaterilor. La fel ca �i abaterea medie liniar� sau varian�a, abaterea medie p�tratic� este o m�rime absolut�, ceea ce face foarte dificil� compara�ia dintre seriile statistice sau clasificarea acestora din perspectiva dispersiei.

5.2.4. Coeficientul de varia�ie în raport cu abaterea medie liniar�

Coeficientul de varia�ie în raport cu abaterea medie liniar� este

o m�rime relativ�, în form� procentual�, ob�inut� prin raportarea abaterii medii liniare la media aritmetic� în valoare absolut�. Pentru o serie simpl�, coeficientul de varia�ie în raport cu abaterea medie

liniar�, notat cu 0d

xCV , este dat de formula:

1000

00 ×=x

dCV

xd

x (5.7.)

Coeficientul de varia�ie în raport cu abaterea medie liniar� al

unei distribu�ii heterograde, notat cu dxCV , poate fi calculat prin

formula:

100×=x

dCV xd

x (5.8.)

Evident, o astfel de m�rime nu poate avea decât valori pozitive, iar seria este cu atât mai dispersat� cu cât valoarea este mai mare.

Calitatea de m�rime relativ� faciliteaz� utilizarea acestui indicator în compara�iile �i clasific�rile seriilor statistice din perspectiva dispersiei. Astfel, se apreciaz� c� o valoare mai mare de

Page 92: STEFANESCU - B S - PIED - uni-muenchen.de9.3. Analiza legturilor dintre variabile prin intermediul regresiei 9.4. Indicatori de apreciere a sensului i intensit ii legturilor dintre

30% indic� o serie cu omogenitate redus� pentru care media aritmetic� nu este prea reprezentativ�.

Exemplul 5.6. Se cere s� se aprecieze reprezentativitatea

mediilor aritmetice, pe baza coeficientului de varia�ie în raport cu abaterea medie liniar�, pentru seriile prezentate în tabelele 5.1. �i 5.3. Rezolvare: Calculul celor dou� valori este destul de facil, în condi�iile în care atât mediile aritmetice cât �i abaterile medii liniare au fost determinate în exemple anterioare.

Coeficientul de varia�ie în raport cu abaterea medie liniar� al seriei simple are valoarea:

%1,8100700

7,56100

0

00 =×=×=x

dCV

xd

x

ceea ce indic� o serie cu omogenitate semnificativ�, pentru care media aritmetic� este reprezentativ�.

Pentru distribu�ia heterograd�, coeficientul de varia�ie în raport cu abaterea medie liniar� are valoarea:

%4,341004,11

92,3100 =×=×=

x

dCV xd

x ,

ceea ce indic� o omogenitate relativ redus� a seriei, pentru care media aritmetic� nu este foarte reprezentativ�.

5.2.5. Coeficientul de varia�ie în raport cu abaterea medie p�tratic�

Coeficientul de varia�ie în raport cu abaterea medie p�tratic�,

propus în anul 1896 de c�tre statisticianul Karl Pearson, este o alt� m�rime relativ�, în form� procentual� care m�soar� dispersia unei serii statistice. Acest indicator este ob�inut prin raportarea abaterii medii p�tratice la valoarea absolut� a mediei aritmetice. Pentru o serie simpl�, coeficientul de varia�ie în raport cu abaterea medie p�tratic�, notat cu 0σ

xCV , poate fi calculat prin formula:

1000

00 ×=x

CVx

x

σσ (5.9.)

Page 93: STEFANESCU - B S - PIED - uni-muenchen.de9.3. Analiza legturilor dintre variabile prin intermediul regresiei 9.4. Indicatori de apreciere a sensului i intensit ii legturilor dintre

Coeficientul de varia�ie în raport cu abaterea medie p�tratic� al unei distribu�ii heterograde, notat cu σ

xCV este dat de rela�ia:

100×=x

CV xx

σσ (5.10)

Din formulele de calcul se poate observa c� aceast� m�rime nu poate avea decât valori pozitive. Cu cât valoarea sa este mai mare cu atât seria este mai dispersat�. În condi�iile în care abaterea medie p�tratic� este mai mare sau egal� decât abaterea medie liniar� �i coeficientul de varia�ie în raport cu abaterea medie p�tratic� va fi întotdeauna mai mare sau cel mult egal fa�� de coeficientul de varia�ie în raport cu abaterea medie liniar�.

Fiind o m�rime relativ�, coeficientul de varia�ie în raport cu abaterea medie p�tratic� este utilizat frecvent în compara�iile �i clasific�rile seriilor statistice din perspectiva dispersiei. Astfel, se apreciaz� c� atunci când valoarea sa dep��e�te nivelul de 40%, seria statistic� este pu�in omogen�, iar media sa aritmetic� nu este prea reprezentativ�. Aprecierea dispersiei pe baza coeficientului de varia�ie în raport cu abaterea medie p�tratic� este considerat� mai riguroas� decât cea realizat� prin coeficientul de varia�ie în raport cu abaterea medie liniar� în condi�iile în care abaterea medie p�tratic� reflect� amploarea dispers�rii într-o m�sur� mai mare decât abaterea medie liniar�.

Exemplul 5.7. Se cere s� se aprecieze, pe baza coeficientului

de varia�ie în raport cu abaterea medie p�tratic�, reprezentativitatea mediilor aritmetice ale seriilor statistice prezentate în tabelele 5.1. �i 5.3.

Rezolvare: Cele dou� valori pot fi determinate destul de simplu, pe baza mediilor aritmetice �i a abaterilor medii p�tratice calculate în exemplele anterioare.

Pentru seria simpl�, coeficientul de varia�ie în raport cu abaterea medie p�tratic� are valoarea:

%75,11100700

26,82100

0

00 =×=×=x

CVx

x

σσ

ceea ce înseamn� c� omogenitatea seriei este semnificativ�, iar media aritmetic� are o reprezentativitate mare. Pentru distribu�ia heterograd� se determin� un coeficient de varia�ie în raport cu abaterea medie p�tratic�:

Page 94: STEFANESCU - B S - PIED - uni-muenchen.de9.3. Analiza legturilor dintre variabile prin intermediul regresiei 9.4. Indicatori de apreciere a sensului i intensit ii legturilor dintre

%9,411004,11

78,4100 =×=×=

xCV x

x

σσ

ceea ce indic� o slab� omogenitate a seriei �i o reprezentativitate redus� a mediei aritmetice.

Page 95: STEFANESCU - B S - PIED - uni-muenchen.de9.3. Analiza legturilor dintre variabile prin intermediul regresiei 9.4. Indicatori de apreciere a sensului i intensit ii legturilor dintre

Capitolul 6 - Asimetria �i boltirea seriilor statistice

6.1. Conceptul de asimetrie a seriilor statistice

O valoare medie a unei serii statistice exprim� rezultatul

factorilor esen�iali de influen�� asupra fenomenului colectiv de influen�� asupra fenomenului colectiv studiat. Abaterile de la medie ale celorlalte valori ale seriei exprim� impactul pe care al�i factori, întâmpl�tori, îl au asupra fenomenului. Atunci când influen�a factorilor întâmpl�tori se produce cu regularitate, valorile seriei sunt dispuse simetric fa�� de medie. În schimb, atunci când aceast� influen�� se manifest� în mod neregulat, seria este asimetric� în raport cu media. Studiul asimetriei seriilor statistice are aplica�ii practice îndeosebi în cazul distribu�iilor heterograde, fiind folosit la asocierea cu una dintre formele de abstractizare a seriilor: distribu�ia în form� de J, distribu�ia în form� de U, distribu�ia în form� de clopot etc.

Cel mai adesea sunt folosite asocierile cu o distribu�ie în form� de clopot, care reflect� o lege de reparti�ie normal� ce caracterizeaz� frecvent manifest�rile fenomenelor colective. Dup� cum se �tie, o astfel de serie este perfect simetric�, astfel încât studiul unei distribu�ii heterograde poate servi în evaluarea gradului în care seria difer� de o distribu�ie în form� de clopot. În afara distribu�iilor heterograde, cercetarea asimetriei poate fi aplicat� �i la seriile simple, mai ales atunci când se încearc� asocierea acestora cu legi de distribu�ie normal�.

În studiul asimetriei unei serii statistice sunt abordate mai multe aspecte: m�sura în care aceasta este îndep�rtat� de o dispunere simetric� a valorilor, preponderen�a valorilor mai mici sau, dimpotriv�, mai mari fa�� de medie etc.

Rigorile unei cercet�ri statistice impun folosirea unor m�rimi numerice prin care aceste aspecte s� poat� fi cuantificate iar seriile s� poat� fi comparate �i clasificate.

Page 96: STEFANESCU - B S - PIED - uni-muenchen.de9.3. Analiza legturilor dintre variabile prin intermediul regresiei 9.4. Indicatori de apreciere a sensului i intensit ii legturilor dintre

6.2. Evaluarea asimetriei seriilor statistice

În acest subcapitol vor fi prezentate succint dou� modalit��i de

evaluare a asimetriei unei serii statistice: - prin compara�ia dintre media aritmetic� �i valoarea modului; - prin compara�ia dintre media aritmetic� �i valoarea

median�.

6.2.1. Evaluarea asimetriei prin compara�ia dintre media aritmetic� �i valoarea modului

Cercetarea asimetriei seriilor statistice pe baza compara�iei dintre media aritmetic� �i valoarea modului este indicat� îndeosebi în situa�ia distribu�iilor unimodale. În acest caz modul are semnifica�ia celui mai probabil rezultat iar atunci când factorii întâmpl�tori influen�eaz� în mod regulat fenomenul studiat simetria seriei statistice se manifest� prin egalitatea dintre mod �i media aritmetic�. Când îns� factorii întâmpl�tori se manifest� în mod neregulat, asimetria seriei se poate reflecta printr-o valoare a modului diferit� fa�� de media aritmetic�. Aprecierea asimetriei pe baza compara�iei dintre media aritmetic� �i mod se poate realiza �i pe cale grafic�, reprezentându-se seriile statistice prin curbe sau poligoane de frecven�e, pentru care valoarea modului corespunde celui mai înalt punct al graficului (fig. 6.1.). Totu�i, reprezent�rile grafice nu permit cuantificarea asimetriei, astfel încât este necesar� utilizarea unor m�rimi numerice, calculate pe baza celor dou� valori tipice.

Diferen�a dintre media aritmetic� �i valoarea modului este o m�rime absolut�, greu de utilizat în compara�iile dintre seriile statistice sau în clasificarea acestora din perspectiva asimetriei. Pentru astfel de situa�ii se recomand� utilizarea unor m�rimi relative, a�a cum este coeficientul de asimetrie în raport cu modul, propus de Karl Pearson. Acest indicator, notat cu o

x

M

asC , poate fi ob�inut raportând la

Page 97: STEFANESCU - B S - PIED - uni-muenchen.de9.3. Analiza legturilor dintre variabile prin intermediul regresiei 9.4. Indicatori de apreciere a sensului i intensit ii legturilor dintre

abaterea medie p�tratic� (atunci când aceasta nu este nul�), diferen�a dintre media aritmetic� �i mod:

x

xM

as

MXC o

x σ0−

= (6.1.)

Se poate demonstra c� diferen�a, în valoare absolut�, dintre

media aritmetic� �i mod este cel mult egal� cu abaterea medie p�tratic� a unei serii. Din acest motiv coeficientul de asimetrie al seriei nu poate lua decât valori cuprinse în intervalul [-1; 1].

În condi�iile în care abaterea medie p�tratic� nu poate avea decât valori pozitive rezult� c� valoarea coeficientului este pozitiv� sau negativ� dup� cum diferen�a dintre media aritmetic� �i valoarea modului este mai mare, respectiv, mai mic� decât zero. Astfel spus, când coeficientul este mai mare decât zero seria are asimetrie pozitiv� (spre dreapta) iar când este mai mic decât zero asimetria seriei este negativ� (spre stânga).

Acest indicator poate fi utilizat �i în cuantificarea intensit��ii asimetriei. Cu cât valorile sale absolute sunt mai apropiate de 1 cu atât asimetria este mai pronun�at�. Se obi�nuie�te ca intervalul [0; 1] pe care îl ocup� valorile absolute ale coeficientului s� fie împ�r�it în trei intervale de lungimi egale pentru fiecare dintre acestea fiind asociat, în raport cu dep�rtarea de valoarea 1, un grad de asimetrie: puternic�, moderat� sau slab�. Astfel, în func�ie de valorile coeficientului pot fi apreciate atât sensul cât �i intensitatea asimetriei unei serii (tabelul 6.1.).

Page 98: STEFANESCU - B S - PIED - uni-muenchen.de9.3. Analiza legturilor dintre variabile prin intermediul regresiei 9.4. Indicatori de apreciere a sensului i intensit ii legturilor dintre

xxM0

x xM0

xxM0

Fig. 6.1. Reprezentarea prin curbe de frecven�e a rela�iei dintre media

aritmetic� �i valoarea modului

Page 99: STEFANESCU - B S - PIED - uni-muenchen.de9.3. Analiza legturilor dintre variabile prin intermediul regresiei 9.4. Indicatori de apreciere a sensului i intensit ii legturilor dintre

Tabelul 6.1. Evaluarea asimetriei pe baza valorilor coeficientului de

asimetrie în raport cu modul

Nr. crt.

Valori ale coeficientului de asimetrie în raport

cu modul ( o

x

M

asC )

Sensul �i intensitatea asimetriei

1 -1 ≤ o

x

M

asC < 3

2− Negativ� puternic�

2 3

2− ≤ o

x

M

asC < 3

1− Negativ� moderat�

3 3

1− ≤ o

x

M

asC < 0 Negativ� slab�

4 o

x

M

asC = 0 Serie simetric�

5 0< o

x

M

asC ≤

3

1 Pozitiv� slab�

6 3

1< o

x

M

asC ≤

3

2 Pozitiv� moderat�

7 3

2< o

x

M

asC ≤ 1 Pozitiv� puternic�

Din compara�ia dintre media aritmetic� �i valoarea modului

unei serii pot rezulta trei situa�ii: - asimetrie pozitiv� (numit� �i asimetrie de dreapta), atunci

când media aritmetic� este mai mare decât modul seriei (fig. 6.1.a);

- asimetrie negativ� (numit� �i asimetrie de stânga), atunci când media aritmetic� este mai mic� decât modul seriei (fig. 6.1.b);

- simetria, atunci când media aritmetic� este egal� cu modul seriei (fig. 6.1.c).

Exemplul 6.1. În tabelul 6.2. este prezentat� o distribu�ie

heterograd� care descrie repartizarea punctelor de desfacere ale unei firme în raport cu vânz�rile realizate la un sortiment de produs. Se cere s� se aprecieze sensul �i intensitatea asimetriei seriei pe baza coeficientului de asimetrie în raport cu modul.

Page 100: STEFANESCU - B S - PIED - uni-muenchen.de9.3. Analiza legturilor dintre variabile prin intermediul regresiei 9.4. Indicatori de apreciere a sensului i intensit ii legturilor dintre

Rezolvare: Determinarea coeficientului de asimetrie în raport

cu modul presupune calculul prealabil al mediei aritmetice, al modului �i al abaterii medii p�tratice.

Tabelul 6.2. Repartizarea punctelor de desfacere ale unei

firme în raport cu vânz�rile realizate

Nr. crt.

Interval de varia�ie [mii buc.]

Frecven�� absolut� ( x

in ) (0) (1) (2) 1 (0 ; 40] 5 2 (40 ; 80] 9 3 (80 ; 120] 15 4 (120 ; 160] 14 5 (160 ; 200] 7

a) Calculul mediei aritmetice

Tabelul 6.3. Valori intermediare utilizate în calculul mediei aritmetice �i abaterii absolute medii p�tratice

Nr. crt.

Interval de

varia�ie [mii buc]

Frecven�� absolut�

(xin )

Centru de interval

('ix )

[mii buc]

'ix

xin

[mii buc]

('ix - X )

[mii buc]

('ix - X )

xin

[(mii buc)2]

(0) (1) (2) (3) (4) = (3) ×

(2) (5) (6) = (5)2 × (2)

1 (0 ; 40] 5 20 100 -87,2 38019,2 2 (40 ; 80] 9 60 540 -47,2 20050,6 3 (80 ; 120] 15 100 1500 -7,2 777,6 4 (120; 160] 14 140 1960 32,8 15061,8 5 (160; 200] 7 180 1260 72,8 37098,9 6 Total 50 × 5360 × 111008,1

7 Simbol pentru total

�=

xK

i

xin

1

× �=

xK

i

xiinx

1

' × ( )�

=

−xK

i

xii nXx

1

'

În tabelul 6.3. sunt prezentate valorile intermediare care servesc

în calculul mediei aritmetice a seriei. Pe baza acestora rezult� o valoare a mediei aritmetice:

Page 101: STEFANESCU - B S - PIED - uni-muenchen.de9.3. Analiza legturilor dintre variabile prin intermediul regresiei 9.4. Indicatori de apreciere a sensului i intensit ii legturilor dintre

2,10750

5360

1

1

'

==

×

=

=

=Kx

i

xi

Kx

i

xii

n

nx

X mii buc��i

b) Calculul valorii modului seriei Intervalul modal al seriei (cu frecven�a maxim�) este (80; 120].

Modul seriei are valoarea:

3,11416

64080

21

110 0

=+

+=∆+∆

∆×+= − xM

xdXM mii buc��i

c) Calculul abaterii medii p�tratice Valorile intermediare utilizate în calculul abaterii medii

p�tratice sunt prezentate în tabelul 6.3. Pe baza acestora rezult� o valoare a abaterii medii p�tratice:

( )1,47

50

1,111008

1

1

'

==

=

=

=

x

x

K

i

xi

K

i

i

x

n

Xx

σ mii buc��i

d) Determinarea coeficientului de asimetrie în raport cu modul

Coeficientul are valoarea: 15,03,114

2,10700 −==−

=x

xM

as

MXC

x σ, ceea ce

semnific� o asimetrie negativ� slab�.

6.2.2. Evaluarea asimetriei prin compara�ia dintre media aritmetic� �i valoarea median�

Studiul asimetriei pe baza compara�iei dintre media aritmetic�

�i valoarea median� poate fi realizat atât pentru distribu�ii heterograde cât �i pentru seriile simple. Valoarea median�, care împarte o serie ordonat� în dou� grupe de frecven�e egale, se confund� cu media aritmetic� atunci când factorii întâmpl�tori influen�eaz� fenomenul studiat în mod regulat. Dac� ace�ti factori întâmpl�tori nu ac�ioneaz� cu regularitate, atunci asimetria seriei se manifest� printr-o valoare a mediei aritmetice diferit� fa�� de valoarea median�.

Diferen�ele dintre media aritmetic� �i valoarea median� au semnifica�ii similare diferen�elor dintre media aritmetic� �i valoarea

Page 102: STEFANESCU - B S - PIED - uni-muenchen.de9.3. Analiza legturilor dintre variabile prin intermediul regresiei 9.4. Indicatori de apreciere a sensului i intensit ii legturilor dintre

modului, evocate anterior. O serie are o asimetrie negativ� (de stânga) atunci când media aritmetic� este mai mic� decât valoarea median�, �i o asimetrie pozitiv� (de dreapta), atunci când media aritmetic� este mai mare decât valoarea median�.

Pentru cuantificarea intensit��ii asimetriei unei serii statistice poate fi folosit� o m�rime relativ�, numit� coeficient de asimetrie în

raport cu mediana. Acest indicator, notat cu e

x

M

asC , poate fi calculat

(atunci când abaterea medie p�tratic� a seriei nu este nul�) prin formula:

( )x

xeM

as

MXC e

x σ

−=

3 (6.2.)

Tabelul 6.4. Evaluarea asimetriei pe baza valorilor coeficientului de

asimetrie în raport cu mediana

Nr. crt.

Valori ale coeficientului de asimetrie în raport

cu mediana ( e

x

M

asC )

Sensul �i intensitatea asimetriei

1 -3 ≤ e

x

M

asC < -2 Negativ� puternic�

2 -2 ≤ e

x

M

asC < -1 Negativ� moderat�

3 -1≤ e

x

M

asC < 0 Negativ� slab�

4 e

x

M

asC = 0 Serie simetric�

5 0< e

x

M

asC ≤ 1 Pozitiv� slab�

6 1< e

x

M

asC ≤ 2 Pozitiv� moderat�

7 2< e

x

M

asC ≤ 3 Pozitiv� puternic�

În condi�iile în care abaterea medie p�tratic� este mai mare ca

zero, valoarea coeficientului este pozitiv� sau negativ� dup� cum diferen�a dintre media aritmetic� �i valoarea median� este pozitiv�, respectiv, negativ�. Rezult� c� asimetria este pozitiv� atunci când

Page 103: STEFANESCU - B S - PIED - uni-muenchen.de9.3. Analiza legturilor dintre variabile prin intermediul regresiei 9.4. Indicatori de apreciere a sensului i intensit ii legturilor dintre

coeficientul este mai mare ca zero �i negativ� atunci când coeficientul este mai mic decât zero.

Aceast� m�rime poate fi folosit� �i pentru cuantificarea intensit��ii asimetriei. Cu cât valorile sale absolute sunt mai mari, cu atât asimetria este mai pronun�at�. Se poate demonstra c� diferen�a, în valoare absolut�, dintre media aritmetic� �i valoarea median� este cel mult egal� cu abaterea medie p�tratic�, astfel încât valorile coeficientului se încadreaz� în intervalul [-3 ; 3].

Se obi�nuie�te, la fel ca în cazul m�rimii anterioare, ca intervalul [0 ; 3] pe care îl ocup� valorile absolute ale coeficientului, s� fie împ�r�it în trei intervale de lungimi egale iar pentru fiecare dintre acestea s� fie asociat, în func�ie de dep�rtarea fa�� de valoarea 3, un grad de asimetrie: puternic�, moderat� sau slab�.

La fel ca în cazul m�rimii precedente, valorile acestui coeficient pot fi folosite pentru a aprecia deopotriv� sensul �i intensitatea asimetriei seriilor statistice (tab. 6.4.).

Exemplul 6.2.: Se cere s� se analizeze asimetria seriei din

exemplul anterior pe baza coeficientului de asimetrie în raport cu mediana.

Rezolvare: Determinarea coeficientului presupune calculul prealabil al valorii mediane (media aritmetic�, �i abaterea medie p�tratic� au fost calculate în exemplul anterior) . În tabelul 6.5. sunt prezentate calculele intermediare pentru determinarea valorii mediane. Unitatea median� are valoarea:

5,252

150

2

11

=+

=

+���

����

=

�=

x

e

K

i

xi

M

x

n

U

Drept interval median a fost desemnat intervalul (80 ; 120]. Valoarea median� reprezint�:

7,11015

145,2540801

1 =−

+=−

+= −

− xM

CX

M

x

xMxe

e

eM

e

e n

NUdXM mii

buc��i Rezult� o valoare a coeficientului de asimetrie în raport cu

mediana: ( ) ( )

22,01,47

7,1102,10733−=

−=

−=

x

xeM

as

MXC e

x σ, ceea ce

semnific� o asimetrie slab�.

Page 104: STEFANESCU - B S - PIED - uni-muenchen.de9.3. Analiza legturilor dintre variabile prin intermediul regresiei 9.4. Indicatori de apreciere a sensului i intensit ii legturilor dintre

Tabelul 6.5. Valori intermediare utilizate în calculul

valorii mediane

Nr. crt.

Interval de varia�ie [mii buc]

Frecven�� absolut�

( xin )

Frecven�� absolut� cumulat� ( C

XeM

N1−)

(0) (1) (2) (3) 1 (0 ; 40] 5 5 2 (40 ; 80] 9 14 3 (80 ; 120] 15 29 4 (120 ; 160] 14 43 5 (160 ; 200] 7 50 6 Total 50 ×

7 Simbol pentru total �=

xK

i

xin

1

×

6.3. Boltirea distribu�iilor heterograde

6.3.1. Conceptul de boltire a unei distribu�ii heterograde

Boltirea (numit� �i kurtosisul) unei distribu�ii heterograde este o tr�s�tur� care se refer� la aplatizarea curbei asociate seriei. De regul�, acest aspect este folosit în aprecierea gradului în care o serie unimodal� se apropie de distribu�ia normal�. În acest scop, se ia drept baz� curba specific� unei reparti�ii normale, definindu-se în raport cu aceasta trei tipuri de distribu�ii:

- distribu�ii mezokurtice, pentru care curbele de frecven�e sunt asem�n�toare, în ceea ce prive�te aplatizarea, unei curbe de distribu�ie normal� (fig. 6.2.a);

- distribu�ii leptokurtice, la care curbele de frecven�e sunt mai ascu�ite fa�� de curba unei distribu�ii normale (fig. 6.2.b);

- distribu�ii platykurtice, pentru care curbele de frecven�e sunt mai turtite decât curba unei distribu�ii normale (fig. 6.2.c).

În general, se apreciaz� boltirea seriilor simetrice sau cu o asimetrie slab� �i relativ omogene, pentru celelalte serii compara�ia cu o distribu�ie normal� fiind mai pu�in relevant�.

Page 105: STEFANESCU - B S - PIED - uni-muenchen.de9.3. Analiza legturilor dintre variabile prin intermediul regresiei 9.4. Indicatori de apreciere a sensului i intensit ii legturilor dintre

xxeMxM0

xxeM

xM0

xxeM

xM0

Fig. 6.2. Tipuri de distribu�ii în raport cu aplatizarea curbelor Reprezent�rile grafice ale distribu�iilor, cu toarte c� eviden�iaz�

deosebirile dintre cele trei tipuri de distribu�ii, nu permit, totu�i, cuantificarea gradului în care o distribu�ie se apropie de legea de

Page 106: STEFANESCU - B S - PIED - uni-muenchen.de9.3. Analiza legturilor dintre variabile prin intermediul regresiei 9.4. Indicatori de apreciere a sensului i intensit ii legturilor dintre

reparti�ie normal�. Din acest motiv, într-o cercetare statistic� se recurge, de regul�, la exprimarea boltirii prin m�rimi numerice.

6.3.2. Evaluarea boltirii unei distribu�ii heterograde

În acest subcapitol, înainte de a trece la prezentarea propriu-zis� a unei m�rimi ce caracterizeaz� boltirea, consider�m necesar s� definim în prealabil no�iunea de momente centrate ale distribu�iilor

heterograde. Momentul centrat de ordin p al unei distribu�ii heterograde este o m�rime notat� cu pµ �i dat� de rela�ia:

( )

=

=

×−

=x

x

K

i

xi

K

i

xi

p

i

p

n

nxx

1

1

'

µ (6.3.)

Pe baza momentelor centrate ale unei distribu�ii heterograde poate fi determinat un indicator de apreciere a boltirii, numit coeficientul pearsonian al boltirii. Aceast� m�rime, notat� cu

2xβ

poate fi calculat� raportând momentul centrat de ordinul patru la p�tratul momentului centrat de ordinul doi (adic� varian�a seriei):

22

4

2X

X

µβ = (6.4.)

Valoarea acestui coeficient are urm�toarele semnifica�ii: - pentru

2xβ < 3, distribu�ia este platykurtic�;

- pentru 2xβ = 3, distribu�ia este mezokurtic�;

- pentru 2xβ > 3, distribu�ia este leptokurtic�.

Exemplul 6.3. În tabelul 6.6. este prezentat� o distribu�ie

heterograd� care descrie productivitatea orar� a muncii la un grup de 100 de angaja�i au unei firme. Se cere s� se aprecieze boltirea seriei.

Page 107: STEFANESCU - B S - PIED - uni-muenchen.de9.3. Analiza legturilor dintre variabile prin intermediul regresiei 9.4. Indicatori de apreciere a sensului i intensit ii legturilor dintre

Tabelul 6.6. Repartizarea angaja�ilor unei firme în func�ie de productivitatea orar� a muncii

Nr. crt.

Interval de varia�ie [mii buc]

Frecven�� absolut� ( x

in ) (0) (1) (2) 1 (2 ; 4] 10 2 (4 ; 6] 25 3 (6 ; 8] 30 4 (8 ; 10] 25 5 (10 ; 12] 10 Rezolvare: Determinarea coeficientului impune calculul

prealabil al mediei aritmetice, al varian�ei �i al momentului centrat de ordinul patru. valorile intermediare utilizate în determinarea acestor m�rimi sunt prezentate în tabelele 6.7. �i 6.8.

Tabelul 6.7. Valori intermediare utilizate în calculul

mediei aritmetice

Nr. crt.

Interval de varia�ie [RON/h]

Frecven�� absolut�

( xin )

Centru de interval

( 'ix ) [RON/h]

'ix

xin

[RON/h]

(0) (1) (2) (3) (4) = (3) × (2) 1 (2 ; 4] 10 3 30 2 (4 ; 6] 25 5 125 3 (6 ; 8] 30 7 210 4 (8 ; 10] 25 9 225 5 (10 ; 12] 10 11 110 6 Total 100 × 700

7 Simbol

pentru total �=

xK

i

xin

1

×

�=

xK

i

ixi xn

1

'

Media aritmetic� a seriei are valoarea

Page 108: STEFANESCU - B S - PIED - uni-muenchen.de9.3. Analiza legturilor dintre variabile prin intermediul regresiei 9.4. Indicatori de apreciere a sensului i intensit ii legturilor dintre

7100

700

1

1

'

===

=

=

x

x

K

i

xi

K

i

xii

n

nx

X RON/h.

Momentul centrat de ordinul doi (varian�a) reprezint�:

( )2,5

100

520

1

1

2'

2==

×−

=

=

=

x

x

K

i

xi

K

i

xii

x

n

nxx

µ (RON/h)2

Tabelul 6.8. Valori intermediare utilizate în calculul varian�ei

�i momentului centrat de ordinul patru

Nr. crt.

Interval de

varia�ie [RON/h]

Frecven�� absolut�

( xin )

( 'ix - x

in ) [RON/h]

( 'ix - x

in )2 xin

[(RON/h)2] ( '

ix - xin )4 x

in [(RON/h)4]

(0) (1) (2) (3) (4) = (3)2 ×

(2) (5) = (3)4 ×

(2) 1 (2 ; 4] 10 -4 160 2560 2 (4 ; 6] 25 -2 100 400 3 (6 ; 8] 30 - - - 4 (8 ; 10] 25 2 100 400 5 (10 ; 12] 10 4 160 2560 6 Total 100 × 520 5920

7 Simbol pentru total

�=

xK

i

xin

1

× ( )�=

−xK

i

xii nxx

1

2' ( )�=

−xK

i

xii nxx

1

4'

Momentul centrat de ordinul patru are valoarea:

( )2,59

100

5920

1

1

4'

4==

×−

=

=

=

x

x

K

i

xi

K

i

xii

x

n

nxx

µ (RON/h)4

Rezult�:

Page 109: STEFANESCU - B S - PIED - uni-muenchen.de9.3. Analiza legturilor dintre variabile prin intermediul regresiei 9.4. Indicatori de apreciere a sensului i intensit ii legturilor dintre

( )19,2

2,5

2,5922

2

4

2===

X

X

µβ , ceea ce indic� o distribu�ie

platykurtic�.

Page 110: STEFANESCU - B S - PIED - uni-muenchen.de9.3. Analiza legturilor dintre variabile prin intermediul regresiei 9.4. Indicatori de apreciere a sensului i intensit ii legturilor dintre
Page 111: STEFANESCU - B S - PIED - uni-muenchen.de9.3. Analiza legturilor dintre variabile prin intermediul regresiei 9.4. Indicatori de apreciere a sensului i intensit ii legturilor dintre

Capitolul 7 - Legile fenomenelor colective

7.1. Caracteristici ale legilor fenomenelor

colective

Unul dintre scopurile majore ale cercet�rilor statistice este

reprezentat de identificarea legilor ce guverneaz� fenomenele colective. Pe baza acestora pot fi previzionate rezultatele posibile sau pot fi apreciate influen�ele unor factori. În cadrul statisticii matematice au fost propuse mai multe tipuri de func�ii care reflect� legile ce ac�ioneaz� asupra fenomenelor colective. Aceste func�ii nu pot fi îns� decât ni�te simplific�ri ale realit��ii întrucât nu iau în calcul decât aspectele considerate esen�iale ale fenomenelor studiate. În aceste condi�ii pot fi definite dou� forme ale valorilor parametrilor unui fenomen colectiv: - valori teoretice, date de func�iile matematice prin care sunt

reprezentate legile asociate fenomenului; - valori empirice, care reflect� datele statistice culese asupra

fenomenului. Valorile teoretice pot fi interpretate drept rezultate ale factorilor

esen�iali de influen�� în timp ce valorile empirice reflect� influen�a tuturor factorilor: atât a celor esen�iali cât �i a celor considera�i nerelevan�i. Dac� o lege asociat� unui fenomen colectiv reflect� în mare m�sur� realitatea atunci este de a�teptat ca impactul factorilor considera�i nerelevan�i s� nu fie semnificativ, astfel încât valorile teoretice s� fie apropiate de cele empirice. În aceast� logic�, se poate aprecia c� o valoare teoretic� este o aproximare a unei valori empirice ob�inut� prin neglijarea efectelor factorilor considera�i nerelevan�i (din acest motiv, valorile teoretice sunt numite �i valori ajustate).

În practic�, determinarea func�iei care reflect� o lege asociat� unui fenomen colectiv se desf��oar�, de regul�, în trei etape:

1) alegerea formei func�iei; 2) determinarea parametrilor func�iei; 3) evaluarea acurate�ei valorilor teoretice.

1) Pentru alegerea formei func�iei se porne�te de la unele aspecte ale seriei statistice care prezint� valorile empirice: omogenitatea, asimetria, boltirea �.a.m.d. Aceste aspecte pot fi relevate fie prin calcule analitice fie prin reprezent�ri grafice.

Page 112: STEFANESCU - B S - PIED - uni-muenchen.de9.3. Analiza legturilor dintre variabile prin intermediul regresiei 9.4. Indicatori de apreciere a sensului i intensit ii legturilor dintre

2) Pentru determinarea parametrilor func�iei se porne�te, de regul�, de la premisa c� valorile teoretice ale func�iei trebuie s� fie cât mai apropiate de valorile empirice. În practic�, pentru îndeplinirea acestei condi�ii sunt folosite câteva procedee matematice de minimizare a diferen�elor dintre cele dou� tipuri de valori.

3) Prin evaluarea acurate�ei valorilor teoretice se apreciaz� în fapt în ce m�sur� func�ia reflect� manifestarea fenomenului studiat �i, implicit, ce încredere se poate avea în calculele f�cute pe baza func�iei. De regul�, în aceast� opera�iune sunt luate ca reper diferen�ele dintre valorile teoretice �i cele empirice.

7.2. Distribu�ia normal�

7.2.1. Propriet��i ale distribu�iei normale O distribu�ie normal� caracterizeaz� fenomenele ce sunt

influen�ate de mai mul�i factori, dintre care nici unul nu are un impact predominant. Se consider� c� aceast� tr�s�tur� este comun� celor mai multe dintre fenomenele colective desf��urate în condi�ii naturale, ceea ce face ca distribu�ia normal� s� fie folosit� frecvent în cercet�rile statistice.

Unei serii statistice ideale, ale c�rei valori ar urma o distribu�ie normal�, îi poate fi asociat� o curb� de frecven�e cu ecua�ia:

( )2

2

2

2

1x

xx

x

eyσ

πσ

−−

⋅⋅

= (7.1.)

Din ecua�ia curbei de frecven�e rezult� mai multe propriet��i. Astfel, curba este simetric�, în form� de clopot, cu un maxim în dreptul mediei aritmetice ( x ) în raport cu care valorile scad continuu la stânga �i la dreapta, tinzând asimptotic c�tre axa absciselor (fig. 7.1.). În dreptul coordonatelor de abscise xx σ− �i xx σ+ , curba are dou� puncte de inflexiune. Se poate demonstra c� în intervalul [ xx σ− ; xx σ+ ] se afl� concentrat� 68,26% din suprafa�a delimitat� de curba de frecven�e, ceea ce indic� o omogenitate semnificativ� a seriei. În plus, din perspectiva boltirii, curba are semnifica�ia unei distribu�ii mezokurtice.

Page 113: STEFANESCU - B S - PIED - uni-muenchen.de9.3. Analiza legturilor dintre variabile prin intermediul regresiei 9.4. Indicatori de apreciere a sensului i intensit ii legturilor dintre

Din aceea�i ecua�ie (7.1.) reiese �i faptul c� o distribu�ie normal� poate fi definit� prin doi parametri: media aritmetic� x �i

varian�a 2xσ .

xx σ− xx σ+x

Fig. 7.1. Curba frecven�elor asociat� unei distribu�ii normale

7.2.2. Evaluarea probabilit��ilor prin distribu�ii normale Ecua�ia curbei frecven�elor unei serii statistice cu distribu�ia

normal� poate fi folosit� pentru atribuirea de probabilit��i în manifestarea unui fenomen colectiv. În acest scop, seria statistic� trebuie transpus� într-o variabil� aleatoare de tip continuu, care asociaz� probabilit��i intervalelor valorice ale seriei prin intermediul frecven�elor relative. Valorile variabilei aleatoare vor avea aceea�i

medie aritmetic� x �i aceea�i varian�� 2xσ pe care le are �i seria

statistic� din care provine. De asemenea, func�ia densit��ii probabilistice are ecua�ia curbei frecven�elor seriei, fiind definit� pe intervalul (- � ; + �). În aceste condi�ii, probabilitatea ca o valoare X a variabilei aleatoare s� fie mai mare decât un num�r x poate fi calculat� prin formula:

( ) ( )

( )

dxedxyPx

xX

x

x

xxXx�� ∞−

−−

∞−< ⋅⋅

== σ

πσ

2

2

1 (7.2.)

Calculul integralei din aceast� formul� poate fi destul de dificil, ceea ce a condus la dezvoltarea unor metode mai simple de

Page 114: STEFANESCU - B S - PIED - uni-muenchen.de9.3. Analiza legturilor dintre variabile prin intermediul regresiei 9.4. Indicatori de apreciere a sensului i intensit ii legturilor dintre

determinare a probabilit��ilor pentru distribu�iile normale. Cea mai des utilizat� dintre acestea are la baz� folosirea unei a�a-numite distribu�ii normale standard – un caz particular al distribu�iilor normale care are media aritmetic� nul� �i abaterea medie p�tratic� egal� cu 1 (fig. 7.2.).

Transformarea unei distribu�ii normale oarecare X într-o distribu�ie normal� standard Z are la baz� rela�ia:

x

xXZ

σ

−= (7.3.)

Pentru o distribu�ie normal� standard pot fi stabilite valori tabelate ale probabilit��ii ca valorile distribu�iei s� fie mai mari decât un num�r zi (aceast� probabilitate este propor�ional� cu suprafa�a ha�urat� din figura 7.3.). În tabelul 7.1. sunt prezentate câteva astfel de valori tabelate. Evident, dac� se cunoa�te o astfel de probabilitate,

( )izZP > se poate determina �i probabilitatea evenimentului opus: ( ) ( )ii zZPzZP >−=≤ 1 (7.4.)

Fig. 7.2. Curba de frecven�e a distribu�iei normale standard

Se poate demonstra c� probabilitatea ca valorile unei distribu�ii

s� se afle într-un interval (z1 ; z2) este dat� de rela�ia:

( ) ( ) ( )2121 zZPzZPzZzP >−>=<< (7.5.)

Page 115: STEFANESCU - B S - PIED - uni-muenchen.de9.3. Analiza legturilor dintre variabile prin intermediul regresiei 9.4. Indicatori de apreciere a sensului i intensit ii legturilor dintre

iz�

Fig. 7.3. Reprezentarea grafic� a probabilit��ii ca valorile unei distribu�ii normale standard s� fie mai mari decât un num�r z

Simetria graficului distribu�iei normale standard fa�� de punctul

de coordonat� zero pe abscis� face ca suprafa�a delimitat� la dreapta de un num�r pozitiv zi s� fie egal� cu suprafa�a delimitat� la stânga de un num�r negativ, egal cu primul în valoare absolut� (fig. 7.4.). Dac� se ia în considerare rela�ia dintre aceste suprafe�e �i probabilit��ile asociate distribu�iei normale standard rezult�:

( ) ( )ii zZPzZP −<=> (7.6.)

Tabelul 7.1. Valori tabelate ale probabilit��ilor specifice unei

distribu�ii normale standard

zi 0 0,25 0,5 0,75 1 P(Z > zi) 0,5000 0,4013 0,3085 0,2266 0,1587

Page 116: STEFANESCU - B S - PIED - uni-muenchen.de9.3. Analiza legturilor dintre variabile prin intermediul regresiei 9.4. Indicatori de apreciere a sensului i intensit ii legturilor dintre

iz�

�iz−

Fig. 7.4. Reprezentarea grafic� a probabilit��ilor ( )izZP > �i

( )izZP −< Estimarea probabilit��ilor pe baza distribu�iilor normale este

folosit� destul de frecvent în practic� pentru previziunea fenomenelor c�rora le poate fi asociat� o astfel de lege. În acest scop este necesar� cunoa�terea celor doi parametri ce definesc o distribu�ie normal�: media aritmetic� �i varian�a.

Exemplul 7.1. Managerii unei firme evalueaz� rentabilitatea unui sortiment de produs. Pe baza pre�ului �i a costurilor a fost identificat un prag de rentabilitate la nivelul vânz�rilor de 80 mii buc��i, sub care realizarea sortimentului de produs devine nerentabil�. Din datele culese asupra cererii poten�iale a rezultat c� în anul viitor vânz�rile vor urma o distribu�ie normal� cu media aritmetic� de 90 mii buc��i �i varian�a de 400 (mii buc��i)2. Se cere s� se estimeze probabilitatea ca realizarea sortimentului de produs s� se soldeze cu pierderi.

Page 117: STEFANESCU - B S - PIED - uni-muenchen.de9.3. Analiza legturilor dintre variabile prin intermediul regresiei 9.4. Indicatori de apreciere a sensului i intensit ii legturilor dintre

� ����� ���� ��

���������

Fig. 7.5. Distribu�ia normal� a vânz�rilor unui sortiment de produs Rezolvare: A estima probabilitatea ca realizarea produsului s�

se soldeze cu pierderi înseamn�, în fapt, a calcula probabilitatea ca nivelul vânz�rilor s� fie mai mic decât 80 mii buc��i (fig. 7.5.). Pentru aceasta este necesar� determinarea, în prealabil, a abaterii medii p�tratice:

204002 === xx σσ mii buc��i

Calculul probabilit��ii pe baza valorilor tabelate necesit� trecerea la o distribu�ie normal� standard prin transformarea:

5,020

908011 −=

−=

−=

x

xxz

σ

Probabilitatea ca vânz�rile s� fie mai mici de 80 mii buc��i este echivalent�, pentru distribu�ia normal� standard, cu probabilitatea ca valoarea variabilei aleatoare Z s� fie mai mic� decât z1 = – 0,5. Dup� cum se poate remarca în figura 7.6., aceast� probabilitate este de fapt egal� cu probabilitatea ca valorile distribu�iei normale standard s� fie mai mari decât z2 = 0,5. Valoarea tabelat� a acesteia este 0,3085 ceea ce indic� c� o probabilitate de 30,85% ca realizarea sortimentului de produs s� se soldeze cu pierderi.

Page 118: STEFANESCU - B S - PIED - uni-muenchen.de9.3. Analiza legturilor dintre variabile prin intermediul regresiei 9.4. Indicatori de apreciere a sensului i intensit ii legturilor dintre

Fig. 7.6. Distribu�ia normal� standard a vânz�rilor unui sortiment de

produs

Page 119: STEFANESCU - B S - PIED - uni-muenchen.de9.3. Analiza legturilor dintre variabile prin intermediul regresiei 9.4. Indicatori de apreciere a sensului i intensit ii legturilor dintre

Capitolul 8 - Cercetarea statistic� prin sondaj

8.1. Coordonate ale cercet�rii statistice prin sondaj

Într-un capitol anterior a fost prezentat sondajul drept o

modalitate de culegere a datelor statistice ce vizeaz� doar o parte (numit� e�antion) din popula�ia studiat�. În acest caz, valorile m�rimilor ce caracterizeaz� popula�ia nu pot fi cunoscute cu certitudine ci sunt doar estimate pe baza valorilor determinate pentru e�antion. Trecerea de la valorile certe ale parametrilor unui e�antion la valorile probabile ale parametrilor popula�iei este cunoscut� sub denumirea de inferen�� statistic�.

O cercetare statistic� riguroas� presupune cunoa�terea gradului de încredere ce se poate avea în valorile estimate ale parametrilor ce caracterizeaz� popula�ia studiat�. Din acest motiv, estim�rile sunt transpuse adeseori sub forma unor distribu�ii probabilistice.

Despre valorile parametrilor calcula�i pentru un e�antion se spune c� au calitatea de estimatori ai valorilor parametrilor

popula�iei, ceea ce înseamn� c� pot servi în estimarea acestora. Un estimator este numit nedeplasat atunci când valoarea sa este egal� cu media aritmetic� a distribu�iei probabilistice asupra parametrului asociat popula�iei. Atunci când cele dou� valori difer�, estimatorul este numit deplasat. Drept parametri de caracterizare a unei popula�ii sunt folosi�i diferi�i indicatori statistici, dintre care se remarc� prin frecven�a utiliz�rii media aritmetic� (notat� cu sx în cazul sondajului �i cu sµ în cazul popula�iei) �i propor�ia unei caracteristici în ansamblul popula�iei (notat� cu pe în cazul e�antionului �i cu pp în cazul popula�iei). Pentru cele dou� m�rimi, valorile determinate pentru e�antioane pot fi considerate drept estimatori nedeplasa�i pentru valorile probabile ale parametrilor popula�iei.

Un aspect important al inferen�ei statistice este reprezentat de cuantificarea acurate�ei estim�rilor. M�sura preciziei unei cercet�ri statistice prin sondaj poate fi stabilit� exact prin intermediul unui indicator numit eroare efectiv� de inferen��, notat cu eef �i dat de rela�ia:

θθ ˆ−=efe (8.1.)

în care: - θ este valoarea real� a unui parametru ce caracterizeaz� o

popula�ie statistic�;

Page 120: STEFANESCU - B S - PIED - uni-muenchen.de9.3. Analiza legturilor dintre variabile prin intermediul regresiei 9.4. Indicatori de apreciere a sensului i intensit ii legturilor dintre

- θ este valoarea estimat� a parametrului pe baza datelor culese prin sondaj.

Din nefericire, cel mai adesea eroarea efectiv� de inferen�� nu poate fi calculat� întrucât valoarea real� a parametrului ce caracterizeaz� popula�ia este necunoscut� (dac� ar fi cunoscut� nu ar mai fi nevoie de sondaj). În aceste condi�ii, eroarea efectiv� de inferen�� poate fi doar estimat�. În evaluarea acesteia trebuie lua�i în considerare câ�iva factori care o pot influen�a:

1. reprezentativitatea e�antionului pentru popula�ia statistic� din care provine;

2. volumul e�antionului; 3. dispersia popula�iei studiate.

1. Un e�antion este considerat reprezentativ atunci când structura sa este asem�n�toare cu aceea a popula�iei din care provine. �ansele ca o valoare estimat� prin sondaj s� fie apropiat� de valoarea real� sunt cu atât mai mari cu cât e�antionul utilizat este mai reprezentativ. În situa�ia, oarecum ideal�, în care valorile unei caracteristici au acelea�i propor�ii pentru e�antionul folosit �i pentru popula�ia studiat�, parametrul estimat este chiar egal cu parametrul real al popula�iei.

2. Volumul unui e�antion este o m�rime, notat� cu n, care reprezint� num�rul de unit��i statistice con�inut de e�antion. În principiu, atunci când volumul unui e�antion cre�te, sporesc �i �ansele ca valoarea estimat� a unui parametru s� fie apropiat� de cea real�. În cazul extrem, în care num�rul de unit��i statistice al e�antionului ar fi egal cu num�rul unit��ilor statistice ale popula�iei (în acest caz sondajul s-ar transforma îns� într-un recens�mânt) ar exista certitudinea c� valoarea estimat� este egal� cu cea real�. Volumul unui e�antion poate fi luat în considerare �i prin prisma ponderii pe care o de�ine în volumul popula�iei. Se consider� c� acurate�ea estim�rii este cu atât mai mare cu cât aceast� pondere este mai mare.

3. Dispersia popula�iei studiate poate cauza valori mari ale erorii efective de sondaj. Altfel spus, cu cât popula�ia studiat� este mai omogen�, cu atât sunt mai mari �ansele ca valorile estimate s� fie apropiate de cele reale. În situa�ia extrem� în care toate unit��ile popula�iei statistice au aceea�i valoare putem fi siguri c�, indiferent cum este alc�tuit e�antionul (acesta poate fi constituit chiar dintr-o singur� unitate) valoarea estimat� este egal� cu valoarea real�.

În raport cu cei trei factori pot fi stabilite distribu�ii probabilistice asupra valorilor erorilor efective de estimare. Pe baza

Page 121: STEFANESCU - B S - PIED - uni-muenchen.de9.3. Analiza legturilor dintre variabile prin intermediul regresiei 9.4. Indicatori de apreciere a sensului i intensit ii legturilor dintre

acestora se pot determina a�a numite intervale de încredere, care sunt intervale în interiorul c�rora putem aprecia, cu probabilit��i cunoscute, c� se afl� valori reale ale parametrilor popula�iei studiate. Probabilitatea ca valoarea unui parametru s� se afle într-un interval de încredere este numit� nivel de încredere. Unele propriet��i ale distribu�iilor probabilistice fac ca adeseori în practic� s� se prefere determinarea nivelului de încredere pe baza probabilit��ii ca valoarea parametrului s� nu se afle în intervalul de încredere. Aceast� probabilitate, numit� nivel de semnifica�ie, este notat� cu � în timp ce nivelul de încredere, care corespunde unui eveniment opus, este notat cu 1 – �.

Atunci când în cadrul inferen�ei statistice sunt utiliza�i estimatori nedeplasa�i, valorile acestora pot fi stabilite, pentru simplificarea calculelor probabilistice, în centrul intervalelor de încredere. Limitele unui interval de încredere se vor afla, în acest caz,

la o distan�� egal� de estimator. Aceast� distan��, notat� cu α1e �i

numit� eroare limit� de inferen��, este în fapt o estimare, pentru un nivel de semnifica�ie �, a erorii efective de inferen��. În aceste

condi�ii, intervalul de încredere are forma ]ˆ;ˆ[ 11αα θθ ee +− iar

probabilitatea ca valoarea real� a parametrului popula�iei s� se afle în acest interval este egal� cu nivelul de încredere:

( ) αθθθ αα −=+≤≤− 1ˆˆ11 eeP (8.2.)

Eroarea limit� de inferen��, care reprezint� un indiciu al acurate�ei estim�rii poate fi evaluat� pe baza celor trei factori care influen�eaz� eroarea efectiv� de inferen��: volumul e�antionului, reprezentativitatea acestuia �i dispersia popula�iei. În situa�ia, destul de frecvent� în practic�, în care dispersia popula�iei nu este cunoscut�, aceasta poate fi estimat� pe baza dispersiei e�antionului. Cunoscând impactul acestor factori se poate alc�tui un e�antion astfel încât acurate�ea inferen�ei s� se situeze deasupra unui nivel minim acceptabil.

Adeseori în practic� este mai util ca în loc de a se stabili un interval de încredere pentru un parametru s� se determine probabilitatea ca valoarea acestuia s� fie mai mic� sau mai mare decât un anumit nivel. În acest scop pot fi folosite propriet��ile distribu�iei de probabilit��i asociat� inferen�ei statistice.

Page 122: STEFANESCU - B S - PIED - uni-muenchen.de9.3. Analiza legturilor dintre variabile prin intermediul regresiei 9.4. Indicatori de apreciere a sensului i intensit ii legturilor dintre

8.2. Tipologia sondajelor statistice

Sondajele folosite în cercet�rile statistice îmbrac� forme foarte

variate, în raport cu scopurile urm�rite �i cu resursele disponibile. În acest subcapitol vor fi prezentate succint câteva din tipurile de sondaje, relevante din perspectiva inferen�ei statistice, grupate în raport cu dou� criterii:

a) volumul e�antionului; b) procedeul de alc�tuire a e�antionului.

a) În func�ie de volumul e�antionului se diferen�iaz� dou� tipuri de sondaje:

a1) sondaje de volum mare, la care e�antioanele au un volum mai mare de 30 de unit��i statistice;

a2) sondaje de volum redus, ale c�ror e�antioane au un volum de cel mult 30 de unit��i statistice.

Se consider� c� estim�rile realizate pe baza sondajelor de volum mare au o acurate�e superioar� celor care utilizeaz� sondaje de volum redus. În schimb, sondajele de volum redus sunt, de regul�, mai u�or de organizat �i mai pu�in costisitoare fa�� de cele de volum mare.

b) În raport cu procedeul de alc�tuire a e�antionului se delimiteaz� trei tipuri de sondaje:

b1) sondaje aleatoare, la care unit��ile statistice ale e�antioanelor sunt alese în mod întâmpl�tor;

b2) sondaje dirijate, la care unit��ile statistice sunt stabilite în func�ie de tr�s�turile popula�iei studiate, relevante în raport cu scopul cercet�rii statistice;

b3) sondaje mixte, care sunt combina�ii ale sondajelor întâmpl�toare �i ale sondajelor dirijate (de exemplu, o popula�ie poate fi împ�r�it�, în raport cu tr�s�turile sale, în mai multe grupe, iar pentru fiecare dintre acestea este alc�tuit, în mod întâmpl�tor, câte un e�antion).

Se consider� c� sondajele dirijate sau mixte asigur�, în compara�ie cu sondajele aleatoare, un grad mai înalt de reprezentativitate a e�antioanelor, ceea ce conduce la o acurate�e mai

Page 123: STEFANESCU - B S - PIED - uni-muenchen.de9.3. Analiza legturilor dintre variabile prin intermediul regresiei 9.4. Indicatori de apreciere a sensului i intensit ii legturilor dintre

mare a inferen�ei statistice. Totu�i, alc�tuirea e�antioanelor în raport cu tr�s�turile relevante ale popula�iei (care nu sunt întotdeauna u�or de identificat �i de evaluat) poate induce o complexitate deosebit� cercet�rii prin sondaj.

8.3. Inferen�a statistic� pentru sondajele de volum mare

8.3.1. Fundamentele teoretice ale inferen�ei sondajelor de volum mare

Inferen�a statistic� în cazul sondajelor de volum mare are la

baz� a�a-numita teorem� limit� central�. Aceasta stipuleaz� c� dac� dintr-o popula�ie statistic� se constituie un num�r suficient de mare de e�antioane de volum n atunci media aritmetic� a acestora are o distribu�ie normal� sau, cel pu�in, apropiat� de cea normal�, în dou� situa�ii: dac� �i popula�iei îi poate fi asociat� o lege de distribu�ie normal�, sau dac� n tinde la infinit. Media aritmetic� a distribu�iei normale a e�antioanelor va fi egal� cu media aritmetic� a popula�iei statistice, iar abaterea medie p�tratic� (numit� �i eroarea standard) notat� cu �s, poate fi calculat� prin rela�ia:

n

p

s

σσ = (8.3.)

unde �p este abaterea medie p�tratic� a popula�iei studiate. Condi�ia de infinitate a volumului e�antionului este atenuat� în

practic�, unde se consider� c� este suficient ca sondajele s� fie de volum mare (adic� n s� fie mai mare decât 30) pentru ca media aritmetic� a e�antioanelor s� urmeze o distribu�ie aproximativ normal�.

8.3.2. Determinarea intervalelor de încredere asupra mediei aritmetice

Pentru determinarea intervalelor de încredere asupra mediei

aritmetice sunt folosite variate procedee, care se diferen�iaz� în raport cu condi�iile concrete în care se aplic�. În acest subcapitol vor fi prezentate succint modalit��ile de stabilire a intervalelor de încredere pentru trei situa�ii:

a) în condi�iile cunoa�terii dispersiei popula�iei; b) în condi�iile în care dispersia popula�iei nu este cunoscut� ci

doar estimat�;

Page 124: STEFANESCU - B S - PIED - uni-muenchen.de9.3. Analiza legturilor dintre variabile prin intermediul regresiei 9.4. Indicatori de apreciere a sensului i intensit ii legturilor dintre

c) în condi�iile în care e�antionul are o pondere semnificativ� în ansamblul popula�iei.

8.3.2.1. Determinarea intervalelor de încredere în condi�iile cunoa�terii dispersiei popula�iei

În situa�ia în care dispersia popula�iei este cunoscut�,

intervalele de încredere pot fi stabilite pe baza propriet��ilor unei distribu�ii normale cu media aritmetic� �s �i abaterea medie p�tratic� �s (fig. 8.1.)

Fig. 8.1. Distribu�ia normal� a mediilor aritmetice ale e�antioanelor

Una dintre aceste propriet��i faciliteaz� calculul suprafe�elor

delimitate de graficul distribu�iei normale �i de linii verticale trasate la distan�e egale de media aritmetic� a distribu�iei. O astfel de suprafa��, care reprezint� în fapt probabilitatea, notat� cu 1 – � (nu întâmpl�tor se folose�te simbolul asociat nivelului de încredere) ca media aritmetic� a unui e�antion s� se g�seasc� într-un interval de valori ce are în centru media aritmetic� a popula�iei, este dat� de rela�ia:

( )sissis zxzP σµσµα αα ⋅+≤≤⋅−=−1 (8.4.)

unde αiz este o m�rime numit� coeficient de încredere.

Valorile m�rimii αiz pot fi determinate pe baza propriet��ilor

distribu�iei normale, ceea ce simplific� foarte mult calculele probabilistice. A�a cum s-a men�ionat în capitolul anterior, 68,26%

Page 125: STEFANESCU - B S - PIED - uni-muenchen.de9.3. Analiza legturilor dintre variabile prin intermediul regresiei 9.4. Indicatori de apreciere a sensului i intensit ii legturilor dintre

din suprafa�a delimitat� de graficul distribu�iei normale se afl� în

intervalul [ ]xx xx σσ +− ; , ceea ce înseamn� c� pentru αiz = 1 vom

avea: ( )ssss xP σµσµ +≤≤− = 0,6826

Acest nivel de probabilitate nu ofer� îns� o siguran�� prea mare pentru inferen�a statistic�. În practic�, în cadrul estim�rilor se opereaz� de regul� cu niveluri de probabilitate mai mari de 90%, în special cu valorile de 95% �i 99%. Probabilit��ii de 95% îi

corespunde o valoare αiz = 1,96, ceea ce înseamn� c�:

( )ssss xP σµσµ ⋅+≤≤⋅− 96,196,1 = 0,95

De asemenea, probabilit��ii de 99% îi corespunde o valoare αiz

= 2,576, de unde rezult�: ( )ssss xP σµσµ ⋅+≤≤⋅− 576,2576,2 = 0,99

Rela�ia (8.4.) permite calculul probabilit��ii ca media aritmetic� a unui e�antion s� se afle în interiorul unui interval stabilit pe baza mediei aritmetice a popula�iei. Inferen�a statistic� vizeaz� îns� mai degrab� stabilirea probabilit��ii ca media aritmetic� a popula�iei s� se afle într-un interval de valori determinat pe baza mediei aritmetice a unui e�antion. În acest scop, rela�ia (8.4) este modificat� pe baza urm�toarelor transform�ri:

- inegalitatea xz sis ≤⋅− σµ α este echivalent� cu inegalitatea

sis zx σµ α ⋅+≤ ;

- inegalitatea sis zx σµ α ⋅+≤ este echivalent� cu inegalitatea

sis zx σµ α ⋅−≥ Rezult� astfel rela�ia care st� la baza determin�rii unui interval

de încredere pentru un nivel de semnifica�ie dat:

( ) ασµσ αα −=⋅+≤≤⋅− 1sissi zxzxP sau:

ασ

µσ αα −=��

����

�⋅+≤≤⋅− 1

nzx

nzxP

p

is

p

i (8.5.)

Rela�ia (8.5.) poate fi considerat� drept un caz particular al rela�iei (8.2.) de stabilire a nivelului de încredere a unui parametru, în care valoarea estimat� este reprezentat� de media aritmetic� a e�antionului, valoarea real� este reprezentat� de media aritmetic� a popula�iei, iar eroarea limit� de inferen�� este dat� de produsul dintre

Page 126: STEFANESCU - B S - PIED - uni-muenchen.de9.3. Analiza legturilor dintre variabile prin intermediul regresiei 9.4. Indicatori de apreciere a sensului i intensit ii legturilor dintre

coeficientul de încredere αiz �i abaterea medie p�tratic� a distribu�iei

�s:

size σαα ⋅=1 (8.6.) Determinarea intervalelor de încredere pe baza rela�iei (8.5.)

este destul de simpl� în condi�iile în care pot fi utilizate valori cunoscute ale coeficientului de încredere.

Exemplul 8.1. În cadrul unei firme produc�toare de componente electronice se estimeaz� durata medie de func�ionare în regim intensiv a unui sortiment de produs. Testele au fost întreprinse asupra unui e�antion de 100 de produse rezultând pentru acestea o durat� medie de func�ionare de 400 de ore. Cunoscându-se c� pentru întreaga produc�ie a firmei abaterea medie p�tratic� a duratei de func�ionare reprezint� 200 ore se cere s� se determine intervalul de încredere pentru media aritmetic� cu un nivel de încredere de 68,26%.

Rezolvare: În raport cu abaterea medie p�tratic� a popula�iei �i cu volumul e�antionului se calculeaz� valoarea erorii standard:

2010

200

100

20====

n

p

s

σσ h

Nivelului de încredere 1 – � = 0,6826 îi corespunde o valoare tabelat�

αiz = 1, de unde rezult�:

( ) 6826,02020400201400 =×+≤≤×− sP µ ceea ce înseamn� c� poate fi stabilit intervalul de încredere [380 ; 420] în care se afl�, cu o probabilitate de 68,26% durata medie de func�ionare pentru toate produsele realizate de firm�.

În practic�, situa�iile în care se cunosc dispersiile popula�iilor cercetate prin sondaj sunt destul de rare (pentru a fi cunoscut� dispersia ar fi necesar s� se cunoasc� �i media aritmetic� astfel încât sondajul ar fi inutil). Din acest motiv, procedeele de determinare a intervalelor de încredere în condi�iile cunoa�terii popula�iei studiate au mai mult o semnifica�ie teoretic�.

8.3.2.2. Determinarea intervalelor de încredere pe baza dispersiei estimate

Atunci când nu se cunoa�te dispersia popula�iei studiate,

aceasta trebuie estimat� pe baza dispersiei e�antionului. Drept estimator al abaterii medii p�tratice a popula�iei �p poate fi utilizat� o

Page 127: STEFANESCU - B S - PIED - uni-muenchen.de9.3. Analiza legturilor dintre variabile prin intermediul regresiei 9.4. Indicatori de apreciere a sensului i intensit ii legturilor dintre

m�rime numit� abatere medie p�tratic� de sondaj, notat� cu S �i care poate fi calculat� pe baza valorilor din e�antion prin formula:

( )

11

2

=�=

n

xx

S

n

isi

(8.7.)

Valoarea abaterii medii p�tratice de sondaj este ob�inut� împ�r�ind suma p�tratelor abaterilor fa�� de media aritmetic� la n – 1 �i nu la num�rul total de unit��i a�a cum se întâmpl� în cazul abaterii medii p�tratice a unei serii simple. Explica�ia vine din faptul c� s-a constatat c� valoarea astfel calculat� este un estimator mai bun decât abaterea medie p�tratic� a valorilor e�antionului.

Procedeul determin�rii intervalelor de încredere pe baza estim�rilor asupra dispersiei popula�iei este asem�n�tor celui utilizat atunci când se cunoa�te dispersia real� a popula�iei, cu deosebirea c� în formulele de calcul abaterea medie p�tratic� a popula�iei este înlocuit� cu estimatorul acesteia, adic� abaterea medie p�tratic� de sondaj:

��

���

�⋅+≤≤⋅−

n

Szx

n

SzxP isi

αα µ (8.8.)

Exemplul 8.2. Pentru fundamentarea unei decizii asupra înfiin��rii unei re�ele de comercializare a produselor cosmetice s-a întreprins un studiu asupra cererii poten�iale din zon�. În acest scop s-a întreprins un sondaj asupra unui e�antion de 160 de persoane. Cheltuielile lunare pentru produsele cosmetice ale acestor persoane au o medie aritmetic� de 30 RON �i o abatere medie p�tratic� de sondaj de 10 RON. Se cere s� se determine cu o probabilitate de 99%, intervalul de încredere al cheltuielilor medii pentru întreaga popula�ie din zon�. Rezolvare: Nivelului de încredere � – 1 = 0,99 îi corespunde un

coeficient de încredere αiz = 2,576. Rezult�:

��

���

�⋅+≤≤⋅−

n

Szx

n

SzxP isi

αα µ = 1 – �, adic�,

99,0160

10576,230

160

10576,230 =�

���

�×+≤≤×− sP µ

ceea ce înseamn� c� media aritmetic� a cheltuielilor pentru întreaga popula�ie din zon� se afl�, cu o probabilitate de 99%, în intervalul [27,96 ; 32,04].

Page 128: STEFANESCU - B S - PIED - uni-muenchen.de9.3. Analiza legturilor dintre variabile prin intermediul regresiei 9.4. Indicatori de apreciere a sensului i intensit ii legturilor dintre

În situa�ia în care e�antionul ia forma unei distribu�ii heterograde, abaterea medie p�tratic� de sondaj poate fi calculat� prin formula:

( ) ( )

11

1

2'

1

1

2'

⋅−

=

−���

����

⋅−

=�

�=

=

=

n

nxx

n

nxx

S

x

x

x k

i

xii

k

i

xi

k

i

xii

(8.9.)

Exemplul 8.3. S-a întreprins un studiu asupra situa�iei materiale a consumatorilor unui sortiment de produs. În acest scop s-a recurs la un e�antion de 170 de persoane, grupat în raport cu venitul mediu lunar (tabelul 8.1.). Se cere s� se determine, pe baza acestui e�antion, intervalul de încredere în care se situeaz�, cu o probabilitate de 95 %, media aritmetic� a veniturilor tuturor consumatorilor.

Tabelul 8.1. Distribu�ie heterograd� asociat� unui e�antion

Nr. crt.

Interval de varia�ie [RON]

Frecven�� absolut�

( )xin

(0) (1) (2) 1 [300 ; 500) 20 2 [500 ; 700) 30 3 [700 ; 900) 60 4 [900 ; 1.100) 40 5 [1.100 ; 1.300) 20

Rezolvare: În tabelul 8.2. sunt prezentate valorile intermediare

utilizate în calculul abaterii medii p�tratice de sondaj.

Media aritmetic� a e�antionului are valoarea:

76,811170

000.138

1

1

'

==

=

=

=

x

x

k

i

xi

k

i

xii

s

n

nx

x RON

Page 129: STEFANESCU - B S - PIED - uni-muenchen.de9.3. Analiza legturilor dintre variabile prin intermediul regresiei 9.4. Indicatori de apreciere a sensului i intensit ii legturilor dintre

Tabelul 8.2. Valori intermediare folosite în calculul abaterii medii p�tratice de sondaj

Nr. crt.

Interval de

varia�ie [RON]

xin

Centru de

interval 'ix

[RON]

xii nx ⋅'

[RON] si xx ⋅'

[RON] ( ) x

isi nxx ⋅⋅2'

[RON2]

(0) (1) (2) (3) (4) (5) (6) = (5)2 × (2)

1 [300; 500)

20 400 8.000 –

411,76 3.390.926

2 [500 ; 700)

30 600 18.000 –

211,76 1.345.269

3 [700 ; 900)

60 800 48.000 –

11,76 8.298

4 [900 ; 1.100)

40 1.000 40.000 188,24 1.417.372

5 [1.100 ; 1.300)

20 1.200 24.000 388,24 3.014.606

6 Total 170 × 138.000 × 9.176.471

7 Simbol pentru total

�=

xk

i

xin

1

× �=

⋅xk

i

xii nx

1

' × ( )�=

⋅⋅xk

i

xisi nxx

1

2'

Abaterea medie p�tratic� de sondaj reprezint�:

( )233

1170

471.176.9

11

1

'

=−

=

−���

����

⋅−

=

=

=

x

x

k

i

xi

k

i

xisi

n

nxx

S RON

Nivelului de încredere � – 1=0,95 îi corespunde un coeficient

de încredere αiz =0 1,96. Rezult�:

��

���

�⋅+≤≤⋅−

n

Szx

n

SzxP isi

αα µ = 1 – �, adic�,

95,0170

23396,176,811

170

23396,176,811 =�

���

�×+≤≤×− sP µ

Page 130: STEFANESCU - B S - PIED - uni-muenchen.de9.3. Analiza legturilor dintre variabile prin intermediul regresiei 9.4. Indicatori de apreciere a sensului i intensit ii legturilor dintre

ceea ce înseamn� c� media aritmetic� a veniturilor lunare pentru to�i consumatorii se afl�, cu o probabilitate de 95%, în intervalul [776,74 ; 846,78].

8.3.2.3. Determinarea intervalelor de încredere atunci când e�antionul are o pondere semnificativ� în cadrul popula�iei

De regul�, din considerente de eficien��, e�antioanele utilizate

în sondaje au o pondere foarte mic� în totalul popula�iei studiate. Pentru aceste sondaje volumul popula�iei statistice nu este inclus în calculele de inferen�� statistic� întrucât este considerat infinit în raport cu volumul e�antionului.

În practic�, sunt folosite uneori �i sondaje la care e�antionul are o pondere semnificativ� în totalul popula�iei. Se consider� c� la aceste sondaje e�antionul are o reprezentativitate deosebit�, ceea ce conduce la cre�terea acurate�ei �i la reducerea erorii efective de inferen��. Din acest motiv, în stabilirea intervalelor de încredere se obi�nuie�te ca eroarea standard s� fie corectat� cu un a�a-numit factor de corec�ie

pentru popula�ia finit�, o m�rime notat� cu FCfin �i dat� de formula:

N

nFC fin −= 1

(8.10) unde N este volumul popula�iei studiate.

Rela�ia de determinare a intervalului de încredere devine, în aceste condi�ii:

αµ αα −=���

����

�−−≤≤−− 111

N

n

n

szX

N

n

n

szXP issis

(8.11) Exemplul 8.4. În cadrul unei firme s-a efectuat un sondaj prin

care s-au studiat performan�ele vânz�rilor unui sortiment de produs. E�antionul folosit în acest scop a inclus 40 din cele 160 de puncte de desfacere ale firmei. S-a determinat pentru acestea o medie aritmetic� a vânz�rilor lunare de 1500 buc��i �i o abatere medie p�tratic� de sondaj de 300 buc��i. Se cere s� se determine, cu o probabilitate de 99%, intervalul de încredere al mediei aritmetice a vânz�rilor pentru toate punctele de desfacere.

Page 131: STEFANESCU - B S - PIED - uni-muenchen.de9.3. Analiza legturilor dintre variabile prin intermediul regresiei 9.4. Indicatori de apreciere a sensului i intensit ii legturilor dintre

Rezolvare: Unui nivel de încredere 99,01 =−α îi corespunde

un coeficient de încredere 576,2=αiz . rezult�:

αµ αα −=���

����

�−−≤≤−− 111

N

n

n

szX

N

n

n

szXP issis ,

adic�

99,0160

401

40

300576,21500

160

401

40

300576,21500 =��

����

�−−≤≤−− sP µ

de unde reiese c� media aritmetic� a vânz�rilor lunare pentru toate punctele de desfacere ale firmei se afl�, cu o probabilitate de 99%, în intervalul [1394;1616].

8.3.3. Determinarea volumului unui e�antion

Acurate�ea unui sondaj, reprezentat� prin eroarea efectiv� de inferen��,depinde, a�a cum s-a v�zut, de mai mul�i factori, dintre care, de regul�, cel mai u�or de controlat este volumul e�antionului. Din acest motiv, adeseori în practic� se obi�nuie�te ca volumul unui e�antion s� fie stabilit astfel încât eroarea de sondaj s� nu dep��easc� un nivel maxim acceptabil (se are în vedere �i faptul c� cu cât volumul e�antionului este mai mare cu atât costul sondajului este mai mare iar dificult��ile de organizare sporesc).

Procedeul de determinare a volumului unui e�antion are la baz� formula care exprim� dependen�a erorii limit� de inferen�� fa�� de volumul e�antionului. În situa�ia în care nu se cunoa�te dispersia popula�iei se poate aprecia, din formula intervalului de încredere, c� eroarea limit� de inferen�� este dat� de rela�ia:

n

sze ii ⋅= αα (8.12)

de unde rezult�: 2

���

����

� ⋅=

α

α

i

i

e

szn (8.13)

Pentru un nivel maxim admisibil al erorii limit� de inferen�� se poate determina, prin transformarea rela�iei (8.13) volumul minim al e�antionului:

Page 132: STEFANESCU - B S - PIED - uni-muenchen.de9.3. Analiza legturilor dintre variabile prin intermediul regresiei 9.4. Indicatori de apreciere a sensului i intensit ii legturilor dintre

2

���

����

� ⋅≥

α

α

i

i

e

szn (8.14)

În determinarea volumului e�antionului pe baza inegalit��ii (8.14) apare o dificultate dat� de faptul c� abaterea medie p�tratic� de sondaj nu poate fi calculat� dac� nu se cunoa�te volumul e�antionului. În practic�, aceast� dificultate este surmontat� estimându-se abaterea medie p�tratic� de sondaj pe baza experien�ei dat� de sondaje efectuate în trecut sau prin studii preliminare ale popula�iei.

Exemplul 8.5. Se cere s� se determine volumul e�antionului pentru un sondaj care are ca obiect estimarea cheltuielilor lunare cu publicitatea ale corpora�iilor dintr-o ramur� industrial� cunoscând urm�toarele caracteristici ale sondajului:

- eroarea limit� de inferen�� trebuie s� fie de cel mult 1000 RON;

- intervalului de încredere îi este asociat� o probabilitate de 95%;

- a fost estimat� o abatere medie p�tratic� de sondaj de 10.000 RON.

Rezolvare: Probabilit��ii de 95% îi corespunde un coeficient

de încredere 96,1=αiz

Rezult� pentru volumul e�antionului:

16,3841000

1000096,12

=��

���

� ⋅=�

��

����

� ⋅≥

α

α

i

i

l

szn

Prin rotunjire, se ob�ine n = 385.

8.3.4. Estim�ri asupra propor�iilor

Uneori, o popula�ie statistic� este descris� prin propor�ia unit��ilor care posed� o caracteristic� cert�. Astfel de situa�ii apar în special în cazul unor caracteristici calitative.

Se consider� c� teorema limit� central�, care este formulat� pentru inferen�a statistic� asupra mediei aritmetice poate fi adaptat� pentru propor�ia unei caracteristici. Distribu�ia probabilistic� a acesteia poate fi astfel aproximat� printr-o distribu�ie normal� în situa�ia unui num�r semnificativ de sondaje de volum mare. În aceste condi�ii, formulele de calcul pentru inferen�a asupra propor�iilor sunt similare celor determinate pentru inferen�a mediei aritmetice dac� se fac urm�toarele înlocuiri:

Page 133: STEFANESCU - B S - PIED - uni-muenchen.de9.3. Analiza legturilor dintre variabile prin intermediul regresiei 9.4. Indicatori de apreciere a sensului i intensit ii legturilor dintre

- media aritmetic� a e�antionului sX este înlocuit� cu propor�ia caracteristicii din e�antion, notat� cu pe;

- media aritmetic� a popula�iei sµ este înlocuit� cu propor�ia caracteristicii în ansamblul popula�iei, notat� cu pp;

- abaterea medie p�tratic� de sondaj s este înlocuit� cu o m�rime numit� abaterea medie p�tratic� a propor�iilor, notat� cu sp �i dat� de rela�ia:

( )eep pps −= 100 (8.15)

Cu aceste echival�ri, formula de determinare a unui interval de încredere asupra propor�iei devine:

( ) ( )ααα −=��

����

� −−≤≤

−− 1

100100

n

ppzpp

n

ppzpP ee

iesee

ie (8.16)

Exemplul 8.6. În cadrul unei firme s-a realizat un sondaj

pentru a se estima propor�ia rebuturilor la un sortiment de produs. S-a constatat c� din e�antionul de 200 de buc��i testate 16 erau defecte. Se cere s� se determine, cu un nivel de semnifica�ie de 12%, intervalul de încredere al propor�iei rebuturilor pentru întreaga produc�ie:

Rezolvare: În cadrul e�antionului, propor�ia produselor defecte reprezint�:

%8100200

16100

uiesantionul volumul

rebutate bucati denumar =×=×=ep

Nivelului de semnifica�ie de 1% (sau, altfel spus, a nivelului de încredere de 99%) îi corespunde un coeficient de încredere

576,2=αiz . Rezult�:

( ) ( )ααα −=�

��

����

� −−≤≤

−− 1

100100

n

ppzpp

n

ppzpP ee

iesee

ie

, adic�:

( ) ( )01,01

200

81008576,28

200

81008756,28 −=��

����

� −−≤≤

−− spP

ceea ce înseamn� c� propor�ia rebuturilor, pentru întreaga produc�ie se afl�, cu o probabilitate de 99%, în intervalul [3,06; 12,94].

Formula de determinare a volumului unui e�antion dat� pentru inferen�a asupra mediilor aritmetice poate fi adaptat�, pe baza

Page 134: STEFANESCU - B S - PIED - uni-muenchen.de9.3. Analiza legturilor dintre variabile prin intermediul regresiei 9.4. Indicatori de apreciere a sensului i intensit ii legturilor dintre

rela�iilor de echivalen�� men�ionate anterior, la inferen�a asupra propor�iilor astfel:

( )ee

i

i ppl

zn −××��

����

�≥ 100

α

α

(8.17)

Întrucât propor�ia unit��ilor din e�antion care posed� o anumit� caracteristic� nu poate fi cunoscut� în momentul stabilirii volumului e�antionului, aceasta trebuie estimat� pe baza unor sondaje anterioare sau a studiului preliminar al popula�iei.

Exemplul 8.7. Se cere s� se stabileasc� volumul e�antionului

pentru un sondaj care vizeaz� estimarea propor�iei facturilor incorect completate ale unei firme: Se cunosc: - propor�ia facturilor incorecte, estimat� preliminar pe baza

sondajelor precedente, reprezint� 15%; - eroarea limit� de inferen�� trebuie s� fie de cel mult 4%; - intervalului de încredere asupra propor�iei facturilor incorecte îi

este asociat� o probabilitate de 95%. Rezolvare: Nivelul de încredere de 95% îi corespunde un

coeficient de încredere 96,1=αiz . Rezult�:

( ) ( ) 1,30615100154

96,1100

2

=−××��

���

�=−××��

����

�≥ ee

i

i ppz

α

Rotunjindu-se prin majorare valoarea calculat�, se ob�ine n = 307.

8.4. Inferen�a statistic� asupra sondajelor de volum

redus

În compara�ie cu sondajele de volum mare, sondajele de volum

redus sunt, de regul�, mai pu�in costisitoare îns� ofer� o acurate�e inferioar�. Acest ultim aspect face ca în principiu sondajele de volum redus s� nu fie recomandate pentru cercet�rile statistice. Totu�i, uneori în practic� pot s� apar� situa�ii în care sondajele de volum redus sunt preferate celor de volum mare: atunci când nu exist� posibilitatea alc�tuirii unui e�antion de volum mare, când sondajele de volum mare ar fi mult prea costisitoare �.a.m.d.

Teorema limit� central� stipuleaz� c� inferen�a statistic� poate fi descris� de o distribu�ie normal� chiar �i pentru sondajele de volum redus, cu condi�ia ca popula�ia studiat� s� urmeze tot o distribu�ie

Page 135: STEFANESCU - B S - PIED - uni-muenchen.de9.3. Analiza legturilor dintre variabile prin intermediul regresiei 9.4. Indicatori de apreciere a sensului i intensit ii legturilor dintre

normal�. Într-un astfel de caz estim�rile pot fi realizate prin procedee similare celor utilizate pentru sondajele de volum mare. Din nefericire îns�, cel mai adesea în practic� nu sunt disponibile suficiente date pentru a se aprecia dac� popula�ia studiat� se supune unei legi de distribu�ie normal�, ceea ce impune folosirea altor tipuri de distribu�ii probabilistice.

Se consider� c� acurate�ea inferioar� pe care sondajele de volum redus o au în compara�ie cu sondajele de volum mare este cauzat� de faptul c� un e�antion de mici dimensiuni nu reflect� corespunz�tor dispersia popula�iei studiate. În general, cu cât e�antionul este mai mic, cu atât sporesc �ansele ca dispersia acestuia s� fie mai mic� în compara�ie cu dispersia popula�iei.

În aceste condi�ii, inferen�a statistic� a sondajelor de volum redus se poate realiza luându-se drept baz� procedeele de inferen�� pentru sondajele de volum mare. Aceste tehnici trebuie îns� adaptate pentru a se lua în considerare faptul c� e�antioanele de volum redus reflect� într-o m�sur� mai mic� dispersia popula�iei studiate. În acest scop se folose�te un tip de distribu�ie probabilistic�, numit distribu�ia

t, asem�n�tor cu o distribu�ie normal� (are un grafic simetric, în form� de clopot, îns� mai aplatizat decât cel specific unei distribu�ii normale) dar care face ca pentru o aceea�i abatere medie p�tratic� de sondaj �i acela�i nivel de încredere s� corespund� o eroare limit� de inferen�� mai mare (fig. 8.2.).

Fig. 8.2. Distribu�ia normal� �i distribu�ii de tip t

Page 136: STEFANESCU - B S - PIED - uni-muenchen.de9.3. Analiza legturilor dintre variabile prin intermediul regresiei 9.4. Indicatori de apreciere a sensului i intensit ii legturilor dintre

În fapt, exist� mai multe forme ale distribu�iei în raport cu reflectarea în cadrul e�antionului a dispersiei popula�iei studiate. Drept criteriu de diferen�iere poate fi folosit un indicator numit num�r

de grade de libertate, notat cu ν , care este dat de num�rul de unit��i statistice independente folosite pentru estimarea unui parametru. În cazul estim�rii dispersiei pe baza sondajelor de volum redus se consider� c� num�rul de grade de libertate poate fi ob�inut sc�zând o unitate din volumul e�antionului. Justificarea vine din faptul c� indicatorii dispersiei folosi�i în estimare sunt calcula�i pe baza abaterilor fa�� de media aritmetic�. Întrucât suma algebric� a acestora este întotdeauna nul� rezult� c� valoarea abaterii unei unit��i fa�� de medie poate fi dedus� din celelalte. Se poate deci concluziona c� num�rul de grade de libertate asociat estim�rii dispersiei pe baza unui e�antion de volum redus este dat de rela�ia:

1−= nν (8.14) unde n este volumul e�antionului. Cu cât num�rul de grade de libertate este mai mare, cu atât dispersia popula�iei este reflectat� mai semnificativ în cadrul e�antionului iar distribu�ia t este mai apropiat� de distribu�ia normal� (fig. 8.2).

Propriet��ile distribu�iilor de tip t faciliteaz� unele calcule probabilistice. Poate fi astfel cunoscut� probabilitatea, reprezentat� prin suprafa�a ha�urat� din figura 8.3., ca valorile distribu�iei s� dep��easc� un anumit punct critic. În func�ie de num�rul de grade de libertate �i propor�ia, notat� cu q, pe care suprafa�a o are în totalul ariei delimitate de graficul distribu�iei, se pot stabili valori tabelate,

notate cu υqt , care exprim� pozi�ia punctului critic (tabelul 8.3.).

Page 137: STEFANESCU - B S - PIED - uni-muenchen.de9.3. Analiza legturilor dintre variabile prin intermediul regresiei 9.4. Indicatori de apreciere a sensului i intensit ii legturilor dintre

�������

�� � �

������ � �����

Fig. 8.3. Reprezentarea probabilit��ii ca valorile unei distribu�ii de tip

t s� dep��easc� un punct critic Tabelul 8.3. Valori tabelate pentru m�rimea υ

qt

Probabilitate Num�r de grade de libertate

0,10 0,05 0,025 0,01 0,005

4 1,533 2,132 2,776 3,747 4,604 5 1,476 2,015 2,571 3,365 4,032 6 1,440 1,943 2,447 3,143 3,707

23 1,319 1,714 2,069 2,500 2,807 24 1,318 1,711 2,064 2,492 2,797

Cu un ra�ionament similar celui folosit în cazul inferen�ei

asupra sondajelor de volum mare, se poate determina formula de stabilire a intervalelor de încredere pentru sondajele de volum redus:

αµ νν −=��

���

�⋅+≤≤⋅− 1

n

stX

n

stXP qssqs (8.19)

Page 138: STEFANESCU - B S - PIED - uni-muenchen.de9.3. Analiza legturilor dintre variabile prin intermediul regresiei 9.4. Indicatori de apreciere a sensului i intensit ii legturilor dintre

�1x− 1x

Figura 8.4. Probabilit��i asociate unui interval de încredere Propor�ia q se stabile�te luându-se în considerare faptul c� într-

o distribu�ie t standardizat� intervalul de încredere este dispus simetric în raport cu valoarea nul� a mediei aritmetice (figura 8.4.) astfel încât probabilitatea ca valorile distribu�iei s� nu fie cuprinse într-un interval [–x1, x1] reprezint� de fapt dublul probabilit��ii ca valorile distribu�iei s� fie mari decât valoarea x1. Altfel spus:

2

α=q (8.20)

Exemplul 8.7. : Managerii unei firme de transport �i-au propus s� estimeze costul mediu anual al între�inerii unui autocamion. În acest scop au fost selectate cinci ma�ini pentru care au fost ob�inute datele prezentate în tabelul 8.4. Se cere s� se determine, cu o probabilitate de 95%, intervalul de încredere al costului mediu anual de între�inere pentru ansamblul parcului de autocamioane al firmei.

Tabelul 8.4. Costuri anuale de între�inere

pentru un grup de cinci autocamioane

Nr. crt. Cost anual de între�inere

(xi)[RON] 1 60 2 80 3 80 4 70 5 70

Page 139: STEFANESCU - B S - PIED - uni-muenchen.de9.3. Analiza legturilor dintre variabile prin intermediul regresiei 9.4. Indicatori de apreciere a sensului i intensit ii legturilor dintre

Rezolvare: În tabelul 8.5. sunt prezentate datele intermediare

folosite în calculul mediei aritmetice �i a abaterii medii p�tratice de sondaj.

Tabelul 8.5. Date intermediare utilizate în calculul mediei

aritmetice �i a abaterii medii p�tratice de sondaj Nr. crt.

Xi [RON] XX i − [RON] ( )2XX i − [RON2]

(0) (1) (2) (3) = (2)2

1 60 -12 144 2 80 8 64 3 80 8 64 4 70 2 4 5 70 2 4

Total 360 × 280 Simbol pentru total

�=

n

i

iX1

× ( )�=

−n

i

i XX1

Media aritmetic� a e�antionului are valoarea:

725

3601 ===�=

n

X

X

n

i

i

s RON

Abaterea medie p�tratic� de sondaj reprezint�:

( )37,8

1,5

280

11 ==

=�

n

XX

S

n

n

i

RON

Num�rul de grade de libertate pentru acest sondaj are valoarea 4151 =−=−= nν

În raport cu nivelul de semnifica�ie 05,0=α se determin�:

025,02

05,0

2===

αq

Din tabelul 8.3. se extrage pentru 4=ν �i q = 0,025 o valoare

776,2=νqt

Rezult�: αµ νν −=��

���

�⋅+≤≤⋅− 1

n

stX

n

stXP qssqs ,

Page 140: STEFANESCU - B S - PIED - uni-muenchen.de9.3. Analiza legturilor dintre variabile prin intermediul regresiei 9.4. Indicatori de apreciere a sensului i intensit ii legturilor dintre

adic�

95,05

37,8776,272

5

37,8776,272 =�

���

�⋅+≤≤⋅− sP µ

ceea ce înseamn� c� media aritmetic� pentru ansamblul popula�iei studiate se situeaz�, cu o probabilitate de 95%, în intervalul [61,6 ; 82,4].

8.5. Verificarea ipotezelor statistice prin sondaje

Uneori, sondajele statistice sunt utilizate pentru a verifica

anumite aprecieri preliminare asupra popula�iei studiate. În acest scop sunt formulate dou� ipoteze:

1) o ipotez� care îmbrac� forma aprecierii ini�iale, numit� ipoteza

nul� �i notat� cu H0; 2) o ipotez� care reprezint� opusul aprecierii ini�iale, numit� ipoteza

alternativ� �i notat� cu HA. În condi�iile în care caracteristicile popula�iei studiate prin

sondaj nu pot fi cunoscute cu certitudine, confirmarea sau infirmarea ipotezei nule trebuie s� se fac� în termeni probabilistici, pe baza unui nivel de semnifica�ie. În acest scop pot fi folosite unele propriet��i ale tipurilor de distribu�ii probabilistice specifice tipurilor de sondaje folosite.

În practic�, pentru verificarea procedeelor statistice sunt utilizate diverse procedee. În acest subcapitol, vom prezenta un algoritm de verificare, prin sondaje de volum mare, a ipotezelor asupra mediei aritmetice a unei popula�ii. Dup� cum se �tie, pentru sondajele de volum mare probabilit��ile pot fi stabilite prin intermediul unei distribu�ii normale standard, în care suprafa�a ce reprezint� nivelul de semnifica�ie poate fi împ�r�it� în dou� arii dispuse simetric (fig. 8.6.).

Page 141: STEFANESCU - B S - PIED - uni-muenchen.de9.3. Analiza legturilor dintre variabile prin intermediul regresiei 9.4. Indicatori de apreciere a sensului i intensit ii legturilor dintre

α

1z− α

1z−

Fig. 8.6. Verificarea unei ipoteze statistice printr-un sondaj de volum

mare Domeniul din graficul distribu�iei asociat accept�rii ipotezei

nule are limitele date de coordonatele α1z− �i α

1z+ , suprafa�a sa reprezentând astfel nivelul de încredere 1 – �.

Algoritmul de verificare a ipotezei asupra mediei aritmetice cuprinde mai multe etape:

Pasul 1 - Se stabilesc cele dou� ipoteze: - ipoteza nul�, H0 : �s = �0, unde �0 este valoarea atribuit�

ini�ial mediei aritmetice a popula�iei; - ipoteza alternativ�, HA : �s � �0. Pasul 2 – Se stabile�te un nivel de semnifica�ie acceptabil

pentru verificarea ipotezei nule. Pasul 3 - Se determin�, în func�ie de nivelul de semnifica�ie,

valoarea tabelat� αiz , numit�, în acest caz, valoare critic�.

Pasul 4 - Se determin� media aritmetic� a e�antionului sx �i abaterea medie p�tratic� de sondaj s.

Pasul 5 - Se calculeaz� o m�rime numit� valoarea testului

statistic z, prin rela�ia:

ns

xz s 0µ−

= (8.20)

Pasul 6 – Se compar� valoarea testului statistic z cu valorile αiz− �i α

iz+ rezultând una din urm�toarele concluzii:

Page 142: STEFANESCU - B S - PIED - uni-muenchen.de9.3. Analiza legturilor dintre variabile prin intermediul regresiei 9.4. Indicatori de apreciere a sensului i intensit ii legturilor dintre

- dac� z apar�ine intervalului [ ]ααii zz +− ; se accept� ipoteza

nul�;

- dac� z nu apar�ine intervalului [ ]ααii zz +− ; se respinge

ipoteza nul�. Exemplul 8.8. Managerii departamentului de marketing al unei

firme ce produce dulciuri consider� c� în medie un client cheltuie�te s�pt�mânal pentru ciocolat� suma de 7 RON. Pentru a se verifica aceast� ipotez� a fost efectuat un sondaj pe un e�antion de 40 de clien�i, determinându-se o medie aritmetic� de 6,8 RON �i o abatere medie p�tratic� de sondaj de 0,8 RON. Se cere s� se identifice concluziile verific�rii pentru un nivel de semnifica�ie de 5%. Rezolvare: Ipoteza nul� este dat� de aprecierea ini�ial� a managerilor, adic�: H0 : �s = �0 = 7 RON Ipoteza alternativ� este reprezentat� de opusul ipotezei nule:

HA : �s � 7 RON Petru un nivel de semnifica�ie � = 5% (sau un nivel de

încredere de 95%) se stabile�te o valoare tabelat� αiz = 1,96. Valoarea

testului statistic z reprezint�: 581,1408,0

78,60 −=×−

=−

= ns

xz s µ

Deoarece -1,581 apar�ine intervalului [– 1,96 ; + 1,96] se poate considera c�, pentru un nivel de semnifica�ie de 5 %, ipoteza nul� poate fi acceptat�.

Page 143: STEFANESCU - B S - PIED - uni-muenchen.de9.3. Analiza legturilor dintre variabile prin intermediul regresiei 9.4. Indicatori de apreciere a sensului i intensit ii legturilor dintre

Capitolul 9 - Analiza statistic� a leg�turilor dintre variabile

9.1. Coordonate ale analizei statistice a leg�turilor

dintre variabile

În cadrul cercet�rilor statistice, termenul de variabil�

desemneaz� o colec�ie de date organizate în raport cu o caracteristic� a popula�iei studiate. Pentru a fi complet�, o cercetare statistic� presupune atât studiul separat al fiec�rei variabile (altfel spus, al fiec�rui aspect esen�ial al fenomenului cercetat) cât �i o abordare a leg�turilor semnificative care exist� între variabile. Aceste leg�turi pot fi transpuse în rela�ii de tip cauz�-efect, folosite în elaborarea modelelor care descriu mecanismele fenomenelor cercetate.

În cadrul model�rii fenomenelor colective sunt utilizate dou� tipuri de variabile:

- variabile independente, care descriu factorii de influen�� asupra fenomenelor modelate;

- variabile dependente, care descriu efectele ac�iunii factorilor de influen��.

Într-o cercetare statistic�, analiza leg�turilor dintre variabile, numit� �i analiz� a corela�iei vizeaz� mai multe aspecte:

a) identificarea leg�turilor relevante dintre variabile; b) stabilirea formelor sub care se manifest� aceste leg�turi; c) evaluarea intensit��ii leg�turilor dintre variabile.

a) Identificarea leg�turilor relevante dintre variabile se

bazeaz� pe studiul evolu�iei în paralel a unei variabile dependente �i a uneia sau mai multor variabile independente. Atunci când schimb�rile

Page 144: STEFANESCU - B S - PIED - uni-muenchen.de9.3. Analiza legturilor dintre variabile prin intermediul regresiei 9.4. Indicatori de apreciere a sensului i intensit ii legturilor dintre

unei variabile sunt înso�ite de modific�ri importante ale altei variabile se poate emite ipoteza unei leg�turi relevante. Trebuie avut îns� în vedere faptul c� modific�rile concomitente a dou� variabile nu sunt neap�rat rezultatul unei leg�turi semnificative. Uneori, simultan cu factorii de influen�� studia�i se produce �i ac�iunea altor factori, pe care nu i-am luat în considerare dar care au un impact determinant asupra fenomenului cercetat. Coinciden�a ac�iunii ne face s� atribuim toate efectele factorilor pe care i-am considerat relevan�i când, de fapt, acestea s-au datorat în primul rând factorilor pe care i-am neglijat. Un alt aspect care poate spori complexitatea identific�rii factorilor leg�turilor dintre variabile este dat de faptul c� influen�a unor factori asupra fenomenelor cercetate se produce cu întârziere.

b) Formele stabilite pentru leg�turile dintre variabile sunt

deosebit de importante din perspectiva aplic�rii modelelor ce descriu mecanismele fenomenelor cercetate. Se recomand� ca leg�turii dintre o variabil� dependent� �i una sau mai multe variabile independente s� îi fie atribuit� forma unei func�ii matematice ale c�rei parametri s� poat� fi determina�i. Func�iile matematice folosite în acest scop pot fi clasificate în raport cu dou� criterii:

b1) num�rul de variabile independente; b2) tipul ecua�iei matematice.

b1) În raport cu num�rul de variabile independente, func�iile matematice utilizate pot fi împ�r�ite în dou� categorii:

- func�ii cu o singur� variabil� independent�, de forma y = f(x); - func�ii cu mai multe variabile independente, de forma y = f(x1, x2, …, xn). În practic�, func�iile cu mai multe variabile independente, cu

toate c� pot conferi o rigoare deosebit� cercet�rii, sunt adeseori evitate ca urmare a complexit��ii deosebite pe care o induc analizei statistice. În schimb, func�iile cu o singur� variabil� independent�, sunt folosite, datorit� simplit��ii pe care o confer�, chiar �i atunci când nu aduc o rigoare prea mare modelelor.

b2) În raport cu tipul ecua�iei matematice se pot delimita dou�

categorii ale func�iilor folosite în analiza leg�turilor dintre variabile: - func�ii liniare, date de o ecua�ie liniar�; - func�ii neliniare, cu o ecua�ie matematic� mai complex�:

parabolice, hiperbolice, logaritmice, exponen�iale etc.

Page 145: STEFANESCU - B S - PIED - uni-muenchen.de9.3. Analiza legturilor dintre variabile prin intermediul regresiei 9.4. Indicatori de apreciere a sensului i intensit ii legturilor dintre

Din acelea�i considerente de simplitate, în practic�, func�iile liniare sunt folosite mult mai frecvent decât func�iile neliniare.

Un aspect important în cazul leg�turilor cu o singur� variabil� independent� este reprezentat de coresponden�a dintre direc�iile în care evolueaz� variabila dependent� �i cea independent�. Din aceast� perspectiv� se pot delimita dou� tipuri de leg�turi între variabile:

- leg�turi directe, în care cele dou� variabile evolueaz� în acela�i sens;

- leg�turi inverse, în care variabilele evolueaz� în sensuri opuse.

c) Evaluarea intensit��ii leg�turilor dintre variabile are rolul

de apreciere a impactului pe care factorii de influen�� reprezenta�i prin variabilele independente îl au asupra aspectului reprezentat printr-o variabil� dependent�. Cu cât leg�tura este mai intens� cu atât influen�a acestor factori este mai determinant�. Evaluarea intensit��ii leg�turilor dintre variabile ofer�, totodat�, un indiciu asupra impactului unor factori care nu au fost reprezenta�i prin variabile independente, ceea ce permite aprecierea reprezentativit��ii rela�iilor de tip cauz� efect.

9.2. Tehnici grafice de caracterizare a leg�turilor dintre

variabile

Tehnicile grafice de caracterizare a leg�turilor dintre variabile,

numite �i corelograme, sunt simplu de aplicat �i pot oferi indicii asupra unor aspecte importante ale leg�turilor dintre variabile. În general, tehnicile grafice se bazeaz� pe reprezentarea valorilor variabilelor în sisteme de coordonate carteziene. Din perspectiva seriilor statistice prin care sunt descrise variabilele se diferen�iaz� dou� tipuri de corelograme: - corelograme pentru seriile simple, care constau în reprezent�ri

prin puncte ce au drept coordonate valorile variabilelor; - corelograme pentru distribu�ii heterograde, care presupun

reprezentarea subgrupelor prin dreptunghiuri ce corespund intervalelor de varia�ie, în interiorul fiec�rui dreptunghi fiind trasat un num�r de puncte egal cu frecven�a absolut� a grupei (atunci când frecven�ele absolute sunt foarte mari, în locul punctelor se pot trasa figuri geometrice cu suprafe�ele propor�ionale cu frecven�ele).

Page 146: STEFANESCU - B S - PIED - uni-muenchen.de9.3. Analiza legturilor dintre variabile prin intermediul regresiei 9.4. Indicatori de apreciere a sensului i intensit ii legturilor dintre

Pe baza corelogramelor se pot face aprecieri asupra unor caracteristici ale leg�turilor dintre variabile:

a) forma func�iei matematice adecvat� pentru exprimarea unei leg�turi;

b) sensul leg�turii dintre variabile; c) intensitatea leg�turii dintre variabile.

Fig. 9.1. Alegerea, pe cale grafic�, a func�iei matematice asociat� leg�turii dintre variabile

a) Forma func�iei matematice utilizat� în exprimarea unei

leg�turi poate fi aleas� prin tehnici grafice, folosindu-se condi�ia ca graficul func�iei s� fie cât mai apropiat de reprezent�rile valorilor variabilei. Chiar dac� nu pot conduce neap�rat la determinarea parametrilor func�iei, corelogramele faciliteaz�, cel pu�in, alegerea între o func�ie liniar� �i una neliniar� (fig. 9.1.)

b) Sensul leg�turii dintre dou� variabile poate fi apreciat

destul de facil prin intermediul corelogramelor, care relev� cre�terea sau descre�terea variabilei dependente odat� cu cre�terea variabilei independente. În figura 9.2. sunt prezentate reprezent�rile grafice ale dou� tipuri de leg�turi: o leg�tur� direct�, la care cre�terii variabilei independente îi corespunde o cre�tere a variabilei dependente (fig. 9.2.a) �i o leg�tur� invers�, pentru care cre�terea variabilei independente determin� sc�derea variabilei dependente (fig. 9.2.b).

Page 147: STEFANESCU - B S - PIED - uni-muenchen.de9.3. Analiza legturilor dintre variabile prin intermediul regresiei 9.4. Indicatori de apreciere a sensului i intensit ii legturilor dintre

Fig. 9.2. Aprecierea, pe cale grafic�, a sensului leg�turilor dintre

variabile

c) Intensitatea leg�turii dintre variabile poate fi apreciat�, pe cale grafic�, pe baza concentr�rii punctelor ce reprezint� valorile variabilelor �i a apropierii acestora de graficul func�iei ce exprim� leg�tura dintre variabile. În figura 9.3. sunt prezentate dou� leg�turi între variabile: o leg�tur� de intensitate maxim� (numit� �i leg�tur�

determinist�) în care punctele se g�sesc pe graficul func�iei asociate leg�turii (fig. 9.3.a) �i o leg�tur� de intensitate foarte slab�, în care punctele nu pot fi asociate unei func�ii (fig. 9.3.b).

Fig. 9.1. Aprecierea, pe cale grafic�, a intensit��ii leg�turii dintre

dou� variabile Exemplul 9.1. În tabelul 9.1. sunt prezentate rezultatele unei

cercet�ri asupra leg�turii dintre cheltuielile anuale pentru publicitate �i volumul desfacerilor, întreprins� asupra unui e�antion de cinci

Page 148: STEFANESCU - B S - PIED - uni-muenchen.de9.3. Analiza legturilor dintre variabile prin intermediul regresiei 9.4. Indicatori de apreciere a sensului i intensit ii legturilor dintre

firme dintr-o ramur� industrial�. Se cere s� se caracterizeze, pe baza reprezent�rii grafice, leg�tura dintre cele dou� variabile.

Rezolvare: În figura 9.4. este prezentat� corelograma asociat� leg�turii dintre cele dou� variabile. Pe baza acesteia se poate alege pentru exprimarea leg�turii o func�ie liniar�. De asemenea, se poate aprecia c� leg�tura dintre cele dou� variabile este direct� (cu o singur� excep�ie, cu cât cheltuielile pentru publicitate sunt mai mari, cu atât volumul desfacerilor este mai mare) �i de intensitate semnificativ� (punctele ce reprezint� valorile variabilelor sunt destul de apropiate de graficul func�iei liniare).

Tabelul 9.1. Valorile cheltuielilor pentru publicitate �i

ale volumului desfacerilor pentru un grup de cinci firme Nr. crt.

Cheltuieli pentru publicitate [mil. RON]

Volumul desfacerilor [mii buc.]

(0) (1) (2) 1 0,2 0,5 2 0,8 1,1 3 0,5 0,7 4 0,6 0,9 5 0,4 0,8

Fig. 9.4. Reprezentarea grafic� a rela�iei dintre cheltuielile pentru

publicitate �i volumul desfacerilor

Page 149: STEFANESCU - B S - PIED - uni-muenchen.de9.3. Analiza legturilor dintre variabile prin intermediul regresiei 9.4. Indicatori de apreciere a sensului i intensit ii legturilor dintre

Pentru distribu�iile heterograde, caracterizarea rela�iilor dintre variabile pe cale grafic� este ceva mai dificil� fa�� de seriile simple întrucât, în acest caz punctele au mai degrab� semnifica�ia unor frecven�e decât a unor valori. În consecin��, func�ia matematic� se alege astfel încât graficul ei s� fie cât mai apropiat de dreptunghiurile cu concentra�ii mari de puncte. Sensul �i intensitatea leg�turii sunt apreciate, de asemenea, pe baza concentra�iilor de puncte din dreptunghiuri.

Exemplul 9.2. În tabelul 9.2. este prezentat� o distribu�ie heterograd� care descrie vechimea în munc� �i num�rul mediu zilnic de rebuturi, pentru un grup de 25 de angaja�i ai unei firme. Se cere s� se caracterizeze pe cale grafic� leg�tura dintre cele dou� variabile.

Tabelul 9.2. Distribu�ie heterograd� asupra vechimii în munc� �i

num�rul de rebuturi Vechimea în munc�

[ani] Num�r mediu zilnic de rebuturi [buc]

(0 ; 4] (4 ; 8] (8 ; 12] (12 ; 16] (16 ; 20]

(1,0 ; 1,1] – – – 1 3 (1,1 ; 1,2] 1 1 1 2 – (1,2 ; 1,3] 2 1 5 2 – (1,3 ; 1,4] 2 1 1 – – (1,4 ; 1,5] 2 – – – – Rezolvare: În figura 9.5. este prezentat� corelograma asociat�

distribu�iei heterograde. Rela�ia dintre cele dou� variabile poate fi descris� atât printr-o func�ie liniar� cât �i printr-o func�ie neliniar�. Din considerente de simplitate s-a optat pentru o func�ie liniar� al c�rei grafic s� fie apropiat de dreptunghiurile cu concentra�ii maxime. Din aceea�i figur� se poate deduce c� leg�tura dintre cele dou� variabile este invers� (cu cât vechimea este mai mare cu atât num�rul rebuturilor este mai mic) iar unele valori sunt destul de îndep�rtate de grafic, ceea ce înseamn� c� leg�tura nu este foarte intens�.

Page 150: STEFANESCU - B S - PIED - uni-muenchen.de9.3. Analiza legturilor dintre variabile prin intermediul regresiei 9.4. Indicatori de apreciere a sensului i intensit ii legturilor dintre

Fig. 9.5. Corelograma distribu�iei heterograde

Pe lâng� avantajul simplit��ii în aplicare, tehnicile grafice de

caracterizare a leg�turilor dintre variabile au �i dezavantajul unei rigori reduse, în condi�iile în care nu pot conduce la cuantificarea aspectelor esen�iale ale rela�iilor. În plus folosirea lor este limitat�, practic, la leg�turile cu o singur� variabil� independent�, pentru rela�iile cu mai multe variabile independente aplicarea fiind foarte complex�.

9.3 Analiza leg�turilor dintre variabile prin intermediul

regresiei

9.3.1. Conceptul de regresie Termenul de regresie are semnifica�ia de studiu al leg�turilor

dintre variabile prin intermediul unor func�ii matematice numite func�ii de regresie. Valorile acestora, numite valori teoretice sunt aproxim�ri ale valorilor variabilelor dependente, care sunt numite valori empirice. Se consider� c� o valoare teoretic� este rezultatul exclusiv al factorilor de influen�� exprima�i prin variabilele independente în timp ce o valoare empiric� este rezultatul tuturor factorilor de influen�� care ac�ioneaz�, la momentul înregistr�rii, asupra fenomenului studiat. Aceast� situa�ie se transpune într-o form� matematic� astfel:

yi =f(xi) + �t = ixy + �t (9.1.)

unde:

Page 151: STEFANESCU - B S - PIED - uni-muenchen.de9.3. Analiza legturilor dintre variabile prin intermediul regresiei 9.4. Indicatori de apreciere a sensului i intensit ii legturilor dintre

- yi este valoarea empiric� a variabilei independente y ob�inut� în condi�iile i;

- f este func�ia de regresie asociat� leg�turii dintre variabila dependent� y �i variabila independent� (sau variabilele independente exprimate vectorial) x;

- xi este o valoare numeric� ce exprim� manifestarea în condi�iile i a factorilor de influen�� reprezenta�i prin variabila independent� (sau variabilele independente);

- �t este un termen numit variabil� rezidual�, care exprim� efectele pe care le au asupra variabile dependente factorii de influen�� care nu au fost exprima�i prin variabilele independente;

- este valoarea teoretic� a variabilei dependente în condi�iile i, care se ob�ine atribuind argumentului func�iei de regresie valoarea xi (altfel spus,

ixy = f(xi) ).

Parametrii unei func�ii de regresie pot rezulta din condi�ia ca pentru ansamblul observ�rilor statistice, care dau circumstan�ele de manifestare a fenomenului studiat, diferen�ele dintre valorile teoretice �i cele empirice s� fie cât mai mici (fig. 9.6.).

1xy

2xy

2y

1y

1x 2x

)( i

x

xf

y i

=

Fig. 9.6. Reprezentarea grafic� a valorilor empirice �i a valorilor

teoretice Aceast� condi�ie poate fi transpus� într-o expresie matematic�

în mai multe moduri: - minimizând suma valorilor absolute ale diferen�elor dintre valorile

teoretice �i cele empirice (se folosesc valorile absolute pentru ca diferen�ele pozitive s� nu le anuleze pe cele negative);

- minimizând suma p�tratelor diferen�elor dintre valorile teoretice �i cele empirice (prin ridicare la p�trat to�i termenii sumei devin

Page 152: STEFANESCU - B S - PIED - uni-muenchen.de9.3. Analiza legturilor dintre variabile prin intermediul regresiei 9.4. Indicatori de apreciere a sensului i intensit ii legturilor dintre

pozitivi ceea ce înl�tur� posibilitatea anul�rii reciproce a valorilor pozitive �i a celor negative).

În practic�, se prefer� de regul� a doua modalitate, care îmbrac� forma unui procedeu numit metoda celor mai mici p�trate �i are la baz� minimizarea func�iei:

( ) [ ] ( )��==

−=−=N

iix

N

iiin yyyxfaaaS

i1

2

1

210 )(,,, � (9.2.)

unde a0, a1, …, an sunt parametrii func�iei de regresie f(xi) care constituie argumente pentru func�ia S. Func�ia S fiind o func�ie de mai multe variabile, minimizarea sa poate fi realizat� pe baza ecua�iilor lui Fermat:

=∂

=∂

=∂

0

..............

0

0

1

0

na

S

a

S

a

S

(9.3.)

care conduc, în final, la rezolvarea unui sistem cu n ecua�ii. Func�iile de regresie au aplica�ii importante în practic�. Pe baza

acestora se pot face previziuni asupra efectelor posibile ale ac�iunii unor factori de influen��, atribuind diferite valori variabilelor independente �i calculând valorile teoretice ale variabilelor dependente. În raport cu valorile variabilelor independente folosite, se pot delimita dou� forme ale previziunii pe baza func�iilor de regresie:

- interpolarea, când valorile variabilelor independente se afl� în interiorul intervalului de valori ob�inut prin observ�ri statistice;

- extrapolarea, când valorile variabilelor independente se afl� în afara intervalului de valori ob�inut prin observa�ii statistice.

Se consider� c� în general acurate�ea previziunilor prin interpolare este superioar� acurate�ei previziunilor prin extrapolare întrucât pentru valorile variabilelor independente din afara intervalului ob�inut prin observa�ii statistice fenomenul ar putea urma alte mecanisme decât cele descrise prin func�ia de regresie.

În practic� sunt folosite diferite forme ale regresiei, pentru a c�ror clasificare pot fi utilizate mai multe criterii:

a) num�rul de variabile independente;

Page 153: STEFANESCU - B S - PIED - uni-muenchen.de9.3. Analiza legturilor dintre variabile prin intermediul regresiei 9.4. Indicatori de apreciere a sensului i intensit ii legturilor dintre

b) ecua�ia func�iei de regresie; c) forma seriei statistice care descrie variabilele

utilizate. a) În func�ie de num�rul de variabile independente, regresiile pot fi împ�r�ite în dou� categorii:

a1) regresii unifactoriale, la care se utilizeaz� o singur� variabil� independent�;

a2) regresii multifactoriale, la care se utilizeaz� mai multe variabile independente.

b) În raport cu ecua�ia func�iei de regresie, se pot delimita dou� forme de regresie:

b1) regresii liniare, la care se folosesc func�ii cu ecua�ii liniare;

b2) regresii neliniare, la care se folosesc func�ii cu ecua�ii neliniare.

c) În func�ie de forma seriei statistice care descrie variabilele, regresiile pot fi grupate în dou� categorii:

c1) regresii pentru serii simple; c2) regresii pentru distribu�ii heterograde.

9.3.2. Regresii unifactoriale Metodele regresiilor unifactoriale se diferen�iaz� în raport cu

forma ecua�iilor func�iilor de regresie: - metode pentru regresii unifactoriale liniare; - metode pentru regresii unifactoriale neliniare.

9.3.2.1. Regresii unifactoriale liniare Procedeele regresiei unifactoriale liniare prezint� anumite

particularit��i în func�ie de forma seriei statistice care descrie variabilele, ceea ce justific� împ�r�irea în dou� categorii:

- procedee ale regresiei unifactoriale liniare pentru serii simple;

- procedee ale regresiei unifactoriale liniare ale distribu�iilor heterograde.

9.3.2.1.1. Regresii unifactoriale liniare pentru seriile simple

Page 154: STEFANESCU - B S - PIED - uni-muenchen.de9.3. Analiza legturilor dintre variabile prin intermediul regresiei 9.4. Indicatori de apreciere a sensului i intensit ii legturilor dintre

Regresia unifactorial� liniar� pentru seriile simple are la baz� adaptarea formulelor metodei celor mai mici p�trate pentru o func�ie liniar� cu un singur argument:

ix bxayi

+= (9.4.)

În acest caz, func�ia care exprim� suma p�tratelor diferen�elor dintre valorile teoretice �i valorile empirice îmbrac� forma:

( ) ( ) ( )��==

−+=−=N

i

ix

N

i

ixba ybayySii

1

2

1

2, (9.5)

Determinarea valorilor parametrilor a �i b pentru care func�ia S are un minim presupune rezolvarea ecua�iilor lui Fermat:

=∂

=∂

0

0

b

Sa

S

(9.6)

Derivata par�ial� a func�iei S în raport cu argumentul a are expresia:

( )[ ] ( ) ( ) = �

���

�−+⋅

−+∂=

−+∂=

∂��

==

N

i

iiii

N

i

ii ybxaa

ybxa

a

ybxa

a

S

11

2

( )[ ] ���

����

�−+⋅=−+××= ���

===

N

i

i

N

i

i

N

i

ii yxbaNybxa111

212 (9.7.)

În raport cu argumentul b, derivata par�ial� a func�iei S are expresia:

( )[ ] ( ) ( ) = �

���

�−+⋅

−+∂=

−+∂=

∂��==

N

i

iiii

N

i

ii ybxab

ybxa

b

ybxa

b

S

11

2

( )[ ] ���

����

�−+=−+××= ����

====

N

i

ii

N

i

i

N

i

i

N

i

iii yxxbxaybxaX11

2

11

22

Introducând expresiile derivatelor par�iale în ecua�iile lui

Fermat ob�inem:

=��

���

�−+=

=��

���

�−+⋅=

� ���

� ��

= ===

= ==

02

02

1 11

2

1

1 11N

i

N

iii

N

ii

N

ii

N

i

N

ii

N

ii

yxxbxaa

S

yxbaNa

S

(9.9)

Rezult� un sistem de ecua�ii prin care pot fi determina�i parametrii a �i b ai func�iei de regresie:

Page 155: STEFANESCU - B S - PIED - uni-muenchen.de9.3. Analiza legturilor dintre variabile prin intermediul regresiei 9.4. Indicatori de apreciere a sensului i intensit ii legturilor dintre

=+

=+⋅

���

��

===

==N

i

ii

N

i

i

N

i

i

N

i

i

N

i

i

yxxbxa

yxbaN

11

2

1

11 (9.10)

Exemplul 9.3. Se cere s� se determine parametrii unei func�ii

de regresie care s� exprime dependen�a volumului desfacerilor fa�� de cheltuielile pentru publicitate pe baza seriei simple prezentate în tabelul 9.1.

Rezolvare: În aceast� aplica�ie vom nota cu xi cheltuielile pentru publicitate �i cu yi volumul desfacerilor.

Tabelul 9.3. Valori intermediare utilizate în calculul parametrilor func�iei de

regresie pentru o serie statistic� simpl�

Nr. crt.

xi

[mil. RON]

yi

[mii buc.]

2ix

[(mil. RON)2]

2iy

[(mii buc.)2]

ii yx ⋅

[mil. RON × mii buc. ]

(0) (1) (2) (3) (4) (5) 1 0,2 0,5 0,04 0,25 0,10 2 0,8 1,1 0,64 1,21 0,88 3 0,5 0,7 0,25 0,49 0,35 4 0,6 0,9 0,36 0,81 0,54 5 0,4 0,8 0,16 0,64 0,32

Total 2,5 4,0 1,45 3,40 2,19 Simbol pentru total

�=

N

i

ix1

�=

N

i

iy1

�=

N

i

ix1

2 �=

N

i

iy1

2 i

N

i

i yx�=1

În tabelul 9.3. sunt prezentate valorile intermediare pe baza

c�rora poate fi constituit sistemul de ecua�ii prin care pot fi determinate valorile parametrilor func�iei liniare:

−+

−+⋅

���

��

===

==N

i

ii

N

i

i

N

i

i

N

i

i

N

i

i

yxxbxa

yxbaN

11

2

1

11

adic�:

Page 156: STEFANESCU - B S - PIED - uni-muenchen.de9.3. Analiza legturilor dintre variabile prin intermediul regresiei 9.4. Indicatori de apreciere a sensului i intensit ii legturilor dintre

��

=+

=+

19,245,15,2

0,45,25

ba

ba

Prin rezolvarea sistemului rezult�: a = 0,325 mii buc., b = 0,95

mil. buc/RON În consecin��, func�ia de regresie are formula: ix xy

i⋅+= 95,0325,0

Pe baza unei func�ii de regresie liniar� pot fi previzionate, destul de facil, efectele factorilor de influen��. De asemenea, func�iile liniare de regresie sunt aplicate frecvent în cadrul simul�rilor în care se determin� modul în care trebuie ac�ionat asupra factorilor controlabili (exprima�i prin variabile independente) astfel încât s� se ob�in� anumite efecte.

Exemplul 9.4. Pe baza func�iei de regresie liniar� determinat�

în exemplul anterior se cere s� se previzioneze care ar fi valorile volumului vânz�rilor în situa�ia în care cheltuielile pentru publicitate ar lua dou� valori: 0,7 mil. RON �i 0,9 mil. RON.

Se cere, de asemenea, s� se aprecieze care, ar trebui s� fie valoarea cheltuielilor de publicitate pentru ca volumul vânz�rilor s� reprezinte 0,6 mii buc��i.

Rezolvare: Previziunea în raport cu prima valoare a

cheltuielilor de publicitate este o interpolare iar valoarea prognozat� a volumului vânz�rilor reprezint�:

99,07,095,0325,095,0325,0ˆ )7,0( =×+=×+= ix xyi

mii buc.

Previziunea în raport cu a doua valoare a cheltuielilor de publicitate este o extrapolare (cea ce înseamn� c� acurate�ea sa este inferioar� fa�� de prima previziune) iar valoarea prognozat� a volumului vânz�rilor reprezint�:

18,19,095,0325,095,0325,0ˆ )9,0( =×+=×+= ixxy

i mii buc

În ce prive�te determinarea nivelului cheltuielilor de publicitate pentru care volumul vânz�rilor ar reprezenta 0,6 mii buc��i (valoare notat� ca yopt) este necesar s� se rezolve ecua�ia:

ix xyopt

×+= 95,0325,0ˆ adic� 0,6 = 0,325 + 0,95 × ix de unde rezult�

2895,0ˆ =ix mil. RON.

Page 157: STEFANESCU - B S - PIED - uni-muenchen.de9.3. Analiza legturilor dintre variabile prin intermediul regresiei 9.4. Indicatori de apreciere a sensului i intensit ii legturilor dintre

9.3.2.1.2. Regresii unifactoriale liniare pentru distribu�iile

heterograde Parametrii regresiilor pentru distribu�ii heterograde pot fi

determina�i prin ra�ionamente similare celor folosite în cazul seriilor simple. Dac� se consider� c� unit��ile din fiecare subgrup� au valorile pentru cele dou� caracteristice egale cu centrele intervalelor de varia�ie, se ajunge la urm�toarele rela�ii de echivalen��:

- expresia N este echivalent� cu expresia

����=== =

==Ky

j

jj

Kx

i

xi

Kx

i

Ky

j

xyij nnn

111 1

, unde xyijn este frecven�a subgrupei cu

num�rul i dup� caracteristica x �i cu num�rul de ordine j dup� caracteristica y (dup� cum se �tie, frecven�a absolut� a unei grupe este egal� cu suma frecven�elor absolute ale subgrupelor componente):

�=

=Ky

j

xyij

xi nn

1

(9.11)

�i

�=

=Ky

i

xyij

xj nn

1

(9.12)

de unde rezult�:

������== == ==

===Ky

j

yj

Kx

j

Ky

i

xyij

Kx

i

Ky

j

xyij

Kx

i

xi nnnn

11 11 11

(9.13)

- expresia �=

N

i

ix1

este echivalent� cu expresia xi

K

i

i nxx

⋅�=1

' ;

- expresia �=

N

i

iy1

este echivalent� cu expresia yj

K

j

nyy

⋅�=1

' ;

- expresia �=

N

i

ix1

2 este echivalent� cu expresia xi

K

i

i nxx

⋅�=1

2' ;

- expresia �=

N

i

iy1

2 este echivalent� cu expresia yj

K

i

i nyx

⋅�=1

2 ;

- expresia �=

N

i

ii yx1

este echivalent� cu expresia

xyij

K

i

i

kY

j

i nyxx

⋅⋅��= =1

'

1

' =

Page 158: STEFANESCU - B S - PIED - uni-muenchen.de9.3. Analiza legturilor dintre variabile prin intermediul regresiei 9.4. Indicatori de apreciere a sensului i intensit ii legturilor dintre

= xyij

K

i

kY

j

ij nxyy

� �= =

⋅1 1

'' = xyij

K

i

Ky

j

ji nyxx

� �= =

⋅1 1

''

În raport cu aceste rela�ii de echivalen�� se ob�in pentru ecua�iile lui Fermat expresiile:

=+

=+

����

���

= ===

===

Kx

i

Ky

j

xyjji

Kx

i

xi

K

i

xi

Ky

j

yjj

Kx

i

xii

K

i

xyij

nyxnxbnxa

nynxbna

x

y

1 1'

''

1'

2'

1'

'

1

'

1

'

1 (9.14)

Exemplul 9.5.: Se cere s� se determine parametrii unei func�ii

de regresie care s� exprime dependen�a num�rului mediu zilnic de rebuturi al unui angajat fa�� de vechimea acestuia în munc�, pe baza distribu�iei heterograde prezentat� în tabelul 9.2. Se cere, de asemenea, ca pe baza func�iei de regresie s� se aprecieze care ar fi num�rul mediu zilnic de rebuturi al unui angajat cu vechimea în munc� de cinci ani.

Page 159: STEFANESCU - B S - PIED - uni-muenchen.de9.3. Analiza legturilor dintre variabile prin intermediul regresiei 9.4. Indicatori de apreciere a sensului i intensit ii legturilor dintre

Tabelul 9.4. Valori intermediare utilizate pentru calculul parametrilor func�iei de regresie pentru o distribu�ie heterograd�

xi – 1 - xi

[ani] yj – 1- yj [buc.]

(0 ; 4]

(4 ; 8]

(8 ; 12]

(12 ; 16]

(16 ; 20]

Total Simbol

pentru total

'jy

[buc]

y

jj ny ⋅'

[buc]

y

jj ny ⋅2'

[buc2] � ⋅⋅ xy

ijij nxy''

[buc × ani]

(1,0 ; 1,1] – – – 1 3 4 yn1 1,05 4,20 4,4100 71,4

(1,1 ; 1,2] 1 1 1 2 – 5 yn2 1,15 5,75 6,6125 52,9

(1,2 ; 1,3] 2 1 5 2 – 10 yn3 1,25 12,50 15,6250 110,0

(1,3 ; 1,4] 2 1 1 – – 4 yn4 1,35 5,40 7,2900 27,0

(1,4 ; 1,5] 2 – – – – 2 yn5 1,45 2,90 4,2050 5,8

Total 7 3 7 5 3 25 �=

Ky

j

y

jn1

× 30,75 38,1425 267,1

Simbol pentru total

xn1 x

n2 xn3 x

n4 xn5 �

=

Kx

i

x

in1

× × �=

⋅Ky

j

y

jj ny1

' �=

⋅Ky

j

y

jj ny1

2' ��==

⋅Ky

j

xy

iji

Kx

i

j nxy1

'

1

'

'ix [ani] 2 6 10 14 18 × ×

x

ii nx ×' [ani] 14 18 70 70 54 226 �=

Kx

i

x

iinx1

'

x

ii nx ×2' [ani] 28 108 700 980 972 2.788 �=

Kx

i

x

ii nx1

2'

�=

⋅⋅Ky

j

xy

ijji nyx1

''

[ani × buc] 18,5 22,5 87,5 81,9 56,7 267,1 ��

==

⋅Ky

j

xy

ijj

Kx

i

i nyx1

'

1

'

Page 160: STEFANESCU - B S - PIED - uni-muenchen.de9.3. Analiza legturilor dintre variabile prin intermediul regresiei 9.4. Indicatori de apreciere a sensului i intensit ii legturilor dintre

Rezolvare: În tabelul 9.4. sunt prezentate valorile intermediare care conduc la determinarea parametrilor func�iei de regresie. Înlocuind aceste valori în ecua�iile lui Fermat se ob�ine:

��

=+

=+

1,267788.2226

75,3022625

ba

ba

Prin rezolvarea sistemului rezult�: ��

=

−=

buca�i

buc��i/an

362,1

0146,0

a

b

adic�: ix xyi

0146,0362,1 −= .

Pe baza func�iei de regresie se poate aprecia c� pentru un angajat cu vechimea în munc� de cinci ani, num�rul mediu zilnic de rebuturi ar avea valoarea

289,150146,0362,1)5(ˆ =×−=ixy buc��i.

9.3.2.2. Regresii unifactoriale neliniare În acest subcapitol vor fi prezentate succint câteva dintre formele de

regresii unifactoriale neliniare folosite destul de frecvent în practic�: - regresii polinomiale; - regresii exponen�iale; - regresii hiperbolice; - regresii logaritmice.

9.3.2.2.1. Regresii polinomiale O func�ie de regresie polinomial� îmbrac� forma:

pipiix xaxaxaay

i++++= �

2210 (9.15.)

unde p este gradul polinomului asociat func�iei. Modalitatea de determinare a parametrilor unei func�ii de regresie

polinomial� este asem�n�toare celei utilizate pentru func�iile de regresie liniare (de altfel o func�ie de regresie liniar� poate fi considerat� o func�ie de regresie polinomial� de gradul unu). În continuare vom prezenta modul de calcul al parametrilor unei func�ii polinomiale de gradul doi, ce are forma:

2210 iix xaxaay

i++= (9.16.)

Pentru o serie simpl�, func�ia care exprim� suma p�tratelor diferen�elor dintre valorile teoretice �i valorile empirice este dat� de rela�ia:

( ) ( ) ( )��==

−++=−=N

iiii

N

iixaaa yxaxaayyS

i1

22210

1

2,, 210

(9.17.)

Pentru calculul parametrilor a0, a1 �i a2 se pot folosi ecua�iile lui Fermat:

Page 161: STEFANESCU - B S - PIED - uni-muenchen.de9.3. Analiza legturilor dintre variabile prin intermediul regresiei 9.4. Indicatori de apreciere a sensului i intensit ii legturilor dintre

=∂

=∂

=∂

0

0

0

2

1

0

a

S

a

S

a

S

(9.18)

Derivata par�ial� a func�iei S în raport cu argumentul a0 are expresia:

( )[ ]

( ) ( )

( )[ ]

.)19.9(2

212

2

11

22

110

11

22

11

10

0

2210

0

2210

0

2210

0 0

22210

0

��

���

�−++⋅=

=��

���

�−++=−++××=

= �

���

�−++×

−++∂×=

=∂

−++∂=

���

�����

===

=====

=

=

N

ii

N

ii

N

ii

N

ii

N

ii

N

ii

N

i

N

iiii

N

iiii

iii

N

i

iii

yxaxaaN

yxaxaayxaxaa

yxaxaaa

yxaxaa

a

yxaxaa

a

S

Pentru derivata par�ial� a func�iei S în raport cu argumentul a1 se ob�ine expresia:

( )[ ]

( ) ( )

( )[ ] ( )

.)20.9(2

2

22

2

11

32

1

21

10

11

32

1

21

10

0

32

210

0

2210

0

2210

1

2210

0 1

22210

1

��

���

�−++=

=��

���

�−++

−++=−++××=

= �

���

�−++×

−++∂×=

=∂

−++∂=

����

����

��

====

====

==

=

=

N

iii

N

ii

N

ii

N

ii

N

iii

N

ii

N

ii

N

ii

N

iiiiii

N

iiiii

N

iiii

iii

N

i

iii

yxxaxaxa

yxxaxaxa

xyxaxaxayxaxaax

yxaxaaa

yxaxaa

a

yxaxaa

a

S

În raport cu argumentul a2, derivata par�ial� a func�iei S are expresia:

Page 162: STEFANESCU - B S - PIED - uni-muenchen.de9.3. Analiza legturilor dintre variabile prin intermediul regresiei 9.4. Indicatori de apreciere a sensului i intensit ii legturilor dintre

( )[ ]

( ) ( )

( )[ ] ( )

.)21.9(2

2

22

2

1

2

1

42

1

31

1

20

1

2

1

42

1

31

1

20

0

242

31

20

0

2210

2

0

2210

2

2210

0 2

22210

1

��

���

�−++=

=��

���

�−++

−++=−++××=

= �

���

�−++×

−++∂×=

=∂

−++∂=

����

����

��

====

====

==

=

=

N

iii

N

ii

N

ii

N

ii

N

iii

N

ii

N

ii

N

ii

N

iiiiii

N

iiiii

N

iiii

iii

N

i

iii

yxxaxaxa

yxxaxaxa

xyxaxaxayxaxaax

yxaxaaa

yxaxaa

a

yxaxaa

a

S

Dac� se introduc expresiile derivatelor par�iale în ecua�iile lui Fermat se ob�ine:

=��

���

�−++=

=��

���

�−++=

=��

���

�−++⋅=

����

����

���

====

====

===

02

02

02

1

2

1

42

1

31

1

20

2

11

32

1

21

10

1

11

22

110

0

N

iii

N

ii

N

ii

N

ii

N

iii

N

ii

N

ii

N

ii

N

ii

N

ii

N

ii

yxxaxaxaa

S

yxxaxaxaa

S

yxaxaaNa

S

(9.22.)

Rezult� astfel urm�torul sistem de ecua�ii care poate fi folosit în determinarea parametrilor a0, a1 �i a2:

=++

=++

=++⋅

����

����

���

====

====

===

N

iii

N

ii

N

ii

N

ii

N

iii

N

ii

N

ii

N

ii

N

ii

N

ii

N

ii

yxxaxaxa

yxxaxaxa

yxaxaaN

1

2

1

42

1

31

1

20

11

32

1

21

10

11

22

110

(9.22.)

Aceste rela�ii pot fi adaptate �i pentru variabile reprezentate prin distribu�ii heterograde dac� se folosesc rela�iile de echivalen�� utilizate în cazul regresiei liniare, la care se adaug� înc� trei:

- expresia �=

N

iix

1

3 este echivalent� cu expresia xi

N

ii nx ⋅�

=1

3' ;

- expresia �=

N

iix

1

4 este echivalent� cu expresia xi

N

ii nx ⋅�

=1

4' ;

- expresia �=

⋅N

iii yx

1

2 este echivalent� cu expresia ��= =

⋅⋅x yK

i

xyijj

K

ji nyx

1

'

1

2' .

Page 163: STEFANESCU - B S - PIED - uni-muenchen.de9.3. Analiza legturilor dintre variabile prin intermediul regresiei 9.4. Indicatori de apreciere a sensului i intensit ii legturilor dintre

Se ob�ine astfel urm�torul sistem de ecua�ii care poate fi folosit în determinarea parametrilor unei regresii polinomiale de gradul doi la care se utilizeaz� o distribu�ie heterograd�:

=++

=++

=++

��� ��

��� ��

�� ���

= == ==

= == ==

== == =

x yx xx

x yx xx

yx xx y

K

i

K

j

xyijji

xi

K

i

K

ii

xii

K

i

xii

K

i

K

j

xyijji

xi

K

i

K

ii

xii

K

i

xii

K

j

yjj

xi

K

i

K

ii

xii

K

i

K

j

xyij

nyxnxanxanxa

nyxnxanxanxa

nynxanxana

1 1

'2'

1 1

4'2

3'1

1

2'0

1 1

''

1 1

3'2

2'1

1

'0

1

'

1 1

2'2

'1

1 10

(9.24.)

9.3.2.2.2. Regresii exponen�iale O func�ie de regresie exponen�ial� are forma:

eex bayi

⋅= (9.25.)

Ecua�ia func�iei, destul de complex�, induce unele dificult��i în aplicarea direct� a metodei celor mai mici p�trate. Din acest motiv, în practic�, se prefer� logaritmarea expresiei func�iei:

( ) eexee

xeex bxababay

ilglglglglglg +=+=⋅= (9.26.)

Dac� se fac urm�toarele transform�ri:

ii xx yy lg' = ; ee aa lg' = ; ee bb lg' = ;

se ajunge la o func�ie de regresie liniar� de forma:

ieex xbayi

⋅+= ''' (9.27.)

pentru care parametrii 'ea �i '

eb pot fi determina�i printr-o modalitate prezentat�

anterior. Odat� calculate valorile teoretice 'ixy acestea pot fi transformate, prin

antilogaritmare, în valorile teoretice ix

y : ( )'logii xx yantiy =

(9.29.) 9.3.2.2.3. Regresii hiperbolice O func�ie de regresie hiperbolic� are ecua�ia:

i

hhxx

bayi

1⋅+= (9.29.)

Modalitatea de determinare a parametrilor ah �i bh este similar� celei aplicat� în cazul regresiei liniare. Ecua�iile lui Fermat au, în aceast� situa�ie, forma:

Page 164: STEFANESCU - B S - PIED - uni-muenchen.de9.3. Analiza legturilor dintre variabile prin intermediul regresiei 9.4. Indicatori de apreciere a sensului i intensit ii legturilor dintre

⋅=⋅+⋅

=⋅+⋅

���

��

===

==

N

ii

i

N

i i

h

N

i i

h

N

ii

N

i i

hh

yxx

bx

a

yx

baN

112

1

11

111

1

(9.30.)

Ecua�iile utilizate pentru o serie simpl� pot fi adaptate �i pentru variabile reprezentate prin distribu�ii heterograde. Într-o astfel de situa�ie se pot folosi rela�iile de echivalen�� folosite pentru regresia liniar�, la care se adaug� înc� trei:

- expresia �=

N

i ix1

1 este echivalent� cu expresia x

i

K

i i

nx

x

⋅�=1

'

1;

- expresia �=

N

i ix12

1 este echivalent� cu expresia x

i

K

i i

nx

x

⋅�=1

2'

1;

- expresia �=

⋅N

ii

i

yx1

1 este echivalent� cu expresia ��

= =

⋅⋅x yK

i

xyijj

K

j i

nyx1

'

1'

1.

Se ob�ine astfel sistemul de ecua�ii pe baza c�rora pot fi determina�i parametrii unei regresii hiperbolice la care se utilizeaz� o distribu�ie heterograd�:

⋅=⋅⋅+⋅⋅

=⋅⋅+

����

����

= ===

=== =

x yxx

yxx y

K

i

K

j

xyijj

i

K

i

xi

i

h

K

i

xi

i

h

K

j

yjj

xi

K

i i

h

K

i

K

j

xyijh

nyx

nx

bnx

a

yynx

bna

1 1

'

12'

1'

1

'

1'

1 1

111

1

(9.31.)

9.3.2.2.4. Regresii logaritmice O func�ie de regresie logaritmic� are expresia:

illx xbayi

lg⋅+= (9.32.)

Parametrii al �i bl pot fi determina�i printr-un ra�ionament similar celui folosit în cazul regresiei liniare. Pentru regresia logaritmic� ecua�iile lui Fermat au forma:

( ) ( )

⋅=⋅+⋅

=⋅+⋅

���

��

===

==

N

iii

N

ill

N

iil

N

ii

N

iill

xyxbxa

yxbaN

11

2

1

11

lglglg

lg

(9.33.)

Ecua�iile regresiei logaritmice stabilite pentru o serie simpl� pot fi adaptate pentru o distribu�ie heterograd�. În acest scop pot fi utilizate rela�iile de echivalen�� formulate pentru regresia liniar�, la care se adaug� înc� trei:

- expresia �=

N

iix

1

lg este echivalent� cu expresia ( )[ ]�=

⋅xK

i

xii nx

1

lg ;

Page 165: STEFANESCU - B S - PIED - uni-muenchen.de9.3. Analiza legturilor dintre variabile prin intermediul regresiei 9.4. Indicatori de apreciere a sensului i intensit ii legturilor dintre

- expresia ( )�=

N

iix

1

2lg este echivalent� cu expresia ( )[ ]�=

⋅xK

i

xii nx

1

2lg ;

- expresia �=

⋅N

iii xy

1

lg este echivalent� cu expresia ( )��= =

⋅x yK

i

K

j

xyijji nyx

1 1

'lg .

Se ob�ine astfel un sistem de ecua�ii care poate fi folosit în calculul parametrilor unei regresii logaritmice la care se utilizeaz� o distribu�ie heterograd�:

( )

( ) ( ) ( )

⋅=⋅⋅+⋅⋅

⋅=⋅+

����

����

= ===

=== =

x yxx

yxx y

K

i

K

j

xyijji

K

iixilix

K

iil

K

i

yjj

K

iixil

K

i

K

j

xyijl

nyxnxbnxa

nynxbna

1 1

'

1

2'

1

'

1

'

1

'

1 1

lglglg

lg

(9.34.)

9.3.3. Regresii multifactoriale Regresiile multifactoriale sunt folosite, de regul�, în cazul unor fenomene

desf��urate în condi�ii complexe, pentru care factorii relevan�i de influen�� nu pot fi exprima�i printr-o singur� variabil� independent�. La fel ca în cazul regresiei unifactoriale, func�iile folosite în regresia multifactorial� pot îmbr�ca diferite forme: liniare, polinomiale, exponen�iale, hiperbolice, logaritmice etc. De exemplu, o func�ie de regresie multifactorial� liniar� cu dou� variabile are forma:

21 210 imimmx xaxaayi

++= (9.35.)

Func�ia S care exprim� suma p�tratelor diferen�elor dintre valorile teoretice �i valorile empirice are, în acest caz, expresia:

( ) ( ) ( )�� −+⋅+=−==

221

1

2,, 20210

iimimm

N

iixaaa yxaxaayyS

iimmm (9.36.)

Parametrii 0ma ,

1ma �i 2ma ai func�iei de regresie pot fi determina�i pe

baza ecua�iilor lui Fermat.

=∂

=∂

=∂

0

0

0

2

1

0

m

m

m

a

S

a

S

a

S

(9.36.)

Derivata par�ial� a func�iei S în raport cu argumentul 0ma are expresia:

Page 166: STEFANESCU - B S - PIED - uni-muenchen.de9.3. Analiza legturilor dintre variabile prin intermediul regresiei 9.4. Indicatori de apreciere a sensului i intensit ii legturilor dintre

( )[ ]

( ) ( )

( )

��

���

�−++⋅=

=−⋅+⋅+=

=⋅+⋅+⋅⋅=

= �

���

�⋅+⋅+⋅

⋅+⋅+∂⋅=

=∂

⋅+⋅+∂=

���

����

===

====

=

=

=

N

ii

N

iim

N

iimm

N

ii

N

iimi

N

im

N

im

N

iimimm

N

iimimm

m

imimm

N

i m

imimm

m

yxaxaaN

yxaxaa

xaxaa

xaxaaa

xaxaa

a

xaxaa

a

S

112

11

1121

11

121

121

21

1

221

210

210

210

210

0

210

0

210

0

2

2

12

2

(9.38.)

Pentru derivata par�ial� a func�iei S în raport cu argumentul 1ma se ob�ine

expresia:

( )[ ]

( )( )

( )[ ]

( )

( ).38.92

2

2

2

2

11

121

1

21

11

11

121

1

21

11

1121

211

1211

121

21

1

221

210

210

210

210

210

1

210

1

210

1

��

���

�⋅−⋅++=

=��

���

�⋅−⋅⋅+⋅+⋅=

=⋅−⋅⋅+⋅+⋅=

=−⋅+⋅+⋅=

= �

���

�−⋅+⋅+

−⋅+⋅+∂×=

=∂

−⋅+⋅+∂=

����

����

====

====

=

=

=

=

N

iii

N

iiim

N

iim

N

iim

N

iii

N

iiim

N

iim

N

iim

N

iiiiimimim

N

iiimimmi

N

iiimimm

m

iimimm

N

i m

iimimm

m

yxxxaxaxa

yxxxaxaxa

yxxxaxaxa

yxaxaax

yxaxaaa

yxaxaa

a

yxaxaa

a

S

În raport cu argumentul 2ma , derivata par�ial� a func�iei S are expresia:

Page 167: STEFANESCU - B S - PIED - uni-muenchen.de9.3. Analiza legturilor dintre variabile prin intermediul regresiei 9.4. Indicatori de apreciere a sensului i intensit ii legturilor dintre

( )[ ]

( )( )

( )[ ]

( )

( ).39.92

2

2

2

2

12

1

22

121

12

12

1

22

121

12

12

22212

1212

121

21

1

221

210

210

210

210

210

2

210

2

210

1

��

���

�⋅−+⋅+=

=��

���

�⋅−⋅+⋅⋅+⋅=

=⋅−⋅+⋅⋅+⋅=

=−⋅+⋅+⋅=

= �

���

�−⋅+⋅+

−⋅+⋅+∂×=

=∂

−⋅+⋅+∂=

����

����

====

====

=

=

=

=

N

iii

N

iim

N

iiim

N

iim

N

iii

N

iim

N

iiim

N

iim

N

iiiimiimim

N

iiimimmi

N

iiimimm

m

iimimm

N

i m

iimimm

m

yxxaxxaxa

yxxaxxaxa

yxxaxxaxa

yxaxaax

yxaxaaa

yxaxaa

a

yxaxaa

a

S

Introducând expresiile derivatelor par�iale în ecua�iile lui Fermat se ob�ine:

=��

���

�⋅−+⋅+=

=��

���

�⋅−⋅++=

=��

���

�−++⋅=

����

����

���

====

====

===

02

02

02

12

1

22

121

12

11

121

1

21

11

112

11

210

2

210

1

210

0

N

iii

N

iim

N

iiim

N

iim

m

N

iii

N

iiim

N

iim

N

iim

m

N

ii

N

iim

N

iimm

m

yxxaxxaxaa

S

yxxxaxaxaa

S

yxaxaaNa

S

(9.40.)

Rezult� astfel un sistem de ecua�ii prin a c�rui rezolvare pot fi ob�inute valorile parametrilor

0ma , 1ma �i

1ma :

⋅=+⋅+

⋅=⋅++

=++⋅

����

����

���

====

====

===

N

iii

N

iim

N

iiim

N

iim

N

iii

N

iiim

N

iim

N

iim

N

ii

N

iim

N

iimm

yxxaxxaxa

yxxxaxaxa

yxaxaaN

12

1

22

121

12

11

121

1

21

11

112

11

210

210

210

(9.41.)

9.4. Indicatori de apreciere a sensului �i intensit��ii leg�turilor dintre variabile

În acest subcapitol vor fi prezentate succint cinci m�rimi utilizate destul

de frecvent în cuantificarea sensului �i intensit��ii leg�turilor dintre variabile: - coeficientul de asociere; - covarian�a;

Page 168: STEFANESCU - B S - PIED - uni-muenchen.de9.3. Analiza legturilor dintre variabile prin intermediul regresiei 9.4. Indicatori de apreciere a sensului i intensit ii legturilor dintre

- coeficientul de corela�ie liniar� simpl�; - coeficientul de determinare; - raportul de corela�ie.

9.4.1. Coeficientul de asociere Coeficientul de asociere este o m�rime propus� de statisticianul G.U.

Yule pentru evaluarea leg�turii dintre dou� atribute de ordin calitativ. Pentru determinarea coeficientului de asociere este necesar ca popula�ia studiat� s� fie împ�r�it�, în raport cu cele dou� atribute, notate cu A �i B, în patru subgrupe (tabelul 9.5.): - unit��ile care au atât atributul A cât �i atributul B, al c�ror num�r este notat

cu AB; - unit��ile care au atributul A dar nu au atributul B ci opusul acestuia �, al

c�ror num�r este notat cu A�; - unit��ile care nu au atributul A ci opusul acestuia � �i care au atributul B, al

c�ror num�r este notat cu B�; - unit��ile care nu au nici atributul A nici atributul B ci opusele acestora, adic� �, respectiv �, al c�ror num�r este notata cu ��.

Tabelul 9.5. Împ�r�irea unei popula�ii statistice în raport cu dou� atribute

Primul atribut

Al doilea atribut

A � Total

B AB B� B

� A� �� �

Total A � N

Valoarea coeficientului de asociere, notat cu Qas, este dat� de rela�ia:

αβαβ

αβαβ

BAAB

BAABQas

×+×

×−×= (9.42.)

Domeniul de varia�ie a coeficientului de asociere este reprezentat de intervalul [–1 ; 1]. O valoare negativ� indic� o leg�tur� invers� între atributul A �i atributul B în timp ce o valoare pozitiv� semnific� o leg�tur� direct�. Intensitatea leg�turii este cu atât mai mare cu cât valoarea absolut� a coeficientului este mai mare. În tabelul 9.6. sunt prezentate intervalele de valori ale m�rimii în raport cu care sunt apreciate sensul �i intensitatea leg�turii.

Page 169: STEFANESCU - B S - PIED - uni-muenchen.de9.3. Analiza legturilor dintre variabile prin intermediul regresiei 9.4. Indicatori de apreciere a sensului i intensit ii legturilor dintre

Tabelul 9.6. Aprecierea sensului �i intensit��ii unei leg�turi în raport cu coeficientul de asociere

Nr. crt.

Valori ale coeficientului de asociere

Apreciere asupra sensului �i intensit��ii leg�turii

1. Qas = –1 leg�tur� invers� determinist� 2. –1 < Qas < – 0,9 leg�tur� invers� foarte pronun�at� 3. – 0,9 ≤ Qas < – 0,7 leg�tur� invers� pronun�at� 4. – 0,7 ≤ Qas < – 0,5 leg�tur� invers� moderat� 5. – 0,5 ≤ Qas < – 0,3 leg�tur� invers� slab� 6. – 0,3 ≤ Qas < 0 leg�tur� invers� foarte slab� 7. Qas = 0 nu exist� leg�tur� între cele dou� variabile 8. 0 < Qas ≤ 0,3 leg�tur� direct� foarte slab� 9. 0,3 < Qas ≤ 0,5 leg�tur� direct� slab�

10. 0,5 < Qas ≤ 0,7 leg�tur� direct� moderat� 11. 0,7 < Qas ≤ 0,9 leg�tur� direct� pronun�at� 12. 0,9 < Qas ≤ 1 leg�tur� direct� foarte pronun�at� 13. Qas = 0 leg�tur� direct� determinist�

Exemplul 9.6. Clien�ii unei firme au fost grupa�i în raport cu dou�

caracteristici: sexul �i onorarea facturilor (tabelul 9.7.). Se cere s� se aprecieze, pe baza coeficientului de asociere, leg�tura care se poate face între sexul masculin al clien�ilor �i calitatea acestora de restan�ier.

Tabelul 9.7. Gruparea clien�ilor unei firme în raport cu sexul �i cu onorarea facturilor

Sex

Onorarea facturilor

B�rba�i (A)

Femei (�)

Total

Restan�ieri (B) 15 5 20 Buni platnici (�) 45 35 80

Total 60 40 100

Rezolvare: Valoarea coeficientului de asociere reprezint�:

4,05453515

5453515=

×+×

×−×=

×+×

×−×=

αβαβ

αβαβ

BAAB

BAABQas ,

ceea ce înseamn� c� între calitatea de b�rbat �i cea de restan�ier exist� o leg�tur� direct� dar slab�.

9.4.2. Covarian�a dintre dou� variabile Covarian�a dintre dou� variabile, x �i y, este o m�rime, notat� cu cov(x,y)

�i care se poate calcula prin formula:

Page 170: STEFANESCU - B S - PIED - uni-muenchen.de9.3. Analiza legturilor dintre variabile prin intermediul regresiei 9.4. Indicatori de apreciere a sensului i intensit ii legturilor dintre

( ) ( )( )�=

−−=N

iii yyxx

Nyx

1

1,cov (9.42.)

Pe baza valorii covarian�ei pot fi apreciate atât sensul cât �i intensitatea leg�turii dintre cele dou� variabile.

Atunci când leg�tura este invers�, adic� variabilele evolueaz� în sensuri opuse, valorilor peste medie ale unei variabile le vor corespunde, în general, valori sub medie ale celeilalte variabile, astfel încât valoarea covarian�ei este negativ�. În schimb, atunci când leg�tura este direct�, iar variabilele evolueaz� în acela�i sens, valoarea covarian�ei este pozitiv� întrucât, pentru o unitate statistic�, valorile celor dou� variabile vor fi, în general, fie ambele peste medie, fie ambele sub medie.

Se poate demonstra c� valoarea absolut� a covarian�ei nu poate dep��i produsul dintre abaterile medii p�tratice ale celor dou� variabile. În consecin��, covarian�a dintre dou� variabile x �i y are ca domeniu de varia�ie intervalul

];[ yxyx σσσσ ⋅+⋅− . Valorile absolute ale covarian�ei sunt cu atât mai mari cu

cât leg�tura este mai intens�. Pentru o leg�tur� determinist� covarian�a atinge una dintre limitele intervalului în timp ce valoarea nul� este atins� atunci când între cele dou� variabile nu exist� nicio leg�tur�.

Aprecierea intensit��ii unei leg�turi pe baza covarian�ei dintre variabile, este facilitat� de simplitatea modului de calcul. Totu�i, pe baza acestei m�rimi nu pot fi f�cute încadr�ri sau compara�ii asupra intensit��ii.

9.4.3. Coeficientul de corela�ie liniar� simpl� Coeficientul de corela�ie liniar� simpl� este o m�rime, notat� cu rxy, prin

care pot fi apreciate sensul �i intensitatea unei leg�turi ce poate fi exprimat� printr-o func�ie liniar�. Valoarea sa poate fi calculat� raportând covarian�a la produsul dintre abaterile medii p�tratice ale celor dou� variabile:

( )

yx

xy

yxr

σσ ⋅=

,cov (9.43.)

În condi�iile în care valoarea absolut� a covarian�ei nu poate fi mai mare decât produsul, domeniul de varia�ie al acestei m�rimi va fi reprezentat de intervalul [–1;1]. Coeficientul de corela�ie liniar� simpl� are, la fel ca �i covarian�a, o valoare pozitiv� în cazul unei leg�turi directe �i o valoare negativ� în cazul unei leg�turi inverse. Valoarea sa absolut� este cu atât mai mare cu cât leg�tura dintre cele dou� variabile este mai intens�. Fiind o m�rime adimensional�, coeficientul de corela�ie liniar� simpl� are, în compara�ie cu covarian�a, avantajul c� poate fi folosit pentru încadrarea intensit��ii �i pentru compara�ii între serii. Valorile sale au, în ce prive�te sensul �i intensitatea unei leg�turi liniare, acelea�i semnifica�ii (prezentate în tabelul 9.6.) pe care le au valorile coeficientului de asociere.

Valoarea coeficientului de corela�ie liniar� simpl� poate fi folosit� în verificarea ipotezelor statistice asupra unei leg�turi semnificative între dou�

Page 171: STEFANESCU - B S - PIED - uni-muenchen.de9.3. Analiza legturilor dintre variabile prin intermediul regresiei 9.4. Indicatori de apreciere a sensului i intensit ii legturilor dintre

variabile. În acest scop poate fi folosit un procedeu numit testul Student ce utilizeaz� o distribu�ie t în care num�rul de grade de libertate este dat de rela�ia:

ν =N – 2 (9.44.) unde N este num�rul de unit��i statistice folosit în studiul leg�turii dintre cele dou� variabile. Testul Student presupune formularea a dou� ipoteze:

- ipoteza nul� H0: „coeficientul de corela�ie liniar� simpl� difer� semnificativ de zero” (altfel spus, între cele dou� variabile exist� o leg�tur� semnificativ�);

- ipoteza alternativ� HA: „coeficientul de corela�ie liniar� simpl� nu difer� semnificativ de zero” (altfel spus, între cele dou� variabile nu exist� o leg�tur� semnificativ�).

În continuare, se calculeaz� o m�rime numit� valoarea testului statistic

Student pentru coeficientul de corela�ie liniar� simpl�, notat� cu tr �i dat� de formula:

ν⋅−

=21 xy

xy

r

r

rt (9.45.)

Aceast� valoare calculat� se compar� cu o valoare tabelat� qtν , ob�inut� în

raport cu num�rul de grade de libertate �i de nivelul de încredere dorit pentru verificarea ipotezei statistice, rezultând una din urm�toarele situa�ii:

- dac� tr ≥ qtν se admite ipoteza nul�;

- dac� tr < qtν se respinge ipoteza nul�.

În practic�, se obi�nuie�te ca valoarea coeficientului de corela�ie liniar� simpl� s� fie calculat� printr-o a�a-numit� formul� simplificat�:

���

���

���

�−

���

���

���

�−

=

����

� ��

====

= ==

2

11

22

11

2

1 11

N

ii

N

ii

N

ii

N

ii

N

i

N

iii

N

iii

xy

yyNxxN

yxyxN

r (9.46.)

Exemplul 9.7. Se cere s� se aprecieze, pe baza seriei statistice prezentat� în tabelul 9.1., sensul �i intensitatea leg�turii liniare dintre volumul desfacerilor �i cheltuielile pentru publicitate prin intermediul coeficientului de corela�ie liniar� simpl�.

Rezolvare: Coeficientul de corela�ie liniar� simpl� poate fi determinat pe baza formulei de calcul simplificat, utilizând valorile intermediare prezentate în tabelul 9.3.:

Page 172: STEFANESCU - B S - PIED - uni-muenchen.de9.3. Analiza legturilor dintre variabile prin intermediul regresiei 9.4. Indicatori de apreciere a sensului i intensit ii legturilor dintre

( )( )95,0

0,44,355,245,15

0,45,219,2522

2

11

22

11

2

1 11

=−×−×

×−×=

=

���

���

���

�−

���

���

���

�−

=

����

� ��

====

= ==

N

ii

N

ii

N

ii

N

ii

N

i

N

iii

N

iii

xy

yyNxxN

yxyxN

r

În raport cu aceast� valoare se poate aprecia c� între volumul desfacerilor �i cheltuielile pentru publicitate exist� o leg�tur� direct� foarte pronun�at�.

Rela�ia de calcul simplificat al coeficientului de corela�ie simpl� aplicabil� pentru seriile simple poate fi adaptat� �i pentru distribu�iile heterograde, pe baza rela�iilor de echivalen�� utilizate în cazul regresiei liniare. Se ob�ine astfel urm�toarea formul� de calcul.

��

���

����

�⋅−⋅⋅

��

���

����

�⋅−⋅⋅

⋅⋅⋅−⋅⋅⋅

=

��������

������

=== ==== =

=== == =

2

1

'

1

2'

1 1

2

1

'

1

2'

1 1

1

'

1

'

1 1

''

1 1

yyx yxxx y

yxx yx y

K

j

yjj

K

j

yjj

K

i

K

j

xyij

K

i

xii

K

i

xii

K

i

K

j

xyij

K

j

yjj

K

i

xii

K

i

K

j

xyijji

K

i

K

j

xyij

xy

nynynnxnxn

nynxnyxn

r

Exemplul 9.8. Se cere s� se aprecieze, pe baza distribu�iei heterograde

prezentat� în tabelul 9.2., sensul �i intensitatea leg�turii dintre vechimea în munc� �i num�rul mediu zilnic de rebuturi prin intermediul coeficientului de corela�ie liniar� simpl�. Se cere, de asemenea, s� se verifice, pe baza testului Student, ipoteza unei leg�turi semnificative între cele dou� variabile, pe baza unui nivel de semnifica�ie � = 0,01.

Rezolvare: Aplicând formula de calcul simplificat, în care sunt introduse valorile intermediare prezentate în tabelul 9.4. rezult�:

( )( )7047,0

75,301425,3825226788.225

75,302261,2672522

2

1

'

1

2'

1 1

2

1

'

1

2'

1 1

1

'

1

'

1 1

''

1 1

−=−×−×

×−×=

=

��

���

����

�⋅−⋅⋅

��

���

����

�⋅−⋅⋅

⋅⋅⋅−⋅⋅⋅

=

��������

������

=== ==== =

=== == =

yyx yxxx y

yxx yx y

K

j

yjj

K

j

yjj

K

i

K

j

xyij

K

i

xii

K

i

xii

K

i

K

j

xyij

K

j

yjj

K

i

xii

K

i

K

j

xyijji

K

i

K

j

xyij

xy

nynynnxnxn

nynxnyxn

r

Valoarea coeficientului de corela�ie liniar� simpl� indic� o leg�tur�

invers� pronun�at� între cele dou� variabile. Pentru aplicarea testului Student asupra relevan�ei leg�turii dintre cele

dou� variabile sunt formulate dou� ipoteze statistice: - ipoteza nul� H0: „rxy difer� semnificativ de zero”; - ipoteza alternativ� HA: „rxy nu difer� semnificativ de zero”;

Page 173: STEFANESCU - B S - PIED - uni-muenchen.de9.3. Analiza legturilor dintre variabile prin intermediul regresiei 9.4. Indicatori de apreciere a sensului i intensit ii legturilor dintre

Num�rul de grade de libertate al distribu�iei t folosite reprezint�:

2322521 1

=−=−=��= =

x yK

i

K

jixnν

În raport cu num�rul de grade de libertate �i cu nivelul de încredere � =

0,01 se ob�ine o valoare tabelat� qtν = 2,807. Aceast� valoare se compar� cu

valoarea testului Student:

7634,4237047,01

7047,0

1 22=⋅

−=⋅

−= ν

xy

xy

r

r

rt

Întrucât valoarea lui tr este mai mare decât valoarea tabelat� qtν se poate accepta

ipoteza nul�.

9.4.4. Coeficientul de determinare Coeficientul de determinare este o m�rime, notat� cu ηd prin care poate fi

evaluat� intensitatea unei leg�turi între dou� variabile pentru care a fost stabilit� o func�ie de regresie liniar� sau neliniar�. Valoarea sa este dat� de rela�ia:

2

22

i

xi

y

y

ση = (9.48.)

în care: - 2xiyσ este dispersia valorilor teoretice ale variabilei dependente;

- 2iyσ este dispersia valorilor empirice ale variabilei dependente.

În principiu, valorile teoretice sunt doar rezultatul factorilor de influen�� care au fost considera�i relevan�i în cadrul regresiei �i care sunt exprima�i prin intermediul variabilei independente. În schimb, valorile empirice sunt rezultatul tuturor factorilor de influen��, inclusiv a celor care au fost considera�i nerelevan�i �i care nu au fost exprima�i prin variabila independent�.

Raportul dintre dispersia valorilor teoretice �i dispersia valorilor empirice ale variabilei dependente reflect� gradul în care valorile empirice sunt influen�ate de factorii exprima�i prin variabila independent�. Cele dou� dispersii nu pot avea decât valori pozitive, iar dispersia valorilor teoretice este cel mult egal� cu dispersia valorilor empirice, astfel încât domeniul de varia�ie al coeficientului de determinare este reprezentat de intervalul [0;1]. Exprimat în termeni procentuali, coeficientul de determinare reflect� propor�ia în care valorile variabilei dependente sunt datorate factorilor exprima�i prin variabila independent�.

Exemplul 9.9. Se cere s� se aprecieze, pe baza seriei statistice prezentat� în tabelul 9.1., prin intermediul coeficientului de determinare, impactul pe care îl au cheltuielile pentru publicitate asupra volumului desfacerilor.

Rezolvare: În tabelul 9.8. sunt prezentate valorile intermediare pentru calculul dispersiilor valorilor teoretice �i ale valorilor empirice ale variabilei dependente. Pentru ambele variabile, media aritmetic� are aceea�i valoare:

Page 174: STEFANESCU - B S - PIED - uni-muenchen.de9.3. Analiza legturilor dintre variabile prin intermediul regresiei 9.4. Indicatori de apreciere a sensului i intensit ii legturilor dintre

8,050,41 ===

�=

N

y

y

N

ii

mii buc.;

sau,

8,050,41 ===

�=

N

y

y

N

ix

x

i

i mii buc.

Dispersia valorilor teoretice reprezint�:

( )0361,0

51805,01

2

2 ==

=�=

N

yyN

ixx

y

ii

ixσ (mii buc.)2

Tabelul 9.9. Valori intermediare utilizate în calculul coeficientului de

determinare

Nr. crt.

xi [mil. RON]

yi [mii buc.]

ix bxayi

+=

[mii buc.]

2)( yyi − [(mii buc.)2]

2)(ii xx yy −

[(mii buc.)2] (0) (1) (2) (3) (4) (5) 1. 0,2 0,5 0,515 0,09 0,0812 2. 0,8 1,1 1,085 0,09 0,0812 3. 0,5 0,7 0,80 0,01 0 4. 0,6 0,9 0,895 0,01 0,009 5. 0,4 0,8 0,705 0 0,009

Total 2,5 4,0 4,0 0,2 0,1805

Simbol pentru total �

=

N

iix

1

�=

N

iiy

1

�=

N

ixi

y1

( )�=

−N

ii yy

1

2 ( )�=

−N

ixx ii

yy1

2

Coeficientul de determinare are valoarea:

9025,004,0

0361,02

2

2 ===

i

ix

y

y

ση ,

ceea ce înseamn� c� în medie 90,25% din valoarea volumului desfacerilor se datoreaz� cheltuielilor pentru publicitate în timp ce restul de 9,75% se datoreaz� altor factori.

Atunci când variabilele sunt reprezentate prin distribu�ii heterograde, calculul dispersiei valorilor teoretic presupune ca acestea s� fie grupate pe baza grupelor constituite în raport cu variabila independent�.

Exemplul 9.10. Se cere s� se aprecieze, pe baza distribu�iei heterograde prezentat� în tabelul 9.3., prin intermediul coeficientului de determinare,

Page 175: STEFANESCU - B S - PIED - uni-muenchen.de9.3. Analiza legturilor dintre variabile prin intermediul regresiei 9.4. Indicatori de apreciere a sensului i intensit ii legturilor dintre

impactul pe care îl are vechimea în munc� asupra num�rului mediu zilnic de rebuturi.

Rezolvare: În tabelul 9.10. sunt prezentate valorile intermediare utilizate în calculul dispersiei valorilor teoretice. Media aritmetic� a valorilor teoretice reprezint�:

23,125

7504,30

1

1

'

==

=

=

=

x

x

i K

iix

K

i

xii

x

n

nx

y buc��i

Dispersia valorilor teoretice are valoarea:

( )0064,0

25

1588,0

1

1

2'

2 ==

⋅−

=

=

=

x

x

ii

ix K

i

xi

K

i

xixx

y

n

nyy

σ buc2

Tabelul 9.10. Valori intermediare utilizate în calculul dispersiei valorilor teoretice

Nr. crt.

Interval de varia�ie (xi – 1 – xi)

[ani]

'ix

[ani] xin

''ix bxay

i+=

[buc.]

xix ny

i⋅'

[buc.]

xixx nyy

ii⋅− 2' )(

[buc.2]

(0) (1) (2) (3) (4) (5) = (4) × (3) (6) 1. (0 ; 4] 2 7 1,3328 9,3296 0,0740 2. (4 ; 8] 6 3 1,2744 3,8232 0,0059 3. (8 ; 12] 10 7 1,2160 8,5120 0,0014 4. (12 ; 16] 14 5 1,1576 5,7880 0,0262 5. (16 ; 20] 18 3 1,0992 3,2976 0,0513 6. Total × 25 × 30,7504 0,1588

7. Simbol

pentru total × �

=

xK

i

xin

1

× �=

⋅x

i

K

i

xix ny

1

' ( )�=

⋅−x

ii

K

i

xixx nyy

1

2'

Valorile intermediare folosite în calculul dispersiei valorilor empirice ale

variabilei dependente sunt prezentate în tabelul 9.11. Media aritmetic� a valorilor empirice reprezint�:

23,125

75,30

1

1

'

==

=

=

=

y

j

K

j

yj

K

j

yjj

n

ny

y buc

Dispersia valorilor empirice reprezint�:

Page 176: STEFANESCU - B S - PIED - uni-muenchen.de9.3. Analiza legturilor dintre variabile prin intermediul regresiei 9.4. Indicatori de apreciere a sensului i intensit ii legturilor dintre

( )0128,0

25

32,0

1

1

2'

2 ==

⋅−

=

=

=

y

y

i K

j

yj

K

j

yjj

y

n

nyy

σ buc2

Coeficientul de determinare are valoarea: 4963,00128,0

0064,02

2

2 ===

i

ix

y

y

ση ,

ceea ce înseamn� c� în medie doar 49,63% din valoarea num�rului mediu de rebuturi este datorat� influen�ei vechimii în munc�, restul de 50,37% datorându-se altor factori. Tabelul 9.11. Valori intermediare utilizate în calculul dispersiei valorilor empirice

Nr. crt.

Interval de varia�ie

(yj – 1 – yj) [ani]

yjn

'jy

[buc.]

yjj ny ⋅'

[buc.]

yjj nyy ⋅− 2' )(

[buc.2]

(0) (1) (2) (3) (4) = (3) × (2) (6) 1. (1,0 ; 1,1] 4 1,05 4,20 0,1296 2. (1,1 ; 1,2] 5 1,15 5,75 0,0320 3. (1,2 ; 1,3] 10 1,25 12,50 0,0040 4. (1,3 ; 1,4] 4 1,35 5,40 0,0576 5. (1,4 ; 1,5] 2 1,45 2,90 0,0968 6. Total 25 × 30,75 0,32

7. Simbol

pentru total �=

yK

j

yjn

1

× �=

⋅yK

j

yjj ny

1

' ( )�=

⋅−yK

j

yjj nyy

1

2'

9.4.5. Raportul de corela�ie Raportul de corela�ie este o m�rime, notat� cu dη , care poate fi ob�inut�

extr�gând r�d�cina p�trat� din coeficientul de determinare: 2dd ηη = (9.49.)

La fel ca �i coeficientul de determinare, raportul de corela�ie are un domeniu de varia�ie reprezentat de intervalul [0 ; 1]. Valoarea sa este cu atât mai mare cu cât intensitatea leg�turii dintre cele dou� variabile este mai mare.

Se poate demonstra c� dac� între cele dou� variabile poate fi stabilit� o leg�tur� liniar� atunci valoarea raportului de corela�ie este egal� cu valoarea absolut� a coeficientului de corela�ie liniar� simpl�:

xyd r=η (9.50.)

Page 177: STEFANESCU - B S - PIED - uni-muenchen.de9.3. Analiza legturilor dintre variabile prin intermediul regresiei 9.4. Indicatori de apreciere a sensului i intensit ii legturilor dintre

Capitolul 10 - Analiza seriilor de timp

10.1. Coordonate ale analizei seriilor de timp

Analiza seriilor de timp are ca obiect studiul dinamicii fenomenelor

colective, prin eviden�ierea transform�rilor suferite de acestea sub impactul factorilor de influen��. Pentru un astfel de demers trebuie folosite procedee �i m�rimi specifice, care s� exprime evolu�iile unor caracteristici.

Adeseori, factorii care influen�eaz� un fenomen colectiv se manifest� diferen�iat în timp. Din aceast� perspectiv� se poate face urm�toarea clasificare a factorilor de influen��:

- factori de influen�� continu�; - factori de influen�� oscilant�; - factori de influen�� aleatoare.

1. Factorii de influen�� continu� î�i exercit� impactul în mod constant pentru toat� durata acoperit� de seria în timp. Influen�a acestor factori d� direc�ia general� a evolu�iei, numit� trend.

2. Factorii de influen�� oscilant� î�i exercit� impactul în mod discontinuu, dar cu regularitate, la intervale de timp relativ egale. În func�ie de lungimea acestor intervale de timp se pot delimita dou� categorii de factori de influen�� oscilant�:

- factori ciclici, care se manifest� la intervale de timp (numite cicluri) mai mari de un an;

- factori sezonieri care se manifest� la intervale de timp (numite sezoane) mai mici de un an.

Efectele pe care factorii de influen�� oscilant� le au asupra fenomenelor colective sunt numite mi�c�ri ciclice (ondulatorii) în cazul factorilor ciclici �i varia�ii sezoniere în cazul factorilor sezonieri.

3. Factorii de influen�� aleatorie î�i exercit� impactul în mod discontinuu �i neregulat. Efectul pe care ace�ti factori îl au asupra unui fenomen colectiv este numit varia�ie rezidual�.

Pentru relevarea efectelor acestor tipuri de factori sunt folosite diferite modele ale fenomenelor colective. În acest subcapitol vom prezenta dou� astfel de modele, utilizate destul de frecvent în practic�:

a) modelul aditiv; b) modelul multiplicativ.

a) Modelul aditiv este descris de ecua�ia:

iiii RSCTi yyyyy +++= (10.1.)

în care: - yi este valoarea caracteristicii y la un moment de timp (sau pentru un

interval de timp)i; -

iTy este trendul inclus în valoarea yi;

Page 178: STEFANESCU - B S - PIED - uni-muenchen.de9.3. Analiza legturilor dintre variabile prin intermediul regresiei 9.4. Indicatori de apreciere a sensului i intensit ii legturilor dintre

- iCy este mi�carea ciclic� inclus� în valoarea yi;

- iSy este varia�ia sezonier� inclus� în valoarea yi;

- iRy este varia�ia rezidual� inclus� în valoarea yi;

iTy

iy

31 SS yy =

42 SS yy =

42 SS yy =

24 SS yy =

iTi yy ,

Fig. 10.1. Model aditiv asupra evolu�iei valorilor unei caracteristici În practic�, delimitarea mi�c�rii ciclice este în general foarte dificil�,

necesitând observa�ii îndelungate asupra fenomenului studiat. Din acest motiv, adeseori se face abstrac�ie de mi�carea ciclic�, astfel încât ecua�ia modelului aditiv devine:

iii RSTi yyyy ++= (10.2.)

Într-o serie de aplica�ii practice ale modelului aditiv se porne�te de la premisa c� varia�ia rezidual� poate fi neglijabil� în raport cu evolu�ia în ansamblu a fenomenului studiat. Dac� se face abstrac�ie �i de acest element rezult� c� valoarea caracteristicii studiate este egal� cu suma dintre trend �i varia�ia sezonier�:

ii STi yyy += (10.3.)

Tot din considerente de simplicitate se consider� c� unor diviziuni similare ale sezonului le corespund varia�ii sezoniere egale. În figura 10.1. este prezentat modelul aditiv pentru evolu�ia unei caracteristici timp de dou� sezoane. Varia�iile sezoniere din momentele t1 �i t2, care desemneaz� începuturile de sezoane, sunt egale, a�a cum sunt �i varia�iile sezoniere din momentele t3 �i t4, care desemneaz� centrele celor dou� sezoane.

b) Modelul multiplicativ este descris de ecua�ia: yi = yTi * rCi * rSi* rRi (10.4.)

în care: -

iCr este o ra�ie ce reflect� efectul factorilor ciclici în momentul de timp (sau

intervalul de timp) i;

Page 179: STEFANESCU - B S - PIED - uni-muenchen.de9.3. Analiza legturilor dintre variabile prin intermediul regresiei 9.4. Indicatori de apreciere a sensului i intensit ii legturilor dintre

- iSr este o ra�ie ce reflect� efectul factorilor sezonieri în momentul de timp (sau

intervalul de timp) i; -

iRr este o ra�ie ce reflect� efectul factorilor aleatorii în momentul de timp (sau

intervalul de timp) i. Atunci când se face abstrac�ie de mi�carea ciclic� se consider� c� 1=

iCr ,

iar ecua�ia modelului devine: yi= yTi * rSi* rRi (10.5.) De asemenea, atunci când se neglijeaz� impactul factorilor aleatori, se

consider� c� 1=iRr , astfel încât valoarea yi este dat� de produsul dintre trend �i

ra�ia ce reflect� varia�ia sezonier�: yi= yTi * rSi (10.6.) Pentru unele aplica�ii practice ale modelului multiplicativ se consider� c�

unor diviziuni similare ale sezonului le corespund valori egale ale ratelor ce reflect� factorii sezonieri.

10.2. Indicatori ai analizei seriilor de timp

În raport cu modul de exprimare, indicatorii utiliza�i în analiza seriilor de

timp pot fi grupa�i în trei categorii: - indicatori absolu�i; - indicatori relativi; - indicatori medii.

10.2.1. Indicatorii absolu�i ai seriilor de timp Indicatorii absolu�i sunt m�rimi exprimate în unitatea de m�sur� a

caracteristicii studiate, al c�ror calcul nu implic� mijlocirea unor al�i indicatori. Printre indicatorii absolu�i utiliza�i relativ frecvent în practic� pentru caracterizarea seriilor în timp se num�r�:

- indicatorul de nivel; - modificarea absolut�. a) Indicatorul de nivel este o m�rime, notat� cu yi, care exprim� valoarea

caracteristicii y la un moment de timp (sau pentru un interval de timp) i. Valorile acestei m�rimi, care rezult� din observ�rile statistice �i din prelucr�rile primare ale datelor, se afl�, practic, la baza calculului tuturor celorlal�i indicatori de analiz� a seriilor în timp.

b) Modificarea absolut� este o m�rime, notat� cu ij∆ , ce exprim�

diferen�a dintre valorile indicatorului de nivel la dou� momente de timp i �i j:

jiij yy −=∆ (10.7.)

Prin intermediul modific�rii absolute se pot face compara�ii între st�rile unui fenomen la dou� momente de timp diferite apreciindu-se astfel sensul �i amploarea evolu�iei. Dintre cele dou� momente de timp, primul, în ordine

Page 180: STEFANESCU - B S - PIED - uni-muenchen.de9.3. Analiza legturilor dintre variabile prin intermediul regresiei 9.4. Indicatori de apreciere a sensului i intensit ii legturilor dintre

cronologic�, este numit baz� de compara�ie, iar al doilea este numit termen

curent. În func�ie de valoarea modific�rii absolute se pot stabili sensurile

evolu�iei între cele dou� momente de timp: - cre�tere, pentru o valoare pozitiv�; - sc�dere, pentru o valoare negativ�; - stagnare, pentru o valoare nul�. Pentru analiza unei serii în timp se poate folosi un sistem de modific�ri

absolute în care fiecare moment al seriei este folosit drept termen curent. În func�ie de modul de alegere a bazei de compara�ie se pot delimita dou� tipuri de sisteme de modific�ri absolute:

sisteme de modific�ri absolute cu baza fix�; sisteme de modific�ri absolute cu baza în lan�.

1. Un sistem de modific�ri absolute cu baza fix� presupune ca pentru to�i termenii seriei s� se foloseasc� o singur� baz� de compara�ie, care corespunde, de regul�, primului moment de timp. În acest caz modificarea absolut� este dat� de rela�ia: 11/ yyii −=∆ (10.8.)

2. Un sistem de modific�ri absolute cu baza în lan� presupune ca fiecare termen al seriei, cu excep�ia primului, s� fie comparat ca termenul anterior. O modificare absolut� cu baza în lan� poate fi calculat� prin formula:

11/ −− −=∆ iiii yy (10.9.) Indicatorii relativi ai seriilor în timp sunt m�rimi adimensionale ob�inute

prin raportarea valorilor a doi indicatori. Printre indicatorii relativi utiliza�i frecvent în analiza seriilor în timp se num�r�:

a. indicele dinamicii; b. ritmul dinamicii.

a) Indicele dinamicii este o m�rime, notat� cu Ii/j, care exprim� raportul dintre valorile indicatorului de nivel la dou� momente de timp i �i j:

j

iji

y

yI =/ (10.10.)

Interpretarea indicelui dinamicii este oarecum asem�n�toare interpret�rii modific�rii absolute. Primul moment de timp, în ordine cronologic�, este numit baz� de compara�ie, iar al doilea este numit termen curent. Caracteristica studiat� înregistreaz� o cre�tere, atunci când indicele dinamicii este supraunitar, o sc�dere, când are o valoare subunitar� �i o stagnare pentru o valoare unitar�. Pentru analiza unei serii în timp se pot folosi dou� tipuri de sisteme de indici ai dinamicii:

- sisteme de indici ai dinamicii cu baz� fix�; - sisteme de indici ai dinamicii cu baza în lan�. 1. Într-un sistem de indici ai dinamicii cu baz� fix� se folose�te pentru

to�i termenii seriei în timp o singur� baz� de compara�ie. De regul�, aceasta corespunde primului termen al seriei. În acest caz, indicele dinamicii poate fi calculat prin formula:

Page 181: STEFANESCU - B S - PIED - uni-muenchen.de9.3. Analiza legturilor dintre variabile prin intermediul regresiei 9.4. Indicatori de apreciere a sensului i intensit ii legturilor dintre

11/

y

yI i

i = (10.11.)

2. Într-un sistem de indici ai dinamicii cu baz� în lan� fiecare termen al seriei, cu excep�ia primului, este comparat cu termenul anterior. Un indice al dinamicii cu baza în lan� este dat de rela�ia:

11/

−− =

i

iii

y

yI (10.12.)

b) Ritmul dinamicii este o m�rime, notat� cu Ri/j, care poate fi ob�inut� raportând o modificare absolut� la valoarea folosit� drept baz� de compara�ie:

1//

/ −=∆

= ji

j

ji

ji Iy

R (10.13.)

Amploarea evolu�iei caracteristicii studiate este cu atât mai mare cu cât valoarea absolut� a ritmului de cre�tere (sc�dere) este mai mare.

Pentru analiza unei serii în timp pot fi folosite sisteme de ritmuri ale dinamicii cu baz� fix� sau cu baz� în lan�, dup� cum modific�rile absolute sunt calculate ca baza fix� sau în lan�.

Adeseori ritmul dinamicii este exprimat într-o form� procentual�. Este cazul ratei infla�iei care reprezint� ritmul cre�terii procentuale a pre�urilor.

10.2.3. Indicatori medii ai seriilor în timp Un indicator mediu exprim� nivelul general, pentru toat� seria în timp, al

unui indicator absolut sau relativ. printre indicatorii medii utiliza�i destul de frecvent în practic� pentru caracterizarea seriilor în timp se num�r�:

a) indicatorul mediu de nivel; b) modificarea absolut� medie; c) indicele mediu al dinamicii; d) ritmul mediu.

a) Indicatorul mediu de nivel este o m�rime, notat� cu rCy , care

exprim� valoarea medie, pentru toat� perioada acoperit� de seria în timp, a indicatorului de nivel yi. Aceast� m�rime poate fi calculat� ca o medie aritmetic� a valorilor indicatorului de nivel atunci când acestea corespund unor diviziuni egale ca lungime ale perioadei de timp acoperit� de serie:

N

y

y

N

ii

Cr

�== 1 (10.14.)

unde N este num�rul termenilor seriei. În situa�ia în care valorile indicatorului de nivel corespund unor momente

de timp aflate la distan�e inegale, indicatorul mediu de nivel este calculat ca o medie aritmetic� ponderat� cu lungimile intervalelor dintre momentele de timp:

Page 182: STEFANESCU - B S - PIED - uni-muenchen.de9.3. Analiza legturilor dintre variabile prin intermediul regresiei 9.4. Indicatori de apreciere a sensului i intensit ii legturilor dintre

)15.10(2222

222

21

1121

212

11

21

11

232

121

N

NN

NNN

N

NNN

C

ttt

ty

tty

tty

ty

ttt

tyy

tyy

tyy

yr

+++

⋅++

⋅+++

⋅+⋅=

=+++

⋅+

++⋅+

+⋅+

=

−−−−

−−

unde t1, t2, … , tN reprezint� lungimile intervalelor de timp la care se înregistreaz� valorile yi.

b) Modificarea absolut� medie este m�rime, notat� cu ∆ , calculat� ca o medie aritmetic� a tuturor m�rimilor absolute cu baza în lan�:

112

1/1/2/31/2

=−

∆++∆+∆=∆

�=

−−

NN

N

iii

NN�

(10.16.)

Din aceast� formul� de calcul se poate deduce leg�tura dintre modificarea absolut� medie �i modificarea absolut� cu baz� fix� pentru ultimul termen al seriei:

( ) ( ) ( ) ( )

)17.10(11

1

1/1

1212312

∆=

−=

=−

−+−++−+−=∆ −−−

NN

yy

N

yyyyyyyy

NN

NNNN�

c) Indicele mediu al dinamicii este o m�rime, notat� cu I , calculat� ca o medie geometric� a indicilor dinamicii cu baza în lan� determina�i pentru întreaga serie:

1

21/

11/2/31/2

=−

−− ∏=×××= N

N

iii

NNN IIIII � (10.18.)

Formula de calcul a indicelui mediu al dinamicii permite eviden�ierea leg�turii dintre aceast� m�rime �i indicele dinamicii cu baza fix� pentru ultimul termen al seriei:

11/1

1

1

12

1

2

3

1

2 −−−

−−

− ==××××= NN

NN

N

N

N

N

N Iy

y

y

y

y

y

y

y

y

yI � (10.19.)

d) Ritmul mediu al dinamicii este o m�rime, notat� cu R , care poate fi calculat� prin rela�ia:

1−= IR (10.19.) Exemplul 10.2. În tabelul 10.1. este prezentat� o serie în timp care

exprim� volumul vânz�rilor realizate de o firm� pentru un sortiment de produs în primele cinci luni ale anului 2006. Se cere s� se calculeze urm�torii indicatori ai acestei serii în timp:

a) indicatorii absolu�i; b) indicatorii relativi; c) indicatorii medii.

Page 183: STEFANESCU - B S - PIED - uni-muenchen.de9.3. Analiza legturilor dintre variabile prin intermediul regresiei 9.4. Indicatori de apreciere a sensului i intensit ii legturilor dintre

Tabelul 10.1. Volumul vânz�rilor înregistrat de o firm� în primele cinci luni ale anului 2006

Nr. crt. Luna Volumul vânz�rilor (yi)

[mii buc.] (0) (1) (2) 1. Ianuarie 1,50 2. Februarie 1,45 3. Martie 1,60 4. Aprilie 1,70 5. Mai 1,75

Rezolvare: a) Indicatorii absolu�i ai seriei în timp Valorile indicatorului de nivel (altfel spus, valorile lunare ale volumului

vânz�rilor) sunt prezentate în coloana cu num�rul de ordine 2 din tabelul 10.1. Modific�rile absolute cu baz� fix�, prezentate în coloana cu num�rul de

ordine 3 din tabelul 10.2. au fost calculate prin formula: ∆i/1 = yi – y1 Modific�rile absolute cu baza în lan�, prezentate în coloana cu num�rul de

ordine 4 din tabelul 10.2. au fost determinate pe baza rela�iei: ∆i/i – 1 = yi – yi – 1 b) Indicatori relativi ai seriei în timp Indicii dinamicii cu baza fix� sunt prezenta�i în coloana cu num�rul de

ordine 5 din tabelul 10.2. Aceste valori au fost calculate prin formula:

11/

y

yI i

i =

Indicii dinamicii cu baza în lan� sunt prezenta�i în coloana cu num�rul de ordine 6 din tabelul 10.2. Pentru determinarea acestor valori a fost utilizat� rela�ia:

1

1/−

− =i

iii

y

yI

Ritmurile dinamicii cu baza fix� sunt prezentate în coloana cu num�rul de

ordine 7 din tabelul 10.2. Calculul acestora are la baz� formula: 1

1/1/

yR i

i

∆=

Ritmurile dinamicii cu baz� în lan� sunt prezentate în coloana cu num�rul de ordine 8 din tabelul 10.2. În determinarea acestora a fost folosit� formula:

1

1/1/

−−

∆=

i

iiii

yR

c) Indicatori medii ai seriei de timp

Page 184: STEFANESCU - B S - PIED - uni-muenchen.de9.3. Analiza legturilor dintre variabile prin intermediul regresiei 9.4. Indicatori de apreciere a sensului i intensit ii legturilor dintre

Pentru calculul indicatorului mediu de nivel se consider� c� toate cele cinci luni au un num�r egal de zile, astfel încât se poate aplica formula:

60,15

00,81 ===�=

N

y

y

N

ii

Cr mii buc.

Modificarea absolut� medie reprezint�: 0625,015

25,0

12

1/

=−

=−

=∆�=

N

N

iii

mii

buc.

Tabelul 10.2. Indicatori absolu�i �i relativi ai seriei în timp

Modific�ri absolute

Indici ai dinamicii

Ritmul dinamicii

Nr. crt.

Luna

Indicator de nivel

(yi) [mii buc.]

cu baz� fix� (∆i/1)

cu baz� în lan� (∆i/i–1)

cu baz� fix� (Ii/1)

cu baz� în lan� (Ii/i–1)

cu baz� fix� (Ri/1)

cu baz�

în lan� (Ri/i–1)

(0) (1) (2) (3) (4) (5) (6) (7) (8) 1. Ianuarie 1,50 × × × × × ×

2. Februarie 1,45 – 0,05 – 0,05 0,9667 0,9667 –

0,0333 0,0333

3. Martie 1,60 0,10 0,15 1,0667 1,1034 0,0667 0,1034 4. Aprilie 1,70 0,20 0,10 1,1333 1,0625 0,1333 0,0625 5. Mai 1,75 0,25 0,05 1,1667 1,0294 0,1667 0,0294 6. Total 8,00 × 0,25 × × × ×

7. Simbol pentru total

�=

N

iiy

1

× �=

−∆N

iii

21/ × × × ×

Indicele mediu al dinamicii are valoarea:

0393,10294,10625,11034,19667,0151

21/ =×××= −−

=−∏N

N

iiiI

Ritmul mediu al dinamicii reprezint�: 0393,010393,11 =−=−= IR

10.3. Determinarea trendului unei serii de timp

10.3.1. Considera�ii generale asupra determin�rii trendului unei serii de timp

În general, determinarea trendului unei serii de timp este întreprins� în

scopul eviden�ierii efectelor unor factori care influen�eaz� continuu fenomenul

Page 185: STEFANESCU - B S - PIED - uni-muenchen.de9.3. Analiza legturilor dintre variabile prin intermediul regresiei 9.4. Indicatori de apreciere a sensului i intensit ii legturilor dintre

studiat. Pe baza trendului pot fi analizate aspectele esen�iale ale unei activit��i �i pot fi prognozate desf��ur�rile viitoare ale unor fenomene.

În cadrul analizelor unor fenomene în raport cu factorii care îi influen�eaz� în mod continuu se practic� procedeul ajust�rii seriilor de timp în

raport cu trendul, care const� în determinarea, pentru toate valorile seriilor, a componentelor datorate factorilor de influen�� continu�. Acest procedeu are mai multe variante:

- tehnica mediilor mobile; - tehnica ajust�rii pe baza modific�rii absolute medii; - tehnica ajust�rii pe baza indicelui mediu al dinamicii; - tehnica ajust�rii pe baza unei func�ii de regresie. Valorile ajustate în raport cu trendul pot fi folosite în cadrul prognozelor

prin extrapolare. Într-o prognoz� prin extrapolare asupra manifest�rii unui fenomen colectiv se porne�te de la premisa c� factorii care au influen�at fenomenul în trecut vor avea în viitor un impact similar. În privin�a trendului, extrapolarea const� în determinarea valorilor prognozate prin procedee similare celor care au fost aplicate pentru ajustarea valorilor seriei în timp.

Valorile extrapolate ale trendului sunt combinate cu valorile extrapolate pentru mi�c�rile ciclice �i pentru varia�iile sezoniere �i reziduale, rezultând astfel valorile prognozate ale indicatorului de nivel. Adeseori în practic� se consider� c� impactul factorilor de influen�� oscilant� �i aleatorie este nesemnificativ în raport cu impactul factorilor de influen�� continu�, astfel încât valorile prognozate ale indicatorului de nivel ( )iy sunt date doar de valorile prognozate ale trendului )ˆ(

iTy :

iTi yy ˆˆ = (10.20)

Acurate�ea unei valori prognozate prin extrapolarea trendului poate fi cunoscut� doar dup� ce perioada pentru care s-a elaborat prognoza s-a încheiat,

pe baza unei m�rimi numit� eroare de prognoz�, notat� cu Pti

ε �i dat� de rela�ia:

ii TiiiPt yyyy ˆˆ −=−=ε (10.21.)

În momentul previziunii, eroarea de prognoz� poate fi doar estimat� în raport cu parametrii procedeului de ajustare. Drept estimator este folosit un indicator numit abaterea medie p�tratic� a trendului fa�� de indicatorul de

nivel notat cu Ty /σ �i calculat ca o medie p�tratic� a diferen�elor dintre valorile

indicatorului de nivel �i valorile ajustate în raport cu trendul ale seriei în timp:

( )

N

yyN

iTi

Ty

i�=

= 1/σ (10.22.)

Acurate�ea unei prognoze este cu atât mai mare cu cât abaterea medie p�tratic� a trendului fa�� de indicatorul de nivel este mai mic�.

Page 186: STEFANESCU - B S - PIED - uni-muenchen.de9.3. Analiza legturilor dintre variabile prin intermediul regresiei 9.4. Indicatori de apreciere a sensului i intensit ii legturilor dintre

10.3.2. Ajustarea seriilor de timp prin tehnica mediilor mobile Determinarea valorilor ajustate prin tehnica mediilor mobile are la baz�

premisa compens�rii, pentru mai multe momente succesive, a abaterilor de la trend cauzate de factorii cu influen�� oscilant� sau aleatorie. În acest fel, media aritmetic� a unor termeni succesivi dintr-o serie în timp poate fi considerat� un rezultat al factorilor cu influen�� continu�.

Prin aplicarea procedeului mediilor mobile, valoarea ajustat� a unui termen dintr-o serie în timp este dat� de media aritmetic� a unui num�r impar de termeni consecutivi, în care termenul ce trebuie ajustat ocup� pozi�ia central�.

Exemplul 10.2. Se cere s� se ajusteze seria de timp prezentat� în tabelul 10.1. prin tehnica mediilor mobile.

Rezolvare: Întrucât seria în timp are doar cinci termeni s-a ales ca mediile aritmetice s� se calculeze pe baza a trei termeni. În tabelul 10.3. este prezentat modul de calcul al valorilor ajustate.

Tabelul 10.3. Ajustarea unei serii în timp prin tehnica mediilor mobile

Nr. crt.

Luna Indice de nivel (yi) [mii buc.]

Suma termenilor succesivi [mii buc.]

Valori ajustate

[mii buc.] (0) (1) (2) (3) (4) = (3)/3 1. Ianuarie 1,50 × × 2. Februarie 1,45 4,55 1,5167 3. Martie 1,60 4,75 1,5833 4. Aprilie 1,70 5,05 1,6833 5. Mai 1,75 × x

Tehnica mediilor mobile este destul de simpl� îns� aplicarea ei este

limitat� la termenii pentru care media aritmetic� poate fi calculat� pe baza num�rului stabilit de termeni succesivi (în exemplul 10.2. nu s-au putut ajusta valorile primului �i ultimului termen al seriei întrucât pentru acestea nu s-au putut determina medii aritmetice pe baza a trei termeni succesivi). Aceast� tehnic� are, în plus, dezavantajul c� nu poate fi folosit� în cadrul prognozelor.

10.3.3. Ajustarea seriilor de timp pe baza modific�rii absolute medii Ajustarea pe baza modific�rii absolute medii este indicat� pentru seriile în

timp ale c�ror valori au o evolu�ie apropiat� de cea a unei progresii aritmetice. Se poate considera c� rata progresiei aritmetice este egal� cu modificarea

Page 187: STEFANESCU - B S - PIED - uni-muenchen.de9.3. Analiza legturilor dintre variabile prin intermediul regresiei 9.4. Indicatori de apreciere a sensului i intensit ii legturilor dintre

absolut� medie astfel încât între valorile trendului pentru doi termeni succesivi ai seriei exist� rela�ia:

∆+=−

maT

maT ii

yy1

(10.23.)

În aplicarea procedeului se consider� c� pentru primul termen al unei serii în timp valoarea ajustat� coincide cu indicatorul de nivel:

11yy

maT = (10.24.)

Pentru ceilal�i termeni, valorile ajustate pot fi determinate prin aplic�ri succesive ale rela�iei (10.23.) sau prin formula:

∆×+=+

iyymaT

maT ii 1

(10.25.)

Modul de calcul al modific�rii absolute medii face ca �i pentru ultimul termen al seriei valoarea ajustat� s� coincid� cu indicatorul de nivel:

NmaT yy

N= (10.26.)

Tehnica de ajustare a trendului pe baza modific�rii medii absolute poate fi folosit� în cadrul prognozelor prin extrapolare atunci când se consider� c� evolu�ia viitoare a fenomenului poate fi încadrat� într-o progresie aritmetic�. În acest caz, valoarea prognozat� a indicatorului de nivel pentru un moment viitor de timp este dat� de rela�ia:

∆×+=+ kyy N

ma

kNˆ (10.27)

în care N + k este indicele numeric atribuit momentului viitor în raport

cu distan�a în timp la care acesta se afl� fa�� de ultimul termen al seriei. Exemplul 10.3. Se cere s� se ajusteze, pe baza modific�rii absolute

medii, seria în timp prezentat� în tabelul 10.1. Se cere, de asemenea, s� se determine, prin extrapolare pe baza modific�rii absolute medii, valorile prognozate ale volumului vânz�rilor în lunile iunie �i iulie f�când abstrac�ie de mi�c�rile ciclice �i de varia�iile sezoniere sau reziduale.

Rezolvare: În exemplul 10.1. a fost determinat� modificarea absolut� medie 0625,0=∆ mii buc. Valorile ajustate ale seriei în timp, prezentate în

tabelul 10.4., au fost calculate pe baza rela�iei: ∆×+=−

11

maT

maT ii

yy

Valoarea prognozat� a volumului vânz�rilor în luna iunie, pentru care se atribuie indicele numeric N + k = 6, reprezint�:

8125,10625,075,11ˆ 56 =+=∆×+= yyma mii buc.

Pentru luna iulie, c�reia i se atribuie un indice numeric N + k = 7, valoarea prognozat� a volumului vânz�rilor reprezint�:

875,10625,0275,12ˆ 57 =×+=∆×+= yyma mii buc.

Acurate�ea prognozei poate fi estimat� pe baza abaterii medii p�tratice a

trendului fa�� de indicatorul de nivel:

Page 188: STEFANESCU - B S - PIED - uni-muenchen.de9.3. Analiza legturilor dintre variabile prin intermediul regresiei 9.4. Indicatori de apreciere a sensului i intensit ii legturilor dintre

( )052,0

5

0135,01

2

/ ==

=�=

N

yyN

i

maTi

maTy

i

σ mii buc��i.

Tabelul 10.4. Ajustarea seriei în timp pe baza modific�rii absolute medii

Nr. crt.

Luna yi

[mii buc.]

maTi

y

[mii buc.]

maTi i

yy −

[mii buc.]

2)( maTi i

yy −

[(mii buc.)2] (0) (1) (2) (3) (4) = (2) – (3) (5) = (4)2

1. Ianuarie 1,50 1,5000 – – 2. Februarie 1,45 1,5625 – 0,1125 0,0127 3. Martie 1,60 1,6250 – 0,025 0,0006 4. Aprilie 1,70 1,6875 0,0125 0,0002 5. Mai 1,75 1,7500 – –

Total × 8,00 8,1250 × 0,0135 Simbol pentru total

× �=

N

iiy

1

�=

N

i

maTi

y1

× ( )�=

−N

i

maTi

yy1

1

10.3.4. Ajustarea seriilor în timp pe baza indicelui mediu al dinamicii Ajustarea pe baza indicelui mediu al dinamicii este indicat� pentru seriile

în timp ale c�ror valori evolueaz� asem�n�tor unei progresii geometrice. În acest caz se poate considera c� rata progresiei geometrice este egal� cu indicele mediu al dinamicii astfel încât pentru doi termeni succesivi ai seriei se poate stabili rela�ia:

IyyidT

idT ii

×=−1

(10.28.)

Atunci când procedeul este aplicat se consider� c� pentru primul termen al seriei în timp valoarea ajustat� coincide cu indicatorul de nivel:

11yy

idT = (10.29.)

Pentru termenii urm�tori, valorile ajustate pot fi calculate fie aplicând succesiv rela�ia (10.28), fie prin formula:

( )iidT

idT Iyy

ii×=

+1 (10.30.)

Din modul de calcul al indicelui mediu al dinamicii rezult� c� �i pentru ultimul termen al seriei valoarea ajustat� coincide cu indicatorul de nivel:

NidT yy

N= (10.31.)

Tehnica de ajustare a seriilor în timp pe baza indicelui mediu al dinamicii poate fi folosit� în cadrul prognozelor prin extrapolare atunci când se consider� c� evolu�ia viitoare a fenomenului poate fi încadrat� într-o progresie geometric�

Page 189: STEFANESCU - B S - PIED - uni-muenchen.de9.3. Analiza legturilor dintre variabile prin intermediul regresiei 9.4. Indicatori de apreciere a sensului i intensit ii legturilor dintre

ce are aceea�i rat� I . În aceast� situa�ie, valoarea prognozat� a indicatorului de nivel pentru un moment viitor de timp poate fi calculat� prin formula:

( )k

Nid

kN Iyy ×=+ (10.32.) în care k este indicele numeric atribuit momentului viitor în raport cu distan�a în timp la care acesta se afl� de ultimul termen al seriei.

Exemplul 10.4. Se cere s� se ajusteze, pe baza indicelui mediu al dinamicii, seria în timp prezentat� în tabelul 10.1. Se cere, de asemenea, s� se determine prin extrapolare pe baza indicelui mediu al dinamicii, valorile prognozate ale volumului vânz�rilor în lunile iunie �i iulie f�când abstrac�ie de mi�c�rile ciclice �i de varia�iile sezoniere sau reziduale.

Rezolvare: În exemplul 10.1. a fost determinat indicele mediu al dinamicii 0393,1=I . Valorile ajustate ale seriei în timp, prezentate în tabelul

10.5., au fost determinate pe baza rela�iei: ( )iidT

idT Iyy

ii×=

+1

Valoarea prognozat� a volumului vânz�rilor în luna iunie, pentru care s-a atribuit indicele numeric N + k = 6 reprezint�:

( ) 8188,10393,175,1ˆ 156 =×=×= Iyy

id mii buc. Pentru luna iulie, c�reia i s-a atribuit un indice numeric N + k = 7,

valoarea prognozat� a volumului vânz�rilor reprezint�:

( ) ( ) 8903,10393,175,1ˆ 2257 =×=×= Iyy

id mii buc. Acurate�ea prognozei poate fi estimat� pe baza abaterii medii p�tratice a

trendului fa�� de indicatorul de nivel:

( )0502,0

5

0126,01

2

/ ==

=�=

N

yyN

i

idTi

idTy

i

iσ mii buc��i

Tabelul 10.5. Ajustarea seriei în timp pe baza indicelui mediu al dinamicii

Nr. crt.

Luna yi

[mii buc.]

idTi

y

[mii buc.]

idTi i

yy −

[mii buc.]

2)( idTi i

yy −

[(mii buc.)2] (0) (1) (2) (3) (4) = (2) – (3) (5) = (4)2

1. Ianuarie 1,50 1,5000 – – 2. Februarie 1,45 1,5590 – 0,1090 0,0119 3. Martie 1,60 1,6202 – 0,0202 0,0004 4. Aprilie 1,70 1,6839 0,0161 0,0003 5. Mai 1,75 1,7500 – –

Total × 8,00 8,1131 × 0,0126 Simbol pentru total

× �=

N

iiy

1

�=

N

i

idTi

y1

× ( )�=

−N

i

idTi

yy1

1

Page 190: STEFANESCU - B S - PIED - uni-muenchen.de9.3. Analiza legturilor dintre variabile prin intermediul regresiei 9.4. Indicatori de apreciere a sensului i intensit ii legturilor dintre

10.3.4. Ajustarea seriilor de timp pe baza func�iilor de regresie

ity

Fig. 10.2. Ajustarea unei serii în timp printr-o func�ie de regresie

Ajustarea seriilor în timp pe baza func�iilor de regresie este considerat�

cea mai riguroas� dintre tehnicile de determinare a trendului, aplicabil� pentru toate situa�iile. Procedeul are la baz� exprimarea timpului printr-o variabil� numeric� �i reflectarea dependen�ei fa�� de aceast� variabil� a unei variabile dat� de valorile trendului. În acest scop este stabilit� o func�ie matematic� ale c�rei valori s� fie apropiate de valorile seriei în timp (fig. 10.2.). Practic, aceast� func�ie matematic� poate fi considerat� o func�ie de regresie, pentru care timpul are semnifica�ia variabilei independente, trendul are semnifica�ia valorilor teoretice ale variabilei dependente iar indicatorul de nivel are semnifica�ia valorilor empirice ale aceleia�i variabile dependente.

Dac� se noteaz� cu ti valorile variabilei independente care exprim� timpul

�i cu it

y valorile teoretice ale variabilei dependente, atunci func�ia de regresie f

are forma:

ii Tti yytf ==)( (10.33.)

Parametrii func�iei de regresie rezult� din condi�ia ca pentru ansamblul

observ�rilor statistice valorile teoretice it

y s� fie cât mai apropiate de cele

empirice yi. Prin aplicarea metodei celor mai mici p�trate se ob�in pentru func�iile de regresii expresii similare celor determinate în cadrul analizei leg�turilor dintre variabile:

- pentru o func�ie liniar� de forma it btayi

+= , parametrii a �i b pot fi

ob�inu�i rezolvând sistemul:

Page 191: STEFANESCU - B S - PIED - uni-muenchen.de9.3. Analiza legturilor dintre variabile prin intermediul regresiei 9.4. Indicatori de apreciere a sensului i intensit ii legturilor dintre

⋅=+

=+⋅

���

��

===

==

i

N

ii

N

ii

N

ii

N

ii

N

ii

yttbta

ytbaN

11

2

1

11 (10.34.)

- pentru o func�ie polinomial� de ordinul doi, de forma 2

210 iit tataayi

⋅+⋅+= , parametrii a0, a1 �i a2 pot fi ob�inu�i prin

intermediul sistemului:

⋅=++

⋅=++

=++⋅

����

����

���

====

====

===

i

N

ii

N

ii

N

ii

N

ii

i

N

ii

N

ii

N

ii

N

ii

N

ii

N

ii

N

ii

yttatata

yttatata

ytataaN

1

2

1

42

1

31

1

20

11

32

1

21

10

11

22

110

(10.35.)

Valorile numerice ale variabilei independente ti sunt stabilite în raport cu

pozi�ia momentelor sau intervalelor de timp pe care le reprezint� în cadrul perioadei acoperite de seria în timp. Atunci când termenii seriei corespund unor momente de timp aflate la distan�e egale sau unor intervale de timp egale, valorile numerice ale variabilei ti sunt alese astfel încât diferen�ele dintre termenii succesivi s� fie egale.

Ajustarea trendului pe baza unei func�ii de regresie poate fi folosit� în prognozele prin extrapolare, atunci când se consider� c� evolu�ia viitoare a fenomenului poate fi încadrat� func�iei de regresie ce a fost utilizat� în cadrul ajust�rii. În acest caz, momentelor sau intervalelor de timp pentru care se fac prognoze le sunt asociate valori ale variabilei ti care reflect� distan�a în timp fa�� de ultimul termen al seriei.

Pentru seriile la care termenii sunt pozi�iona�i la distan�e egale de timp, se obi�nuie�te ca valorile variabilei ti s� fie dispuse simetric în raport cu valoarea nul�. În acest fel, sumele valorilor ti la puteri impare devin nule, ceea ce simplific� foarte mult rezolvarea ecua�iilor lui Fermat. Alegerea acestor valori comport� unele deosebiri în raport cu num�rul par sau impar de termeni ai seriei. Din aceast� perspectiv�, tehnicile de ajustare a seriilor în timp pe baza func�iilor de regresie pot fi împ�r�ite în dou� categorii:

a) tehnici de ajustare pentru seriile în timp cu un num�r impar de termeni;

b) tehnici de ajustare pentru seriile în timp cu un num�r par de termeni.

a) Pentru seriile cu un num�r impar de termeni, în scopul simplific�rii calculelor, se poate atribui o valoare nul� variabilei ti a termenului central, diferen�ele dintre doi termeni succesivi fiind egale cu o unitate (fig. 10.3.).

Page 192: STEFANESCU - B S - PIED - uni-muenchen.de9.3. Analiza legturilor dintre variabile prin intermediul regresiei 9.4. Indicatori de apreciere a sensului i intensit ii legturilor dintre

Fig. 10.3. Stabilirea valorilor variabilei ti pentru o serie cu un num�r impar de

termeni Exemplul 10.5. Se cere s� se ajusteze, pe baza unei func�ii liniare, seria

în timp prezentat� în tabelul 10.1. Se cere, de asemenea, ca pe baza acestei func�ii s� se prognozeze volumul vânz�rilor în lunile iunie �i iulie, neglijând mi�c�rile ciclice �i varia�iile sezoniere sau reziduale.

Rezolvare: Valorile numerice ale variabilei ti au fost stabilite astfel încât suma acestora s� fie nul�. În acest scop, pentru termenul central, care corespunde lunii martie, a fost aleas� o valoare nul�, iar diferen�a dintre doi termeni succesivi a fost stabilit� la o unitate.

Tabelul 10.6. Valori intermediare utilizate în calculul parametrilor func�iei

liniare de regresie

Nr. crt.

Luna yi

[mii buc.]

ti 2it ii yt ⋅

[mii buc.]

(0) (1) (2) (3) (4) = (3)2 (5) = (3) × (2)

1. Ianuarie 1,50 – 2 4 – 3,00 2. Februarie 1,45 – 1 1 – 1,45 3. Martie 1,60 0 0 0 4. Aprilie 1,70 + 1 1 1,70 5. Mai 1,75 + 2 4 3,50

Total × 8,00 – 10 0,75 Simbol pentru total

× �=

N

iiy

1

�=

N

iit

1

�=

N

iit

1

2 �=

⋅N

iii yt

1

În tabelul 10.6. sunt prezentate valorile intermediare utilizate în calculul

parametrilor func�iei liniare de regresie. Ace�tia rezult� din ecua�iile lui Fermat:

Page 193: STEFANESCU - B S - PIED - uni-muenchen.de9.3. Analiza legturilor dintre variabile prin intermediul regresiei 9.4. Indicatori de apreciere a sensului i intensit ii legturilor dintre

⋅=+

=+

���

��

===

==

N

iii

N

ii

N

ii

N

ii

N

ii

yttbta

ytbNa

11

2

1

11

adic�:

��

=⋅+⋅

=⋅+

75,0100

805

ba

ba

Rezolvând ecua�iile lui Fermat se ob�ine: a = 1,6 mii buc.; b = 0,075 mii buc. ceea ce înseamn� c� func�ia de regresie liniar� are expresia: it ty

i⋅+= 075,06,1

Tabelul 10.7. Ajustarea seriei în timp pe baza func�iei liniare de regresie

Nr. crt.

Luna yi

[mii buc.]

ti if

Tty

i⋅+= 075,06,1

[mii buc.]

f

Ti iyy −

[mii buc.]

2)( f

Ti iyy −

[(mii buc.)2]

(0) (1) (2) (3) (4) (5) = (2) –

(4) (6) = (5)2

1. Ianuarie 1,50 – 2 1,450 0,05 0,0025 2. Februarie 1,45 – 1 1,525 – 0,075 0,0056 3. Martie 1,60 0 1,600 – – 4. Aprilie 1,70 +1 1,675 0,025 0,0006 5. Mai 1,75 +2 1,750 – –

Total × 8,00 – 8,00 – 0,0087 Simbol pentru total

× �=

N

iiy

1

�=

N

iit

1

�=

N

i

f

Tiy

1

( )�=

−N

i

f

Ti iyy

1

( )�=

−N

i

f

Ti iyy

1

2

Valorile ajustate ale seriei în timp pe baza acestei func�ii sunt prezentate

în tabelul 10.7. Pentru prognoza volumului vânz�rilor pe baza func�iei de regresie valorile ti sunt stabilite men�inându-se diferen�a de o unitate dintre dou� luni succesive.

Lunii iunie, care se afl� la o distan�� de o lun� de ultimul termen al seriei în timp, i-a fost stabilit� valoarea t6 = 2 + 1 = 3. Atribuind aceast� valoare argumentului func�iei de regresie rezult� o valoare prognozat� a volumului vânz�rilor:

825,13075,06,1)3(ˆ =×+==it

fiun yy mii buc. Pentru luna iulie, care se

afl� la o distan�� de dou� luni fa�� de ultimul termen, a fost stabilit� valoarea t7 = 2 + 2 = 4. Pentru aceast� valoare a argumentului func�iei de regresie rezult� o valoare prognozat� a volumului vânz�rilor:

Page 194: STEFANESCU - B S - PIED - uni-muenchen.de9.3. Analiza legturilor dintre variabile prin intermediul regresiei 9.4. Indicatori de apreciere a sensului i intensit ii legturilor dintre

9,14075,06,1)4(ˆ =×+==it

fiul yy mii buc.

Acurate�ea prognozei poate fi estimat� pe baza abaterii medii p�tratice a trendului fa�� de indicatorul de nivel:

( )0418,0

5

0087,01

2

/ ==

=�=

N

yyN

i

f

Tif

Ty

i

iσ mii buc.

b) Pentru seriile cu un num�r par de termeni, simplificarea calculelor

poate fi ob�inut� atribuind celor doi termeni centrali valorile de – 1 �i + 1, diferen�a dintre doi termeni centrali fiind egal� cu dou� unit��i (fig. 10.4.).

Fig. 10.4. Stabilirea valorilor variabilei ti pentru o serie

cu un num�r par de termeni Exemplul 10.6. În tabelul 10.8. este prezentat� evolu�ia num�rului de

rebuturi înregistrat de o sec�ie de produc�ie a unei firme în primul semestru al anului 2006.

Tabelul 10.8. Evolu�ia num�rului de rebuturi pentru un sortiment

de produs în primul semestru al unui an

Nr. crt. Luna Num�r de rebuturi [buc.]

(0) (1) (2) 1. Ianuarie 43 2. Februarie 41 3. Martie 38 4. Aprilie 35 5. Mai 31 6. Iunie 25

Se cere: a) s� se ajusteze seria în timp prin urm�toarele procedee:

a1) ajustare pe baza modific�rii absolute medii;

Page 195: STEFANESCU - B S - PIED - uni-muenchen.de9.3. Analiza legturilor dintre variabile prin intermediul regresiei 9.4. Indicatori de apreciere a sensului i intensit ii legturilor dintre

a2) ajustare pe baza indicelui mediu al dinamicii; a3) ajustare pe baza unei func�ii liniare de regresie; a4) ajustare pe baza unei func�ii liniare de regresie;

b) s� se prognozeze, prin extrapolare pe baza celor patru procedee, num�rul rebuturilor înregistrat în lunile iulie �i august f�când abstrac�ie de mi�carea ciclic� �i de varia�iile sezoniere �i reziduale;

c) s� se aprecieze, pe baza abaterii medii p�tratice a trendului fa�� de indicatorul de nivel, care dintre cele patru metode de prognoz� are o acurate�e mai mare.

Rezolvare: a) Ajustarea seriei în timp

a1) Ajustare pe baza modific�rii absolute medii

Tabelul 10.9. Valori utilizate în ajustarea unei serii în timp pe baza modific�rii absolute medii

Modific�ri absolute [buc.]

Nr. crt.

Luna

Num�r de

rebuturi (yi)

[buc.]

cu baz� fix� (∆i/1)

cu baz� în lan� (∆i/ – 1)

idTi

y

[buc.]

idTi i

yy −

[buc.]

2)( idTi i

yy −

[buc.2]

(0) (1) (2) (3) (4) (5) (6) = (2) – (5) (7) = (6)2

1. Ianuarie 43 × × 43,0 – – 2. Februarie 41 – 2,0 – 2,0 39,4 1,6 2,56 3. Martie 38 – 5,0 – 3,0 35,8 2,2 4,84 4. Aprilie 35 – 8,0 – 3,0 32,2 2,8 7,84 5. Mai 31 – 12,0 – 4,0 28,6 2,4 5,76 6. Iunie 25 – 18,0 – 6,0 25,0 – –

Total × 213 × – 18,0 204,0 × 21,0 Simbol pentru total

× �=

N

iiy

1

× �=

−∆N

iii

21/ �

=

N

i

maTi

y1

× ( )�=

−N

i

maTi i

yy1

2

În tabelul 10.9. sunt prezentate valorile utilizate în ajustarea seriei în timp

pe baza modific�rii absolute medii. Acest indicator reprezint�:

6,3160,18

12

1/

−=−

−=

=∆�=

N

N

iii

buc.

Valorile ajustate ale seriei în timp au fost calculate prin formula: ∆⋅+=

+iyy

maT

maT ii 1

a2) Ajustare pe baza indicelui mediu al dinamicii

Page 196: STEFANESCU - B S - PIED - uni-muenchen.de9.3. Analiza legturilor dintre variabile prin intermediul regresiei 9.4. Indicatori de apreciere a sensului i intensit ii legturilor dintre

În tabelul 10.10. sunt prezentate valorile utilizate în ajustarea seriei în timp pe baza indicelui mediu al dinamicii. Aceast� m�rime are valoarea:

8972,08065,08857,09211,09268,09535,0161

21/ =××××== −−

=−∏N

N

iiiII

Tabelul 10.10. Valori utilizate în ajustarea unei serii în timp pe baza indicelui

mediu al dinamicii

Indici ai dinamicii

Nr. crt.

Luna

Num�r de

rebuturi (yi)

[buc.]

cu baz� fix� (Ii/1)

cu baz� în lan� (Ii/i – 1)

idTi

y

[buc.]

idTi i

yy −

[buc.]

2)( idTi i

yy −

[buc.2]

(0) (1) (2) (3) (4) (5) (6) = (2) –

(5) (7) = (6)2

1. Ianuarie 43 × × 43,0 – – 2. Februarie 41 0,9535 0,9535 38,58 2,42 5,86 3. Martie 38 0,8837 0,9268 34,61 3,39 11,49 4. Aprilie 35 0,8537 0,9211 31,06 3,94 15,52 5. Mai 31 0,7209 0,8857 27,86 3,14 9,86 6. Iunie 25 0,5814 0,8065 25,0 – –

Total × 213 × × 200,11 × 42,73 Simbol pentru total

× �=

N

iiy

1

× × �=

N

iTi

y1

× ( )�=

−N

i

idTi i

yy1

2

Valorile ajustate ale seriei au fost determinate prin formula:

IyyidT

idT ii

×=−1

a3) Ajustare pe baza unei func�ii liniare de regresie Valorile variabilei ti au fost alese astfel încât suma acestora s� fie nul�. În

acest scop, celor doi termeni centrali, care corespund lunilor martie �i aprilie, le-au fost atribuite valorile – 1 respectiv + 1, în timp ce diferen�a pentru doi termeni succesivi a fost stabilit� la dou� unit��i.

Page 197: STEFANESCU - B S - PIED - uni-muenchen.de9.3. Analiza legturilor dintre variabile prin intermediul regresiei 9.4. Indicatori de apreciere a sensului i intensit ii legturilor dintre

Tabelul 10.11. Valori utilizate în ajustarea unei serii în timp pe baza unei func�ii liniare de regresie

Nr. crt.

Luna yi

[buc.] it 2it 3

it 4it ii yt ⋅

[buc.] ii yt ⋅2

[buc.]

(0) (1) (2) (3) (4) = (3)2

(5) = (3)3

(6) = (3)4

(7) = (3) × (2)

(8) = (4) × (2)

1. Ianuarie 43 – 5 25 – 125 625 – 215 1 075 2. Februarie 41 – 3 9 – 27 81 – 123 369 3. Martie 38 – 1 1 – 1 1 – 38 38 4. Aprilie 35 + 1 1 + 1 1 35 35 5. Mai 31 + 3 9 + 27 81 93 279 6. Iunie 25 + 5 25 + 125 625 125 625

Total × 213 – 70 – 1 414 – 123 2 421 Simbol pentru total

× �=

N

iiy

1

�=

N

iit

1

�=

N

iit

1

2 �=

N

iit

1

3 �=

N

iit

1

4 �=

⋅N

iii yt

1

�=

⋅N

iii yt

1

2

În tabelul 10.11. sunt prezentate valorile intermediare utilizate în

determinarea parametrilor func�iei liniare de regresie. Valorile acestora reies din ecua�iile lui Fermat.

⋅=+

=+

���

��

===

==

N

iii

N

ii

N

ii

N

ii

N

ii

yttbta

ytbNa

11

2

1

11

adic�:

��

−=⋅+⋅

=⋅+

123700

21306

ba

ba

Prin rezolvarea ecua�iilor lui Fermat se ob�ine: a = 35,5 buc.; b = – 1,757 buc. de unde rezult� c� func�ia de regresie liniar� are expresia:

it tyi

⋅−= 757,15,35

În raport cu ecua�ia func�iei de regresie liniar� au fost determinate valorile ajustate ale seriei în timp care sunt prezentate în tabelul 10.12.

Page 198: STEFANESCU - B S - PIED - uni-muenchen.de9.3. Analiza legturilor dintre variabile prin intermediul regresiei 9.4. Indicatori de apreciere a sensului i intensit ii legturilor dintre

Tabelul 10.12. Ajustarea seriei în timp pe baza unei func�ii liniare de regresie

Nr. crt.

Luna yi

[buc.] ti i

f

Tty

i⋅+= 757,15,35

[buc.]

f

Ti iyy −

[buc.]

2)( f

Ti iyy −

[buc.2] (0) (1) (2) (3) (4) (5) = (2) – (4) (6) = (5)2

1. Ianuarie 43 – 5 44,285 – 1,285 1,6512 2. Februarie 41 – 3 40,771 0,229 0,0524 3. Martie 38 – 1 37,257 0,743 0,5520 4. Aprilie 35 +1 33,743 1,257 1,5800 5. Mai 31 +3 30,229 0,771 0,5944 6. Iunie 25 + 5 26,715 – 1,715 2,9412

Total × 213 – 213,000 – 2,3712 Simbol pentru total

× �=

N

iiy

1

�=

N

iit

1

�=

N

i

f

Tiy

1

( )�=

−N

i

f

Ti iyy

1

( )�=

−N

i

f

Ti iyy

1

2

a4) Ajustare pe baza unei func�ii de regresie polinomial� de gradul doi

Pentru determinarea parametrilor unei func�ii de regresie polinomial� de gradul doi se folosesc valorile variabilei ti care au fost stabilite pentru func�ia de regresie liniar�. Valorile parametrilor rezult� din ecua�iile lui Fermat.

⋅=++

⋅=++

=++⋅

����

����

���

====

====

===

i

N

ii

N

ii

N

ii

N

ii

i

N

ii

N

ii

N

ii

N

ii

N

ii

N

ii

N

ii

yttatata

yttatata

ytataaN

1

2

1

42

1

31

1

20

11

32

1

21

10

11

22

110

Introducând în aceste ecua�ii valorile intermediare prezentate în tabelul 10.12. se ob�ine sistemul de ecua�ii:

=⋅+⋅+⋅

−=⋅+⋅+⋅

=⋅+⋅+⋅

421.21414070

1230700

2137006

210

210

210

aaa

aaa

aaa

de unde rezult�: a0 = 36,7495 buc; a1 = – 1,7571 buc; a2 = – 0,1071 buc;

Pe baza ecua�iei de regresie: 21071,071,75,17495,36 iit ttyi

⋅−⋅−=

au fost determinate valorile ajustate ale seriei în timp, care sunt prezentate în tabelul 10.13.

Page 199: STEFANESCU - B S - PIED - uni-muenchen.de9.3. Analiza legturilor dintre variabile prin intermediul regresiei 9.4. Indicatori de apreciere a sensului i intensit ii legturilor dintre

Tabelul 10.13. Ajustarea seriei în timp pe baza unei func�ii de regresie liniar� de gradul doi

Nr. crt.

Luna yi

[buc.] ti

fp

Tiy

[buc.]

fp

Ti iyy −

[buc.]

2)( fp

Ti iyy −

[buc.2]

(0) (1) (2) (3) (4) (5) = (2) –

(4) (6) = (5)2

1. Ianuarie 43 – 5 42,8575 0,1425 0,0203 2. Februarie 41 – 3 41,0569 – 0,0569 0,0032 3. Martie 38 – 1 38,3995 – 0,3995 0,1596 4. Aprilie 35 +1 34,8853 0,1147 0,0132 5. Mai 31 +3 30,5143 0,4857 0,2359 6. Iunie 25 + 5 25,2865 – 0,2865 0,0821

Total × 213 – 213,000 – 0,5143 Simbol pentru total

× �=

N

iiy

1

�=

N

iit

1

�=

N

i

fp

Tiy

1

( )�=

−N

i

fp

Ti iyy

1

( )�=

−N

i

fp

Ti iyy

1

2

b) Prognoza prin extrapolare

b1) Prognoza pe baza modific�rii absolute medii Valorile prognozate pe baza modific�rii absolute medii pot fi calculate

prin rela�ia:

∆⋅+=+ kyy Nma

kNˆ Pentru luna iulie, c�reia i se atribuie indicele numeric N + k = 7, valoarea

prognozat� a num�rului de rebuturi reprezint�:

4,21)6,3(1251ˆ 67 =−⋅+=∆⋅+= yyma buc. Valoarea prognozat� a num�rului de rebuturi pentru luna august, pentru

care se atribuie indicele numeric N + k = 8, reprezint�:

8,17)6,3(2252ˆ 68 =−⋅+=∆⋅+= yyma buc.

b2) Prognoza pe baza indicelui mediu al dinamicii Valorile prognozate pe baza indicelui mediu al dinamicii pot fi

determinate prin formula:

( )k

Nma

kN Iyy ⋅=+ˆ Pentru luna iulie, c�reia i s-a atribuit indicele numeric N + k = 7, se

prognozeaz� un num�r de rebuturi: ( ) 43,228972,025ˆ 167 =×=×= Iyyma buc.

Valoarea prognozat� a num�rului de rebuturi din luna august, pentru care s-a atribuit indicele numeric N + k = 8,

reprezint�: ( ) 12,208972,025ˆ 2268 =×=×= Iyy

ma buc. b3) Prognoza pe baza func�iei liniare de regresie

Num�rul de rebuturi poate fi prognozat pe baza func�iei de regresie atribuind argumentului acesteia valori ale variabilei ti stabilite în raport cu

Page 200: STEFANESCU - B S - PIED - uni-muenchen.de9.3. Analiza legturilor dintre variabile prin intermediul regresiei 9.4. Indicatori de apreciere a sensului i intensit ii legturilor dintre

pozi�ia în timp fa�� de ultimul termen al seriei �i respectând diferen�a de dou� unit��i dintre doi termeni succesivi.

Pentru luna iulie s-a atribuit o valoare ti =5 + 2 = 7, c�reia îi corespunde o valoare prognozat� a num�rului de rebuturi:

20,237757,15,35)7(ˆ =×−== f

t

fiul i

yy buc.

Valoarea prognozat� a num�rului de rebuturi din luna august, pentru care s-a atribuit o valoare ti = 5 + 2 × 2 = 9, reprezint�:

69,199757,15,35)9(ˆ =×−== f

t

faug i

yy buc.

b4) Prognoza pe baza unei func�ii de regresie polinomial� de gradul doi.

Pentru prognoza pe baza func�iei de regresie polinomial� de gradul doi pot fi folosite drept argument valorile variabilei ti care au fost stabilite pentru prognoza pe baza unei func�ii liniare de regresie.

Num�rul de rebuturi prognozat pentru luna iulie reprezint�:

20,1971071,077571,17495,36)7(ˆ 2 =×−×−== fp

t

fpiul i

yy buc.

Pentru luna august a fost prognozat un num�r de rebuturi care reprezint�:

26,1291071,097571,17495,36)9(ˆ 2 =×−×−== fp

t

fpaug i

yy buc.

c) Aprecierea acurate�ei prognozelor Pe baza valorilor intermediare, calculate în cadrul ajust�rilor, se pot

determina abaterile medii p�tratice ale trendului fa�� de indicatorul de nivel pentru cele patru procedee:

- pentru prognoza pe baza modific�rii absolute medii:

( )8708,1

6

0,211

2

/ ==

=�=

N

yyN

i

maTi

maTy

i

iσ buc.

- pentru prognoza pe baza indicelui mediu al dinamicii:

( )6686,2

6

73,42

61

2

/ ==

=�=

N

i

idTi

idTy

i

i

yy

σ buc.

- pentru prognoza pa baza unei func�ii liniare de regresie:

( )1084,1

6

3712,7

61

2

/ ==

=�=

N

i

f

Tif

Ty

i

i

yy

σ buc.

- pentru prognoza pe baza unei func�ii de regresie polinomial� de gradul doi:

( )2928,0

6

5143,01

2

/ ==

=�=

N

yyN

i

fp

Tifp

Ty

i

iσ buc.

Rezult� c� prognoza pe baza unei func�ii de regresie polinomial� de gradul doi are cea mai mare acurate�e dintre procedeele utilizate.

Page 201: STEFANESCU - B S - PIED - uni-muenchen.de9.3. Analiza legturilor dintre variabile prin intermediul regresiei 9.4. Indicatori de apreciere a sensului i intensit ii legturilor dintre

Teste gril�

1. Fenomenele tipice au drept caracteristici: a. sunt guvernate de a�a numite legi deterministe; b. în condi�ii de mediu identice vor duce întotdeauna la acelea�i rezultate; c. în condi�ii de mediu identice pot conduce la rezultate diferite; d. au in general mecanisme simple, cu un num�r redus de factori; e. au in general mecanisme complexe, cu factori de influen�� numero�i, în

care intervine hazardul; f. rezultatele nu pot fi anticipate decât în condi�ii de incertitudine; g. rezultatele pot fi anticipate în condi�ii de certitudine; h. au o singur� form� de manifestare; i. au mai multe forme de manifestare.

R1: a, b, d, g, h.

2. Fenomenele colective au drept caracteristici:

a. sunt guvernate de a�a numite legi deterministe; b. în condi�ii de mediu identice vor duce întotdeauna la acelea�i

rezultate; c. în condi�ii de mediu identice pot conduce la rezultate diferite; d. au in general mecanisme simple, cu un num�r redus de factori; e. au in general mecanisme complexe, cu factori de influen��

numero�i, în care intervine hazardul; f. rezultatele nu pot fi anticipate decât în condi�ii de incertitudine; g. rezultatele pot fi anticipate în condi�ii de certitudine; h. au o singur� form� de manifestare; i. au mai multe forme de manifestare .

R2: c, e, f, i.

3. Popula�ia statistic� este o no�iune reprezentat� de: a. o mul�ime de elemente studiate pentru a se cerceta starea la un moment

dat sau evolu�ia în timp a unuia sau mai multor fenomene; b. un rezultat posibil sau o combina�ie de rezultate posibile, ale unui

fenomen studiat; c. o aplica�ie prin care fiec�rui element al unui câmp de evenimente îi este

asociat� o valoare numeric�. R3: a.

4. O variabil� aleatoare este o no�iune reprezentat� de:

Page 202: STEFANESCU - B S - PIED - uni-muenchen.de9.3. Analiza legturilor dintre variabile prin intermediul regresiei 9.4. Indicatori de apreciere a sensului i intensit ii legturilor dintre

a. o aplica�ie prin care fiec�rui element al unui câmp de evenimente îi este asociat� o valoare numeric�;

b. un rezultat posibil sau o combina�ie de rezultate posibile, ale unui fenomen studiat;

c. însu�irile prin care sunt descrise, în cadrul unei cercet�ri, unit��ile statistice.

R4: a.

5. Statistica aplicat� are ca obiect: a. formularea, pe baza principiilor �tiin�ei matematicii, a unor tehnici de

cercetare statistic�; b. combinarea tehnicilor statistice cu procedee bazate pe inteligen�a

artificial�; c. adaptarea tehnicilor statisticii matematice la condi�iile concrete ale

domeniilor în care sunt utilizate.. R5: c.

6. Culegerea datelor prin recens�minte are drept caracteristici: a. presupune investigarea tuturor unit��ilor popula�iei statistice prin care se

studiaz� un fenomen; b. este expus� erorilor de reprezentativitate; c. presupune investigarea unui e�antion; d. presupune investigarea unei p�r�i din popula�ia statistic�.

R6: a.

7. Culegerea datelor prin sondaje are drept caracteristici: a. presupune investigarea tuturor unit��ilor popula�iei statistice prin care se

studiaz� un fenomen; b. este expus� erorilor de reprezentativitate; c. presupune investigarea unui e�antion; d. presupune investigarea unei p�r�i din popula�ia statistic�.

R7: b, c, d. 8. O chestionare statistic� const� în: a. un ansamblu de întreb�ri adresate unor persoane cu privire la percep�iile �i reac�iile acestora fa�� de un fenomen studiat; b. înregistrarea unor aspecte ale manifest�rii unui fenomen cercetat; c. provocarea, în mod artificial dar în condi�ii cât mai apropiate de cele naturale, a unui proces, pentru a i se putea studia manifestarea. R8: a.

Page 203: STEFANESCU - B S - PIED - uni-muenchen.de9.3. Analiza legturilor dintre variabile prin intermediul regresiei 9.4. Indicatori de apreciere a sensului i intensit ii legturilor dintre

9. O observa�ie statistic� const� în: a. un ansamblu de întreb�ri adresate unor persoane cu privire la percep�iile �i reac�iile acestora fa�� de un fenomen studiat; b. înregistrarea unor aspecte ale manifest�rii unui fenomen cercetat; c. provocarea, în mod artificial dar în condi�ii cât mai apropiate de cele naturale, a unui proces, pentru a i se putea studia manifestarea. R9: b. 10. Un experiment statistic const� în: a. un ansamblu de întreb�ri adresate unor persoane cu privire la percep�iile �i reac�iile acestora fa�� de un fenomen studiat; b. înregistrarea unor aspecte ale manifest�rii unui fenomen cercetat; c. provocarea, în mod artificial dar în condi�ii cât mai apropiate de cele naturale, a unui proces, pentru a i se putea studia manifestarea. R10: c. 11. Un panel statistic const� în: a. interogarea periodic� a unui grup de persoane cu privire la un acela�i fenomen; b. provocarea, în mod artificial dar în condi�ii cât mai apropiate de cele naturale, a unui proces, pentru a i se putea studia manifestarea; c. un ansamblu de chestion�ri efectuate concomitent. R11: a. 12. O distribu�ie homograd� reprezint�: a. o distribu�ie de frecven�e la care caracteristica atributiv� este calitativ�; b. o distribu�ie de frecven�e la care caracteristica atributiv� este cantitativ�; c. o serie simpl� la care caracteristica atributiv� este calitativ�; d. o serie simpl� la care caracteristica atributiv� este cantitativ�; e. o serie de timp la care caracteristica atributiv� este cantitativ�; f. o serie de timp la care caracteristica atributiv� este calitativ�. R12: a. 13. O distribu�ie heterograd� reprezint�: a. o distribu�ie de frecven�e la care caracteristica atributiv� este calitativ�; b. o distribu�ie de frecven�e la care caracteristica atributiv� este cantitativ�; c. o serie simpl� la care caracteristica atributiv� este calitativ�; d. o serie simpl� la care caracteristica atributiv� este cantitativ�; e. o serie de timp la care caracteristica atributiv� este cantitativ�; f. o serie de timp la care caracteristica atributiv� este calitativ�.

Page 204: STEFANESCU - B S - PIED - uni-muenchen.de9.3. Analiza legturilor dintre variabile prin intermediul regresiei 9.4. Indicatori de apreciere a sensului i intensit ii legturilor dintre

R13: b. 14. Printre valorile tipice utilizate pentru identificarea tr�s�turilor esen�iale ale fenomenelor colective se num�r�: a. m�rimile medii; b. valoarea median�; c. modul; d. media aritmetic�; e. media armonic�; f. varian�a; g. coeficientul de varia�ie în raport cu abaterea medie p�tratic�; h. coeficientul de asimetrie în raport cu modul; i. coeficientul de asimetrie în raport cu mediana; j. momentele centrate ale distribu�iilor heterograde; k. coeficientul pearsonian al boltirii. R14: a, b, c, d, e. 15. O valoare median� reprezint�: a. o m�rime ce ocup� locul central într-o serie statistic� ordonat�; b. un raport dintre suma valorilor �i num�rul de unit��i statistice; c. o m�rime care exprim� valoarea cu cea mai mare frecven�� din cadrul seriei. R15: a. 16. Modul unei distribu�ii heterograde reprezint�: a. o m�rime ce ocup� locul central într-o serie statistic� ordonat�; b. un raport dintre suma valorilor �i num�rul de unit��i statistice; c. o m�rime care exprim� valoarea cu cea mai mare frecven�� din cadrul seriei. R16: c. 17. Un interval modal al unei distribu�ii heterograde reprezint�: a. un interval cu frecven�a mai mare decât cea a intervalelor învecinate; b. un interval aflat într-o pozi�ie central�; c. un interval aflat în una din extremit��ile seriei. R17: a. 18. Rela�ia dintre dispersia unei serii statistice �i reprezentativitatea valorilor tipice ale acesteia poate fi formulat� astfel : a. cu cât dispersia seriei este mai mare, cu atât valorile tipice sunt mai pu�in reprezentative; b. cu cât dispersia seriei este mai mic�, cu atât valorile tipice sunt mai pu�in reprezentative;

Page 205: STEFANESCU - B S - PIED - uni-muenchen.de9.3. Analiza legturilor dintre variabile prin intermediul regresiei 9.4. Indicatori de apreciere a sensului i intensit ii legturilor dintre

c. cu cât dispersia seriei este mai mare , cu atât media aritmetic� este mai reprezentativ�. R18: a. 19. O serie statistic� este simetric� atunci când: a. influen�a factorilor întâmpl�tori asupra fenomenului colectiv studiat se produce cu regularitate; b. media aritmetic� este egal� cu modul seriei; c. coeficientul de asimetrie în raport cu mediana este nul. R19: a, b, c. 20. O distribu�ie heterograd� este platykurtic� atunci când: a. curba de frecven�e este asem�n�toare, în ceea ce prive�te aplatizarea, unei curbe de distribu�ie normal�; b. curba de frecven�e este mai ascu�it� fa�� de curba unei distribu�ii normale; c. curba de frecven�e este mai turtit� decât curba unei distribu�ii normale; d. coeficientul pearsonian al boltirii este mai mic decât 3; e. coeficientul pearsonian al boltirii este mai mare decât 3; f. coeficientul pearsonian al boltirii este egal cu 3. R20: c, d. 21. O distribu�ie heterograd� este mezokurtic� atunci când: a. curba de frecven�e este asem�n�toare, în ceea ce prive�te aplatizarea, unei curbe de distribu�ie normal�; b. curba de frecven�e este mai ascu�it� fa�� de curba unei distribu�ii normale; c. curba de frecven�e este mai turtit� decât curba unei distribu�ii normale; d. coeficientul pearsonian al boltirii este mai mic decât 3; e. coeficientul pearsonian al boltirii este mai mare decât 3; f. coeficientul pearsonian al boltirii este egal cu 3. R21: a, f. 22. O distribu�ie heterograd� este leptokurtic� atunci când: a. curba de frecven�e este asem�n�toare, în ceea ce prive�te aplatizarea, unei curbe de distribu�ie normal�; b. curba de frecven�e este mai ascu�it� fa�� de curba unei distribu�ii normale; c. curba de frecven�e este mai turtit� decât curba unei distribu�ii normale; d. coeficientul pearsonian al boltirii este mai mic decât 3; e. coeficientul pearsonian al boltirii este mai mare decât 3; f. coeficientul pearsonian al boltirii este egal cu 3. R22: b, e.

Page 206: STEFANESCU - B S - PIED - uni-muenchen.de9.3. Analiza legturilor dintre variabile prin intermediul regresiei 9.4. Indicatori de apreciere a sensului i intensit ii legturilor dintre

23. Inferen�a statistic� reprezint�: a. trecerea de la valorile certe ale parametrilor unui e�antion la valorile probabile ale parametrilor popula�iei; b. analiza statistic� a parametrilor unui e�antion; c. asocierea unor distribu�ii probabilistice pentru valorile parametrilor unei popula�ii. R23: a. 24. Sondajele aleatoare pot fi definite drept: a. sondajele la care unit��ile statistice ale e�antioanelor sunt alese în mod întâmpl�tor; b. sondajele la care unit��ile statistice sunt stabilite în func�ie de tr�s�turile popula�iei studiate, relevante în raport cu scopul cercet�rii statistice; c. sondajele la care intervalele de încredere sunt stabilite aleatoriu. R24: a. 25. În cadrul inferen�ei statistice, atunci când nu se cunoa�te dispersia popula�iei studiate se recurge la estimarea acesteia pe baza: a. dispersiei e�antionului; b. mediei aritmetice a popula�iei studiate; c. volumului e�antionului. R25: a. 26. Impactul dispersiei popula�iei studiate asupra erorii efective de sondaj poate fi descris astfel: a. cu cât popula�ia studiat� este mai omogen�, cu atât sunt mai mari �ansele ca valorile estimate s� fie apropiate de cele reale; b. cu cât popula�ia studiat� este mai omogen�, cu atât sunt mai mici �ansele ca valorile estimate s� fie apropiate de cele reale; c. cu cât dispersia popula�iei studiate este mai mare, cu atât sunt mai mari �ansele ca valorile estimate s� fie apropiate de cele reale. R26: a. 27. Impactul volumului unui e�antion asupra erorii efective de sondaj poate fi descris astfel: a. cu cât volumul e�antionului este mai mare, cu atât sunt mai mari �ansele ca valorile estimate s� fie apropiate de cele reale; b. cu cât volumul e�antionului este mai mic, cu atât sunt mai mari �ansele ca valorile estimate s� fie apropiate de cele reale;

Page 207: STEFANESCU - B S - PIED - uni-muenchen.de9.3. Analiza legturilor dintre variabile prin intermediul regresiei 9.4. Indicatori de apreciere a sensului i intensit ii legturilor dintre

c. cu cât volumul e�antionului are o pondere mai mare în volumul popula�iei, cu atât sunt mai mici �ansele ca valorile estimate s� fie apropiate de cele reale. R27: a. 28. În inferen�a statistic� pentru sondajele de volum redus se utilizeaz� drept distribu�ii probabilistice: a. distribu�ia normal�, cu condi�ia ca popula�ia studiat� s� urmeze tot o distribu�ie normal�; b. distribu�ii t; c. distribu�ii în form� de clopot; d. distribu�ii în form� de J; e. distribu�ii în form� de U. R28: a, b, c.

29. În inferen�a statistic� pentru sondajele de volum mare se utilizeaz� drept distribu�ii probabilistice:

a. distribu�ia normal�; b. distribu�ii t; c. distribu�ii în form� de clopot; d. distribu�ii în form� de J;

e. distribu�ii în form� de U. R29: a, c. 30. În cadrul verific�rii ipotezelor statistice, ipoteza nul� reprezint�:

a. o ipotez� care îmbrac� forma aprecierii ini�iale ; b. o ipotez� care reprezint� opusul aprecierii ini�iale; c. ipoteza distribu�iei normale a valorilor estimate.

R30: a. 31. În cadrul verific�rii ipotezelor statistice, ipoteza alternativ� reprezint�:

a. o ipotez� care îmbrac� forma aprecierii ini�iale ; b. o ipotez� care reprezint� opusul aprecierii ini�iale; c. ipoteza distribu�iei normale a valorilor estimate. R31: b.

32. O leg�tur� cu o singur� variabil� independent� este invers� atunci când: a. cele dou� variabile evolueaz� în acela�i sens; b. variabilele evolueaz� în sensuri opuse; c. leg�tura are intensitate maxim�; d. leg�tura este liniar�.

Page 208: STEFANESCU - B S - PIED - uni-muenchen.de9.3. Analiza legturilor dintre variabile prin intermediul regresiei 9.4. Indicatori de apreciere a sensului i intensit ii legturilor dintre

R32: b.

33. În cadrul analizei dinamice se consider� c� factorii de influen�� continu� î�i exercit� impactul:

a. în mod constant pentru toat� durata acoperit� de seria în timp; b. în mod discontinuu, dar cu regularitate, la intervale de timp relativ egale; c. în mod discontinuu �i neregulat.

R33: a. 34. În cadrul analizei dinamice se consider� c� factorii de influen�� oscilant� î�i exercit� impactul:

a. în mod constant pentru toat� durata acoperit� de seria în timp; b. în mod discontinuu, dar cu regularitate, la intervale de timp relativ egale; c. în mod discontinuu �i neregulat.

R34: b.

35. În cadrul analizei dinamice se consider� c� factorii de influen�� aleatorie î�i exercit� impactul:

a. în mod constant pentru toat� durata acoperit� de seria în timp; b. în mod discontinuu, dar cu regularitate, la intervale de timp relativ egale; c. în mod discontinuu �i neregulat.

R35: c. 36. Categoria factoriilor de influen�� oscilant� cuprinde: a. factori ciclici; b. factori sezonieri; c. factorii influen�� aleatorie. R36: a, b. 37. În cadrul analizei dinamice se consider� c� trendul este un rezultat al: a. factorilor de influen�� continu�; b. factorilor de influen�� oscilant�; c. factorilor de influen�� aleatorie. R37: a. 38. În cadrul analizei dinamice se consider� c� varia�ia rezidual� este un rezultat al: a. factorilor de influen�� continu�; b. factorilor de influen�� oscilant�;

Page 209: STEFANESCU - B S - PIED - uni-muenchen.de9.3. Analiza legturilor dintre variabile prin intermediul regresiei 9.4. Indicatori de apreciere a sensului i intensit ii legturilor dintre

c. factorilor de influen�� aleatorie. R38: c. 39. În cadrul analizei dinamice se consider� c� mi�c�rile ciclice (ondulatorii) sunt un rezultat al: a. factorilor de influen�� continu�; b. factorilor de influen�� oscilant�; c. factorilor de influen�� aleatorie. R39: b. 40. În cadrul analizei dinamice modificarea absolut� este o m�rime care exprim�; a. valoarea caracteristicii studiate la un moment de timp (sau pentru un interval de timp); b. diferen�a dintre valorile indicatorului de nivel la dou� momente de timp; c. raportul dintre valorile indicatorului de nivel la dou� momente de timp. R40: b. 41. În cadrul analizei dinamice indicatorul de nivel este o m�rime care exprim�: a. valoarea caracteristicii studiate la un moment de timp (sau pentru un interval de timp); b. diferen�a dintre valorile caracteristicii studiate la dou� momente de timp; c. raportul dintre valorile caracteristicii studiate la dou� momente de timp. R41: c. 42. O valoare pozitiv� a modific�rii absolute exprim�, în cadrul analizei dinamice: a. cre�terea între cele dou� momente de timp; b. sc�derea între cele dou� momente de timp; c. stagnarea între cele dou� momente de timp. R42: a. 43. O valoare negativ� a modific�rii absolute exprim�, în cadrul analizei dinamice: a. cre�terea între cele dou� momente de timp; b. sc�derea între cele dou� momente de timp; c. stagnarea între cele dou� momente de timp. R43: b.

Page 210: STEFANESCU - B S - PIED - uni-muenchen.de9.3. Analiza legturilor dintre variabile prin intermediul regresiei 9.4. Indicatori de apreciere a sensului i intensit ii legturilor dintre

44. O valoare nul� a modific�rii absolute exprim�, în cadrul analizei dinamice: a. cre�terea între cele dou� momente de timp; b. sc�derea între cele dou� momente de timp; c. stagnarea între cele dou� momente de timp. R44: c. 45. În cadrul analizei dinamice o valoare supraunitar� a indicelui dinamicii exprim�: a. cre�terea între cele dou� momente de timp; b. sc�derea între cele dou� momente de timp; c. stagnarea între cele dou� momente de timp. R45: a. 46. În cadrul analizei dinamice o valoare subunitar� a indicelui dinamicii exprim�: a. cre�terea între cele dou� momente de timp; b. sc�derea între cele dou� momente de timp; c. stagnarea între cele dou� momente de timp. R46: b. 47. În cadrul analizei dinamice o valoare supraunitar� a indicelui dinamicii exprim�: a. cre�terea între cele dou� momente de timp; b. sc�derea între cele dou� momente de timp; c. stagnarea între cele dou� momente de timp. R47: c. 48. Ajustarea seriilor în timp în raport cu trendul const� în: a. determinarea, pentru toate valorile seriilor, a componentelor datorate factorilor de influen�� continu�; b. determinarea, pentru toate valorile seriilor, a componentelor datorate factorilor de influen�� oscilant�; c. determinarea, pentru toate valorile seriilor, a componentelor datorate factorilor de influen�� aleatorie. R48: a. 49. Într-o prognoz� prin extrapolare asupra manifest�rii unui fenomen colectiv se porne�te de la premisa c�: a. factorii care au influen�at fenomenul în trecut vor avea în viitor un impact similar;

Page 211: STEFANESCU - B S - PIED - uni-muenchen.de9.3. Analiza legturilor dintre variabile prin intermediul regresiei 9.4. Indicatori de apreciere a sensului i intensit ii legturilor dintre

b. factorii care au influen�at fenomenul în trecut nu vor mai avea nicio influen�� în viitor; c. factorii care au influen�at fenomenul în trecut vor avea în viitor un impact semnificativ diferit. R49: a. 50. În cadrul analizei dinamice valoarea ritmului dinamicii se ob�ine: a. sc�zând o unitate din valoarea indicelui dinamicii; b. raportând o modificare absolut� la valoarea folosit� drept baz� de compara�ie; c. adunând o unitate din valoarea indicelui dinamicii. R50: a, b.

Bibliografie selectiv�

1. Biji Mircea, Biji Maria Elena, Lilea Eugenia, Anghelache Constantin, Tratat de statistic�, Editura Economic�, Bucuresti, 2003;

2. Curwin Jon, Slater Roger, Quantitative Methods for Business Decision, Third Edition, Chapman&Hall, London, 1991;

3. Georgescu-Roegen Nicholas, Metoda statistic�, Editura Expert, Bucuresti, 1998;

4. Isac-Maniu Alexandru, Mitru� Constantin, Voineagu Vergil, Statistica

pentru managementul afacerilor, Edi�ia a doua, Editura Economic�, Bucuresti, 2003;

5. Jaba Elisabeta, Statistica economic�, Edi�ia a treia, Editura Economic�, Bucuresti, 2003;

6. Lucey Terry, Quantitative Techniques, 5th Edition, D.P. Publication, London, 1996.