001.distributii de frecvente1.distributii de frecvente

5
Prof.univ.dr. Alin Gilbert Sumedrea – Statistică psihologică (curs universitar) 1 După Yule şi Kendall, statistica este definită ca fiind “expunerea riguroasă a metodelor statistice”. După aceiaşi autori, metodele statistice sunt definite ca proceduri adoptate pentru studiul datelor statistice. Datele statistice se prezintă sub forma unor şiruri de observaŃii privind mărimea diferitelor variabile sau caracteristici analizate. 1. DISTRIBUłII DE FRECVENłE Statistica operează cu grupuri şi foarte des cu grupuri mari de observaŃii. ObservaŃiile se găsesc într-o mare varietate de forme. Ele pot fi de natură cantitativă (temperatura zilnică, înălŃimea indivizilor etc.) sau de natură calitativă (culoarea ochilor, oameni politici favoriŃi etc.). Indiferent de natura sau originea lor, datele trebuie să fie organizate sau sintetizate în aşa fel încât să li se discearnă sensul sau semnificaŃia. O modalitate de a realiza acest lucru constă în construirea distribuŃiei de frecvenŃe. O distribuŃie de frecvenŃe evidenŃiază valorile unei mulŃimi de date statistice asociate cu frecvenŃele de apariŃie ale acestora. 1.1 DISTRIBUłII DE FRECVENłE PENTRU VARIABILE CANTITATIVE Să presupunem că în urma susŃinerii examenului de psihologie generală de către un număr de 30 de studenŃi, profesorul titular doreşte să ştie cum au aprofundat studenŃii materia predată. Cum s-au prezentat studenŃii în general? În ce interval de grupare sunt cuprinse cele mai multe note? CâŃi studenŃi nu au trecut examenul? Să admitem că scorul unui student este de 75. Cum putem compara acest scor cu scorurile realizate de ceilalŃi colegi? La aceste întrebări se poate răspunde cu dificultate dacă datele nu sunt prelucrate în prealabil. Să presupunem că rezultatele obŃinute la examen de către studenŃi sunt cele prezentate în tabelul de mai jos. Scorurile obŃinute de studenŃi la examenul de psihologie generală 40 70 90 100 90 30 35 70 60 80 75 60 20 90 20 80 70 60 35 40 20 80 60 65 60 35 45 80 85 70 Cea mai simplă cale de a vedea ce spun datele statistice constă în ordonarea scorurilor. Se poate începe prin identificarea celui mai mare şi a celui mai mic scor, identificare urmată de ordonarea descrescătoare a tuturor scorurilor posibile, incluzând extremele. Fiecărui scor i se poate ataşa frecvenŃa de apariŃie corespunzătoare, rezultând următoarea distribuŃie de frecvenŃe a scorurilor. DistribuŃia de frecvenŃe a scorurilor Scor FrecvenŃă Scor FrecvenŃă Scor FrecvenŃă Scor FrecvenŃă Scor FrecvenŃă 100 1 80 4 65 1 40 2 20 3 90 3 75 1 60 5 35 3 85 1 70 4 45 1 30 1

Upload: cretu-ileana

Post on 24-Oct-2015

26 views

Category:

Documents


2 download

DESCRIPTION

01.Distributii de FrecventeStatistica psihologică- cursuri an I , ULBsibiu, cursuri universitare, 17 cursuri format Pdf

TRANSCRIPT

Page 1: 001.Distributii de Frecvente1.Distributii de Frecvente

Prof.univ.dr. Alin Gilbert Sumedrea – Statistică psihologică (curs universitar)

1

După Yule şi Kendall, statistica este definită ca fiind “expunerea riguroasă a

metodelor statistice”. După aceiaşi autori, metodele statistice sunt definite ca proceduri adoptate pentru studiul datelor statistice. Datele statistice se prezintă sub forma unor şiruri de observaŃii privind mărimea diferitelor variabile sau caracteristici analizate.

1. DISTRIBUłII DE FRECVENłE

Statistica operează cu grupuri şi foarte des cu grupuri mari de observaŃii. ObservaŃiile se găsesc într-o mare varietate de forme. Ele pot fi de natură cantitativă (temperatura zilnică, înălŃimea indivizilor etc.) sau de natură calitativă (culoarea ochilor, oameni politici favoriŃi etc.). Indiferent de natura sau originea lor, datele trebuie să fie organizate sau sintetizate în aşa fel încât să li se discearnă sensul sau semnificaŃia. O modalitate de a realiza acest lucru constă în construirea distribuŃiei de frecvenŃe. O distribuŃie de frecvenŃe evidenŃiază valorile unei mulŃimi de date statistice asociate cu frecvenŃele de apariŃie ale acestora. 1.1 DISTRIBUłII DE FRECVENłE PENTRU VARIABILE CANTITATIVE Să presupunem că în urma susŃinerii examenului de psihologie generală de către un număr de 30 de studenŃi, profesorul titular doreşte să ştie cum au aprofundat studenŃii materia predată. Cum s-au prezentat studenŃii în general? În ce interval de grupare sunt cuprinse cele mai multe note? CâŃi studenŃi nu au trecut examenul? Să admitem că scorul unui student este de 75. Cum putem compara acest scor cu scorurile realizate de ceilalŃi colegi? La aceste întrebări se poate răspunde cu dificultate dacă datele nu sunt prelucrate în prealabil. Să presupunem că rezultatele obŃinute la examen de către studenŃi sunt cele prezentate în tabelul de mai jos.

Scorurile obŃinute de studenŃi la examenul de psihologie generală 40 70 90 100 90 30 35 70 60 80 75 60 20 90 20 80 70 60 35 40 20 80 60 65 60 35 45 80 85 70

Cea mai simplă cale de a vedea ce spun datele statistice constă în ordonarea scorurilor. Se poate începe prin identificarea celui mai mare şi a celui mai mic scor, identificare urmată de ordonarea descrescătoare a tuturor scorurilor posibile, incluzând extremele. Fiecărui scor i se poate ataşa frecvenŃa de apariŃie corespunzătoare, rezultând următoarea distribuŃie de frecvenŃe a scorurilor.

DistribuŃia de frecvenŃe a scorurilor Scor FrecvenŃă Scor FrecvenŃă Scor FrecvenŃă Scor FrecvenŃă Scor FrecvenŃă 100 1 80 4 65 1 40 2 20 3 90 3 75 1 60 5 35 3 85 1 70 4 45 1 30 1

Page 2: 001.Distributii de Frecvente1.Distributii de Frecvente

Prof.univ.dr. Alin Gilbert Sumedrea – Statistică psihologică (curs universitar)

2

Odată ce datele statistice au fost organizate în acest mod, pot fi făcute o serie de observaŃii interesante. Analizând datele statistice se constată că deşi amplitudinea scorurilor este de 80 ( 20100minmax −=− xx ), totuşi cea mai mare parte a scorurilor se

înregistrează în intervalul (45-90) cu un vârf la scorul de 60. De asemenea se remarcă scorul maxim obŃinut de un student care se detaşează de celelalte scoruri şi zece studenŃi care nu au trecut baremul de promovare a examenului (50). În ce priveşte scorul de 75 obŃinut de către un student, el este superior scorului la „modă” (=60), nouă studenŃi obŃinând scoruri mai mari. 1.2 SCORURI GRUPATE DistribuŃia de frecvenŃe rezultată mai sus este o distribuŃie de frecvenŃe a datelor ne-grupate. Când seriile de date sunt foarte lungi, interpretarea informaŃiilor chiar în serii cu distribuŃie de frecvenŃe după modelul de mai sus rămâne dificilă. O modalitate de a sintetiza şi mai mult conŃinutul informaŃional al unei serii de date statistice constă în gruparea scorurilor pe grupe de scoruri. Mărimea intervalelor de grupare se poate calcula, din relaŃia:

n

xxMig minmax −

=

cu n reprezentând numărul intervalelor de grupare. Pentru un număr de 4 intervale de grupare (n=4) Mig-ul pentru seria scorurilor obŃinute la examenul de psihologie generală este egal cu (100-20)/4=20 iar pentru n=8, Mig=10.

Scorurile convertite în distribuŃii de frecvenŃe pentru Mig=20 şi Mig=10 DistribuŃia A DistribuŃia B

Intervale de grupare FrecvenŃe Intervale de grupare FrecvenŃe [100-80] 9 [100-90] 4 (80-60] 11 (90-80] 5 (60-40] 3 (80-70] 5 (40-20] 7 (70-60] 6

n=30 (60-50] 0 (50-40] 3 (40-30] 4 (30-20] 3 n=30

Când se recurge la gruparea datelor după modelul prezentat mai sus se pierd anumite informaŃii. De exemplu, în distribuŃia A nu avem idee unde se plasează scorul de 70 şi cel de 65 în intervalul (80-60]. Ar putea fi foarte bine plasate în zona superioară după cum la fel de bine ar putea fi plasate în zona inferioară. Singurul mod în care am putea afla aceste informaŃii este să ne întoarcem la distribuŃia de frecvenŃe a datelor ne-grupate. În al doilea rând, dintr-o mulŃime de scoruri individuale nu rezultă neapărat o singură mulŃime de scoruri grupate. Aşa cum se constată şi din tabelul de mai sus, sunt prezentate două mulŃimi de scoruri grupate care au rezultat din aceeaşi mulŃime de date ne-grupate. 1.3 REGULILE DE FORMARE ALE INTERVALELOR DE GRUPARE Dacă o mulŃime de scoruri individuale poate fi grupată în mai multe moduri, cum se poate decide asupra unui anumit mod? Din fericire există convenŃii larg

Page 3: 001.Distributii de Frecvente1.Distributii de Frecvente

Prof.univ.dr. Alin Gilbert Sumedrea – Statistică psihologică (curs universitar)

3

acceptate pentru organizarea şi sintetizarea datelor statistice cu scopul de a fi mai bine înŃelese. Acestea sunt:

1. toate intervalele de grupare trebuie să aibă aceeaşi lungime; 2. intervalele trebuie să fie continue; 3. intervalul conŃinând cel mai mare scor trebuie să fie plasat la începutul

distribuŃiei; 4. este de dorit ca într-o distribuŃie de frecvenŃe să existe între 10 şi 20 de

intervale; 5. limitele intervalelor trebuie să fie multiplii ai lungimii intervalelor.

1.4 DISTRIBUłII DE FRECVENłE RELATIVE În urma unei campanii de sensibilizare a populaŃiei în legătură cu donarea de sânge în spitale, pe parcursul unei săptămâni s-au prezentat la serviciile specializate 200 de persoane. Reprezintă numărul de donatori înregistraŃi un procent apreciabil care să ne permită să emitem ipoteze cu privire la sensibilitatea populaŃiei vis-a-vis de iniŃiativa de ajutorare a persoanelor cu probleme de sănătate? În măsura în care campania de sensibilizare a fost ascultată de toŃi membrii unei comunităŃi în număr de 2000 de persoane, atunci disponibilitatea populaŃiei faŃă de donarea de sânge poate fi apreciată la 10%, ceea ce constituie un procent apreciabil. Dacă însă campania a fost ascultată de un număr de 2000000 de persoane, atunci atitudinea populaŃiei poate fi catalogată ca “una slabă”. Pentru multe scopuri, cea mai relevantă întrebare este „cât de mult?”, în timp ce pentru altele este „ce procent?”, sau „ce proporŃie?”. FrecvenŃele absolute ale intervalelor de grupare dintr-o distribuŃie de frecvenŃe pot fi uşor transformate în frecvenŃe relative prin convertirea frecvenŃelor absolute în proporŃii sau procente. O distribuŃie de frecvenŃe relative arată scorurile şi proporŃiile sau procentele pe care aceste scoruri le reprezintă în ansamblul distribuŃiei scorurilor. Pentru a obŃine proporŃia fiecărui interval de grupare, se împarte frecvenŃa intervalului la numărul total de cazuri (f/n). Procentele se obŃin, multiplicând proporŃiile obŃinute cu 100. În tabelul de mai jos este prezentată distribuŃia de frecvenŃe relative (distribuŃia A), folosind datele exemplului prezentat în paragraful 1.2.

DistribuŃia de frecvenŃe relative (A) Interval de grupare FrecvenŃa ProporŃia Procentul (%)

[100-80] 9 0,3 30 (80-60] 11 0,367 36,7 (60-40] 3 0,1 10 (40-20] 7 0,233 23,3 Total n=30 1 100

Analizând datele din tabel, se constată că aproximativ 2/3 din studenŃii analizaŃi au obŃinut scoruri cuprinse între 60 şi 100 iar aproape un sfert, între 20 şi 40.

De regulă, frecvenŃele relative sunt folosite pentru compararea a două sau mai multe distribuŃii de frecvenŃe de mărimi diferite.

Să presupunem că un profesor Ńine zilnic două cursuri, unul dimineaŃa iar celălalt seara. Numărul de cursanŃi care frecventează cursul de dimineaŃă este de 40, în timp ce cursul seral este frecventat de 20. Rezultatele obŃinute la examenul de evaluare pentru cele două grupuri de studenŃi sunt prezentate mai jos.

Page 4: 001.Distributii de Frecvente1.Distributii de Frecvente

Prof.univ.dr. Alin Gilbert Sumedrea – Statistică psihologică (curs universitar)

4

DistribuŃiile de frecvenŃe relative asociate scorurilor obŃinute de cele două grupuri de studenŃi DistribuŃia 1 DistribuŃia 2 Interval de grupare FrecvenŃă Procent FrecvenŃă Procent

100-90 1 2,5 3 15 90-80 4 10 5 25 80-70 10 25 10 50 70-60 15 37,5 1 5 60-50 3 7,5 1 5 50-40 7 17,5 0 0 Total 40 100 20 100

Aşa cum se poate observa, compararea frecvenŃelor nu este deloc simplă. Însă transformarea frecvenŃelor absolute în frecvenŃe relative face ambele distribuŃii comparabile. 1.5 DISTRIBUłIA FRECVENłELOR PROCENTUALE CUMULATE Deseori este folositor să se ştie procentul cazurilor care se plasează sub un anumit scor înregistrat într-o distribuŃie. De exemplu, care este procentul studenŃilor care obŃin scoruri mai mici de 80? Sau care este procentul bărbaŃilor în vârstă de 40 de ani care au o înălŃime mai mică de 180 cm.? La întrebările de acest gen se poate răspunde cel mai uşor atunci când se dispune de distribuŃii de frecvenŃe procentuale cumulate. O asemenea distribuŃie prezintă procentele cazurilor care se plasează sub limita maximă a fiecărui interval de grupare (exceptând limita maximă a primului interval).

Procentele şi frecvenŃele cumulate pentru o serie cu distribuŃie de frecvenŃe Interval de grupare FrecvenŃa FrecvenŃa cumulată

descrescător FrecvenŃa relativă

cumulată descrescător %

[100-90] 2 40 100 (90-80] 3 38 95 (80-70] 10 35 87,5 (70-60] 15 25 62,5 (60-50] 3 10 25 (50-40] 7 7 17,5

n=40 Paşii necesari pentru construirea distribuŃiei frecvenŃelor procentuale cumulate sunt:

- construirea distribuŃiei de frecvenŃe pentru datele grupate în intervale de grupare;

- calculul frecvenŃelor cumulate; - transformarea frecvenŃelor cumulate în procente cumulate.

Procentele cumulate indică numărul de cazuri care înregistrează scoruri mai mici decât limita superioară a intervalelor de grupare. Din tabelul prezentat mai sus rezultă că 95% din studenŃi au obŃinut scoruri mai mici de 90 iar 62,5% au obŃinut scoruri mai mici de 70. De asemenea procentele cumulate se dovedesc utile în comparaŃii, atunci când se pune problema analizării criteriilor de grupare a scorurilor în intervale de grupare. Din tabelul referitor la distribuŃia de frecvenŃe relative (A), rezultă că 70% din studenŃi au obŃinut scoruri mai mici de 80 în timp ce din tabelul de mai sus, 87,5%

Page 5: 001.Distributii de Frecvente1.Distributii de Frecvente

Prof.univ.dr. Alin Gilbert Sumedrea – Statistică psihologică (curs universitar)

5

din studenŃi au obŃinut punctaje inferioare celui menŃionat. Punctajul mediu realizat de studenŃi (66,25) se află plasat undeva în intervalul (70-60]. 1.6 SCORURILE ŞI RANGURILE PERCENTILE Scorurile şi rangurile percentile sunt larg utilizate în evaluări psihologice şi educaŃionale pentru a relata poziŃia unei performanŃe individuale în cadrul unui grup de performanŃe. Un rang percentil este procentul de cazuri care înregistrează un scor inferior scorului dat. Dacă într-o distribuŃie, 60% din cazuri obŃin scoruri inferioare lui 32 atunci rangul percentil al acestui scor este de 60. În contrast cu rangul percentil, scorul percentil este scorul sub care se plasează un anumit număr de cazuri. Prin urmare scorul percentil de 32 este scorul pentru care 60% din studenŃi obŃin un scor mai mic decât acesta. NotaŃia atribuită este următoarea: αP unde α este procentul

cazurilor care înregistrează scoruri inferioare unui anumit scor. De exemplu, scorul percentil al lui 32 se notează 3260 =P . Dacă datele statistice sunt prezentate sub

forma unei distribuŃii ca cea de mai sus, atunci nu este posibil să determinăm direct scorurile şi rangurile percentile. De exemplu rangul percentil al unui scor de 62 se află plasat undeva între 25 şi 62,5. Pentru această situaŃie, determinarea rangului percentil trebuie să urmeze o procedură de interpolare, pornind de la presupunerea că frecvenŃele în interiorul fiecărui interval de grupare sunt distribuite uniform. 1.7 DISTRIBUłII DE FRECVENłE PENTRU VARIABILE CALITATIVE

DistribuŃiile de frecvenŃe pot fi construite şi pentru variabile calitative. Să presupunem că dorim să aflăm preferinŃa unui număr de 20 de subiecŃi pentru aprofundarea psihologiei cognitive. Se poate începe prin chestionarea fiecărui subiect, înregistrând o singură preferinŃă. PreferinŃele exprimate sunt: aprofundarea studiului teoretic, prezentarea de cercetări recente şi studiu practic.

DistribuŃia de frecvenŃe pentru variabila calitativă “PreferinŃa de aprofundare a psihologiei cognitive”

PreferinŃa de aprofundare a psihologiei cognitive

FrecvenŃa Procentul %

Aprofundare studiu teoretic 9 45 Prezentare de cercetări 7 35

Studiu practic 4 20 n=20

PreferinŃa pentru aprofundarea studiului este o variabilă calitativă (nominală), cele trei preferinŃe înregistrate, diferind prin gen şi nu prin cantitate. De regulă, reprezentarea unei distribuŃii de frecvenŃe pentru o variabilă nominală presupune parcurgerea următorilor paşi:

- listarea tuturor categoriilor înregistrate pentru o variabilă; - înregistrarea frecvenŃelor asociate fiecărei categorii şi, dacă se doreşte,

înregistrarea procentelor corespunzătoare. Este potrivit să folosim frecvenŃele şi procentele cumulate pentru o astfel de distribuŃie? Categoric nu, pentru că este un non-sens să vorbim despre un student care se situează sub aprofundare de studiu teoretic sau sub orice altă categorie a oricărei variabile calitative. Procedura de cumulare porneşte de la ideea unui continuum de scoruri.