st1 01 curs introductiv
DESCRIPTION
bkjnmnTRANSCRIPT
STATISTICA PSIHOLOGICĂ
ŞI PRELUCRAREA
INFORMATIZATĂ A DATELOR
Titular de curs: Conf. univ. dr. Marian Popa
www.mpopa.ro
Seminarii: Lect. univ. dr. Alina Vasile; Drd. Gorbănescu Adrian; Prof. asoc. dr. Traian Manea
„...gândirea statistică va deveni într-o zi la fel de necesară pentru un cetăţean eficient, la fel ca şi abilitatea de a citi şi a scrie”.
H.G. Wells (1866-1946)
2
Curs introductiv
Organizarea cursului
Definiţia statisticii
Statistica, instrument al metodei ştiinţifice în psihologie
Scurt istoric al statisticii în psihologie
Utilitatea statisticii în activitatea curentă a psihologilor
Dificultăţi şi riscuri în însuşirea metodelor statistice
Concepte statistice fundamentale
Măsurare în psihologie
3
1. Organizare
Statutul cursului
Disciplină fundamentală
de suport interdisciplinar
Durata studiilor
2 semestre
Număr de credite
5+2
4
Tipuri de activităţi didactice:
• Sem. I: 2hC+2hS (56 ore)
• Sem. II: 1hC+2hL (42 ore)
• teme pentru acasă
• se găsesc pe site
• vor fi predate sub formă scrisă, la fiecare seminar
• nu se admite prezentarea ulterioară!
5
Sistemul de evaluare
(sem I)
• 3 pe semestru – anunţate
• teste de cunoştinţe cu întrebări deschise
evaluări periodice (2p)
• prezenţa (o absenţă= -0.2p)
• calitatea temelor (copierea=absență)
• Activism (la aprecierea prof.)
evaluare de seminar (4p)
• semestrialExamen (4p)
6
Suport de curs
Manual de bază:
• Statistică pentru psihologie. Teorie și aplicații SPSS, M. Popa, Editura Polirom, 2008– Prezentări de curs - pagina web:
www.mpopa.ro
Bibliografie suplimentară (facultativă):
• Orice manual introductiv în statistică
• Referințele bibliografice ale cursului
• Adrese web recomandate pe site
7
Cerinţe
Calculator de buzunar cu funcţii elementare
Fixarea stabilă într-o grupă de studiu
Conduita în sala de curs…
Evitaţi să deveniţi “excepţii de la regulă”
8
Dificultăţi specifice
Volum mare de concepte noi
mai ales la primele cursuri!
Informaţii interdependente
chiar şi o absenţă poate însemna mult!
Precizie şi rigoare în exprimare
limbaj specializat
care nu admite ambiguităţi
Evaluări frecvente
obligatorii pentru fixarea cunoştinţelor
statisticofobia
naivitatea statistică
epatare statistică
RISCURI
9
Recomandări
• Prezenţa constantă la curs şi seminar
• Realizarea independentă a temelor– cooperarea este un lucru bun… dar nu prin copiere
• Participarea la evaluările parţiale
• Teamă de statistică?– concentraţi-vă mai ales pe raţionament şi nu pe numere sau
calcule
– calculele nu vor depăşi nivelul aritmeticii elementare
– nu va trebui sa reţineţi formule
– în spatele cifrelor se află întotdeauna realităţi intuitive
Echivalarea cursului?
• Condiţii:
– programa analitică a cursului urmat anterior să
fie echivalentă cu cea a cursului nostru;
– o evaluare generală a cunoştinţelor
• întrebări referitoare la cunoştinţe statistice de bază;
– poate fi cerută numai în primele două
saptamâni ale semestrului
11
2. Definiţii
• Statistica– domeniu al matematicii cu ramuri aplicative (statistica psihologică)
– „Ştiinţa care ne învaţă care este organizarea politică a tuturor statelor
moderne ale lumii”
• 1770, Londra, baronul Bielfeld „The Elements of Universal Erudition”
(capitol de „statistică”)
– recoltarea, descrierea şi analizarea datelor în vederea extragerii unor
concluzii (inferenţe) pe baza acestora
– operează cu date numerice care descriu realitatea din jurul nostru
• Datele– informaţii obţinute prin categorializare, numărare sau măsurare, pe
baza utilizării unor metode adecvate
12
3. Metoda științifică în psihologie
căută reguli cu un anumit nivel de generalitate, care depășesc nivelul particular sau individual;
colectează dovezi obiective, de natură empiric-inductivă;
operează cu afirmaţii controlabile pe care le testează cu proceduri acceptate de comunitatea cercetătorilor;
atitudine sceptică faţă de rezultate și față de cunoştinţele acumulate;
atitudine deschisă faţă de orice informaţii noi;
creativitate şi transparenţă.
13
Pământenii se împart în trei
categorii (Huck, 2004)
• Aproape orice psiholog face din această categorie
cei care fac cercetare ştiinţifică
• Orice psiholog face parte din această categorie
cei care nu fac cercetare, dar se
confruntă cu rezultatele altora
• Nu te poţi numi psiholog dacă faci faci parte din această categorie
cei care nici nu fac şi nici nu se întâlnesc
cu rezultatele cercetărilor
Statistica nu se confundă cu metoda științifică, ci este doar un instrument al acesteia
• Statistica este incercarea de a răspunde cu ajutorul
numerelor la întrebările pe care ni le punem
• Punctul central al statisticii este problema (raționamentul),
nu numerele!
– Ne punem o problemă
• Este eficientă utilizarea unei metode de terapie anxiolitică?
– Construim un model de cercetare
• Același grup înainte/după; Două grupuri (terapie/non-terapie)
– Măsurăm (cuantificăm)
• Chestionar…
– Analizăm
• Proceduri statistice (descriptive, test de semnificație a diferenței ș.a.)
– Tragem concluzii…
• Acceptăm existența unui efect? Cât de mare este? Câtă încredere putem avea?
16
un exemplu...
Observaţie
Definirea
problemei
Ipoteză
Date
Testarea ipotezei
acceptarerespingere
Teorie
Publicare
Terapeutul –DA; Cercetătorul - ?
Se măsoară anxietatea pe două grupe
Procedură de comparare a mediilor
Este diferenţa semnificativă?
Se publică, într-un anumit format
O nouă metodă de terapie a anxietăţii
Este eficientă?
• Formarea psihologilor trebuie să cuprindă obligatoriu:
• cunoştinţe teoretice
• abilităţi şi competenţe practice
• capacităţi de cercetare ştiinţifică
EFPA (European
Federation of PsychologistsAssociations)
19
20
4. Scurt istoric al statisticii
în psihologie
• ideea unui domeniu matematic al psihologiei (“psihometrie”)Christian von . Wolf, 1732
• iniţiatorul şcolii psihometrice englezeFrancis Galton (1882-
1911)
• antropolog şi psiholog (analiza de corelaţie)Karl Pearson (1857-1936)
• Elev al lui Wundt, iniţiază analiza bifactorială a inteligenţeiCharles E. Spearman
(1863-1945)
• statistica aplicată în psihofiziologieE.H. Weber (1795-1878) şi G.T. Fechner (1801-1887)
• teoria factorială a personalităţii (16PF)Raymond B. Cattel (1905-
1988)
• un geniu al statisticii (analiza de varianţă)Ronald A. Fisher (1890-
1962)
21
în evaluare
• construirea instrumentelor (teste, chestionare, scale)
• utilizarea instrumentelor (etalonare, diagnostic)
• selecţia psihologică (validare, prognoză)
în psihoterapie
• probarea eficienţei
• construirea modelelor terapeutice (durată, context etc.)
• relația dintre genul tipul terapeutului și eficiența terapiei
în instruire
• evaluarea performanţei
5. Utilitatea statisticii în practica psihologică
22
23
6. Concepte fundamentale
noţiunea de variabilă statistică
v. dependente / v. independente
v. continue / v. discrete
populaţie şi eşantion
statistica descriptivă / inferenţială
Cercetări experimentale / corelaţionale
24
Noţiunea de variabilă statistică
Definiţiecaracteristică a realităţii care
poate lua valori diferite
vârsta, inteligenţa,
satisfacţia etc.
distribuţia variabilei
valorile şi frecvenţa de
apariţie a fiecărei valori
2, 9, 11, 5, 8, 10, 15, 3, 7, 2, 11, 5
variabilitatea
măsura în care o distribuţie este
compusă din valori mai asemănătoare sau mai diferite una
de alta
caracteristica cea mai
importantă a variabilei
25
• ce sunt…• genul ............
• culoarea ochilor ...
• temperamentul
• lateralitatea .....
• religia ..............
• dar...– m, f
– căprui, albaștri, negri…
– flegmatic, sanguin, coleric...
– dreptaci, stângaci
– ortodox, musulman...
26
v. dependente/v. independente
distincţia se face în context de cercetare
o cercetare vizează
relaţia între variabile
v.
dependentă
suportă un efect, variază în funcţie de
ceva
face obiectul central
cercetării
v. independentă
determină un efect, induce variaţia VD
reprezintă contextul în
care se manifestă VD
27
• exemplu: o cercetare care vizează
numărul orelor de somn la studenţi, în
timpul semestrului, comparativ cu
perioada de sesiune
– orele de somn= v. dependentă
– perioada din semestru= v. independentă
Ce valori iau fiecare din cele două variabile?
28
• alegerea procedurii de testare a ipotezei
de ce este important să
distingem
VD și VI?
• le plasăm într-un raţionament de tip cauzal
• variabila “cauză”=v. independentă
• variabila “efect”=v. dependentă
• atenţie, concluziile cercetării nu vor fi neapărat de tip cauzal!
cum le distingem?
• relaţia dintre ereditate şi inteligenţă
• relaţia dintre eficienţa învăţării şi
temperatura ambiantă
• relaţia dintre nota la bacalaureat şi
nota la examenul de admitere
identificaţi VD şi VI:
30
v. continue/v. discrete
• exemple: greutatea, înălţimea, timpul de reacţie
v „continuă”→ poate lua un număr
teoretic infinit de niveluri ale valorilor (suportă zecimale)
• exemple: numărul persoanelor dintr-o familie, numărul de ţigarete fumate zilnic, scorul la un test
v. „discretă” → poate lua un număr
finit de valori (nu suportă zecimale)
31
populaţie şi eşantion
• Populația– cercetării: totalitatea „unităţilor de
informaţie” care constituie obiectivul de
interes al unei investigaţii (de regulă,
persoane)
– statistică: valorile care descriu
populația cercetării
• Eşantionul– Cercetării: toate persoanele care fac
obiectul studiului
– Statistic: toate valorile unei variabile,
măsurate pe eşantionul cercetării
Populatie
eșantion
exemple
• studiu asupra relației dintre accesul la
internet și comportamentul elevilor de liceu
– populaţia = elevii de liceu
– eşantionul = elevii selecţionaţi pentru investigaţie,
• studiu care vizează relația dintre inteligenţă și
performanţa în instruirea de zbor
– populaţia = toţi piloţii
– Eşantionul = subiecţii incluşi în studiu.
Reprezentativitatea eșantionului
• caracteristica unui eșantion de a descrie
în mod adecvat proprietățile populației din
care a fost extras
– are un caracter relativ (nu există eșantion
absolut reprezentativ)
– diferența dintre eșantion și populație se
numește eroare de eșantionare
• cu cât eroare este mai mică, cu atât concluzia
cercetării este mai sigură
”Bias”
• Eroare sistematică în constituirea
eșantionului– studiu asupra atitudinii faţă de utilizarea computerelor
în educaţie… sursă de BIAS:• eşantionul este constituit numai din elevi care utilizează frecvent
calculatorul
– Sondaj cu privire la intenţiile de vot bazat pe interviul
telefonic… surse de BIAS:
• starea socială a respondenţilor (îşi permit montarea unui
telefon)
• ora apelului (în orele dimineţii sunt acasă, să zicem, mai multe
femei casnice).
35
Statistica descriptivă/Statistica inferenţială
• S. descriptivă
– descrie datele, aşa cum sunt (numeric, grafic)
• S. inferenţială
– susţine concluzii (inferenţe) cu privire la o
populaţie, pe baza datelor unui eşantion extras din
acea populaţie• Parametrică
• Neparametrică
Măsurarea în psihologie
36
• ”Tot ceea ce există în
realitate, există într-o
anumită cantitate. Pentru a
cunoaște realitatea, trebuie
să o abordăm în egală
măsură sub aspect cantitativ,
dar și calitativ” (Thorndike, E. L., 1918, The nature, purposes, and
general methods of measurement of educational
products, p. 16)
Thorndike, Edward Lee
1874-1949
Ce este măsurarea?
- Concurs de manechine- Înălțime: 180 cm (poate fi exprimată și
în ”inch” sau ”picioare”)
- Bust: 90 cm
- Talie: 60 cm
- Șolduri: 90 cm
- Culoarea ochilor: - căprui (1), verzi (2), albaștri (3) (”c”, ”v”,
”a”)
- Inteligența (unități QI, stanine, nr. răspunsuri corecte)
- Frumusețea: - (1) urâțele
- (2) drăguțe
- (3) frumușele
- (4) frumoase de pică 38
- S.S. Stevens (1946) „On the theory of scale of
measurement”
- a măsura înseamnă ”a atribui valori numerice obiectelor și
fenomenelor, în conformitate cu anumite reguli”
- Limite ale definiției anterioare (Judd și McClelland, 1998)
- nu toate măsurările au un caracter numeric
- caracteristica de gen poate fi simbolizată cu caracterele ”m” și
”f”
- o regulă de atribuire a numerelor are caracter de măsurare
numai dacă ea instituie o anumită semnificație cu privire la
caracteristica măsurată
- Descrierea realității sub formă numerică sau
simbolică39
1906-1973
Caracteristici măsurabile în
psihologie
- de natură fizică (timpul de reacție, vârsta, diverși indicatori fiziologici)
- constructe psihice ”sociabilitatea”, ”motivația”, ”atitudinea față de risc”, ”depresia” …- ”modele” ale realității psihice a căror existență și nivel trebuie
probate
- nu pot fi măsurate direct, ci numai prin manifestările lor particulare
- Sociabilitatea (disponibilitatea de a comunica)- numărul prietenilor
- disconfortul resimțit în situații de izolare socială
- Constructul=variabilă latentă
- Indicatorii=variabile observate- distincție importantă pentru analiza de itemi, SEM
40
De ce este important să analizăm
procesul de măsurare?
- Cunoaşterea tipurilor de transformări la care
putem spune în mod legitim valorile rezultate
prin măsurare
- Evitarea concluziilor lipsite de sens
- Alegerea procedurilor statistice adecvate
datelor numerice şi scopurilor pe care ni le
propunem
41
Niveluri (scale) de măsurare
- Numerele diferă între ele prin semnificația și proprietățile lor
- niveluri (scale) de măsurare:- Nivelul nominal
- Nivelul ordinal
- Nivelul de interval
- Nivelul de raport
- Acestea sunt ordonate ierarhic- scalele superioare includ proprietățile celor
inferioare
42
a. Nivelul nominal
- Valorile indică categoria din care face parte cazul evaluat
- Exemple:- Genul: masculin/feminin (m/f; 1-2 …)
- Tipurile temperamentale (coleric, sanguinic, flegmatic, melancolic)
- Tipuri- De identificare (CNP, alte coduri arbitrare)
- Categoriale (m/f …)
- Caracteristici:- cel mai redus nivel de măsurare
- codurile valorilor sunt arbitrare
- valorile au doar o semnificaţie calitativă
- nu suportă operaţii aritmetice, în afară de însumare
- Pot fi grupate sau rafinate- Extravert (coleric, sanguinic); introvert (flegmatic, melancolic)
43
b. Nivelul ordinal
- Valorile au o semnificație cantitativă limitată la raportul de mărime
- Exemple:
- poziţia pe lista de admitere, în funcţie de notă
- evaluarea satisfacţiei pe o scală de la 1 la 10
- anul de studiu (1, 2, 3)
44
b. Nivelul ordinal
- Caracteristici:
- valorile au o semnificaţie cantitativă (mai mare/mai mic; mai mult/mai puţin), dar…
- precizează doar raportul de mărime dintre valori
- intervalele dintre valori sunt neprecizate- cit înseamnă “mai mare”?, cit înseamnă “mai
mic?”
- primul admis=9.90; al doilea=9.70; al treilea=8.15 !
- codurile valorilor pot fi acordate si arbitrar, dar ele trebuie sa exprime ideea de ordine
45
c. Nivelul de interval
- Valorile au un caracter cantitativ,
exprimat numeric
- Intervalele dintre valori sunt egale
- Exemple:
- temperatura, în grade Celsius (5°,6°,7°...)
- coeficientul de inteligenţă - numărul de
răspunsuri corecte la un test (14, 15, 25
...)
- scoruri la testele de personalitate (20, 19
...) 46
c. Nivelul de interval
- Caracteristici:
- intervalele sunt egale, dar lipseşte zero absolut
- 0°C nu înseamnă absenţa temperaturii (0°K)
- 10°C faţă de 5°C este “mai mare cu 5°”
- ... dar nu şi “de două ori mai cald”!
- suportă toate transformările matematice posibile
47
d. Nivelul de raport
- valori cantitative, exprimate numeric
- intervale egale plus... zero absolut!
- Exemple:
- gradele Kelvin, pentru temperatura (0°K
este temperatura minimă absolută)
- timpul, greutatea, înălţimea
48
d. Nivelul de raport
- caracteristici:- cel mai înalt nivel de măsurare (valorile au mai multă
informaţie)
- suportă toate transformările matematice posibile
- controverse în psihologie:- există valori de acest tip?
- inteligenţa=0, anxietate=0, etc., nu sunt posibile la fiinţele vii
- în practică, distincţia dintre variabilele de interval (I) şi de raport (R) nu este relevantă, ambele suportând aceleaşi proceduri statistice (I/R)
49
controversă în psihologie
- Sunt posibile măsurări cantitative ale caracteristicilor subiective?- variabilele psihologice sunt expresia unor
evaluări subiective
- Este greu de demonstrat egalitatea intervalelor dintre valori consecutive, chiar şi la evaluări obiective, precise:
- ”măsurarea “iubirii” prin “durata ţinerii de mână” a cuplurilor!
50
Pe ce scală sunt exprimate următoarele variabile:
- genurile muzicale (rap, house, rock, disco)
- latenţa reacţiei la un stimul auditiv, măsurată în sutimi de secundă
- atitudinea faţă de statistică măsurată pe o scală continuă de la 1 (absolut antipatică) la 10 (absolut simpatică)
- scalele de măsurare (nominal, ordinal, interval, raport)
51
52
Variabile categoriale
- O variabilă se numește categorială atunci când valorile acesteia descriu categorii- În mod obișnuit, variabilele măsurate pe scală nominală
sunt categoriale
- Variabilele ordinale pot fi și ele categoriale- Categoriile de vârstă:
- 1 (21-30 ani)
- 2 (31-40 ani)
- 3 (41-50 ani)
- Variabilele cantitative (I/R) pot fi și ele categoriale:- Categoriile de motoare: 1100 cmc; 1400cmc; 1600 cmc …
- Există proceduri statistice speciale pentru variabile categoriale, motiv pentru care trebuie reținute!
53
Statistica parametrică/neparametrică
- s. parametrică- proceduri inferenţiale pe v. măsurate pe scale
cantitative (Interval sau Raport)
- se bazează pe estimarea prin eşantionare a parametrilor populaţiei (medie, ab. std.)
- s. neparametrică- proceduri inferenţiale pe v. măsurate pe scală
calitative (nominale şi ordinale)
- nu se bazează pe estimarea parametrilor populației
54
Scale de măsurare şi
variabile
- variabila=caracteristica supusă măsurării
- scala de măsurare=tipul de valori pe care
le ia variabila- ”variabilă nominală”= ”variabilă măsurată pe scală
nominală”
- ”variabilă ordinală”=”variabilă măsurată pe scală
ordinală”
- ”variabilă interval”=”variabilă măsurată pe scală
interval”
55
scor
1 14
2 19
3 19
4 14
5 19
6 19
7 19
8 17
9 19
10 13
Exemplu: măsurăm aptitudinea numerică
Cazul 1:
10 măsurări repetate ale lui Gigel
Care este nivelul adevărat al aptitudinii numerice al
lui Gigel?• ar putea fi oricare valoare… sau nici una
• o soluție: media măsurărilor (17.2), dar…
• … dacă nici una din valori nu este adevărată, atunci
nici media nu este adevărată
• Deci (orice) medie are o eroare
• … vom vorbi cu alt prilej despre modul în care o
calculăm
Erori de măsurare
Cazul 2:
O singură măsurare pe un eșantion
de 10 subiecți
Care este nivelul adevărat al aptitudinii numerice al
populației din care a fost extras eșantionul?• ar putea fi oricare valoare… sau nici una
• Și în acest caz media eșantionului conține o eroare,
în raport cu media adevărată a populației
scor
Elena 14
Ion 19
Dan 19
Toni 14
Dana 19
Mihai 19
Adrian 19
Cornel 17
Alex 19
Cornelia 13
Populatie
eșantion
X
Scor=
TScor adevărat
+ EEroare
Eroarea
trăsăturii
Eroare
de metodă
Fidelitatea
măsurării=
Scor adevărat
Scor adevărat + Eroare
Oboseală
Motivație
Emoție
Instructaj ambiguu
Prea cald în sală
Greșeli în text
Teoria clasică a măsurării
Validitatea
măsurării
De construct(Măsoară ”aptitudinea numerică” și nu altceva)
De criteriu(Valorile aptitudinii numerice sunt predictive pentru notele la
statistică)
Tipuri de erori
- erori aleatoare (eA)- produse de surse care ar putea afecta oricare dintre
valorile rezultate din măsurare, fără să știm dacă și în
ce măsură acest lucru se întâmplă
- pot fi în orice sens (mai mari sau mai mici decât scorul
adevărat)
- caracterul aleatoriu face ca abaterile în plus și cele în
minus față de scorul adevărat să se anihileze
- erorile aleatoare afectează valorile individuale, dar nu
și media eșantionului
- mai sunt denumite și ”zgomot de măsurare”59
Tipuri de erori
- erori sistematice (eS)
- Se manifestă într-un anume sens față de valoarea adevărată
• X=T+(eA+ eS)
- afectează în mod necesar un anumit număr, mai mare sau mai mic, din valorile măsurate
- Exemplu:- Zgomot în sala de testare
- O eroare în grila de corecție a rezultatelor
- sunt numite și ”bias”60
mică mare
mică mare
aleatoare
sistematică
Eroarea de măsurare
61
Fidelitatea și Validitatea
• Fidelitatea: Cât de ”sigură” este o măsurare?• valori similare la măsurări diferite
• valori similare la evaluatori diferiți
• Validitatea: Cât de bine reflectă (”țintesc”) valorile caracteristica supusă măsurării
Fidel/Valid Fidel/Ne-valid Nefidel/Ne-valid
Validitatea presupune fidelitatea, dar fidelitatea nu este singura condiție a validității…
X=T+(EA+ ES)
- Modelul scorului adevărat este un construct teoretic
- Nu există posibilitatea cuantificării erorilor
”numai Dumnezeu știe câtă eroare este în rezultatul unei măsurări!”
- Totuși modelul erorii este important:- pentru fundamentarea teoriei fidelității măsurării
- pentru optimizarea practicii măsurării
- pentru interpretarea rezultatelor măsurării 63
64
Scale de măsurare şi statistici adecvate
ScaleProceduri statistice
adecvate
CALITATIVE
NOMINALEIDENTITATE
NON
PARAMETRICE
CATEGORIALE
ORDINALE
CANTITATIVE
INTERVAL PARAMETRICE
(dacă sunt
respectate anumite
condiţii)RAPORT
65