curs 1 - masurarea in stiintele socio-umane.pdf
Post on 23-Dec-2015
258 Views
Preview:
TRANSCRIPT
Cristian Opariuc-Dan
Măsurarea în științele socio-umane
CONCEPTE ȘI TEME NOI
• Ce legătură există între statistică, analiză de date, IBM SPSS Statistics și R; • Ce înțeles are conceptul „a măsura” și care este specificul acestuia în domeniul socio-uman; • Ce sunt variabilele și cum le putem clasifica; • La ce niveluri putem măsura și care este precizia fiecărui nivel de măsură • Ce înseamnă IBM SPSS Statistics, cum îl putem obține și cum începem să lucrăm cu acest program; • Cum se definesc variabilele și cum se proiectează corect o
bază de date în IBM SPSS Statistics; • Ce este R, cum se obține și cum începem să lucrăm cu el; • Cum se definesc variabilele și cum se proiectează corect o bază de date în R; • Cum se pot transfera date între IBM SPSS Statistics și R
CE CONȚINE ACEST CAPITOL?
Capitolul urmărește o introducere în analiza de
date și cuprinde trei părți. Prima parte este una
teoretică în care vom încerca să clarificăm o serie de
concepte fundamentale înțelegerii principiilor analizei
de date. A doua parte vizează o scurtă introducere în
IBM SPSS Statistics și vă prezintă câteva noțiuni de
proiectare corectă a unor variabile și de construire a unei baze de date. În cea
de-a treia parte vă vom iniția în R și vom vedea cum putem construi o bază de
date folosind acest program. Capitolul se încheie cu o serie de întrebări de
verificare și teme de meditație.
4
Măsurarea în științele socio-umane
Noțiuni teoretice Analiza de date se bazează, evident, pe date. Ce sunt însă datele, cum se
clasifică ele, ce putem face cu ele și cum le utilizăm în mod corect, toate acestea
sunt probleme pe care vom încerca să le lămurim pe parcursul întregii lucrări.
Într-o primă instanță, vom studia ce sunt datele, de unde le putem culege, cum
se împart, cum se pot organiza și, în definitiv, care este disciplina științifică ce se
ocupă de asemenea lucruri. Nu în ultimul rând, vom vedea ce înseamnă, de fapt,
a măsura. Este posibil ca acest cuvânt să însemne și altceva față de ceea ce știați
deja sau intuiți.
I.1 Statistică, analiză de date sau SPSS? Majoritatea programelor de studiu ale facultăților socio-umane includ,
ca disciplină, statistica, fie că vorbim despre cea psihologică, sociologică,
economică și așa mai departe. Este și nu este corect, iar pentru a vedea exact
de ce, vom porni de la definiția dată de dicționare.
Conform DEX, termenul are mai multe înțelesuri, putând însemna: (1) Evidență numerică, situație cifrică referitoare la diverse fenomene (izolate sau generale), numărătoare; (2) Culegere, prelucrare și valorificare a unor date legate de fenomene generale; (3) Știință care culege, sintetizează, descrie și interpretează date referitoare la fenomene generale; (4) Ramură a matematicii care elaborează
noțiunile și metodele folosite în statistică; (5) Știință care, folosind calculul probabilităților, studiază fenomenele de masă din punct de vedere cantitativ (Academia Română, 2012).
Ultimele două accepțiuni (4 și 5) sunt cele mai apropiate de sensul real
al statisticii, ca disciplină matematică axată pe studiul probabilităților. Din acest
punct de vedere, statistica este o „perlă” a matematicii, sintetizând mai multe
domenii cum ar fi probabilități, calcul matriceal, combinatorică, analiză
matematică, inclusiv calcul diferențial și integral. Dacă am studia o asemenea
5
Cristian Opariuc-Dan
știință în cadrul unei facultăți de psihologie, sociologie, științe economice sau
științe ale administrației, în mod aproape sigur ar reprezenta un „cui” atât de
mare pentru studenți încât ar limita drastic numărul absolvenților. De fapt, nici
facultățile de matematică nu studiază statistica decât în cadrul unor programe
masterale, unii preferând studiul avansat al statisticii în cadrul programelor de
doctorat.
În științele socio-umane avem în vedere mai curând înțelesurile 2 și 3 ale
definiției, chiar dacă putem observa redundanța acestora. Așadar, am putea
spune că statistica este, în această accepție, o modalitate de „culegere,
prelucrare și valorificare a unor date legate de fenomene generale”, sens care
ne apropie mai mult de cel al termenului de analiză de date.
În fine, primul sens al statisticii este cel comun, de evidență numerică.
Atunci când jurnalele de știri spun că „statisticile demonstrează o reducere a
natalității”, avem în vedere, iată, sensul comun, popular al termenului. Dacă ne
referim la modalitățile de prelucrarea statistică a datelor în vederea realizării
unui raport de cercetare, avem în vedere sensul analizei de date, iar dacă vorbim
despre demonstrarea teoremei limitei centrale sau a asumpției normalității
reziduurilor, ne referim la adevăratul sens al statisticii, acela de statistică
matematică.
Așadar, în sens comun, statistica înseamnă o numărătoare, o evidență numerică, situație cifrică referitoare la diverse fenomene. În sensul analizei de date, statistica are în vedere culegerea, sintetizarea, descrierea și interpretarea datelor referitoare la fenomene iar în sensul său propriu, de știință, statistica este o ramură a matematicii care, folosind calculul probabilităților, studiază fenomenele de masă
din punct de vedere cantitativ.
6
Măsurarea în științele socio-umane
Pornind de la cele trei definiții, putem observa cu ușurință faptul că în
domeniul socio-uman nu studiem, în niciun caz, statistică, ci analiză de date,
văzută ca „instrument, parte a metodologiei cercetării științifice, care permite
utilizarea principiilor și a legilor statisticii în sintetizarea, descrierea și
interpretarea datelor colectate din cercetări”.
Pentru a ne lămuri că avem dreptate, să discutăm două dintre definițiile analizei, așa cum le prezintă dicționarul: (1) metodă științifică de cercetare care se bazează pe studiul sistematic al fiecărui element în parte; examinare amănunțită a unei probleme și (2) ramură a matematicii care studiază funcțiile, limitele, derivatele și aplicațiile lor. Există, desigur, mai multe sensuri (de exemplu analiza
substanțelor chimice), dar care nu prezintă interes pentru domeniul nostru.
Dacă excludem înțelesul analizei ca analiză matematică, prima definiție
sprijină întrutotul ce-a de-a doua definiție a statisticii. Iată și motivele pentru
care preferăm să spunem că în științele socio-umane nu studiem statistică
(încetățenită ca disciplină matematică) ci analiză de date (aplicații ale principiilor
statistice în activitatea de cercetare). Prin analogie, atunci când faceți școala de
șoferi, nu studiați ingineria construcției autovehiculelor (analog statisticii), nu vă
interesează să știți din ce aliaj este făcut arborele cotit. Dacă sunteți însă un
șofer cu pretenții de profesionist, atunci veți fi interesat de modul cum
funcționează ambreiajul sau de faptul că mașina dumneavoastră funcționează
cu benzină (analog analizei de date). Asta ca să nu riscați să alimentați cu
motorină și să vă distrugeți motorul.
Cuvântul „statistică” a o etimologie interesantă și merită
să prezentăm, pe scurt, evoluția acestui termen. În forma
actuală, a fost folosit de către filosoful german Gottfried
Aschenwall (1719-1772), în lucrarea „Vorbereitung zur
7
Cristian Opariuc-Dan
Staatswissenschaft”, apărută în 1748, în care apare cuvântul „Statistik”, având
înțelesul de „știință ce vizează studiul datelor referitoare la condiția unui stat
sau a unei comunități” (Harper, 2015). Părintele statisticii nu a fost doar filosof,
ci a avut preocupări și în domeniul istoriei și economiei, fiind de profesie jurist,
predând dreptul în cadrul Universității din Göttingen.
În limba engleză, cuvântul a fost introdus în 1829 de către
un politician scoțian, Sir John Sinclair (1754-1835), având înțelesul
de „date numerice colectate și clasificate”, rafinând și
particularizând sensul dat de profesorul german. Gânditorul
scoțian a avut, și el, formație economică, fiind preocupat de finanțe și
agricultură, dar și de drept.
Pare surprinzător faptul că ceea ce astăzi atribuim aproape exclusiv
matematicii, a avut originea în domenii destul de diferite de matematică: drept,
economie, filozofie. În realitate, „rădăcina” statisticii, în înțelesul modern al
termenului, se regăsește în scrierile economice, în activitatea de optimizare a
taxelor și de monitorizare a producției. Originea termenului este, totuși, mult
mai veche și ar proveni din latinescul „status”, având înțelesul de rang, poziție,
organizare a comunității, ordine publică. Cuvântul latin a fost preluat în italiana
veche, rezultând „statista”, ceea ce înseamnă persoană specializată în treburile
statului, ce ajută statul să gestioneze politica de taxe, costurile războaielor,
evidența populației și alte sarcini de acest tip (Lungu, 2001). Acest înțeles este
cel mai apropiat de sensul modern al termenului, afacerile statului din acea
perioadă numindu-se și „statisticum”. Cunoscând aceste elemente, devine
evidentă originea cuvântului și faptul că în prezent, chiar dacă are o importantă
încărcătură matematică, statistica provine din economie și din administrația
publică.
8
Măsurarea în științele socio-umane
Dacă am lămurit faptul că în domeniul socio-uman nu studiem statistică
în sensul actual al termenului, ci analiză de date, vom continua cu o altă marotă,
cea a înlocuirii studiului analizei de date cu SPSS. Revenind la analogia cu școala
de șoferi, este ca și cum am spune că învățăm să conducem Dacia Logan. Asta
ar însemna, oare, că dacă ne luăm permisul de conducere, nu știm să conducem
BMW, Mercedes, Lamborghini sau Tico? Bineînțeles că odată ce avem
deprinderile necesare conducerii, le putem transfera, cu un minim efort, pe
orice automobil din acea clasă, ba chiar și din clase diferite. În definitiv, de ce nu
am putea să conducem un microbuz sau un camion?
Ideea centrală nu este să ne concentrăm pe utilizarea unui anumit
produs, ci pe însușirea principiilor, metodelor și tehnicilor de analiză de date.
Din moment ce cunoaștem analiză de date, utilizarea unui produs informatic
este doar o chestiune de preferințe.
I.2 Sensul și semnificația termenului de măsurare Contactul nemijlocit al ființei umane cu lumea înconjurătoare se
realizează prin simțuri. Cu ajutorul acestora percepem obiectele, fenomenele,
persoanele, evenimentele. Observăm în mod direct culoarea biroului la care ne
desfășurăm activitatea, distanța dintre scaunul dumneavoastră și cel al
colegului, faptul că muzica pe care o ascultă vecinul este prea tare ori timpul
rămas până la terminarea programului de lucru. Toate acestea formează un
mediu în care ne aflăm și pe care îl putem caracteriza la un moment dat, mediu
populat, generic, de obiecte.
Să ne imaginăm camera în care învățați sau lucrați. Ce obiecte puteți
remarca? Biroul, scaunul, televizorul, filtrul de cafea, bunica ce tricotează sau
colegul care joacă Solitaire. Toate acestea le vom denumi generic „obiecte”.
Dacă vă veți gândiți la biroul la care vă redactați referatele, dumneavoastră,
9
Cristian Opariuc-Dan
cititorul, veți avea o imagine extrem de personalizată și care diferă radical de
imaginea pe care o am eu față de același obiect. Așadar, oricât ar părea de
ciudat, conceptul de birou reprezintă o abstracțiune, care vehiculează imagini
diferite la diferite persoane. Eu am o imagine mintală a biroului, dumneavoastră
aveți o altă imagine a biroului, alții au imagini mai mult sau mai puțin diferite
când se gândesc la același obiect. Dacă aș dori să cunosc și să înțeleg biroul
dumneavoastră, v-aș ruga să-l descrieți. Aș afla, de exemplu, că are o lungime
cam de 2 metri, o lățime de un metru și are culoarea albastră. Deja cunosc mai
bine obiectul la care vă referiți. Descriindu-l, practic, ce ați făcut? În primul rând
ați precizat o serie de caracteristici ale sale: lungimea, lățimea și culoarea. Apoi
ați specificat ce valori au caracteristicile în cazul obiectului dumneavoastră: 2, 1
și albastru. În fine, ați stabilit o regulă în baza căreia ați atribuit valori acestor
caracteristici, specificând unitatea de măsură – metrul.
Totuși, albastru, roșu sau galben, un birou are întotdeauna un obiect fizic
drept corespondent. Nu întotdeauna lucrurile stau așa. Folosind rațiunea și
capacitatea de abstractizare putem anticipa sau cunoaște elemente care nu au
o corespondență în lumea fizică. Ce-ar fi să descriem gradul de satisfacție pe
care îl avem față de perceperea taxelor locale? Sau anxietatea ori
comportamentul prosocial? Aceste elemente sunt cât se poate de reale, însă nu
au drept corespondent obiecte fizice. Unii pot înțelege, atunci când vorbesc
despre taxe, fața acră a funcționarului de la birou, alții faptul că a fost plimbat
pe la 20 de ghișee pentru a achita 10 lei, alții au scăpat în 30 de secunde datorită
unui funcționar extrem de competent și eficient care știa ce să facă, în fine,
anumite voci sunt foarte mulțumite pentru că-și achită impozitele prin Internet.
Anxietatea, la rândul ei, poate avea semnificații diferite pentru diferite
10
Măsurarea în științele socio-umane
persoane, asta ca să nu mai vorbim de comportamentul prosocial, patriotism,
integritate sau iubire.
Astfel de „obiecte” sunt prea generale pentru a fi cunoscute în mod
direct; ele vor trebui particularizate în cadrul unui proces specific, numit
operaționalizare. Această lungă introducere a fost făcută pentru a înțelege
faptul că măsurarea reprezintă, de fapt, o abstracțiune și că nu putem cunoaște
obiectele decât dacă stabilim o serie de caracteristici ale acestora. Rezumând,
am putea spune că, la modul general, obiectele, fenomenele, evenimentele pot
fi măsurate doar dacă precizăm o serie caracteristici (atribute),
prin caracteristică înțelegând o particularitate, o însușire a
obiectului, fenomenului sau evenimentului ce urmează a fi
măsurată. În cazul în care aceste atribute nu sunt specificate, un
obiect nu poate fi cunoscut. Cu cât există mai multe atribute ce definesc un
obiect, cu atât acel obiect este cunoscut mai bine. Dacă am spune că biroul este
lung de 2 metri, cunoașterea obiectului se poate realiza strict pe baza acestui
atribut. În mod cert, este mai lung sau mai scurt comparativ cu ale birouri. Însă
nu vom putea ști dacă este mai greu, mai lat, mai înalt, dacă are culoarea verde
cu roșie sau dacă este pătat de la vin. Pe măsură ce crește numărul atributelor
specificate, cunoașterea obiectelor devine tot mai precisă.
Faptul că am precizat caracteristica nu este suficient pentru a vorbi
despre o măsurare. Cum am putea, de exemplu, să măsurăm iubirea? Ce
caracteristici definitorii am putea găsi? Suma disponibila spre a fi cheltuita pe
care o pune la dispoziție iubitul (mai rar iubita) poate fi o caracteristică a iubirii?
Foarte discutabil. Emoția, fiorul, „fluturii” din stomac? Posibil, dar cum îi putem
remarca? Avem aceeași problemă dacă ne propunem să măsurăm patriotismul,
integritatea, moralitatea sau sentimentele superioare.
11
Cristian Opariuc-Dan
Iată că, pentru a vorbi despre măsurare, acele caracteristici
definite trebuie să fie cuantificabile, măsurabile. În ciuda părerii
unora, există obiecte, fenomene sau evenimente care nu pot fi
măsurate. Se punea, la un moment dat, problema evaluării psihologice a unor
funcționari publici în vederea stabilirii integrității. Au apărut chiar și metodologii
de evaluare, s-au construit chestionare și alte instrumente în acest sens,
psihologii au început să oferteze servicii de evaluare psihologică pentru
integritate, ignorându-se un lucru esențial – acest concept nu este măsurabil.
Dacă am putea măsura integritatea unor persoane, probabil că nu am mai avea
nevoie de o întreagă categorie de procurori, decizia de integru sau corupt fiind
dată imediat de către psiholog. Una este să vorbim despre opinia unor persoane
față de comportamente care țin de integritate și cu totul altceva să măsurăm
„nivelul” de integritate al unei persoane. Orice am face, persoanele evaluate nu
vor răspunde la întrebări decât în sensul unor oameni integri, indiferent dacă
este sau nu este în joc serviciul lor.
Chiar dacă un atribut poate fi măsurat, acest concept se concretizează în
momentul în care, pentru un anumit obiect, atributul dobândește o anumită
valoare, în termeni de specialitate valoarea pe care o are atributul pentru un
anumit obiect numindu-se și scor. Dacă am spune că atributul „lățime” al unei
mese are scorul 20, am concretizat o operație de măsurare doar dacă am
menționa și ce înseamnă acel scor. Ne referim la centimetri, la inch, la picioare
sau la alte unități de măsură? Pentru a măsura în adevăratul sens
al cuvântului, trebuie să stabilim o regulă sau un set de reguli pe
baza cărora putem atribui valori caracteristicilor măsurate. Iată că,
am măsurat cu adevărat atributul „lățime” al mesei atunci când am spus că are
20 de centimetri, stabilind și regula de atribuire, în cazul nostru o subdiviziune
12
Măsurarea în științele socio-umane
a scalei metrice. Dacă nu precizăm regula, riscăm că scorul să aibă o anumită
semnificație pentru un chinez, o alta pentru un englez și o cu totul altă
semnificație pentru un american.
În acest moment, am putea prezenta una dintre cele mai cunoscute definiții a măsurării ca „atribuire de numere evenimentelor sau obiectelor în concordanță cu o anumită regulă” (Stevens, 1959). Conform acestei abordări, măsurarea dobândește un sens extrem de larg și extinde semnificația conceptului de număr dincolo de operațiile matematice tradiționale, în funcție de modul de stabilire a regulii.
Se poate observa destul de ușor că măsurarea poate fi considerată o
funcție prin care unui atribut al unui obiect îi poate fi acordat un număr și numai
unul, la o anumită măsurare. Această funcție se face pe baza unei anumite
reguli, suficient de clară pentru a fi înțeleasă și suficient de simplă pentru a fi
aplicată (Vasilescu, 1992), regulile determinând ceea ce numim niveluri (scale)
de măsură. Problematica măsurării, deși considerată ca fiind baza analizei de
date, nu este studiată de statistică, nici de matematică, ci de o altă știință,
numită metrologie.
I.2.1 Specificul măsurării în științele socio-umane În domeniul științelor fizice, măsurarea este destul de precisă. De obicei
regula este simplă și clară, instrumentele sunt puternic standardizate, valorile
sunt relativ stabile. Ați putea crede că atunci când măsurăm lățimea unei mese
și spunem că aceasta este de 20 de centimetri, între două măsurători valoarea
se conservă perfect, deoarece ne aflăm în zona măsurătorilor fizice, precise. De
fapt, între două măsurători ar putea exista diferențe determinate de
instrument, de clasa de precizie, de condițiile de mediu, ba chiar și de persoana
care face măsurătoarea. Dacă nea Costică este puțin miop, atunci sunt șanse
mari ca cei 20 de centimetri să fie, de fapt, 20,5 centimetri sau 19,5 centimetri.
13
Cristian Opariuc-Dan
Dacă în loc să măsoare cu ruleta, măsoară cu metrul de stofă, atunci s-ar putea
ca dimensiunea reală să fie de 19,75 centimetri, chiar dacă nea Costică nu are
probleme cu vederea. În fine, chiar dacă folosește un instrument de măsură
precis, lățimea mesei ar putea fi 20,00545 centimetri, situându-ne, după cum
intuiți, la o clasă de precizie diferită. Dacă tot am vorbit despre metru, ar fi bine
să precizăm că acesta reprezintă, conform definiției metrologice, distanța
parcursă de lumină într-un interval de timp de 1/299.792.458 dintr-o secundă, prin
urmare nivelurile de precizie sunt, practic, infinite.
În științele socio-umane lucrurile nu mai sunt atât de limpezi. Cum am
putea măsura, spre exemplu, inteligența? Nu avem la dispoziție, în acest caz,
nici ruleta și nici măcar o unitate de măsură, nu putem spune că avem 20 de
kilograme sau 20 de centimetri de inteligență. Poate vă gândiți că măsurăm
inteligența în IQ, însă coeficientul de inteligență nu este o unitate de măsură, ci
un raport între vârsta mintală și vârsta cronologică (𝐼𝐼𝐼𝐼 = 𝑉𝑉𝑉𝑉𝑉𝑉𝑉𝑉
× 100). Cu alte
cuvinte, dacă o persoană de 15 de ani (VC=15) rezolvă probleme pe care le pot
rezolva cei de 23 de ani (VM=23), atunci are un coeficient de inteligență de 2315
×
100 = 153, un geniu. Problema, în acest caz, nu ar fi vârsta cronologică, ci
vârsta mintală. Cum decidem asupra vârstei mintale, cum aflăm această
valoare? Cum selectăm acele probleme pe care le rezolvă persoanele de 23 de
ani și nu le pot rezolva cele de 15 ani? Răspunsul la acest gen de întrebări
depășește specificul analizei de date și ține de o altă disciplină științifică, numită
psihometrie.
Dacă în cazul inteligenței, unde putem propune, în definitiv, o serie de
probleme, lucrurile sunt destul de complicate, cum am putea măsura
anxietatea, depresia sau alte asemenea trăsături, mult mai vagi? Cert este faptul
că, în cazul anxietății de exemplu, oamenii au diferite grade de intensitate a 14
Măsurarea în științele socio-umane
acesteia, putem spune că o persoană este mai anxioasă, o alta mai puțin
anxioasă, chiar că o persoană este mai anxioasă în comparație cu alta, însă nu
avem de unde ști ce cantitate de anxietate posedă un om. Din acest motiv, vom
aprecia că factorii psihici, dar și alte „obiecte” de acest tip, au un caracter latent,
și îi vom putea denumi factori (caracteristici) latente, în sensul că
există într-o anumită cantitate, doar că această cantitate nu poate
fi observată și măsurată în mod direct. Orice persoană are, la un
moment dat, o anumită „cantitate” de anxietate sau de depresie, un anumit
nivel de trai sau o anumită încredere în clasa politică. Toată chestiunea este că
nu avem unități de măsură pentru aceste „cantități” și nici instrumente precise
pentru a le măsura. Putem presupune că orice caracteristică latentă, din punct
de vedere al cantității, poate lua orice valoare între minus și plus infinit, de la
valori infinit de mici la valori infinit de mari. Acest concept îl întâlnim sub numele
de continuum al factorului latent, înțelegerea sa condiționând înțelegerea
măsurării în științele socio-umane.
Dacă acești factori latenți nu pot fi cunoscuți în mod direct, cum ar putea
fi, totuși, măsurați? Să presupunem că vom întreba persoanele cărora dorim să
le cunoaștem anxietatea dacă le-ar fi teamă atunci când ar sta pe un câmp de
luptă sub focul mitralierelor. Un asemenea comportament ar presupune o
„cantitate” foarte mică de anxietate la răspunsul pozitiv. Tuturor ne este teamă
de război, de armele de foc, prin urmare răspunsul „da” ar fi perfect normal. Din
contra, un răspuns negativ ar putea fi indicatorul unei patologii psihice. În
termeni tehnici, această întrebare s-ar situa undeva spre polul negativ al
continuumului factorului latent, comportamentul vizat saturând foarte puțin
anxietatea. Acelorași persoane le punem și o a doua întrebare, dacă le este frică
să stea în casă pe întuneric atunci când se întrerupe curentul electric. De data
aceasta, răspunsul normal ar fi negativ, un răspuns eventual pozitiv indicând o
15
Cristian Opariuc-Dan
„cantitate” mare de anxietate. Dacă se întrerupe seara curentul, te poți cel mult
enerva în cazul în care ai ceva de făcut, în niciun caz nu îți va genera o senzație
de teamă. Un astfel de comportament îl putem considera saturat în anxietate,
situându-se înspre polul pozitiv al continuumului factorului latent. În fine,
întrebând persoanele dacă le place pizza cu ton, măsurăm orice altceva, numai
anxietatea nu. Asta deoarece preferința către un sortiment de pizza nu are nicio
legătură cu anxietatea, în termeni tehnici întrebarea fiind situată în afara
continuumului factorului latent.
Astfel de întrebări se numesc eșantioane de comportamente. Deoarece
nu putem observa direct factorul latent, îl vom observa indirect, prin
intermediul unor eșantioane de comportamente extrase dintr-un univers
practic nelimitat de comportamente specifice. Pe baza modului în care
persoanele ar reacționa la aceste comportamente și cunoscând zona în care
acestea se situează în continuumul factorului latent, se poate aprecia, subiectiv,
nivelul factorului latent al persoanei, fără a spune că măsurăm exact cantitatea
de factor latent. Acesta este modul în care efectuăm măsurători în domeniul
socio-uman, iar trecerea de la o dimensiune latentă generală, abstractă, la
indicatori, componente concrete ale dimensiunii și apoi la eșantioane de
comportamente (numite și itemi în literatura de specialitate) poarte numele de
operaționalizare a constructelor latente.
Chiar dacă am operaționalizat foarte bine constructele și am conceput
un instrument de măsură foarte bun, măsurarea în științele sociale rămâne
inexactă și limitată din mai multe motive. În primul rând, nu putem construi
instrumente de măsură care să acopere întregul continuum al factorului latent.
Un test de inteligență, de exemplu, se adresează zonei medii a inteligenței.
Acesta va putea diferenția destul de bine persoanele cu o inteligență de la
16
Măsurarea în științele socio-umane
mediu-inferior la mediu-superior, însă va fi inexact și aproape inutil în cazul
persoanelor foarte inteligente sau foarte puțin inteligente. În asemenea cazuri
va trebui să apelam la alte instrumente, demers mare consumator de resurse,
în special de timp. Pe de altă parte, cu cât crește timpul unei evaluări, cu atât
scade precizia măsurătorii, indiferent de calitatea instrumentului folosit, asta
deoarece intervin și alți factori, precum plictiseala și oboseala. Chiar dacă există
și alte modele de măsurare care pot evalua pe întregul continuum al factorului
latent (numite modele de răspuns la item), astfel de instrumente sunt dificil de
construit iar evaluarea se face de obicei computerizat, apărând, în plus, și alte
surse de eroare.
Multe instrumente de măsură specifice domeniului socio-uman, în
special psihologiei și sociologiei, numite incorect teste, fac apel la auto-evaluare.
Persoana se auto-analizează înainte de a da un răspuns, neavând aproape nicio
posibilitate de a controla dacă acel răspuns este sau nu este reprezentativ
pentru persoana evaluată. În cazul în care miza evaluării este benefică pentru
individ, acesta va avea tendința să se pună într-o lumină favorabilă sau, din
conta, nefavorabilă dacă urmărește să evite scopul evaluării. În cazul unui studiu
privind nivelul de trai, o persoană va răspunde în sensul unui nivel de trai scăzut
dacă scopul perceput este stabilirea cuantumului taxelor sau în sensul unui nivel
de trai ridicat dacă scopul ar fi obținerea unui anumit credit. Această abordare,
numită tendință de fațadă, este comună tuturor instrumentelor bazate pe auto-
evaluare. Chiar dacă există anumite mecanisme de control, așa-numitele scale
de minciună, eficiența lor este discutabilă.
Dacă în științele naturii putem vorbi de un zero absolut, în domeniul
socio-uman nu avem o inteligență zero, o anxietate zero, o depresie zero sau
opinii zero. Din acest motiv, nu putem raporta cantități, nu putem spune că o
17
Cristian Opariuc-Dan
persoană este de două ori mai anxioasă sau mai inteligentă decât o altă
persoană, că are un nivel de trai de trei ori mai bun sau mai slab. Convențional,
valoarea zero în științele socio-umane este media, faptul că o persoană nu se
distinge de majoritatea oamenilor privind caracteristica măsurată.
Imposibilitatea de raportare permite doar să spunem că o persoană este mai
mult sau mai puțin inteligentă sau anxioasă în comparație cu o altă persoană
sau în comparație cu majoritatea persoanelor, și nu de câte ori și nici cu cât. O
asemenea limitare nu oferă o putere prea mare măsurătorilor socio-umane, ele
situându-se departe de specificul măsurătorilor fizice, chiar dacă prin forțarea
matematicii se tinde către o apropiere de acestea.
Construind un instrument de măsură, decidem asupra
comportamentelor pe care le selectăm din universul infinit de comportamente
posibile, relaționate factorului latent. Această selecție poate induce noi surse de
eroare pentru că ceea ce pare relevant pentru un grup de persoane, poate să
nu fie relevant pentru un alt grup. Un instrument construit pentru militari s-ar
putea să nu aibă o valoare prea mare în cazul agenților de vânzări, chiar dacă
dorim să măsurăm același factor latent, asta ca să nu mai spunem că anumite
comportamente alese pentru populația din America aproape sigur vor avea o
altă relevanță pentru populația din România sau din China. Astfel, dependența
culturală a instrumentelor impune revizii importante ale acestora ori de câte ori
urmează să le folosim pe alte populații decât cele pe care au fost construite
inițial. Mai mult, majoritatea atributelor suferă modificări în timp, unele fiind
mai sensibile, altele mai puțin sensibile la acest factor. Anxietatea, de exemplu,
ar putea fi o stare, diminuându-se relativ rapid după dispariția evenimentului
anxiogen, sau o trăsătură, persistând mai mult timp, uneori accentuându-se cu
trecerea timpului. Mai mult, unele comportamente saturate în factorul latent
18
Măsurarea în științele socio-umane
într-o anumită perioadă de timp îți pierd saturația în prezent și trebuie înlocuite.
Imaginați-vă doar că foarte multe dintre comportamentele normale ale tinerilor
din prezent ar fi atras cu siguranță internarea într-un ospiciu dacă s-ar fi
manifestat în anii ’30 ai secolului XX.
Iată că măsurarea în științele socio-umane este posibilă, însă nu are
caracteristicile unei măsurări fizice, fiind imprecisă, indirectă, puternic limitată
atât ca posibilitate de abordare a atributului, cât și ca semnificație generală.
I.2.2 Noțiunea de variabilă Știm bine de acum că obiectele, în sensul general al termenului, pot fi
măsurate pe baza atributelor cuantificabile. Înălțimea este un atribut
cuantificabil al tuturor persoanelor, însă nu are aceleași valori. Vasile poate avea
înălțimea de 178 centimetri, Ion poate avea o înălțime de 192 centimetri iar
Maria poate avea 168 de centimetri la această caracteristică.
Iată că, această particularitate, comună tuturor ființelor umane, prezintă diferențe inter-individuale, în termeni tehnici afirmând că exprimă variația caracteristicii măsurate. Am ajuns la a defini conceptul de variabilă ca fiind particularitatea, însușirea unui fenomen care constituie obiectul măsurării și care exprima variația inter-individuală a acestei caracteristici.
Înălțimea oamenilor reprezintă o variabilă deoarece exprimă modul în
care variază această caracteristică, de la cel mai scund om din lume, la cel mai
înalt. La fel putem spune și despre greutate, ritm cardiac, nivel de venit, culoarea
ochilor, gen biologic și așa mai departe, toate aceste atribute având în comun o
mulțime de valori, numită și mulțime (domeniu) de definiție sau
categorii. Domeniul de definiție, la rândul său, poate fi teoretic și
empiric, iar când categoriile se pot ordona, poartă numele de
amplitudine (teoretică și empirică).
19
Cristian Opariuc-Dan
Variabila „gen biologic”, de exemplu, poate avea doar două valori,
domeniul de definiție teoretic fiind format din categoriile „masculin” și
„feminin”. Variabila „culoarea ochilor” poate avea patru categorii, vorbind
despre „ochi căprui”, „ochi albaștri”, „ochi negri” și „ochi verzi”. Prin urmare,
domeniul de definiție teoretic are patru valori, iar dacă nu se află nicio persoană
cu ochi albaștri în lotul de studiu, spunem că domeniul empiric de definiție are
doar trei categorii.
O altă variabilă exemplu „titlul universitar”, are tot patru categorii –
„asistent”, „lector”, „conferențiar” și „profesor” –, însă acestea pot fi ordonate
de la asistent la profesor. Astfel, putem vorbi despre o amplitudine teoretică de
patru valori, cuprinsă între valoarea minimă „asistent” și valoarea maximă,
„profesor”.
Valorile unei variabile, știm deja, se numesc și scoruri, iar atribuirea de
scoruri fiecărui element (în cazul de față, fiecărei persoane) al variabilei poartă
numele, știm și asta, de modalitatea de realizare a variabilei.
Definiția măsurării susține că este vorba despre atribuirea de numere
obiectelor și fenomenelor, însă, în exemplele de mai sus, observăm că mulțimile
de valori nu se exprimă prin numere, ci prin anumite „calități”. Nu putem spune
că titlul universitar al unui cadru didactic universitar este 3, ci conferențiar.
Culoarea ochilor 2 nu are niciun sens, preferând menționarea categoriei „ochi
albaștri”, dar la fel de bine am putea să includem orice altă categorie. Unele
variabile nu se exprimă natural sub formă numerică, acestea fiind
denumite variabile calitative. Altele, precum înălțimea, greutatea,
vârsta, au valori natural numerice, din acest motiv numindu-se
variabile cantitative, aceasta fiind prima și cea mai simplă
clasificare a variabilelor.
20
Măsurarea în științele socio-umane
I.3 Niveluri de măsură Dincolo de distincția calitativ-cantitativ, desigur foarte importantă,
există o clasificare și mai importantă, de fapt baza ierarhizării și a puterii
procesului de măsurare. Vorbim despre nivelurile de măsură, numite și scale de
măsură, însă vom prefera utilizarea termenului de nivel și nu de scală pentru a
nu se crea confuzie, chiar dacă, în analiza de date, sunt sinonime.
I.3.1 Variabile discrete (discontinui, neparametrice) Am înțeles deja că orice variabilă posedă un domeniu teoretic de
definiție. Uneori, această mulțime de definiție a valorilor este una finită, în
sensul că se pot număra categoriile, iar între două categorii nu se
poate interpune, la nesfârșit, o categorie intermediară. Convenim
astfel să denumim variabilele discrete acele variabile pentru care
mulțimea de definiția a valorilor este una discontinuă, finită (Vasilescu, 1992).
Dacă luăm, spre exemplu, „genul
biologic”, observăm că mulțimea de valori
conține doar două categorii, „masculin” și
„feminin”, fiind, prin urmare, o mulțime
numărabilă, finită, discontinuă. Între cele două
categorii am putea include, cel mult, categoria
„hermafrodit”, însă nu am putea continua incluzând, la nesfârșit, noi categorii.
Lucrurile stau la fel și în cazul variabilei „titlul universitar”. Mulțimea de
valori conține doar patru categorii fiind, din nou, numărabilă, finită. Între
„lector” și „profesor” am putea include categoria „conferențiar”, însă nu putem
vorbi, la infinit, despre categorii intermediare între „conferențiar” și „profesor”.
Nu există categoriile „conferențiaro-profesor” și „conferențiaro-conferențiaro-
profesor” și așa, la infinit. Iată de ce spunem că asemenea variabile sunt
discontinui, discrete, la rândul lor situându-se pe două niveluri de măsură.
Figura I-1 Variabila discretă „gen biologic”
21
Cristian Opariuc-Dan
I.3.1.1 Nivelul nominal (de clasificare sau topologic) Reprezintă nivelul de bază, cea mai „slabă” scală de măsură și presupune
construcția unui set omogen de categorii disjuncte pe baza atributului care
urmează să fie măsurat, acordarea de numere fiecărei categorii și includerea
subiecților în categorii pe bază de apartenență (Opariuc-Dan, 2009). Avem de a
face cu o simplă operațiune ce clasificare, în absența oricărei posibilități de a
pune o relație de ordine între categorii, de aceea nivelul se mai numește și nivel
categorial sau de clasificare.
Există o serie de caracteristici ale acestui
nivel de măsură. În primul rând, exhaustivitatea.
Categoriile create trebuie să permită includerea
oricărui subiect, să nu existe situații în care unii
subiecți nu și-ar găsi locul într-o anumită
categorie. Recent, în Germania, s-a dat o lege
conform căreia genul biologic nu mai are două
categorii, ci 3 – „masculin”, „feminin” și „nedeterminat”. Astfel, clasificarea
permite și includerea celor „nemulțumiți” de sexul lor. Chiar dacă biologic o
asemenea clasificare nu-și are rostul decât în cazul hermafrodiților, social s-a
considerat că este utilă.
Singura regulă de atribuire o reprezintă apartenența la categorie. Ești
bărbat, vei fi clasificat în categoria „masculin”; ești femeie, vei fi inclusă în
categoria „feminin”; habar nu ai ce ești sau vrei sa fii altceva, te incluzi în
„nedeterminat”. Această regulă este una mutual exclusivă, adică un subiect își
poate găsi locul într-o singură categorie și numai în una. Nu poți încadra
subiectul și la masculin și la feminin.
Figura I-2 Variabilă discretă nominală „gen biologic”
22
Măsurarea în științele socio-umane
Cât despre relația de ordine, nici nu poate fi vorba. Încercați doar să
puneți pe primul loc unul dintre genurile biologice și veți vedea ce reacție
declanșați la sexul opus. Categoriile calitative ale unei variabile nominale trebuie
să primească valori numerice, pentru a respecta sensul definiției măsurării, doar
că acestea se acordă pe baza unei atribuiri arbitrare. Putem da valoarea 1
categoriei „masculin”, valoarea 2 categoriei „feminin” și valoarea 3 categoriei
„nedeterminat”. La fel de bine putem spune 1 – nedeterminat, 2 – masculin și 3
– feminin fără ca acest lucru să influențeze în vreun fel includerea subiecților în
categorii. Bineînțeles, pentru a vorbi despre o variabilă va trebui să avem cel
puțin două categorii, altminteri avem de a face cu o constantă. Dacă într-un
studiu am utiliza doar bărbați, atunci genul biologic nu ar mai avea sens să-l
includem ca variabilă deoarece nu mai exprimă variația acestei caracteristici.
La acest nivel de măsură se situează, de exemplu, sondajele de opinie
politice. Avem categoriile determinate de candidați sau de partide și am putea
analiza câte persoane preferă un anumit candidat sau ce candidat este cel mai
bine plasat.
I.3.1.2 Nivelul ordinal (de rang sau ierarhic) Acest nivel se bazează pe cel descris
anterior, cu toate caracteristicile sale, doar
că putem vorbi, în acest caz, de o relație de
ordine între categorii, în baza
caracteristicilor atributului măsurat. Dacă
la nivelul nominal puteam pune „pe primul
loc” orice categorie, fără ca acest lucru să
aibă vreo semnificație, aici nu mai putem proceda la fel, deoarece ordinea
categoriilor contează. Regula de bază este aceea conform căreia o categorie
Figura I-3 Variabilă discretă ordinală „titlul didactic”
23
Cristian Opariuc-Dan
este superioară sau inferioară alteia, fără însă a se putea specifica nici cu cât,
nici de câte ori.
Să luăm, de exemplu, titlurile didactice universitare. Acestea pot fi puse
într-o ordine: asistent, lector, conferențiar și profesor. Este foarte clar faptul că
asistentul reprezintă cel mai mic grad, iar profesorul cel mai mare grad deoarece
are vechime și experiență. Dar nu putem spune că un profesor face cât 4
asistenți, deoarece nu există un interval fix, constant între aceste grade. La acest
nivel de măsură funcția de atribuire a persoanelor în categorii este o funcție
crescătoare.
Majoritatea cercetărilor în care sunt măsurați factori latenți, în special
cele psihologice, folosesc acest nivel de măsură, fapt care ne permite să
apreciem că măsurarea în psihologie are caracterul unei scale ordinale. Chiar
dacă probele psihologice au pretenția unui nivel de interval, în realitate, dacă
este să fim stricți, ele nu depășesc scala ordinală.
I.3.2 Variabile continui (scalare, parametrice) În cazul altor variabile, mulțimea de
definiție a valorilor nu este una finită,
numărabilă. Să luam cazul variabilei „înălțime”
și vom observa că mulțimea de valori este
infinită. Amplitudinea teoretică este cuprinsă
între 0 centimetri, deoarece nu poate exista
vreun om cu înălțime negativă și întotdeauna există posibilitatea identificării
unei persoane mai scunde decât cel mai scund om din lume și infinit, deoarece
oricând putem găsi pe cineva mai înalt decât cel mai înalt om din lume.
Amplitudinea empirică s-ar putea situa, spre exemplu, între 100 de centimetri
și 210 centimetri, în funcție de persoanele incluse în cercetare.
Figura I-4 Variabila continuă „înălțimea”
24
Măsurarea în științele socio-umane
Totodată, între două valori succesive putem găsi, oricând, o valoare
intermediară. De exemplu, între o persoană cu înălțimea de 179 centimetri și
una de 178 centimetri, putem găsi o persoană de 178,5 centimetri, apoi una de
178,25 centimetri și, tot așa, la infinit. Iată de ce vom spune că o
variabilă continuă este aceea la care mulțimea de definiție a
valorilor este nenumărabilă, infinită (Vasilescu, 1992). Și aceste
variabile, la rândul lor, se pot măsura pe două niveluri.
I.3.2.1 Nivelul de interval (al intervalelor egale) De această dată, categoriile nu numai că sunt ordonate, ca în cazul
nivelului ordinal, dar intervalele dintre categorii sunt constante. Astfel, la acest
nivel putem spune nu numai că A este mai mare decât B, ci și cu cât este mai
mare. Un exemplu clasic îl reprezintă scala de temperatură Celsius. Între 0 și 100
de grade Celsius există un număr de 100 de intervale egale, corespunzătoare
unui grad Celsius. Un grad Celsius înseamnă același lucru, fie că ne referim la
distanța dintre gradul 3 și gradul 4, fie la distanța dintre gradul 90 și gradul 91.
Prin extensie, unii consideră că scorurile standardizate ale probelor psihologice
au această caracteristică. Matematic au dreptate, însă psihologic nu este chiar
așa. Să considerăm, de exemplu, scala IQ. Intervalele sunt egale, putem spune
că un subiect este cu 2 puncte IQ mai inteligent decât un alt subiect. Toată
problema constă în faptul că semnificația nu are o constanță pe întreaga scală,
așa cum se întâmplă la scala Celsius. Diferența dintre un IQ de 55 și unul de 56
are o anumită semnificație, în timp ce diferența dintre un IQ de 100 și un IQ de
101 are o altă semnificație. Este ca în vorba aceea: toți oamenii sunt egali, însă
unii oameni sunt „mai egali” decât alții. Practic, scala IQ este tot o scală ordinală,
puțin forțată și îmbunătățită.
25
Cristian Opariuc-Dan
Figura I-5 Variabilă continuă de interval, „temperatura”
Folosind acest nivel de măsură, putem spune cu cât o cantitate este mai
mare sau mai mică în comparație cu o altă cantitate, însă nu și de câte ori, asta
deoarece nu avem de a face cu un zero absolut ci cu un zero convențional. Ca să
înțelegem, să facem o comparație între scala Celsius și scala Fahrenheit. Scala
Celsius știm cum s-a construit; zero grade Celsius înseamnă temperatura de
îngheț a apei la presiunea atmosferică de la nivelul mării iar 100 de grade Celsius
reprezintă temperatura de fierbere a apei la aceeași presiune atmosferică. Se
crede că scala Fahrenheit este bazată pe temperatura la care un amestec masic
echivalent de gheață și sare se topește (0 grade Fahrenheit), respectiv
temperatura internă a corpului uman (100 de grade Fahrenheit). Pornind de la
aceste informații, zero grade Celsius corespund la aproximativ 38 de grade
Fahrenheit iar 100 de grade Celsius înseamnă cam 212 grade Fahrenheit. O
găleată cu apă având temperatura de 10 grade Celsius înseamnă o temperatură
a apei de 50 de grade Fahrenheit iar o găleată cu apă având temperatura de 20
de grade Celsius nu înseamnă o temperatură a apei de 100 de grade Fahrenheit
ci doar de 68 de grade Fahrenheit. Așadar, temperatura apei din prima găleată
nu este de două ori mai rece ci doar cu 10 grade Celsius, respectiv cu 18 grade
Fahrenheit mai rece. Absența acestui zero absolut nu ne permite să raportăm
cantitățile.
26
Măsurarea în științele socio-umane
Faptul că poate fi atribuit un zero arbitrar a fost speculat de psihologi,
astfel încât instrumentele de diagnostic psihologic ridică pretenția unui nivel de
interval. Valoarea zero este, în general, cea a unui nivel mediu al factorului
latent în conformitate cu tip special de distribuție a datelor, valorile mai mici de
zero fiind caracteristice unui nivel mai scăzut iar cele mai mari de zero unui nivel
mai ridicat. După cum știți, zero în psihologie nu înseamnă absența cantității
factorului latent (cine ar putea să definească inteligența zero), ci valoarea medie
a acesteia la nivelul populației, amplitudinea domeniului factorului latent fiind
extinsă la infinit. Chiar dacă nivelul de măsură permite acest lucru, fundamentul
tehnicilor psihometrice clasice este reprezentat tot de comparație și de relații
de ordine
I.3.2.2 Nivelul de raport Reprezintă cel mai înalt nivel de măsură, în
acest caz putem spune nu numai cu cât o cantitate
este mai mare, ci și de câte ori. Este cazul
măsurătorilor fizice, cum ar fi lungimea, greutatea,
volumul sau temperatura exprimată în grade
Kelvin. O persoană cu înălțimea de 105 centimetri
este cu 105 centimetri mai scundă în comparație
cu una având înălțimea de 210 centimetri, dar și de două ori mai scundă, pentru
că dacă luăm două persoane înalte de 105 centimetri și le punem una în capul
celeilalte, ajungem să măsoare exact cât persoana cu înălțimea de 210 de
centimetri. În psihologie nu atingem acest nivel de măsură în mod curent, rar se
întâmplă să măsurăm la acest nivel în alte domenii socio-umane, poate doar în
științele economice. Psihofiziologia mai operează cu asemenea scale, iar în
domeniul instrumentelor de diagnostic psihologic putem „forța” nivelul de
raport în teoria răspunsului la item.
Figura I-6 Variabilă continuă de interval, „înălțimea”
27
top related