statistica ii seminar02 teorie

6
Statistică II – Seminarul 2 STATISTICA INFERENŢIALĂ NOŢIUNI TEORETICE Populaţie statistică = mulţime de entităţi care satisfac un criteriu prestabilit (propriu unei cercetări). Entităţile sunt de obicei, în psihologie, indivizi. Observaţie: Acelaşi individ poate face parte din mai multe populaţii. (vezi detalii în Stan & Clocotici – „Statistică aplicată în psihologie” – cap 6.) Parametru = indicator numeric calculat din date care provin de la toţi membrii populaţiei. Are valoare fixă şi se modifică doar la modificarea mărimii populaţiei. Eşantion = submulţime a populaţiei statistice. Eşantionarea / Sondajul = operaţia de formare a unui eşantion. Eşantionul este alcătuit din unităţi de sondaj. Mărimea unui eşantion este dată de numărul de unităţi. Estimator = o entitate a cărei valoare poate fi folosită ca valoare aproximativă pentru o altă entitate. Estimaţie = valoarea estimatorului. Estimaţie statistică = valoarea care aproximează, pe baza datelor de sondaj (din eşantion), valoarea necunoscută a unui parametru al populaţiei. Inferenţă = operaţia prin care pe baza acceptării unor enunţuri ca adevărate, se acceptă ca adevărat un alt enunţ derivat logic din celelalte enunţuri (acelaşi principiu ca la inducţie matematică sau inferenţa logică). Inferenţă statistică = obţinerea unor concluzii asupra caracteristicilor unei populaţii, pe baza statisticilor unui eşantion (extras din populaţia respectivă). Inferenţa statistică presupune estimarea valorii parametrilor (populaţiei) pe baza statisticilor din eşantion. CLASIFICAREA EŞANTIOANELOR - după mărime/volum: o eşantioane mici – până în 30 o eşantioane mari – peste 30 - după modul de selectare a elementelor (avem cel puţin 2 eşantioane) o eşantioane dependente (perechi) – 2 situaţii: aceeaşi indivizi în ambele eşantioane. Ex: cercetările cu măsurători repetate (în mai multe etape) – vezi mai jos ; 1

Upload: nadea-romanciuc

Post on 03-Oct-2015

219 views

Category:

Documents


0 download

DESCRIPTION

Statistică inferențială, psihologie

TRANSCRIPT

PAGE 2Statistic II Seminarul 2

STATISTICA INFERENIAL

NOIUNI TEORETICEPopulaie statistic = mulime de entiti care satisfac un criteriu prestabilit (propriu unei cercetri).

Entitile sunt de obicei, n psihologie, indivizi.

Observaie: Acelai individ poate face parte din mai multe populaii. (vezi detalii n Stan & Clocotici Statistic aplicat n psihologie cap 6.)

Parametru = indicator numeric calculat din date care provin de la toi membrii populaiei. Are valoare fix i se modific doar la modificarea mrimii populaiei.

Eantion = submulime a populaiei statistice.

Eantionarea / Sondajul = operaia de formare a unui eantion.Eantionul este alctuit din uniti de sondaj. Mrimea unui eantion este dat de numrul de uniti.

Estimator = o entitate a crei valoare poate fi folosit ca valoare aproximativ pentru o alt entitate.Estimaie = valoarea estimatorului.Estimaie statistic = valoarea care aproximeaz, pe baza datelor de sondaj (din eantion), valoarea necunoscut a unui parametru al populaiei.

Inferen = operaia prin care pe baza acceptrii unor enunuri ca adevrate, se accept ca adevrat un alt enun derivat logic din celelalte enunuri (acelai principiu ca la inducie matematic sau inferena logic).

Inferen statistic = obinerea unor concluzii asupra caracteristicilor unei populaii, pe baza statisticilor unui eantion (extras din populaia respectiv).

Inferena statistic presupune estimarea valorii parametrilor (populaiei) pe baza statisticilor din eantion.

CLASIFICAREA EANTIOANELOR dup mrime/volum:

eantioane mici pn n 30

eantioane mari peste 30

dup modul de selectare a elementelor (avem cel puin 2 eantioane)

eantioane dependente (perechi) 2 situaii:

aceeai indivizi n ambele eantioane. Ex: cercetrile cu msurtori repetate (n mai multe etape) vezi mai jos ;

egalizarea indivizilor din punctul de vedere al caracteristicilor. Ex: dac n primul eantion am subieci de sex masculin, cu vrste ntre 25-30 de ani, cu studii superioare, atunci, n al doilea eantion trebuie s am subieci cu aceleai caracteristici (sex masculin, vrsta ntre ...)

eantioane independente avem indivizi diferii n cele dou eantioane, iar selectarea indivizilor dintr-un eantion nu depinde de selectarea indivizilor din cellalt eantion - nu este necesar s aib aceleai caracteristici ba, mai mult, trebuie s se diferenieze din punctul de vedere al uneia dintre caracteristici.Ex: 2 eantioane difereniate dup caracteristica sex un eantion cu subieci de sex masculin i altul cu subieci de sex feminin.Observaie: criteriile de clasificare se pot combina.Eantioanele dependente sunt utilizate n 3 tipuri de cercetri:

cercetri n care este necesar controlarea factorului de variaie la nivelul individului. Ex: cercetrile longitudinale panel cercetri n mai multe etape legate ntre ele (cu msurri repetate). Ex: cercetarea efectului repetiiei asupra memoriei: n prima etap se cere subiecilor citirea unei liste de 20 de cuvinte i s precizeze cuvintele pe care le-au reinut; n a doua etap li se cere subiecilor sa reciteasc lista i se verific iar numrul de cuvinte pe care le-au reinut .a.m.d. (se repet acelai lucru). Printr-o astfel de cercetare s-a obinut curba memoriei lui Ebbinghaus. cercetri n care este necesar controlarea factorului de variaie la nivelul eantionului.

Reprezentativitatea unui eantion = capacitatea eantionului de a reproduce ct mai fidel structurile i caracteristicile populaiei din care este extras. Se exprim cantitativ prin 2 indicatori:

Eroarea maxim: d = v* v exprim cea mai mare diferen acceptat ntre o valoare gsit pe eantion (v*) i valoarea corespunztoare din populaie (v). Se refer la precizie. Nivelul de ncredere / probabilitate: P arat ce anse exist ca eroarea comis atunci cnd se aproximeaz valoarea v (necunoscut) prin valoarea v*, s nu depeasc limita d.

Vorbim de o eroare d cnd avem n vedere: 1. o caracteristicExemple:1. Vrsta1.Sex

2. o valoare a ei2. Media (de vrst)2.Proporia de subieci de sex feminin

Cu ajutorul valorii d i a unei valori v* determinat pe un eantion (media, proporia, abaterea standard etc.) se construiete intervalul de ncredere pentru parametrul populaiei (v) : (v* d, v* + d).

Ex: pe eantion am gsit o proporie de subieci de sex feminin de 54%, i eroarea d = 2%. Atunci proporia de subieci de sex feminin din populaie va fi n intervalul: (54 2, 54 + 2), adic (52, 56).

PRINCIPII LEGATE DE STABILIREA REPREZENTATIVITII UNUI EANTION1. Plasarea valorii pentru populaie n intervalul (v* d, v* + d) nu este niciodat sigur; ea are loc cu probabilitatea P (0,95 sau 0,99 i respectiv 95% sau 99%). Prin urmare, reprezentativitatea se exprim prin ambii termeni: d i P.

2. Reprezentativitatea este pentru o caracteristic dat; nu vorbim n general de ea. Ex: pentru acelai eantion care are dou caracteristici: sex i vrst, vom avea o reprezentativitate pentru caracteristica sex dat de cuplul (d1, P1) i o reprezentativitate pentru caracteristica vrst dat de cuplul (d2, P2).3. Reprezentativitatea este o noiune relativ; astfel un eantion este mai mult sau mai puin reprezentativ. Nu avem niciodat reprezentativitate total 100% (vezi principiul 1: P este maxim 99%), dar nici reprezentativitate nul. Putem compara eantioanele din punctul de vedere al reprezentativitii pentru o caracteristic 4 situaii:1. Acelai P2.Acelai d3. d1P2 P1P2

Eantionul 1 este mai reprezentativ dect eantionul 2: e1>e2e1>e2e1>e2Eantioanele nu pot fi comparate. Trebuie uniformizat nivelul de probabilitate (se transform P1 i P2 astfel nct s avem acelai P) i apoi se compar doar d-urile (d1 i d2 transformndu-se i ei ca urmare a modificrii lui P1 i P2 vezi principiul urmtor)

4. Cele dou mrimi d i P nu sunt independente. Fixnd una dintre ele, cealalt se calculeaz. Dependena lor se exprim astfel: cu ct scade eroarea (d), cu att scade i probabilitatea (P). Prin urmare, nu putem ameliora simultan i precizia estimrii (d) i sigurana acesteia (P).

5. Indicatorul p exprim riscul de eroare i este 0,05 sau 0,01 (respectiv, 5% sau 1 %) i se obine prin: p = 1 P sau p = 100% P

OBS: p se va mai ntlni sub forma lui . Putem vorbi de un eantion reprezentativ dac, n raport cu toate caracteristicile cercetate, eroarea d se afl sub o limit acceptabil, iar mrimea p se afl sub pragul de 5% (sau P peste 95%).

GRADUL DE REPREZENTATIVITATE AL UNUI EANTION DEPINDE DE URMTOARELE:a) Caracteristicile populaiei Un eantion este mai reprezentativ pentru caracteristici ce evideniaz o mai mare omogenitate (similaritate din punctul de vedere al caracteristicii respective. Ex: populaia studenilor din Iai este mai omogen din punctul de vedere al vrstei dect ntreaga populaie a Iaului.

Aceasta este o consecin a legturii dintre omogenitatea unei caracteristici (exprimat prin indicatori ai mprtierii, din care cel mai folosit este abaterea standard) i eroarea de eantionare (care, cu ct este mai mic, arat o reprezentativitate mai mare a eantionului). Legtura este urmtoarea: eroarea de eantionare este direct proporional cu abaterea standard (cu ct crete abaterea standard, adic mprtierea care indic neomogenitate, cu att crete eroarea de eantionare, adic scade reprezentativitatea eantionului).

b) Mrimea eantionului (Nu a populaiei !) Reprezentativitatea crete odat cu numrul de indivizi din eantion, dar aceast cretere nu este direct proporional cu creterea volumului eantionului. Pentru un numr mic de subieci, adugarea altora aduce o cretere mare a reprezentativitii, dar pentru un numr mai mare de subieci, adugarea altora duce la o cretere foarte mic a reprezentativitii.

Observaii:

reprezentativitatea nu depinde de mrimea populaiei ! n practic, creterea efectivului eantionului nu se face pentru sporirea reprezentativitii acestuia, ci din necesitatea reprezentativitii unor subgrupuri din eantion corespunztoare unor subpopulaii. Dac n eantion am un subgrup de 2 subieci care corespunde unei subpopulaii este evident c acest subgrup (un eantion i el) nu este reprezentativ pentru subpopulaie (care este populaie pentru eantionul reprezentat de subgrupul din eantionul iniial). Prin urmare, apare necesitatea mririi subgrupului astfel nct s devin reprezentativ, ceea ce duce i la o mrire a eantionului mare (iniial). Acesta din urm nu va avea o influen foarte mare asupra reprezentativitii eantionului mare (care era reprezentativ). Deci, creterea efectivului se face pentru sporirea reprezentativitii unor subgrupuri din eantion i nu a eantionului.

c) Se poate calcula reprezentativitatea unui eantion doar pentru eantioane obinute prin tehnici aleatoare sau probabilistice. Chiar i ntre acestea exist diferene mari n ce privete asigurarea reprezentativitii.

PopulaieEantionObservaii

Notaii:Media

este o estimaie a lui

Abaterea standardss este o estimaie a lui

Volum Nn

PAGE

_1108969943.unknown

_1108969992.unknown