c3 testarea ipotezelor

23
C3. Testarea ipotezelor statistice

Upload: florina-maria-savu

Post on 25-Apr-2017

308 views

Category:

Documents


6 download

TRANSCRIPT

C3. Testarea ipotezelor statistice

Etapele verificării ipotezelor statistice

– Identificarea ipotezelor ce trebuie testate– Alegerea testului statistic– Specificarea nivelului de semnificaţie– Stabilirea regulii de decizie– Culegerea datelor şi realizarea calculelor– Luarea deciziei de respingere sau nu a ipotezei statisticeCondiţia esenţială: variabila urmează o repartiţie normală

• Ipoteză statistică = presupunerea (enunțul) formulat cu privire la parametrul unei repartiţii sau la legea de repartiţie pe care o urmează o variabilă aleatoare.

• Ipoteză nulă (H0) = ipoteza care se consideră a priori adevărată.

• Ipoteză alternativă (HA) = o ipoteză care contrazice ipoteza nulă.

Formele ipotezei nule H0 si ipotezei alternative HA

(exemplificare pentru compararea parametrului „media colectivităţii generale“ μ cu valoarea ipotetica μ0)

– test bilateral:

H0: μ = μ0

HA: μ ≠ μ0 (μ < μ0 sau μ > μ0)

– test unilateral dreapta:H0: μ ≤ μ0

HA: μ > μ0

– test unilateral stânga:H0: μ ≥ μ0

HA: μ < μ0

• Testul statistic: se calculează statistica testului și se compară cu valoarea teoretică (valoare critică) => decizia de a respinge sau nu ipoteza nulă H0.

• Regiunea critică: interval de valori delimitat de valoarea critică. Dacă valoarea calculată a testului statistic se află în regiunea critică, ipoteza H0 se respinge.

• Eroare de tip I = eroarea pe care o facem eliminînd o ipoteză nulă, deşi este adevărată. Probabilitatea (riscul) comiterii unei erori de tip I este α; – α se numeşte nivel sau prag de semnificaţie; – α trebuie să fie f. mic (α = 0,005; 0,01 etc)– P-value=cel mai mic nivel de semnificaţie la care

poate fi respinsă ipoteza nulă.

• Nivelul de încredere al unui test statistic este (1-α) -> în expresie procentuală, (1-α)100 reprezintă probabilitatea ca rezultatele să fie adevărate.

• Eroare de tip II = eroarea pe cere o facem acceptînd o ipoteză nulă, deşi este falsă.

• Probabilitatea (riscul) comiterii unei erori de tip II este β.

• Puterea testului statistic este (1-β).

TIPURI DE ERORI ÎN TESTAREA IPOTEZELOR STATISTICE

α = P(respingere H0 ׀ H0 este adevărată)=P(eroare de tip I)

β = P(acceptare H0 ׀ H0 este falsă)= P(eroare tip II)

Decizia de Ipoteza adevărată este:a accepta: H0 HA

H0

Decizie corectă(probabilitate 1-α)

Eroare de tip II(risc β)

HA

Eroare de tip I(risc α)

Decizie corectă(probabilitate 1-β)

Efectuarea testului statistic

• Condiţia esenţială în verificarea ipotezelor statistice este că variabila urmează o repartiţie normală

• Se extrage un eşantion aleator din respectiva populaţie

• Pe baza eşantionului se calculează valoarea estimatorului parametrului populaţiei de interes şi apoi valoarea testului

• Forma generală a testului statistic:

1: ( ,..., )nx x x

valoarea estimată - valoarea ipoteticăeroarea standard a estimatorului

Decizie: – dacă valoarea numerică a testului statistic cade în

regiunea critică (Rc), respingem ipoteza nulă şi acceptăm ipoteza alternativă. Această decizie este incorectă doar în 100 α % din cazuri;

– dacă valoarea numerică a testului nu se află în regiunea critică (Rc), nu se respinge ipoteza nulă H0.

I. Teste pentru media populaţiei: dispersia σ2 este cunoscută, n ≥ 30

Testul “z”

•Se formulează ipoteza

•Se extrage un eşantion aleator din populaţie și se calculează media

•Se calculează valoarea statisticii z:

•Se stabileşte pragul de semnificaţie α (de regulă 0,05)

•Se compară valoarea calculată z cu o valoare tabelată zα (valoare critică) şi se ia decizia de acceptare/respingere

0

/xz

n

1: ( ,..., )nx x xx

TESTIpoteza

nulă H 0

Ipoteza alternativă

H A Decizia

bilateral

unilateral dreapta

unilateral stânga

/ 2 0

0

z z resping H

altfel accept H

0

0

z z resping Haltfel accept H

0

0

z z resping Haltfel accept H

Regiunea critică

μ μ μa) b) c)

Regiunea critică pentru: a) test bilateral; b) test unilateral dreapta; c) test unilateral stînga

/ 2z / 2z z z

Exemplu

• Se știe că prețul mediu al unui apartament cu 2 camere în București este de 65000 euro, cu o abatere standard de 2000 euro.Din cercetările unei agenții imobiliare pe un eșantion de 36 apartamente reiese că în cartierul Aviației prețul mediu este 68000 euro.Se poate afirma, folosind o probabilitate de 95%, ca prețul mediu al unui apartament cu 2 camere în cartierul Aviației este semnificativ mai mare decât media capitalei?

Soluţie-testul z• Variabila de interes: X – prețul mediu al unui apartament cu

2 camere– presupunem o distribuţie normală • Dispersia populaţiei este cunoscută, deci aplicăm testul z.

Ipotezele (test unilateral dreapta):H0: μ ≤ μ0

H1: μ > μ0

• Pragul de semnificaţie: • Valoarea critică: z(0,05)=1,6

0.05 (5%)

200068000

650000

x

• Valoarea testului:

• Verificarea: z=9 > z(0,05)= 1,6 => respingem H0

=> acceptam HA : putem afirma cu probabilitatea de 95% că prețul mediu al unui apartament cu 2 camere în cartierul Aviației este semnificativ mai mare decât media capitalei.

9362000

6500068000

/z

II. Teste privind media populaţiei generale (μ) pentru eşantioane de volum redus şi dispersia σ2 necunoscută

0

/xts n

•Se estimează dispersia populaţiei cu dispersia de eşantion:

•Pentru esantioane de volum redus (n<30) aplică testul “t. Se calculează valoarea statisticii:

•Valorile critice se obtin din tabelele repartiţiei t (Student), în funcţie de nivelul de semnificaţie α ales, cu n-1 grade de libertate

2

2 1

( )

1

n

ii

x xs

n

Regiunea critică-testul t

μ μ μa) b) c)

Regiunea critică pentru a) test bilateral; b) test unilateral dreapta; c) test unilateral stînga

/ 2; 1nt / 2; 1nt ; 1nt ; 1nt

Exemplul 1 – testul t

Volumul unei cutii de bere este de 0.33 litri. Pentru a verifica acest lucru se selectează aleator un eşantion de 16 cutii. În urma prelucrării datelor, s-au obţinut următoarele rezultate:

Confirmă datele corectitudinea îmbutelierii? Folosiţi un nivel de încredere de 95%.

1

2

1

5.25

( ) 23.04

n

ii

n

ii

x

x x

• Variabila de interes: X – volumul unei cutii de bere – presupunem o distribuţie normală

• Dispersia populaţiei este necunoscută - poate fi estimată prin dispersia esantionului:

• Volumul mediu ipotetic: • Volumul mediu din eşantion:

• Pragul de semnificaţie:

0 0.33

1 0.328

n

ii

xx

n

0.05 (5%)

2

2 1

( )23.04 1.536

1 15

n

ii

x xs

n

• Ipotezele:

• Valoarea critică:

• Valoarea testului:

• Verificarea:

• Decizia : nu sunt suficiente motive pentru a respinge ipoteza nulă (cu probabilitatea 95% sau cu riscul de a greși de 5%) .

0 0

0

::A

HH

/ 2; 1 0.05/ 2;15 2.48 ( , 1)nt t TINV n

0 0.382 0.33 0.00038/ 1.24 / 16x

ts n

/ 2; 10.00038 2.48nt t

Ex. 2. Conducerea unei companii apelează la 5 experţi pentru a previziona profitul în anul curent. Valorile estimate sunt: 2,60; 3,32; 1,80; 3,43; 2,00 (mil lei, preţurile anului anterior). Ştiind că profitul companiei în anul anterior a fost de 1,9 mil. lei, media previziunilor experţilor este semnificativ mai mare decât profitul anului anterior (pentru α = 0,1)?

Rezolvare. Media previziunilor experţilor este mil. lei, cu dispersia:

şi abaterea medie pătratică:

Folosim testul t.

63,2x

55070

42032

1

2

2 ,,

n

xxs i

7402 , ss

Testarea ipotezei statistice:H0: μ ≤ 1,9

H1: μ > 1,9 (test unilateral dreapta).

Regiunea critică: t > tα;n-1 = t0,1;4 = 2,132

Cum t=2,206 < t0,1;4 = 2,132, respingem ipoteza nulă => acceptam că

media previzionată este semnificativ mai mare decât profitul anului trecut.

2062574091632 ,

/,,,

ns

xt

x