curs 13 testarea ipotezelor statisticemath.etc.tuiasi.ro/rstrugariu/cursuri/spd2018/c13.pdftestarea...

26
Curs 13 Testarea ipotezelor statistice ˆ In continuare vom face ipoteze asupra parametrilor unor populat ¸ii, ¸ stiind distribut ¸ia pe care o urmeaz˘ a. Vom folosi rezultatele obt ¸inute la estimarea prin intervale de ˆ ıncredere a unor parametri remarcabili ai unor distribut ¸ii cunoscute. Fie o colectivitate cercetatat˘a din punct de vedere al caracteristicii X . Legea de proba- bilitate este f (x, θsi poate fi funct ¸ia de frecvent ¸˘ a, ˆ ın cazul discret, respectiv densitatea de probabilitate, ˆ ın cazul continuu. 13.1 Teste parametrice Definit ¸ia 13.1.1 Se nume¸ ste ipotez˘ a statistic˘ a orice presupunere relativ la parametrii distribut ¸iei uneia sau mai multor populat ¸ii statistice, dac˘ a distribut ¸ia este cunoscut˘ a, sau presupuneri legate de distribut ¸ia de probabilitate a populat ¸iei statistice. Ipotezele pot fi acceptate sau nu cu anumite probabilit˘ at ¸i de corectitudine a deciziei. Testul statistic poat fi referitor la parametrii de care depinde legea de probabilitate a caracteristicii X . ˆ In acest caz testul se nume¸ ste parametric . ˆ In caz contrar se obt ¸ine un test neparametric . Acceptarea unei ipoteze nu ˆ ınseamn˘ a c˘ a este adev˘ arat˘acic˘ a nu exist˘ a motive de respin- gere. Adev˘ arul sau falsitatea ipotezei nu se poate stabili niciodat˘ a cu exactitate pˆ an˘ a nu se examineaz˘ ıntreaga populat ¸ie. Acest lucru este imposibil ˆ ın cele mai multe situat ¸ii practice. De aceea procedura de testare a ipotezei statistice se face cu o anumit˘ a probabilitate de a trage o concluzie gre¸ sit˘ a. Exemplul 13.1.2 a presupunem c˘ ın timp ce urm˘ arim o emisiune la TV apare pe ecran o reclam˘a ˆ ın care se afirm˘ a c˘a firma X vinde un nou tip de baterii electrice funct ¸ionˆ and ˆ ın medie 100 de ore f˘ar˘ ıntrerupere. Un consumator sceptic dore¸ ste s˘a testeze aceast˘ a afirmat ¸ie care se refer˘a la durata de viat ¸˘ a a bateriilor produse de firma X . Pentru aceasta, statistica recomand˘ a s˘a se considere un e¸ santion aleator din bateriile produse de acea firm˘a, a fie l˘ asate s˘a funct ¸ioneze ¸ sis˘aseˆ ınregistreze timpii scur¸ si pˆ an˘ a la desc˘ arcarea lor. S˘a presupunem c˘ a s-au considerat 26 de baterii ¸ si a rezultat un timp mediu de funct ¸ionare x = 98.2 de ore. Dac˘a ar fi rezultat x 100, atunci nu se putea repro¸ sa nimic firmei X ; dar pentru x = 98.2 se pune problema avertiz˘arii consumatorilor. Unii se potˆ ıntrebadac˘a santionul a fost reprezentativ, alt ¸ii decid c˘a totul este Ok (ceˆ ınseamn˘ a 98.2, dar100?). Cˆat de mult se poate coborˆ ı pentu a decide c˘ a reclama nu este minciunoas˘a? Astfel deˆ ıntreb˘ ari se pun ˆ ınleg˘atur˘ a cu testarea oric˘ arei ipoteze statistice. ˆ In testarea ipotezelor se ˆ ıncepe cu o afirmat ¸ie numit˘a ipoteza nul˘a ¸ sinotat˘a H 0 , despre care nu se ¸ stie dac˘a este adev˘ arat˘ a sau fals˘ a, iar e¸ santionul este ales pentru a valida aceast˘ a 1

Upload: others

Post on 04-Feb-2020

31 views

Category:

Documents


1 download

TRANSCRIPT

Page 1: Curs 13 Testarea ipotezelor statisticemath.etc.tuiasi.ro/rstrugariu/cursuri/SPD2018/c13.pdfTestarea ipotezelor statistice ^In continuare vom face ipoteze asupra parametrilor unor populat˘ii,

Curs 13

Testarea ipotezelor statistice

In continuare vom face ipoteze asupra parametrilor unor populatii, stiind distributia pe careo urmeaza. Vom folosi rezultatele obtinute la estimarea prin intervale de ıncredere a unorparametri remarcabili ai unor distributii cunoscute.

Fie o colectivitate cercetatata din punct de vedere al caracteristicii X. Legea de proba-bilitate este f(x, θ) si poate fi functia de frecventa, ın cazul discret, respectiv densitatea deprobabilitate, ın cazul continuu.

13.1 Teste parametrice

Definitia 13.1.1 Se numeste ipoteza statistica orice presupunere relativ la parametrii distributieiuneia sau mai multor populatii statistice, daca distributia este cunoscuta, sau presupunerilegate de distributia de probabilitate a populatiei statistice. Ipotezele pot fi acceptate sau nucu anumite probabilitati de corectitudine a deciziei.

Testul statistic poat fi referitor la parametrii de care depinde legea de probabilitate acaracteristicii X. In acest caz testul se numeste parametric. In caz contrar se obtine un testneparametric.

Acceptarea unei ipoteze nu ınseamna ca este adevarata ci ca nu exista motive de respin-gere. Adevarul sau falsitatea ipotezei nu se poate stabili niciodata cu exactitate pana nu seexamineaza ıntreaga populatie. Acest lucru este imposibil ın cele mai multe situatii practice.De aceea procedura de testare a ipotezei statistice se face cu o anumita probabilitate de atrage o concluzie gresita.

Exemplul 13.1.2 Sa presupunem ca ın timp ce urmarim o emisiune la TV apare pe ecrano reclama ın care se afirma ca firma X vinde un nou tip de baterii electrice functionandın medie 100 de ore fara ıntrerupere. Un consumator sceptic doreste sa testeze aceastaafirmatie care se refera la durata de viata a bateriilor produse de firma X. Pentru aceasta,statistica recomanda sa se considere un esantion aleator din bateriile produse de acea firma,sa fie lasate sa functioneze si sa se ınregistreze timpii scursi pana la descarcarea lor. Sapresupunem ca s-au considerat 26 de baterii si a rezultat un timp mediu de functionarex = 98.2 de ore. Daca ar fi rezultat x ≥ 100, atunci nu se putea reprosa nimic firmei X;dar pentru x = 98.2 se pune problema avertizarii consumatorilor. Unii se pot ıntreba dacaesantionul a fost reprezentativ, altii decid ca totul este Ok (ce ınseamna 98.2, dar 100?). Catde mult se poate coborı pentu a decide ca reclama nu este minciunoasa? Astfel de ıntrebarise pun ın legatura cu testarea oricarei ipoteze statistice.

In testarea ipotezelor se ıncepe cu o afirmatie numita ipoteza nula si notata H0, desprecare nu se stie daca este adevarata sau falsa, iar esantionul este ales pentru a valida aceasta

1

Page 2: Curs 13 Testarea ipotezelor statisticemath.etc.tuiasi.ro/rstrugariu/cursuri/SPD2018/c13.pdfTestarea ipotezelor statistice ^In continuare vom face ipoteze asupra parametrilor unor populat˘ii,

ipoteza. In cazul bateriilor electrice ipoteza nula este

H0 : m = 100

(deci firma X spune adevarul). Notam cu H1 o ipoteza alternativa care sa sugereze siconditiile ın care ipoteza H0 este respinsa; de exemplu:

H1 : m < 100

Nu ıntotdeauna ipoteza H1 reprezinta negatia logica obisnuita a ipotezei H0. De regula,aceasta a doua ipoteza se alege ın directia deciziei de respingere a ipotezei H0; nu se ia aiciH1 : m > 100 care nu ar fi o ipoteza de respingere ci de satisfactie pentru calitatea bateriilor.

Valorile parametrilor specificati prin ipoteza nula sunt determinati prin mai multe cai:– pot rezulta dintr-o experienta trecuta, din experiente realizate acum,– pot fi obtinute din teorie sau modele privitoare la procesele ın studiu.Obiectivul testului este, de obicei, de a stabili daca aceste valori s-au schimbat. Alta

situatie apare cand valorile parametrilor rezulta din consideratii exterioare sau din obligatiicontractuale. Atunci obiectivul testarii ipotezelor este de a confirma aceste valori.

13.1.1 Legatura dintre testarea ipotezei statistice relativ la unparametru si intervalul de ıncredere al parametrului

Fie parametrul θ si [u, v] intervalul de ıncredere pentru acest parametru cu nivelul deıncredere 100(1− α)%. Astfel pentru ipoteza bilaterala

H0 : θ = θ0,H1 : θ 6= θ0,

vom respinge ipoteza H0 daca si numai daca θ0 /∈ [u, v], [u, v] intervalul de ıncredere cunivelul de ıncredere 100(1 − α)%. Regiunea critica pentru testul bilateral (contine valorilepentru care ipoteza H0 se respinge) este ın afara intervalului de ıncredere.

Pentru ipoteza unilateralaH0 : θ = θ0,H1 : θ < θ0,

vom respinge ipoteza H0 daca si numai daca θ0 < u. Multimea (−∞, u) se numeste regiunecritica pentru testul unilateral propus, [u,∞) fiind intervalul de ıncredere unilateral pentruparametrul θ.

Pentru ipoteza unilateralaH0 : θ = θ0,H1 : θ > θ0,

vom respinge ipoteza H0 daca si numai daca θ0 > v. Multimea (v,∞) se numeste regiunecritica pentru testul unilateral propus, (−∞, v] fiind intervalul de ıncredere unilateral pentruparametrul θ.

Etapele procedurii de testare a ipotezelor:Pasul 1. Pentru problema studiata se identifica parametrul care intereseaza a fi testat.Pasul 2. Se formuleaza ipoteza nula H0.Pasul 3. Se formuleaza ipoteza alternativa H1.Pasul 4. Se alege pragul de semnificatie α.Pasul 5. Se face selectia, daca testul verifica o ipoteza pentru date confirmate din experiente

realizate. Se determina testul statistic corespunzator.Pasul 6. Se stabileste regiunea critica corespunzatoare testului propus.Pasul 7. Se fac calculele necesare, se ınlocuiesc ın testul statistic si se calculeaza valoarea.Pasul 8. Se stabileste daca ipoteza H0 se accepta sau nu.

2

Page 3: Curs 13 Testarea ipotezelor statisticemath.etc.tuiasi.ro/rstrugariu/cursuri/SPD2018/c13.pdfTestarea ipotezelor statistice ^In continuare vom face ipoteze asupra parametrilor unor populat˘ii,

Exemplul 13.1.3 Folosim un test unilateral pentru medie cu dispersie necunoscuta. Aplicampasii testului problemei din Exemplul 13.1.2.

Pasul 1. Pentru problema studiata se identifica parametrii care intereseaza: timpul mediude functionare a bateriilor. Notam cu m parametrul care ia ca valori acest timp mediu.

Pasul 2. Se formuleaza ipoteza nula

H0 : m = 100

Pasul 3. Se formuleaza ipoteza alternativa

H1 : m < 100

Pasul 4. Se alege pragul de semnificatie α = 0.05.Pasul 5. Se face selectia si se determina testul statistic corespunzator. Se considera un

esantion n = 26 de baterii, sunt puse sa functioneze si se noteaza timpul de functionare abateriilor. S-a obtinut media x = 98.2 si s = 10 ore. Deoarece dispersia nu este cunoscutasi volumul esantionului este mic folosim testul Student. Pentru aceasta utilizam statistica(conform rezultatelor de la intervale de ıncredere)

T =X −m

s√n

∈ t(n− 1).

Pasul 6. Testul este unilateral. Se determina tα,n−1 astfel ıncat P (T < −tα,n−1) =α, P (T < −t0.05,25) = 0.05 rezulta t0.05,25 = 1.70814. Regiunea critica pentru T este(−∞,−1.70814).

Pasul 7. Se fac calculele necesare, se ınlocuiesc ın testul statistic si se calculeaza valoarea.

Stim ca x = 98.2 si s = 10 ore, rezulta cas√n

=10√26

= 1.9612. Calculam T =X −m

s√n

=

98.2− 10010√26

= −0.91782.

Aceasta ınseamna ca X < 100 − 10√26

1.70814 = 96.65, regiunea critica pentru m este

(−∞, 96.65).Pasul 8. Se stabileste daca ipoteza H0 se accepta sau nu. Deoarece T = −0.917 82 >

−1.70814 = −t0.05,25, rezulta ca ın acest caz nu avem motive sa respingem ipoteza H0, deciipoteza H0 se accepta.

Regiunea colorata este regiunea critica pentru testul unilateralH0 : m = m0, H1 : m < 100

Observatia 13.1.4 Daca am fi aplicat Testul Z atunci : Φ(z0.05) = 0.95⇒ z0.05 = 1.64485si regiunea critica este (−∞,−1.64485) . Deoarece Z = −0.917 82 > −1.64485, rezulta ca nuavem motive sa respingem ipoteza H0.

Daca datele din esantion ar fi dat x = 94.5, folosind testul Student rezulta

T =X −m

s√n

=94.5− 100

10√26

= −2.8045 < −1.70814 = t0.05,25

si respingem ipoteza H0.Daca am fi aplicat testul Z am obtine T = −2.804 5 < −1.64485, rezulta ca, la fel ca mai

sus, respingem ipoteza H0.

3

Page 4: Curs 13 Testarea ipotezelor statisticemath.etc.tuiasi.ro/rstrugariu/cursuri/SPD2018/c13.pdfTestarea ipotezelor statistice ^In continuare vom face ipoteze asupra parametrilor unor populat˘ii,

Daca schimbam pragul de semnificatie α = 0.01, atunci daca aplicam testul Studentt0.01,25 = 2.48511 si pentru x = 98.2, T = −0.91782 > −2.48511. Rezulta ca nu avem motivesa respingem ipoteza H0.

Pragul de semnificatie este dat de piata, lupta pentru calitate, concurenta ın promovareaproduselor. ♦

Aceasta procedura de decidere ne poate conduce la doua concluzii gresite: eroare de tipI si eroare de tip II. Deoarece deciziile sunt bazate pe rezultate aleatoare, probabilitatile potfi asociate acestor erori.

Eroarea de tip I consta ın respingerea ipotezei H0 desi ea este adevarata (se respinge penedrept ipoteza nula). Probabilitatea de a face o eroare de tip I se numeste risc de spetaıntai (risc al furnizorului) si este data de nivelul α de ıncredere,

α = P (se respinge H0, desi H0 este adevarat) .

Pentru exemplul nostru ınseamna ca eroarea de tip I poate apare cand pentru esantionulstudiat, media timpului de functionare a bateriilor a fost x = 94.5, fapt care ne conduce larespingerea ipotezei, desi ın realitate timpul de functionare este corect.

Calculam

P (x < 94.5 | m = 100) = P

(x− 100

10√26

<94.5− 100

10√26

)=

= P (T < −2.8045) = F25(−2.804 5) = 0.0048 ≈ 0.005,

unde F25(−2.804 5) reprezinta valoarea functiei de repartitie Student cu 25 de grade delibertate. Aceasta ınseamna ca 0.5% din esantioane vor conduce la respingerea ipotezei nulecand media reala de viata a bateriilor este de 100 ore.

Observatia 13.1.5 Putem reduce α prin largirea regiunii de acceptare. De exemplu, dacaregiunea critica ar fi (−∞, 94.5) atunci

α = P (x < 94.5 | m = 100) = P

(x− 100

10√26

<94.5− 100

10√26

)=

= P (T < −3.8243) = F25(−3.8243) = 0.000388446

4

Page 5: Curs 13 Testarea ipotezelor statisticemath.etc.tuiasi.ro/rstrugariu/cursuri/SPD2018/c13.pdfTestarea ipotezelor statistice ^In continuare vom face ipoteze asupra parametrilor unor populat˘ii,

Se poate reduce α si prin cresterea dimensiunii esantionului. Daca facem o selectie devolum n = 36 si am obtinut acelasi s = 10, atunci

α = P (x < 96.65 | m = 100) = P

(x− 100

10√36

<94.5− 100

10√36

)=

= P (T < −3.3) = F25(−3.3) = 0.00111.

Eroarea de tip II ınseamna admiterea unei ipoteze false, adica nu se respinge ipotezaH0 desi ea este falsa. Probabilitatea acestei erori se numeste risc de speta a doua (risc albeneficiarului) si este notata cu β.

In exemplul nostru se poate produce o eroare de tip II daca esantionul pentru care amobtinut x = 98.2 ne conduce la acceptarea ipotezei H0, desi ea este falsa. β = P (nu respingH0, desi H0 este fals).

Presupunem ca ın realitate m = 95.

β = P (x > 98.2 | m = 95) = P

(x− 95

10√26

>98.2− 95

10√26

)=

= P (T > 1.631 7) = 1− F25(1.631 7) = 0.05763

Astfel, ın testarea orcarei ipoteze statistice pot apare patru situatii:

Decizia H0 adevarata H0 este falsanu avem motive derespingere a lui H0 p = 1− α

eroare de tip IIp = β

respingem H0eroare de tip I

p = α p = 1− β

Orice regula de decizie este cuplul de numere (α, β).Dintre doua reguli de decizie cu (α1, β1) si (α2, β2) astfel ıncat α1 ≤ α2, β1 ≤ β2, vom

elimina pe a doua. Spunem ca regula de decizie (α1, β1) domina regula (α2, β2). Exista sicazuri ın care cele doua reguli nu se pot compara.

13.1.2 Testarea mediei unei distributii normale

Vrem sa testam ipotezaH0 : m = m0

H1 : m 6= m0

unde m0 este constanta data.Selectia X1, X2, . . . , Xn s-a facut dintr-o populatie distribuita normal cu media necu-

noscuta si abaterea medie patratica σ cunoscuta. Deoarece X este distribuita normal cu

media m0 si devierea standardσ√n, si daca ipoteza nula este adevarata, putem construi o

regiune critica pe baza datelor din esantion. Se utilizeaza statistica (conform rezultatelor de

la intervale de ıncredere) Z0 =X −m0

σ√n

∈ N(0, 1).

P (|Z0| ≤ z) = 1− α⇔

1− α = P

(m ∈

[x− z σ√

n, x+ z

σ√n

])= Φ (z)− Φ (−z) =

= 1− 2Φ(−z)⇒ 1− α = 1− 2Φ(−z).

5

Page 6: Curs 13 Testarea ipotezelor statisticemath.etc.tuiasi.ro/rstrugariu/cursuri/SPD2018/c13.pdfTestarea ipotezelor statistice ^In continuare vom face ipoteze asupra parametrilor unor populat˘ii,

Notam cu zα2

valoarea pozitiva a lui z obtinuta din relatia Φ(−z) =α

2. Daca pentru selectia

facuta valoarea calculata Z0 =x−m0

σ√n

/∈[−zα

2, zα

2

]ipoteza H0 este respinsa. Regiunea(

−∞,−zα2

)∪(zα

2,∞)

este regiunea critica sau regiunea de respingere a ipotezei H0.

Regiunea critica pentru testul bilateral H0 : m = m0, H1 : m 6= m0 este prezentata ın

Figura 9.2 iar aria fiecarei zone colorate esteα

2.

Daca Z0 =x−m0

σ√n

∈[−zα

2, zα

2

]nu avem motive sa respingem ipoteza H0.

Daca dispersia este necunoscuta se foloseste testul statistic T =X −m0

s√n

∈ t (n− 1),

care urmeaza, ın acest caz, o distributie Student cu n− 1 grade de libertate.Regiunea critica pentru testul unilateral

H0 : m = m0, H1 : m > m0 este

6

Page 7: Curs 13 Testarea ipotezelor statisticemath.etc.tuiasi.ro/rstrugariu/cursuri/SPD2018/c13.pdfTestarea ipotezelor statistice ^In continuare vom face ipoteze asupra parametrilor unor populat˘ii,

Ipoteza

H0Statistica

Ipoteza

alternativa

H1

Regiunea criti-

ca pentru res-

pingerea lui H0

A)Z0 =

X −m0σ√n

∈ N (0, 1)

m < m0 Z0 < −zα

m = m0(σ cunoscut)

n ≥ 30m > m0 Z0 > zα

m 6= m0 |Z0| > zα2

B)T =

X −m0s√n

∈ t (n− 1)

m < m0 T < −tα,n−1

m = m0(σ necunoscut)

n < 30m > m0 Tn−1 > tα,n−1

m 6= m0 |Tn−1| > tα2,n−1

Exemplul 13.1.6 La un control al calitatii produselor fabricate de catre o fabrica s-auobtinut urmatoarele date privind greutatea ın grame a unui anumit produs: 998, 989, 1004,1015, 991, 987, 995, 1006, 987, 983, 996, 997, 1003, 990, 996, 992, 997, 1016, 990, 981. Sase verifice ipoteza ca greutatea produselor corespunde standardului de calitate care este 1000g. Sa se calculeze intervalul de ıncredere pentru greutatea produselor.

Rezolvare. Se va efectua mai ıntai testul bilateral pentru medie cu dispersie necunoscuta.Pasul 1 . Parametrul care trebuie testat este media greutatii m.Pasul 2. Se fixeaza ipoteza nula

H0 : m = 1000 (greutatea produselor corespunde normei);Pasul 3. Se fixeaza ipoteza alternativa

H1 : m 6= 1000 (greutatea produselor nu corespunde normei, sınt necesare ajustariale procesului de productie).

Pasul 4. Nivelul de seminficatie este considerat pe rand α = 0.05 si α = 0.01.Pasul 5. Se face selectia. Se stabileste statistica folosita (conform rezultatelor de la

intervale de ıncredere)

T =X −m0

s√n

∈ t (n− 1) ,

care are repartitie Student cu n − 1 grade de libertate. Avem x =1

n

n∑i=1

xi este me-

dia greutatilor produselor din lotul dat, s este abaterea medie patratica de selectie, s =√1

n− 1

n∑i=1

(xi − x)2.

Pasul 6. Se determina regiunea critica si valoarea critica tα2,n−1 > 0 astfel ıncat P (|T | ≤

tα2,n−1) = 1− α. Se vor considera cazurile α = 0.05 si α = 0.01.

Pasul 7. Se fac calculele necesare, se ınlocuiesc ın testul statistic si se calculeaza valoarea.Pasul 8. Se stabileste daca ipoteza H0 se accepta sau nu. Daca |T | ≤ tα/2, atunci nu

avem motive sa respingem ipoteza H0, iar daca |T | > tα/2, atunci ipoteza H0 se respinge sise accepta ipoteza H1.

Urmatorul program Matlab va efectua calculele necesare si va determina ce ipoteza tre-buie acceptata:

% Test bilateral privind media repartitiei normale,

% dispersie necunoscuta.

7

Page 8: Curs 13 Testarea ipotezelor statisticemath.etc.tuiasi.ro/rstrugariu/cursuri/SPD2018/c13.pdfTestarea ipotezelor statistice ^In continuare vom face ipoteze asupra parametrilor unor populat˘ii,

% ipoteza nula H0: m=1000

% ipoteza alternativa H1: m~=1000

clc;

clear;

format compact;

x=[998, 989, 1004, 1015, 991, 987, 995, 1006, 987,...

983, 996, 997, 1003, 990, 996, 992, 997, 1016,...

990, 981]

n=length(x)

alfa=0.05

m=1000

ms=sum(x)/n

s=sqrt(1/(n-1)*sum((x-ms).^2))

t=(ms-m)*sqrt(n)/s

ta=tinv(1-alfa/2,n-1)

if abs(t)<=tadisp(’Ipoteza H0 se accepta’)

else

disp(’Ipoteza H0 se respinge’)

end;

int incr=[ms-ta*s/sqrt(n) ms+ta*s/sqrt(n)]

t=-5:0.1:5;

ft=tpdf(t,n-1);

plot(t,ft,’m’);

xlabel(’t’); ylabel(’densitatea de repartitie Student’);

patch([t(t<=-ta),-ta],[ft(t<=-ta),0],’b’);patch([t(t>=ta),ta],[ft(t>=ta),0],’b’);

Ruland programul, obtinem:

x = 995, 65; s = 9, 4494; t = −2, 0587; tα/2 = 2, 093.

Prin urmare |t| < tα/2 si, deci, ipoteza nula H0 se accepta pentru nivelul de semnificatieα = 0, 05. Intervalul de incredere[

x− tα/2s√n, x+ tα/2

s√n

]pentru x (greutatea produsului) este [991, 23; 1000, 1]. Programul afiseaza, de asemenea,graficul densitatii de repartitie Student (figura 9.2). Zona hasurata indica valorile lui tpentru care ipoteza nula este respinsa.

Luand α = 0.01, obtinem tα/2 = 2.8609 si deci ipoteza nula se confirma iar. Intervalulde ıncredere este [989.6; 1001.7].

Exemplul 13.1.7 Printr-un sondaj, pentru un esantion de volum n = 20, s-a constatat cadurata medie de functionare ın ore a unui anumit tip de acumulatoare pına la urmatoareaıncarcare este 148 ore. Sa se verifice ipoteza ca durata de functionare este 150 ore, ipotezaalternativa fiind un timp de functionare mai mic de 150 ore, la un nivel de semnificatie de0.05, stiind ca dispersia duratei de functionare este 35.

8

Page 9: Curs 13 Testarea ipotezelor statisticemath.etc.tuiasi.ro/rstrugariu/cursuri/SPD2018/c13.pdfTestarea ipotezelor statistice ^In continuare vom face ipoteze asupra parametrilor unor populat˘ii,

−5 −4 −3 −2 −1 0 1 2 3 4 50

0.05

0.1

0.15

0.2

0.25

0.3

0.35

0.4

t

dens

itate

a de

rep

artit

ie S

tude

nt

Rezolvare. Se va efectua un test unilateral pentru medie cu dispersie cunoscuta.Pasul 1 . Parametrul care trebuie testat este media timpilor de functionare a unui anumit

tip de acumulator, m.Pasul 2. Se fixeaza ipoteza nula

H0 : m = 150Pasul 3. Se fixeaza ipoteza alternativa

H1 : m < 150Pasul 4. Nivelul de semnificatie este α = 0.05.Pasul 5. Se face selectia. Se stabieste statistica folosita

Z =

(X −m

)√n

σ∈ N (0, 1) .

Pasul 6. Se determina regiunea critica si valoarea critica zα pentru nivelul de semnificatieα dat, din conditia P (z < −zα) = α, adica Φ (zα) = 1− α.

Pasul 7. Se fac calculele necesare, se ınlocuiesc ın testul statistic si se calculeaza valoarea.Pasul 8. Se stabileste daca ipoteza H0 se accepta sau nu. Daca z ≥ −zα atunci nu avem

motive sa respingem ipoteza H0, ın caz contrar se respinge H0. Programul urmator va efectuaacest test.

% Test unilateral privind media repartitiei normale,

% dispersie cunoscuta

% ipoteza nula H0: media m=150

% ipoteza alternativa H1: m<150clc;

clear;

n=20;

alfa=0.05

m=150

sg=sqrt(35)

ms=148

z=(ms-m)*sqrt(n)/sg

za=norminv(1-alfa,0,1)

if z>=-zadisp(’Ipoteza H0 se accepta’)

9

Page 10: Curs 13 Testarea ipotezelor statisticemath.etc.tuiasi.ro/rstrugariu/cursuri/SPD2018/c13.pdfTestarea ipotezelor statistice ^In continuare vom face ipoteze asupra parametrilor unor populat˘ii,

else

disp(’Ipoteza H0 se respinge’)

end;

z=-5:0.1:5;

fz=normpdf(z,0,1);

plot(z,fz,’m’);

xlabel(’z’); ylabel(’densitatea de repartitie normala’);

patch([z(z<=-za),-za],[fz(z<=-za),0],’b’);

Rulınd programul, obtinem σ = 5.92, z = −1.51, zα = 1.64 si, deci, ipoteza nula seconfirma. Programul afiseaza si densitatea de repartitie normala si intervalul de respingerea ipotezei nule.

−5 −4 −3 −2 −1 0 1 2 3 4 50

0.05

0.1

0.15

0.2

0.25

0.3

0.35

0.4

z

dens

itate

a de

rep

artit

ie n

orm

ala

Deoarece Z = −1.51186 > z1 = −1.64485 rezulta ca nu avem motive sa respingemipoteza nula.

13.1.3 Test asupra dispersiei unei populatii distribuite normal

Sa presupunem o selectie X1, X2, . . . , Xn dintr-o populatie repartizata normal cu media msi dispersia σ2.

Pentru a testa ipotezaH0 : σ2 = σ2

0

H1 : σ2 6= σ20

se foloseste statistica χ20 =

(n− 1)s2

σ20

∈ χ2 (n− 1).

Se calculeaza χ20. Pentru α ∈ (0, 1) dat, se determina χ2

1−α/2,n−1, χ2α/2,n−1 astfel ıncat

P

((n− 1)s2

σ2≤ χ2

1−α/2,n−1

)=α

2si P

((n− 1)s2

σ2≥ χ2

α/2,n−1

)=α

2.

De aici rezulta ca nu avem motive sa acceptam ipoteza H0 daca χ20 > χ2

α/2,n−1 sau χ20 <

χ21−α/2,n−1. Regiunea critica ın cazule testului bilateral este prezentata ın figura urmatoare.

10

Page 11: Curs 13 Testarea ipotezelor statisticemath.etc.tuiasi.ro/rstrugariu/cursuri/SPD2018/c13.pdfTestarea ipotezelor statistice ^In continuare vom face ipoteze asupra parametrilor unor populat˘ii,

Aceeasi statistica este folosita pentru testulH0 : σ2 = σ2

0;H1 : σ2 > σ2

0.Nu avem motive sa acceptam ipoteza H0 daca χ2

0 > χ2α,n−1

Pentru testulH0 : σ2 = σ2

0;H1 : σ2 < σ2

0

se foloseste aceeasi statistica. Nu avem motive sa acceptam ipoteza H0 daca χ20 < χ2

1−α,n−1.Regiunea critica este prezentata ın figura urmatoare.

11

Page 12: Curs 13 Testarea ipotezelor statisticemath.etc.tuiasi.ro/rstrugariu/cursuri/SPD2018/c13.pdfTestarea ipotezelor statistice ^In continuare vom face ipoteze asupra parametrilor unor populat˘ii,

Exemplul 13.1.8 O sectie de vopsitorie utilizeaza o mare cantitate de titan (ca pigmentalb). Conform standardelor, se masoara tonul de alb a acestui pigment utilizand o scala0− 30, unde nivelul 30 ınseamna alb perfect. Recent sectia si-a schimbat furnizorul si noulfurnizor afirma ca dioxidul de titan livrat are nivelul mediu 25, cu o dispersie de 0.4. Ceidin sectia de vopsitorie se ındoiesc de aceasta mica dispersie si planifica un experiment pe 10esantioane, cerand testarea ipotezei la nivel de dispersie, cu nivelul de semnificatie α = 0.05.

Rezolvare.Pasul 1 . Parametru care trebuie testat este dispersia, σ2.Pasul 2. Se fixeaza ipoteza nulaH0 : σ2 = 0.4.

Pasul 3. Se fixeaza ipoteza alternativaH1 : σ2 6= 0.4.

Pasul 4. Nivelul de semnificatie este α = 0.05.Pasul 5. Se face selectia. Presupunem ca ın cele 10 esantioane, tonul de alb masurat este:

24, 25, 27, 25, 26, 26, 24, 25, 26, 25 deci

X = 25.3, s2 = 0.9.

Pasul 6. Statistica folosita este

χ20 =

(n− 1)s2

σ20

∈ χ2 (n− 1) .

Se stabileste regiunea critica. Se determina χ20.975,9 si χ2

0.025,9:

P(χ20 ≤ χ2

0.975,9

)= 0.025⇒ χ2

0.975,9 = 2.70039 si

P(χ20 ≤ χ2

0.025,9

)= 0.975⇒ χ2

0.025,9 = 19.0228.

Fiind un test bilateral, H0 se respinge daca χ2 > χ2α/2,n−1 sau χ2 < χ2

1−α/2,n−1.Pasul 7. Se fac calculele necesare, se ınlocuiesc ın testul statistic si se calculeaza valoarea.

Atunci

χ20 =

(n− 1)s2

σ2=

9 · 0.90.4

= 20.25.

Pasul 8. Se stabileste daca ipoteza H0 se accepta sau nu.

12

Page 13: Curs 13 Testarea ipotezelor statisticemath.etc.tuiasi.ro/rstrugariu/cursuri/SPD2018/c13.pdfTestarea ipotezelor statistice ^In continuare vom face ipoteze asupra parametrilor unor populat˘ii,

Deoarece χ20 = 20.25 > χ2

0.975,9 = 19.0228, se respinge H0.

Observam ca intervalul de ıncredere de 99.5% pentru dispersie este[(n− 1)s2

χ21−α/2,n−1

,(n− 1)s2

χ2α/2,n−1

]=

[9 · 0.9

19.0228,

9 · 0.92.70039

]= [0.4258; 2.9996] ,

iar 0.4 nu intra ın acest interval. ♦

Ipot. H0 Testul statistic

Ipot.

altern.

H1

Regiunea critica

pentru respingerea

lui H0

σ2< σ20 χ2

0 < χ21−α,n−1

σ2= σ20 χ2

0 =(n− 1)s2

σ20

σ2> σ20 χ2

0 > χ2α,n−1

σ2 6= σ20

χ20 < χ2

1−α/2,n−1 sau

χ20 > χ2

α/2,n−1

13.1.4 Test asupra proportiei unei populatii

In probleme de inginerie apar v. a. care urmeaza o distribuitie binomiala. De exemplu, stu-diem ce procent de aparate defecte sunt produse de o anumita fabrica. Este logic sa modelamacest proces cu o distributie binomiala cu parametrul p care reprezinta probabilitatea ca unaparat sa nu fie acceptat. Multe decizii din inginerie se bazeaza pe teste asupra parametruluip.

Se considera ipotezele asupra lui p:H0 : p = p0,H1 : p 6= p0.

Se considera, de obicei, un test bazat pe aproximarea repartitiei binomiale cu o repartitienormala. Testul furnizeaza rezultate acceptabile atat timp cat p nu este aproape de 0 sau1 si daca volumul selectiei este relativ mare. Fie X numarul observatiilor dintr-un esantionde dimensiune n care apartin clasei careia ıi este asociata probabilitatea p. Atunci, dacaipoteza H0 : p = p0 este adevarata, avem X ∈ N [np0, np0(1− p0)], aproximativ. Pentruacest test este folosita statistica (conform rezultatelor de la intervale de ıncredere)

Z0 =X − np0√np0(1− p0)

∈ N [0, 1] .

Ipoteza H0 va fi respinsa daca Z0 < −zα2

sau Z0 > zα2. Observam ca distributia normala

standard este cea utilizata ın acest test.

Ipot. H0 Testul statisticIpot. altern.

H1

Regiunea critica

pentru respingerea

lui H0

p < p0 Z0 < −zα2

p = p0 Z0=X − np0√np0(1− p0)

p > p0 Z0 > zα2

p 6= p0 Z0 > zα2

sau Z0 < −zα2

Exemplul 13.1.9 O firma produce aparate de comanda utilizate ın industria automobi-listica. Utilizatorul impune conditia ca procentul de aparate defecte sa nu depaseasca 5%.

13

Page 14: Curs 13 Testarea ipotezelor statisticemath.etc.tuiasi.ro/rstrugariu/cursuri/SPD2018/c13.pdfTestarea ipotezelor statistice ^In continuare vom face ipoteze asupra parametrilor unor populat˘ii,

Producatorul considera ca acest procent este mai mic. Se utilizeaza un test statistic ın carese considera pragul de semnificatie α = 0.05, se alege un esantion de 200 de aparate si seconstata ca 4 dintre ele au defect. Poate demonstra producatorul ca are dreptate?

Rezolvare. Prezentam pasii ın testarea ipotezei statistice.Pasul 1. Parametrul testat este procentul de aparate defecte p.Pasul 2. Se formuleaza ipoteza nula H0 : p = 0.05.Pasul 3. Se formuleaza ipoteza alternativa H1 : p < 0.05.Pasul 4. α = 0.05.Pasul 5. Se efectueaza selectia esantionului de volum n = 200 si se stabileste ca procentul

de aparate defecte ın esantion este p = 4200

= 0.02.

Pasul 6. Se considera statistica Z0 =p− p0√p0(1−p0)

n

.

Se stabileste regiunea critica. Φ(−z0.05) = 0.05⇒−z0.05 = −1.64485. Rezulta regiuneacritica (−∞,−1.64485).

Pasul 7. Se fac calculele necesare, se ınlocuiesc ın testul statistic si se calculeaza valoarea.

Se calculeaza Z0 =0.02− 0.05√

0.05(1−0.05)200

= −1.9467.

Pasul 8. Se stabileste daca ipoteza H0 se accepta sau nu.Z0 = −1.9467 < −1.64485, ipoteza H0 se respinge. Deci producatorul are dreptate.

Determinam eroarea de tip IISe poate obtine o aproximare a erorii de tip II, β-eroare pentru testul anterior. Presu-

punem ca p este valoarea exacta a proportiei. Eroarea de tip II pentru ipoteza alternativaH1 : p 6= p0 este

β = Φ

p0 − p+ zα2

√p0(1−p0)

n√p(1−p)n

− Φ

p0 − p− zα2√

p0(1−p0)n√

p(1−p)n

.

Daca H1 : p < p0

β = 1− Φ

p0 − p− zα2√

p0(1−p0)n√

p(1−p)n

.

Daca H1 : p > p0

β = Φ

p0 − p+ zα2

√p0(1−p0)

n√p(1−p)n

.

Acesasta ecuatie poate fi folosita pentru a aproxima dimensiunea esantionului n dacadorim sa aplicam un test cu nivelul de ıncredere 1− α si riscul specificat β.

In cazul testului bilateral

n =

[zα

2

√p0(1− p0) + zβ

2

√p(1− p)

p− p0

]2.

Pentru testul unilateral

n =

[zα√p0(1− p0) + zβ

√p(1− p)

p− p0

]2.

14

Page 15: Curs 13 Testarea ipotezelor statisticemath.etc.tuiasi.ro/rstrugariu/cursuri/SPD2018/c13.pdfTestarea ipotezelor statistice ^In continuare vom face ipoteze asupra parametrilor unor populat˘ii,

In cazul Exemplului 13.1.9 eroarea de tip II este, daca consideram ca valoarea corecta alui p = 0.03,

β = 1− Φ

(0.05−0.03−1.64485

√0.05(1−0.05)

200√0.03(1−0.03)

200

)=

= 1− Φ (−0.44343) = 1− 0.328727 = 0.67127.

Eroarea de tip II este aproximativ 0.7, destul de mare iar puterea testului este 0.3, oputere mica.

Daca s-ar dori o eroare de tip II de 0.1, valoarea corecta ar fi p = 0.3 cu α = 0.05,dimensiunea esantionului ar trebui sa fie cel putin

n =

[1.645√

0.05(1−0.05)+1.28155√

0.03(1−0.03)0.03−0.05

]2' 832.

13.1.5 Test asupra diferentei mediilor a doua caracteristici distri-buite normal

Aceste teste vor folosi statisticele studiate ın capitolul Intervale de ıncredere pentru caracte-risticile a doua populatii care urmeaza o distributie normala, ın functie de cele doua cazuri,dispersia cunoscuta sau necunoscuta. Statisticile folosite sunt cele prezentate la constructiaintervalelor de ıncredere pentru diferenta mediilor a doua populatii care urmeaza o distributienormala cu dispersiile cunoscute, respectiv necunoscute.

Urmeaza un exemplu de aplicare a testului privind egalitatea mediilor a doua esantioane,dispersie necunoscuta.

Exemplul 13.1.10 Notele ınregistrate de studentii a doua grupe la un test suntI: 7, 5, 4, 8, 10, 9, 3, 8, 6, 5; II: 9, 7, 10, 10, 8, 4, 5, 4, 6, 9.Sa se testeze daca cunostintele studentilor celor doua grupe difera semnificativ sau nu,

stiind distrubutia caractetistica studiata urmeaza o distributie normala.

Rezolvare. Se va efectua un test Student pentru verificarea egalitatii mediilor a douaesantioane, dispersiile populatiilor fiind necunoscute.

Pasul 1. Se testeaza egalitatea mediilor notelor obtinute de studentii a doua grupe, m1

si m2.Pasul 2. Se formuleaza ipoteza nula H0 : m1 = m2.Pasul 3. Se formuleaza ipoteza alternativa H1 : m1 6= m2.Pasul 4. Consideram nivelul de semnificatie α = 0.05.Pasul 5. Se efectueaza selectia, se calculeaza mediile celor doua esantioane, dispersiile de

selectie.Pasul 6. Se considera statistica

T =m1 −m2√

(n1 − 1) s21 + (n2 − 1) s22n1 + n2 − 2

√1

n1

+1

n2

∈ t(n1 + n2 − 2).

unde s21 si s22 sınt dispersiile de selectie ale celor doua esantioane, iar n1 si n2 sınt volumeleesantioanelor. Variabila aleatoare t are repartitie Student cu n1 + n2 − 2 grade de libertate.

Se stabileste regiunea critica.Pasul 7. Se fac calculele necesare, se ınlocuiesc ın testul statistic si se calculeaza valoarea

critica.

15

Page 16: Curs 13 Testarea ipotezelor statisticemath.etc.tuiasi.ro/rstrugariu/cursuri/SPD2018/c13.pdfTestarea ipotezelor statistice ^In continuare vom face ipoteze asupra parametrilor unor populat˘ii,

Pasul 8. Se stabileste daca ipoteza H0 se accepta sau nu.Ipoteza nula H0 se va accepta daca |T | ≤ tα/2, unde tα/2 se determina din conditia

P(|T | ≤ tα/2

)= 1 − α si va fi respinsa daca |T | > tα/2. Urmatorul program Matlab va

verifica ipoteza egalitatii celor doua medii:

% testare bilaterala a diferentei mediilor a doua esantioane

% ipoteza nula: m1=m2

% ipoteza alternativa: m1~=m2

clc;

clear;

format compact;

x1=[7 5 4 8 10 9 3 8 6 5]

x2=[9 7 10 10 8 4 5 4 6 9]

alfa=0.05

n1=length(x1);

n2=length(x2);

ms1=sum(x1)/n1

ms2=sum(x2)/n2

s1=sqrt(1/(n1-1)*sum((x1-ms1).^2))

s2=sqrt(1/(n2-1)*sum((x2-ms2).^2))

s=sqrt(((n1-1)*s1^2+(n2-1)*s2^2)/(n1+n2-2))

T=(ms1-ms2)/s/sqrt(1/n1+1/n2)

ta=tinv(1-alfa/2,n1+n2-2)

if abs(t)<=tadisp(’Ipoteza H0 se accepta’)

else

disp(’Ipoteza H0 se respinge’)

end;

Ruland programul, obtinem

x1 = 6.5; s21 = 2.27; x2 = 7.2;

s22 = 2.35; T = −0.677; tα/2 = 2.1.

Cum |T | < tα/2, rezulta ca nu avem motive sa respingem ipoteza nula H0, adica la nivelulde semnificatie dat cunostintele studentilor celor doua grupe nu difera semnificativ.

Concluzia: nu avem motive sa respingem ipoteza nula H0, adica la nivelul de semnificatiedat cunostintele studentilor celor doua grupe nu difera semnificativ.

Exemplul 13.1.11 Un producator este interesat ın reducerea timpului de uscare a uneivopsele. In acest caz se stie ca timpul de uscare urmeaza o distributie normala. Sunt testatedoua formule: formula 1 este cea standard, formula 2 contine un ingredient ın vopsea carereduce timpul de uscare. Din experienta se stie ca timpul de uscare urmeaza o repartitie nor-mala cu abaterea standard de 8 minute si ca ea nu este afectata de adaugarea ingredientului.10 produse sunt vopsite utilizand formula 1 si 10 utilizand formula 2. Alegerea produselorpentru vopsire se face aleator. Se obtin datele

x1 = {120, 132, 111, 121, 119, 123, 120, 120, 119, 125}x2 = {110, 111, 120, 113, 112, 103, 121, 115, 102, 113}.Ce concluzie se poate trage despre cele doua formule folosind α = 0.05?

Se va efectua un test normal pentru verificarea egalitatii mediilor a doua esantioane,dispersiile populatiilor fiind cunoscute si egale.

16

Page 17: Curs 13 Testarea ipotezelor statisticemath.etc.tuiasi.ro/rstrugariu/cursuri/SPD2018/c13.pdfTestarea ipotezelor statistice ^In continuare vom face ipoteze asupra parametrilor unor populat˘ii,

Ipoteza nula: H0 : m1 = m2 (media timpilor de uscare nu difera semnificativ, esteaproape zero)

Ipoteza alternativa: H1 : m1 > m2 media timpului de uscare a formulei 1 este mai maredecit a formulei 2.

Va rezulta ca nu sunt motive sa se accepte ipoteza nula, deci timpul de uscare prin adoua formula este mai mic decat cel prin prima formula.

13.1.6 Test asupra raportului dispersiilor a doua populatii

Vom aplica test asupra raportului dispersiilor a doua populatii care urmeaza o distributienormala si ale caror medii si dispersii sunt necunoscute.

Reluam un exemplu dintr-un curs anterior.

Exemplul 13.1.12 Intr-un atelier se polizeaza o anumita suprafata metalica. Doua proce-dee de polizare sunt folosite si ambele procedee produc portiuni neregulate. Coordonatorulvrea sa aplice acel procedeu care realizeaza cea mai mica variatie a portiunilor neregulate.A fost ales un esantion de n1 = 11 portiuni de suprafata polizate cu primul procedeu si s-auobtinut rezultatele{22.0, 13.1, 22.7, 12.9, 12.05, 12.5, 12.55, 20.1, 24.7, 22.7, 14.5}.A rezultat o dispersie de selectie S2

1 = 26.0992, deci o deviere standard de S1 = 5.10874microinches si un esantion de n2 = 16 portiuni de suprafata polizate cu al doilea procedeusi s-au obtinut rezultatele{22.0, 13.2, 13.1, 22.1, 12.9, 12.4, 12.05, 12.1, 12.9, 14.55, 23.1, 23.3, 26.5, 24.158, 13.4,

14.5, 14.5, 19.7, 15.6, 12.6, 16.8, 15}A rezultat o dispersie de selectie S2

2 = 22.0243, deci o deviere standard de S2 = 4.69301microinches. Dorim sa verificam ipoteza ca dispersiile celor doua procedee sunt egale cu unnivel de ıncredere de 90%.

Ipoteza nula: ipoteza nula H0 : σ1 = σ2.Ipoteza alternativa: H1 : σ1 6= σ2.Va rezulta ca nu avem motive sa respingem ipoteza nula.

13.1.7 Test asupra diferentei proportiilor a doua populatii

Presupunem ca avem doua esantioane de dimensiuni n1 si respectiv n2 extrase din douapopulatii X1 si X2 reprezentand numarul de observatii care apartin unei clase care se stu-diaza. Mai mult, presupunem aproximarea distributiei binomiale cu distributia normalaeste aplicabila (populatia sa aiba macar 10 elemente), astfel ıncat estimatorii proportiilorP1 = X1/n1 si P2 = X2/n2 urmeaza o distributie normala. Suntem interesati ın a testaipotezele

H0 : p1 = p2,H1 : p1 6= p2.

Statistica folosita este

Z =P1 − P2 − (p1 − p2)√

p1(1−p1)n1

+ p2(1−p2)n2

.

Ea urmeaza o distributie aproximativ standard normala. Daca ipoteza nula este adevarata,folosind faptul ca p1 = p2 = p, atunci

Z =P1 − P2√

p (1− p)(

1n1

+ 1n2

) ∈ N [0, 1] .

17

Page 18: Curs 13 Testarea ipotezelor statisticemath.etc.tuiasi.ro/rstrugariu/cursuri/SPD2018/c13.pdfTestarea ipotezelor statistice ^In continuare vom face ipoteze asupra parametrilor unor populat˘ii,

Estimatorul parametrului p este P =X1 +X2

n1 + n2

.

Statistica folosita pentru testul avand ipoteza H0 : p1 = p2 va fi

Z0 =P1 − P2√

P(

1− P)(

1n1

+ 1n2

) .Ipoteza alternativa Regiunea criticaH1 : p1 6= p2

(−∞,−zα

2

)∪(zα

2,∞)

H1 : p1 > p2 (zα,∞)H1 : p1 < p2 (−∞,−zα)

Exemplul 13.1.13 Un cercetaror este interesat daca persoanele care au facut psihologiasunt capabile sa rezolve o problema care implica o anumita judecata. Cercetatorul esteinteresat ın a estima diferenta dintre proportiile persoanelor din cele doua populatii care potrezolva problema. Prima populatie are 100 membrii din care 65 au rezolvat problema, iar adoua populatie are 110 din care doar 45 au rezolvat problema. Sa se analizeze ipotezele:

a) cele doua proportii sunt egale,b) prima proportie este mai mare decat a doua.

Rezolvare. a) 1. Parametrii care intereseaza sunt p1 si p2.2. Ipoteza nula H0 : p1 = p2,3. Ipoteza alternativa H1 : p1 6= p2.4. Alegem α = 0.05

5. Testul statistic utilizat Z0 =p1 − p2√

p (1− p)(

1n1

+ 1n2

) , unde p1 = 0.65, p2 = 45110

=

0.409 09, n1 = 100, n2 = 110 si

p =X1

n1

+X2

n2

=65 + 45

100 + 110= 0.523 81.

6. Regiunea critica: deoarece z0.025 = 1.96 rezulta ca ipoteza nula este respinsa dacaZ0 ∈ (−∞,−1.96) ∪ (1.96,∞) .

7: Z0 =0.65− 0.409 09√

0.523 81 (1− 0.523 81)(

1100

+ 1110

) = 3.4911.

8. Concluzia: deoarece Z0 = 3.4911 > 1.96, rezulta ca ipoteza nula este respinsa, deciproportiile nu sunt egale.

b) 1. Parametrii care intereseaza sunt p1 si p2.2. Ipoteza nula H0 : p1 = p2,3. Ipoteza alternativa H1 : p1 > p2.4. Alegem α = 0.05

5. Testul statistic utilizat Z0 =p1 − p2√

p (1− p)(

1n1

+ 1n2

) , unde p1 = 0.65, p2 = 45110

=

0.409 09, n1 = 100, n2 = 110 si

p =X1

n1

+X2

n2

=65 + 45

100 + 110= 0.523 81.

18

Page 19: Curs 13 Testarea ipotezelor statisticemath.etc.tuiasi.ro/rstrugariu/cursuri/SPD2018/c13.pdfTestarea ipotezelor statistice ^In continuare vom face ipoteze asupra parametrilor unor populat˘ii,

6. Regiunea critica: deoarece z0.05 = 1.65, rezulta ca ipoteza nula este respinsa dacaZ0 ∈ (1.65,∞).

7: Z0 =0.65− 0.409 09√

0.523 81 (1− 0.523 81)(

1100

+ 1110

) = 3.4911

8. Concluzia: deoarece Z0 = 3.4911 > 1.65 rezulta ca ipoteza nula este respinsa, deciproportiile nu sunt egale iar prima proportie este mai mare decat a doua.

13.2 Testul lui Pearson (χ2)

Este folosit ca indicator al concordantei unei repartitii empirice cu una teoretica. Este unuldin cele mai importante teste statistice.

Se considera o selectie de volum n, x′1, x′2, . . . , x

′n.

Ipoteza H0: selectia facuta provine dintr-o populatie cu functia de repartitie F completspecificata (de exemplu normala standard). Ipoteza alternativa H1: selectia nu provine dinpopulatia definita de F .

Se considera o selectie de volum n, x′1, x′2, . . . , x

′n. Datele se ımpart ın r clase, x1 < x2 <

· · · < xr. Obtinem intervalele [x1, x2) , [x2, x3) , . . . , [xr,∞) . Fie fj numarul de observatiidin intervalul j si pj probabilitatea teoretica ca v. a. din care provine selectia sa ia valori ınintervalul j, daca admitem ipoteza H0. Atunci frecventa teoretica este npj.

Statistica utilizata ın testarea acestei ipoteze este:

χ2 =r∑j=1

(fj − npj)2

npj(13.1)

care urmeaza legea χ2 cu r − 1.

13.2.1 Algoritmul testului lui Pearson

Pasul 1. Alegerea lui r: Mann si Wald au propus formula

r = 4

(2(n− 1)2

C2

) 15

unde C este cuantila de ordin α a repartitiei N(0, 1).Pasul 2. Selectia de volum n se ımparte ın r intervale. Se calculeaza fk numarul de

observatii ın intervalul k iar pk probabilitatea teoretica ca v. a. ın studiu sa ia valori ınintervalul k ın ipoteza ca H0 este adevarata. Pentru aceasta se estimeaza media (sau altiparametri) si se genereaza acelasi numar de date repartizate conform legii teoretice alese.Pentru o buna aplicare a testului trebuie ca npk ≥ 5 pentru k = 1, r.

Pasul 3. Se calculeaza

χ2 =r∑j=1

(fj − npj)2

npj.

Pasul 4. Se stabileste nivelul de semnificatie 1− α, se calculeaza χ2α,r−1.

Ipoteza H0 se respinge daca χ2 > χ2α,r−1.

Daca χ2 < χ2α,r−1 nu avem motive sa respingem ipoteza H0.

Observatia 13.2.1 In practica se poate da o expresie mai usor de retinut pentru (13.1) sianume

19

Page 20: Curs 13 Testarea ipotezelor statisticemath.etc.tuiasi.ro/rstrugariu/cursuri/SPD2018/c13.pdfTestarea ipotezelor statistice ^In continuare vom face ipoteze asupra parametrilor unor populat˘ii,

χ2 =∑(O − E)2

E,

unde O sunt datele observate si E cele estimate (pentru care trebuie decisa buna potrivire).

Observatia 13.2.2 Daca se estimeaza un numar de s parametri, atunci χ2 urmeaza orepartitie χ2 cu r − s− 1 grade de libertate.

Exemplul 13.2.3 La o ora de varf s-au sondat canalele de televiziune TVR1, PROTV,TVR2, Antena 1, Realitatea, care au avut la 23 martie audientele 34%, 8%, 12%, 34%, 12%respectiv. La un sondaj printre 500 telespectatori dupa 6 luni s-au constatat rezultateleurmatoare: 159 spectatori pentru TVR1, 49, 62, 161, 69 pentru celelalte. Apare o diferentasemnificativa?

Rezolvare. In acest exemplu avem r = 5, X = audienta, n = 500, p1 = 0.34, p2 = 0.08,p3 = 0.12, p4 = 0.34, p5 = 0.12.

Numarul estimat de telespectatori la 23 martie este respectiv

np1 = 500 · 0.34 = 170, np2 = 500 · 0.08 = 40, np3 = 500 · 0.12 = 60,

np4 = 500 · 0.34 = 170, np5 = 500 · 0.12 = 60.

Calculam

χ2 = (159−170)2170

+ (49−40)240

+ (62−60)260

+ (161−170)2170

+ (69−60)260

= 4.629 9.

Datele pot fi organizate conform urmatorului tabel

Grupa 1 2 3 4 5fk 159 49 62 161 69pk 0.34 0.08 0.12 0.34 0.12npk 170 40 60 170 60

fk − npk −11 9 2 −9 9

(fk − npk)2 121 81 4 81 81

(fk − npk)2

npk0.71176 2.025 6.6667× 10−2 0.47647 1.35

Alegem α = 0.1, r − 1 = 4, atunci χ20.1(4) = 7.779. Deoarece χ2 < χ2

0.1(4) (4.629 9 <7.7794) rezulta ca nu avem argumente suficiente pentru a respinge ipoteza H0.

Daca luam α = 0.5 atunci χ20.5(4) = 3.36 si H0 se respinge cu o eroare de 50%.

Secventa de program Mathematica care realizeaza aceasta testare este data mai jos:

Potrivire cu repartitia binomiala

Exemplul 13.2.4 O reclama a fost difuzata ın mass-media. Dintr-un esalon de 800 depersoane au fost 434 care nu au auzit (vazut) reclama; 329 au auzit o data; 35 de doua ori si2 de 3 ori (nimeni mai mult de trei ori). Ne propunem sa verificam la nivel de semnificatie95% daca numarul de dati cand o persoana a aflat de acea reclama urmeaza o repartitiebinomiala cu parametru p = 0.2.

Rezolvare. Pasii care trebuie urmati ın testarea ipotezei statisticePasul 1. Variabila care intereseaza: X numara de cate ori o persoana a auzit reclama.Pasul 2. H0 : variabila X urmeaza o distributie binomiala.Pasul 3. H1 : variabila X nu urmeaza o distributie binomiala.

20

Page 21: Curs 13 Testarea ipotezelor statisticemath.etc.tuiasi.ro/rstrugariu/cursuri/SPD2018/c13.pdfTestarea ipotezelor statistice ^In continuare vom face ipoteze asupra parametrilor unor populat˘ii,

Pasul 4. α = 0.05.Pasul 5. Testul statistic este

χ2 =r∑

k=1

(fk − npk)2

npk

Pasul 6. Ipoteza H0 este respinsa daca χ2 > χ20.05(3) = 7.81473. Regiunea critica este

(7.81473,∞).Pasul 7. Calculele: r = 4, k = 1, 2, 3, 4 si aceste valori sunt luate de X cu probabilitatile

pk = Ck−13 pk−1(1− p)4−k, deci

p1 = C03(0.2)0(0.8)3 = 0.512, p2 = C1

3(0.2)1(0.8)2 = 3 · 0.128 = 0.384,

p3 = 3 · (0.2)2 (0.8)1 = 0.096, p4 = (0.2)3 (0.8)0 = 0.008

n = 800,

Grupa 0 1 2 3fk 434 329 35 2pk 0.512 0.384 0.096 0.008npk 409.6 307.2 76.8 6.4

fk − npk 24.4 21.8 −41.8 −4.4

(fk − npk)2 595.36 475.24 1747.2 19.36

(fk − npk)2

npk7.864 1× 10−2 1.547 22.75 3.025

χ2 = 28.776, χ20.95(3) = 7.81473.

Pasul 8. 28.776 > 7.81473 rezulta ca respingem H0, deci datele observate nu urmeaza olege binomiala cu parametru p = 0.2.

In ipoteza ca variabila studiata ar urma, totusi, o repartitie binomiala, estimam parame-trul p cu metoda verosimilitatii maxime. Construim functia de verosimilitate maxima:

p1 = C03p

0(1− p)3, p2 = C13p

1(1− p)2, p3 = C23p

2(1− p)1, p4 = C33p

3,

L(x1, x2, x3, x4; p) = px11 px22 p

x33 p

x44

L(434, 329, 35, 2; p) = (1− p)3·4343p329(1− p)2·3293p2·35(1− p)35P 3·2 =

= 9p405(1− p)1995,lnL(434, 329, 35, 2; p) = ln 9 + 405 ln p+ 1995 ln(1− p),

∂ lnL(434, 329, 35, 2; θ)

∂p=

405

p− 1995

1− p,

405

p− 1995

1− p= 0, p =

27

160= 0.16875.

Potrivire cu repartitia Poisson

Exemplul 13.2.5 Vrem sa stabilim daca numarul defectiunilor unui circuit al unei impri-mante urmeaza o repartitie Poisson. Se studiaza comportatea acestui circuit pe un numarde 60 de imprimante si sunt consemnate numarul defectiunilor care au aparut.

Nr. defectiunilor Frecventa0 321 152 9≥3 4

21

Page 22: Curs 13 Testarea ipotezelor statisticemath.etc.tuiasi.ro/rstrugariu/cursuri/SPD2018/c13.pdfTestarea ipotezelor statistice ^In continuare vom face ipoteze asupra parametrilor unor populat˘ii,

Media distributiei Poisson presupuse este necunoscuta si trebuie estimata din dateleesantionului. Estimarea mediei numarului defectelor circuitului o facem printr-un estimatorpunctual al mediei, x = 32·0+15·1+9·2+4·3

60= 0.75. Din distributia Poisson cu parametrul

λ = 0.75 putem calcula probabilitatile teoretice pi, i = 1, 2, 3, 4,

p1 = P (X = 0) =e−0.75(0.75)0

0!= 0.472 367

p2 = P (X = 1) =e−0.75(0.75)1

1!= 0.354 275

p3 = P (X = 2) =e−0.75(0.75)2

2!= 0.132 853

p4 = P (X ≥ 3) = 1− (p1 + p2 + p3) = 0.0405054

Aplicam testul.Pasul 1. Variabila care intereseaza: X numarul de defecte care apar la un circuit.Pasul 2. H0 : variabila X urmeaza o distributie Poisson.Pasul 3. H1 : variabila X nu urmeaza o distributie Poisson.Pasul 4. α = 0.05Pasul 5. Testul statistic este

χ2 =r∑

k=1

(fk − npk)2

npk

Pasul 6. Determinam regiunea critica. χ2 urmeaza o distributie hi-patrat cu 2 gradede libertate. Sunt patru grade, ar trebui sa urmeze o distributie cu 3 grade de libertatedar, deoarece s-a estimat parametrul distributiei Poisson, numarul gradelor de libertate seconsidera cu o unitate mai mic, conform Observatiei 13.2.2.

Frecventele observatef1 = 32;f2 = 15;f3 = 9;f4 = 4;Determinam regiunea critica:IpotezaH0 este respinsa daca χ2 > χ2

0.05(2) = 5.99146. Regiunea critica este (5.99146,∞).Pasul 7. Calculele:CHI = (n p1 - f1)ˆ2/(n p1) + (n p2 - f2)ˆ2/(n p2) + (n p3 - f3)ˆ2/(n p3) + (n p4 - f4)ˆ2/(n

p4)3.46021

Pasul 8. χ2 = 3.46021 < χ20.05(2) = 5.99146. Nu avem motive sa respingem ipoteza nula.

Potrivire cu repartitia uniforma

Exemplul 13.2.6 Un comerciant vrea sa vada daca un anumit produs se vinde la fel (uni-form) ın 5 dintre magazinele sale. Prin experiment constata ca ıntr-o saptamana s-au realizatvanzari ın mii RON de 43, 29, 52, 34, 48. Este aceasta informatie suficienta pentru a consideraca exista mari diferente ıntre cele 5 magazine?

Pasul 1. Variabila care intereseaza: X veniturile realizate prin vanzari ın 5 magazine, ındecursul unei saptamani.

Pasul 2. Ipoteza H0: variabila X urmeaza o distributie uniforma. Probabilitatea de acumpara de la unul din cele cinci magazine este aceeasi p1 = p2 = · · · = p5 = 0.2, cu altecuvinte vanzarile sunt aceleasi.

22

Page 23: Curs 13 Testarea ipotezelor statisticemath.etc.tuiasi.ro/rstrugariu/cursuri/SPD2018/c13.pdfTestarea ipotezelor statistice ^In continuare vom face ipoteze asupra parametrilor unor populat˘ii,

Observatia 13.2.7 In cazul unei repartitii uniforme a vanzarilor pe cele 5 magazine, ele artrebui sa vanda fiecare ın valoare de 206 · 0.2 = 41.2 mii RON. Acestea sunt datele estimatedaca ipoteza H0 ar fi adevarata. Datele date ın enunt sunt cele observate.

Pasul 3. Ipoteza H1: variabila X nu urmeaza o distributie uniforma.Pasul 4. α = 0.1Pasul 5. Testul statistic este

χ2 =r∑

k=1

(fk − npk)2

npk.

Pasul 6. Determinam regiunea critica. χ2 urmeaza o distributie hi-patrat cu 4 grade delibertate.

p1 = 0.2; p2 = 0.2; p3 = 0.2; p4 = 0.2; p5 = 0.2;f1 = 43; f2 = 29; f3 = 52; f4 = 34; f5 = 48;n = f1 + f2 + f3 + f4 + f5206

Regiunea critica este (7.77944,∞).Deoarece am estimat probabilitatile teoretice p1 = p2 = · · · = p5 = 0.2 care depind de

volumul selectiei (numarul magazinelor cercetate) specialistii recomanda sa se considere caau ramas 5− 1− 1 = 3 grade de libertate. In acest caz regiunea critica este (6.25139,∞).

Pasul 7. Calculele:CHI = (n p1 - f1)ˆ2/(n p1) + (n p2 - f2)ˆ2/(n p2) + (n p3 - f3)ˆ2/(n p3) + (n p4 - f4)ˆ2/(n

p4) + (n p5 - f5)ˆ2/(n p5)8.90291

Pasul 8. Pentru r = 5 la un nivel de semnificatie de 10% χ20.05(4) = 7.77944 > 8.902 91,

deci nu avem motive sa respingem ipoteza H0. La fel si pentru cazul a trei grade de libertate.Observam ca daca consideram α = 0.05, atunci avem doua situatii (3 sau 4 grade de

libertate), pentru care regiunile critice sunt (9.48773,∞) si respectiv (7.81473,∞).Observam ca ıntre cele doua situatii interpretarile sunt diferite si atunci concluzia se

trage ın functie de conjunctura. Pentru r = 5 la un nivel de semnificatie de 5% χ20.05(4) =

9.48773 > 8.902 91, deci nu avem motive sa respingem ipoteza H0. In cazul ın care seconsidera 5− 1− 1 = 3 grade de libertate, χ2

0.05(3) = 7.81473 < 8.902 9 si ın acest caz putemzice ca sunt diferente mari ıntre magazine.

In acest caz putem zice ca sunt diferente mari ıntre magazine.

Potrivire cu repartitia normala

Exemplul 13.2.8 Presupunem ca timpul mediu de asamblare (ın minute) pentru un esantionde 300 de aparate electronice a fost m = 84, cu abaterea medie patratica σ = 3. S-a observatca aceste 300 de aparate au fost repartizate astfel: pentru 15 aparate au fost necesare sub78 de minute, pentru 39 ıntre 78-81 minute, pentru 96 ıntre 81-84 minute, pentru 87 ıntre84-87, pentru 48 aparate ıntre 87-90 minute si pentru 15 aparate peste 90 minute. Sa setesteze la nivel de semnificatie de 1% daca datele anterioare sunt repartizate normal.

Pasul 1. Variabila care intereseaza: X timpul mediu de asamblare a unor aparate elec-tronice.

Pasul 2. H0 : variabila X urmeaza o distributie normala.Pasul 3. H1 : variabila X nu urmeaza o distributie normala.Pasul 4. α = 0.1Pasul 5. Testul statistic este

23

Page 24: Curs 13 Testarea ipotezelor statisticemath.etc.tuiasi.ro/rstrugariu/cursuri/SPD2018/c13.pdfTestarea ipotezelor statistice ^In continuare vom face ipoteze asupra parametrilor unor populat˘ii,

χ2 =r∑

k=1

(fk − npk)2

npk.

Pasul 6. Determinam regiunea critica. Datele sunt ımpartite ın 6 grupe. S-a estimatmedia, m = 84 si abaterea medie patratica, σ = 3. Testul statistic urmeaza o distributieχ20.01(3).m = 84;σ= 3;f1 = 15;f2 = 39;f3 = 96;f4 = 87;f5 = 48;f6 = 15;n = f1 + f2 + f3 + f4 + f5 + f6300

Regiunea critica este: (11.3449,∞).Pasul 7. Calculele:Avem r = 6 grupe; daca X = timpul de asamblare si daca X ∈

N(84, 9), atunci

p1 = P (X < 78) = Φ

(78− 84

3

)= Φ (−2) = 1− Φ(2) =

= 1− 0.977 25 = 0.022 75

p2 = P (78 ≤ X < 81) = Φ

(81− 84

3

)− Φ

(78− 84

3

)=

= Φ (−1)− Φ (−2) = 0.977 25− 0.841 34 = 0.135 91

p3 = P (81 ≤ X < 84) = Φ

(84− 84

3

)− Φ

(81− 84

3

)=

= Φ (0)− Φ (−1) = 0.841 34− 0.5 = 0.341 34

p4 = P (84 ≤ X < 87) = Φ

(87− 84

3

)− Φ

(84− 84

3

)=

= Φ (1)− Φ (0) = 0.841 34− 0.5 = 0.341 34

p5 = P (87 ≤ X < 90) = Φ

(90− 84

3

)− Φ

(87− 84

3

)=

= Φ (2)− Φ (1) = 0.977 25− 0.841 34 = 0.135 91

p6 = P (90 ≤ X) = 1− Φ

(90− 84

3

)= 1− Φ (2) =

= 1− 0.977 25 = 0.022 75

n = 300χ2 = 23.6597Pasul 8. χ2 =23.6597 > χ2

0.01(3)=11.3449 rezulta ca respingem ipoteza H0.

Potrivire cu repartitia exponentiala

In general nu avem o densitate de probabilitate pentru X, ci numai un model statisticpe care ıl alegem din modelele cunoscute. Consideram un esantion (X1, X2, . . . , Xk) ∈

24

Page 25: Curs 13 Testarea ipotezelor statisticemath.etc.tuiasi.ro/rstrugariu/cursuri/SPD2018/c13.pdfTestarea ipotezelor statistice ^In continuare vom face ipoteze asupra parametrilor unor populat˘ii,

Multinomial [n, p1, p2, . . . , pk]. In mod natural ne punem problema sa gasim un estimatorde verosimilitate maxima ın acest caz. Functia de verosimilitate maxima se ia de forma:

L(x1, x2, . . . , xk; p1, p2, . . . , pk) = (p1)x1 (p2)

x2 · · · (pk)xk .

Exemplul 13.2.9 Presupunem ca este testata durata de functionare a unui tip de becuri(masurata ın ore) pentru un esantion de 30 de becuri. S-a observat ca durata de functionarea 9 becuri este sub 1000 de ore, a 12 becuri ıntre 1000 si 2000 de ore, a 8 becuri ıntre 2000 si3000 de ore, iar a unui bec peste 3000 de ore. Sa se testeze la nivel de semnificatie de 0.1%daca datele prezentate sunt repartizate exponential.

Avem nevoie de o estimare a parametrului v. a. X care ia ca valori durata de functionare(masurata ın sute de ore) a becurilor, presupusa exponentiala X ∈ Exponential [θ]. Rea-

mintim ca pentru repartitia exponentiala F (x) =

{0 daca x ≤ 0

1− e−θx daca x > 0.

Datele se ımpart ın patru grupe, (0, 1], (1, 2], (2, 3], (3,∞).

p1 = P (0 ≤ X < 1) = F (1)− F (0) = 1− e−θ,p2 = P (1 ≤ X < 2) = F (2)− F (1) = e−θ − e−2θ,p3 = P (2 ≤ X < 3) = F (3)− F (2) = e−2θ − e−3θ,p4 = P (3 ≤ X) = 1− F (3) = e−3θ.

Pentru a calcula probabilitatile trebuie estimat parametrul θ. Folosim estimatorul de vero-similitate maxima. Functia de verosimilitate maxima este

L(x1, . . . , xn; θ) =(1− e−θ

)9 (e−θ − e−2θ

)12 (e−2θ − e−3θ

)8 (e−θ)1.

lnL(x1, . . . , xn; θ) = ln(1−e−θ

)9(e−θ−e−2θ

)12(e−2θ−e−3θ

)8(e−3θ

)1=

= 9 ln(1− e−θ) + 12 ln(e−θ − e−2θ) + 8 ln(e−2θ − e−3θ)− 3θ,

∂ lnL(x1, x2, . . . , xn; θ)

∂θ=

=9e−θ

1−e−θ+

12

e−θ−e−2θ(2e−2θ−e−θ

)+

8

e−2θ−e−3θ(3e−3θ−2e−2θ

)−3 =

=9e−θ

1− e−θ+

12

1− e−θ(2e−θ − 1

)+

8

1− e−θ(3e−θ − 2

)− 3 =

=1

e−θ − 1

(31− 60e−θ

),

1

e−θ − 1

(31− 60e−θ

)= 0⇒ θ = 0.66036,

∂ lnL(x1, x2, . . . , xn; θ)

∂θ= 0⇒ θ = 0.660 36,

∂2 lnL(x1, x2, . . . , xn; θ)

∂θ2=

= −57e−θ

1− e−θ− 9

e2(−θ)

(1− e−θ)2− 12

e−θ

(1− e−θ)2(2e−θ − 1

)−

− 8e−θ

(1− e−θ)2(3e−θ − 2

)= −29

e−θ

(1− e−θ)2< 0,

25

Page 26: Curs 13 Testarea ipotezelor statisticemath.etc.tuiasi.ro/rstrugariu/cursuri/SPD2018/c13.pdfTestarea ipotezelor statistice ^In continuare vom face ipoteze asupra parametrilor unor populat˘ii,

∂2 lnL(x1, x2, . . . , xn; θ)

∂θ2

∣∣∣∣θ=0.66036

=

= − 57e−0.66036

1−e−0.66036− 9e2(−0.66036)

(1−e−0.66036)2− 12e−0.66036

(1−e−0.66036)2(2e−0.66036−1

)−

− 8e−0.66036

(1− e−0.66036)2(3e−0.66036 − 2

)= −64.137.

θ = 0.660 36 este estimator de verosimilitate maxima.

Aplicam testul.Pasul 1. Variabila care intereseaza: X durata de functionare masurata ın sute de orea a

unui tip de becuri.Pasul 2. H0 : variabila X urmeaza o distributie exponentiala.Pasul 3. H1 : variabila X nu urmeaza o distributie exponentiala.Pasul 4. α = 0.001Pasul 5. Testul statistic este

χ2 =r∑

k=1

(fk − npk)2

npk.

Pasul 6. Determinam regiunea critica.Regiunea critica este (13.8155,∞).Pasul 7. Calculele:Probabilitatile teoretice sunt

p1 = 1− e−0.660 36 = 0.483 33,

p2 = e−0.660 36 − e−2·0.660 36 = 0.24972,

p3 = e−2·0.660 36 − e−3·0.660 36 = 0.12902,

p4 = e−3·0.660 36 = 0.137 92,

χ2 = 2.086 2 + 2.713 2 + 4.405 5 + 2.379 3 = 11.584

χ20.999(2) = 13.8155

f1 = 9;f2 = 12;f3 = 8;f4 = 1;n = 30;CHI = (n p1 - f1)ˆ2/(n p1) + (n p2 - f2)ˆ2/(n p2) + (n p3 - f3)ˆ2/(n p3) + (n p4 - f4)ˆ2/(n

p4)11.5837

χ2 < χ20.001(2), rezulta ca nu avem motive sa respingem ipoteza H0.

26