testul lui pearson
Post on 24-Dec-2015
78 Views
Preview:
DESCRIPTION
TRANSCRIPT
« ≈ 1 of 19
Teste de concordantaTestul lui Pearson (chi-p trat)
La o or de vârf s-au sondat canalele de televiziune TVR1,PROTV, TVR2, Antena 1, Realitatea care au avut la 23 martieaudienţele 34%,8%,12%, 34%,12% respectiv. La un sondajprintre 500 telespectatori dup 6 luni s-au constatat rezultateleurm toare: 159 spectatori pentru TVR1, 49,62,161, 69 pentru cele-lalte. Apare o diferenţ seminificativ ? Nivelul de incredere 0.9.
p1 = 0.34;p2 = 0.08;p3 = 0.12;p4 = 0.34;p5 = 0.12;
r = 5;n = 500;
CHI = Hn p1 − 159L^2êHn p1L +
Hn p2 − 49L^2êHn p2L +
Hn p3 − 62L^2êHn p3L +
Hn p4 − 161L^2êHn p4L +
Hn p5 − 69L^2êHn p5L4.6299
<< Statistics`ContinuousDistributions`
Quantile@ChiSquareDistribution@r − 1D, 0.9D
7.77944
Nu avem argumente pentru a respingeipoteza ca ar fi diferente semnificative.
« ≈ 2 of 19
Potrivire cu repartiţia binomial
O reclam a fost difuzat în mass-media. Dintr-un eşalon de 800de persoane au fost 434 care nu au auzit (v zut) reclama; 329 auauzit o dat ; 35 de dou ori şi 2 de 3 ori (nimeni mai mult de treiori). Ne propunem s verific m la nivel de seminificaţie 95%dac num rul de d ţi când o persoan a aflat de acea reclamurmeaz o repartiţie binomial cu parametru p=0.2.
p = 0.2;n = 800;r = 4;
2 sliteCHI.nb
p0 = H1 − pL^3p1 = 3 p H1 − pL^2p2 = 3 p^2 H1 − pLp3 = p^3
0.512
0.384
0.096
0.008
CHI = Hn p0 − 434L^2êHn p0L +
Hn p1 − 329L^2êHn p1L +
Hn p2 − 35L^2êHn p2L +
Hn p3 − 2L^2êHn p3L28.776
<< Statistics`ContinuousDistributions`
Quantile@ChiSquareDistribution@r − 1D, 0.95D
7.81473
Concluzie : datele observate nu urmeaza olege binomiala cu parametru p = 0.2.
sliteCHI.nb 3
« ≈ 3 of 19
Estimator de verosimilitate maxima
Clear@sD
dr@s_D := H1 − sL^H3 434L 3 s^329H1 − sL^H2 329L 3 s^70 H1 − sL^35 s^6
d1 = Simplify@dr@sDD9 H1 − sL1995 s405
dd = Factor@D@Log@d1D, sDD15 H−27 + 160 sL
H−1 + sL s
Solve@dd 0, sD
99s →27160
==
N@%D88s → 0.16875<<
s = 0.16875
0.16875
4 sliteCHI.nb
p0 = H1 − sL^3;p1 = 3 s H1 − sL^2;p2 = 3 s^2 H1 − sL;p3 = s^3;
CHI = Hn p0 − 434L^2êHn p0L +
Hn p1 − 329L^2êHn p1L +
Hn p2 − 35L^2êHn p2L +
Hn p3 − 2L^2êHn p3L19.3074
Concluzie : datele observate nu urmeaza olege binomiala cu parametru s = 0.16875
« ≈ 4 of 19
s = 0.168
0.168
p0 = H1 − sL^3;p1 = 3 s H1 − sL^2;p2 = 3 s^2 H1 − sL;p3 = s^3;
sliteCHI.nb 5
CHI = Hn p0 − 434L^2êHn p0L +
Hn p1 − 329L^2êHn p1L +
Hn p2 − 35L^2êHn p2L +
Hn p3 − 2L^2êHn p3L19.4138
Concluzie : datele observate nu urmeaza olege binomiala cu parametru s = 0.168
s = 0.15
0.15
p0 = H1 − sL^3;p1 = 3 s H1 − sL^2;p2 = 3 s^2 H1 − sL;p3 = s^3;
CHI = Hn p0 − 434L^2êHn p0L +
Hn p1 − 329L^2êHn p1L +
Hn p2 − 35L^2êHn p2L +
Hn p3 − 2L^2êHn p3L27.7043
Concluzie : datele observate nu urmeaza olege binomiala cu parametru s = 0.15
6 sliteCHI.nb
« ≈ 5 of 19
Potrivire cu repartiţia Poisson
Vrem s stabilim dac num rul defecţiunilor unui circuit al uneiimprimante urmeaz o repartiţie Poisson. Se se studiaz compor-tatea acestui circuit pe un num r de 60 de imprimante şi sunt con-semnate num rul defecţiunilor care au ap rut.
Nr.defectiunilor Frecventa0 321 152 9>= 3 4
Determinarea probabilitatilor teoretice
n = 60;
media = H0 32 + 1 15 + 2 9 + 3 4Lê60
34
λ = N@%D
0.75
sliteCHI.nb 7
p1 = Exp@−λDp2 = Exp@−λD λp3 = Exp@−λD HλL^2ê2p4 = 1 − Hp1 + p2 + p3L0.472367
0.354275
0.132853
0.0405054
« ≈ 6 of 19
Determinarea frecventelor observate
f1 = 32;f2 = 15;f3 = 9;f4 = 4;
Regiunea critica
<< Statistics`ContinuousDistributions`Quantile@ChiSquareDistribution@2D, 0.95D5.99146
Calculul testului statistic
8 sliteCHI.nb
CHI = Hn p1 − f1L^2êHn p1L +
Hn p2 − f2L^2êHn p2L +
Hn p3 − f3L^2êHn p3L +
Hn p4 − f4L^2êHn p4L3.46021
Concluzia : nu avem argumentesa respingem ipoteza nula
« ≈ 7 of 19
Potrivire cu repartiţia uniform
Un mare comerciant vrea s vad dac un anumit produs se vindela fel (uniform) în 5 dintre magazinele sale. Prin experimentconstat c într-o saptamân s-au realizat vânz ri în mii RON de43,29,52,34,48. Este aceast informaţie suficient pentru a consid-era c exist mari diferenţe între cele 5 magazine?
p1 = 0.2;p2 = 0.2;p3 = 0.2;p4 = 0.2;p5 = 0.2;
sliteCHI.nb 9
f1 = 43;f2 = 29;f3 = 52;f4 = 34;f5 = 48;
n = f1 + f2 + f3 + f4 + f5
206
Regiunea critica
<< Statistics`ContinuousDistributions`Quantile@ChiSquareDistribution@4D, 0.9D7.77944
<< Statistics`ContinuousDistributions`Quantile@ChiSquareDistribution@3D, 0.9D6.25139
« ≈ 8 of 19
Calculul testului statistic
10 sliteCHI.nb
CHI = Hn p1 − f1L^2êHn p1L +
Hn p2 − f2L^2êHn p2L +
Hn p3 − f3L^2êHn p3L +
Hn p4 − f4L^2êHn p4L +
Hn p5 − f5L^2êHn p5L8.90291
Cazul α = 0.05
<< Statistics`ContinuousDistributions`Quantile@ChiSquareDistribution@4D, 0.95DQuantile@ChiSquareDistribution@3D, 0.95D9.48773
7.81473
Sunt doua situatii diferite
Cazul α = 0.1
<< Statistics`ContinuousDistributions`Quantile@ChiSquareDistribution@4D, 0.9DQuantile@ChiSquareDistribution@3D, 0.9D7.77944
6.25139
sliteCHI.nb 11
Se respinge ip nula
« ≈ 9 of 19
Potrivire cu repartiţia normal
Presupunem c timpul mediu de asamblare (în minute) pentru uneşantion de 300 de aparate electronice a fost m=84, cu abatereamedie p tratic s=3. S-a observat c aceste 300 de aparate au fostrepartizate astfel: pentru 15 aparate au fost necesare sub 78 de minute, pentru 39 între 78-81 minute, pentru 96 între 81-84 minute, pentru 87 între 84-87, pentru 48 aparate între 87-90 minute şi pentru 15 aparate peste 90 minute. S se testeze la nivel de seminificaţie de 1% dac datele anterio-are sunt repartizate normal.
m = 84;s = 3;f1 = 15;f2 = 39;f3 = 96;f4 = 87;f5 = 48;f6 = 15;n = f1+ f2+ f3+ f4+ f5+ f6
300
12 sliteCHI.nb
« ≈ 10 of 19
Regiunea critic
<< Statistics`ContinuousDistributions`Quantile@ChiSquareDistribution@3D, 0.99D11.3449
p1 = N@CDF@NormalDistribution@0, 1D,H78 − 84Lê3DD
0.0227501
p2 = N@CDF@NormalDistribution@0, 1D,H81 − 84Lê3DD −
N@CDF@NormalDistribution@0, 1D,H78 − 84Lê3DD
0.135905
p3 = N@CDF@NormalDistribution@0, 1D,H84 − 84Lê3DD −
N@CDF@NormalDistribution@0, 1D,H81 − 84Lê3DD
0.341345
sliteCHI.nb 13
p4 = N@CDF@NormalDistribution@0, 1D,H87 − 84Lê3DD −
N@CDF@NormalDistribution@0, 1D,H84 − 84Lê3DD
0.341345
p5 = N@CDF@NormalDistribution@0, 1D,H90 − 84Lê3DD −
N@CDF@NormalDistribution@0, 1D,H87 − 84Lê3DD
0.135905
p6 = 1 − N@CDF@NormalDistribution@0, 1D,H90 − 84Lê3DD
0.0227501
« ≈ 11 of 19
Calculul testului statistic
14 sliteCHI.nb
CHI = Hn p1 − f1L^2êHn p1L +
Hn p2 − f2L^2êHn p2L +
Hn p3 − f3L^2êHn p3L +
Hn p4 − f4L^2êHn p4L + Hn p5 − f5L^2êHn p5L + Hn p6 − f6L^2êHn p6L
23.6597
23.6597
23.659667381438993` > 11.34486673014437`Ipoteza nula se respinge
« ≈ 12 of 19
Potrivire cu repartiţia ExponentialaPresupunem c este testat durata de funcţionare a unui tipde becuri Hm surat în mii de oreL pentru un eşantionde 30 de becuri. S − a observat c durata de funcţionare
a 9 becuri este sub 1000 de ore,a 12 becuri între 1000 şi 2000 de ore,a 8 becuri între 2000 şi 3000 de ore,iar un bec peste 3000 de ore.S se testeze la nivel de seminificaţie de 0.1 % dacdatele prezentate sunt repartizate exponenţial.
F HxL = 0, x ≤ 0
F HxL = 1 − e−θx, x > 0,
p₁ = P H0 ≤ X < 1L = F H1L − F H0L = 1− e−θ,p₂ = P H1 ≤ X < 2L = F H2L − F H1L = e−θ − e−2 θ,p₃ = P H2 ≤ X < 3L = F H3L − F H2L = e−2 θ − e−3 θ,p₄ = P H3 ≤ XL = 1 − F H3L = e−3 θ
sliteCHI.nb 15
Estimarea parametrului θ cumetoda verosimilitatii maxime
ff@p_D :=
H1 − Exp@−pDL^9 HExp@−pD − Exp@−2 pDL^12HExp@−2 pD − Exp@−3 pDL^8 Exp@−3 pD
der = Factor@D@Log@ff@pDD, pDD
−−60 + 31 p
−1 + p
N@Solve@der 0, pDD88p → 0.660357<<
D@der, pD ê. p −> 0.6603573577369545`
−64.1379
p = 0.6603573577369545
0.660357
« ≈ 13 of 19
Regiunea critica
16 sliteCHI.nb
<< Statistics`ContinuousDistributions`Quantile@ChiSquareDistribution@2D, 0.999D13.8155
Probabilitatile teoretice
p1 = 1 − Exp@−pDp2 = Exp@− pD − Exp@−2 pDp3 = Exp@−2 pD − Exp@−3 pDp4 = Exp@−3 pD0.483333
0.249722
0.129023
0.137921
f1 = 9;f2 = 12;f3 = 8;f4 = 1;
n = 30;
Testul
sliteCHI.nb 17
CHI = Hn p1 − f1L^2êHn p1L +
Hn p2 − f2L^2êHn p2L +
Hn p3 − f3L^2êHn p3L +
Hn p4 − f4L^2êHn p4L11.5837
Concluzia :nu sunt motive sa respingem ipoteza nula
« ≈ 14 of 19
Test de independenta
O companie are de ales între treiplanuri de pensii private.Se puneproblema dac preferinţele pentruplanurile de pensii private suntindependente de forma de angajare cu
α = 0.05.Este chestionat un eşantionde 500 angajaţi iar rezultatele suntprezentate în urm torul tabel :
12 3 Total
salariaţi full time 160140 40 340salariaţi part time40 60 60 160Total200 200 100 500
Regiunea critica
18 sliteCHI.nb
<< Statistics`ContinuousDistributions`Quantile@ChiSquareDistribution@2D, 0.95D5.99146
n = 500;
o11 = 160;o12 = 140;o13 = 40;o21 = 40;o22 = 60;o23 = 60;
u1 = N@340ê500Du2 = N@160ê500D0.68
0.32
« ≈ 15 of 19
v1 = N@200ê500Dv2 = N@200ê500Dv3 = N@100ê500D0.4
0.4
0.2
sliteCHI.nb 19
E11 = n u1 v1E12 = n u1 v2E13 = n u1 v3E21 = n u2 v1E22 = n u2 v2E23 = n u2 v3
136.
136.
68.
64.
64.
32.
CHI =
Ho11 − E11L^2êE11 + Ho12 − E12L^2êE12 +
Ho13 − E13L^2êE13 + Ho21 − E21L^2êE21 +
Ho22 − E22L^2êE22 + Ho23 − E23L^2êE2349.6324
20 sliteCHI.nb
Concluzia : nu avem motive s accept mipoteza c preferinţele pentrudiferite planuri de pensionarenu depind de forma de angajare.
« ≈ 16 of 19
Test de omogeneitate
300 de elevi din ultimeleclase de liceu au fost chestionaţiasupra intenţiilor lor de a −şi continua studiile universitare întrei domenii de interes.Rezultatelesunt prezentate în urm torul tabel :
inginerieştiinţ art Total
b ieţi 3741 44 122fete35 72 71 178Total 72113 115 300Testaţi ipoteza c populaţiile suntomogene Hadic nu exist leg turîntre faptul c elevul este b iatsau fat şi tipul de facultateL
cu un nivel de încredere de 90 %.Concluziile ar fi diferite dacnivelul de încredere ar fi de 95 %?Regiunea critica
sliteCHI.nb 21
<< Statistics`ContinuousDistributions`Quantile@ChiSquareDistribution@2D, 0.9D4.60517
n = 300;
o11 = 37;o12 = 41;o13 = 44;o21 = 35;o22 = 72;o23 = 71;
u1 = N@122ê300Du2 = N@178ê300D0.406667
0.593333
« ≈ 17 of 19
v1 = N@72ê300Dv2 = N@113ê300Dv3 = N@115ê300D0.24
0.376667
0.383333
22 sliteCHI.nb
E11 = n u1 v1E12 = n u1 v2E13 = n u1 v3E21 = n u2 v1E22 = n u2 v2E23 = n u2 v3
29.28
45.9533
46.7667
42.72
67.0467
68.2333
« ≈ 18 of 19
CHI =
Ho11 − E11L^2êE11 + Ho12 − E12L^2êE12 +
Ho13 − E13L^2êE13 +
Ho21 − E21L^2êE21 + Ho22 − E22L^2êE22 +
Ho23 − E23L^2êE234.60628
sliteCHI.nb 23
<< Statistics`ContinuousDistributions`Quantile@ChiSquareDistribution@2D, 0.9D4.60517
Concluzia : cu un nivel de incredere de 90
% nu avem motive sa acceptam ipotezaca preferintele in ceea ce privestestudiile viitoare sunt independentede faprul ca elevul este fata sau baiat.
<< Statistics`ContinuousDistributions`Quantile@ChiSquareDistribution@2D, 0.95D5.99146
Concluzia :cu un nivel de incredere de 95 % nu avemmotive sa respingem ipoteza nula.
« ≈ 19 of 19
24 sliteCHI.nb
top related