testul lui pearson

24
« 1 of 19 Teste de concordanta Testul lui Pearson (chi-p trat) La o or de vârf s-au sondat canalele de televiziune TVR1, PROTV, TVR2, Antena 1, Realitatea care au avut la 23 martie audienţele 34%,8%,12%, 34%,12% respectiv. La un sondaj printre 500 telespectatori dup 6 luni s-au constatat rezultatele urm toare: 159 spectatori pentru TVR1, 49,62,161, 69 pentru cele- lalte. Apare o diferenţ seminificativ ? Nivelul de incredere 0.9. p1 = 0.34; p2 = 0.08; p3 = 0.12; p4 = 0.34; p5 = 0.12; r = 5; n = 500; CHI = Hn p1 159L ^2 êHn p1L + Hn p2 49L ^2 êHn p2L + Hn p3 62L ^2 êHn p3L + Hn p4 161L ^2 êHn p4L + Hn p5 69L ^2 êHn p5L 4.6299 << Statistics`ContinuousDistributions`

Upload: juravle-humaniuc-petru-si-anamaria

Post on 24-Dec-2015

76 views

Category:

Documents


2 download

DESCRIPTION

statistica si prelucrare a datelor

TRANSCRIPT

« ≈ 1 of 19

Teste de concordantaTestul lui Pearson (chi-p trat)

La o or de vârf s-au sondat canalele de televiziune TVR1,PROTV, TVR2, Antena 1, Realitatea care au avut la 23 martieaudienţele 34%,8%,12%, 34%,12% respectiv. La un sondajprintre 500 telespectatori dup 6 luni s-au constatat rezultateleurm toare: 159 spectatori pentru TVR1, 49,62,161, 69 pentru cele-lalte. Apare o diferenţ seminificativ ? Nivelul de incredere 0.9.

p1 = 0.34;p2 = 0.08;p3 = 0.12;p4 = 0.34;p5 = 0.12;

r = 5;n = 500;

CHI = Hn p1 − 159L^2êHn p1L +

Hn p2 − 49L^2êHn p2L +

Hn p3 − 62L^2êHn p3L +

Hn p4 − 161L^2êHn p4L +

Hn p5 − 69L^2êHn p5L4.6299

<< Statistics`ContinuousDistributions`

Quantile@ChiSquareDistribution@r − 1D, 0.9D

7.77944

Nu avem argumente pentru a respingeipoteza ca ar fi diferente semnificative.

« ≈ 2 of 19

Potrivire cu repartiţia binomial

O reclam a fost difuzat în mass-media. Dintr-un eşalon de 800de persoane au fost 434 care nu au auzit (v zut) reclama; 329 auauzit o dat ; 35 de dou ori şi 2 de 3 ori (nimeni mai mult de treiori). Ne propunem s verific m la nivel de seminificaţie 95%dac num rul de d ţi când o persoan a aflat de acea reclamurmeaz o repartiţie binomial cu parametru p=0.2.

p = 0.2;n = 800;r = 4;

2 sliteCHI.nb

p0 = H1 − pL^3p1 = 3 p H1 − pL^2p2 = 3 p^2 H1 − pLp3 = p^3

0.512

0.384

0.096

0.008

CHI = Hn p0 − 434L^2êHn p0L +

Hn p1 − 329L^2êHn p1L +

Hn p2 − 35L^2êHn p2L +

Hn p3 − 2L^2êHn p3L28.776

<< Statistics`ContinuousDistributions`

Quantile@ChiSquareDistribution@r − 1D, 0.95D

7.81473

Concluzie : datele observate nu urmeaza olege binomiala cu parametru p = 0.2.

sliteCHI.nb 3

« ≈ 3 of 19

Estimator de verosimilitate maxima

Clear@sD

dr@s_D := H1 − sL^H3 434L 3 s^329H1 − sL^H2 329L 3 s^70 H1 − sL^35 s^6

d1 = Simplify@dr@sDD9 H1 − sL1995 s405

dd = Factor@D@Log@d1D, sDD15 H−27 + 160 sL

H−1 + sL s

Solve@dd 0, sD

99s →27160

==

N@%D88s → 0.16875<<

s = 0.16875

0.16875

4 sliteCHI.nb

p0 = H1 − sL^3;p1 = 3 s H1 − sL^2;p2 = 3 s^2 H1 − sL;p3 = s^3;

CHI = Hn p0 − 434L^2êHn p0L +

Hn p1 − 329L^2êHn p1L +

Hn p2 − 35L^2êHn p2L +

Hn p3 − 2L^2êHn p3L19.3074

Concluzie : datele observate nu urmeaza olege binomiala cu parametru s = 0.16875

« ≈ 4 of 19

s = 0.168

0.168

p0 = H1 − sL^3;p1 = 3 s H1 − sL^2;p2 = 3 s^2 H1 − sL;p3 = s^3;

sliteCHI.nb 5

CHI = Hn p0 − 434L^2êHn p0L +

Hn p1 − 329L^2êHn p1L +

Hn p2 − 35L^2êHn p2L +

Hn p3 − 2L^2êHn p3L19.4138

Concluzie : datele observate nu urmeaza olege binomiala cu parametru s = 0.168

s = 0.15

0.15

p0 = H1 − sL^3;p1 = 3 s H1 − sL^2;p2 = 3 s^2 H1 − sL;p3 = s^3;

CHI = Hn p0 − 434L^2êHn p0L +

Hn p1 − 329L^2êHn p1L +

Hn p2 − 35L^2êHn p2L +

Hn p3 − 2L^2êHn p3L27.7043

Concluzie : datele observate nu urmeaza olege binomiala cu parametru s = 0.15

6 sliteCHI.nb

« ≈ 5 of 19

Potrivire cu repartiţia Poisson

Vrem s stabilim dac num rul defecţiunilor unui circuit al uneiimprimante urmeaz o repartiţie Poisson. Se se studiaz compor-tatea acestui circuit pe un num r de 60 de imprimante şi sunt con-semnate num rul defecţiunilor care au ap rut.

Nr.defectiunilor Frecventa0 321 152 9>= 3 4

Determinarea probabilitatilor teoretice

n = 60;

media = H0 32 + 1 15 + 2 9 + 3 4Lê60

34

λ = N@%D

0.75

sliteCHI.nb 7

p1 = Exp@−λDp2 = Exp@−λD λp3 = Exp@−λD HλL^2ê2p4 = 1 − Hp1 + p2 + p3L0.472367

0.354275

0.132853

0.0405054

« ≈ 6 of 19

Determinarea frecventelor observate

f1 = 32;f2 = 15;f3 = 9;f4 = 4;

Regiunea critica

<< Statistics`ContinuousDistributions`Quantile@ChiSquareDistribution@2D, 0.95D5.99146

Calculul testului statistic

8 sliteCHI.nb

CHI = Hn p1 − f1L^2êHn p1L +

Hn p2 − f2L^2êHn p2L +

Hn p3 − f3L^2êHn p3L +

Hn p4 − f4L^2êHn p4L3.46021

Concluzia : nu avem argumentesa respingem ipoteza nula

« ≈ 7 of 19

Potrivire cu repartiţia uniform

Un mare comerciant vrea s vad dac un anumit produs se vindela fel (uniform) în 5 dintre magazinele sale. Prin experimentconstat c într-o saptamân s-au realizat vânz ri în mii RON de43,29,52,34,48. Este aceast informaţie suficient pentru a consid-era c exist mari diferenţe între cele 5 magazine?

p1 = 0.2;p2 = 0.2;p3 = 0.2;p4 = 0.2;p5 = 0.2;

sliteCHI.nb 9

f1 = 43;f2 = 29;f3 = 52;f4 = 34;f5 = 48;

n = f1 + f2 + f3 + f4 + f5

206

Regiunea critica

<< Statistics`ContinuousDistributions`Quantile@ChiSquareDistribution@4D, 0.9D7.77944

<< Statistics`ContinuousDistributions`Quantile@ChiSquareDistribution@3D, 0.9D6.25139

« ≈ 8 of 19

Calculul testului statistic

10 sliteCHI.nb

CHI = Hn p1 − f1L^2êHn p1L +

Hn p2 − f2L^2êHn p2L +

Hn p3 − f3L^2êHn p3L +

Hn p4 − f4L^2êHn p4L +

Hn p5 − f5L^2êHn p5L8.90291

Cazul α = 0.05

<< Statistics`ContinuousDistributions`Quantile@ChiSquareDistribution@4D, 0.95DQuantile@ChiSquareDistribution@3D, 0.95D9.48773

7.81473

Sunt doua situatii diferite

Cazul α = 0.1

<< Statistics`ContinuousDistributions`Quantile@ChiSquareDistribution@4D, 0.9DQuantile@ChiSquareDistribution@3D, 0.9D7.77944

6.25139

sliteCHI.nb 11

Se respinge ip nula

« ≈ 9 of 19

Potrivire cu repartiţia normal

Presupunem c timpul mediu de asamblare (în minute) pentru uneşantion de 300 de aparate electronice a fost m=84, cu abatereamedie p tratic s=3. S-a observat c aceste 300 de aparate au fostrepartizate astfel: pentru 15 aparate au fost necesare sub 78 de minute, pentru 39 între 78-81 minute, pentru 96 între 81-84 minute, pentru 87 între 84-87, pentru 48 aparate între 87-90 minute şi pentru 15 aparate peste 90 minute. S se testeze la nivel de seminificaţie de 1% dac datele anterio-are sunt repartizate normal.

m = 84;s = 3;f1 = 15;f2 = 39;f3 = 96;f4 = 87;f5 = 48;f6 = 15;n = f1+ f2+ f3+ f4+ f5+ f6

300

12 sliteCHI.nb

« ≈ 10 of 19

Regiunea critic

<< Statistics`ContinuousDistributions`Quantile@ChiSquareDistribution@3D, 0.99D11.3449

p1 = N@CDF@NormalDistribution@0, 1D,H78 − 84Lê3DD

0.0227501

p2 = N@CDF@NormalDistribution@0, 1D,H81 − 84Lê3DD −

N@CDF@NormalDistribution@0, 1D,H78 − 84Lê3DD

0.135905

p3 = N@CDF@NormalDistribution@0, 1D,H84 − 84Lê3DD −

N@CDF@NormalDistribution@0, 1D,H81 − 84Lê3DD

0.341345

sliteCHI.nb 13

p4 = N@CDF@NormalDistribution@0, 1D,H87 − 84Lê3DD −

N@CDF@NormalDistribution@0, 1D,H84 − 84Lê3DD

0.341345

p5 = N@CDF@NormalDistribution@0, 1D,H90 − 84Lê3DD −

N@CDF@NormalDistribution@0, 1D,H87 − 84Lê3DD

0.135905

p6 = 1 − N@CDF@NormalDistribution@0, 1D,H90 − 84Lê3DD

0.0227501

« ≈ 11 of 19

Calculul testului statistic

14 sliteCHI.nb

CHI = Hn p1 − f1L^2êHn p1L +

Hn p2 − f2L^2êHn p2L +

Hn p3 − f3L^2êHn p3L +

Hn p4 − f4L^2êHn p4L + Hn p5 − f5L^2êHn p5L + Hn p6 − f6L^2êHn p6L

23.6597

23.6597

23.659667381438993` > 11.34486673014437`Ipoteza nula se respinge

« ≈ 12 of 19

Potrivire cu repartiţia ExponentialaPresupunem c este testat durata de funcţionare a unui tipde becuri Hm surat în mii de oreL pentru un eşantionde 30 de becuri. S − a observat c durata de funcţionare

a 9 becuri este sub 1000 de ore,a 12 becuri între 1000 şi 2000 de ore,a 8 becuri între 2000 şi 3000 de ore,iar un bec peste 3000 de ore.S se testeze la nivel de seminificaţie de 0.1 % dacdatele prezentate sunt repartizate exponenţial.

F HxL = 0, x ≤ 0

F HxL = 1 − e−θx, x > 0,

p₁ = P H0 ≤ X < 1L = F H1L − F H0L = 1− e−θ,p₂ = P H1 ≤ X < 2L = F H2L − F H1L = e−θ − e−2 θ,p₃ = P H2 ≤ X < 3L = F H3L − F H2L = e−2 θ − e−3 θ,p₄ = P H3 ≤ XL = 1 − F H3L = e−3 θ

sliteCHI.nb 15

Estimarea parametrului θ cumetoda verosimilitatii maxime

ff@p_D :=

H1 − Exp@−pDL^9 HExp@−pD − Exp@−2 pDL^12HExp@−2 pD − Exp@−3 pDL^8 Exp@−3 pD

der = Factor@D@Log@ff@pDD, pDD

−−60 + 31 p

−1 + p

N@Solve@der 0, pDD88p → 0.660357<<

D@der, pD ê. p −> 0.6603573577369545`

−64.1379

p = 0.6603573577369545

0.660357

« ≈ 13 of 19

Regiunea critica

16 sliteCHI.nb

<< Statistics`ContinuousDistributions`Quantile@ChiSquareDistribution@2D, 0.999D13.8155

Probabilitatile teoretice

p1 = 1 − Exp@−pDp2 = Exp@− pD − Exp@−2 pDp3 = Exp@−2 pD − Exp@−3 pDp4 = Exp@−3 pD0.483333

0.249722

0.129023

0.137921

f1 = 9;f2 = 12;f3 = 8;f4 = 1;

n = 30;

Testul

sliteCHI.nb 17

CHI = Hn p1 − f1L^2êHn p1L +

Hn p2 − f2L^2êHn p2L +

Hn p3 − f3L^2êHn p3L +

Hn p4 − f4L^2êHn p4L11.5837

Concluzia :nu sunt motive sa respingem ipoteza nula

« ≈ 14 of 19

Test de independenta

O companie are de ales între treiplanuri de pensii private.Se puneproblema dac preferinţele pentruplanurile de pensii private suntindependente de forma de angajare cu

α = 0.05.Este chestionat un eşantionde 500 angajaţi iar rezultatele suntprezentate în urm torul tabel :

12 3 Total

salariaţi full time 160140 40 340salariaţi part time40 60 60 160Total200 200 100 500

Regiunea critica

18 sliteCHI.nb

<< Statistics`ContinuousDistributions`Quantile@ChiSquareDistribution@2D, 0.95D5.99146

n = 500;

o11 = 160;o12 = 140;o13 = 40;o21 = 40;o22 = 60;o23 = 60;

u1 = N@340ê500Du2 = N@160ê500D0.68

0.32

« ≈ 15 of 19

v1 = N@200ê500Dv2 = N@200ê500Dv3 = N@100ê500D0.4

0.4

0.2

sliteCHI.nb 19

E11 = n u1 v1E12 = n u1 v2E13 = n u1 v3E21 = n u2 v1E22 = n u2 v2E23 = n u2 v3

136.

136.

68.

64.

64.

32.

CHI =

Ho11 − E11L^2êE11 + Ho12 − E12L^2êE12 +

Ho13 − E13L^2êE13 + Ho21 − E21L^2êE21 +

Ho22 − E22L^2êE22 + Ho23 − E23L^2êE2349.6324

20 sliteCHI.nb

Concluzia : nu avem motive s accept mipoteza c preferinţele pentrudiferite planuri de pensionarenu depind de forma de angajare.

« ≈ 16 of 19

Test de omogeneitate

300 de elevi din ultimeleclase de liceu au fost chestionaţiasupra intenţiilor lor de a −şi continua studiile universitare întrei domenii de interes.Rezultatelesunt prezentate în urm torul tabel :

inginerieştiinţ art Total

b ieţi 3741 44 122fete35 72 71 178Total 72113 115 300Testaţi ipoteza c populaţiile suntomogene Hadic nu exist leg turîntre faptul c elevul este b iatsau fat şi tipul de facultateL

cu un nivel de încredere de 90 %.Concluziile ar fi diferite dacnivelul de încredere ar fi de 95 %?Regiunea critica

sliteCHI.nb 21

<< Statistics`ContinuousDistributions`Quantile@ChiSquareDistribution@2D, 0.9D4.60517

n = 300;

o11 = 37;o12 = 41;o13 = 44;o21 = 35;o22 = 72;o23 = 71;

u1 = N@122ê300Du2 = N@178ê300D0.406667

0.593333

« ≈ 17 of 19

v1 = N@72ê300Dv2 = N@113ê300Dv3 = N@115ê300D0.24

0.376667

0.383333

22 sliteCHI.nb

E11 = n u1 v1E12 = n u1 v2E13 = n u1 v3E21 = n u2 v1E22 = n u2 v2E23 = n u2 v3

29.28

45.9533

46.7667

42.72

67.0467

68.2333

« ≈ 18 of 19

CHI =

Ho11 − E11L^2êE11 + Ho12 − E12L^2êE12 +

Ho13 − E13L^2êE13 +

Ho21 − E21L^2êE21 + Ho22 − E22L^2êE22 +

Ho23 − E23L^2êE234.60628

sliteCHI.nb 23

<< Statistics`ContinuousDistributions`Quantile@ChiSquareDistribution@2D, 0.9D4.60517

Concluzia : cu un nivel de incredere de 90

% nu avem motive sa acceptam ipotezaca preferintele in ceea ce privestestudiile viitoare sunt independentede faprul ca elevul este fata sau baiat.

<< Statistics`ContinuousDistributions`Quantile@ChiSquareDistribution@2D, 0.95D5.99146

Concluzia :cu un nivel de incredere de 95 % nu avemmotive sa respingem ipoteza nula.

« ≈ 19 of 19

24 sliteCHI.nb