probleme de statistică pentru biologi, cu soluții, matematică În biologie, 2013 - 2014

9
8/18/2019 Probleme de Statistică Pentru Biologi, Cu Soluții, Matematică În Biologie, 2013 - 2014 http://slidepdf.com/reader/full/probleme-de-statistica-pentru-biologi-cu-soluii-matematica-in-biologie 1/9 Probleme de statistica 2008-2009 Solutii 1)  S¼ a se proiecteze un sondaj pentru o populatie cu volumul  N  = 1 000 000: Se cunosc: volumul esantionului  n  = 10 000;  num¼ arul r¼ aspunsurilor favorabile = 6 000;  iar eroarea s¼ a …e sub  3 %: Solutie.  Fie   k  o variabila aleatoare care ia valoarea  1  daca "individul" cu numarul  k  din populatia avuta in vedere "raspunde" cu  " DA"  si valoarea  0 in caz contrar (1   k    N ). Daca  p 2  (0;1)  este probabilitatea obtinerii unui "raspuns" a…rmativ atunci repartitia v.a.   k  este urmatoarea:  k  :  0 1 q p ; q  = 1  p; adica o repartitie de tip Bernoulli. Evident variabilele aleatoare de mai sus sunt independente si la fel repartizate, cu media  M ( k ) = 0 +1  p =  p  si dispersia D( k ) =  M ( 2 k ) [( k )] 2 = p  p 2 = pq: Conform teoremei limita centrala v.a. s   Np N pq  ; pentru N >> 1;  este repartizata normal standard si, pentru   2 (0; 1) ;  exista si este unic  z  >  0  astfel incat ( z    s   Np N pq   z ) = 2(z ) 1 = 1 ; unde  s  =  1  + ::: +   reprezinta numarul de "raspunsuri" a…rmative la intre- barea din sondaj. Prin urmare s  2 [Np z Npq;Np + z N pq ]; cu o eroare sub  100%;  deci cu un coe…cient de incredere egal cu  1  :  In cazul    = 0; 03  obtinem (z ) = 1   2  = 1 0; 015 = 0; 985  si din tabelul cu valorile lui    gasim ca  z 0;03  = 2; 17  (pentru    = 0; 01  se obtine  z 0;01  = 2; 58): Din esantionul de  10 000  de "votanti" chestionati se obtine  p  =  6 000 10 000  = 0 ; 6: Asadar s 1 000 000  2 [600 000 2; 17 10 3  6 10 4 10 ; 600 000 + 2; 17 10 3  6 10 4 10 ]; adica s 1 000 000  2 [600 000 2; 17 10 2 2 6;  600 000 + 2; 17 10 2 2 6]; 1

Upload: newbooks11

Post on 07-Jul-2018

217 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Probleme de Statistică Pentru Biologi, Cu Soluții, Matematică În Biologie, 2013 - 2014

8/18/2019 Probleme de Statistică Pentru Biologi, Cu Soluții, Matematică În Biologie, 2013 - 2014

http://slidepdf.com/reader/full/probleme-de-statistica-pentru-biologi-cu-soluii-matematica-in-biologie 1/9

Probleme de statistica

2008-2009

Solutii

1)  S¼a se proiecteze un sondaj pentru o populatie cu volumul  N  = 1 000 000:Se cunosc: volumul esantionului  n  = 10 000;  num¼arul r¼aspunsurilor favorabile= 6 000;  iar eroarea s¼a …e sub  3 %:

Solutie.   Fie    k  o variabila aleatoare care ia valoarea   1   daca "individul"cu numarul  k  din populatia avuta in vedere "raspunde" cu  "DA"  si valoarea  0in caz contrar (1   k   N ). Daca  p 2 (0;1)   este probabilitatea obtinerii unui"raspuns" a…rmativ atunci repartitia v.a.    k  este urmatoarea:

 k  :

  0 1q p

; q  = 1  p;

adica o repartitie de tip Bernoulli. Evident variabilele aleatoare de mai sus suntindependente si la fel repartizate, cu media  M ( k) = 0 q + 1  p =  p  si dispersiaD( k) =  M ( 2k) [M ( k)]2 = p  p2 = pq:

Conform teoremei limita centrala v.a.

sN   N pp N pq 

  ;

pentru N >> 1; este repartizata normal standard si, pentru   2 (0; 1); exista sieste unic  z >  0  astfel incat

P (

z

 

 sN   N p

p N pq    z) = 2(z)

1 = 1

;

unde sN  =  1 + ::: +  N  reprezinta numarul de "raspunsuri" a…rmative la intre-barea din sondaj. Prin urmare

sN  2 [N p zp 

Npq;Np + zp 

N pq ];

cu o eroare sub   100%;  deci cu un coe…cient de incredere egal cu   1  :   Incazul    = 0; 03  obtinem  (z) = 1  

2  = 1 0; 015 = 0; 985  si din tabelul cu

valorile lui    gasim ca  z0;03  = 2; 17  (pentru    = 0; 01  se obtine  z0;01  = 2; 58):Din esantionul de 10 000  de "votanti" chestionati se obtine  p  =   6 000

10 000  = 0; 6:Asadar

s1 000 000 2 [600 000 2; 17 103 r  610

410

; 600 000 + 2; 17 103 r  610

410

];

adica

s1 000 000 2 [600 000 2; 17 102 2p 

6;  600 000 + 2; 17 102 2p 

6];

1

Page 2: Probleme de Statistică Pentru Biologi, Cu Soluții, Matematică În Biologie, 2013 - 2014

8/18/2019 Probleme de Statistică Pentru Biologi, Cu Soluții, Matematică În Biologie, 2013 - 2014

http://slidepdf.com/reader/full/probleme-de-statistica-pentru-biologi-cu-soluii-matematica-in-biologie 2/9

cu o eroare sub 3%:Mai sus am notat cu (z) :=   1p 

2

R z1 et

2=2 dt; z 2R; functia de repartirie

a unei v.a. repartizate normal standard. Reamintim ca:i)   lim

z!1(z) = 0;   lim

z!+1(z) = 1;

ii) (z) + (z) = 1; 8z 2R;iii)   strict crescatoare,iv) (R) = (0; 1):2) Se d¼a un set de date de volum  n = 2r; r  3; x1; x2;:::;xn: S¼a se realizeze o

prelucrare statistic¼a elementar¼a (descriptiv¼a) a setului respectiv de date (volum,ordonare cresc¼atoare, eliminarea datelor afectate de erori grosolane, interval devariatie, indicatori de pozitie, indicatori de variatie, imp¼artire in intervale delungimi egale, determinarea frecventelor absolute si relative asociate, interval

modal,functie empiric¼a de repartitie, histograma, comentarii). Caz concret:14; 16; 12; 11; 13; 12; 15; 12:

Solutie.  Se va proceda absolut analog ca in cazurile tratate la   Seminar   !Observatie.  Aceasta problema (nr.2) este obligatorie  !!!!!   Se consider¼a o selectie  x1; x2;:::;xn;  de volum   n    2;  din repartitia de

valori a unei variabile aleatoare  X   cu media  m  si dispersia   2( > 0):  Not¼am:

x :=  1

n(x1 + ::: + xn) si  s2 :=

  1

n 1

nXi=1

(xi x)2:

Reamintim ca selectia fx1; x2;:::;xng   poate … interpretata ca …ind   o re-alizare  a vectorului aleator   (X 1;:::;X n)   in care   X k   reprezinta caracteristica(variabila aleatoare) X;  avuta in vedere in studiul statistic pe care il efectuam,

in experimentul cu numarul   k;   1    k    n:   Asadar vom admite, pentru a nucomplica scrierea, ca   x1; x2;:::;xn  sunt variabile aleatoare independente si lafel repartizate (ca si caracteristica initiala   X ). Prin urmare   M (xk) =   m   siD(xk) =  2; 81 k  n:

Ar¼atati c¼a:3)  M (x) =  m  ;Solutie.

M (x) =  1

n

nXi=1

M (xi) =  1

n

nXi=1

m =  1

n  n m =  m:

4)  M (s2) =  2;Solutie.  Utilizam urmatoarele fapte:a)  M (x2

i ) :=  D(xi) + [M (xi)]2 = 2 + m2;b)Pn

i=1 xi =  nx;c) M (x) =  m ; D(x) =  2=n ;d)  M (x2) =  D(x) + [M (x)]2 = 2=n + m2

2

Page 3: Probleme de Statistică Pentru Biologi, Cu Soluții, Matematică În Biologie, 2013 - 2014

8/18/2019 Probleme de Statistică Pentru Biologi, Cu Soluții, Matematică În Biologie, 2013 - 2014

http://slidepdf.com/reader/full/probleme-de-statistica-pentru-biologi-cu-soluii-matematica-in-biologie 3/9

e) Pn

i=1(xi x)2 =Pn

i=1 x2i  2x

Pni=1 xi + nx2 =

Pni=1 x2

i  nx2:Deci

(n 1)M (s2) =  M [nXi=1

(xi x)2] =nXi=1

M (x2i ) nM (x2) =

=nXi=1

(2 + m2) n(2=n + m2) =  n2 + nm2 2 nm2 = (n 1)2:

Simpli…cand cu  (n 1) (,in ipoteza naturala  n 2; ) obtinem rezultatul dorit.5)  x 2 N (m;   p 

n);  pentru  n >> 1;

Solutie.Utilizam urmatoarea:Observatie . Fie   o variabila aleatoare repartizata normal standard. Atunci

pentru orice  m 2  R  si orice   >  0   avem    +  m 2 N (m; )   (demonstratia seface prin veri…care directa).

Deoarece x1;:::;xn sunt (considerate ca) variabile aleatoare independente sila fel repartizate, cu media  m  si dispersia   2;  aplicand teorema limita centralarezulta ca, pentru n >> 1;  variabila aleatoare (notata,ulterior, cu  )

x m

=p 

n

este repartizata normal standard. De aici, deoarece

x = (=p 

n) + m;

se obtine imediat a…rmatia din enunt.Pentru completitudine vom arata si ca  + m 2 N (m; ); daca  2 N (0; 1);

iar  > 0; m

2R:

Demonstratia se face prin veri…care directa !Vom avea:

P ( + m x) =  P (  x m) =  P (  (x m)=) =

2N (0;1)=

  1p 2

(xm)=Z 1

et2=2dt

 t:=(sm)==

dt=1ds

1

2

xZ 1

e(sm)

22

2

ds; x 2 R:

6)  P (A x B) = (Bm=p n

)  ( Am=p n

);  pentru  n >> 1;

Solutie.  Tinand cont de rezultatul din problema precedenta vom avea:

P (A x B) =  P (A m x m B m) =

= P ( A m=

p n   x m

=p 

n   B m

=p 

n ) = ( B m

=p 

n ) ( A m

=p 

n );

deoarece   xm=p n 2 N (0; 1);  daca  n >> 1:

7)  m 2 [x zp n

; x + zp n

];  cu o eroare sub  100    %;  unde z   este unica

solutie pozitiv¼a a ecuatiei  (z) = 1  2 ;caz concret    = 0; 03 (=) z = 2; 17).

3

Page 4: Probleme de Statistică Pentru Biologi, Cu Soluții, Matematică În Biologie, 2013 - 2014

8/18/2019 Probleme de Statistică Pentru Biologi, Cu Soluții, Matematică În Biologie, 2013 - 2014

http://slidepdf.com/reader/full/probleme-de-statistica-pentru-biologi-cu-soluii-matematica-in-biologie 4/9

Reamintim c¼a:

(z) :=   1p 2

zZ 1

et2=2dt; z 2R :

Solutie.  A…rmatia din enunt este echivalenta cu:

P (m 2 [x zp 

n; x + z

p n

]) = 1

si deci cu

P (z   x m

=p 

n  z) = 1 :

Dar, pentru  n >> 1;   xm=p n

  este repartizata normal standard si deci

P (z   x m

=p 

n  z) = (z) (z) = 2(z) 1:

Ramane sa alegem  z  ca unica solutie (strict pozitiva) a ecuatiei:

2(z) 1 = 1 ;

care, la randul sau, se mai scrie sub forma:

(z) = 1 =2:

Deoarece     este strict crescatoare (0(x) = (1=p 

2)   ex2=2 >   0; 8x 2   R);

(0) = 1=2  si  (z) = 1 =2  >  1=2 = (0)  rezulta  z  >  0:  Existenta lui  zse obtine din egalitatea  (R) = (0; 1)   si din faptul ca  1 =2 2   (0; 1);  daca 2 (0; 1):

Pentru urmatoarele trei probleme vom prezenta, mai intai, cateva fapte cu

caracter teoretic.Fie  X  o variabil¼a aleatoare, numit¼a si caracteristic¼a (a procesului studiat),

asociata unei experiente cu rezultate aleatoare. Notam cu F  functia (teoretic¼a)de repartitie corespunzatoare acestei variabile. Deci

F (x) :=  P (X < x); x 2R

:

Intrucat   limx!1

F (x) = 0;   limx!1

F (x) = 1 convenim ca F (1) = 0 si F (+1) = 1:

Se vede imediat ca daca se cunoaste F  atunci se determina imediat

P (a X < b) =  F (b) F (a); 8a; b 2 R = R [f1; +1g;  cu  a < b:

4

Page 5: Probleme de Statistică Pentru Biologi, Cu Soluții, Matematică În Biologie, 2013 - 2014

8/18/2019 Probleme de Statistică Pentru Biologi, Cu Soluții, Matematică În Biologie, 2013 - 2014

http://slidepdf.com/reader/full/probleme-de-statistica-pentru-biologi-cu-soluii-matematica-in-biologie 5/9

Deoarece P (X 

 b) = lim

x&b

F (x) =  F (b + 0) se pot calcula si probabilitatile:

a)  P (a X < b) =  P (X < b) P (X < a) =  F (b) F (a);b)  P (a < X < b) =  P (X < b) P (X   a) =  F (b) F (a + 0);c) P (a X   b) =  P (X   b) P (X < a) =  F (b + 0) F (a);d)  P (X  =  a) =  P (X   a) P (X < a) =  F (a + 0) F (a):

In anumite cazuri concrete, dupa efectuarea unei analize statistice prelim-inare a setului de date din esantionul reprezentativ selectionat aleator, ni se "sug-ereaza" tipul repartitiei asociate variabilei aleatoare a‡ate in studiu. Intr-uneledintre cele mai importante cazuri intalnite in aplicatii aceste repartitii depindde unul sau mai multi parametri de a caror determinare depinde cunoasterea(completa a) respectivei repartitii.

Exemple importante.

a)   Repartitie de tip Bernoulli :

  :

  0 11  p p

;

parametrul …ind numarul real  p 2 (0; 1):b)  Repartitie de tip binomial:

  :

  0 1   :::: k :::

q n C 1n  p1q n1 :::: C  kn  pkq nk :::n

 pn

;

cu  parametrii  n2N  si  p

2(0; 1) (am notat q  = 1

 p):

c)  Repartitie de tip Poisson:

  :

  0 1   :::: n ::: p0   p1   :::: pn   :::

;

unde pn =   n

n! e; iar  n 2 N

( >  0  …ind parametrul repartitiei, numar real…xat).

d)  Repartitie normala  cu densitatea de probabilitate:

 pm;(t) =  1

2e

(tm)2

22 ; t 2 R;

avand  parametrii  m 2 R si   > 0:In general se alege o multime (nevida)     R

k si se selecteaza parametrii = (1; 2;:::;k) 2 ; iar functia de repartitie va avea o reprezentare de forma:

F (x; ) =  F (x; 1;:::;k):

5

Page 6: Probleme de Statistică Pentru Biologi, Cu Soluții, Matematică În Biologie, 2013 - 2014

8/18/2019 Probleme de Statistică Pentru Biologi, Cu Soluții, Matematică În Biologie, 2013 - 2014

http://slidepdf.com/reader/full/probleme-de-statistica-pentru-biologi-cu-soluii-matematica-in-biologie 6/9

Functia de repartitie a vectorului aleator  (X 1;:::;X n)  va …:

F (x1;:::;xn; ) =  F (x1; ) ::: F (xn; ):

Cum se face estimarea parametrilor ? O posibilitate este data de

Metoda verosimilitatii maxime.

Cazul discret.  Presupunem c¼a X  (variabil¼a aleatoare discret¼a) ia o valoarex  cu o probabilitate depinzând de parametrul  

P (X  =  x  ; ):

Se numeste   functie de verosimilitate   bazat¼a pe o selectie de volum   nfunctia :

L(x1;:::;xn; ) :=  P (X  =  x1; )

:::

P (X  =  xn; ):

Cazul continual.   Daca  X   este o variabil¼a aleatoare continual¼a si  f (x; )este densitatea de probabilitate asociat¼a se de…neste o   functie de verosimili-tate  bazat¼a pe o selectie de volum  n  functia :

L(x1;:::;xn; ) :=  f (x1; ) ::: f (xn; ):

De…nitie.  Se numeste estimatie de verosimilitate maxima  (pe scurt E.V.M.)

acea estimatie a parametrilor, notat¼a cu    = n  =  n(x1;:::;xn);care realizeazamaximul functiei de verosimilitate:

L(x1;:::;xn; ) = max2

L(x1;:::;xn; );

pentru orice selectie  (x1;:::;xn):Observatie.a) L(x1;:::;xn; ) (ca functie in variabila ) admite un maxim dac¼a (si numai

dac¼a) functia

V (x1;:::;xn; 1;:::;k) := ln L(x1;:::;xn; 1;:::;k)

admite un maxim.a) Dac¼a admitem c¼a exist¼a o E.V.M.  atunci ea este solutie a sistemului:

@jV (x1;:::;xn; 1;:::;k) = 0; 1  j  k;

cu  k  ecuatii si  k  necunoscute.8) Determinati o estimatie de verosimilitate maxim¼a pentru parametrul   p

dintr-o repartitie Bernoulli.

6

Page 7: Probleme de Statistică Pentru Biologi, Cu Soluții, Matematică În Biologie, 2013 - 2014

8/18/2019 Probleme de Statistică Pentru Biologi, Cu Soluții, Matematică În Biologie, 2013 - 2014

http://slidepdf.com/reader/full/probleme-de-statistica-pentru-biologi-cu-soluii-matematica-in-biologie 7/9

Solutie.   Dac¼a  X  :

  0 11

 p p

 atunci:

P (X  = x; p) =  px(1  p)1x; x 2 f0; 1g; p 2 (0; 1):

Prin urmareL(x1;:::;xn; p) =  psn(1  p)nsn ;

unde sn =  x1 + ::: + xn:Deci

V (x1;:::;xn; p) =  sn ln p + (n sn)ln(1  p):

Derivând functia  V , in raport cu  p;  rezult¼a:

sn p  

 n

sn1  p   = 0;

adic¼asn sn p  pn + psn = 0;

de unde^ p =

 snn

  = x:

Deoarece@ 2

@p2V (x1;:::;xn; ^ p) = sn

^ p2    n sn

(1  ^ p)2  < 0

rezult¼a c¼a   ^ p  realizeaz¼a o  E.V.M.9) Determinati o estimatie de verosimilitate maxim¼a pentru parametrul  

dintr-o repartitie Poisson.Solutie.Dac¼a

X   :

  0 1   :::: n ::: p0   p1   :::: pn   :::

;

unde   pn   =   n

n! e; >   0   …ind parametrul repartitiei Poisson, functia de

verosimilitate va …:

L(x1;:::;xn; ) =  en  x1

(x1)!  :::   xn

(xn)!; x1;:::;xn 2N:

Prin urmare

V (x1;:::;xn; ) := ln L(x1;:::;xn; ) = n + (x1 + ::: + xn) ln + C (x1;:::;xn);

unde C (x1;:::;xn) este o constant¼a (in raport cu );dar care depinde de x1;:::;xn.

7

Page 8: Probleme de Statistică Pentru Biologi, Cu Soluții, Matematică În Biologie, 2013 - 2014

8/18/2019 Probleme de Statistică Pentru Biologi, Cu Soluții, Matematică În Biologie, 2013 - 2014

http://slidepdf.com/reader/full/probleme-de-statistica-pentru-biologi-cu-soluii-matematica-in-biologie 8/9

Derivând (functia V ) in raport cu    rezult¼a:

n + 1

(x1 + ::: + xn) = 0;

de unde

 = x1 + ::: + xn

n  = x:

Deoarece@ 2

@2  ln L(x1;:::;xn; ) =  1

2 (x1 + ::: + xn) <  0

rezulta ca    realizeaza o E.V.M.10) Determinati o estimatie de verosimilitate maxim¼a pentru parametrii  m

si    dintr-o repartitie normal¼a.Solutie.In acest caz

L(x1;:::;xn; m; ) =  Cne  122

Pn

i=1(xim)2

si deci

V (x1;:::;xn; m; ) =  C 1 n ln   1

22

nXi=1

(xi m)2:

Din sistemul  @ @mV (x1;:::;xn; m; ) =   1

2

Pni=1(xi m) = 0;

@ @ V (x1;:::;xn; m; ) =   n

 +   13 P

ni=1(xi m)2 = 0;

rezult¼a:    m   =   x1+:::+xn

n  =   x;

2 =   1n

Pni=1(xi x)2 =   S 2;

unde S 2 =   1n

Pni=1(xi x)2 este dispersia de selectie.

Apoi@ 2

@m2V (x1;:::;xn; m; ) =  n

2 ;

@ 2

@m@V (x1;:::;xn; m; ) =

  @ 2

@@mV (x1;:::;xn; m; ) =  C ()

nXi=1

(xi x) = 0;

@ 2

@ 2 V (x1;:::;xn; m; ) =  n

2   3

4

nXi=1

(xi x)2

=  n

2   3

4  n2

= 2n

2 :

Prin urmare matricea hessian¼a    n2

  00   2n

2

8

Page 9: Probleme de Statistică Pentru Biologi, Cu Soluții, Matematică În Biologie, 2013 - 2014

8/18/2019 Probleme de Statistică Pentru Biologi, Cu Soluții, Matematică În Biologie, 2013 - 2014

http://slidepdf.com/reader/full/probleme-de-statistica-pentru-biologi-cu-soluii-matematica-in-biologie 9/9

are ambele valori proprii  1  =

  n2

; 2  =

 2n2

  strict negative si deci perechea

(m; 2) realizeaz¼a o  E.V.M.

9