probleme de statistică pentru biologi, cu soluții, matematică În biologie, 2013 - 2014
TRANSCRIPT
8/18/2019 Probleme de Statistică Pentru Biologi, Cu Soluții, Matematică În Biologie, 2013 - 2014
http://slidepdf.com/reader/full/probleme-de-statistica-pentru-biologi-cu-soluii-matematica-in-biologie 1/9
Probleme de statistica
2008-2009
Solutii
1) S¼a se proiecteze un sondaj pentru o populatie cu volumul N = 1 000 000:Se cunosc: volumul esantionului n = 10 000; num¼arul r¼aspunsurilor favorabile= 6 000; iar eroarea s¼a …e sub 3 %:
Solutie. Fie k o variabila aleatoare care ia valoarea 1 daca "individul"cu numarul k din populatia avuta in vedere "raspunde" cu "DA" si valoarea 0in caz contrar (1 k N ). Daca p 2 (0;1) este probabilitatea obtinerii unui"raspuns" a…rmativ atunci repartitia v.a. k este urmatoarea:
k :
0 1q p
; q = 1 p;
adica o repartitie de tip Bernoulli. Evident variabilele aleatoare de mai sus suntindependente si la fel repartizate, cu media M ( k) = 0 q + 1 p = p si dispersiaD( k) = M ( 2k) [M ( k)]2 = p p2 = pq:
Conform teoremei limita centrala v.a.
sN N pp N pq
;
pentru N >> 1; este repartizata normal standard si, pentru 2 (0; 1); exista sieste unic z > 0 astfel incat
P (
z
sN N p
p N pq z) = 2(z)
1 = 1
;
unde sN = 1 + ::: + N reprezinta numarul de "raspunsuri" a…rmative la intre-barea din sondaj. Prin urmare
sN 2 [N p zp
Npq;Np + zp
N pq ];
cu o eroare sub 100%; deci cu un coe…cient de incredere egal cu 1 : Incazul = 0; 03 obtinem (z) = 1
2 = 1 0; 015 = 0; 985 si din tabelul cu
valorile lui gasim ca z0;03 = 2; 17 (pentru = 0; 01 se obtine z0;01 = 2; 58):Din esantionul de 10 000 de "votanti" chestionati se obtine p = 6 000
10 000 = 0; 6:Asadar
s1 000 000 2 [600 000 2; 17 103 r 610
410
; 600 000 + 2; 17 103 r 610
410
];
adica
s1 000 000 2 [600 000 2; 17 102 2p
6; 600 000 + 2; 17 102 2p
6];
1
8/18/2019 Probleme de Statistică Pentru Biologi, Cu Soluții, Matematică În Biologie, 2013 - 2014
http://slidepdf.com/reader/full/probleme-de-statistica-pentru-biologi-cu-soluii-matematica-in-biologie 2/9
cu o eroare sub 3%:Mai sus am notat cu (z) := 1p
2
R z1 et
2=2 dt; z 2R; functia de repartirie
a unei v.a. repartizate normal standard. Reamintim ca:i) lim
z!1(z) = 0; lim
z!+1(z) = 1;
ii) (z) + (z) = 1; 8z 2R;iii) strict crescatoare,iv) (R) = (0; 1):2) Se d¼a un set de date de volum n = 2r; r 3; x1; x2;:::;xn: S¼a se realizeze o
prelucrare statistic¼a elementar¼a (descriptiv¼a) a setului respectiv de date (volum,ordonare cresc¼atoare, eliminarea datelor afectate de erori grosolane, interval devariatie, indicatori de pozitie, indicatori de variatie, imp¼artire in intervale delungimi egale, determinarea frecventelor absolute si relative asociate, interval
modal,functie empiric¼a de repartitie, histograma, comentarii). Caz concret:14; 16; 12; 11; 13; 12; 15; 12:
Solutie. Se va proceda absolut analog ca in cazurile tratate la Seminar !Observatie. Aceasta problema (nr.2) este obligatorie !!!!! Se consider¼a o selectie x1; x2;:::;xn; de volum n 2; din repartitia de
valori a unei variabile aleatoare X cu media m si dispersia 2( > 0): Not¼am:
x := 1
n(x1 + ::: + xn) si s2 :=
1
n 1
nXi=1
(xi x)2:
Reamintim ca selectia fx1; x2;:::;xng poate … interpretata ca …ind o re-alizare a vectorului aleator (X 1;:::;X n) in care X k reprezinta caracteristica(variabila aleatoare) X; avuta in vedere in studiul statistic pe care il efectuam,
in experimentul cu numarul k; 1 k n: Asadar vom admite, pentru a nucomplica scrierea, ca x1; x2;:::;xn sunt variabile aleatoare independente si lafel repartizate (ca si caracteristica initiala X ). Prin urmare M (xk) = m siD(xk) = 2; 81 k n:
Ar¼atati c¼a:3) M (x) = m ;Solutie.
M (x) = 1
n
nXi=1
M (xi) = 1
n
nXi=1
m = 1
n n m = m:
4) M (s2) = 2;Solutie. Utilizam urmatoarele fapte:a) M (x2
i ) := D(xi) + [M (xi)]2 = 2 + m2;b)Pn
i=1 xi = nx;c) M (x) = m ; D(x) = 2=n ;d) M (x2) = D(x) + [M (x)]2 = 2=n + m2
2
8/18/2019 Probleme de Statistică Pentru Biologi, Cu Soluții, Matematică În Biologie, 2013 - 2014
http://slidepdf.com/reader/full/probleme-de-statistica-pentru-biologi-cu-soluii-matematica-in-biologie 3/9
e) Pn
i=1(xi x)2 =Pn
i=1 x2i 2x
Pni=1 xi + nx2 =
Pni=1 x2
i nx2:Deci
(n 1)M (s2) = M [nXi=1
(xi x)2] =nXi=1
M (x2i ) nM (x2) =
=nXi=1
(2 + m2) n(2=n + m2) = n2 + nm2 2 nm2 = (n 1)2:
Simpli…cand cu (n 1) (,in ipoteza naturala n 2; ) obtinem rezultatul dorit.5) x 2 N (m; p
n); pentru n >> 1;
Solutie.Utilizam urmatoarea:Observatie . Fie o variabila aleatoare repartizata normal standard. Atunci
pentru orice m 2 R si orice > 0 avem + m 2 N (m; ) (demonstratia seface prin veri…care directa).
Deoarece x1;:::;xn sunt (considerate ca) variabile aleatoare independente sila fel repartizate, cu media m si dispersia 2; aplicand teorema limita centralarezulta ca, pentru n >> 1; variabila aleatoare (notata,ulterior, cu )
x m
=p
n
este repartizata normal standard. De aici, deoarece
x = (=p
n) + m;
se obtine imediat a…rmatia din enunt.Pentru completitudine vom arata si ca + m 2 N (m; ); daca 2 N (0; 1);
iar > 0; m
2R:
Demonstratia se face prin veri…care directa !Vom avea:
P ( + m x) = P ( x m) = P ( (x m)=) =
2N (0;1)=
1p 2
(xm)=Z 1
et2=2dt
t:=(sm)==
dt=1ds
1
p
2
xZ 1
e(sm)
22
2
ds; x 2 R:
6) P (A x B) = (Bm=p n
) ( Am=p n
); pentru n >> 1;
Solutie. Tinand cont de rezultatul din problema precedenta vom avea:
P (A x B) = P (A m x m B m) =
= P ( A m=
p n x m
=p
n B m
=p
n ) = ( B m
=p
n ) ( A m
=p
n );
deoarece xm=p n 2 N (0; 1); daca n >> 1:
7) m 2 [x zp n
; x + zp n
]; cu o eroare sub 100 %; unde z este unica
solutie pozitiv¼a a ecuatiei (z) = 1 2 ;caz concret = 0; 03 (=) z = 2; 17).
3
8/18/2019 Probleme de Statistică Pentru Biologi, Cu Soluții, Matematică În Biologie, 2013 - 2014
http://slidepdf.com/reader/full/probleme-de-statistica-pentru-biologi-cu-soluii-matematica-in-biologie 4/9
Reamintim c¼a:
(z) := 1p 2
zZ 1
et2=2dt; z 2R :
Solutie. A…rmatia din enunt este echivalenta cu:
P (m 2 [x zp
n; x + z
p n
]) = 1
si deci cu
P (z x m
=p
n z) = 1 :
Dar, pentru n >> 1; xm=p n
este repartizata normal standard si deci
P (z x m
=p
n z) = (z) (z) = 2(z) 1:
Ramane sa alegem z ca unica solutie (strict pozitiva) a ecuatiei:
2(z) 1 = 1 ;
care, la randul sau, se mai scrie sub forma:
(z) = 1 =2:
Deoarece este strict crescatoare (0(x) = (1=p
2) ex2=2 > 0; 8x 2 R);
(0) = 1=2 si (z) = 1 =2 > 1=2 = (0) rezulta z > 0: Existenta lui zse obtine din egalitatea (R) = (0; 1) si din faptul ca 1 =2 2 (0; 1); daca 2 (0; 1):
Pentru urmatoarele trei probleme vom prezenta, mai intai, cateva fapte cu
caracter teoretic.Fie X o variabil¼a aleatoare, numit¼a si caracteristic¼a (a procesului studiat),
asociata unei experiente cu rezultate aleatoare. Notam cu F functia (teoretic¼a)de repartitie corespunzatoare acestei variabile. Deci
F (x) := P (X < x); x 2R
:
Intrucat limx!1
F (x) = 0; limx!1
F (x) = 1 convenim ca F (1) = 0 si F (+1) = 1:
Se vede imediat ca daca se cunoaste F atunci se determina imediat
P (a X < b) = F (b) F (a); 8a; b 2 R = R [f1; +1g; cu a < b:
4
8/18/2019 Probleme de Statistică Pentru Biologi, Cu Soluții, Matematică În Biologie, 2013 - 2014
http://slidepdf.com/reader/full/probleme-de-statistica-pentru-biologi-cu-soluii-matematica-in-biologie 5/9
Deoarece P (X
b) = lim
x&b
F (x) = F (b + 0) se pot calcula si probabilitatile:
a) P (a X < b) = P (X < b) P (X < a) = F (b) F (a);b) P (a < X < b) = P (X < b) P (X a) = F (b) F (a + 0);c) P (a X b) = P (X b) P (X < a) = F (b + 0) F (a);d) P (X = a) = P (X a) P (X < a) = F (a + 0) F (a):
In anumite cazuri concrete, dupa efectuarea unei analize statistice prelim-inare a setului de date din esantionul reprezentativ selectionat aleator, ni se "sug-ereaza" tipul repartitiei asociate variabilei aleatoare a‡ate in studiu. Intr-uneledintre cele mai importante cazuri intalnite in aplicatii aceste repartitii depindde unul sau mai multi parametri de a caror determinare depinde cunoasterea(completa a) respectivei repartitii.
Exemple importante.
a) Repartitie de tip Bernoulli :
:
0 11 p p
;
parametrul …ind numarul real p 2 (0; 1):b) Repartitie de tip binomial:
:
0 1 :::: k :::
q n C 1n p1q n1 :::: C kn pkq nk :::n
pn
;
cu parametrii n2N si p
2(0; 1) (am notat q = 1
p):
c) Repartitie de tip Poisson:
:
0 1 :::: n ::: p0 p1 :::: pn :::
;
unde pn = n
n! e; iar n 2 N
( > 0 …ind parametrul repartitiei, numar real…xat).
d) Repartitie normala cu densitatea de probabilitate:
pm;(t) = 1
p
2e
(tm)2
22 ; t 2 R;
avand parametrii m 2 R si > 0:In general se alege o multime (nevida) R
k si se selecteaza parametrii = (1; 2;:::;k) 2 ; iar functia de repartitie va avea o reprezentare de forma:
F (x; ) = F (x; 1;:::;k):
5
8/18/2019 Probleme de Statistică Pentru Biologi, Cu Soluții, Matematică În Biologie, 2013 - 2014
http://slidepdf.com/reader/full/probleme-de-statistica-pentru-biologi-cu-soluii-matematica-in-biologie 6/9
Functia de repartitie a vectorului aleator (X 1;:::;X n) va …:
F (x1;:::;xn; ) = F (x1; ) ::: F (xn; ):
Cum se face estimarea parametrilor ? O posibilitate este data de
Metoda verosimilitatii maxime.
Cazul discret. Presupunem c¼a X (variabil¼a aleatoare discret¼a) ia o valoarex cu o probabilitate depinzând de parametrul
P (X = x ; ):
Se numeste functie de verosimilitate bazat¼a pe o selectie de volum nfunctia :
L(x1;:::;xn; ) := P (X = x1; )
:::
P (X = xn; ):
Cazul continual. Daca X este o variabil¼a aleatoare continual¼a si f (x; )este densitatea de probabilitate asociat¼a se de…neste o functie de verosimili-tate bazat¼a pe o selectie de volum n functia :
L(x1;:::;xn; ) := f (x1; ) ::: f (xn; ):
De…nitie. Se numeste estimatie de verosimilitate maxima (pe scurt E.V.M.)
acea estimatie a parametrilor, notat¼a cu = n = n(x1;:::;xn);care realizeazamaximul functiei de verosimilitate:
L(x1;:::;xn; ) = max2
L(x1;:::;xn; );
pentru orice selectie (x1;:::;xn):Observatie.a) L(x1;:::;xn; ) (ca functie in variabila ) admite un maxim dac¼a (si numai
dac¼a) functia
V (x1;:::;xn; 1;:::;k) := ln L(x1;:::;xn; 1;:::;k)
admite un maxim.a) Dac¼a admitem c¼a exist¼a o E.V.M. atunci ea este solutie a sistemului:
@
@jV (x1;:::;xn; 1;:::;k) = 0; 1 j k;
cu k ecuatii si k necunoscute.8) Determinati o estimatie de verosimilitate maxim¼a pentru parametrul p
dintr-o repartitie Bernoulli.
6
8/18/2019 Probleme de Statistică Pentru Biologi, Cu Soluții, Matematică În Biologie, 2013 - 2014
http://slidepdf.com/reader/full/probleme-de-statistica-pentru-biologi-cu-soluii-matematica-in-biologie 7/9
Solutie. Dac¼a X :
0 11
p p
atunci:
P (X = x; p) = px(1 p)1x; x 2 f0; 1g; p 2 (0; 1):
Prin urmareL(x1;:::;xn; p) = psn(1 p)nsn ;
unde sn = x1 + ::: + xn:Deci
V (x1;:::;xn; p) = sn ln p + (n sn)ln(1 p):
Derivând functia V , in raport cu p; rezult¼a:
sn p
n
sn1 p = 0;
adic¼asn sn p pn + psn = 0;
de unde^ p =
snn
= x:
Deoarece@ 2
@p2V (x1;:::;xn; ^ p) = sn
^ p2 n sn
(1 ^ p)2 < 0
rezult¼a c¼a ^ p realizeaz¼a o E.V.M.9) Determinati o estimatie de verosimilitate maxim¼a pentru parametrul
dintr-o repartitie Poisson.Solutie.Dac¼a
X :
0 1 :::: n ::: p0 p1 :::: pn :::
;
unde pn = n
n! e; > 0 …ind parametrul repartitiei Poisson, functia de
verosimilitate va …:
L(x1;:::;xn; ) = en x1
(x1)! ::: xn
(xn)!; x1;:::;xn 2N:
Prin urmare
V (x1;:::;xn; ) := ln L(x1;:::;xn; ) = n + (x1 + ::: + xn) ln + C (x1;:::;xn);
unde C (x1;:::;xn) este o constant¼a (in raport cu );dar care depinde de x1;:::;xn.
7
8/18/2019 Probleme de Statistică Pentru Biologi, Cu Soluții, Matematică În Biologie, 2013 - 2014
http://slidepdf.com/reader/full/probleme-de-statistica-pentru-biologi-cu-soluii-matematica-in-biologie 8/9
Derivând (functia V ) in raport cu rezult¼a:
n + 1
(x1 + ::: + xn) = 0;
de unde
= x1 + ::: + xn
n = x:
Deoarece@ 2
@2 ln L(x1;:::;xn; ) = 1
2 (x1 + ::: + xn) < 0
rezulta ca realizeaza o E.V.M.10) Determinati o estimatie de verosimilitate maxim¼a pentru parametrii m
si dintr-o repartitie normal¼a.Solutie.In acest caz
L(x1;:::;xn; m; ) = Cne 122
Pn
i=1(xim)2
si deci
V (x1;:::;xn; m; ) = C 1 n ln 1
22
nXi=1
(xi m)2:
Din sistemul @ @mV (x1;:::;xn; m; ) = 1
2
Pni=1(xi m) = 0;
@ @ V (x1;:::;xn; m; ) = n
+ 13 P
ni=1(xi m)2 = 0;
rezult¼a: m = x1+:::+xn
n = x;
2 = 1n
Pni=1(xi x)2 = S 2;
unde S 2 = 1n
Pni=1(xi x)2 este dispersia de selectie.
Apoi@ 2
@m2V (x1;:::;xn; m; ) = n
2 ;
@ 2
@m@V (x1;:::;xn; m; ) =
@ 2
@@mV (x1;:::;xn; m; ) = C ()
nXi=1
(xi x) = 0;
@ 2
@ 2 V (x1;:::;xn; m; ) = n
2 3
4
nXi=1
(xi x)2
= n
2 3
4 n2
= 2n
2 :
Prin urmare matricea hessian¼a n2
00 2n
2
8
8/18/2019 Probleme de Statistică Pentru Biologi, Cu Soluții, Matematică În Biologie, 2013 - 2014
http://slidepdf.com/reader/full/probleme-de-statistica-pentru-biologi-cu-soluii-matematica-in-biologie 9/9
are ambele valori proprii 1 =
n2
; 2 =
2n2
strict negative si deci perechea
(m; 2) realizeaz¼a o E.V.M.
9