aplicatii numerice de statistica in farmacie si · pdf filese spune, în acest caz, c:

202
Constantin Mircioiu Roxana Colette Sandulovici APLICATII NUMERICE DE STATISTICA IN FARMACIE SI IN STUDIILE CLINICE VOL. I – metode manuale Editia a – II – a Revizuita EDITURA UNIVERSITARA “CAROL DAVILA” BUCURESTI, 2010

Upload: tranthu

Post on 21-Mar-2018

240 views

Category:

Documents


4 download

TRANSCRIPT

Page 1: APLICATII NUMERICE DE STATISTICA IN FARMACIE SI  · PDF fileSe spune, în acest caz, c:

Constantin Mircioiu Roxana Colette Sandulovici

APLICATII NUMERICE DE

STATISTICA IN FARMACIE SI IN

STUDIILE CLINICE VOL. I – metode manuale

Editia a – II – a Revizuita

EDITURA UNIVERSITARA “CAROL DAVILA” BUCURESTI, 2010

Page 2: APLICATII NUMERICE DE STATISTICA IN FARMACIE SI  · PDF fileSe spune, în acest caz, c:

Prof. dr. farm., mat. CONSTANTIN MIRCIOIU Dr. farm., mat. ROXANA COLETTE SANDULOVICI

APLICATII NUMERICE DE

STATISTICA IN FARMACIE SI IN

STUDIILE CLINICE VOL. I – metode manuale

Editia a II – a revizuita

pentru

cursul de biostatistica

Facultatea de Farmacie, Universitatea de Medicina si Farmacie “Carol Davila”, Bucuresti

cursul de biostatistica doctoranzi

Universitatea de Medicina si Farmacie “Carol Davila”, Bucuresti

cursul de biostatistica si farmacocinetica Masterul de Biostatistica

Facultatea de Matematica, Universitatea Bucuresti

EDITURA UNIVERSITARA “CAROL DAVILA” BUCURESTI, 2010

Page 3: APLICATII NUMERICE DE STATISTICA IN FARMACIE SI  · PDF fileSe spune, în acest caz, c:

Campuri de probabilitate

1

CÂMPURI DE PROBABILITATE In teoria probabilităţilor fiecărui rezultat posibil al unui experiment

aleator, rezultat considerat ca eveniment, i se asociază o masura numerică, numită “probabilitatea” evenimentului respectiv. Această valoare este o caracteristică obiectivă a evenimentului în condiţiile experimentului dat.

Pentru operatiile cu evenimente functioneaza aceleasi proprietati ale lor din teoria multimilor: 1. ABBA ∪=∪ ABBA ∩=∩ 2. ( ) ( ) CBACBA ∪∪=∪∪ ( ) ( ) CBACBA ∩∩=∩∩ 3. AA =Φ∪ Φ=Φ∩A 4. AAA =∪ AAA =∩ 5. EEA =∪ AEA =∩ 6. ( ) ( ) ( )CABACBA ∪∩∪=∩∪ ( ) ( ) ( CABACBA ∩∪ )∩=∪∩ 7. EAA =∪ Φ=∩ AA 8. Φ=E E=Φ 9. BABA ∩=∪ BABA ∪=∩ 10 BABA ∩=−

Daca avem o familie nevida de evenimente { } IiiA ∈ , unde I este o

familie de indici cel mult numarabila, vom putea extinde operatiile de reuniune si de intersectie astfel: 1. ∩∪

Iii

Iii AA

∈∈

= ∪∩Ii

iIi

i AA∈∈

=

2. ( )∪∪ ∩

Iii

Iii BABA

∈∈

∩=⎟⎟⎠

⎞⎜⎜⎝

⎛ ( )∩∩Ii

iIi

i BABA∈∈

∪=∪⎟⎟⎠

⎞⎜⎜⎝

Spunem ca doua evenimente A si B sunt incompatibile daca nu se

pot realiza simultan: Φ=∩ BA

si spunem ca sunt independente daca realizarile lor nu se influenteaza reciproc.

Exemplul clasic de câmp de probabilitate finit îl constituie evenimentele ce pot apărea atunci când, dintr-o urnă în care se află bile albe şi negre se extrag n bile. Dacă proporţia bilelor albe în urnă este p, şi deci a celor negre este q = 1 - p, probabilitatea evenimentului A, ca din n bile extrase, k să fie albe, este:

( ) qpCAP knkkn

−=

Page 4: APLICATII NUMERICE DE STATISTICA IN FARMACIE SI  · PDF fileSe spune, în acest caz, c:

Campuri de probabilitate

2

Definitie: Fie E multimea finita a evenimentelor posibile la efectuarea unui

experiment si ( )E℘ multimea partilor lui E. Fie ( )EK ℘⊆ o multime nevida de parti ale lui E. Ea se numeste

corp de evenimente , daca verifica urmatoarele axiome: 1. KAavemKA ∈∈∀ 2. KBAavemKBA ∈∪∈∀ ,

Aplicatii:

Daca ( )EK ℘⊆ este un corp de evenimente, verificati urmatoarele proprietati: a. KEsiK ∈∈Φ

b. KAsiKAniKAn

ii

n

iii ∈∈⇒=∈∀

==∩∪

11

,1,

c. KBAKBA ∈−⇒∈, Solutie: a. Deoarece φ≠K , exista cel putin o multime KA ⊆ . Rezulta ca

KA∈ , deci KEKAA ⇒∈∪ ∈ si KE ∈ ceea ce inseamna ca K∈Φ b. Daca niKAi ,1, =∀∈ , atunci prin inductie completa se obtine ca

K An

ii ∈

=∪

1

Deoarece niKAi ,1, =∀∈ , avem niKAi ,1, =∀∈ si KAn

ii ∈

=∪

1

.

Dar KAAn

ii

n

ii ∈=

==∪∪

11

ceea ce implica KAAn

ii

n

ii ∈=

==∩∪

11

c. KBAKBAKBAKBA ∈−⇒∈∩⇒∈⇒∈ ,, Definitie:

Fie E o mulţime şi K o familie nevidă de părţi ale lui E, K ⊂℘(E) cu proprietăţile:

1. A∈ K ⇒CA∈ K 2. K⇒ ∪ K ( ) ⊂∈NiiA ∞

∈1

iA3. E∈ K

Deci, este închisă la operaţiile de complementare şi reuniune.

Page 5: APLICATII NUMERICE DE STATISTICA IN FARMACIE SI  · PDF fileSe spune, în acest caz, c:

Campuri de probabilitate

3

Se spune, în acest caz, că familia K, împreună cu operaţiile menţionate, formează un corp bolerian. Definitie:

Un element KA∈ se numeste eveniment compus daca exista doua evenimente KDB ∈, , Φ≠Φ≠ DB , , ADAB ≠≠ , astfel incat

DBA ∪= . Un eveniment Φ≠A ce nu este compus se numeste eveniment elementar. Definitie:

Fiind dat un spaţiu măsurabil ( )KE, . O funcţie P: cu proprietăţile:

[ 1,0→K ]

a) P – măsură şi b) P ( )E =1

se numeşte probabilitate. Deci, probabilitatea ar fi o măsură “normată”.

Definitie: Se numeşte măsură orice funcţie pozitivă definită pe corpul mulţimilor

măsurabile, μ : K R+ , “aditivă” pe orice familie → ( ) IiiA ∈ numărabilă de mulţimi măsurabile disjuncte:

( ) ( )∑∞∞=⇒Φ=∩∀∀

11,, nnmn AAAAmn μμ∪

Aplicatii:

Fie KBsiA ∈ . Verificati urmatoarele proprietati: a. ( ) (APCAPavemKA )−=∈∀ 1 b. ( ) 0=Φ Pc. Daca BA ⊂ , atunci ( ) ( )BPAP ≤ d. ( ) 10 ≤≤∈∀ APavemKA e. ( ) ( ) ( )BAPBPABP ∩−=− f. ( ) ( ) ( )APBPABP −=− , daca BA ⊂ g. ( ) ( ) ( ) ( )BAPBPAPABP ∩−+=∪ daca Φ≠∩ BA

h. ( ) (inegalitatea lui Boole) ∑==

−≥⎟⎟⎠

⎞⎜⎜⎝

⎛ n

ii

n

ii CAPAP

11

1∩Solutie: a. Φ=∩=∪∈∀ AAsiEAAavemKA

Page 6: APLICATII NUMERICE DE STATISTICA IN FARMACIE SI  · PDF fileSe spune, în acest caz, c:

Campuri de probabilitate

4

( ) ( ) ( ) ( ) 1==+=∪ EPAPAPAAP ( ) ( )APCAP −=⇒ 1 b. ( ) ( ) ( ) 0111 =−=−==Φ⇒=Φ EPCEPPCE c. ( )CABABBA ∩∪=⇒⊂ dar ( ) Φ=∩∩ CABA , deci

( ) ( ) ( ) ( )APCABPAPBP ≥∩+= d. ( ) ( ) ( ) ... deqEPAPPEAavemKA ⇒≤≤Φ⇒⊆⊆Φ∈∀ e. ( ) ( ) ( )CABABCAABEBB ∩∪∩=∪∩=∩=

Dar ( ) ( ) Φ=∩∪∩ CABAB , deci ( ) ( ) ( ) ( ) ( ) ... deqABPABPCABPABPBP ⇒−+∩=∩+∩=

f. ( ) ( ) ( ) ( ) ( ) (APBPABPBPABPBPABABA − )=∩−=−=⇒=∩⇒⊂

g. Deoarece Φ≠∩ BA putem scrie: ( ) ( ) ( )CBABACBBAEAA ∩∪∩=∪∩=∩= ( ) ( ) ( )CABABCAABEBB ∩∪∩=∪∩=∩=

Deci, ( ) ( ) ( )CABCBABABA ∩∪∩∪∩=∪ Cum evenimentele CABCBABA ∩∩∩ ,, sunt incompatibile

doua cate doua obtinem: ( ) ( ) ( ) ( CABPCBAPBAPBAP )∩+∩+∩=∪

Dar ( ) ( ) ( )BPAPCBAP −=∩ si ( ) ( ) ( )APBPCABP −=∩ de unde obtinem

( ) ( ) ( ) ( )BAPBPAPABP ∩−+=∪

h. Deoarece ∪ vom aplica probabilitatea obtinandu-se ∩i

ii

i CAAC =⎟⎟⎠

⎞⎜⎜⎝

( )

( )∑

−≥⎟⎟⎠

⎞⎜⎜⎝

⎛⇒

⇒≤⎟⎟⎠

⎞⎜⎜⎝

⎛=⎟⎟

⎞⎜⎜⎝

⎛−⇒⎟⎟

⎞⎜⎜⎝

⎛=⎟⎟

⎞⎜⎜⎝

⎛⎟⎟⎠

⎞⎜⎜⎝

ii

ii

ii

ii

ii

ii

ii

CAPAP

CAPCAPAPCAPACP

1

1

∪∩∪∩

Definitie: Probabilitatea condiţionată

Fie B un eveniment a cărei probabilitate este diferită de 0. Probabilitatea unui eveniment A, reprezintă proporţia în care ne aşteptăm să se realizeze A în cadrul tuturor evenimentelor câmpului de probabilitate la care aparţine A

Page 7: APLICATII NUMERICE DE STATISTICA IN FARMACIE SI  · PDF fileSe spune, în acest caz, c:

Campuri de probabilitate

5

Probabilitatea lui A se mai poate analiza însă şi în contextul în care ştim că s-a produs anterior evenimentul B. Probabilitatea evenimentului A condiţionată de B se notează, în acest caz, cu: P(A/B) sau PB(A).

În acest context apare naturală definiţia probabilităţii evenimentului A, condiţionată de B, prin formula:

( ) ( )( )BP

BAPAPB

∩=

Aplicatii: Demonstrati ca raportul de mai sus verifica axiomele

probabilitatilor: a. ( ) 0≥A PB

b. ( ) 1=EPB c. ( ) ( ) ( )DPAPDAP BBB +=∪ , daca Φ=∩ DA Demonstratie: a. Deoarece ( ) 0⟩AP si ( ) 0≥∩ BAP obtinem inegalitatea ceruta. b. Conform definitiei avem:

( ) ( )( )

( )( ) 1==

∩=

BPBP

BPBEPEPB

c.

( ) ( )[ ]( )

( ) ( )[ ]( )

( ) ( )( )

( )( )

( )( )

( ) ( )DPAPBP

BDPBP

ABPBP

BDPABPBP

BDABPBP

BDAPDAP

BB

B

+=

=∩

+∩

=∩+∩

=

=∩∪∩

=∩∪

=∪

Teorema probabilităţii cauzelor

Probabilitatea producerii oricărui eveniment X, este egală cu suma probabilităţilor de producere a lui X, condiţionate de evenimentele complete ale sistemului ( ) niiA ,1= şi

( ) ( ) ( )( ) ( )∑

= XPAPXPAPAPi

j

Ai

AjjX

Page 8: APLICATII NUMERICE DE STATISTICA IN FARMACIE SI  · PDF fileSe spune, în acest caz, c:

Campuri de probabilitate

6

Exercitii: 1. Masa, rezistenta si inaltimea sunt caracteristici independente ale unui comprimat. Probabilitatile ca un comprimat sa nu corespunda din aceste puncte de vedere sunt: 0,03; 0,05 si 0,02. Care este probabilitatea ca tableta sa corespunda in raport cu cele trei caracteristici? Solutie:

Fie E1, E2, E3 evenimentele care se realizeaza cand produsul corespunde in raport cu fiecare dintre caracteristici.

Conform ipotezei avem: ( ) ( )1 0,03P CE P comprimatul nu corespunde in raport cu masa= =

( ) ( )2 0,05P CE P comprimatul nu corespunde in raport cu rezistenta= =

( ) ( )3 0,02P CE P comprimatul nu corespunde in raport cu inaltimea= = Deci, probabilitatile de producere a evenimentelor E1, E2, E3 vor fi:

( ) ( ) 97.01 11 =−= CEPEP ( ) 95.02 =EP ( ) 98.03 =EP

Daca CE1 , CE2 , CE3 sunt independente si E1, E2, E3 sunt independente.

Asadar: ( ) ( ) ( ) ( )1 2 3 1 2 3* * 0.97 *0.95*0.98 0.9031P E E E P E P E P E∩ ∩ = = =

2. Cu datele din problema precedenta sa se calculeze probabilitatea ca produsul sa nu corespunda. Solutie: ( )

( )( )( )

P comprimatul nu corespunde

comprimatul nu corespunde in raport cu masa

P comprimatul nu corespunde in raport cu inaltimea

comprimatul nu corespunde in raport cu rezistenta

=

∪⎛ ⎞⎜ ⎟

= ∪ ∪⎜ ⎟⎜ ⎟∪⎝ ⎠

Conform ipotezei avem: ( ) ( )1 0,03P CE P comprimatul nu corespunde in raport cu masa= =

( ) ( )2 0,05P CE P comprimatul nu corespunde in raport cu rezistenta= =

( ) ( )3 0,02P CE P comprimatul nu corespunde in raport cu inaltimea= = Se utilizeaza relatia

Page 9: APLICATII NUMERICE DE STATISTICA IN FARMACIE SI  · PDF fileSe spune, în acest caz, c:

Campuri de probabilitate

7

( ) ( ) ( ) ( )( ) ( ) ( )( )

P A B D P A P B P D

P A B P A D P B D

P A B D

∪ ∪ = + + −

− ∩ − ∪ − ∩ +

+ ∩ ∩

si se obtine ( )

0969.002.0*05.0*03.002.0*05.002.0*03.005.0*03.002.005.003.0321

=+−−−−++=∪∪ CECECEP

O alta demonstratie, tinand cont de rezultatele obtinute la exercitiul

precedent: ( ) ( )11 0,9031 0,0969

P comprimatul nu corespunde P comprimatul corespunde= − =

= − =

3. In cazul la 5% din comprimatele verificate rezistenta este necorespunzatoare din cauza nerespectarii formulei de fabricatie, iar 10% din cauza reglajului incorect al masinii de comprimat. Care este probabilitatea ca rezistenta comprimatului sa fie buna? Solutie:

Fie A evenimentul care se realizeaza cand rezistenta nu corespunde din cauza formulei de fabricatie si B evenimentul care se realizeaza cand rezistenta nu corespunde din cauza reglajului masinii. ( ) ( ) 0,05P A P formulare necorespunzatoare= =

( ) ( ) 0,10P B P reglaj necorespunzator= =

( )( ) (( )( ) ( ) ( )1

P rezistenta buna

P formulare corespunzatoare reglaj corespunzator

P CA CB P C A B P A B

=

= ∩

= ∩ = ∪ = − ∪⎡ ⎤⎣ ⎦

) =

Dar ( ) ( ) ( ) ( ) 145.010.0*05.010.005.0 =−+=∩−+=∪ BAPBPAPBAP Deci, ( ) 855.0=∩CBCAP 4. O capsula este considerata corespunzatoare standardului daca indeplineste conditiile A1, A2, A3, A4. Datele statistice arata ca 90% dintre capsule indeplinesc conditia A1, 80% indeplinesc conditia A2, 85% indeplinesc conditia A3 si 95% indeplinesc conditia A4. Care este probabilitatea minima ca o capsula sa corespunda standardului?

Page 10: APLICATII NUMERICE DE STATISTICA IN FARMACIE SI  · PDF fileSe spune, în acest caz, c:

Campuri de probabilitate

8

Solutie Se aplica inegalitatea lui Boole ( ) ( )∑−≥∩ ii CAPAP 1 ( ) ( )ii APCAP −= 1

Deci ( ) ( ) (∑=

−−≥∩n

iii nAPAP

1

1)

Obtinem ( ) ( ) ( ) ( ) ( ) ( )1 2 3 4 1 2 3 4 4 10,90 0,80 0,85 0,95 3 3,5 3 0.5

P A A A A P A P A P A P A∩ ∩ ∩ ≥ + + + − − =

= + + + − = − =

Deci probabilitatea ca o capsula sa fie corespunzatoare este cuprinsa intre 0.5 si 1, probabilitatea minima fiind 0,5. 5. O instalatie este deservita de trei pompe cu functionare independenta a caror probabilitate de defectare este 0.1 ; 0.15 si 0.25. Instalatia trebuie oprita daca se defecteaza prima pompa sau pompele 2 si 3 simultan. Daca se defecteaza numai una dintre pompele 2 sau 3 instalatia poate functiona. Care este probabilitatea ca instalatia sa functioneze? Solutie

Fie A1, A2, A3 evenimentele care corespund functionarii pompelor 1, 2 si respectiv 3 si fie A evenimentul cere se realizeaza cand instalatia functioneaza.

Deci, evenimentul A se realizeaza daca: • Functioneaza toate pompele, sau • Functioneaza prima pompa, nu functioneaza pompa 2 dar functioneaza

pompa 3, sau • Functioneaza primele doua pompe si nu functioneaza pompa 3 Deci,

( ) ( ) ( )321321321 CAAAACAAAAAA ∩∩∪∩∩∪∩∩= ( ) ( ) ( ) ( )( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( )

866.025.0*85.0*9.075.0*15.0*9.075.0*85.0*9.0321321321

321321321

=++==++=

=∩∩+∩∩+∩∩=CAPAPAPAPCAPAPAPAPAP

CAAAPACAAPAAAPAP

6. Un produs farmaceutic este prelucrat in doua etape A si B. In prima etapa are loc comprimarea propriu-zisa, iar in a doua etapa are loc ambalarea produsului intermediar obtinut. Dupa etapa A comprimatele vrac sunt controlate obtinandu-se un randament de 97%. Comprimatele vrac

Page 11: APLICATII NUMERICE DE STATISTICA IN FARMACIE SI  · PDF fileSe spune, în acest caz, c:

Campuri de probabilitate

9

corespunzatoare vor fi prelucrate in etapa B obtinandu-se un randament de 95%. Care este probabilitatea ca produsul finit sa corespunda? Solutie ( ) ( ) 0,95P A P comprimat vrac corespunzator= =

( ) ( ) 0,97AP B P comprimat ambalat corespunzator= =

Conform definitiei probabilitatilor conditionate avem: ( ) ( )( )AP

ABPBPA

∩=

( ) ( ) ( ) 9215.095.0*97.0* ===∩⇒ BPAPBAP A 7. Se considera doua recipiente de reactiv B1 si B2. In recipientul B1 se afla pastile de KOH, iar in recipientul B2 pastile de KOH si de NaOH in numar egal. O pastila scoasa la intamplare din unul din recipienti se dovedeste a fi KOH. Care este probabilitatea ca aceasta pastila sa provina din B1? Solutie Fie A evenimentul ca pastila sa fie de KOH. Se aplica relatia lui Bayes:

( ) ( ) ( )( ) ( ) ( ) ( )APBPAPBP

APBPBP

BB

BA

21

1

21

11 +=

( ) ( )21

21 == BPBP

( ) 11

=APB

( )21

2=APB

Deci ( )32

1 =BPA

8. Se considera cinci loturi de comprimate cu structurile: a. Doua loturi cu 60% comprimate corespunzatoare; b. Doua loturi cu 55% comprimate corespunzatoare; c. Un lot cu 70% comprimate corespunzatoare.

Loturile constau din acelasi numar de piese. Se face controlul unui comprimat luat la intamplare. a) Care este probabilitatea ca acest comprimat sa fie necorespunzator? b) Daca se presupune ca acest comprimat este necorespunzator care este probabilitatea ca acesta sa provina dintr-un lot de tipul 2?

Page 12: APLICATII NUMERICE DE STATISTICA IN FARMACIE SI  · PDF fileSe spune, în acest caz, c:

Campuri de probabilitate

10

Solutie a) Se noteaza cu B evenimentul de a controla un comprimat necorespunzator si cu A1, A2, A3 evenimentele care constau din efectuarea controlului unui comprimat din loturile 1, 2 sau respectiv 3. ( ) ( ) ( )BPAPBP

iAi

i∑=

( )52

1 =AP , ( ) 4.01

=BPA

( )52

2 =AP , ( ) 45.02

=BPA

( )51

3 =AP , ( ) 3.03

=BPA

Deci, ( )51

51*3.0

52*45.0

52*4.0 =++=BP

b) ( ) ( ) ( )( ) 45.0

52

52*45.0

222 ===

BPBPAP

AP AB

9. Zece loturi dintre care trei de tipul A1, cinci de tipul A2 si doua de tipul A3 trec verificarile la care sunt supuse in proportie de 90%, 75% si resprectiv 85%. a) Care este probabilitatea ca un lot ales la intamplare sa fie

corespunzator. b) Care este probabilitatea ca un lot corespunzator sa fie de tipul A1. Solutie ( ) 3.01 =AP , ( ) 5.02 =AP , ( ) 2.03 =AP

Se noteaza cu B evenimentul care constata in faptul ca lotul ales trece verificarile.

( )1

0,90AP B = , ( )2

0,75AP B = , ( )3

0,85AP B =

( ) ( ) ( ) 0.815Ii A

iP B P A P B= =∑

( )( ) ( )

( )11

1 0.33AB

P A P BP A

P B= =

Page 13: APLICATII NUMERICE DE STATISTICA IN FARMACIE SI  · PDF fileSe spune, în acest caz, c:

Variabile aleatoare

11

VARIABILE ALEATOARE Definiţii:

a) Se numeşte variabilă aleatoare (întâmplătoare sau statistică) o funcţie reală f definită pe mulţimea K a evenimentelor, cu proprietatea că, oricare ar fi numărul real a, mulţimea x∈ K pentru care f(x) ≤ a este un eveniment din K.

În termeni de teoria măsurii, o variabilă aleatoare este o funcţie f : (E, K, P) (R, B), măsurabilă. →Practic vorbind avem definită probabilitatea ca variabila să aibă valori

mai mici decât orice număr dat a. b) O variabilă aleatoare se numeşte variabilă aleatoare simplă dacă ia

un număr finit de valori: f : E→R, f (E) finită şi P( f (x) = xi ) = P( f-1(xi) ) = pi

c) Doua variabile aleatoare sunt independente, daca iau valori independente una de cealaltă:

( )( ) ( )( )( ) ( )( ) ( )( )jiji yygPxxfPyygxxfP ====∩= * , ji yx ,∀ Exemplu:

Fie X o variabila aleatoare discreta (v.a.) avand tabelul de distributie:

⎟⎟⎠

⎞⎜⎜⎝

n

n

px

ppxx

X......

:21

21 unde ⎪⎩

⎪⎨⎧

=

=≥

∑=

n

ii

i

p

nip

1

1

,1,0

atunci functia de repartitie corespunzatoare va fi:

( )

⎪⎪⎪⎪

⎪⎪⎪⎪

≤⟨

≤⟨+≤⟨

=∑−

=−

n

k

ikki

xxdaca

xxxdacap

xxxdacappxxxdacap

xxdaca

xF

,1.

,.

,,,0

1

11

3221

211

1

Definitie:

Fie ( )xF functia de repartitie a unei v.a. X. Daca exista o functie

integrabila astfel incat ,atunci X se numeste variabila ( )xf ( ) ( )∫∞−

=x

duufxF

Page 14: APLICATII NUMERICE DE STATISTICA IN FARMACIE SI  · PDF fileSe spune, în acest caz, c:

Variabile aleatoare

12

aleatoare continua, iar ( )xf se numeste densitatea de probabilitate sau densitatea de repartitie a lui X Caracteristici ale variabilelor aleatoare Media:

Se numeşte valoare medie (sau speranţă matematică) a unei valori aleatoare f, numărul

M(f) = , atunci când ξ este o variabilă aleatoare simplă şi, respectiv

∑ iipx

M(f) = , atunci când ξ este o variabilă aleatoare continuă,

cu densitatea de probabilitate ρ.

( )dxxx∫+∞

∞−ρ

Momentul de ordin k al unei variabile aleatoare reprezinta generalizarea notiunii de medie:

( ) kk i iM f x= p∑ , atunci când ξ este o variabilă aleatoare simplă

şi respectiv,

Mk(f) = xkρ(x)dx , atunci când ξ este o variabilă aleatoare

continuă. ∫+∞

∞−

Momentul centrat de ordin k al unei variabile aleatoare f este momentul de ordinul k al abaterii sale faţă de medie. ( ) ( ) i

kfi

ck pxfM ∑ −= μ

şi respectiv, ,în cazul unei variabile aleatoare

continue.

( )[ ] ( )dxxfMxk

ck ρμ ∫

+∞

∞−−=

Dispersia variabilei aleatoare X de notează D(X) sau σ2 şi este, în particular, momentul centrat de ordinul doi.

D(X) = σ2 = M[(X-M(X))2] = ( )( ) ( dxxXMx ρ2

∫+∞

∞−− )

şi respectiv σ2 = M[(X-M(X))2] = ( ) iXi px 2∑ − μ , atunci când variabila aleatoare

este discretă. Rădăcina pătrată a dispersiei, σ, se numeşte abaterea medie pătratică a

variabilei X, iar sx abaterea standard.

Page 15: APLICATII NUMERICE DE STATISTICA IN FARMACIE SI  · PDF fileSe spune, în acest caz, c:

Variabile aleatoare

13

Exercitiu: Verificati urmatoarele proprietati ale mediei: dacă f şi g sunt

independente, atunci avem: a) M(af) = aM(f) b) M(f+g) = M(f) + M(g) c) M(fg) = M(f)M(g)

Solutie: Fie variabilele independente:

⎟⎟⎠

⎞⎜⎜⎝

n

n

pf

ppff

f......

:21

21 unde ⎪⎩

⎪⎨⎧

=

=≥

∑=

n

ii

i

p

nip

1

1

,1,0si

⎟⎟⎠

⎞⎜⎜⎝

m

m

qg

qqgg

g......

:21

21 unde ⎪⎩

⎪⎨

=

=≥

∑=

m

jj

j

q

mjq

11

,1,0

a) ( ) ( )faMpfapafafMi

iii

ii === ∑∑

b) ( ) ( ) ( ) ( )[ ]==∩=+=+ ∑ji

jiji ggffpgfgfM,

( ) ( ) ( )[ ] ( )

( )

( ) ( )gMfMqgpfpqgqpf

qpgqpf

qpgqpfqpgqpf

qpgfggpffpgf

jjj

iii

j iijj

i jjii

j ijij

i jjii

jijij

jijii

jijijjii

jji

ijiji

jiji

+=+=+=

=⎟⎠

⎞⎜⎝

⎛+⎟⎟

⎞⎜⎜⎝

⎛=

=+=+=

=+===+=

∑∑∑ ∑∑ ∑

∑ ∑∑ ∑

∑∑∑

∑∑

,,,

,,*

c) ( ) ( ) ( ) ( )[ ]==∩==∑ji

jiji ggffpgfgfM,

**

( ) ( ) ( )[ ] ( ) ===== ∑∑ jji

ijiji

jiji qpgfggpffpgf,,

***

( )

( ) ( ) ( )fMgMpfgM

gMpfqgpfqpgfqpgf

iii

iii

jjj

iii

i jjijijij

jii

==

==⎟⎟⎠

⎞⎜⎜⎝

⎛===

∑∑∑∑∑∑,

Page 16: APLICATII NUMERICE DE STATISTICA IN FARMACIE SI  · PDF fileSe spune, în acest caz, c:

Variabile aleatoare

14

Exercitiu: Verificati urmatoarele proprietati ale dispersiei: a) Pentru orice variabilă aleatoare X şi orice constante a şi b

D(aX+b) = a2D(X) b) Dacă X, Y sunt două variabile aleatoare independente

D(X+Y) = D(X) + D(Y) c) Între dispersie, valoarea medie şi momentul de ordinul doi există relaţia:

D(X) = M(X2) – (M(X))2 Solutie: a) ( ) ( )∑ −=

iii pxXD 2μ

( ) ( ) ( )( ) ( )

( ) ( )( ) ( )

( ) ( )XDapxa

pxapxapaax

pbabaxpbabaxbaXD

iii

iii

iii

iii

iii

iii

222

2222

22

=−=

=−=−=−=

=−−+=+−+=+

∑∑∑

∑∑

μ

μμμ

μμ

b)

( ) ( ) ( )( ) ( ) ( )( )( ) ( ) ( )( )

( ) ( ) ( )( )

2 2

, ,

22

, , ,

22

2

2

i j X Y i j i X j Y i ji j i j

i X i j j Y i j i X j Y i ji j i j i j

i X i j j Y i j i X j Y i ji j j i i j

D X Y x y p q x y p q

x p q y p q x y p q

x p q y p q x y p q

μ μ μ μ

μ μ μ μ

μ μ μ

+ = + − + = − + − =

= − + − − − − =

= − + − − − −

∑ ∑

∑ ∑ ∑

∑∑ ∑∑ ∑∑( )

μ =

( ) ( ) ( )∑ ∑∑∑∑∑ =−−−−+−=i j

jYjiXii

ij

jYjj

ji

iXi qypxpqyqpx μμμμ 222

( ) ( ) ( ) ( )YDXDqypx jj

Yjii

Xi +=−−+−= ∑∑ 0*222 μμ

c) D(X) = ( ) iXi px 2∑ − μ = ii px∑ 2 -2 iXi px μ∑ + iX p∑ 2μ =

( ) ( )( )2222

2222 1**22

XMXMpx

pxppxpx

Xi

ii

XXXi

iii i

iXiiXi

ii

−=−=

=+−=+−=

∑∑ ∑∑μ

μμμμμ

Deci, M(X2) - 2 + = M(X2) – (M(X))2 2Xμ

2Xμ

Page 17: APLICATII NUMERICE DE STATISTICA IN FARMACIE SI  · PDF fileSe spune, în acest caz, c:

Variabile aleatoare

15

Exercitii: 1. Fie urmatoarea variabila aleatoare:

⎟⎟⎠

⎞⎜⎜⎝

⎛4,03,0

431,02,0

21:X

Sa se determine functia sa de repartitie. Solutie:

( )

0, 10,2 1 2

0,2 0,1 0,3 2 30,2 0,1 0,3 0,6 3 4

1, 4

daca xdaca x

F x daca xdaca x

daca x

≤⎧⎪ ⟨ ≤⎪⎪= + = ⟨ ≤⎨⎪ + + = ⟨ ≤⎪

⟩⎪⎩

2. La o farmacie a fost inregistrat numarul de antibitice cerut zilnic pe o perioada de 50 de zile, obtinandu-se urmatoarele valori:

Cererea zilnica 3 4 5 6 7 8 Numarul de zile 3 7 12 14 10 4

a. Sa se reprezinte tabelul de distributie a variabilei aleatoare reprezentand cererea zilnica de antibiotice; b. Sa se determine functia de repartitie corespunzatoare c. Care este probabilitatea ca numarul cererilor sa fie cuprins intre 4 si 7, putand lua valoarea 4 sau 7; d. Care este probabilitatea ca cererea de antibiotice sa fie mai mare de 6; Solutie:

a. ⎟⎟

⎜⎜

5048

50107

50146

50125

5074

5033

:X deci

⎟⎟⎠

⎞⎜⎜⎝

⎛08,08

20,07

28,06

24,05

14,04

06,03

:X

b. Din definitia functiei de repartitie avem ( ) ( )xXPxF ⟨= , deci:

Page 18: APLICATII NUMERICE DE STATISTICA IN FARMACIE SI  · PDF fileSe spune, în acest caz, c:

Variabile aleatoare

16

( )

0, 30,06 3 4

0,06 0,14 0,20 4 50,06 0,14 0,24 0,44 5 6

0,06 0,14 0,24 0,28 0,72 6 70,06 0,14 0,24 0,28 0,20 0,92 7 8

1 8

daca xdaca x

daca xdaca x

F xdaca x

daca xdaca x

≤⎧⎪ ⟨ ≤⎪⎪ + = ⟨ ≤⎪ + + = ⟨ ≤⎪= ⎨ + + + = ⟨ ≤⎪⎪ + + + + = ⟨ ≤⎪

⟩⎪⎪⎩

c. ( ) ( ) ( ) ( ) ( ) ( )4 7 4 7 7 7 4 70,72 0,06 0,20 0,86

P X P X P X F F P X≤ ≤ = ≤ ⟨ + = = − + = =

= − + =

Putem demonstra si altfel: ( ) ( ) ( ) ( ) ( )( )( ) ( ) ( ) ( )

4 7 4 5 6 7

4 5 6 77 12 14 10 43 0,8650 50 50 50 50

P X P X X X X

P X P X P X P X

≤ ≤ = = ∪ = ∪ = ∪ =

= = + = + = + = =

= + + + = =

=

d. ( ) ( ) ( ) ( ) ( ) ( )6 1 6 1 6 6 1 6 6

1 0,44 0,28 0,28

P X P X P X P X F P X⟩ = − ≤ = − ⟨ + = = − − =⎡ ⎤⎣ ⎦= − − =

=

3. Sa se determine Rx∈ astfel incat variabila aleatoare X sa aiba repartitia:

⎟⎟

⎜⎜

⎛++ 8

14

: 2x

b

xxa

X

Solutie:

Conditiile impuse sunt:

[ ][ ]

⎪⎪⎪

⎪⎪⎪

=+++

∈+

∈+

181

4

1,081

4

1,0

2

2

xxx

xxx

Page 19: APLICATII NUMERICE DE STATISTICA IN FARMACIE SI  · PDF fileSe spune, în acest caz, c:

Variabile aleatoare

17

2 2 21 1 8 8 2 1 8 8 10 74 8xx x x x x x x+ + + = ⇒ + + + = ⇒ + − = 0

1,2 1 210 18 28 1

16 16 2x x si− ±

⇒ = ⇒ = − =x

21

=⇒ x singura solutie a sistemului

4. Sa se calculeze media si dispersia pentru urmatoarea variabila

aleatoare⎟⎟

⎜⎜

322

311

:X

Solutie:

( ) 1 2 51* 2* 1.663 3 3i i

iM X x pμ= = = + = =∑

( ) ( )2 2

2 5 1 5 2 4 2 61 * 2 * 0,3 3 3 3 27 27 27i i

i

D X x pμ ⎛ ⎞ ⎛ ⎞= − = − + − = + = =⎜ ⎟ ⎜ ⎟⎝ ⎠ ⎝ ⎠

∑ 22

5. Sa se calculeze suma urmatoarelor variabile aleatoare:

⎟⎟

⎜⎜

322

311

:X si ⎟⎟

⎜⎜

211

210

:Y

Solutie:

⎟⎟⎠

⎞⎜⎜⎝

⎛+

321

321:

pppYX

( ) ( ) ( )( ) ( ) ( )

61

21*

31

0*10111

==

=====∩===+= YPXPYXPYXPp

( ) ( ) ( )( ) ( ) ( )( )[ ]

( ) ( ) ( ) ( )21

63

21*

32

21*

310*21*1

121122

==+===+===

==∩=∪=∩===+=

YPXPYPXP

YXYXPYXPp

( ) ( ) ( )( ) ( ) ( )

31

62

21*

32

1*21233

===

=====∩===+= YPXPYXPYXPp

Pe 3p il putem calcula si astfel: 3 1 21 1 11 16 2 3

p p p= − − = − − =

Page 20: APLICATII NUMERICE DE STATISTICA IN FARMACIE SI  · PDF fileSe spune, în acest caz, c:

Variabile aleatoare

18

Deci, ⎟⎟

⎜⎜

⎛+

313

212

611

:YX

6. Cunoscandu-se urmatoarea variabila aleatoare ⎟⎟

⎜⎜

322

311

:X sa

se calculeze ( )23 +X DSolutie:

Vom calcula ( ) 1 21* 2*3 3i i

ix x pμ 5

3= = + =∑

( ) ( ) ( ) ( )22

2 2

3 2 3 9* 9*

5 1 5 29* 1 * 2 *3 3 3 3

4 1 1 2 69* * * 29 3 9 3 3

i ii

D X D X D X x pμ+ = = = − =

⎛ ⎞⎛ ⎞ ⎛ ⎞= − + − =⎜ ⎟⎜ ⎟ ⎜ ⎟⎜ ⎟⎝ ⎠ ⎝ ⎠⎝ ⎠⎛ ⎞= + = =⎜ ⎟⎝ ⎠

7. Sa se calculeze media si dispersia pentru suma urmatoarelor variabile aleatoare:

⎟⎟

⎜⎜

211

210

:X si ⎟⎟

⎜⎜

212

411

410

:Y

Solutie: Vom calcula media si dispersia pentru cele doua variabile aleatoare:

( )21

21*1

21*0 =+== ∑

iii pxXM si

( ) ( )2 2

2 1 1 1 1 1 1 1 1 10 * 1 * * *2 2 2 2 4 2 4 2i i

i

D X x pμ ⎛ ⎞ ⎛ ⎞= − = − + − = + =⎜ ⎟ ⎜ ⎟⎝ ⎠ ⎝ ⎠

∑ 4

Analog, ( )45

21*2

41*1

41*0 =++== ∑

iiiqyYM si

( ) ( )2 2 2

2 5 1 5 1 5 10 * 1 * 2 *4 4 4 4 4 2

25 1 1 1 9 1 44 11* * *16 4 16 4 16 2 32 8

i ii

D Y y qμ ⎛ ⎞ ⎛ ⎞ ⎛ ⎞= − = − + − + −⎜ ⎟ ⎜ ⎟ ⎜ ⎟⎝ ⎠ ⎝ ⎠ ⎝ ⎠

= + + = =

∑ =

Page 21: APLICATII NUMERICE DE STATISTICA IN FARMACIE SI  · PDF fileSe spune, în acest caz, c:

Variabile aleatoare

19

( ) ( ) ( )47

45

21

=+=+=+ YMXMYXM

( ) ( ) ( ) 5 11 214 8 8

D X Y D X D Y+ = + = + =

8. Un transport de recipienţi cu materie primă sunt controlaţi astfel: se analizează conţinutul unui recipient ales la întâmplare şi se stabileşte dacă poate fi acceptat sau nu. Se cercetează 6 recipienţi. Dacă recipientul controlat la extracţia de rang k=1,2,3,4,5 nu corespunde întregul transport este respins şi se opreşte analiza. a) Care este repartiţia variabilei aleatoare care dă numărul de recipienţi analizaţi? Se ştie că probabilitatea ca un anumit recipient să corespundă este de 2/3. b) Să se calculeze media acestei variabile. Rezolvare: Variabila aleatoare X ia valorile: X=1 dacă primul recipient este respins ⇒

P(X=1)=P(primul recipient este respins)=31

X=2 dacă primul recipient corespunde, dar al doilea recipient este respins ⇒P(X=2)=P(primul recipient corespunde şi al doilea recipient este respins)=P(primul recipient corespunde)*P(al doilea recipient este

respins)= 232

31*

32

=

X=3 dacă primele două recipiente corespund, dar al treilea recipient este respins ⇒P(X=3)=P(primul recipient corespunde, al doilea recipient corespunde şi al treilea recipient este respins)=P(primul recipient corespunde)*P(al doilea

recipient corespunde)*P(al treilea recipient este respins)= 3

2

32

31*

32*

32

=

.

.

. X=6 dacă toate recipientele corespund ⇒

P(X=6)=P(primele 5 recipientele corespund)=5

32⎟⎠⎞

⎜⎝⎛

Deci, repartiţia de probabilitatea este:

Page 22: APLICATII NUMERICE DE STATISTICA IN FARMACIE SI  · PDF fileSe spune, în acest caz, c:

Variabile aleatoare

20

X: ⎟⎟

⎜⎜

5

5

5

4

4

3

3

2

2 32

32

65

32

32

43

32

31

21

Media acestei variabile este:

( ) 5

5

5

4

4

3

3

2

2 32*6

32*5

32*4

32*3

32*2

31*1 +++++=XM

9. Fie q probabilitatea ca o reacţie de policondensare să se producă şi qp −= 1 probabilitatea ca reacţia să se întrerupă. Să se calculeze repartiţia, media şi dispersia variabilei aleatoare care dă gradul de policondensare. Solutie:

Probabilitatea formării unui polimer cu gradul de condensare n, care să conţină n-1 legături formate prin policondensare este , înmulţită cu probabilitatea de întrerupere

1−nqpq =−1 . Deci repartiţia variabilei aleatoare

este:

X: ⎟⎟⎠

⎞⎜⎜⎝

⎛− .

.....321

12 npqn

pqpqp

Se observă că 111

1 =−

=∑=

qppq

n

n

( ) ( )......321......32 1212 +++++=+++++= −− nn nqqqpnpqpqpqpXE

Deoarece din q

qqqq n

−=++++

1......2 prin derivare se obtine

( )212

11...321q

nqqq n

−=++++ − rezulta ca

( )( ) pq

pXE 11 2 =−

=

( ) ( ) ( )XEXEXD 22 −= ( ) ( )......321......32 12222122222 +++++=+++++= −− nn qnqqppqnpqpqpXE

Dar ( )2

32

1...32

qqnqqqq n

−=++++

Prin derivare rezulta:

( ) ( ) ( )( )3

122222

11......321

qpqqnqqpXE n

−+

=+++++= −

Page 23: APLICATII NUMERICE DE STATISTICA IN FARMACIE SI  · PDF fileSe spune, în acest caz, c:

Variabile aleatoare

21

( )( ) 22 1

pXE =

Rezulta ( ) ( )( ) 223

11

1pq

pqqpXD =−

−+

=

Abaterea medie patratica este ( )pq

X =σ

10. Un lot de comprimate este supus controlului pe flux in ceea ce priveste greutatea, rezistenta si inaltimea. Probabilitatea ca un comprimat sa corespunda la fiecare incercare este de 0,9. Experienta este intrerupta daca tableta nu corespunde la o anumita incercare. Sa se scrie repartitia variabilei aleatoare X care reprezinta numarul de comprimate testate. Solutie:

Se noteaza cu 9,0=q probabilitatea ca tableta sa reziste si cu probabilitatea ca ea sa nu reziste. Probabilitatea ca tableta sa

fie supusa la n incercari este deoarece ea trebuie sa reziste la n-1 incercari si sa reziste la incercarea n.

1,01 =−= qppq n 1−

Asadar:

( ) ( )⎟⎟⎠⎞

⎜⎜⎝

⎛− 1.0*9.0

: 1k

kX k=1,2,....

11. Sa se calculeze media si dispersia variabilei cu repartitia

X: ⎟⎟⎠

⎞⎜⎜⎝

⎛−− nknkk

nn

nn pqpC

nqpqCq ........

......10

11

Solutie:

( ) knkn

k

kn qpkCXE −

=∑=

0

Se porneste de la relatia: ( ) . Prin derivare dupa t

rezulta

knkkn

k

kn

n qtpCqpt −

=∑=+

0

( ) knkkn

k

kn

n qtpkCqptnp −−

=

− ∑=+ 1

0

1

Se considera 1=t si se obtine:

Page 24: APLICATII NUMERICE DE STATISTICA IN FARMACIE SI  · PDF fileSe spune, în acest caz, c:

Variabile aleatoare

22

( ) ( ) npXEqpkCqpnp knkn

k

kn

n ===+ −

=

− ∑0

1

Derivand din nou dupa t obtinem:

( ) ( ) ( ) knkkn

k

kn

nn qtpCkqpttpnnqptnp −−

=

−− ∑=+−++ 1

0

22221 1

Se considera 1=t si se obtine:

( ) ( )2

0

221 XEqpCkpnnnp knkkn

n

k==−+ −

=∑

( ) ( ) ( )( ) npqXEXEXD =−= 22 12. Sa se calculeze media si dispersia variabilei cu repartitia

X: ⎟⎟

⎜⎜

⎛−−

− .....!

......!1

10

ke

kee

k λλλ λλ

Solutie: ( ) ( ) λλλλλ λλλλ

==−

== −∞

=

−−

=

∑∑ eek

ekekXE

k

k

k

k

1

1

0 !1!

( ) ( ) ( )

( ) λλλλλλλ

λλλλ

λλλ

λλλλ

+=+=+−

=

=+−=+−==

−∞

=

−−

=

−∞

=

−∞

=

−∞

=

∑∑∑∑

22

2

22

000

2

0

22

!2

!!1

!!

eek

e

kke

kkke

kkkke

kekXE

k

kk

k

k

k

k

k

k

k

( ) ( ) ( )( ) λ=−= 22 XEXEXD

Page 25: APLICATII NUMERICE DE STATISTICA IN FARMACIE SI  · PDF fileSe spune, în acest caz, c:

Distributii de probabilitate

23

DISTRIBUTII DE PROBABILITATE Distributia binomiala

Distribuţia binomială apare la descrierea evenimentelor asociate extracţiilor dintr-o urnă cu bile albe şi bile negre.

Distribuţia variabilei aleatoare “numărul k de bile albe din n bile extrase” se poate reprezenta şi sub formă matricială:

⎟⎟⎠

⎞⎜⎜⎝

⎛= −− 011100 ......

10qpC

nqpC

kqpCqpC

X nkn

knkkn

nn

nn

Probabilitatea evenimentului este knkknk qpCp −=

Proprietati: Media şi dispersia unei variabile aleatoare repartizate binomial sunt si npM = npqD =

Repartiţia binomială apare întotdeauna atunci când un experiment

cu numai două răspunsuri posibile se repetă de n ori. Distributia Poisson

Un caz particular al distributiei binomiale îl prezintă experimentele care se repetă de un număr foarte mare de ori, iar evenimentul în a cărui apariţie suntem interesaţi are o probabilitate foarte mică, categorisit uzual ca “eveniment rar”.

Distribuţia Poisson se obţine la limită, când ∞→n , , dar rămâne constant,

0→pnp λ=np .

Deci, distribuţia Poisson este dată de matricea

⎟⎟

⎜⎜

⎛= −−−− λλλλ λλλ

en

n

ek

keeX nk

!...

!...

!1

10

Proprietati: Media şi dispersia unei variabile aleatoare distribuite Poisson sunt

( ) λ=XM si ( ) λ=XD Distributia normala

Spunem că o variabilă aleatoare este normal repartizată ( )2,σmN , atunci când densitatea sa de probabilitate este data de formula:

( )( )

2

2

2

21,, σ

πσσρ

mx

emx−

−=

Page 26: APLICATII NUMERICE DE STATISTICA IN FARMACIE SI  · PDF fileSe spune, în acest caz, c:

Distributii de probabilitate

24

Aplicatie: Daca X este o variabilă aleatoare normal repartizată ( )2,σmN ,

atunci variabila aleatoare σ

mXZ −= este normal repartizată . ( )1,0N

Variabila Z se numeste variabila aleatoare normal standardizata. Distributia χ2 Helmert - Pearson Se consideră n observaţii independente x1, x2, …, xn (variabile aleatoare independente) normal distribuite ( )2,σmN .

Variabilele standard σ

mxu i

i−

= , ni ,1= sunt de asemenea

independente, iar suma pătratelor lor va avea o distributie ce poate fi determinată. Se defineşte ∑= n

iuX1

2 . Distribuţia variabilei X rezultate se notează χ2(n)

Distributia STUDENT

Dacă sunt date două variabile aleatoare ( )1,0NZ ∈ si

independente, se spune că variabila

( )nV 2χ∈

( )ZT TVn

= ∈ n este repartizată

Student cu n grade de libertate. Distributia F (Behrens - Fisher – Snedecor) a raportului a două dispersii

Se consideră frecvent în statistică raportul a două dispersii care estimează aceeaşi dispersie generală a unei colectivităţi. Dintr-o colectivitate generală se extrag două selecţii ( )1

2 nU χ∈ , . ( )22 nV χ∈

Raportul lor este o variabilă aleatoare repartizată F

( )21

2

1 ,nnF

nVnU

F ∈=

Page 27: APLICATII NUMERICE DE STATISTICA IN FARMACIE SI  · PDF fileSe spune, în acest caz, c:

Distributii de probabilitate

25

Exercitii: 1. Probabilitatea ca un comprimat sa se sfarame este de 0.1. Presupunand ca un lot cuprinde 200 comprimate sa se calculeze numarul mediu de comprimate care se sfarama si abaterea medie patratica. Solutie: Deoarece p =0.1 este constant se utilizeaza repartitia binomiala ( ) 20200*1.0 === npXE ( ) 189.0*1.0*2002 ==== npqXD σ

2. Se stie ca 3 muncitori din 2000 fac alergie la medicamente. Care este probabilitatea ca intr-o fabrica cu 1000 de muncitori sa existe 3 muncitori alergici? Solutie: a) Se poate utiliza repartitia binomiala cu p=3/2000=0.0015 si n=1000.

knP = knkk

n qpC −

31000P =

31000331000 2000

312000

3 −

⎟⎠⎞

⎜⎝⎛ −⎟

⎠⎞

⎜⎝⎛C =0.12555

b) Folosind repartitia Poisson se obtine: ( ) 125.0!3

5.1 35.13 ==

−eP unde 5.1== npλ

3. Se stie ca probabilitatea ca un lot sa fie corespunzator este de 0.9. a. Care este probabilitatea ca din 10 loturi sa fie rebutat unul singur? b. Care este probabilitatea ca din 10 de loturi sa fie rebutat mai mult de 2 loturi? Solutie:

Suntem in cazul distributiei binomiale in care avem: ( ) 0,9P lotul este corespunzator q= =

( ) 1 0,9 0,1P lotul este necorespunzator p= − = = a) Fie X numarul de loturi rebutate. In acest caz avem 20n = si 1k = , deci:

( ) ( ) 387,09,09,0*1,0*!110!1

!109,0*1,0*1 999110 ==

−==== − CqpCXP knkk

n

b) ( ) ( ) ( ) ( ) ( )2 1 2 1 0 1 2P X P X P X P X P X⟩ = − ≤ = − = + = + = =⎡ ⎤⎣ ⎦

Page 28: APLICATII NUMERICE DE STATISTICA IN FARMACIE SI  · PDF fileSe spune, în acest caz, c:

Distributii de probabilitate

26

)( ) (

0 0 10 1 9 2 2 810 10 10

10 9 8 8 2

1 *0,1 *0,9 *0,1*0,9 *0,1 *0,9

1 0,9 0,9 0, 45*0,9 1 0,9 * 0,9 0,9 0, 45

C C C⎡ ⎤= − + + =⎣ ⎦

= − + + = − + + =

8 2 9 90,9 1 4,81 0,9 * 0,9 0,9 1 0,9 * 0,9 1 1 0,9 *2 2

1 0,387*2, 4 1 0,929 0,071

⎛ ⎞ ⎛ ⎞= − + + = − + + = − =⎜ ⎟ ⎜ ⎟⎝ ⎠ ⎝ ⎠

= − = − =2

0

4. Se stie ca 20% dintre anumite produse sunt defecte. Se aleg la intamplare 8 produse. a. Care este probabilitatea ca 0.1 sau 2 produse sa fie defecte? b. Care este probabilitatea ca cel putin doua produse sa fie

defecte? c. Care este probabilitatea ca cel mult doua produse sa fie

defecte? Solutie: Fie X numarul de produse defecte. Se ia , ( ) 0,20p P produse defecte= = 1 0,8q p= − = si 8n = . a) ( ) ( ) ( ) ( ) ==+=+=== 21021.0 XPXPXPsauXP

( ) ( )( ) ( ) 798.08,0*8,34,16,18,08,004,0*288,0*6,18,08,0

8,0*2,0*!28!2

!88,0*2,0*!18!1

!88,0

8,0*2,0*8,0*2,0*8,0*2,0*

7726

6278

6228

718

8008

==++=++=

=−

+−

+=

=++= CCC

b) ( ) ( ) ( ) ( ) ( )[ ]==+=−=≤−=⟨−=≥ 10111212 XPXPXPXPXP

[ ] ( ) =⎥⎦

⎤⎢⎣

⎡−

+−=+−= 78718

8008 8,0*2,0*

!18!1!88,018,0*2,0*8,0*2,0*1 CC

( ) 49,051,013*17,013*8,016,18,08,01 87 =−=−=−=+−= c) ( ) ( ) ( ) ( ) 798,02102 ==+=+==≤ XPXPXPXP 5. 8% din recipientele cu materie prima sunt rebutate. Care este probabilitatea ca din 20 de recipiente 2 sa fie rebutate. Solutie:

Page 29: APLICATII NUMERICE DE STATISTICA IN FARMACIE SI  · PDF fileSe spune, în acest caz, c:

Distributii de probabilitate

27

Folosind repartitia binomiala pentru p=0.08 si n=20 se obtine

( ) ( ) 2711.092.008.0!18!2

!20 182220 ==P

Folosind repartitia Poisson pentru 6.1== npλ se obtine ( ) 258.0!2

6.1 26.12 ==

−eP ⇒ Se observa ca rezultatele sunt apropiate.

6. Se stie ca 10% din productia unei fabrici este alcatuita din produse cu defectiuni. Sa se calculeze probabilitatea ca din 10 produse alese la intamplare ( cu punerea inapoi a produsului) k sa fie defecte, k=0,1,2,...,7. Solutie: Se poate aplica fie repartitia binomiala, fie repartitia Poisson.

knkkn

kn qpCP −= ,

!keP

kk

λλ −

= unde n=10; p=0.1; q=0.9 si 1== npλ

k 0 1 2 3 4 5 6 7 k

nP 0.348 0.387 0.193 0.057 0.011 0.001 0.001 0 kP 0.368 0.368 0.184 0.061 0.015 0.003 0.001 0

7. Probabilitatea de a avea un consum zilnic normal de energie este de 0.75. Fie X numarul de zile lucratoare pe saptamana, in care consumul este normal. Sa se determine : a. Repartitia variabilei aleatoare X b. Probabilitatea unui consum normal in cel mai putin 4 zile c. Media, dispersia si abaterea medie patratica a lui X. Solutie: Se aplica repartitia binomiala cu n=6 , p=3/4 si q=1/4

a) ⎟⎟ ⎠

⎞⎜⎜⎝

⎛−knkk

n qpCk

X :

Deci ⎟⎟

⎜⎜

40967296

40961458

40961215

54

4096540

4096135

32

409618

40961

10:X

b) ( ) ( ) ( ) ( ) 83.06544 ==+=+==≥ XPXPXPXP c) ( ) 5.4== npXE ( ) 125.1== npqXD ( ) ( ) 06.1== XDXσ

Page 30: APLICATII NUMERICE DE STATISTICA IN FARMACIE SI  · PDF fileSe spune, în acest caz, c:

Distributii de probabilitate

28

8. Norma prevede pentru caprolactama punctul de solidificare 2.67≥ °C. Experientele efectuate asupra unui lot arata ca punctul de

solidificare este repartizat normal cu media C07.67 si dispersia 09.02 = . Sa se determine procentul de sarje care nu corespund calitatii.

=μσSolutie:

Din ipoteza avem ca variabila aleatoare X (punctul de solidificare) este normal repartizata cu media si dispersia deci, C07.67=μ 09.02 =σ

( )( )

( )1,0NXD

XEXZ ∈−

= 66,135

3,05,0

3,07,672,67

−=−=−

=−

Se observa ca:

( ) ( )67,7 67, 2 67,767.2 1,66 0,5 0, 45150,09 0,09

XP X P P Z⎛ ⎞− −

⟨ = ⟨ = ⟨ − = −⎜ ⎟⎝ ⎠

Deci, ( )67.2 0.0485P X ⟨ = 9. Un echipament pentru producerea apei pentru solutii injectabile este alcatuit din patru sisteme independente. Probabilitatea ca un sistem sa se defecteze in timpul functionarii este de 0.1. Care este repartitia variabilei aleatoare X care da numarul de sisteme ce se pot defecta in timpul functionarii? Solutie: X este probabilitatea binomiala in care 4=n , 1.0=p si 9.01 =−= pq

( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ⎟⎟⎠

⎞⎜⎜⎝

⎛4313

4222

431

44 1.0

41.09.0

31.09.0

21.09.0

19.00

:CCC

X

Page 31: APLICATII NUMERICE DE STATISTICA IN FARMACIE SI  · PDF fileSe spune, în acest caz, c:

Distributii de probabilitate

29

10. Un operator poate controla vizual doua fiole de vaccin pe minut. Pe durata unui schimb (480 minute) se constata ca 40 de fiole de vaccin prezinta defecte de inchidere. Considerand ca numarul de fiole defecte este repartizat Poisson sa se determinde probabilitatea ca din 5 fiole cel putin doua sa fie defecte. Solutie:

Intr-un minut se constata 083.048040

= fiole defecte si sunt

inspectate vizual 2 fiole. Deci, 5 fiole de vaccin vor fi inspectate in

5.225= minute.

In acest timp se constata 2.05.2*083.0 = fiole defecte. La o repartitie Poisson λ este media, deci 2=λ

( ) ( )!

2.0 2.0

kekP

k −

=

Probabilitatea ceruta corespunde lui 5,4,3,2=k ( ) ( ) ( ) ( )5432 PPPPP +++= =0.0175

11. Sa se calculeze probabilitatea ca o variabila aleatoare normala sa ia valori intr-un interval de lungime σk de-o parte si de alta a valorii medii. Se ia k=1,2,3. Solutie: Se calculeaza ( ) ( ) ( )

( ) ( ) ( ) ( ) kzkZPkkkZkPkXkP

kXkPkXkPkXP

*2*2 =⟨=−Φ−Φ=⟨⟨−=⎟⎠⎞

⎜⎝⎛ ⟨

−⟨−=

=⟨−⟨−=+⟨⟨−=⟨−

σμ

σμσσμσμσμ

unde ( 1,0NXZ ∈−

= )σμ si ( )kk zZPz ⟨=

a) Pentru 1=k avem ( ) ( ) 6826,03413,0*2*211 1 ===⟨⟨−=⟨− zZPXP σμ

Page 32: APLICATII NUMERICE DE STATISTICA IN FARMACIE SI  · PDF fileSe spune, în acest caz, c:

Distributii de probabilitate

30

b) Pentru 2=k avem

( ) ( ) 9544,04772,0*2*2222 2 ===⟨⟨−=⟨− zZPXP σμ

c) Pentru 3=k avem ( ) ( ) 9974,04987,0*2*2333 3 ===⟨⟨−=⟨− zZPXP σμ

Se observa ca probabilitatea ca o variabila aleatoare normala sa ia

valori inafara intervalului ( )σσ 3,3− de-o parte si de alta a valorii medii este infima.

Page 33: APLICATII NUMERICE DE STATISTICA IN FARMACIE SI  · PDF fileSe spune, în acest caz, c:

Distributii de probabilitate

31

12. O variabila aleatoare este repartizata normal cu media 30 si dispersia 1002 =σ . Care este probabilitatea ca variabila aleatoare sa ia valori mai mari decat 5 ( mai mici decat -5)? Solutie:

( ) ( )5 305 210

0,5 0, 4938 0.0062

X XP X P Pμ μσ σ− − −⎛ ⎞ ⎛ ⎞⟨ = ⟨ = ⟨ − = Φ − =⎜ ⎟ ⎜ ⎟

⎝ ⎠ ⎝ ⎠= − =

,5 2.5

( ) ( )

0002.04998,05,0

5.35,310

3055

=−=

=−Φ=⎟⎠⎞

⎜⎝⎛ −⟨

−=⎟

⎠⎞

⎜⎝⎛ −−

⟨−

=−⟨σμ

σμ XPXPXP

Page 34: APLICATII NUMERICE DE STATISTICA IN FARMACIE SI  · PDF fileSe spune, în acest caz, c:

Distributii de probabilitate

32

13. O variabila aleatoare are media 2=μ si dispersia 42 =σ . Sa se calculeze ( )30 ⟨≤ XP si ( )1≤XP . Solutie:

( ) ( )0 2 2 3 20 3 1 0,52 2 2

XP X P P Z− − −⎛ ⎞≤ ⟨ = ≤ ⟨ = − ≤ ⟨ =⎜ ⎟⎝ ⎠

0 2 3 2 0,1915 0,3413 0,53282 2− −⎛ ⎞ ⎛ ⎞= Φ −Φ = + =⎜ ⎟ ⎜ ⎟

⎝ ⎠ ⎝ ⎠

b)

( ) ( ) ( )

2417.01915,04332,02

212

21

5,05,12

212

22

21111

=−=⎟⎠⎞

⎜⎝⎛ −−

Φ−⎟⎠⎞

⎜⎝⎛ −

Φ=

=−≤≤−=⎟⎠⎞

⎜⎝⎛ −

≤−

≤−−

=⟨⟨−=≤ ZPXPXPXP

Page 35: APLICATII NUMERICE DE STATISTICA IN FARMACIE SI  · PDF fileSe spune, în acest caz, c:

Distributii de probabilitate

33

14. Fie X o variabila aleatoare repartizata normal cu parametrii μ si σ . Sa se calculeze ( )μ−XE Solutie:

( ) ( ) ( ) ( )( )2

2212

x

E X x f x dx x eμ

σμ μ μσ π

− −+∞ +∞

−∞ −∞

− = − = −∫ ∫ dx =

( )( )

( )( )2 2

2 2

2 2

2 2

2

2

2 2

02 2

0 0

22

0

1 12 2

1 1 22 2 2

2 22

x x

y y

y

x e dx x e dx

ye dy ye dy ye dy

e

μ μμσ σ

μ

μ μσ π σ π

σ π σ π σ π

σ σπσ π

− −+∞− −

−∞

+∞ +∞− −

−∞

+∞−

= − − + − =

= − + = =

= − =

∫ ∫

∫ ∫ ∫2

22y

15. Densitatea de repartitie a duratei de functionare a unui sistem de

centrifugare este ( ) ττ

ττ

−= ef 1 unde τ este 3 ani. Sa se determine

probabilitatea ca intr-o instalatie formata din trei sisteme de centrifugare sa nu se defecteze nici o centrifuga in primii 6 ani de functionare. Solutie:

Probabilitatea ca durata de functionare a unei singure centrifugi sa fie mai mare de 6 ani este

26

6

1 −−−∞

==∫ eede τττ

ττ

Deoarece duratele de functionare ale evaporatoarelor sunt variabile independente, probabilitatea cautata va fi ( ) 632 −− = ee

16. Intr-un strat fluidizat se afla M=1000 kg de granula. Debitul de material prin strat este de hkgGm /4000= .

Sa se determine ce fractiune de particule se afla in strat un timp mai mic (mai mare) decat timpul mediu de stationare. Solutie:

Page 36: APLICATII NUMERICE DE STATISTICA IN FARMACIE SI  · PDF fileSe spune, în acest caz, c:

Distributii de probabilitate

34

min1560*40001000

===mG

Mτ si ( ) ττ

ττ

−= ef 1

( ) ( ) 11 −−−∞∞

=−===⟩ ∫∫ eededfP ττ

ττ

ττ

τττ

τττττ

( ) ( ) 1

01 −−==⟨ ∫ edfP ττττ

τ

Page 37: APLICATII NUMERICE DE STATISTICA IN FARMACIE SI  · PDF fileSe spune, în acest caz, c:

Estimarea intervalelor de incredere

35

ESTIMATII Problema estimării intervalelor pentru un parametru θ se reduce la

găsirea unui interval de încredere ( )UL θθ , cu un coeficient de încredere α−1 astfel încât: ( ) αθθθ −=⟨⟨ 1ULP .

Aplicatie: Presupunem ca dorim sa estimam θ , fractia oamenilor care au

tuberculoza intr-o populatie omogena cu un numar mare de indivizi. In acest scop vom alege la intamplare n indivizi pentru a fi cercetati si gasim ca x dintre ei au boala. Deoarece populatia are un numar mare de indivizi si este omogena, presupunem ca indivizii alesi pentru cercetare sunt independenti si ca fiecare are probabilitatea θ de a avea tuberculoza. Probabilitatea ca din cei n indivizi x sa aiba tuberculoza este:

( )1 n xx xnC θ θ −− , daca 0 1θ≤ ≤

Deci spatiul parametrilor este [ ]0,1H = Vom considera functia de verosimilitate:

( ) ( )1 n xxP x θ θ −= − Avem:

( ) ( ) ( )ln ln ln 1P x n xθ θ θ= + − −

( )ln1

P x n xθθ θ θ

∂ −= −

∂ − si ( )

( )

2

22 2

ln1

P x n xθθ θ θ

∂ −= − −

∂ −

Daca 1 1x n≤ ≤ − , ecuatia ( )ln0

P θθ

∂=

∂ are solutia unica x

nθ = .

Deoarece xn

θ = , ( )2

2

ln0

P θθ

∂⟨

∂acesta este un maxim relative.

Deoarece ( ) 0P θ = pentru 0θ = sau 1θ = , acesta este maximul

absolute si deci xn

θ = .

Daca 0x = , ecuatia ( )ln0

P θθ

∂=

∂nu are solutie si maximul se

realizeaza pe frontiera spatiului parametrilor [ ]0,1H = . In acest caz avem

( ) ( )1 nP θ θ= − , pentru 0 1θ≤ ≤

( )P θ are valoarea cea mai mare cand 0θ = si deci 0θ = .

Page 38: APLICATII NUMERICE DE STATISTICA IN FARMACIE SI  · PDF fileSe spune, în acest caz, c:

Estimarea intervalelor de incredere

36

Similar 1θ = pentru x n= si astfel avem xn

θ = pentru 0,1, 2,...,x n= .

Observam ca:

( ) ( )1 1 * *M M X nn n

θ θ θ= = =

Ceea ce arata ca xn

θ = este un estimator nedeplasat pentru θ .

Estimarea intervalelor de încredere pentru medii a) Cazul când se cunoaste dispersia.

Se consideră o populaţie repartizată normal ( )2,σμN . Dacă se

cunoaşte dispersia se foloseste variabila aleatoare

n

XZσμ−

= care este

repartizată ( )1,0N . Intervalul de incredere pentru medie va fi:

( ) ⎟⎟⎠

⎞⎜⎜⎝

⎛+−=

−− nzX

nzXUL

σσθθ αα2

12

1,,

Mărimea n

zE σα2

1−= poartă numele de eroare.

b) Cazul când dispersia este necunoscută Dacă nu se cunoaste dispersia se utilizeaza variabila aleatoare

1nXT Ts

n

μ−

−= ∈ , unde ( 21

1 is xn

= −− ∑ )X este dispersia de selectie.

Intervalul de incredere pentru medie va fi:

( ) ⎟⎟⎠

⎞⎜⎜⎝

⎛+−=

−−−− nstX

nstX

nnUL

21,1

21,1

,, ααθθ

În acest caz eroarea este nstE

n2

1,1 α−−

=

Dacă numărul de experienţe este , se poate folosi aproximaţia 30⟩n

21

21,1 αα

−−−= zt

n

Page 39: APLICATII NUMERICE DE STATISTICA IN FARMACIE SI  · PDF fileSe spune, în acest caz, c:

Estimarea intervalelor de incredere

37

Estimarea intervalului de încredere α−1 pentru diferenţa a două medii Se consideră două selecţii din populaţii normal repartizate

( )211 ,σμN şi ( )2

22 ,σμN . a) Cazul dispersiilor 2

221 ,σσ cunoscute..

Variabila aleatoare ( ) ( )1 2 1 2

2 21 2

1 2

X XZ

n n

μ μ

σ σ

− − −=

+

este repartizată N(0,1).

Intervalul de estimaţie pentru diferenţa mediilor este

( ) ( ) ( ) ⎟⎟⎠

⎞⎜⎜⎝

⎛++−+−−=ΘΘ

−−2

22

1

21

21

212

22

1

21

21

2121 ,,nn

zXXnn

zXX σσσσαα

În acest caz, eroarea este 2

22

1

21

21 nn

zEσσ

α +=−

.

b) Dispersii necunoscute dar presupuse egale În cazul în care nu cunoaştem dispersiile dar ştim că sunt egale

utilizăm variabila aleatoare 222

21 σσσ ==

( ) ( )

21

2121

11nn

s

XXT

p +

−−−=

μμ repartizată ( )221 −+ nnT

unde ( ) ( )2 21 1 22

1 2

12p

n s n ss

n n− + −

=+ −

21 este dispersia ponderată de selecţie

Deci, intervalul de incredere este:

( ) ⎟⎟⎠

⎞⎜⎜⎝

⎛++−+−−=ΘΘ

−−+−−+212

1,221

2121,2

212111,11,

1221 nn

stXXnn

stXX pnn

pnn

αα

cu eroarea 212

1,2

1121 nn

stE pnn+=

−−+α .

Page 40: APLICATII NUMERICE DE STATISTICA IN FARMACIE SI  · PDF fileSe spune, în acest caz, c:

Estimarea intervalelor de incredere

38

Estimarea intervalelor de încredere pentru dispersie

Considerăm o selecţie de volum n dintr-o populaţie normală ( )2,σμN . Variabila aleatoare

( ) 2

2

1n sV

σ−

=

este repartizată ( )12 −nχ şi ca urmare intervalul de incredere pentru dispersie este:

( ) ( )2

2,1

22

2

21,1

2 11

αα χσ

χ−−−

−⟨⟨

nn

snsn .

Estimarea intervalului de încredere pentru raportul a două dispersii

Se consideră selecţia aleatoare dintr-o populaţie 111211 ,...,, nxxx

( )21, ,σμN şi o selecţie dintr-o populaţie

222221 ,...,, nxxx ( )222 ,σμN .

Raportul

22

22

21

21

σ

σs

s

F =

este repartizat ( )1,1 21 −− nnF şi deci intervalul de estimaţie pentru raportul dispersiilor este:

( ) ⎟⎟⎠

⎞⎜⎜⎝

⎛=ΘΘ

−−−−−2

1,1,121

22

2,1,12

1

22

2121

,, ααnnnn

UL fssf

ss

Page 41: APLICATII NUMERICE DE STATISTICA IN FARMACIE SI  · PDF fileSe spune, în acest caz, c:

Estimarea intervalelor de incredere

39

Exercitii: 1. Sa se calculeze un interval de incredere pentru media determinarilor colorimetrice exprimate in molaritati 10-4: 1.22; 1.23; 1.18; 1.29, daca se cunoaste dispersia pentru o observatie individuala 210 . Se alege

2 10*16 M−=σ95.01 =−α

Solutie

Se utilizeaza faptul ca

n

XZσμ−

= este repartizat ( )1,0N

nzX

nzz

n

Xzz

n

Xz σμσσμ

σμ

αααααα **2

12

12

12

12

12

−−−−−⟨−⟨−⇒⟨

−⟨−⇒⟨

−⟨

⇒+−⟨−⟨−−⇒−− n

zXn

zX σμσαα **2

12

1

nzX

nzX σμσ

αα **2

12

1 −−+⟨⟨−⇒

Dar avem: ( ) Mnx

X i 44

10*23.14

10*29,118,123,122,1 −−

=+++

== ∑ ;

96.1975.02

1==

−zz α ; 4=n

Deci intervalul de incredere pentru media μ este:

210*7*96,110*23,1

210*7*96,110*23,1

54

54

−−

−− +⟨⟨− μ

MM 44 10*622,110*838,0 −− ⟨⟨⇒ μ

Page 42: APLICATII NUMERICE DE STATISTICA IN FARMACIE SI  · PDF fileSe spune, în acest caz, c:

Estimarea intervalelor de incredere

40

2. La receptionarea unei substante in recipienti care trebuie sa aiba 40 kg se efectueaza un control cantarind prin sondaj 4 recipiente. Se obtin greutatile: 39.75; 40.25; 39.50; 39.50. Sa se determine un interval de incredere pentru greutatea medie cu un coeficient de incredere 95.01 =−α daca se presupune ca greutatile sunt distribuite normal. Solutie

Deoarece nu se cunoaste dispersia se utilizeaza faptul ca 2σ

ns

XTX

μ−= este repartizat ( )1−nT unde:

( ) 75,394

50,3950,3925,4075,39=

+++== ∑

nx

X i

( )( ) ( ) ( ) ( )

=−

−+−+−+−=

=−−

= ∑

1475,3950,3975,3950,3975,3925,4075,3975,39

11

2222

22 Xxn

s iX

( ) ( ) ( )=

⎥⎥⎦

⎢⎢⎣

⎡⎟⎠⎞

⎜⎝⎛−+⎟

⎠⎞

⎜⎝⎛−+⎟

⎠⎞

⎜⎝⎛=

−+−++=

222222

41

41

21

31

325,025,050,00

221

81

83*

31

161

161

41

31

=⇒==⎟⎠⎞

⎜⎝⎛ ++= Xs

4=n ; 18,3975.0;3 =t

Intervalul de incredere este:

Page 43: APLICATII NUMERICE DE STATISTICA IN FARMACIE SI  · PDF fileSe spune, în acest caz, c:

Estimarea intervalelor de incredere

41

22*21*18,375,39

22*21*18,375,39 +⟨⟨− μ

Eroarea este 56,022*2

1*18,3 ≅=E , deci 31,4019,39 ⟨⟨ μ

3. 7 containere au greutatile 9.8; 10.2; 10.4; 9.8; 10.0; 10.2; 9.6. Sa se gaseasca un interval de incredere cu 95.01 =−α pentru media greutatii presupunand ca greutatea este distribuita normal. Solutie

Vom utiliza variabila aleatoare

ns

XTX

μ−= repartizata ( )1−nT

0.107

6,92,10108,94,102,108,9=

++++++== ∑

nx

X i ;

( )

( ) ( ) ( ) ( ) ( ) ( )

09,0104

102

102

104

102

102

61

17106,9102,10108,9104,10102,10108,9

1

222222

222222

2

2

≅⎥⎥⎦

⎢⎢⎣

⎡⎟⎠⎞

⎜⎝⎛−+⎟

⎠⎞

⎜⎝⎛+⎟

⎠⎞

⎜⎝⎛−+⎟

⎠⎞

⎜⎝⎛+⎟

⎠⎞

⎜⎝⎛+⎟

⎠⎞

⎜⎝⎛=

=−

−+−+−+−+−+−

=−

−= ∑

nXx

s iX

447.2975.0;6 =t

Intervalul de incredere:

73.0*447.210

73.0*447.210 +⟨⟨− μ

Deci ( ) ( )26.10;74.9, =ΘΘ UL

Page 44: APLICATII NUMERICE DE STATISTICA IN FARMACIE SI  · PDF fileSe spune, în acest caz, c:

Estimarea intervalelor de incredere

42

4. La determinarea continutului de substanta activa a unui numar de 2500 fiole s-a gasit greutatea medie mgX 18.126= , mgs 05.4= . Sa se calculeze un interval de incredere pentru medie. Se alege 99.01 =−α Solutie:

Deoarece 302500 ⟩=n , se poate folosi aproximaţia 2

12

1,1 αα−−−

= ztn

si se va lua 58.2995.0 =z

Avem 2500

05.4*58.218.1262500

05.4*58.218.126 +⟨⟨− μ , deci

intervalul de incredere este: 39,12697,125 ⟨⟨ μ

5. Se efectueaza 8 titrari volumetrice si se obtin rezultatele: 76.48; 76.43; 77.20; 76.45; 76.25; 76.48; 76.48; 76.60 cm3. Sa se calculeze un interval de incredere pentru media masuratorilor. Se ia 95.01 =−α Solutie

546.768

60,7648,7648,7625,7645,7620,7748,7648,76

=

=+++++++

== ∑nx

X i

( )0790.0

1

2

2 =−

−= ∑

nXx

s iX

36.2975.0;72

1;1==

−−tt

n α

Avem 2

1;12

;1 ααμ

−−−⟨

−⟨

nX

nt

sXt , deci,

XnXnstXstX **

21;1

21;1 αα μ

−−−−+⟨⟨− adica:

79.7631.76 ⟨⟨ μ 6. Determinarile succesive efectuate in doua vase deschise care contin HCl au dat normalitatile: N1 N2 15.75 15.58 15.64 15.49 15.92 15.72

Se stie ca dispersia concentratiilor este . 016,02 =σ

Page 45: APLICATII NUMERICE DE STATISTICA IN FARMACIE SI  · PDF fileSe spune, în acest caz, c:

Estimarea intervalelor de incredere

43

Sa se construiasca un interval de incredere cu coeficientul 95.01 =−α pentru diferenta 21 μμ − unde 1μ si 2μ sunt valorile teoretice

ale concentratiilor medii. Solutie

Se utilizeaza variabila ( )

2

22

1

21

2121

nn

XXz

σσ

μμ

+

−−−=

77,153

92,1564,1575,1511 =

++== ∑

nx

X i

60,153

72,1549,1558,1522 =

++== ∑

nx

X i

96.1975.0 =z

Avem, 2

12

αα−

⟨⟨ zZz ,deci ( )2

1

2

21

1

21

2121

21 αα

σσ

μμ−−

+

−−−⟨− z

nn

XXz ceea ce

inseamna ca: errXXerrXX +−⟨−⟨−− 212121 μμ unde eroarea este:

20,010,0*96,13016,0

3016,0*96,1*

2

22

1

21

21

==+=+=− nn

zerrσσ

α

Obtinem astfel: 20,060,1577,1520,060,1577,15 21 +−⟨−⟨−− μμ

1 20,03 0,37μ μ− ⟨ − ⟨ 7. Au fost examinate 75 esantioane de substanta de tipul 1 cu procentul de substanta activa 8.2 si abaterea medie patratica 0.8 si 50 esantioane de substanta de tipul 2 cu procentul de substanta activa 7.6 si abaterea medie patratica 0.6. Sa se gaseasca un interval cu coeficientul de incredere

96.01 =−α pentru diferenta 21 μμ − a continuturilor medii de substanta activa. Solutie:

2

22

1

21

212121

2

22

1

21

2121

nnzXX

nnzXX

σσμμ

σσαα ++−⟨−⟨+−−

−−

6.06.72.821 =−=− XX ; 054.298.02

1==

−zz α

Page 46: APLICATII NUMERICE DE STATISTICA IN FARMACIE SI  · PDF fileSe spune, în acest caz, c:

Estimarea intervalelor de incredere

44

5036.0

7564.0054.26.0

5036.0

7564.0054.26.0 21 ++⟨−⟨+− μμ

858.0342.0 21 ⟨−⟨ μμ 8. Pentru a studia influenta concentratiei de component catalitic asupra reactiei de obtinere a NO2 se fac doua grupe de experiente indexate prin 1 si 2 pentru concentratiile 0.5 si respectiv 1%. Se obtin datele urmatoare :

1 5.18 5.52 5.42 2 5.58 5.62 5.82

Sa se construiasca un interval de incredere cu coeficientul 0.95

pentru diferenta 21 μμ − . Se considera ca dispersiile sunt necunoscute dar egale si 95,01 =−α Solutie:

Se utilizeaza variabila ( )1 2 1 2

1 2

1 1p

X XT

Sn n

μ μ− − −=

+ distribuita Student cu

grade de libertate. 221 −+ nnAvem

37.51 =X ; 67.52 =X ; ; 08425.021 =s 07325.02

2 =s

07875.02

22

21

22

212 =

−++

=nn

ssS p ; 776.2975.0;4 =t

Page 47: APLICATII NUMERICE DE STATISTICA IN FARMACIE SI  · PDF fileSe spune, în acest caz, c:

Estimarea intervalelor de incredere

45

Deci

31

31*07875.0*776.267.537.5

31

31*07875.0*776.267.537.5

21

21

++−⟨−

−⟨+−−

μμ

μμ

Rezulta 2361.09361.0 21 ⟨−⟨− μμ 9. Greutatile unor containere sunt (in kg): 16.4; 16.1; 15.8; 17.0; 16.1; 15.9; 15.8; 16.9; 15.2; 16.0. Sa se gaseasca un interval de incredere cu

95.01 =−α pentru dispersia acestora. Solutie

Se utilizeaza variabila aleatoare ( )2

21σ

snV −= , iar intervalul de

incredere este: ( ) ( )

2

2,1

22

2

21,1

2 11

αα χσ

χ−−−

−⟨⟨

nn

snsn

Page 48: APLICATII NUMERICE DE STATISTICA IN FARMACIE SI  · PDF fileSe spune, în acest caz, c:

Estimarea intervalelor de incredere

46

023.192975.0;9 =χ ; 700.22

025.0;9 =χ

Avem 161, 2 16,1210

ixX

n= = =∑ si ( )22 1 0.286

1 is x Xn

= − =− ∑

Deci,

700.2286.0*9

023.19286.0*9 2 ⟨⟨ σ Rezulta 953.0125.0 2 ⟨⟨ σ

10. Cinci masuratori similare asupra debitului apei reci la un schimbator de caldura au dat rezultatele (kg / s): 5.76; 6.03; 5.84; 5.90; 5.89. Sa se gaseasca un interval de incredere 95.01 =−α pentru dispersia debitelor. Solutie:

5.88X = ; ; 00975.02 =s1.112

975.0;4 =χ ; 484.02025.0;4 =χ

484.000975.0*4

1.1100975.0*4 2 ⟨⟨ σ

Rezulta 08057.000351.0 2 ⟨⟨ σ

Page 49: APLICATII NUMERICE DE STATISTICA IN FARMACIE SI  · PDF fileSe spune, în acest caz, c:

Estimarea intervalelor de incredere

47

11. Se efectueaza 8 titrari volumetrice si se obtin rezultatele: 76.48; 76.43; 77.20; 76.45; 76.25; 76.48; 76.48; 76.60 cm3. Sa se calculeze un interval de incredere pentru dispersia masuratorilor. Se alege 95.01 =−α . Solutie:

( ) ( )2

2,1

22

2

21,1

2 11

αα χσ

χ−−−

−⟨⟨

nn

snsn

612,37 76,558

ixX

n= = =∑

( )22 1 0,07901 is x X

n= − =

− ∑

013.162975.0;7 =χ

690.12025.0;7 =χ

690.10790.0*7

013.160790.0*7 2 ⟨⟨ σ

Rezulta 3262.003452.0 2 ⟨⟨ σ 12. S-au facut 20 de analize ale unei materii prime si s-au gasit o dispersie a concentratiei de substanta activa 2132.0 . Sa se calculeze un interval de incredere pentru dispersia masuratorilor. Se alege 95.01 =

2 =s−α .

Solutie: 9.322

975.0;19 =χ ; 91.82025.0;19 =χ

91.82132.0*19

9.322132.0*19 2 ⟨⟨ σ

Rezulta 4545.01231.0 2 ⟨⟨ σ

Page 50: APLICATII NUMERICE DE STATISTICA IN FARMACIE SI  · PDF fileSe spune, în acest caz, c:

Estimarea intervalelor de incredere

48

13. S-a efectuat o analiza asupra continutului de substanta activa a doua loturi de materie prima. S-au analizat 25 de probe din primul lot si 16 probe din cel de al doilea lot de materie. S-a obtinut o concentratia medie 82 cu dispersia 64 pentru primul lot si concentratia medie 78 cu dispersia 49 pentru al doilea lot. Sa se gaseasca un interval de incredere cu coeficientul

98.01 =−α pentru raportul dispersiilor. Solutie:

1 2 1 2

2 2 22 2 22 2 21, 1, 1, 1,11 1 12 2

n n n n

s sf fs sα α

σσ− − −

⟨ ⟨− −

251 =n 642

1 =s

162 =n 492

2 =s

304.001.0;24.15 =f 89.299.0;24.15 =f

2221

49 49*0.304 *2.8964 64

σσ

⟨ ⟨

Avem: 2221

0.23 2,22σσ

⟨ ⟨ ⇒ 2

1

0.48 1.49σσ

⟨ ⟨ ⇒ 1

2

1 11, 49 0, 48

σσ

⟨ ⟨ ⇒

1

2

0,67 2,08σσ

⟨ ⟨

14. Se stie ca 90% din produsele unei intreprinderi sunt corespunzatoare.

Sa se gaseasca un interval de estimatie pentru proportia p de produse corespunzatoare. Se alege 95.01 =−α si se face o selectie de 100 produse. Solutie

Se utilizeaza

nqpppZˆ*ˆ

ˆ −= , unde 9.0ˆ =p ; 9.0ˆ =q ; 96.1025.0975.0 =−= zz

1001.0*9.0*96.19.0

1001.0*9.0*96.19.0 +⟨⟨− p

959.0841.0 ⟨⟨ p

Page 51: APLICATII NUMERICE DE STATISTICA IN FARMACIE SI  · PDF fileSe spune, în acest caz, c:

Verificarea ipotezelor statistice

49

VERIFICAREA IPOTEZELOR STATISTICE

Ipoteze statistice Ipotezele statistice sunt ipoteze asupra repartiţiei unor variabile

aleatoare. Ele se referă fie la parametrii repartiţiei, fie la legea propriu zisa de repartiţie. In cele ce urmeaza ne vom referi numai la ipotezele privind parametrii.

Notaţii conventionale

Ipoteza testată, presupusă adevarată, se numeşte ipoteza nulă şi se notează H0. Testarea necesită şi formularea unei ipoteze complementare, numită ipoteză alternativă şi notată HA. Probabilitatea unei decizii gresite

La verificarea ipotezelor se pot comite două feluri de erori: 1. Erorile de tipul 1 constau în respingerea ipotezei H0 atunci când aceasta este adevărată. 2. Erorile de tipul 2 constau în acceptarea ipotezei H0 atunci când aceasta este falsă. Notatii uzuale: α = P (respinge H0 / H0 adevărată) = riscul de a respinge în mod greşit H0 se numeşte nivel de semnificaţie β = P (acceptă H0 / H0 falsă) = P (respinge HA / HA adevărată) = riscul de a respinge în mod greşit HA ( )0 01 P respinge H H falsaπ β= − = se numeşte puterea testului. Pentru a verifica o ipoteză se folosesc datele de selecţie pentru calcularea unui test statistic. Domeniul de valori ale testului care corespunde respingerii ipotezei H0 cu probabilitatea α se numeşte regiune critică. Metodologia de verificare cuprinde în principiu următoarele etape: 1. se presupune, pe baza unor teste anterioare sau pe baza structurii fenomenului studiat, o repartiţie pentru populaţia statistică din care se face selectia; 2. se formulează ipoteza; 3. se calculează valoarea testului ales şi se compară cu limitele de acceptare, respectiv respingere; 4. se acceptă sau se respinge, în funcţie de rezultat, ipoteza H0.

Page 52: APLICATII NUMERICE DE STATISTICA IN FARMACIE SI  · PDF fileSe spune, în acest caz, c:

Verificarea ipotezelor statistice

50

Ipoteze asupra mediei 1. Dispersia cunoscută

Se consideră X o selecţie dintr-o populaţie normală ( )2,σμN . Ca urmare a teoremei limită centrală, variabila aleatoare

( )( )

X E X XZD X

n

μσ

− −= = este repartizata ( )1,0N .

Pentru un nivel de semnificatie α , ipotezele şi criteriile de acceptare sau respingere sunt prezentate mai jos:

H0 HA Regiunea critică

12

Z z α−

⟩ 0μμ = 0μμ ≠

12

Z z α−

⟨−

0μμ = 0μμ⟩ 1Z z α−⟩

0μμ = 0μμ⟨ 1Z z α−⟨−

2. Dispersia necunoscută În acest caz se înlocuieşte în formula anterioară σ cu estimaţia sa

şi se ţine cont că variabila aleatoare XSX

XT Sn

μ−= este repartizată

Student cu n-1 grade de libertate, unde ( )22

1

11

n

X ii

S xn =

= −− ∑ X

Page 53: APLICATII NUMERICE DE STATISTICA IN FARMACIE SI  · PDF fileSe spune, în acest caz, c:

Verificarea ipotezelor statistice

51

Ipoteze asupra diferenţelor a două medii 1. Cazul când se cunosc dispersiile

Se consideră două populaţii normale ( )211 ,σμN şi ( )2

22 ,σμN , o selecţie aleatoare din din populaţia

111211 ,...,, nxxx ( )211 ,σμN şi o selecţie

aleatoare din populaţia 222221 ,...,, nxxx ( )2

22 ,σμN . Variabila aleatoare

( ) ( )

( )( ) ( )1 1 2 1 2 1

2 21 21 2

1 2

X X X XZ

D X Xn n

2μ μ μ

σ σ

− − − − − −= =

− +

μ

este repartizată N(0,1).

2. Cazul dispersiilor necunoscute, dar presupuse egale În cazul în care nu cunoaştem dispersiile dar ştim că sunt egale

utilizăm dispersia ponderată de selecţie 222

21 σσσ ==

( ) ( ) ( ) ( )22

11

21

1 12

2

2

11

21

222

2112

1 2

−+

−+−=

−+−+−

= ∑ ∑nn

XxXxnn

snsnsn n

iip

ca un estimator nedeplasat pentru . 2σ

Variabila aleatoare ( ) ( )

21

2121

11nn

s

XXT

p +

−−−=

μμ

este repartizată ( )221 −+ nnT

3. Cazul observaţiilor perechi In cazul când observaţiile formează în mod natural perechi considerăm

variabila aleatoare 21 XXd −= . În cazul în care selecţiile aparţin la aceiaşi populaţie, media lui d va fi

zero: ( ) 0=dE .

Când se cunosc dispersiile avem ( )nn

dD d

22

212 σσ

σ +== şi variabila

aleatoare d

este repartizată ( )1,0N .

Page 54: APLICATII NUMERICE DE STATISTICA IN FARMACIE SI  · PDF fileSe spune, în acest caz, c:

Verificarea ipotezelor statistice

52

Când nu se cunosc dispersiile se folosesc dispersiile de selecţie şi se ţine

cont că variabila aleatoare

nsdd

este repartizată Student cu n-1 grade de

libertate.

Compararea proporţiilor Dacă vom considera un experiment în care răspunsul este de tip da sau

nu, de exemplu vindecare sau nevindecare, supravieţuire sau moarte, etc., numărul de rezultate k de un anumit tip în n repetări ale experimentului este o variabilă aleatoare repartizată binomial.

Variabila aleatoare standardizată ( )( )

npq

pnk

npqnpk

kDkEkz

−=

−=

−= se

aproximează ca fiind normal repartizată.

Estimarea dispersiei Considerăm o selecţie de volum n dintr-o populaţie normală ( )2,σμN .

Variabila aleatoare ( ) 2

2

1n sV

σ−

= este repartizată ( )12 −nχ .

Estimarea raportului a două dispersii

Se consideră selecţia aleatoare dintr-o populaţie 111211 ,...,, nxxx

( )211 ,σμN şi o selecţie aleatoare dintr-o populaţie

222221 ,...,, nxxx

( )222 ,σμN .

Raportul

22

22

21

21

σ

σs

s

F = este repartizat ( )1,1 21 −− nnF .

Page 55: APLICATII NUMERICE DE STATISTICA IN FARMACIE SI  · PDF fileSe spune, în acest caz, c:

Verificarea ipotezelor statistice

53

Exercitii: 1. Se presupune că efectuarea a 4 măsuratori de normalitate conduc la valoarea medie 31.2*10X M− . Se ştie ca dispersia corespunzătoare unei măsuratori este 8 2

=49*102 Mσ = − . Să se verifice ipoteza potrivit căreia

valoarea medie a normalităţii este M3 . Se alege 05.00 10−=μ =α . Soluţie: Ipotezele statistice sunt: vs. MH 3

0 10: −=μ MH A310: −≠μ

Testul utilizat:

n

XZ

σμ0−

=

Regiunea critica este

12

Z z α−

⟩ sau 1

2

Z z α−

⟨ −

3 3

4

3

4

1, 2*10 107*10

40,2*10 *2 4 0,6

7*10 7

Z− −

−= =

= = ≅

0,05 0,9751 12 2

z z zα− −

= =

Deci, regiunea critică este sau 96.1⟩z 96.1−⟨z

Cum 1,96 0,6 1,96− ⟨ ⟨ ⇒ z nu apartine regiunii critice, deci se acceptă ipoteza 0H

2. O întreprindere trebuie să livreze recipiente cu material recuperat cu greutatea de 15 kg şi abaterea medie pătratică kg5.0=σ . Un control efectuat asupra a 49 de piese duce la o valoare medie kgX 8.14= . Să se verifice ipoteza potrivit căreia masa medie este de 15 kg. Se alege 01,0=α . Soluţie: Ipotezele statistice sunt: 15:0 =μH vs 15: ≠μAH

Testul utilizat: 0XZ

n

μσ−

=

Page 56: APLICATII NUMERICE DE STATISTICA IN FARMACIE SI  · PDF fileSe spune, în acest caz, c:

Verificarea ipotezelor statistice

54

Regiunea critica: 1

2

Z z α−

⟩ sau 1

2

Z z α−

⟨−

14.8 15 0, 2*7 1, 4 2,80.5 0,5 0,549

Z − − −= = = = −

58.2995.02

1==

−zz α

Deoarece 58,28,2 −⟨− , rezulta ca z este in regiunea critica, deci

ipoteza se respinge. 0H 3. Experientele anterioare arata ca greutatea unui comprimat este o variabila aleatoare cu abaterea medie patratica de 15 mg. O selectie de volum 9 ne da o greutate medie mgX 400= . Sa se verifice la un prag de semnificatie 01.0=α ipoteza potrivit careia greutatea medie este de 420 mg. Soluţie: Ipotezele statistice sunt: 420:0 =μH vs. 420: ≠μAH

Testul utilizat: 0XZ

n

μσ−

=

Regiunea critica: 1

2

Z z α−

⟩ sau 1

2

Z z α−

⟨−

400X = 15σ = 9n = 0 420μ = 400 420 415

3

Z −= = −

58.2995.02

1==

−zz α

Deoarece 57.24 −⟨− rezulta ca Z este in regiunea critica, deci se

respinge 0H

Page 57: APLICATII NUMERICE DE STATISTICA IN FARMACIE SI  · PDF fileSe spune, în acest caz, c:

Verificarea ipotezelor statistice

55

4. O selectie de 16 loturi de coprolactoma cristalizata are continutul de baze volatile 23.0=X miliechivalenti / kg. Presupunand ca acest continut este o variabila aleatoare cu abaterea medie patratica 0.07 sa se verifice ipoteza :

20.0:0 =μH 20.0: ⟩μAH

Se alege 99.01 =−α . Soluţie :

Testul utilizat: 0XZ

n

μσ−

=

Regiunea critica: 1Z z α−⟩

0, 23X = 0,07σ = 16n = 0 0, 20μ = 0.23 0.20 1.720.07

16

Z −= ≅

33.299.0 =z

Deoarece 33,272,1 ⟨ , Z nu este in regiunea critica, deci se accepta

ipoteza 0H

5. Durata de functionare a unui electrod este o variabila aleatoare cu h200=σ . O selectie de 25 astfel de electrozi da o durata de functionare de

1380 h. Cu 01.0=α sa se verifice ipoteza: hH 1500:0 =μ hH A 1500: ⟨μ

Soluţie:

Testul utilizat: 0XZ

n

μσ−

=

Regiunea critica: Z zα⟨

Page 58: APLICATII NUMERICE DE STATISTICA IN FARMACIE SI  · PDF fileSe spune, în acest caz, c:

Verificarea ipotezelor statistice

56

hX 1380= h15000 =μ 25=n h200=σ

3200

5*120

25200

15001380−=

−=

−=Z

0.01 0,99 2.33z z= − = −

Deoarece 33,23 −⟨− rezulta ca Z se afla in regiunea critica, deci se

respinge ipoteza hH 1500:0 =μ

6. Rezultatele unor cantariri de etaloane sunt urmatoarele: 26,7 ; 26,8 ; 25,8 ; 25,7. Se poate afirma ca media greutatilor este mai mica decat 26.5 g? Se alege 05.0=α . Soluţie: Ipotezele statistice sunt: 5.26:0 =μH vs 5.26: ⟨μAH

Testul utilizat:

nS

XT 0μ−= , unde ( )22 1

1 iS xn

= −− ∑ X

Regiunea critica: α;1−⟨ ntT , unde 35,295.0;31;1,1 −=−=−= −−− ttt nn αα

25,264

7,258,258,267,26=

+++== ∑

nx

X i

( )

( ) ( ) ( ) ([ ])( ) ( )[ ] 34,0

301,155,045,055,045,0

31

25,267,2525,268,2525,268,2625,267,2614

11

1

2222

2222

22

≅=−+−++=

=−+−+−+−−

=

=−−

= ∑ Xxn

S i

Deci, 58,0≅S

86,058,050,0

58,02*25,0

458,0

5.2625,26−≅−=

−=

−=T

Page 59: APLICATII NUMERICE DE STATISTICA IN FARMACIE SI  · PDF fileSe spune, în acest caz, c:

Verificarea ipotezelor statistice

57

Deoarece 86,035,2 −⟨− , T nu este situat in regiunea critică deci se

accepta ipoteza adica 0H 5.26⟨μ 7. Douazeci si cinci de determinari ale unei conversii au dat valoarea medie 76.54=X si dispersia de selectie 42 =S . Sa se verifice daca conversia medie este mai mica decat 55. Se alege 01.0=α . Soluţie:

55:0 =μH 55: ⟨μAH

60,0220,1

25*24,0

252

5576,540 −=−=−

=−

=−

=

nS

XT

μ

Regiunea critică este α;1−⟨ ntT unde 49,299.0;241;1,1 −=−=−= −−− ttt nn αα .

Deci T nu apartine regiunii critice ceea ce inseamna ca se poate

accepta ipoteza . 0H

Page 60: APLICATII NUMERICE DE STATISTICA IN FARMACIE SI  · PDF fileSe spune, în acest caz, c:

Verificarea ipotezelor statistice

58

8. Se stie ca greutatea media a unor recipienti este 0 6.80 kgμ = . O

selectie de volum 9=n ne da greutatea medie 5.6=X si dispersia de selectie medie 25.02 = . Acest rezultat infirma experientele anterioare? Se alege 05.0=

Sα .

Soluţie: Ipotezele statistice sunt: 00 : μμ =H vs 0: μμ ≠AH

Testul utilizat:

nS

XT 0μ−= , unde ( )22 1

1 iS xn

= − X− ∑

Regiunea critica: 2

1;1 α−−

⟩n

tT sau 2

1;1 α−−

−⟨n

tT

8.1

35.0

8.65.60 −=−

=−

=

nS

XT

μ

306.2975.0;8

21;1

==−−

ttn α

Deci T nu apartine regiunii critice ceea ce inseamna ca se poate

accepta ipoteza . 0H 9. S-au facut 25 determinari asupra continutului de component activ al unui amestec etalon si s-a determinat media 45.34=X mg/l si 9.0=S . In etalon s-a introdus cantitatea 00.340 =μ mg/l. Valoarea gasita pentru medie este intamplatoare sau este datorata unor erori sistematice de metoda? Se alege 05.0=α . Soluţie Se verifica ipoteza 00 : μμ =H ; 0: μμ ≠AH

5,29,0

5*45,0

259,0

00,3445,340 ==−

=−

=

nS

XT

μ

Regiunea critică este 2

1;1 α−−

⟩n

tT sau 2

1;1 α−−

−⟨n

tT .

Page 61: APLICATII NUMERICE DE STATISTICA IN FARMACIE SI  · PDF fileSe spune, în acest caz, c:

Verificarea ipotezelor statistice

59

06,2975.0;24 =t

Deoarece , T se gaseste in regiunea critica deci respingem

ipoteza . Aşadar valoarea gasita pentru media de selectie este datorata unor erori sistematice de metoda.

06,25,2 ⟩

0H

10. Patru termometre sunt introduse intr-un mediu cu temperatura fixa 1000ºC. Ele dau indicatiile: 986, 1005, 991, 994. Sa se verifice ipoteza potrivit careia abaterile de la valoarea 10000 =μ ºC sunt datorate experientelor. Se alege 05.0=α . Soluţie: Se verifica ipoteza 00 : μμ =H ; 0: μμ ≠AH

nS

XT 0μ−= ; Regiunea critică este

21;1 α−−

⟩n

tT sau 2

1;1 α−−

−⟨n

tT .

9944

9949911005986=

+++== ∑

nx

X i ;

( )∑ −−

=22

11 Xx

nS i

( ) ( ) ( ) ( )[ ]( ) ( )[ ] 7,64194*

3103118

31

99499499499199410059949861

1

222

22222

≅=+−++−=

−+−+−+−−

=n

S

Page 62: APLICATII NUMERICE DE STATISTICA IN FARMACIE SI  · PDF fileSe spune, în acest caz, c:

Verificarea ipotezelor statistice

60

Deci 5,104,8

2*6

44.64

1000994−≅−=

−=T unde 18,3975.0;3 =t

Deoarece 18,35,118,3 ⟨−⟨− nu se respinge adica erorile sunt

datorate experientelor. 0H

11. Zece determinari ale procentului de clor dintr-o soluţie au condus la

832.0=X % si 02.0=S %. Daca adevaratul continut este 9.00 =μ % sa se verifice ipoteza 00 : μμ =H ; 0: μμ ⟨AH Se alege 05.0=α . Soluţie :

9.5

1002.0

9.0832.00 −=−

=−

=

nS

XT

μ

Zona critică este α,1−⟨ ntT

1, 9;0,05 9;0,95 2, 262nt t tα− = = − = −

Se respinge ipoteza . 0H

Page 63: APLICATII NUMERICE DE STATISTICA IN FARMACIE SI  · PDF fileSe spune, în acest caz, c:

Verificarea ipotezelor statistice

61

12. Determinarile succesive efectuate in doua vase deschise care contin HCl au dat rezultatele :

I II 15.75 15.58 15.64 15.49 15.92 15.72

Sa se stabileasca daca cele doua vase au in medie aceeasi compozitie. Se cunoaste distersia . Se alege 16.02

221 == σσ 95.01 =−α

Soluţie : Se verifica 210 : μμ =H ; 21: μμ ≠AH

Se utilizează variabila ( )

2

22

1

21

2121

nn

XXZσσ

μμ

+

−−−= unde

77.153

92,1564,1575,151 =

++=X si 60.15

372,1549,1558,15

2 =++

=X

Conform ipotezei 210 : μμ =H , deci 021 =− μμ

Deci 5,023

4,017,0

316,0

316,0

060,1577,15≅=

+

−−=Z ;

96.1975.02

1==

−zz α

Zona critică este 2

1 α−

⟩ zZ sau 2

1 α−

−⟨ zZ

Nu se poate respinge deoarece 0H 96.15,096.1 ⟨⟨−

Page 64: APLICATII NUMERICE DE STATISTICA IN FARMACIE SI  · PDF fileSe spune, în acest caz, c:

Verificarea ipotezelor statistice

62

13. Doua cantare automate M1 si M2 sunt folosite pentru ambalarea unui produs in pachete de 1000 g. Se stie ca produsele ambalate au masele repartizate normal cu mediile 1μ si 2μ si abaterile medii patratice g31 =σ , respectiv g42 =σ . Se cantaresc cate 100 pachete din produsele ambalate de fiecare dintre cantare si se obtin rezultatele gX 10071 = si g1002=X 2 .

La un prag de semnificatie 01.0=α sa se verifice daca pachetele ambalate au aceeasi masa. Soluţie:

Ipotezele statistice sunt: 0 1 2 0 1 2

1 2 1 2

: :: :A A

H HH H

μ μ μ μμ μ μ μ

00

= − =⎧ ⎧⇔⎨ ⎨≠ − ≠⎩ ⎩

;

Testul utilizat: ( )1 2 1 2

2 21 2

1 2

X XZ

n n

μ μ

σ σ

− − −=

+

Regiunea critica: 1

2

Z z α−

⟩ sau 1

2

Z z α−

⟨−

2 2

1007 1002 0 5 10253 4

100100 100

Z − −= = =

+

58.2995.0 =z

Deoarece

21 α−

⟩ zZ se respinge ipoteza . 0H

14. Se analizeaza doua loturi de materii prime indexate prin 1 si 2. Pentru cele 75 (80) de probe din lotul 1 (2) se obtin concentratiile medii

441 =X (respectiv 402 =X ). Se stie ca dispersiile sunt 10021 =σ si

402 =σ . Cu un prag de semnificatie 01.02 =α sa se verifice daca diferenta medie de concentratie intre cele doua loturi este mai mare decat 2. Soluţie:

2: 210 =− μμH ; 2: 21 ⟩− μμAH

Page 65: APLICATII NUMERICE DE STATISTICA IN FARMACIE SI  · PDF fileSe spune, în acest caz, c:

Verificarea ipotezelor statistice

63

( )

2

22

1

21

2121

nn

XXZσσ

μμ

+

−−−=

751 =n 802 =n 441 =X 402 =X 1002

1 =σ 4022 =σ

221 =− μμ

Deci, ( )5.1

116*2

21

34

2

8040

75100

24044

2

22

1

21

2121 ≅=+

=+

−−=

+

−−−=

nn

XXZ

σσ

μμ

Regiunea critică este unde α−⟩ 1zZ 33.299.01 ==− zz α , deci se acceptă 0H 15. Pentru a studia efectul concentratiei de catalizator asupra conversiei se fac doua grupe de observatii si se obtin datele:

I II 5.18 5.58 5.52 5.62 5.42 5.82

Se poate considera ca cele doua tipuri de catalizator duc la aceeasi conversie medie? Se alege 05.0=α si se considera dispersiile egale. Soluţie :

210 : μμ =H vs 21: μμ ≠AH

Page 66: APLICATII NUMERICE DE STATISTICA IN FARMACIE SI  · PDF fileSe spune, în acest caz, c:

Verificarea ipotezelor statistice

64

37.53

42,552,518,51 ≅

++=X ; 67.5

382,562,558,5

2 ≅++

=X ;

Avem: ( )∑=

−−

=1

1

2

111

21 1

1 n

ii Xx

ns ; ( )∑

=

−−

=2

1

2

222

22 1

1 n

ii Xx

ns si

( ) ( )2

11

21

222

2112

−+−+−

=nn

snsnS p

Deci,

( ) ( ) ( )[ ] 03,006,0*2137,542,537,552,537,518,5

131 2222

1 =≅−+−+−−

=s

( ) ( ) ( )[ ] 015,003,0*2167,582,567,562,567,558,5

131 2222

2 =≅−+−+−−

=s

( ) 0225.04

015,003,02233

22 22

212 =

+=

−++

=ssS p , deci 15,0=pS

( )

21

2121

11nn

S

XXT

p +

−−−=

μμ este distribuita T cu 221 −+ nn grade de libertate.

44,262

3*4232

23

15,03,0

31

3115,0

067,537,5−≅−=−=−=−=

+

−−=T

Regiunea critica este 2

;221α

−+⟨

nntT si

21;221α

−−+⟩

nntT

776.2975.0;4 =t

Deoarece 776.244,2776.2 ⟨−⟨− nu se poate respinge . 0H

Page 67: APLICATII NUMERICE DE STATISTICA IN FARMACIE SI  · PDF fileSe spune, în acest caz, c:

Verificarea ipotezelor statistice

65

16. Pentru a compara doua benzine cu cifrele octanice 90 si 98 o anumita cantitate este folosita in 5 automobile pentru incercare. Se masoara distanta parcursa pana la oprire si se obtin valorile

98 90 X (km) 22.7 21.3 S (km) 0.45 0.55

Sa se verifice daca cele doua benzine sunt diferite. Se alege 05.0=α Soluţie:

90980 : μμ =H vs 9098: μμ ≠AH

252.0255

55.0*445.0*42

22 22

21

22

212 =

−++

=−+

+=

nnssS p deci 5.0=pS

45.4

32*5.0

3.217.2211

21

9098 =−

=+

−=

nnS

XXT

p

;

306.2975.0;8 =t deci se respinge 0H 17. Cinci determinari de debit pentru un schimbator de caldura au dat valorile: 5.84; 5.76; 6.03; 5.90; 5.87 kg / s. Se poate presupune ca dispersia pentru aceste masuratori este mai mica decat 0.01? se alege 025.0=α Soluţie :

01.0: 20 =σH ; vs. 01.0: 2 ⟨σAH

Page 68: APLICATII NUMERICE DE STATISTICA IN FARMACIE SI  · PDF fileSe spune, în acest caz, c:

Verificarea ipotezelor statistice

66

Se utilizează variabila ( ) 20

22 1

σχ Sn −= ; 5,88X = , ; 2 0.009S =

2 4*0.009 3.90.01

χ = = Regiunea critică este data de 2,1

2αχχ −⟨ n

Deoarece nu se respinge si nu putem considera

484.02025.0;4 =χ 0H

01.02 ⟨σ 18. Doua echipe de experimentatori au efectuat cate 13 observatii asupra unor temperaturi de reactie. S-au obtinut rezultatele:

8423.3101 =X °C, , respectiv 1867.121 =s

5246.3102 =X °C, 5757.122 =s

Exista diferente semnificative intre rezultatele obtinute? Se alege 02.0=α . Soluţie:

Inainte de a aplica testul T se aplica testul F pentru a ne asigura de egalitatea dispersiilor.

a) Aplicam testul F privind egalitatea dispersiilor

22

210 : σσ =H ; vs. 2

221: σσ ≠AH

Se utilizează variabila 3.11867.15757.1

22

21 ===

ssF

Se alege 02.0=α ; 16.499.0;12,12 =f ; 241.001.0;12,12 =f Deoarece 16.43.1241.0 ⟨⟨ se acceptă ipoteza , deci dispersiile

sunt egale. 0H

b) Aplicam testul T privind egalitatea mediilor

Page 69: APLICATII NUMERICE DE STATISTICA IN FARMACIE SI  · PDF fileSe spune, în acest caz, c:

Verificarea ipotezelor statistice

67

689.046095.03117.0

11

21

21 ==+

−=

nnS

XXT

p

;

3812.124

5757.1*121867.1*122 =+

=pS ; 064.2025.0;24 −=t ; 064.2975.0;24 =t

Deoarece 064.2689.0064.2 ⟨⟨− nu se respinge ipoteza , deci intre cele doua echipe nu exista deosebiri semnificative.

0H

19. Doua pompe cu debitul nominal de 100 l/min au functionat cu debitele: 1 97.8 98.9 101.2 98.8 102 99 99.1 100.8 100.9 100.5 2 97.2 100.5 98.2 98.3 97.5 99.9 97.9 96.8 97.4 97.2 Sa se verifice daca sunt caracterizate de aceeasi dispersie. Se alege 05.0=α Soluţie Se aplica testul F:

22

210 : σσ =H ; 2

221: σσ ≠AH

9.991 =X , , 69.121 =s

1.982 =X , 44.122 =s

17.144.169.1

22

21 ===

ssF ; 03.4975.0;9,9 =f ; 248.0025.0;9,9 =f

Deoarece 03.417.1248.0 ⟨⟨ nu se respinge ipoteza . 0H

Page 70: APLICATII NUMERICE DE STATISTICA IN FARMACIE SI  · PDF fileSe spune, în acest caz, c:

Verificarea ipotezelor statistice

68

20. Doua clase de experiente dau rezultatele: 219.11 =X , , 28.02

1 =s 161 =n 179.12 =X , , 143.02

2 =s 152 =n Se poate trage concluzia ca ambele experiente duc la acelasi rezultat? Se alege 05.0=α Soluţie: Se aplica testul F si pe aceasta baza testul T.

22

210 : σσ =H ; 2

221: σσ ≠AH

08.1143.0208.0

22

21 ===

ssF ; 89.2975.0;14,15 =f ; 339.0025.0;14,15 =f

Deoarece 89.208.1339.0 ⟨⟨ nu se respinge ipoteza . 0HIn continuare se aplica testul T

210 : μμ =H ; vs. 21: μμ ≠AH

201.029

193.0*14208.0*152 =+

=pS

252.035.0*447.0

179.1219.111

21

21 =−

=+

−=

nnS

XXT

p

; 045.2975.0;27 =t

Deoarece 045.2252.0045.2 ⟨⟨− se acceptă ipoteza 210 : μμ =H .

Page 71: APLICATII NUMERICE DE STATISTICA IN FARMACIE SI  · PDF fileSe spune, în acest caz, c:

Verificarea ipotezelor statistice

69

21. S-au efectuat doua serii de cate 25 de experiente obtinandu-se abaterile standard 023.01 =s si 019.02 =s . Sa se compare dispersiile celor doua serii de experiente. Soluţie Se aplica testul F

22

210 : σσ =H ; 2

221: σσ ≠AH

5.1019.0023.0

2

2

22

21 ===

ssF

Se alege 05.0=α si 98.195.0;24,24 =f ,

deci nu se poate respinge ipoteza . 0H Pentru 10.0=α si 70.190.0;24,24 =f concluzia este aceeasi.

Page 72: APLICATII NUMERICE DE STATISTICA IN FARMACIE SI  · PDF fileSe spune, în acest caz, c:

Verificarea ipotezelor statistice

70

22. Determinarea efectului antiinflamator al Algopirinului s-a efectuat pe modelul de inflamaţie experimentală cu carrageenan la nivelul labei piciorului posterior la şobolani. S-au utilizat şobolani Wistar cu greutate de 120 ± 10 g în loturi de câte 10 şobolani pentru fiecare variantă experimentală. S-a utilizat o soluţie salină de 1% carrageenan injectată în volum de 0,1 ml s.c. în laba posterioară.

Volumul labei a fost determinat înainte de administrare şi la 3 ore după injectarea soluţiei de carrageenan. Preparatele antiinflamatorii s-au administrat cu 1 oră în prealabil carageenanului, iar la 3 ore după administrarea acestora a fost determinat volumul labelor posterioare. Laba contralaterală a constituit referinţa.

S-au obtinut urmatoarele date experimentale: Acetyl salicylic acid

Chlorpheniramin ALGOPIRIN Lot control Sobolan

Initial inflamat Initial inflamat Initial inflamat Initial inflamat 1 0,8 1,6 1 2 1,1 1 0,9 1,6 2 1 1,5 1,1 1,8 0,9 1,4 0,8 1,5 3 1 1,7 1 2 1 1,5 0,9 1,6 4 0,9 1,4 1 2 1 0,8 0,9 1,6 5 0,9 1,5 0,9 1,7 1 0,6 0,9 1,5 6 1 1,6 0,9 2 1 0,7 1 1,8 7 0,9 1,2 1 1,9 1 1,2 0,9 1,7 8 0,9 1,5 9 0,9 1,6 10 0.9 1,6

Sa se verifice daca cresterea volumului labei sobolanului ca urmare a inflamatiei provocata de carrageenan este semnificativa.

absolute value of inflammation (ml) of the rat paw induced by caragenaan

-1

0

1

21

2

3

4

57

8

9

10

Patent

AAS

clorpheniramin

control

Page 73: APLICATII NUMERICE DE STATISTICA IN FARMACIE SI  · PDF fileSe spune, în acest caz, c:

Verificarea ipotezelor statistice

71

Solutie: Pentru fiecare produs utilizat vom aplica un test t – pereche:

1nd

dT Tsn

−= ∈

unde • d este diferenta dintre volumul initial si volumul inflamatiei • d este media lui d

• ( )22 11d is d d

n= −

− ∑Obtinem astfel urmatoarele rezultate pentru d Sobolan Acetyl salicylic acid Chlorpheniramin ALGOPIRIN Lot control 1 -0,8 -1 0,1 -0,7

2 -0,5 -0,7 -0,5 -0,7

3 -0,7 -1 -0,5 -0,7

4 -0,5 -1 0,2 -0,7

5 -0,6 -0,8 0,4 -0,6

6 -0,6 -1,1 0,3 -0,8

7 -0,3 -0,9 -0,2 -0,8

8 -0,6

9 -0,7

10 -1,7

d -0.57 -0.93 -0.03 -0.8

ds 0.16 0.14 0.35 0,31

Pentru fiecare produs in parte vom verifica ipotezele statistice: 0 0:H μ μ= vs. 0:AH μ μ≠

considerandu-se 1 0.90α− = . Regiunea critica:

21;1 α−−

⟩n

tT sau 2

1;1 α−−

−⟨n

tT ; 6;0,95 1,94t = ; 9;0,95 1,83t =

S-au obtinut urmatoarele valori: 9, 43acetyl salicylic acidT = − min 17,80chlorpheniraT = − lg 0, 22A opirinT = − 8, 25lot controlT = −

Page 74: APLICATII NUMERICE DE STATISTICA IN FARMACIE SI  · PDF fileSe spune, în acest caz, c:

Verificarea ipotezelor statistice

72

Deci, exceptand Algopirinul toate celelalte valori ale testelor sunt situate in regiunea critica. 23. Evoluţia funcţiei renale reziduale (FRR) în funcţie de boala primară renală a fost calculată la intervale de 3 luni timp de 1 an de la iniţierea dializei obtinandu-se urmatoarele rezultate:

FRR la initierea dializei FRR la 1 an Boala renala primara Media SD Numar Media SD Numar

1 GNC 7.9 1.45 10 3.76 1.18 10 2 NTI 14.33 2.99 16 11.52 3.37 16 3 NI 12.08 4.63 13 6.55 3.25 13 4 NH 12.25 5.42 19 6.33 3.32 19 5 BPI 10.70 2.55 8 7.26 3.26 8 6 NV=NI+NH 12.18 5.03 32 6.42 3.24 32 unde: GNC = glomerulonefrita cronica NTI = nefropatie tubulointerstitiala cronica NI – nefropatie ischemica NH = nefropatie hipertensiva BP = boala polichistica renala NI+NH = nefropatii vasculare = NV

Sa se verifice urmatoarele ipoteze: I. La initierea dializei:

la initierea HD (dializei), pacienţii cu media FRR ( functia renala reziduala) cea mai mare sunt cei având ca boală renală primară o nefropatie tubulointerstiţială cronică (nti), în timp ce glomerulopaţii (gnc) au FRR cea mai mică; II. Evoluţie la 1 an

Ritmul cel mai rapid de deteriorare a FRR a fost înregistrat în cazul bolnavilor cu nefropatii vasculare (nv) Solutie: I FRR la initierea dializei

media SD n GNC 7.9 1.45 10 NTI 14.33 2.99 16 NI 12.08 4.63 13 NH 12.25 5.42 19 BP 10.70 2.55 8

FRR la initierea dializei

0

2

4

6

8

10

12

14

16

GNC NTI NI NH BP

Page 75: APLICATII NUMERICE DE STATISTICA IN FARMACIE SI  · PDF fileSe spune, în acest caz, c:

Verificarea ipotezelor statistice

73

Aplicam testul t ( Student) pentru a verifica semnificatia statistica a diferentei intre NTI si NI

( )

21

2121

11nn

S

XXT

p +

−−−=

μμ este distribuita T cu 221 −+ nn grade de libertate.

( ) ( ) ( ) ( )2 2 2 21 1 2 22

1 2

1 1 16 1 2,99 19 1 5, 4247,38

2 16 19 2p

n s n sS

n n− + − − + −

= =+ − + −

=

14,33 12, 25 0 0,891 16,88

16 19

T − −=

+≅ Regiunea critica este

1 2 2;1 33;12 2

n nT t tα α

+ − − −⟩ =

Intrucat numarul de grade de libertate este mai mare de 30, cuantilele t sunt practice egale cu cele pentru repartitia normala . Pentru riscul obisnuit de 0.05, valoarea calculate cade in zona de acceptare. Deci valoarea cea mai mare corespunde NTI dar diferenta fata de urmatoarea afectiune – NI, nu este semnificativa.

Similar , daca se calculeaza, se obtine ca valoarea cea mai mica este pentru GNC, dar aceasta valoare nu difera semnificativ de cea pentru BP. Diferenta este semnificativa intre NTI si GNC

Observatie: aplicarea testului t nu este chiar ortodoxa in aceste cazuri deoarece dispersiile nu apar sa fie egale. II. FRR evolutie

media SD nGNC -4.14 0.71 10NTI -2.81 1.33 16NI -5.52 1.60 13NH -5.92 2.72 19BP -3.44 0.97 8NV=NI+NH -5.76 2.31 32

Evolutia FRR

-6

-5

-4

-3

-2

-1

0

GNC NTI NI NH BP NV=NI+NH

Din tabel se observa ca diferenta cea mai mare apare la NV. Compararea cu testul t nu este prea corecta deoarece dispersiile sunt foarte diferite. Aplicarea testului F pentru compararea lor va duce la aceasta concluzie.

Page 76: APLICATII NUMERICE DE STATISTICA IN FARMACIE SI  · PDF fileSe spune, în acest caz, c:

Verificarea ipotezelor statistice

74

Aplicarea mecanica duce se pare la concluzia unei diferente semnificative de exemplu intre deteriorarea la NV si deteriorarea la NTI. Diferenta intre NV si GNC.

( )1 2

1 2 1 22

1 2

1 1 n n

p

X XT T

Sn n

μ μ+ −

− − −= ∈

+.

Regiunea critica este α−−+

⟩1;221 nn

tT( ) ( )

( )( ) ( )( )2 22 21 1 2 22

1 2

1 1 32 1 5,76 10 1 4,145,65

2 32 10 2p

n s n sS

n n− + − − − + − −

= = =+ − + −

( )5,76 4,14 01,88

1 12,3832 10

T− − − −

= ≅+

Cu riscurile obisnuite ( 0.05 sau 0.01) se obtine concluzia ca cele doua “degradari” (NV si GNC ) difera semnificativ. Evident, cu atat mai mult vor diferi semnificativ NV si NTI. 24. Distribuţia gravitatii HTA (hipertensiune arteriala), în funcţie de boala renală primară, la 3 luni de la iniţierea programului de dializă cronică (când s-a considerat că pacienţii au ajuns la un echilibru din punct de vedere hemodinamic), a fost următoarea:

HTA Boala renala primara

non - HTA monoterapie biterapie > 3 medicamente

1 GNC glomerulonefrite cronice 5 5 15 25

2 NTI nefropatii tubulointerstiţiale 59 9 6 5

3 NI nefropatie ischemica 19 3 2 0

4 NH nefropatie hipertensiva 0 7 14 16

5 BP boala polichistica renala 18 6 8 4

Sa se verifice ipoteza potrivit careia HTA este mai severa in grupul pacientilor cu GNC. Severitatea e tradusa prin numarul de medicamente necesare pentru a controla tensiunea. Se considera 0,10α =

Page 77: APLICATII NUMERICE DE STATISTICA IN FARMACIE SI  · PDF fileSe spune, în acest caz, c:

Verificarea ipotezelor statistice

75

Solutie: Vom calcula procentul de pacienti hipertensivi care au si boli renale. Total pacienti cu HTA ( ) = pacienti cu monoterapie + pacienti cu biterapie + pacienti cu peste 3 medicamente

ik

Total pacienti ( ) = Total pacienti cu HTA ( )+ pacienti non HTA in ikProcent = Total pacienti cu HTA ( ) / Total pacienti ( ) ik in

Numar de medicamente administrate

non HTA 1 2 Peste 3

Total pacienti cu HTA ( ) ik

Total pacienti ( ) in

Procent

GNC 5 5 15 25 45 50 0,9 NTI 59 9 6 5 20 79 0,25 NI 19 3 2 0 5 24 0,21 NH 0 7 14 16 37 37 1 BP 18 6 8 4 18 36 0,5

Concluzie: intr-adevar proportia de hipertensivi este cea mai mare la bolnavii cu GNC ( NH nu se ia in cosiderare deoarece este prin definitie “hipertensiva”).

Vom verifica ipotezele 0 1 2:H p p p vs= = 1:AH p p2≠ calculand testul

( )1 2

ˆ ˆ1p pZp p

n

−=

−, unde 1 1 2 2 1 2

1 2 1 2

ˆ n p n p k kpn n n n+ +

= =+ +

a) Vom face o comparare intre GNC si NTI desi rezultatul se vede cu ochiul liber: cele doua proportii difera semnificativ

Numar de medicamente administrate

non HTA 1 2 Peste 3

Total pacienti cu HTA ( ) ik

Total pacienti ( ) in

Procent

GNC 5 5 15 25 45 50 0,9 NTI 59 9 6 5 20 79 0,25

0 : GNC NTIH p p p vs= =

:A GNC NTIH p p≠

( )ˆ ˆ1GNC NTIp pZp p

n

−=

1 2

1 2

45 20 65ˆ 0,5050 79 129

k kpn n+ +

= = = =+ +

0,90 0, 25 0,65 16,250,040,50*0,50

129

Z −= = =

Dar si 1 0,90 1, 28z zα− = = 16, 25 1, 28Z = ⟩ , deci se gaseste in zona de respingere.

Page 78: APLICATII NUMERICE DE STATISTICA IN FARMACIE SI  · PDF fileSe spune, în acest caz, c:

Verificarea ipotezelor statistice

76

Concluzie: Se respinge ipoteza 0 : GNC NTIH p p= si se accepta ca ele difera semnificativ cu probabilitatea >0,90 (si chiar 0,99)

b) Comparatia GNC - NI

Numar de medicamente administrate

non HTA 1 2 Peste 3

Total pacienti cu HTA ( ) ik

Total pacienti ( ) in

Procent

GNC 5 5 15 25 45 50 0,9 NI 19 3 2 0 5 24 0,21

0 : gnc NIH p p p v= = s

:A gnc NIH p p≠

( )ˆ ˆ1GNC NIp pZp p

n

−=

1 2

1 2

45 5 50ˆ 0,6850 24 74

k kpn n+ +

= = = =+ +

0,90 0,21 0,69 13,80,050,68*0,32

74

Z −= = =

Dar , deci se gaseste in zona de respingere. 13,8 1, 28Z = ⟩Concluzie: Se respinge ipoteza 0 : GNC NIH p p= si se accepta ca ele difera semnificativ cu probabilitatea >0,90 (si chiar 0,99) c) Comparatia GNC - BP

Numar de medicamente administrate

non HTA 1 2 Peste 3

Total pacienti cu HTA ( ) ik

Total pacienti ( ) in

Procent

GNC 5 5 15 25 45 50 0,9 BP 18 6 8 4 18 36 0,5

0 : GNC BPH p p p vs= =

:A GNC BPH p p≠

( )ˆ ˆ1GNC BPp pZp p

n

−=

1 2

1 2

45 18 63ˆ 0,7350 36 86

k kpn n+ +

= = = =+ +

0,90 0,50 0,40 100,040,73*0,27

86

Z −= = =

Dar , deci se gaseste in zona de respingere. 10 1, 28Z = ⟩Concluzie:

Se respinge ipoteza 0 : GNC BPH p p= si se accepta ca ele difera semnificativ cu probabilitatea >0,90 (si chiar 0,99)

Page 79: APLICATII NUMERICE DE STATISTICA IN FARMACIE SI  · PDF fileSe spune, în acest caz, c:

Verificarea ipotezelor statistice

77

25. In cadrul loturilor de hemodializaţi s-a comparat procentul de pacienţi care au necesitat tratament cu stimulatori ai eritropoiezei, precum şi doza medie administrată obtinandu-se urmatoarele valori: Boala renala

primara Anemie

necesitand ASEDoză ASE sub 5000

Doze ASE 5000-10000

Doze ASE peste 10000

1. GNC 50 6 9 29 2. NTI 79 26 22 0 3. NI 24 6 12 3 4. NH 37 22 8 0 5. BP 36 9 3 0 6. NV 37 28 20 3

Sa se verifice ipoteza potrivit careia procentul pacienţilor care au necesitat tratament cu ASE (eritropoietină) nu a avut diferenţe semnificative între glomerulonefrite cronice (44 din 50 – 88%), nefropatii ischemice ( 21 din 24 – 87%) şi cele hipertensive (30 din 37 – 81%), dar a fost semnificativ mai mic la pacienţii cu nefropatii tubulointerstiţiale ( 48 din 79 – 61%) şi boli chistice (12 din 36 – 33%). Solutie: OBSERVATIE 1: LIPSA SEMNIFICATIILOR SEMNALATE ( 88%, 87%, 81%) ESTE EVIDENTA SI NU SE MAI IMPUNE O TESTARE STATISTICA. Testam diferenta intre cele mai apropiate valori 0.88 si 0.61 considerate diferite. OBSERVATIE 2: procentele se refera numai la numarul total de pacienti tratati. Testarea o aplicam intai comparand numai proportiile mentionate cu testul Z . ASE

sub 5000

ASE 5000-10000

ASE peste 10000

TOTAL pacienti cu anemie ( ) ik

Total pacienti ( ) in Procent

GNC 6 9 29 44 50 0.88 NTI 26 22 0 48 79 0.61

Testul Z Pentru a verifica ipotezele

0 : GNC NTIH p p p vs= = :A GNC NTIH p p≠ cu α = 0,10, calculam

( )ˆ ˆ1GNC NTIp pZp p

n

−=

−, unde 1 2 1 2

1 2 1 2

44 48ˆ 0,7150 79

GNC NTIn p n p k kpn n n n+ + +

= = =+ + +

=

Page 80: APLICATII NUMERICE DE STATISTICA IN FARMACIE SI  · PDF fileSe spune, în acest caz, c:

Verificarea ipotezelor statistice

78

0,88 0,61 0,27 6,750,040,71*0,29

129

Z −= = =

Dar si 1 0,90 1, 28z zα− = = 6,75 1, 28Z = ⟩ , deci se gaseste in zona de respingere. Concluzie: Se respinge ipoteza 0 : gnc NTIH p p= si se accepta ca ele difera semnificativ cu probabilitatea >0,90 (si chiar 0,99) 26. Aprecierea stării de nutriţie a fost realizată prin măsurarea albuminemiei serice (s-au luat mediile pe 6 luni) şi prin aplicarea chestionarului de evaluare globală subiectivă a stării de nutriţie (SGA = Subjective Global Assesment) la intervale de 1 an. S-au obtinut urmatoarele valori:

Boala renala primara

Malnutritie albumina

Alb 3-3,5 Alb 2,5-3 Alb < 2,5

1 GNC 16 6 8 2 2 NTI 12 8 3 1 3 NI 14 2 8 4 4 NH 10 4 4 2 5 BPI 6 4 2 0

Malnutritie Nr. pacienti

non Usoara SGA

Media – Severa SGA cu SGA Total

Procent

GNC 31 9 10 19 50 0.38 NTI 65 8 6 14 79 0.18 NI 5 4 15 19 24 0.79 NH 24 10 3 13 37 0.35 BP 29 6 1 7 36 0.19

0.00

0.10

0.20

0.30

0.40

0.50

0.60

0.70

0.80

GNC NTI NI NH BP

p

Page 81: APLICATII NUMERICE DE STATISTICA IN FARMACIE SI  · PDF fileSe spune, în acest caz, c:

Verificarea ipotezelor statistice

79

Sa se verifice ipoteza ca atat din punct de vedere al albuminei serice - ca marker al malnutritiei – cat si al SGA (subjective global assessment) – care include si comorbiditati – malnutritia este mai frecventa si mai severa la NI . Solutie:

a) Testam din punct de vedere al albuminei serice Albumina Pacienti 3 - 3,5 2,5 - 3 sub 2,5 cu Albumina ( )ik Total ( ) in

Procent

NI 2 8 4 14 24 0.58 NH 4 4 2 10 37 0.27

Pentru a verifica ipotezele 0 : NI NHH p p p vs= = :A NI NHH p p≠ cu α = 0,10, calculam

( )ˆ ˆ1NI NHp pZp p

n

−=

−, 14 10ˆ 0,39

24 37p += =

+⇒

0,58 0,27 0,31 5,170,060,39*0,61

61

Z −= = =

Dar 1 0,90 1, 28z zα− = = si 5,17 1, 28Z = ⟩ , deci se gaseste in zona de respingere.

Se respinge ipoteza si se accepta ca ele difera semnificativ cu probabilitatea >0,90 (si chiar 0,99)

0 : NI NHH p p=

b) Testam din punct de vedere al SGA

Se observa ca procentul de malnutritie cel mai mare apare intr-adevar la NI. Comparam proportiile cu testul Z, intre pNI si urmatoarea proportie ca marime pNH

Malnutritie Pacienti

non Usoara SGA

Media - Severa SGA cu SGA ( ) ik Total ( ) in

Procent

NI 5 4 15 19 24 0.79 NH 24 10 3 13 37 0.35

Pentru a verifica ipotezele 0 : NI NHH p p p vs= = :A NI NHH p p≠ cu α = 0,10, calculam

( )ˆ ˆ1NI NHp pZp p

n

−=

−, 19 13ˆ 0,52

24 37p += =

+⇒

0,79 0,35 0,44 7,330,060,52*0,48

61

Z −= = =

Dar , deci se gaseste in zona de respingere. 7,33 1, 28Z = ⟩Se respinge ipoteza si se accepta ca ele difera

semnificativ cu probabilitatea >0,90 (si chiar 0,99) 0 : NI NHH p p=

Page 82: APLICATII NUMERICE DE STATISTICA IN FARMACIE SI  · PDF fileSe spune, în acest caz, c:

Verificarea ipotezelor statistice

80

27. Incidenta osteodistrofiei la pacienti sub dializa renala s-a determinat prin compararea incidenţei hiperparatiroidismului şi hiperfosfatemiei in diferite subgrupuri, obtinandu-se rezultatele urmatoare:

Boala renala

primara

PTH > valoare optima

PTH normal sau suboptim

PTH ≥ 800pg/ml

P>N P in limite

1 GNC 36 14 2 36 14 2 NTI 56 23 18 51 28 3 NI 17 7 0 15 9 4 NH 27 10 0 24 13 5 BPI 26 10 1 22 14

PTH = parathormon, are valoare optimă în jur de 200pg/ml Hiperparatiroidism = creşterea PTH peste valoarea optimă

Sa se verifice ipoteza statistica potrivit careia valori mari ale parathormonului seric (PTH), peste 800pg/dl au fost înregistrate aproape exclusiv la pacienţi cu nefropatii tubulointerstiţiale cronice. Solutie:

Observatie: nu mai este nevoie de statistica dar, ca moft, aplicam testul Z de comparare a doua proportii PTH ≥

800pg/ml total P

GNC 2 50 0.04NTI 18 79 0.23NI 0 24 0.00NH 0 37 0.00BP 1 36 0.03

P

0.00

0.05

0.10

0.15

0.20

0.25

GNC NTI NI NH BP

Pentru a verifica ipotezele

0 : GNC NTIH p p p vs= = :A GNC NTIH p p≠ cu α = 0,10, calculam

( )ˆ ˆ1GNC NTIp pZp p

n

−=

−, 2 18ˆ 0,16

50 79p += =

+, 0,04 0,23 0,19 6,33

0,030,16*0,84129

Z −= = − = −

Dar , deci se gaseste in zona de respingere. 6,33 1, 28Z = − ⟨ −Se respinge ipoteza 0 : gnc NIH p p= si se accepta ca ele difera

semnificativ cu probabilitatea >0,90 (si chiar 0,99).

Page 83: APLICATII NUMERICE DE STATISTICA IN FARMACIE SI  · PDF fileSe spune, în acest caz, c:

Teste neparametrice

81

TESTE NEPARAMETRICE

Testele independente de distributie, numite şi teste de rang,

înlocuiesc valorile variabilei cantitative observate cu rangurile lor. Testele neparametrice sunt valabile şi pentru variabile normal distribuite, dar sunt mai puţin eficiente, pentru acelaşi prag de semnificaţie fiind necesare eşantioane mai mari decât pentru testele parametrice.

Aplicarea lor este posibila atunci cand variabilele aleatoare sunt continue si independente. Testul Wilcoxon

Testul de rang Wilcoxon este un test cu ipoteza nulă că două populaţii sunt identice, fată de ipoteza alternativă că ele diferă printr-o translaţie lineară.

Testul înlocuieşte observaţiile prin rangurile lor. Rangurile sunt repartizate la valorile din selecţii în ordinea creşterii mărimii fără să ţină cont de probele cărora le aparţin.

Să presupunem că o probă este de mărime n şi alta de mărime N-n. Testul presupune că orice combinaţie de ranguri în aceste două grupuri este egal probabilă. Numărul total de moduri de grupare a rangurilor este . n

NCNu este uşor să calculăm toate posibilităţile, astfel încât vom folosi

faptul că media rangurilor unei probe este distribuită aproximativ normal cu urmatorii parametri:

( )2

1+=

NRE si ( ) ( )( )n

nNNRD121 −+

=

Sunt disponibile tabelele care dau limitele de acceptare a ipotezei pentru suma obţinută, ca o funcţie de n, N şi riscul asumat. 0H

Fie R suma rangurilor şi R media rangurilor probei de mărime n.

Variabila aleatoare ( )( ) ( )( )

nnNN

NR

RD

RERZ

121

21

−+

+−

=−

= va fi

repartizată aproximativ ( )1,0N .

Page 84: APLICATII NUMERICE DE STATISTICA IN FARMACIE SI  · PDF fileSe spune, în acest caz, c:

Teste neparametrice

82

Notatii alternative: a) Daca 21 nnN += ; 1nn = si 2nnN =− , ( 21 nn ≤ ) se obtine:

( )

1 2

1 2 2

1

12

112

n nRz

n n nn

+ +−

=+ +

(testul Mann – Whitney)

b) Se amplifica cu , se obtine 1n 1Rn R= si

( )

( )

1 1 2

1 2 1 2

121

12

n n nR

zn n n n

+ +−

=+ +

c) Kruskal si Wallis au observat ca aproximaţia este îmbunătăţită când valoarea α este mai mare de 0,02 prin aducerea lui R mai aproape de

media lui cu n2

1 .

( )( )

1 12 2112

NRnZ

N N nn

+− +=

+ −

Ajustarea pentru valori egale în testul Wilcoxon

Dacă apar egalităţi, o alternativă pentru neglijarea lor este de a repartiza la aceste observaţii media rangurilor pe care le-ar fi primit dacă nu erau egale.

În acest caz, variabila aleatoare ( )2

1 12 21

*12 1

NRnZ

N N T N nnN N

+− +=

− − −−

va fi

repartizată aproximativ ( )1,0N , unde ( ) ( ) 31 1T k k k k k= − + = − Testul Wilcoxon pereche

Wilcoxon a propus deasemenea un test pentru determinări pare în care rangurile sunt atribuite mărimii absolute a diferenţelor şi apoi se dă rangurilor semnul diferenţelor.

Page 85: APLICATII NUMERICE DE STATISTICA IN FARMACIE SI  · PDF fileSe spune, în acest caz, c:

Teste neparametrice

83

i

Ipoteza nulă este că distribuţia diferenţelor este simetrică faţă de zero, astfel orice rang este pozitiv sau negativ cu aceiaşi probabilitate. Valorile egale primesc ca rang media rangurilor grupului.

Să ataşăm rangurilor i variabilele aleatoare di , unde

⎩⎨⎧

=negativesteidacapozitivesteidaca

di ,0,1

,

Cea mai mica suma a rangurilor trebuie sa fie cel mult egala cu cea din Anexa V: Tabelul 1 pentru a considera cele doua grupuri de rezultate ca fiind diferite la nivelul de incredere specificat.

Se foloseste insa cea mai mica valoare dintre suma rangurilor pozitive si a celor negative.

Să considerăm suma rangurilor positive iS d=∑ .

În acest caz, variabila aleatoare ( )( )

( )

( )( )

14

1 2 124

N NsS E S

ZD S N N N

+−−

= =+ +

va fi repartizată aproximativ ( )1,0N . Dacă apar valori egale, Z trebuie să fie ajustat la factorul

( )

( )( )

14

1 2 124 48

N NS

ZTN N N

+−

=+ +

−∑, ( ) ( ) 31 1T k k k k k= − + = −

Testul H, Krusskal – Wallis, de analiza a variatiei “pe o cale” aplicata rangurilor

Testul H, sau testul Kruskal – Wallis este o generalizare a testului Wilcoxon în cazul a k probe, . La fel ca şi în testul Wilcoxon, observaţiile primesc ranguri, şi media rangurilor Ri se calculează pentru fiecare grup.

2⟩k

( )2

1+=

NRE i şi ( ) ( )( )i

ii n

nNNRD

1212 −+

=

Raportul ( )( )i

ii

RD

RER2

− va fi repartizat ( )1,0N , conform teoremei limita

centrala.

Page 86: APLICATII NUMERICE DE STATISTICA IN FARMACIE SI  · PDF fileSe spune, în acest caz, c:

Teste neparametrice

84

Kruskal şi Wallis au arătat că suma pătratelor lor, cu un factor de

ponderare ⎟⎟⎠

⎞⎜⎜⎝

⎛−

Nni1 are aproximativ distribuţia ( )12 −kχ

( )( )( )⇒∑ −≅⎟

⎠⎞

⎜⎝⎛ −

⎥⎥⎥⎥⎥

⎢⎢⎢⎢⎢

−+

+−

==

k

i

i

i

i

ik

Nn

nnNN

NRH

1

2

2

11

121

21

χ

( )( )( )

( )( )1

121

1222

+∑ −

=−

⋅−+

∑ −=

NNRRn

NnN

nNNRRn

H iii

i

ii

Dacă apar valori egale, H trebuie să fie împărţit la factorul NN

T−

− ∑31

unde ( ) ( ) 31 1T k k k k= − + = − k

si Diletti .

este calculat pentru fiecare grup de legături. Estimarea intervalelor de incredere prin calculul “non – parametric”

Daca nu sunt verificate ipotezele necesare aplicarii testului t

(ipotezele privind normalitatea si egalitatea dispersiilor), intervalul de incredere se determina folosind testele non-parametrice. Metoda se bazeaza pe compararea rangurilor.

O metoda de calcul neparametric a intervalului de incredere pentru raportul parametrilor a fost data de Hollander si Wolfe1 si aplicata ulterior la bioechivalenta alaturi de alte metode nonparametrice de Steinijens 2

Consideram N subiecti dintr-o populatie care nu este normal distribuita carora li se aplica doua medicamente diferite (X si Y).

Vom avea N perechi de valori ( ),i ix y unde ix X∈ si iy Y∈ .

1 Hollander M, Wolfe D A, Non-parametric Statistical Methods,Wiley, New York, 1973 2 Steinijens V W, Diletti E, Statistical Analysis of Bioavailability Studies: Parametric and Non-parametric Confidence Intervals, Eur. J. Clin. Pharmacol 24, 127-136,1983

Page 87: APLICATII NUMERICE DE STATISTICA IN FARMACIE SI  · PDF fileSe spune, în acest caz, c:

Teste neparametrice

85

Vom calcula rapoartele i

i

xy

si vom compara R′ , media geometrica

pentru rapoarte, pentru toate perechile posibile de N rapoarte individuale

(R), unde N este numarul de subiecti. Exista ( )2

1+NN astfel de perechi,

incluzand si raportul R/R intre un subiect si el insusi. Valorile lui R′ sunt apoi ordonate crescator in functie de rang.

Limita inferioara si superioara a intervalului de incredere nonparametric de 90%, respectiv 95%, sunt redate in tabelul privind intervalele de incredere folosind testul de rang Wilcoxon (Anexa V: Tabel 2). Coeficientul de corelatie de rang Spearman

Consideram in continuare problema compararii in functie de doua criterii diferite (X si Y) a unor indivizi dintr-o populatie care nu este normal distribuita. Vom testa ipoteza nula privind absenta corelatiei intre X si Y. Vom avea n perechi de valori ( ),i ix y unde ix X∈ si iy Y∈ .

Vom ordona crescator, separat, valorile { }1 2, ,..., nx x x si

{ }1 2, ,..., ny y y notand rangurile corespunzatoare cu ix′ , respectiv iy′ . Valorile egale primesc ca rang media rangurilor grupului.

Vom determina diferentele rangurilor dintre cele doua criterii: i id x y′ ′= − i

Se numeste coeficient de corelatie de rang Spearman numarul

( )

2

12

61

1

n

ii

S

dr

n n== −−

• Daca 10n ≥ vom folosi variabila aleatoare:2

21

S

s

r nTr−

=−

repartizata Student cu 2n− grade de libertate. • Daca 10n ⟨ nu putem utiliza aproximarea precedenta. In acest caz vom determina din tabelul de corelatie de rang Spearman (Anexa V: Tabel 3) valoarea corespunzatoare rα .

Vom spune ca se accepta ipoteza nula daca Sr rα≤ .

Page 88: APLICATII NUMERICE DE STATISTICA IN FARMACIE SI  · PDF fileSe spune, în acest caz, c:

Teste neparametrice

86

Exercitii: 1. Sa se verifice ca urmatoarele esantioane

1x 1,1 2,2 3,1 4,3

2x 10 2,4 3,3

apartin aceleiasi populatii. Se considera riscul 0.10α = Solutie:

Ordonam crescator valorile acordandu-le rangul corespunzator: 1x 1,1 2,2 3,1 4,3

Rangurile 1 2 4 6 10 2,4 3,3

2xRangurile 7 3 5

1 3.25R = 2 7 3 5 15R + + = ; 2 5R = 1 1 2 4 6 13R = + + + = ; ; =Pentru a se accepta ipoteza 0 :H cele doua esantioane apartin aceleiasi populatii

cea mai mica suma a rangurilor trebuie sa fie cel putin egala cu cea din tabelul testului Wilcoxon corespunzatoare numarului N (Anexa V: Tabel 1).

In cazul nostru aceasta valoare este 2. Cum 13 vom spune ca se accepta ipoteza . 2⟩ 0HVom verifica aceste rezultate cu cele obtinute prin aproximarea

normala a distributiei rangurilor.

Aplicand testul Wilcoxon ( )( )

1 12 2112

NRnZ

N N nn

+− +

=+ −

unde 7N = , si 3n =

5R = obtinem

( )( )

7 1 152 2*3 1.23

7 1 7 312*3

Z

+− +

= ≅+ −

Deoarece 64.195.0 =z si ( )1.23 1.64 ,1.64Z = ∈ − se accepta ipoteza,

deci selectiile apartin aceleiasi populatii .

Page 89: APLICATII NUMERICE DE STATISTICA IN FARMACIE SI  · PDF fileSe spune, în acest caz, c:

Teste neparametrice

87

2. Sa se compare daca esantioanele de mai jos provin din aceiasi populatie considerand riscul ca fiind 0.10α = : E1 3 9,8 2 5,2 3,6 5,9 8,5 9,4 E2 9,3 12,5 11,3 7,6 3,2 8,6 7,2 14,2 9,6 3,8

Solutie: Deoarece nu stim nimic despre populatia din care provin cele doua

esantioane nu vom putea aplica teste neparametrice. Vom ordona crescator toate cele 18 valori determinand apoi rangurile

corespunzatoare: E1 3 9,8 2 5,2 3,6 5,9 8,5 9,4 Rang 2 15 1 6 4 7 10 13 E2 9,3 12,5 11,3 7,6 3,2 8,6 7,2 14,2 9,6 3,8 Rang 12 17 16 9 3 11 8 18 14 5

Calculam media rangurilor pe fiecare esantion:

12 15 1 6 4 7 10 13 58 7, 25

8 8R + + + + + + +

= = =

212 17 16 9 3 11 8 18 14 5 113 11,30

10 10R + + + + + + + + +

= = =

Pentru 18N = valoarea corespunzatoare testului Wilcoxon este 40. Cum cea mai mica valoare a sumei rangurilor este mai mare decat valoarea testului (58 ) vom spune ca acceptam ipoteza 40⟩

Aplicand testul Wilcoxon ( )( )

1 12 2112

NRnZ

N N nn

+− +

=+ −

.

In cazul nostru: 18N = , 8n = , 7, 25R = , deci . 0H

( )( )

18 1 17,25 2,182 2*8 1,551, 4018 1 18 8

12*8

Z

+− +

= = − ≅ −+ −

Deoarece 64.195.0 =z si ( )1,55 1.64 ,1.64z = − ∈ − se accepta ipoteza.

Page 90: APLICATII NUMERICE DE STATISTICA IN FARMACIE SI  · PDF fileSe spune, în acest caz, c:

Teste neparametrice

88

3. Se dau datele urmatoare date: 1x : 1.1; 2.2; 3.1; 4.3; 2.5 si : 10; 2.4; 3.3; 2.5; 2.5 2x

Sa se verifice ipoteza ca aceste esantioane apartin aceleiasi populatii asumandu-ne riscul 0.10α = .

Solutie:

1x 2x Valoare 1.1 2.2 3.1 4.3 2.5 10 2.4 3.3 2.5 2.5 Rang 1 2 7 9 5 10 3 8 5 5

4.8 6.2 R

8.45

597211 =

++++=R 2.6

5558310

2 =+ + + + =R

( )2

1 12 21

*12 1

NRnz

N N T N nnN N

+− +

=− − −

unde ( ) ( )11 +−= kkkT si 3k = numarul de cozi⇒ 2*3*4 24T = = .

( )

( )

2

10 1 16.2 0,82 2*50, 2610 10 1 24 10 5*

12*5*10 10 13,08 1.64 ,1.64

Z

Z

+− +

= =− − −

−⇒ ≅ ∉ −

Vom respinge ipoteza, deci esantioanele nu apartin aceleiasi

populatii.

4. Pentru a determina metoda optima de dozare a continutului in substanta activa dintr-un lot de comprimate se compara doua metode analitice diferite. S-au luat in lucru cate 12 comprimate pentru fiecare metoda analitica si s-au obtinut urmatoarele rezultate: cpr. 1 2 3 4 5 6 7 8 9 10 11 12 M 1 9,2 10 9 9,4 10,1 9,5 10 10,3 10,2 10,2 9,8 10,1 M 2 9,5 9 8,8 9,5 9,1 10 10,1 9,3 9 9,7 9,1 9,3

Exista diferente semnificative intre cele doua metode? Se considera 0.10α = .

Page 91: APLICATII NUMERICE DE STATISTICA IN FARMACIE SI  · PDF fileSe spune, în acest caz, c:

Teste neparametrice

89

Solutie: Vom face diferenta dintre cele doua metode

cpr. 1 2 3 4 5 6 7 8 9 10 11 12 M 1 9,2 10 9 9,4 10,1 9,5 10 10,3 10,2 10,2 9,8 10,1 M 2 9,5 9 8,8 9,5 9,1 10 10,1 9,3 9 9,7 9,1 9,3 d -0.3 1 0.2 -0.1 1 -0.5 -0.1 1 1.2 0.5 0.7 0.8

1 2d M M= − Vom aloca rangurile corespunzatoare diferentelor. Vom ordona

crescator valorile absolute ale diferentelor si in final vom aloga semnele corespunzatoare. cpr. 1 2 3 4 5 6 7 8 9 10 11 12 d -0.3 1 0.2 -0.1 1 -0.5 -0.1 1 1.2 0.5 0.7 0.8 rang -4 10 3 -1,5 10 -5.5 -1,5 10 12 5.5 7 8

10 3 10 10 12 5.5 7 8 65.5S+Suma rangurilor pozitive este + + + + + + + = =Suma rangurilor negative este 4 1,5 5,5 1,5 12,5S− = + + + =

Vom aplica testul

( )

( )( )

14

1 2 124 48

N NS

ZTN N N

+−

=+ +

−∑ unde

• 65,5 S S+= =• 12N = numarul de perechi • si vom obtine: 1*2*3 1*2*3 2*3*4 36T = + + =∑

( )

( ) ( )

12 12 165,5

412 12 1 2*12 1 36

24 4826,4 26,4 2,07

12,72161,75

Z

Z

+−

=+ +

⇒ = = =

Deoarece 64.195.0 =z si se respinge ipoteza. (2,07 1.64 ,1.64Z = ∉ − )

Page 92: APLICATII NUMERICE DE STATISTICA IN FARMACIE SI  · PDF fileSe spune, în acest caz, c:

Teste neparametrice

90

5. Dozand calciul din 3 izvoare diferite de apa s-au obtinut valorile (mg/l):

Izvor 1 18 20 22 25 Izvor 2 15 16 17 21 Izvor 3 15 20 21 25

Sa se determine daca zona geografica influenteaza semnificativ cantitatea de calciu din apa. Se considera 05.0=α . Solutie:

Testul statistic utilizat: ( )( )

( )

2

2

1

12 1 1

112

k ii

i i

i

NR nH kNN N n

n

χ=

⎡ ⎤+⎢ ⎥− ⎛ ⎞⎢ ⎥= − ≅ −⎜ ⎟⎢ ⎥ ⎝ ⎠+ −⎢ ⎥

⎢ ⎥⎣ ⎦

unde , 12N = 1 2 3 4n n n= = = si 3k = Vom calcula rangurile corespunzatoare:

Ranguri ( iR ) iR

Izvor 1 5 6.5 10 11.5 8.25 Izvor 2 1.5 3 4 8.5 4.25 Izvor 3 1.5 6.5 8.5 11.5 7

Vom obtine

( )( ) ( )( )

2 2

12 1 12 18,25 4,254 42 21 112 1212 1 12 4 12 1 12 4

12*4 12*4

H

⎡ ⎤ ⎡ ⎤+ +⎢ ⎥ ⎢ ⎥− −⎛ ⎞ ⎛ ⎞⎢ ⎥ ⎢ ⎥= − +⎜ ⎟ ⎜ ⎟⎢ ⎥ ⎢ ⎥⎝ ⎠ ⎝ ⎠+ − + −⎢ ⎥ ⎢ ⎥⎣ ⎦ ⎣ ⎦

− +

( )( )

( )

2 2 2

2

2 2 2

12 17 4 8,25 6,5 2 4,25 6,5 22 1 *12 3 313 1312 1 12 4

6 612*4

7 6,5 2* 1,75 2,25 0,5 0,31 8,375*0,31 2,6313

6

⎡ ⎤ ⎛ ⎞ ⎛ ⎞+⎢ ⎥− ⎜ ⎟ ⎜ ⎟− −⎛ ⎞⎢ ⎥ ⎜ ⎟ ⎜ ⎟+ − = +⎜ ⎟⎢ ⎥ ⎜ ⎟ ⎜ ⎟⎝ ⎠+ −⎢ ⎥ ⎜ ⎟ ⎜ ⎟

⎝ ⎠ ⎝ ⎠⎣ ⎦

⎛ ⎞⎜ ⎟−⎜ ⎟+ = + + = =⎜ ⎟⎜ ⎟⎝ ⎠

* +

Deoarece apar cozi (valori egale), H trebuie să fie împărţit la factorul

Page 93: APLICATII NUMERICE DE STATISTICA IN FARMACIE SI  · PDF fileSe spune, în acest caz, c:

Teste neparametrice

91

NNT−

− ∑31

unde ( ) ( ) 31 1T k k k k= − + = − k este calculat pentru fiecare grup de legături.

In cazul nostru avem 4 grupe a cate 2 cozi fiecare, deci 1*2*3 6T = = .

Factorul de impartire va fi 3

4*6 241 1 012 12 12*143

− = − = ,986−

Se obtine astfel 2,6 2,637

0,986H ′ = =

repartizat 2χ cu 2 grade de libertate.

Cum , si 2

2;0.025 0,05χ = 22;0.975 7,38χ = 0,05 2,637 7,38⟨ ⟨ se accepta

ipoteza 3210 : μμμ ==H . 6. Consideram cazul cand acelasi lot primeste succesiv doua tratamente obtinandu-se urmatoarele rezultate:

Subiect Tratament 1 Tratament 2 1 1.1 10 2 2.2 2.4 3 3.1 2.8 4 4.3 2.5 5 2.5 2.6

Testati ipoteza ca efectele celor doua tratamente nu difera semnificativ. Se considera riscul

0H05.0=α

Solutie: In aceste conditii pentru a inlatura intervariabilitatea se compara fiecare

subiect cu sine insusi. In acest caz testul de compararea a mediilor este testul Wilcoxon pereche si se bazeaza pe analiza diferentelor perechilor de date.

Vom face diferenta dintre valorile (tratament 2) si (tratament 1) si vom aloca rangurile corespunzatoare valorilor obtinute:

2x 1x

1x 1.1 2.2 3.1 4.3 2.5

2x 10 2.4 2.8 2.5 2.6

Page 94: APLICATII NUMERICE DE STATISTICA IN FARMACIE SI  · PDF fileSe spune, în acest caz, c:

Teste neparametrice

92

12 xx − 8.9 0.2 -0.3 -1.8 0.1

Rangul 5 2 -3 -4 1 Suma rangurilor pozitive: 8

( )

( )( )24

1214

1

++

+−

=NNN

NNSz

( )

( ) ( )01.0

2415*2*15*5

415*58

≅++

+−

=z

Deoarece 64.195.0 =z si ( )64.1,64.101.0 −∈=z se accepta ipoteza

7. Se studiaza activitatea acetilcolinesterazei la un lot de animale expusi actiunii unui insecticid organofosforic. Activitatea enzimatica este exprimata in micromoli de substrat hidrolizat pe minut si pe mg de proteine.

Rezultatele obtinute in functie de timpul de expunere la pesticid sunt urmatoarele:

Animal tratat Animal martor 1 zi 2 zile 3 zile 15.0 15.0 2.0 0.5 8.5 9.0 2.2 3.0 10.0 8.0 4.0 2.3 10.0 2.0 2.4 0.6 7.6 5.0 1.1 0.9 5.0 3.0 0.7 0.5

Insecticidul produce o diminuare semnificativa a enzimei (vom compara global cele 4 esantioane)? Solutie: H0: nu exista diferente semnificative intre activitatile medii ale celor 4 esantioane HA: exista diferente semnificative intre activitatile medii ale celor 4 esantioane Alocam rangurile corespunzatoare:

Animal tratat Animal martor 1 zi 2 zile 3 zile

Rangurile medii

23.5 23.5 7.5 1.5 14 19 20 9 12.5 15,125

Page 95: APLICATII NUMERICE DE STATISTICA IN FARMACIE SI  · PDF fileSe spune, în acest caz, c:

Teste neparametrice

93

21.5 18 14 10 15,875 21.5 7.5 11 3 10,75 17 15.5 6 5 10,875 15.5 12.5 4 1.5 8,375

Aplicam testul ( )( )

( )

2

2

1

12 1 1

112

k ii

i i

i

NR nH kNN N n

n

χ=

⎡ ⎤+⎢ ⎥− ⎛ ⎞⎢ ⎥= − ≅ −⎜ ⎟⎢ ⎥ ⎝ ⎠+ −⎢ ⎥

⎢ ⎥⎣ ⎦

1 2 3 4 4n n n n

unde

24N = , = = = , 6k = =

( )( ) ( )( )

2 2

24 1 24 114 15,1254 42 21 124 2424 1 24 4 24 1 24 4

12*4 12*4

H

⎡ ⎤ ⎡ ⎤+ +⎢ ⎥ ⎢ ⎥− −⎛ ⎞ ⎛ ⎞⎢ ⎥ ⎢ ⎥= − +⎜ ⎟ ⎜ ⎟⎢ ⎥ ⎢ ⎥⎝ ⎠ ⎝ ⎠+ − + −⎢ ⎥ ⎢ ⎥⎣ ⎦ ⎣ ⎦

− +

( )( ) ( )( )

2 2

24 1 24 115,875 10,754 42 21 124 2424 1 24 4 24 1 24 4

12*4 12*4

⎡ ⎤ ⎡ ⎤+ +⎢ ⎥ ⎢ ⎥− −⎛ ⎞ ⎛ ⎞⎢ ⎥ ⎢ ⎥+ − +⎜ ⎟ ⎜ ⎟⎢ ⎥ ⎢ ⎥⎝ ⎠ ⎝ ⎠+ − + −⎢ ⎥ ⎢ ⎥⎣ ⎦ ⎣ ⎦

− +

( )( ) ( )( )

( )

2 2

2 2 2 2 2 2

24 1 24 110,875 8,3754 42 21 124 2424 1 24 4 24 1 24 4

12*4 12*41,5 2,625 3,375 1,75 1,625 4,125 *0,48 43.25*0.48

20.76

⎡ ⎤ ⎡ ⎤+ +⎢ ⎥ ⎢ ⎥− −⎛ ⎞ ⎛ ⎞⎢ ⎥ ⎢ ⎥+ − + −⎜ ⎟ ⎜ ⎟⎢ ⎥ ⎢ ⎥⎝ ⎠ ⎝ ⎠+ − + −⎢ ⎥ ⎢ ⎥⎣ ⎦ ⎣ ⎦

= + + + + + =

=

=

=

Deoarece apar cozi (valori egale), H trebuie să fie împărţit la factorul

NNT−

− ∑31

unde ( ) ( ) 31 1T k k k k= − + = − k este calculat pentru fiecare grup de legături.

Avem 5 cozi a cate 2 elemente ⇒ 1*2*3 6T = = deci factorul cu care se va imparti este

3

5*61 1 0,002 0,99824 24

− = − =−

Page 96: APLICATII NUMERICE DE STATISTICA IN FARMACIE SI  · PDF fileSe spune, în acest caz, c:

Teste neparametrice

94

Se obtine astfel 20,76 20,800,998

H ′ = = repartizat 2χ cu 5 grade de

libertate.

Deoarece , si 2

5;0.025 0,831χ = 25;0.975 12,833χ = 20,80 12,833H ′ = ⟩ se

respinge ipoteza. 8. Se dau datele urmatoare:

1x 2x 3x 1.1 2.2 3.1 4.3 2.5 10 2.4 2.8 2.5 2.6 - 2.2 3 3.5 2.7 Sa se verifice ca esantioanele provin din aceiasi populatie, 0.05α = . Solutie: Alocam rangurile corespunzatoare:

1x 2x 3x

x 1.1 2.2 3.1 4.3 2.5 10 2.4 2.8 2.5 2.6 - 2.2 3 3.5 2.7 R 1 2.5 11 13 5.5 14 4 9 5.5 7 2.5 10 12 8

R 6.6 7,9 8.125

Aplicam testul ( )( )

( )

2

2

1

12 1 1

112

k ii

i i

i

NR nH kNN N n

n

χ=

⎡ ⎤+⎢ ⎥− ⎛ ⎞⎢ ⎥ − ≅ −⎜ ⎟⎢ ⎥ ⎝ ⎠+ −⎢ ⎥

⎢ ⎥⎣ ⎦

∑ unde =

14N = , 1 2 5n n= = , 3 4n = , 3k = 2 2

6.6 7.5 5 7,9 7.5 5* 1 * 114 1415*9 15*9

12*5 12*5

H

⎛ ⎞ ⎛ ⎞⎜ ⎟ ⎜ ⎟− −⎛ ⎞ ⎛ ⎞⎜ ⎟ ⎜ ⎟= − +⎜ ⎟ ⎜ ⎟⎜ ⎟ ⎜ ⎟⎝ ⎠ ⎝ ⎠⎜ ⎟ ⎜ ⎟⎝ ⎠ ⎝ ⎠

− +

Page 97: APLICATII NUMERICE DE STATISTICA IN FARMACIE SI  · PDF fileSe spune, în acest caz, c:

Teste neparametrice

95

2

8.125 7.5 4* 1 0,351415*10

12*4

⎛ ⎞⎜ ⎟− ⎛ ⎞⎜ ⎟+ −⎜ ⎟⎜ ⎟ ⎝ ⎠⎜ ⎟⎝ ⎠

Deoarece apar cozi (valori egale), H trebuie să fie împărţit la factorul

NNT−

− ∑31 unde T este calculat pentru fiecare grup de legături.

Pentru grupul 2, 2x = avem 2 cozi, deci 1*2*3 6T = = , aceeasi situatie repetandu-se si pentru grupul 2,5x = , deci factorul cu care se va imparti este

3

6 61 1 0,004 0,99614 14

+− = − =

Se obtine astfel 0,35 0,3510,996

H ′ = =

Deoarece , si 22;0.025 0,05χ = 2

2;0.975 7,38χ =0,05 0,351 7,38H ′⟨ = ⟨

se accepta ipoteza.

9. La testarea a doua preparate farmaceutice (testat –T si referinta – R) s-au obtinut urmatoarele valori pentru concentratia maxima in plasma ( maxC µg/ml) . Subiect 1 2 3 4 5 6 7 8 9

maxC R 0.92 1.74 0.77 0.80 0.70 0.92 0.71 0.80 0.93

maxC T 1.29 1.86 0.73 1.73 1.03 1.63 1.38 1.21 1.05

T/R 1,4 1,07 0,95 2.17 1,47 1,77 1,95 1,51 1,13

Vom determina media geometrica pentru fiecare raport RT adica

radicalul dintre produsul a doua rapoarte. Astfel: pentru subiectul 1 media geometrica este radicalul dintre produsul raportului subiectului 1 combinat cu el insusi: 1, 4*1, 4 1, 4≈

Page 98: APLICATII NUMERICE DE STATISTICA IN FARMACIE SI  · PDF fileSe spune, în acest caz, c:

Teste neparametrice

96

Pentru subiectul 1 combinat cu subiectul 2, media geometrica este radicalul produsului dintre raportul subiectului 1 si raportul subiectului 2:

1, 4*1,07 1, 22≈ Acest rationament il vom aplica pentru fiecare dintre cei 9 subiecti.

Se vor determina ( )1 9*10 452 2

N N += = de combinatii diferite incluzand si

fiecare raport cu el insusi. Mediile geometrice determinate, considerate o singura data, sunt:

1 2 3 4 5 6 7 8 9 1 1.40 2 1.22 1.07 3 1.15 1.00 0.95 4 1.74 1.52 1.43 2.17 5 1.43 1.25 1.18 1.79 1.47 6 1.57 1.37 1.29 1.96 1.62 1.77 7 1.65 1.44 1.36 2.06 1.70 1.86 1.95 8 1.45 1.27 1.19 1.81 1.49 1.64 1.72 1.51 9 1.26 1.10 1.03 1.57 1.29 1.42 1.49 1.31 1.13

Vom determina rangurile corespunzatoare 1 2 3 4 5 6 7 8 9

1 19 2 10 4 3 7 2 1 4 37 29 21.5 45 5 21.5 11 8 39 25 6 30.5 18 14.5 43 32 38 7 34 23 17 44 35 41 42 8 24 13 9 40 26.5 33 36 28 9 12 5 3 30.5 14.5 20 26.5 16 6

Dupa cum se observa, limita inferioara, respectiv superioara a intervalului de incredere 95% este valoarea rangului 6, respectiv 40 al mediilor geometrice determinate anterior, deoarece numarul de subiecti este

. 9N =Vom determina mediile geoametrice corespunzatoare rangurilor

obtinute si vom obtine un interval de incredere 95% : ( )95% 1,13 ,1,81CI =

Tabel Intervalele de incredere folosind testul de rang Wilcoxon

Rangul limitei inferioare Rangul limitei superioare Numarul de subiecti (N) 95% 90% 95% 90% 8 4 6 33 31 9 6 9 40 37

10 9 11 47 45

Page 99: APLICATII NUMERICE DE STATISTICA IN FARMACIE SI  · PDF fileSe spune, în acest caz, c:

Teste neparametrice

97

Pentru a determina un rang al mediilor geometrice vom construi, in

EXCEL, tabelul mediilor geometrice luate o singura data Vom folosi functia small(array;k) care calculeaza valoarea de rang

k dintr-un set de date (array). In cazul nostru array, in tabelul Exccel, a fost F3:Q20, ,

respectiv 40 pentru intervalul de incredere , deci am avut: 6k =

%95CI• =small(F3:Q20; 6)=1,13 • =small(F3:Q20; 40)=1,81

ceea ce inseamna un interval de incredere ( )95% 1,13 ,1,81CI = In cazul intervalului de incredere 90% limita inferioara va avea

rangul 9, iar cea superioara rangul 37 corespunzand astfel intervalului . ( )90% 1,19 ;1,74CI =

10. Vom considera notele unui grup de 12 studenti in functie de rezultatele obtinute la matematica (an I) si biostatistica (an IV).

Student A B C D E F G H I J K l Sem I 7 8 8 8 9 10 5 5 6 9 8 9 Sem II 5 5 6 7 7 10 8 8 8 6 10 8

Sa se verifice daca exista o corelatie semnificativa intre rezultatele obtinute la cele doua materii. 1 0,90α− = Solutie:

Vom aplica testul de rang Spearman. 0 : intH nu exista corelatie re materii

: intAH exista corelatie re materii Determinam rangurile pentru fiecare materie, aplicand conventiile

anterioare privind rangurile pentru valori egale (“cozi”): Student A B C D E F G H I J K l Sem I 4 6.5 6.5 6.5 10 12 1.5 1.5 3 10 6.5 10 Sem II 1.5 1.5 4.5 6.5 6.5 11.5 9.5 9.5 9.5 4.5 11.5 9.5

Determinam diferenta dintre ranguri pentru fiecare student ( ): idStudent A B C D E F G H I J K l

id 2.5 5 2 0 3.5 0.5 -8 -8 -6.5 5.5 -5 0.5 2id 6.25 25 4 0 12.25 0.25 64 64 42.25 30.25 25 0.25

2 273.5id =∑

Page 100: APLICATII NUMERICE DE STATISTICA IN FARMACIE SI  · PDF fileSe spune, în acest caz, c:

Teste neparametrice

98

Calculam ( ) ( )

2

12 2

66*273.51 1

1 12 12 1

n

ii

S

dr

n n== − = − ≅− −

∑0.04

Intrucat avem 12 10n = ⟩ vom aplica variabila

2 2

2 0.04 12 2 0.131 1 0.04

S

s

r nTr− −

= =− −

Deoarece 2;1 10;0.90 1.81nt tα− − = = si 0.13 1.81⟨ se accepta ipoteza , deci rezultatele nu sunt corelate.

0H

11. Studiem inhibitia colinesterazei de catre o serie de compusi organofosforici. Pentru fiecare compus s-a determinat: • Capacitatea inhibitoare, exprimata prin constanta K de formare a complexului enzima – compus; • Lipofilia, exprimata prin coeficientul de partitie P intre apa si octanol log K 2.27 2.44 2.46 2.56 3.08 3.23 3.27 3.32 3.71 log P 0.089 -0.67 0.021 0.66 0.82 1.88 2.53 2.39 1.67

Exista o corelatie semnificativa intre actiunea inhibitoare si lipofilie?

Solutie: Vom aplica testul de rang Spearman.

0 : intH nu exista corelatie re actiunea inhibitoare si lipofilie : intAH exista corelatie re actiunea inhibitoare si lipofilie

Determinam rangurile pentru fiecare compus

log K 1 2 3 4 5 6 7 8 9 log P 3 1 2 4 5 7 9 8 6

Determinam diferenta dintre ranguri pentru fiecare compus ( ): id

id -2 1 1 0 0 -1 -2 0 3 2id 4 1 1 0 0 1 4 0 9

2 20id =∑

Calculam ( )2

6*201 09 9 1Sr = − ≅

−.83

Page 101: APLICATII NUMERICE DE STATISTICA IN FARMACIE SI  · PDF fileSe spune, în acest caz, c:

Teste neparametrice

99

Intrucat avem 9 10n = ⟨ vom utiliza valoarea corespunzatoare din tabelul de corelatie (tabel 2): 0.59rα = pentru 0.10α =

Deoarece Sr rα⟩ vom respinge ipoteza , deci nu exista o corelatie semnificativa intre actiunea inhibitoare si lipofilie.

0H

12. La testarea bioechivalentei a doua preparate farmaceutice (testat –T si referinta – R) continand MELOXICAM s-a constatat ca distributia datelor din tabelul de mai jos nu poate fi considerata ca fiind normala nici pentru datele primare, nici pentru datele logaritmate.

Din acest motiv testarea bioechivalentei cu ajutorul testelor parametrice nu este aplicabila si rezultatul negativ in ceea ce priveste bioechivalenta nu este un rezultat care sa reflecte adevarul.

Vom verifica daca in acest caz, aplicarea testelor nonparametrice schimba concluzia negativa privind bioechivalenta comparand ariile de sub curba (AUC) pentru un studiu efectuat pe 18 subiecti din care s-au selectat ilustrativ 6 voluntari.

Subject AUC-R AUC-T 1 36,7 44,9 6 3,5 12,6 12 24,8 34,6 16 29,1 37,1 19 48,7 38,4 21 31,4 24,9

Solutie: Ipotezele statistice sunt:

0 :H produsele nu sunt bioechivalente :AH produsele sunt bioechivalente

Se studiaza mai intai diferentele dintre AUC pentru medicamentul testat si medicamentul referinta.

Subject AUC-R AUC-T RT AUCAUC −

1 36,7 44,9 8,2 6 3,5 12,6 9,1

12 24,8 34,6 9,7 16 29,1 37,1 8,0 19 48,7 38,4 -10,2 21 31,4 24,9 -6,5

Vom ordona crescator aceste diferente netinandu-se cont de semn. Subject

RT AUCAUC − Rang 21 -6,5 1 16 8,0 2 1 8,2 3

Page 102: APLICATII NUMERICE DE STATISTICA IN FARMACIE SI  · PDF fileSe spune, în acest caz, c:

Teste neparametrice

100

6 9,1 4 12 9,7 5 19 -10,2 6

Dupa ordonarea completa a diferentelor (netinandu-se cont de semne) se vor adauga semnele corespunzatoare diferentelor originale care au determinat aceste ranguri:

Subject

RT AUCAUC − Rang Rangurile continand semn

21 -6,5 1 - 1 16 8,0 2 2 1 8,2 3 3 6 9,1 4 4

12 9,7 5 5 19 -10,2 6 -6

Astfel, subiectul 21 care avea inainte rangul 1 va capata rangul -1

deoarece diferenta pentru acest subiect este negativa. Acelasi lucru se va intampla si cu subiectul 19 care va capata rangul -6.

Vom calcula suma rangurilor pozitive si suma rangurilor negative: 145432 =+++=+R si 761 =+=−R

In tabelul de mai jos sunt prezentate valorile “critice” ale celor doua sume de ranguri necesare pentru nivelul de semnificatie 5%, respectiv 1%, pentru N valori (N se considera numarul de perechi excluzand perechile a caror diferenta este 0). Cea mai mica suma a rangurilor trebuie sa fie cel mult egala cu cea din tabelul de mai jos pentru a considera cele doua grupuri de rezultate ca fiind diferite la nivelul de incredere specificat 05,0=α .

Tabel 1 N 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 α 0 2 3 5 8 10 13 17 21 25 30 35 40 46 52

In exemplul nostru 6=N , suma minima a rangurilor este si

(valoarea corespunzatoare din tabel). De aceea, spunem ca cele doua medicamente realizeaza nivele plasmatice asemanatoare pentru

7=−R07 ≥

05,0=α . Pentru valorile date aproximarea normala este mai la indemana pentru a compara cele doua populatii:

Page 103: APLICATII NUMERICE DE STATISTICA IN FARMACIE SI  · PDF fileSe spune, în acest caz, c:

Teste neparametrice

101

( )

( )( )24

1124

1

++

+−

=NNN

NNRZ

unde R este suma rangurilor (poate fi utilizata oricare dintre suma rangurilor pozitive sau negative) si N este numarul de elemente (exceptand valorile egale).

In cazul nostru, 6=N si 14=R , deci 73,0

247*13*6

47*614

≅−

=Z .

Deci, cele doua produse nu sunt bioechivalente.

13. Determinarea efectului antiinflamator al medicamentului Algopirin s-a efectuat pe modelul de inflamaţie experimentală cu carrageenan la nivelul labei piciorului posterior la şobolani. S-au utilizat şobolani Wistar cu greutate de 120 ± 10 g pentru fiecare variantă experimentală. S-a utilizat o soluţie salină de 1% carrageenan injectată în volum de 0,1 ml s.c. în laba posterioară.

Volumul labei a fost determinat înainte de administrare şi la 3 ore după injectarea soluţiei de carrageenan. Preparatele antiinflamatorii s-au administrat cu 1 oră în prealabil carageenanului, iar la 3 ore după administrarea acestora a fost determinat volumul labelor posterioare. Laba contralaterală a constituit referinţa.

S-au obtinut urmatoarele date experimentale privind volumul

inflamatiei (ml):

Acetyl salicylic acid

0.8 0.5 0.7 0.5 0.6 0.6 0.3

Chlorpheniramin 1 0.7 1 1 0.8 1.1 0.9 ALGOPIRIN -0.1 0.5 0.5 -0.2 -0.4 -0.3 0.2 Lot control 0.7 0.7 0.7 0.7 0.6 0.8 0.8 0.6 0.7 0.7

Sa se verifice ipoteza ca medicamentele pot reduce inflamatia.

Page 104: APLICATII NUMERICE DE STATISTICA IN FARMACIE SI  · PDF fileSe spune, în acest caz, c:

Teste neparametrice

102

absolute value of inflammation (ml) of the rat paw induced by caragenaan

-1

0

1

21

2

3

4

57

8

9

10

Patent

AAS

clorpheniramin

control Solutie: Vom aplica testul H

( )( )( )

2

2

1

12 1 1

112

k ii

i i

i

NR nH kNN N n

n

χ=

⎡ ⎤+⎢ ⎥− ⎛ ⎞⎢ ⎥= − ≅ −⎜ ⎟⎢ ⎥ ⎝ ⎠+ −⎢ ⎥

⎢ ⎥⎣ ⎦

Pentru aceasta vom ordona crescator toate valorile si vom aloca rangurile corespunzatoare tinandu-se cont ca in cazul in care apar cozi (valori egale) acestea vor avea drept rang media rangurilor pe care le-ar fi primit daca nu erau egale.

Acetyl salicylic acid 24.5 8.5 18.5 8.5 12.5 12.5 6 Chlorpheniramin 29 18.5 29 29 24.5 31 27 ALGOPIRIN 4 8.5 8.5 3 1 2 5 Lot control 18.5 18.5 18.5 18.5 12.5 24.5 24.5 12.5 18.5 18.7

Calculam iR media rangurilor pentru fiecare produs (pe linie).

iR

Acetyl salicylic acid 13.00Chlorpheniramin 26.86ALGOPIRIN 4.57Lot control 19.36

31N = 1 2 3 7n n n= = =

4 10n = ; 4k =

16,01R =

Page 105: APLICATII NUMERICE DE STATISTICA IN FARMACIE SI  · PDF fileSe spune, în acest caz, c:

Teste neparametrice

103

Vom calcula statistica H distribuita 2χ cu 3 grade de libertate:

( )( )

( )( ) ( )( ) ( )

2

2 2

2 2

12

1

7 13,00 16,01 7 26,86 16,0112 23,1731 31 1 7 4,57 16,01 10 19,36 16,01

i in R RH

N N

−= =

+

⎡ ⎤− + − +⎢ ⎥= =

+ ⎢ ⎥+ − + −⎣ ⎦

Deoarece apar valori egale, H trebuie impartit cu factorul NN

T−

− ∑31

unde ( ) ( ) 31 1T k k k k= − + = − k este calculat pentru fiecare grup de legături.

In cazul nostru avem: Grup de legaturi (rangul) Nr. Legaturi (k) ( ) ( )1 1T k k k= − +

8,5 4 60 12,5 4 60 18,5 8 504 24,5 4 60 29 3 24

T∑ 704

3 3

704 7041 1 131 31 29760

TN N

− = − = −− −

∑ 0,98

Deci, vom obtine 23,17 23,640,98

H = = .

Dar cuantila deci H este in zona de respingere si deci se poate vorbi de o actiune antiinflamatoare pusa in evidenta prin modelul experimental prezentat.

23;0,90 6,25χ =

Page 106: APLICATII NUMERICE DE STATISTICA IN FARMACIE SI  · PDF fileSe spune, în acest caz, c:

Teste neparametrice

104

Page 107: APLICATII NUMERICE DE STATISTICA IN FARMACIE SI  · PDF fileSe spune, în acest caz, c:

Regresia liniara

105

REGRESIA LINIARA Dacă reprezentarea grafică a două mărimi ce sunt observate

simultan sugerează o dependenţă liniară, ajungem la problema determinării dreptei ce descrie “cel mai bine” această dependenţă.

O soluţie a acestei probleme o constituie “dreapta prin cele mai mici pătrate”, dreapta pentru care suma pătratelor distantelor de la ea la punctele experimentale este minimă.

Să admitem că pentru un x fixat, valoarea măsurată y este o variabilă aleatoare cu urmatoarea structură: y xη ε α β ε= + = + + distribuită normal cu dispersia şi media 2σ xβαη += Estimarea ecuaţiei de regresie o notam : bxaY += Metoda celor mai mici pătrate dă valorile a şi b care minimizează suma pătratelor deviaţiilor (erorilor) între valorile observate şi cele prezise de ecuaţia de regresie:

iy

( ) ( )22 ∑∑ −−=−= iiiiE bxayYySS Valorile lui a şi b care minimizează suma pătratelor erorilor sunt:

( )∑ ∑∑ ∑ ∑ ∑

−= 22

2

ii

iiiii

xxn

yxxxya şi

( )( )( )2 22

i ii i i i

i i i

x x yn x y x yb

n x x x x

−−= =

− −

∑∑ ∑ ∑∑ ∑ ∑

Estimaţii şi ipoteze asupra coeficientului b: a) Cazul dispersiilor cunoscute

În cazul în care se cunoaşte dispersia erorilor de măsurare 2σ se

foloseşte variabila aleatoare

( )2

2

i

bZ

x X

β

σ

−=

⎡ ⎤⎢ ⎥⎢ ⎥−⎢ ⎥⎣ ⎦∑

repartizată . ( )1,0N

b) Cazul dispersiilor necunoscute În acest caz se folosest variabila aleatoare

( ) ( ) ⎥⎥

⎢⎢

−−

−=

∑2

2 Xxn

SS

bT

i

E

β repartizată Student cu n-2 grade de libertate.

Page 108: APLICATII NUMERICE DE STATISTICA IN FARMACIE SI  · PDF fileSe spune, în acest caz, c:

Regresia liniara

106

Coeficientul de corelaţie Coeficientul de corelaţie se defineşte prin formula

( )( )( )

( ) ( )1

2 2

1 1

,n

i i

n ni i

x x y yx y

x x y yρ

− −=

− −

∑∑ ∑

Observatie: Obtinerea unui coeficient de corelatie bun nu implica obligatoriu

faptul ca legea care coreleaza datele este o functie liniara. Consideram de exemplu urmatoarele puncte de pe parabola 2y x= .

x y 1 1 2 4 3 9 4 16

y = 5x - 5R2 = 0.969

0

2

4

6

8

10

12

14

16

18

0 2 4 6

Vom calcula coeficientul de corelatie:

ix iy x y xxi − iy y− ( )2xxi − ( )2

iy y−

( )( )i ix x y y− −

1 1 -1.5 -6.5 2.25 42.25 9.75 2 4 -0.5 -3.5 0.25 12.25 1.75 3 9 0.5 1.5 0.25 2.25 0.75 4 16

2.5 7.5

1.5 8.5 2.25 72.25 12.75 Vom avea:

( )2 5ix x− =∑ ; ( )2 129iy y− =∑ ; ( )( ) 25i ix x y y− − =∑

( )( )( )

( ) ( )1

2 2

1 1

25, 0.9845*129

ni i

n ni i

x x y yx y

x x y yρ

− −= =

− −=

∑∑ ∑

Deci, , dar punctele nu sunt corelate liniar ci parabolic. 2 0.969R =

Page 109: APLICATII NUMERICE DE STATISTICA IN FARMACIE SI  · PDF fileSe spune, în acest caz, c:

Regresia liniara

107

COMPARAREA A DOUA DREPTE DE REGRESIE In farmacologie se poate pune problema compararii a doua

medicamente nu numai in ceea ce priveste efectele la o doza administrata ci la mai multe doze aceasta mai ales in cazul unor farmacocinetici neliniare.

Relatia biodisponibilitatea – doza sau efect – doza se poate insa liniariza in urma unor transformari (de regula logaritmice).

Se pune in acest caz problema compararii celor doua drepte obtinute cu medicamentele respective. Acestea pot fi paralele, sau mai mult, pot fi estimari diferite ale uneia si aceleiasi drepte.

In alt context se pot compara doua metode bioanalitice prin compararea curbelor de etalonare liniarizate.

Deci matematic avem doua probleme : • verificarea ipotezei privind paralelismul si • verificarea ipotezei privind identitatea dreptelor 1. Verificarea ipotezei privind paralelismul

Presupunem ca am obtinut experimental doua grupe de date si . ( )ii yx 11 , ( )ii yx 22 ,

Presupunem ca aceste date sunt corelate de dreptele : ( )1111 xxy −+= βα si ( )2222 xxy −+= βα

si deci noi avem sa verificam ipoteza : βββ == 210 :H vs 21: ββ ≠AH

Similar cu demonstrarea facuta pentru o simpla dreapta se arata ca:

( ) ( ) ( )∑ ∑ −+−= 2

22

2

11

2

xxxxbD

ii

σ

Deci, pentru testarea ipotezei egalitatii pantelor folosim testul t. Pentru aceasta observam ca,

( ) ( ) ( )∑∑ −+

−=− 2

22

22

211

21

21xxxx

bbDii

σσsi ( ) 02121 =−=− ββbbE

Deci statistica de calculat este:

( ) ( )1 2

1 24

2 2

1 1 2 2

1 1n n

p

i i

b bTS

x x x x

+ −

−=

+− −∑ ∑

unde este dispersia ponderata a reuniunii celor doua populatii : pS

( ) ( )4

22

21

222

2112

−+−+−

=nn

SnSnS p

Page 110: APLICATII NUMERICE DE STATISTICA IN FARMACIE SI  · PDF fileSe spune, în acest caz, c:

Regresia liniara

108

2. Verificarea ipotezei privind identitatea dreptelor. Dupa verificarea ipotezei ca cele doua drepte sunt paralele, se pune

problema daca ele sunt efectiv identice si deic dreptele obtinute prin metoda celor mai mici patrate sunt estimari ale uneia si aceiasi drepte.

Pentru aceasta vom considera dreptele ( )111 xxy −+= βα si ( )222 xxy −+= βα

si estimarile , si pentru 1a 2a b 1α , 2α , respectiv β obtinute prin metoda celor mai mici patrate.

Deci vom calcula valorile , si care minimizeaza suma patratelor abaterilor :

1a 2a b

( ) ( )[ ] ( )[ ]22222

2

111121 ,, ∑∑ −−−+−−−= xxbayxxbaybaaSP iiii Conditia necesara ca ( )baaSP ,, 21 sa fie minim este ca :

021

=∂∂

=∂∂

=∂∂

bSP

aSP

aSP

Calculand se obtine :

( )[ ] 02 11111

=−−−−=∂∂ ∑ xxbay

aSP

ii

( )[ ] 02 22222

=−−−−=∂∂ ∑ xxbay

aSP

ii

( )[ ]( )( )[ ]( )222222

111111

2

2

xxxxbay

xxxxbayb

SP

iii

iii

−−−−−

−−−−−−=∂∂

∑∑

Deoarece ( ) ( ) 02211 =−=−∑ ∑ xxxx ii (suma diferentelor fata de medie), rezulta imediat din primele doua ecuatii:

11

11 y

ny

a i == ∑ si 22

22 y

ny

a i == ∑

Inlocuind in a treia ecuatie se obtine:

( )( ) ( )( )( ) ( ) 0

2222222

2

111111

=−+−−−

−−+−−−

∑∑∑∑

xxbxxyy

xxbxxyy

iii

iii

de unde ( )( ) ( )( )

( ) ( )∑∑∑∑

−+−

−−+−−= 2

222

11

22221111

xxxx

xxyyxxyyb

ii

iiii

Page 111: APLICATII NUMERICE DE STATISTICA IN FARMACIE SI  · PDF fileSe spune, în acest caz, c:

Regresia liniara

109

Deoarece ( ) ( )2211 xxxx −+≡−+ βαβα si ( )2121 xx −≡− βαα consideram estimarea ( ) ( )2121 xxbaaZ −−−= avand • ( ) 0=Z deoarece E 11 ya = si 22 ya = •

( ) ( ) ( )

( )( ) ( ) ⎥

⎢⎢

−+−

−++=

=−++=

∑ ∑2

222

11

2

21

21

2

2

212

22

1

21

11

xxxx

xxnn

bDxxnn

ZD

ii

σ

σσ

Astfel se compara valoarea raportului ( ) ( )

( )( ) ( )

1 2

1 2 1 23 2

1 22 2

1 2 1 1 2 2

1 1n n

p

i i

a a b x xT

x xS

n n x x x x

+ −

− − −=

−+ +

− + −∑ ∑

cu valorile pragului de acceptare (respingere) a ipotezei pentru un interval de incredere α−1 fixat. In ceea ce priveste estimarea a dispersiei, se poate lua suma erorilor .

2pS

( )baaSP ,, 21

Aplicatii: 1. La stabilirea curbei de calibrare pentru inceperea unei noi sesiuni de lucru s-au obtinut urmatoarele rezultate:

Concentratie (µg/mol)

Arie analit / Arie standard intern

1 0,1 3 0,3 6 1,7

10 3,4

y = 0.3848x - 0.5489R2 = 0.9747

-0.5

0

0.5

1

1.5

2

2.5

3

3.5

4

0 2 4 6 8 10 12

Page 112: APLICATII NUMERICE DE STATISTICA IN FARMACIE SI  · PDF fileSe spune, în acest caz, c:

Regresia liniara

110

Stiind, de la validare ca sa se calculeze pentru panta dreptei de regresie.

2 0.09σ = 90%CI

Solutie: Dreapta care aproximeaza punctele este de forma *y xβ α= + . Panta dreptei care aproximeaza dependenta liniara este ( )xy( )( )∑

∑−

−= 2

xx

yxxb

i

ii . Deoarece se cunoaste dispersia, pentru determinarea

pentru panta dreptei de regresie, vom folosi variabila aleatoare 90%CI

( )2

2

i

bZ

x X

β

σ

−=

⎡ ⎤⎢ ⎥⎢ ⎥−⎢ ⎥⎣ ⎦∑

repartizată ( )1,0N .

In cazul nostru avem: ix iy x xxi − ( ) ii yxx − ( )2xxi − ( )∑ −

2xxi

( )∑ − ii yxx

1 0,1 -4 -0.4 163 0,3 -2 -0.6 46 1,7 1 1.7 110 3,4

5

5 17 25

46 17,7

Vom obtine astfel 17,7 0,3846

b = =

Vom folosi urmatoarea variabila aleatoare 0,38 0,380,040,09

46

Z β β− −= = .

Deoarece 0.05 0.95 1,65z z= − = − , avem 0,381,65 1,65 0,900,04

P β−⎛ ⎞− ⟨ ⟨ =⎜ ⎟⎝ ⎠

( )0.07 0,38 0.07 0.9P β− ⟨ − ⟨ = ⇒ ( )0,45 0,31 0.9P β− ⟨ − ⟨ − =

( )0,31 0,45 0.9P β⟨ ⟨ = ⇒ ( )90% 0,31; 0,45CI = 2. Masurand absorbanta unor solutii de 4 – nitrofenol de diferite concentratii la lungimea de unda 400 nmλ = s-au obtinut urmatoarele rezultate:

Concentratia C (moli*10-5/l) 1 2 3 4 5 Absorbanta (A) 0,2 0,4 0,5 0,7 0,9

Page 113: APLICATII NUMERICE DE STATISTICA IN FARMACIE SI  · PDF fileSe spune, în acest caz, c:

Regresia liniara

111

Presupunand ca dreapta prin cele mai mici patrate care aproximeaza punctele trece prin origine sa se determine intervalul de incredere 90% pentru panta dreptei. Solutie:

Dreapta care aproximeaza punctele este de forma xy *β= . Din metoda celor mai mici patrate, panta dreptei care aproximeaza

dependenta liniara ( )xy este ( )( )∑

∑−

−= 2

xx

yxxb

i

ii .

In cazul nostru avem: ix iy x xxi − ( ) ii yxx − ( )2xxi − ( )∑ −

2xxi

( )∑ − ii yxx

1 0.2 -2 -0.4 42 0.4 -1 -0.4 13 0.5 0 0 04 0.7 1 0.7 15 0.9

3

2 1.8 4

10 1.7

1.7 0.1710

b = = 0.17*y xdeci, dreapta de regresie este =

y = 0.1782xR2 = 0.9869

0.0

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

0.9

1.0

0 2 4 6

Intervalul de incredere 90% pentru β se calculeaza pornind de la

distributia T a variabilei aleatoare.

( ) ( )∑ −−

−=−

2

2

2 xxn

SSbT

i

En

β

Page 114: APLICATII NUMERICE DE STATISTICA IN FARMACIE SI  · PDF fileSe spune, în acest caz, c:

Regresia liniara

112

* =( ) ( ) ( )( ) ( ) ( )( ) ( )

22 2

2 2 2

2 2

* * 0,17

0,2 0,17*1 0,4 0,17*2 0,5 0,17*3

0,7 0,17*4 0,9 0,17*5 0,008

E i i i i i iSS y a b x y b x y x= − + = − = −⎡ ⎤⎣ ⎦

= − + − + − +

+ − + − =

∑ ∑ ∑

30,17 0,17

0.020,0083*10

T β β− −= =

Deoarece 35.205.0:3 −=t , avem 0,172.35 2.35 0.90.02

P β−⎛ ⎞− ⟨ ⟨ =⎜ ⎟⎝ ⎠

( )0.05 0,17 0.05 0.9P β− ⟨ − ⟨ = ⇒ ( )0,22 0,12 0.9P β− ⟨ − ⟨ − =

( )0,12 0,22 0.9P β⟨ ⟨ = ⇒ ( )90% 0,12 ; 0,22CI = 3. Sa se calculeze dreapta prin cele mai mici patrate care aproximeaza punctele

ix 1 2 3 4 5

iy 2 5 5 8 11 si care trece prin origine si sa se determine intervalul de incredere 90% pentru panta dreptei. Solutie:

Dreapta care aproximeaza punctele este de forma xy *β= . Din metoda celor mai mici patrate, panta dreptei care aproximeaza

dependenta liniara ( )xy este ( )( )∑

∑−

−= 2

xx

yxxb

i

ii .

In cazul nostru avem: ix iy x xxi − ( ) ii yxx − ( )2xxi − ( )∑ −

2xxi

( )∑ − ii yxx

1 2 -2 -4 4 2 5 -1 -5 1 3 5 0 0 0 4 8 1 8 1 5 11

3

2 22 4

10 21

1.21021

==b x*1,2deci, dreapta de regresie este Y =

Page 115: APLICATII NUMERICE DE STATISTICA IN FARMACIE SI  · PDF fileSe spune, în acest caz, c:

Regresia liniara

113

y = 2,1x

0

2

4

6

8

10

12

0 2 4 6

Intervalul de incredere 90% pentru β se calculeaza pornind de la

distributia T a variabilei aleatoare.

( ) ( )∑ −−

−=−

2

2

2 xxn

SSbT

i

En

β

( ) ( ) ( )( ) ( ) ( ) ( ) (

22 2

2 2 2 2

* * 2,1*

2 2.1*1 5 2.1*2 5 2.1*3 8 2.1*4 11 2.1*50.01 0.36 1.69 0.16 0.25 2.77

E i i i i i iSS y a b x y b x y x= − + = − = − =⎡ ⎤⎣ ⎦

= − + − + − + − + − =

= + + + + =

∑ ∑ ∑)2

3.01.2

09.01.2

10*377.2

1.23

βββ −=

−=

−=T

Deoarece 35.205.0:3 −=t , avem 9.035.23.0

1.235.2 =⎟⎠⎞

⎜⎝⎛ ⟨

−⟨−

βP

( ) 9.07.01.27.0 =⟨−⟨− βP ⇒ ( ) 9.04.18.2 =−⟨−⟨− βP ( )1.4 2.8 0.9P β⟨ ⟨ = ⇒ ( )90% 1,4 ; 2,8CI =

4. Metforminul se foloseste in doza de 500 – 2500 mg si problema este daca farmacocinetica este liniara sau nu, daca la dublarea dozei se dubleaza si concentratia maxima si aria de sub curba sau nu.

Datele furnizate de Bristol Myers Squibb pentru metforminul retard ,

Glucophage XR privind concentratia maxima la echilibru dupa administrarea repetata (1 cpr/zi) sunt urmatoarele:

Page 116: APLICATII NUMERICE DE STATISTICA IN FARMACIE SI  · PDF fileSe spune, în acest caz, c:

Regresia liniara

114

Doza administrata (g)

Concentratia (µg/ml)

0.5 0.6 1 1.1

1.5 1.4 2 1.8

Metformin

y = 0.78x + 0.25R2 = 0.9909

0

0.5

1

1.5

2

0 0.5 1 1.5 2 2.5

Doza (g)

Con

cent

ratia

(mg/

l)

Deoarece in cercetarile publicate1,2,3 au sugerat lipsa unei

proportionalitati intre parametrii farmacocinetici la marirea dozei, verificati corelarea liniara a datelor de mai sus. Solutie:

Din metoda celor mai mici patrate, vom determina

( )∑ ∑

∑ ∑ ∑ ∑−

−= 22

2

ii

iiiii

xxn

yxxxya şi

( )∑ ∑∑ ∑ ∑

−= 22

ii

iiii

xxn

yxyxnb

In cazul nostru nu cunostem dispersia, deci pentru a determina pentru panta dreptei de regresie, vom folosi variabila aleatoare 90%CI

( ) ( )∑ −−

−=−

2

2

2 xxn

SSbT

i

En

β repartizată Student cu 2n− grade de libertate.

Vom obtine urmatoarele date:

1 N.C.Sambol, J.Chiang, M.O’Conner, Chui Y.Liu, E.T.Lin, A.M.Goodman, Leslie Z. Benet, J.H.Karam, Pharmacokinetics and pharmacodynamics of Metformin in healthy subjects and patients with noninsulin – dependent diabetes mellitus, Br. J.Clin Pharmacol 1996; 36:1012 - 1021 2 E.Cullen, J.Liao, P.Lukacsko, R.Niecestro, L.Friedhoff, Pharmacokinetics and dose proportionality of extended release Metformin following administration of 1000, 1500, 2000 and 2500 mg in healthy volunteers, Biopharmaceutics & Drug Disposition 25: 261 – 263 (2004) 3 N.C.Sambol, L.G.Brookes, J.Chiang, A.M.Goodman, E.T.Lin, C.Y.Liu, L.Z.Benet, Food intake and dosage level, but not tablet vs solution dosage form, affect the absorption of Metformin HCl in man, , Br. J.Clin Pharmacol 1996; 42:510 - 512

Page 117: APLICATII NUMERICE DE STATISTICA IN FARMACIE SI  · PDF fileSe spune, în acest caz, c:

Regresia liniara

115

ix iy 2ix x i ix y

ix x− ( )2

ix x−

0.5 0.6 0.25 0.3 -0.75 0.5625 1 1.1 1 1.1 -0.25 0.0625

1.5 1.4 2.25 2.1 0.25 0.0625

2 1.8 4

1.25

3.6 0.75 0.5625 Suma 5 4.9 7.5 7.1 1.25 Deci,

( )2

2 22

4.9*7,5 5*7,1 0.254*7.5 5

i i i i i

i i

y x x x ya

n x x

− −= =

−−∑ ∑ ∑ ∑

∑ ∑=

( )2 22

4*7,1 5*4,9 0.784*7.5 5

i i i i

i i

n x y x yb

n x x

− −= =

−−

∑ ∑ ∑∑ ∑

=

Deci, dreapta de regresie este 0.25 0.78*y x= +

Vom calcula ( ) ( )i ⇒22

* 0.25 0.78*E i i iSS y a b x y x= − + = − −⎡ ⎤⎣ ⎦∑ ∑)( ) (

( ) ( )

2 2

2 2

0.6 0.25 0.78*0.5 1.1 0.25 0.78*1

1.4 0.25 0.78*1.5 1.8 0.25 0.78*2 0.007ESS = − − + − − +

+ − − + − − =

Variabila aleatoare este

( )

0.78 0.780.050.007

4 2 1.25

T β β− −= =

distribuita

Student cu 2 grade de libertate.

Deoarece 2:0.05 2:0.95 2.92t t= = − , avem 0.782.92 2.92 0.90.05

P β−⎛ ⎞− ⟨ ⟨ =⎜ ⎟⎝ ⎠

( )0.15 0.78 1.5 0.9P β− ⟨ − ⟨ = ⇒ ( )0.93 0.63 0.9P β− ⟨ − ⟨ − =

( )0.63 0.93 0.9P β⟨ ⟨ = ⇒ ( )90% 0.63 ; 0.93CI = 5. Pentru un lot de 9 compusi organofosforici s-a analizat relatia dintre constanta de inhibitie a colinesterazei ( iK ) si un parametru ( aB ) ce caracterizeaza alcalinitatea compusilor. Aceasta relatie a fost exprimata sub forma urmatoarei drepte de regresie:

( ) ( )8.1 3.1 13.0 5.7i aK B= ± + − ± (parametrii sunt sub forma urmatoare: valoarea estimata ± dispersia de selectie). Este aceasta regresie semnificativa?

Page 118: APLICATII NUMERICE DE STATISTICA IN FARMACIE SI  · PDF fileSe spune, în acest caz, c:

Regresia liniara

116

Solutie: Estimarea dreptei de regresie este : bxaY += unde:

• 13.0 ; 5.7aSa = − = ; • 8.1b = ; 3.1bS = ; si • 9n =

Vom avea de testat urmatoarele ipoteze statistice: 0 : 0H β = vs : 0AH β ≠

Vom considera variabila aleatoare b

bTSβ−

= este repartizata Student cu

grade de libertate. 2n−

In aceste conditii avem 8.1 0 2.613.1

T −= = este repartizata Student cu

7 grade de libertate. Deoarece 7:0.05 7:0.95 1.90t t= = − si , rezulta ca T este in

zona de respingere. 2.61 1.90⟩

Vom spune ca se respinge ipoteza 0 :H 0β = , deci regresia este semnificativa.

6. Consideram o anumită formulare (ex.: comprimate) care fac obiectul studiului stabilităţii. Produsul luat în considerare are o concentraţie declarată de 50 mg şi cu o specificaţie tehnică care prevede o supradozare de 4%; în acest caz producătorul va fabrica tablete cu o concentraţie de 52 mg de substanţă activă.

Se aleg trei tablete la întâmplare, se analizează la: 0,3, 6, 9, 12 şi 18 luni, după producţie, în condiţiile temperaturii camerii (20 de grade Celsius). Datele sunt prezentate în tabelul de mai jos.

Timp t (luni)

Concentratia C Media

0 51 51 53 51.7 3 51 50 52 51.0 6 50 52 48 50.0 9 49 51 51 50.3 12 49 48 47 48.0 18 47 45 49 47.0

44

45

46

47

48

49

50

51

52

53

54

0 5 10 15 20

timp (luni)

Con

cent

ratie

(mg)

Presupunem că concetraţia şi timpul sunt în relaţie liniară:

Page 119: APLICATII NUMERICE DE STATISTICA IN FARMACIE SI  · PDF fileSe spune, în acest caz, c:

Regresia liniara

117

( ) 0C t C kt= − unde • C(t) = concentraţia la timpul t • C0 = concentraţia la timpul 0 • k = constanta • t = timpul de depozitare Sa se determine dreapta care aproximeaza cel mai bine aceste date. Solutie : Când facem calculele celor mai mici pătrate, reţinem că fiecare valoare a timpului este asociată cu trei valori ale concentraţiei medicamentului. Dacă calculăm C0 şi K, fiecare valoare de timp este numărată de trei ori şi N este egal cu 18. Avem:

( ) ( ) ( )0 0 0 1 1 1 .... 18 18 18 144ix = + + + + + + + + + =∑

( ) ( ) ( )2 2 2 2 2 2 2 2 2 20 0 0 1 1 1 .... 18 18 18 1782ix = + + + + + + + + + =∑

144 818

ixx

N= = =∑

( ) ( )51 51 53 .... 47 45 49 894iy = + + + + + + =∑

( ) ( )2 2 2 2 2 2 251 51 53 .... 47 45 49 44476iy = + + + + + + =∑ 894 49.67 5018

y = = ≅

( ) ( )0*51 0*51 0*53 .... 18*47 18*45 18*49 6984i ix y = + + + + + + =∑

( ) ( ) ( )2 2 23* 0 8 ... 18 8 630ix x ⎡ ⎤− = − + + − =⎣ ⎦∑

( ) ( ) ( ) ( ) ( )2 2 2 2 251 50 51 50 53 50 ... 49 50 74y y− = − + − + − + + − =∑

Obtinem:

( )2 22

18*6984 144*894 0,267 /18*1782 144

i i i i

i i

N x y x yb mg luna

N x x

− −= = = −

−−∑ ∑ ∑∑ ∑

( )894* 0, 267 *8 51,8018

a y b x= − = − − =

Ecuaţia dreptei de regresie este: ( ) 51,80 0, 267*C t t= −

Page 120: APLICATII NUMERICE DE STATISTICA IN FARMACIE SI  · PDF fileSe spune, în acest caz, c:

Regresia liniara

118

7. In conformitate cu exercitiul precedent, ( ) 0 51,80 0,267*C t C kt t= − = − ,

iar datele experimentale sunt urmatoare: Timp t (luni) Concentratia C

0 51 51 53 3 51 50 52 6 50 52 48 9 49 51 51 12 49 48 47 18 47 45 49

sa se calculeze intervalul de incredere 90% pentru constanta k. Solutie:

Vom folosi variabila aleatoare:

( ) ( )2

2

0, 267

2

NE

i

kTSS

N x

x

− −=

− −∑

( )

( ) ( )( ) ( )

( )

2exp

222 2 2 22

22

2 2

2 244476 894 /18 0,267 *630

1,182518 2

thi i

ii i

y ySSEN N

yy b xy y b x x N

N N

−= =

− −

− − −− − −= =

− −

− − −= =

∑∑ ∑∑ ∑ x=

( ) ( ) ( )2 2 23* 0 8 ... 18 8 630ix x ⎡ ⎤− = − + + − =⎣ ⎦∑

Deci, avem variabila aleatoare 0, 2670.043

kT − −= distribuita Student cu

16 grade de libertate.

Deoarece 16;0.05 16;0.95 1.75t t= = − , avem 0,2671,75 1,75 0.90,043

kP − −⎛ ⎞− ⟨ ⟨ =⎜ ⎟⎝ ⎠

( )0.075 0,267 0.075 0.9P k− ⟨ − − ⟨ = ⇒ ( )0.342 0.192 0.9P k− ⟨ − ⟨ − =

( )0.192 0.342 0.9P k⟨ ⟨ = ⇒

( )90% 0.192 ; 0.342CI =

Page 121: APLICATII NUMERICE DE STATISTICA IN FARMACIE SI  · PDF fileSe spune, în acest caz, c:

Regresia liniara

119

8. Dandu-se date din exercitiul nr. 6, sa se calculeze termenul de valabilitate (timpul cand produsul a obtinut 90% din doza initiala). Solutie:

Conform exercitiului nr. 6, am obtinut dreapta de regresie care reprezinta dependenta concentratiei in functie

de timp. ( ) 51,80 0, 267*C t t= −

Avem de calculat timpul în care concentraţia comprimatului este de 90% din cantitatea de substanţă activă declarată, adică 45 mg.

45 51,80 0, 267* t= − ⇒ 25,5t luni= Estimarea timpului la care concetraţia comprimatului va fi de 90% din cantitatea declarată iniţial (se regăsesc 45 mg de substanţă activă după 25,5 luni de la data fabricaţiei). Aceasta este un rezultat mediu bazat pe datele a 18 tablete. 9. Consideram urmatoarele selectii din doua populatii corelate:

1ix 1iy 2ix 2iy0 2 0 3 1 3 1 4 2 5 2 5 3 6 3 7

y = 1.3x + 2.8R2 = 0.9657

y = 1.4x + 1.9R2 = 0.98

0

1

2

3

4

5

6

7

8

0 1 2 3 4

Series1Series2Linear (Series2)Linear (Series1)

Sa se verifice ipoteza ca dreptele sunt paralele.

Solutie : Vom determina si . 1b 2bPentru calculul lui avem 1b

1ix 1iy 1x 1 1ix x− ( )1 1i i1x x y− ( )2

1 1ix x− ( )211ix x−∑ ( )1 1i i1x x y−∑

0 2 -1.5 -3 2.251 3 -0.5 -1.5 0.252 5 0.5 2.5 0.253 6

1.5

1.5 9 2.25

5 7

Page 122: APLICATII NUMERICE DE STATISTICA IN FARMACIE SI  · PDF fileSe spune, în acest caz, c:

Regresia liniara

120

Obtinem ( )( )

1 1 11 2

1 1

7 1,45

i i

i

x x yb

x x

−= = =

( )−

∑∑

si

2112

11

5 1,671 3

ix xS

n

−= = =

−∑

Pentru calculul lui avem 2b

2ix

2iy 2x

2 2ix x−

( )2 2 2i i (x x y−

)2

2 2ix x−

( )222ix x−∑

( )2 2i i2x x y−∑

0 3 -1.5 -4.5 2.251 4 -0.5 -2 0.252 5 0.5 2.5 0.253 7

1.5

1.5 10.5 2.25

5 6.5

Obtinem ( )( )

2 2 22 2

2 2

6,5 1,35

i i

i

x x yb

x x

−= = =

( )∑∑

si

2222

22

5 1,671 3

ix xS

n

−= = =

−∑

Vom calcula dispersia ponderata a reuniunii celor doua populatii ( ) ( )2 2

1 1 2 22

1 2

2 2 2*1,67 2*1,67 4*1,67 1,674 4 4 4 4p

n S n SS

n n− + − +

= = =+ − + −

= ⇒

1, 29pS = Calculam variabila

( ) ( )1 2

1 24

2 2

1 1 2 2

1, 4 1,3 0,1 0,120,821 1 1 11,29

5 5

n n

p

i i

b bTS

x x x x

+ −

− −= =

+ +− −∑ ∑

= =

distribuita Student cu 4 grade de libertate. Deoarece 4;0.05 4;0.95 2,13t t= = − si 0,12 2,13⟨ , rezulta ca T este in

zona de acceptare, deci cele doua drepte sunt paralele. 10. Sa se verifice ipoteza ca dreptele de la exercitiul anterior sunt identice. Solutie :

Pentru a verifica ipoteza privind egalitatea celor doua drepte se compara valoarea raportului

Page 123: APLICATII NUMERICE DE STATISTICA IN FARMACIE SI  · PDF fileSe spune, în acest caz, c:

Regresia liniara

121

( ) ( )( )

( ) ( )

1 2

1 2 1 23 2

1 22 2

1 2 1 1 2 2

1 1n n

p

i i

a a b x xT

x xS

n n x x x x

+ −

− − −=

−+ +

− + −∑ ∑

cu valorile pragului de acceptare (respingere) a ipotezei pentru intervalul de incredere α−1 fixat, unde :

• 11

11 y

ny

a i == ∑

• 22

22 y

ny

a i == ∑ si

• ( )( ) ( )( )

( ) ( )∑∑∑∑

−+−

−−+−−= 2

22

2

11

22221111

xxxx

xxyyxxyyb

ii

iiii

1ix 1iy ( )1 1ix x− ( )1 1iy y− ( )( )1 1 1 1i ix x y y− − ( )2

1 1ix x−

0 2 -1.5 -2 3 2.25 1 3 -0.5 -1 0.5 0.25 2 5 0.5 1 0.5 0.25 3 6 1.5 2 3 2.25

1 1,5x = 1 4y = 7=∑ 5=∑ si:

2ix 2iy ( )2 2ix x− ( )2 2iy y− ( )( )2 2 2 2i ix x y y− − ( )2

2 2ix x−

0 3 -1.5 -1.75 2.625 2.25 1 4 -0.5 -0.75 0.375 0.25 2 5 0.5 0.25 0.125 0.25 3 7 1.5 2.25 3.375 2.25

2 1,5x = 2 4,75y = 6,5=∑ 5=∑ Conform exercitiului precedent avem:

• 1, 29p S =

• 1 4a = • 2 4,75 si a =

• 7 6,5 1,355 5

b += =

+

Page 124: APLICATII NUMERICE DE STATISTICA IN FARMACIE SI  · PDF fileSe spune, în acest caz, c:

Regresia liniara

122

Deci, vom obtine variabila aleatoare: ( ) ( )

( )4 4 3 2

4 4,75 1,35 1,5 1,5 0,75 2 0,81,291,5 1,51 11,29

4 4 5 5

T + −

− − − −= =

−+ +

+

2= −

distribuita Student cu 5 grade de libertate. Deoarece 5;0.05 5;0.95 2,02t t= = − si 2,02 0,82− ⟨ − , rezulta ca T este in

zona de acceptare, deci cele doua drepte sunt paralele.

Page 125: APLICATII NUMERICE DE STATISTICA IN FARMACIE SI  · PDF fileSe spune, în acest caz, c:

ANOVA

123

METODE STATISTICE DE ANALIZA FACTORILOR DE VARIABILITATE IN EXPERIMENTUL BIOLOGIC (ANOVA) Se pune problema comparării mai multor selecţii provenite din aceiasi populatie sau din populaţii pe care le ştim ca fiind normal repartizate, de exemplu concentraţiile plasmatice realizate de tablete care conţin diferiţi excipienţi, dar care au aceeaşi substanţă activă, în aceeaşi doză. Vrem să verificăm ipoteza compusă că acestea provin de fapt din aceiaşi populaţie, având media μ şi dispersia σ, deci că excipienţii folosiţi nu influenţează semnificativ cedarea şi absorbţia substanţei active: 43210 : μμμμ ===H

faţă de ipoteza alternativă că cel puţin două medii nu sunt egale. Analiza dispersională este o metodă fundamentală a statisticii care, în plus faţă de mijloacele de calcul a “tendinţei centrale” a rezultatelor experimentelor repetate, caracterizează mai ales variabilitatea acestora. Privita din unghiul de vedere al factorilor de variabilitate ANOVA se transforma in « analiza factoriala » care porneste de la aceeasi metode dar incearca sa rezolve alte probleme. Cea mai simplă analiză dispersională, numită analiză dispersională unidimensională sau unifactorială (numită în literatura engleză şi “one-way ANOVA”) sau “experiment complet aleator”, “experiment cu grupuri paralele”, corespunde testului t de analiză a două eşantioane independente şi compară două sau mai multe grupuri.

In ipoteza că toate grupurile aparţin aceleiaşi populaţii, ideea testului este aceea că variabilitatea în interiorul grupurilor trebuie să fie de acelaşi ordin cu variabilitatea între mediile grupurilor.

În consecinţă, dispersia totală, evaluată ca suma a pătratelor diferenţelor între valorile individuale şi media întregii populaţii selectate SST, este separată într-o parte datorită variaţiei între grupuri (within), sau variabilităţii “interioare” şi o parte datorită variabilităţii “dintre” (between) grupuri: BWT SSSSSS += .

Page 126: APLICATII NUMERICE DE STATISTICA IN FARMACIE SI  · PDF fileSe spune, în acest caz, c:

ANOVA

124

Daca comparam intra si intervariabilitatea cu testul Fischer – Snedecor si se obtine un rezultat pozitiv, atunci vom putea spune ca grupurile nu difera intre ele.

Fie modelul statistic : ijiijx εαμ ++= unde : • μ este media populatiei • iαμ + este media grupului respectiv • ijε este eroarea de masurare

Dacă numărul de grupuri este k şi numărul de subiecţi în grupul i este atunci eroarea totala poate fi scrisa sub forma: in

(2

1∑∑

=

−=n

i

n

jijT

i

XxSS )

Dupa cum s-a demonstrat la curs, aceasta relatie poate fi scrisa sub forma identitatii analizei dispersionale:

( ) ( ) WB

k

i

n

jiij

k

iiiT SSSSXxXXnSS

i

+=−+−= ∑∑∑22

si raportul W

B

W

B

MSMS

kNSSkSS

F =

−= 1 este distribuit ( )1,F k N k− − .

Dupa cum se observă, ( )

2

2

11 x

k

iii

B sk

XXn

kSS

=−

−=

∑ reprezintă

dispersia de selecţie ponderată a mediilor de grup faţă de marea medie. Abaterile mediilor grupurilor faţă de media generală depind atât de

hazardul măsuratorilor cât şi de factori ce ţin de însăsi natura grupurilor. Abaterile în interiorul grupurilor sunt independente de aceşti factori, deoarece fiecare valoare măsurată este raportată la însăşi media grupului respectiv. Ele reprezintă fluctuaţii aleatoare.

Variabilitatea în interiorul grupurilor reprezintă diferenţa între variabilitatea totală şi variabilitatea între grupuri.

Page 127: APLICATII NUMERICE DE STATISTICA IN FARMACIE SI  · PDF fileSe spune, în acest caz, c:

ANOVA

125

TESTAREA EFECTELOR DE FORMULARE, SECVENTA SI PERIOADA IN EXPERIMENTUL INCRUCISAT CU 2 PERIOADE SI 2 SECVENTE

Pornind de la modelul statistic : ( ) ( ) ijkkjkjjikijk eCFPSY +++++= − ,1,μ

se formeaza combinatiile liniare (“contrastele”): • kikiik YYU 21 += , kni ,1= , 2,1=k (R+T si respective T+R)

• ( )kikiik YYd 1221

−= , kni ,1= , 2,1=k .

• ( )( )⎭

⎬⎫

⎩⎨⎧

−−−

=TRventainsubiectiipentrud

RTventainsubiectiipentrudO

ik

ikik 2sec.,

1sec.,

prezenta sau absenta efectelor rezultand din aplicarea testului t acestor variabile aleatoare, conform tabelului de mai jos:

Variabila test ( ) ..%100/1 ICα− Test statistic

Car

ry

- ov

er ( ) ( )22.12.21.11.

1.2.

YYYY

UUC

+−+

=−=

212,2

1121 nn

tC unn

+±⎟⎠⎞

⎜⎝⎛ −+

σα

21

11nn

CT

u

c

+=σ

Efec

t fo

rmul

are

( ) ( )[ 12.22.11.21.

2.1.

21 YYYY

ddF

−−−

=−=

212,2

1121 nn

tF dnn

+±⎟⎠⎞

⎜⎝⎛ −+

σα

]

21

11nn

FT

d

d

+=σ

Peri

oada

( ) ( )[ ]22.12.11.21.

2.1.

21 YYYY

OOP

−+−

=−=

212,2

1121 nn

tP dnn

+±⎟⎠⎞

⎜⎝⎛ −+

σα

21

11nn

PT

d

p

+=σ

ANALIZA DISPERSIONALA IN TESTAREA CORELATIEI SI REGRESIEI LINIARE

Consideram o variabila aleatoare care depinde liniar de variabila aleatoare

yx :

xy βα += Atunci cand facem determinarile experimentale noi nu stim nici daca

cele doua variabile se coreleaza liniar si nici care este dreapta care descrie

Page 128: APLICATII NUMERICE DE STATISTICA IN FARMACIE SI  · PDF fileSe spune, în acest caz, c:

ANOVA

126

dependenta lor. Putem insa, prin analiza datelor experimentale sa determinam, prin metoda celor mai mici patrate, o estimare a dreptei

bxay +=ˆ daca vom considera un set de determinari ( )

jNjijy,1=

corespunzatoare pentru

un dat : ix

Distanta de la un punct dat la ijy y se poate descompune in trei

componente: distanta pana la iy - media punctelor , distanta de la media grupului la valoarea estimata prin dreapta si distanta de la punctele de

pe dreapta la media totala

ijy

iy

y : ( ) ( ) ( )yyyyyyyy iiiiijij −+−+−=− ˆˆ

Ridicand la patrat, sumand si tinand cont ca sumele de produse mixte sunt zero, se obtine :

( ) ( ) ( ) ( )2222ˆˆ ∑∑∑∑ −+−+−=− yyNyyNyyyy iiiiiiijij

sau elinearitatelinearitatladedeviatieeroareT SSSSSSSS ++=

Observam ca, daca toate punctele ar fi pe o dreapta va fi zero, deci aceasta suma este o masura a corelarii liniare.

elinearitatladedeviatieSS

Intr-adevar :

( ) ( )xxSS

rxxbbxabxayyx

y −=−=−−+=−ˆ

Page 129: APLICATII NUMERICE DE STATISTICA IN FARMACIE SI  · PDF fileSe spune, în acest caz, c:

ANOVA

127

Facem observatia ca datele pot fi aproximate foarte bine dupa o alta lege (de exemplu xky = cum este in cazul in care se aplica la dizolvare legea lui Higuchi).

Se definesc coeficientul de corelatie si a raportului de corelare ca :

total

linear

SSSS

r =2 si total

elinearitatladedeviatielinear

Y

XYY

SSSSSS

s

ss +=

−= 2

22

• Raportul de corelare 2η este proportia de variabilitate a lui Y atribuabila covariantei cu X ; • Coeficientul de determinare (corelatie) este proportia de variabilitate a lui Y atribuabila covariantei liniare cu X .

Legatura intre panta dreptei de regresie si coeficientul de corelatie Avem dupa definitie

∑ ⎟⎟⎠

⎞⎜⎜⎝

⎛ −⎟⎟⎠

⎞⎜⎜⎝

⎛ −=

y

i

x

i

Syy

Sxx

Nr 1

In cazul in care punctele sunt toate pe o dreapta iy ii bxay +=

( )yx

i

y

i

x

i

SSxxb

NSxbabxa

Sxx

Nr ∑∑

−=⎟

⎟⎠

⎞⎜⎜⎝

⎛ −−+⎟⎟⎠

⎞⎜⎜⎝

⎛ −=

211

dar, ( ) ( ) 22

222

2x

iiy Sb

Nxxb

Nxbabxa

S =−

=−−+

= ∑∑

Deci, inlocuind mai sus ( )

yx

i

y

i

x

i

SSxxb

NSxbabxa

Sxx

Nr ∑∑

−=⎟

⎟⎠

⎞⎜⎜⎝

⎛ −−+⎟⎟⎠

⎞⎜⎜⎝

⎛ −=

211

( )11

2

22

==−

= ∑x

x

xx

i

SS

bSSxxb

Nr

Cand punctele nu sunt pe dreapta, panta dreptei prin cele mai mici patrate b este:

( )( )( )

( )( ) ( )( )x

y

x

y

yx

ii

x

ii

i

ii

SS

rSS

SSyyxx

Syyxx

xx

yyxxb =

−−=

−−=

−−= ∑∑

∑∑

22

Deci, x

y

SS

rb =

Page 130: APLICATII NUMERICE DE STATISTICA IN FARMACIE SI  · PDF fileSe spune, în acest caz, c:

ANOVA

128

Testarea linearitatii : Observam ca are eroareSS IN − grade de libertate si deci

INSS

MS eroareeroare −

= avem ca ( ) 2eeroareMSE σ=

In cele ce urmeaza vom calcula media sumei ; linearMS

( ) ( )( ) ( )( ) ( ) ( )2222ˆ bExxxbabxaEyyEMSE iiilinear ∑∑∑ −=−−+=−=

Dar, ( ) ( ) ( )[ ] ( ) ( )[ ]22

222 bE

xxbEbDbE

i

y +−

=+=∑

σ

Folosind relatia x

y

SS

rb = ⇒ ( )y

xbEσσ

ρ= si

( ) ( ) ( )( ) 222

2

222

2

2

22

2

2

yyx

yiy

x

y

i

yilinear

Nxx

xxxxMSE

σρσσ

σρσ

σσ

ρσ

+=−

+=

=⎟⎟

⎜⎜

⎛+

−−=

∑∑

In fapt aici am presupus ca pentru fiecare punct valorile corespunzatoare au o dispersie

ix

ijy 2xyσ care este aceeasi pentru toate

punctele si deci putem sa o notam cu sau . ix 2yσ 2

eσLucrurile nu se intampla intotdeauna in acest fel. De exemplu in

cazul dreptei de etalonare in bioanalitica dispersiile sunt practic semnificativ mai mari la limita de cuantificare (pana la 20%) – fata de restul concetratiilor la care limita admisa pentru « precizie » este de 15%.

Ipotezele de verificat sunt : 0:0 =ρH echivalenta cu 0:0 =βH folosind variabila

aleatoareeroare

linearIN MS

MSF =−,1 .

Testarea ipotezei de nonlinearitate : 0: 22

0 =− ρηHPentru aceasta se compara valorile testului

eroare

elinearitatladedeviatieINI MS

MSF =−− ,2 cu valorile din distributia Fischer.

Page 131: APLICATII NUMERICE DE STATISTICA IN FARMACIE SI  · PDF fileSe spune, în acest caz, c:

ANOVA

129

• Raportul de corelare 2η este proportia de variabilitate a lui Y atribuabila covariantei cu X ; • Coeficientul de determinare (corelatie) este proportia de variabilitate a lui Y atribuabila covariantei liniare cu X . Distributia comuna a doua variabile

Fie X, Y variabile aleatoare, ( ),j kP X Y este distributia de probabilitate comuna.

Fie X, Y variabile aleatoare continue, ( ),X Yφ este o suprafata si

de exemplu ( ),P a x b c y d≤ ≤ ≤ ≤ este volumul de sub suprafata sprijinit pe dreptunghiul

Se noteaza j

j Y Xμ μ= si 2 2

Y X jjσ σ= media si dispersia lui Y pentru

jx x= fixat. Daca x nu este fixat media si dispersia intregii populatii Y se

noteaza Yμ si 2Yσ si se numesc parametrii ai distributiei marginale a lui Y.

Cand x este fixat incertitudinea privind Y (deci dispersia) se reduce. Se defineste un raport de corelare, procentul reducerii dispersiei prin fixarea lui x:

2 22

2

Y Y X

Y

σ ση

σ

−=

Daca relatia intre x si y este liniara, atunci 2 2η ρ= raportul de corelare este egal cu coeficientul de corelare (numit si coeficient de determinare)

Daca relatia nu este lineara: 2 2XYρ η≤

Page 132: APLICATII NUMERICE DE STATISTICA IN FARMACIE SI  · PDF fileSe spune, în acest caz, c:

ANOVA

130

Aplicatie: 1. Consideram trei grupe de determinari conform tabelului de mai jos:

I 2 3 4 II 3 4 5 III 4 5 6

a caror medii au fost respectiv 3, 4 si 5.

Considerand un risc 05,0=α se poate spune ca diferentele obtinute sunt aleatoare si in fapt cele trei selectii sunt din aceeasi populatie omogena? Solutie:

Avem de verificat urmatoarele ipoteze: 3210 : μμμ ==H vs. egaletoatesuntnumediileH A :

Calculam ( )∑∑ −=k

i

n

jiijW

i

XxSS2

, adica:

( ) ( ) ( ) ( ) ( ) ( )( ) ( ) ( ) 6565554

454443343332222

222222

=−+−+−+

+−+−+−+−+−+−=WSS

Conform definitiei ( )∑ −=ji

ijT XxSS,

2 unde

49

369

654543432==

++++++++== ∑

Nx

X ij deci,

( ) ( ) ( ) ( ) ( ) ( )( ) ( ) ( ) 12464544

454443444342222

222222

=−+−+−+

+−+−+−+−+−+−=TSS

O alta metoda de calcul pentru este folosirea urmatoarei formule prescurtate:

TSS

( ) ( )( ) 12144156

936156

9654543321

654543432

22

222222222

2

2

=−=−=++++++++

−++++++++=−= ∑∑ NX

XSST

Pentru determinarea lui putem tine cont de relatia , adica

BSS

WBT SSSSSS += 6612 =−=−= WTB SSSSSS sau putem pleca de la definitia lui

Page 133: APLICATII NUMERICE DE STATISTICA IN FARMACIE SI  · PDF fileSe spune, în acest caz, c:

ANOVA

131

( ) ( ) ( ) ( ) 6303453443433 2222=++=−+−+−=−= ∑

k

iiiB XXnSS

O alta metoda de calcul pentru foloseste formula echivalenta: BSS

( )

( ) ( ) ( ) 61441509

363

6543

5433

432 2222

2

2

=−=−++

+++

+++

=

=−⎟⎟⎠

⎞⎜⎜⎝

= ∑∑∑

Nx

n

xSS ij

i i

jij

B

Deci, 3

396

136

1 =

−==

−=W

B

W

B

MSMS

kNSSkSS

F este distribuit Fischer cu 2, 6

grade de libertate Conform tabelelor Fischer avem 14,595,0;6,2 =f .

Cum 14,53 ⟨ se accepta ipoteza ceea ce inseamna ca cele trei

selectii sunt din aceeasi populatie omogena. 0H

Page 134: APLICATII NUMERICE DE STATISTICA IN FARMACIE SI  · PDF fileSe spune, în acest caz, c:

ANOVA

132

2. Dizolvarea unor tablete retard de 400 mg Pentoxifilina a fost testata folosind aparatul USP XXIII, tip 2, in apa la 50 rpm in cele 6 vase ale aparatului, o parte din rezultate fiind prezentate mai jos:

Timp (h) Vas 1 Vas 2 Vas 3 0 0 0 0 1 12 11 12 2 19 23 23 3 29 32 31 4 40 45 38 6 45 49 48 8 48 52 52

Reprezentarea grafica sugereaza aparitia unor diferente intre curbe in

intervalul 4 – 6 h.

a. Folosind ANOVA testati ipoteza ca cele 3 curbe sunt distribuite aleator in jurul unei curbe de dizolvare medii.

0 1 2:H 3μ μ μ= = b. Comentati aplicabilitatea sau non aplicatibilitatea metodei ANOVA in compararea curbelor de dizolvare. Solutie:

Rezerva in aplicarea ANOVA apare din aceea ca in “interiorul curbelor” distributia datelor nu este normala deoarece valorile cresc in timp.

Page 135: APLICATII NUMERICE DE STATISTICA IN FARMACIE SI  · PDF fileSe spune, în acest caz, c:

ANOVA

133

Aplicarea este justificata atunci cand suntem in faza de saturare a dizolvarii, se poate neglija dependenta de timp si deci se compara doar “gradul de dizolvare”. 3. Studiul efectelor antiinflamatoare comparativ al aspirinei, clorfeniraminului si asocierea ALGOPIRIN (aspirina 125 mg, paracetamol 75 mg, cofeina 15 mg, clorfeniramin 3 mg) cu ajutorul testului de reducere a inflamatiei labei de sobolan indusa de injectarea carragenan a dus la rezultatele:

Acetyl salicylic acid

Chlorpheniramin Produs X Lot control Sobolan

Initial inflamat Initial inflamat Initial inflamat Initial inflamat 1 0,8 1,6 1 2 1,1 1 0,9 1,6 2 1 1,5 1,1 1,8 0,9 1,4 0,8 1,5 3 1 1,7 1 2 1 1,5 0,9 1,6 4 0,9 1,4 1 2 1 0,8 0,9 1,6 5 0,9 1,5 0,9 1,7 1 0,6 0,9 1,5 6 1 1,6 0,9 2 1 0,7 1 1,8 7 0,9 1,2 1 1,9 1 1,2 0,9 1,7 8 0,9 1,5 9 0,9 1,6 10 0.9 1,6 a. Verificati prin ANOVA ca testul este adecvat in compararea efectului prin aceea ca rezultatele sunt diferite de lotul de control. b. Comparati folosind ANOVA cele trei tratamente intre ele. 4. Presupunem ca testam 4 medicamente(M1-M4) continând aceeaşi substanţă activă, administrate în 4 perioade diferite (PI-PIV).

Considerăm că efectele determinate de cei doi factori analizaţi (medicament – perioada) sunt variabilele aleatoare independente prezentate mai jos.

Medicament

M1 M2 M3 M4 PI 4 5 5 4

.1x PII 3 4 4 3

.2x PIII 3 4 4 3

3.x Perio

ada

PIV 3 4 4 3 4.x

1.x 2.x .3x .4x

Page 136: APLICATII NUMERICE DE STATISTICA IN FARMACIE SI  · PDF fileSe spune, în acest caz, c:

ANOVA

134

Considerand un risc 05,0=α se poate spune ca diferentele intre linii si respectiv coloane, obtinute sunt aleatoare si in fapt cele patru selectii sunt din aceeasi populatie omogena?

Solutie:

O primă ipoteză ce trebuie verificata se referă la egalitatea mediilor liniilor, iar a doua la egalitatea mediilor coloanelor. Ipoteza alternativă presupune existenţa unor diferenţe între linii sau respectiv între coloane.

Deci, avem de verificat urmatoarele ipoteze: 3210 : μμμ ==H vs. egaletoatesuntnumediileH A :

Valorile experimentale le considerăm ca rezultanta unor efecte aditive corespunzător liniilor, coloanelor şi erorilor întâmplătoare:

ijjiijx εβαμ +++= unde iα este partea lui datorată liniei (schemei de administrare), ijx jβ reprezintă contribuţia coloanei (forma medicamentoasă), iar ijε este eroarea experimentală. 5. Sa se verifice ipoteze privind lipsa efectelor de perioada, secventa si formulare intr-un experiment incrucisat cu 2 perioade si 2 secvente, comparand doua medicamente testat (T) si referinta (R) si in care s-au obtinut rezultatele de mai jos :

PI PII

2 3 3 2

Secventa1 RT

2 3 4 2 3 2

Secventa 2 TR

3 3 Solutie :

PI PII iku 1•u ikd

1•d ikO 1•O

2 3 5 1/2 1/2 3 2 5 -1/2 -1/2

RT

2 3 5

5

1/2

1/6

1/2

1/6

TR 4 2 6 5,6 -2/2 -1/2 2/2 1/2

Page 137: APLICATII NUMERICE DE STATISTICA IN FARMACIE SI  · PDF fileSe spune, în acest caz, c:

ANOVA

135

3 2 5 -1/2 1/2 3 3 6 0 0

• Existenţa efectelor carry – over inegale poate fi determinată prin testarea următoarelor ipoteze:

RT CCCH =⇔= 0:0

RTA CCCH ≠⇔≠ 0: Respingerea ipotezei nule duce la concluzia prezenţei efectelor carry

– over inegale. Pentru testarea ipotezelor asupra lui C se folosesc următoarele medii de selecţie corespunzând fiecărei secvenţe:

∑=

=kn

iik

kk U

nU

1.

1 , 2,1=k unde 1 2ik i k i kU Y Y= +

Deci, 53211 =+=U , 52321 =+=U , 53231 =+=U 62442 =+=U , 52352 =+=U si 63362 =+=U

ceea ce implica 53

5551 =

++=•U si 6,5

3656

2 =++

=•U

In ipoteza , variabila 0H

21

11ˆ

ˆ

nn

CT

u

c

+=σ

are o repartiţie Student

cu grade de libertate. 221 −+ nn6,056,5ˆ

12 =−=−= •• UUC

( ) ( )

( ) ( ) ( ) ( ) ( ) ( )

2 2

1 1 2 2

1 2

2 2 2 2 2 2

ˆ2

5 5 5 5 5 5 6 5,6 5 5,6 6 5,6

3 3 20,16 0,36 0,16 0,68 0,17 0, 4

4 4

i iu

U U U U

n nσ

• •− + −= =

+ −

⎡ ⎤ ⎡− + − + − + − + − + −⎣ ⎦ ⎣= =+ −

+ += = ≅ ≅

∑ ∑

⎤⎦

Obtinem astfel variabila 0,6 6 20, 4*0,71 10, 4

3 3

cT = ≅ ≅+

Page 138: APLICATII NUMERICE DE STATISTICA IN FARMACIE SI  · PDF fileSe spune, în acest caz, c:

ANOVA

136

Vom respinge ipoteza nulă RT CCH =:0 în favoarea ipotezei alternative RTA CCH ≠: la un nivel 05,0=α de semnificaţie, dacă

⎟⎠⎞

⎜⎝⎛ −+

⟩2,

2 21 nnc tT α .

Din tabele distributiei Student avem 78,24;975,02,

2 21

==⎟⎠⎞

⎜⎝⎛ −+

ttnnα

Cum acceptam ipoteza , deci nu avem efecte reziduale. 2 2,78⟨ 0H • Pentru testarea efectelor de formulare se vor verifica urmatoarele ipoteze :

TRTR FFFFH =⇔=− 0:0

TRTRA FFFFH ≠⇔≠− 0: Pentru testarea acestor ipoteze vom folosi variabila

21

11ˆnn

FT

d

d

+=σ

distribuita Student cu 221 −+ nn grade de libertate,

unde 2.1. ddF −= si ( ) ( )2 2

11 22

1 2

ˆ2

i id

d d d d

n nσ

• •− + −=

+ −∑ ∑ 2 .

Dar, mediile diferenţelor între perioade în interiorul fiecărei secvenţe

sunt ∑=

=kn

iik

kk d

nd

1.

1 , unde ( )kikiik YYd 1221

−= .

In cazul nostru avem:

21

223

11 =−

=d , 21

232

21 −=−

=d , 21

223

31 =−

=d

122

242

42 −=−=−

=d , 21

232

52 −=−

=d , 02

3362 =

−=d

ceea ce implica: 61

321

21

21

1 =+−

=•d si 21

3

0211

2 −=+−−

=•d

Facand inlocuirile obtinem:

Page 139: APLICATII NUMERICE DE STATISTICA IN FARMACIE SI  · PDF fileSe spune, în acest caz, c:

ANOVA

137

( ) ( )2 2

2 211 2 22

1 2

2 2 2

1 1 1 1 1 12 6 2 6 2 6

ˆ2 3 3 2

1 1 1 11 02 2 2 2

ˆ0,29 0,543 3 2

i id

d

d d d d

n nσ

σ

• •

2⎡ ⎤⎛ ⎞ ⎛ ⎞ ⎛ ⎞− + − − + −⎢ ⎥⎜ ⎟ ⎜ ⎟ ⎜ ⎟− + − ⎝ ⎠ ⎝ ⎠ ⎝ ⎠⎢ ⎥⎣ ⎦= =+ − + −

⎡ ⎤⎛ ⎞ ⎛ ⎞ ⎛ ⎞− + + − + + +⎢ ⎥⎜ ⎟ ⎜ ⎟ ⎜ ⎟⎝ ⎠ ⎝ ⎠ ⎝ ⎠⎢ ⎥⎣ ⎦+ ≅ ⇒ ≅

+ −

∑ ∑+

Vom obtine astfel variabila aleatoare:

1 2

1 16 2 1,51

1 1 1 1ˆ 0,54*3 3

d

d

FT

n nσ

+= =

+ +≅

Aceasta variabila aleatoare este repartizata Student cu 221 −+ nn grade de libertate.

Cum 2; 0,9751,51 2,78 t⟨ = acceptam ipoteza , deci nu avem efecte formulare.

0H

• Existenţa efectelor de perioada poate fi determinată prin testarea următoarelor ipoteze:

IIIIII PPPPH =⇔=− 0:0

IIIIIIA PPPPH ≠⇔≠− 0: Dupa cum am definit 11 ii dO = , respectiv 22 ii dO −= si 11 •• = dO ,

respectiv 22 •• −= dO Pentru testarea ipotezei vom folosi variabila 0H

21

11ˆnn

PT

d

p

+=σ

repartizata Student cu 221 −+ nn grade de libertate, unde

2.1. OOP −= si ( ) ( )2 2

11 22

1 2

ˆ2

i id

d d d d

n nσ

• •− + −=

+ −∑ ∑ 2

Page 140: APLICATII NUMERICE DE STATISTICA IN FARMACIE SI  · PDF fileSe spune, în acest caz, c:

ANOVA

138

Vom obtine astfel variabila

1 16 2 0,76

1 10,54*3 3

T−

= ≅+

t

si

deoarece 2; 0,025 2; 0,9752,78 0,76 2,78t = − ⟨ − ⟨ = acceptam ipoteza , deci nu avem efecte de perioada.

0H

6. Sa se testeze ipotezele

0

: 0 1: : 0 1

: 0 1 1

A k

B j

AB jk

H unde k KH H unde j J

H unde j J si k K

αβ

γ

⎧ = ≤ ≤⎪ = ≤ ≤⎨⎪ = ≤ ≤ ≤ ≤⎩

vs. cu riscul : 0alternativaH cel putin un factor este diferit de 05,0=α pentru datele din tabelul de mai jos:

PI PII 1 2 2 3

S1

3 4 3 5 4 6

S2

5 4 Solutie: Vom calcula 1

jk ijkIi

Y Y• = ∑ , deci:

23

32111 =

++=•Y 3

3432

21 =++

=•Y

43

54312 =

++=•Y 5

3465

22 =++

=•Y

Avem 1

k ijkIJi j

Y Y•• = ∑∑ :

5,22

322

21111 =

+=

+= ••

••

YYY si 5,42

542

22122 =

+=

+= ••

••

YYY

Avem 1j ijkIK

i kY • • = Y∑∑ , sau altfel calculat:

Page 141: APLICATII NUMERICE DE STATISTICA IN FARMACIE SI  · PDF fileSe spune, în acest caz, c:

ANOVA

139

32

422

12111 =

+=

+= ••

••

YYY si 4

253

22221

2 =+

=+

= ••••

YYY

Si ∑∑∑=•••i j k

ijkYIJK

Y 1 , sau alternativ:

5,34

53424

22211211 =+++

=+++

= •••••••

YYYYY

Calculand eroarea totala conform definitiei obtinem: ( ) ( ) ( ) ( )

( ) ( ) ( ) ( ) ( ) ( )( ) ( ) ( ) ...................5,345,365,35

5,345,335,325,355,345,33

5,335,325,31

222

222222

222

,,

2

=−+−+−+

+−+−+−+−+−+−+

+−+−+−=−= ∑ •••kji

ijkT YYSS

ceea ce este o metoda foarte lunga de calcul. Pentru a simplifica modul de determinare pentru vom folosi

urmatoarea formula prescurtata: TSS

N

YYSS kji

ijk

kjiijkT

2

,,

,,

2⎟⎟⎠

⎞⎜⎜⎝

−=∑

unde ; 42465543432321,,

=+++++++++++=∑kji

ijkY

170465543432321 222222222222

,,

2 =+++++++++++=∑kji

ijkY si

12=N

deci 231242170

2

=−=TSS

a. Pentru testarea efectelor de secventa vom calcula ( )∑ ••••• −=kji

k YYSS,,

2

α .

Trebuie avut in vedere ca sumarea se face dupa toti indicii de sumare, respectiv dupa 2,1=j ; 2,1=k si kni ,1= , deci nu este corect sa se calculeze:

( ) ( ) ( ) ( ) 25,35,45,35,2 222

2

2

1 =−+−=−+−= •••••••••• YYYYSSα ⇒ fals Calculul corect:

Page 142: APLICATII NUMERICE DE STATISTICA IN FARMACIE SI  · PDF fileSe spune, în acest caz, c:

ANOVA

140

( ) ( ) ( )

( ) ( ) (

( ) 12332

21*21*25,35,45,35,2 212

2

11

1

22

1 1

2

2

1 1

22

2

1 1

21

,,

2

21

21

=+=

=+=+=−+−=

=−+−=−=

∑∑∑∑

∑∑∑∑∑

= == =

= =•••••

= =••••••••••

nnnn

YYYYYYSS

j

n

ij

n

i

j

n

ij

n

ikjikα

)

Deci, 1212

121

=−

=−

=KSS

MS αα

b. Pentru testarea efectelor de perioada vom calcula ( )∑ ••••• −=kji

j YYSS,,

2

β .

In mod analog,

( ) ( ) ( )

( ) ( ) ( )( ) 325,0*6*25,025,335,33 221

2

1 1

22

1 1

2

2

1 1

22

2

1 1

21

,,

2

==−+=−+−=

=−+−=−=

∑∑∑∑

∑∑∑∑∑

= == =

= =•••••

= =••••••••••

nn

YYYYYYSS

k

n

ik

n

i

k

n

ik

n

ikjik

kk

kk

β

Deci, 312

31

=−

=−

=JSS

MS ββ

c. Pentru testarea efectelor de interactiune vom calcula ( )∑ •••••••• +−−=

kjijkjk YYYYSS

,,

j k ( )∑ •••••••• +−−=

kjijkjk YYYYSS

,,

1 1 ( ) ( ) 05,335,22 221111 =+−−=+−−= •••••••• YYYY

2 1 ( ) ( ) 05,345,23 222121 =+−−=+−−= •••••••• YYYY

1 2 ( ) ( ) 05,335,44 221212 =+−−=+−−= •••••••• YYYY

2 2 ( ) ( ) 05,345,45 222222 =+−−=+−−= •••••••• YYYY

0=γSS

Deci, ( )( ) 011=

−−=

KJSS

MS γγ

d. Pentru determinarea lui nu vom pleca de la definitia sa RSS

( 2∑ •−= jkijkR YYSS ) deoarece am avea prea multe sume de calculat (9

sume) ci vom tine cont de uratoarea relatie: γβα SSSSSSSSSS TR −−−=

Page 143: APLICATII NUMERICE DE STATISTICA IN FARMACIE SI  · PDF fileSe spune, în acest caz, c:

ANOVA

141

Inlocuind in formula precedenta obtinem: 8031223 =−−−=RSS ceea ce

implica ( ) ( ) 188

13*2*28

1==

−=

−=

IJKSS

MS RR

Vom testa ipoteza

0

: 0 1: : 0 1

: 0 1 1

A k

B j

AB jk

H unde k KH H unde j J

H unde j J si k K

αβ

γ

⎧ = ≤ ≤⎪ = ≤ ≤⎨⎪ = ≤ ≤ ≤ ≤⎩

vs : 0alternativaH cel putin un factor este diferit deaplicand testul Fischer astfel: • Pentru efectul de secventa testul Fischer este:

FMSMS

R

=α ⇒ 121

12==F ; 32,595,0;8,1 =f

Deoarece 1232,5 ⟨ se respinge ipoteza 2,1,0:0 =∀= kH kα ⇒ avem efect de secventa • Pentru efectul de perioada testul Fischer este:

FMSMS

R

=β ⇒ 313==F ; 32,595,0;8,1 =f

Deoarece nu se respinge ipoteza 32,53 ⟨ 2,1,0:0 =∀= jH jβ ⇒nu avem efect de perioada

• Pentru interactiuni:

FMSMS

R

=γ ⇒ 010==F ; 32,595,0;8,1 =f

Deoarece nu se respinge ipoteza32,50 ⟨ 2,1;2,1,0:0 =∀=∀= kjH jkγ

Page 144: APLICATII NUMERICE DE STATISTICA IN FARMACIE SI  · PDF fileSe spune, în acest caz, c:

ANOVA

142

⇒nu avem efect datorat interactiunilor

Modelul mult mai adevarat este cel care foloseste in loc de

, fiecare subiect fiind in acest fel propriul sau martor. raMS int

RMS

ra

rara

SSMS

int

intint ν

=

unde :

• ∑∑∑∑ •••• +−−=k

kki

k

jk

kjiijkra n

YYn

YYSS

22

222

,,

2int

• 221int −+= nnraν In cazul nostru avem :

170465543432321 222222222222

,,

2 =+++++++++++=∑kji

ijkY

321 == nn j k

∑ •

k

jk

nY 2

1 1 ( ) 123

3632131 2 ==++=

2 1 ( ) 27381432

31 2 ==++=

1 2 ( ) 483

14454331 2 ==++=

2 2 ( ) 753

22546531 2 ==++=

∑ =+++=• 162754827122

k

jk

nY

Page 145: APLICATII NUMERICE DE STATISTICA IN FARMACIE SI  · PDF fileSe spune, în acest caz, c:

ANOVA

143

( ) ( ) ( ) ( ) ( ) ( )

1642

328281

2100

264

249

225

29

245

264

253

243

232

221

2

2222222

==+++++=

=+

++

++

++

++

++

=∑ •kiY

( ) ( )

1596

9546

7296

2253*2

4655433*2

432321222

22

2

22

1

21

2

==+=

=+++++

++++++

=+= ∑∑∑ ••••••

nY

nY

nY

k

k

Deci, 3159164162170int =+−−=raSS ⇒ 75,043

2333

int ==−+

=raMS

In aceasta situatie vom obtine urmatoarele teste Fischer : • Pentru efectul de secventa testul Fischer este:

FMSMS

ra

=int

α ⇒ 1675,0

12==F ; 71,795,0;4,1 =f

Deoarece 1671,7 ⟨ se respinge ipoteza 2,1,0:0 =∀= kH kα ⇒ avem efect de secventa

• Pentru efectul de perioada testul Fischer este:

FMSMS

ra

=int

β ⇒ 475,03

==F ; 71,795,0;4,1 =f

Deoarece nu se respinge ipoteza 71,74 ⟨ 2,1,0:0 =∀= jH jβ ⇒nu avem efect de perioada

Page 146: APLICATII NUMERICE DE STATISTICA IN FARMACIE SI  · PDF fileSe spune, în acest caz, c:

ANOVA

144

• Pentru interactiuni:

FMSMS

ra

=int

γ ⇒ 075,00

==F ; 71,795,0;4,1 =f

Deoarece nu se respinge ipoteza 71,70 ⟨ 2,1;2,1,0:0 =∀=∀= kjH jkγ ⇒nu avem efect datorat interactiunilor

Facem observatia ca efectul de interactiune corespunde efectului medicamentului. 7. Consideram urmatoarele puncte de pe dreapta 12 += xy

ix iy 0 1 1 3 2 5 3 7

Page 147: APLICATII NUMERICE DE STATISTICA IN FARMACIE SI  · PDF fileSe spune, în acest caz, c:

ANOVA

145

Sa se calculeze r si b . Indicatie:

ix iy x y xxi − yyi − ( )( )yyxx ii −− ( )2xxi −

0 1 -1,5 -3 4,5 2,25 1 3 -0,5 -1 0,5 0,25 2 5 0,5 1 0,5 0,25 3 7

1,5

4 1,5 3 4,5 2,25

8. Consideram in continuare ca punctele iy sunt afectate de erori :

ix iy 0 1 1 2 2 5 3 6

Sa se calculeze r si b 9. Sa se testeze daca datele de la exercitiul anterior sunt corelate dar nu sunt corelate linear.

Page 148: APLICATII NUMERICE DE STATISTICA IN FARMACIE SI  · PDF fileSe spune, în acest caz, c:

ANOVA

146

Page 149: APLICATII NUMERICE DE STATISTICA IN FARMACIE SI  · PDF fileSe spune, în acest caz, c:

Estimarea bioechivalentei a doua medicamente

147

ESTIMAREA BIOECHIVALENTEI A DOUA MEDICAMENTE

Una din aplicatiile cele mai importante ale metodei de studiu clinic incrucisat priveste studiile de bioechivalenta care urmaresc testarea ipotezei privind bioechivalenta unui medicament generic cu medicamentul inovator.

Definitia cantitativa a bioechivalentei, aprobata prin lege federala in SUA si adoptata de toate autoritatile de reglemetare a medicamentului in lume, este dupa cum urmeaza:

Doua medicamente sunt bioechivalente daca intervaul de incredere 90% pentru raportul mediilor parametrilor farmacocinetici esentiali (aria de sub curba si concentratia maxima ) se incadreaza in intervalul ( ) .

∞−0AUC maxC25,1,8,0

0,8 1,25 0,90T

R

P μμ

⎛ ⎞⟨ ⟨ ≥⎜ ⎟

⎝ ⎠

Este de retinut faptul ca se recomanda de regula, analiza datelor dupa logaritmare considerandu-se ca acestea urmeaza mai curand o distributie lognormala decat o distributie normala.

Metoda celor “doua teste unilaterale”, Schuirmann Ipoteza nula este ipoteza compusa din doua ipoteze simple, testul de

bioechivalenta descompunandu-se de fapt in doua teste unilaterale: IRTH θμμ ≤−:01 vs 1 :a T RH Iμ μ θ− ⟩ si

SRTH θμμ ≥−:02 vs SRTaH θμμ ⟨−:2 O biodisponibilitate mai mare a produsului testat decat cel de

referinta, implica posibilitatea unor efecte secundare sau toxice crescute si o “siguranta” mai mica. Bioechivalenta implica o echivalenta atat in ceea ce priveste efectul cat si in ceea ce priveste siguranta.

Daca vrem sa testam ipotezele enuntate la un nivel de semnificatie α , in conditiile in care presupunem ca datele sunt normal repartizate, putem aplica testul t. Echivalenta este stabilita atunci cand

( )( )1 2

1 2

, 21 1ˆ

T R II

d

Y YT t n n −

( )

n n

θα

σ

− −= ⟩ +

+si ( )1 2

1 2

, 21 1ˆ

T R SS

d

Y Yn n

n n

θα

σ

− −T t⟨ − + −

+ =

Page 150: APLICATII NUMERICE DE STATISTICA IN FARMACIE SI  · PDF fileSe spune, în acest caz, c:

Estimarea bioechivalentei a doua medicamente

148

2

2d

MSEσ =

Estimarea bioechivalentei folosind testul non – parametric Wilcoxon, pornind de la un model care ia in considerare si efectele de perioada

Fie, folosind notatiile standard de la modelul incrucisat cu doua

perioade si doua secvente, diferenta intre formularile testate

RT μμθ −= .

Consideram testarea bioechivalentei folosind doua teste unilaterale:

LLLAL undeHvsH θθθθθ −=⟩≤ ∗∗∗ 0:0: 101 si

UUUAU undeHvsH θθθθθ −=⟨≥ ∗∗∗ 0:0: 202

In vederea testarii ipotezelor enuntate consideram combinatia (“contrastul”):

⎩⎨⎧ =−

=2sec;

1sec,;ventadinsubiectiipentrud

ventadinsubiectiipentruULhdb

ik

hikhik

θ,

unde: • kni ,1= , 2,1=k , reprezinta numarul de subiecti in cele doua secvente

• 2

12 PPdik−

= este jumatate dintre diferentele intre cea de-a II a

perioada si prima perioada • UsauL dupa cum ne referim la compararea cu limita inferioara sau cea superioara a intervalului de acceptare a bioechivalentei

h =

Consideram suma rangurilor: i i

variabilele aleatoare

(∑==

1

11

n

iLiL bRR s) )(∑=

=

1

11

n

iUiU bRR s

( )2

111 +−=

nnRW LL si ( )

2111 +

−=nnRW UU .

Tragem concluzia ca produsele sunt bioechivalente atunci cand amandoua ipotezele i sunt respinse. 01H s 02H

Deci, relatia: ( )αwWU ≤ si ( )α−⟩ 1wWL

Page 151: APLICATII NUMERICE DE STATISTICA IN FARMACIE SI  · PDF fileSe spune, în acest caz, c:

Estimarea bioechivalentei a doua medicamente

149

unde valorile ( )αw se gasesc in tabele, iar valorile complementare se calculeaza cu formula: ( ) ( )αα wnnw −=− 211 , implica biochivalenta celor doua produse.

Aplicatie : 1. Consideram ca intr-un experiment de bioechivalenta au terminat experimentul 7 voluntari (4 in secventa RT si 3 in secventa TR), iar concentratiile maxime (mg/l) au fost dupa cum urmeaza:

Secventa Subiecti P1 P2s1 3 4 s2 4 6 s3 5 5

1S RT

s4 4 5 s5 4 6 s6 5 5

2S TR

s7 6 5

Sa se verifice ipoteza privind bioechivalenta celor doua medicamente prin compararea intervalului de incredere 90% pentru raportul

mediilor R

T

μμ

cu limitele de acceptare.

Solutie:

P1 P2

ikd

kd•

2

1

d

d

k

ik

d

d

•−

2

⎟⎟⎠

⎞⎜⎜⎝

•k

ik

d

d ∑ ⎟

⎟⎠

⎞⎜⎜⎝

2

k

ik

d

d

2dS dS

3 4 0.5 0 04 6 1 0.5 0.255 5 0 -0.5 0.25

secv. 1 RT 4 5 0.5

0.5 0 0

0.5

P1 P2 4 6 1 0.83 0.695 5 0 -0.17 0.03

secv. 2 TR 6 5 -0.5

0.17

0.33

-0.67 0.45

1.17

0.33

0.6

41 =n 32 = 48.190.0;5; n ; =t ( )kikiik yyd 12*21

−=

Deci

Page 152: APLICATII NUMERICE DE STATISTICA IN FARMACIE SI  · PDF fileSe spune, în acest caz, c:

Estimarea bioechivalentei a doua medicamente

150

( ) 5.02134*

21

11 ==−=d ; ( ) 12246*

21

21 ==−=d ;

( ) 02055*

21

31 ==−=d ; ( ) 5.02145*

21

41 ==−=d

( ) 12246*

21

12 ==−=d ; ( ) 02055*

21

22 ==−=d

( ) 5.02165*

21

32 −=−=−=d

k

iik

k n

dd

∑=•

1

413121111 n

ddddd

+++=• ; 5.0

45.0015.0

1 =+++

=•d

2

423222122 n

ddddd

+++=• ; 17.0

35.001

2 =−+

=•d

33.017.05.021 =−=− •• dd

( ) ( )221

1 2

2

22

2

112

1 2

−+

−+−=∑ ∑= =

••

nn

ddddS

n

i

n

iii

d ; 33.0234

17.15.02 =−+

+=dS ;

Putem verifica ca RT YYdd −=− •• 21 .

22211 •• +

=YYYR ; 66.4

23

5564

4543

=

+++

+++

=RY

21221 •• +

=YYYT ; 5

23

6544

5564

=

+++

+++

=TY

Observam ca 2133.066.45 •• −==−=− ddYY RT

2190.0;2

90 11**21 nn

StYYIC dnnRTS +−−= −+ ;

33.067.033.076.0*6.0*48.133.090 −=−=−=SIC

2190.0;2

90 11**21 nn

StYYIC dnnRTD ++−= −+ ;

167.033.076.0*6.0*48.133.090 =+=+=DIC

Page 153: APLICATII NUMERICE DE STATISTICA IN FARMACIE SI  · PDF fileSe spune, în acest caz, c:

Estimarea bioechivalentei a doua medicamente

151

Prin definitie avem RR F+= μμ ; TT F+= μμ si deci

RTRT FF −=− μμ (in ipoteza absentei efectelor reziduale). Deci, ( ) 90.09090 =⟨−⟨ DRTS ICICP μμ

( )1;33.0−⊂− RT μμ ; ⎟⎠⎞

⎜⎝⎛−⊂

−66.41,

66.433.0

R

RT

μμμ

;

( )21.0;07.0−⊂−

R

RT

μμμ

; ( ) ( 25.1;8.021.1;93.0 ⊂⊂R

T

μμ )

Deoarece intervalul de incredere 90% pentru raportul mediilor R

T

μμ

este inclus in intervalul de acceptare a ipotezei privind bioechivalenta rezulta ca cele doua medicamente sunt echivalente. ( 25.1;8.0 )

2. Testarea bioechivalentei pe datele de mai sus, logaritmate. Solutie:

P1 P2

ikd

kd•

2

1

d

d

k

ik

d

d

•−

2

⎟⎟⎠

⎞⎜⎜⎝

•k

ik

d

d ∑ ⎟

⎟⎠

⎞⎜⎜⎝

2

k

ik

d

d

1.1 1.39 0.14 0.03 0.00111.39 1.79 0.20 0.09 0.00861.61 1.61 0 -0.11 0.0121

secv. 1 RT 1.39 1.61 0.11

0.11 0 0

0.02

P1 P2 1.39 1.79 0.20 0.16 0.02651.61 1.61 0 -0.04 0.0016

secv. 2 TR 1.79 1.61

-0.09

0.04

0.08

-0.13 0.0172

0.05

2 0,01dS = ⇒ 0,12dS =

52.12

67.137.12

361.161.179.1

439.161.139.11.1

=+

=

+++

+++

=RY

06.014.008.076.0*12.0*48.108.0 −=−=−=−− errYY RT 22.014.008.076.0*12.0*48.108.0 =+=+=+− errYY RT

( )22.0;06.0lnln −⊂− RT μμ

Page 154: APLICATII NUMERICE DE STATISTICA IN FARMACIE SI  · PDF fileSe spune, în acest caz, c:

Estimarea bioechivalentei a doua medicamente

152

( )22.0;06.0ln −⊂R

T

μμ

, ( )22.006.0 ; eeR

T −⊂μμ

, ( )24.1;94.0⊂R

T

μμ

Concluzie:

Produsele sunt bioechivalente, intervalul de incredere 90% fiind inclus in intervalul (0.8, 1.25). 3. Fiind date rezultatele de mai jos, obtinute intr-un studiu de bioechivalenta pilot sa se testeze bioechivalenta.

PI PII

1 3 2 5

S1 RT

4 2

2 3 S2 TR 1 4

a) Sa se calculeze intervalul de incredere 90% pentru raportul T

R

μμ

PI PII ikd 1di ik kd d− i ( )2

ik kd d− i ( )2

ik kd d−∑ i

1 3 1 0,5 0,25 2 5 1,5 1 1

S1 RT

4 2 -1

0,5

-1,5 2,25

3,5

2di

2 3 0,5 -0,5 0,25 S2 TR 1 4 1,5

1 0,5 0,25

0,5

2 3,5 0,5 43 2 2 3dS +

= =+ − 1 21 ; 2 5;0,95 2,35n nα− + − t t = =

1 2 1 21 ; 2 1 ; 21 2 1 2

1 1 1 1,T R T RT R n n d n n dY Y t S Y Y t S

n n n nα αμ μ ∗ ∗ ∗ ∗− + − − + −

⎡ ⎤− ∈ − − + − + +⎢ ⎥

⎣ ⎦

[ ]0,5 1 2,35*1,05 ; 0,5 1 2,35*1,05T Rμ μ− ∈ − − − +

[ ]2,97 ;1,97T Rμ μ− ∈ − impartim la

1 2 4 3 4353 2 3

2 12R∗

+ + ++

= = =

Page 155: APLICATII NUMERICE DE STATISTICA IN FARMACIE SI  · PDF fileSe spune, în acest caz, c:

Estimarea bioechivalentei a doua medicamente

153

[1 0,99 ; 0,66T

R

]μμ

− ∈ − [ ]0,01;1,66T

R

μμ

Concluzie: Produsele nu sunt bioechivalente. b) Folosind testul “Schuirman” sa se verifice bioechivalenta celor doua formulari

1 21 ; 2

1 2

1 1T R L

L n n

d

Y YT tS

n n

αθ∗ ∗

− + −

− −= ⟩

+ ;

1 2; 2

1 2

1 1T R U

U n n

d

Y Y

Sn n

αθ∗ ∗

T t + −

− −= ⟨

+

L

;

20%* 0.6L Rθ ∗= − = − 20%* 0.6U Rθ ∗= = Bioechivalenta:

1 2 1 2; 2 1 ; 2U n n n nT t t Tα α+ − − + −⟨ ⟨ ⟨ , 29 35 0,6 0,112 12 0,09

1,054 1 13 3 2

LT− +

= =+

=

Deoarece nu avem produsele nu sunt bioechivalente. 5;0.95LT t⟩ c) Verificati ipoteza privind “egalitatea efectelor de formulare”

T RF F= PI PII ikd

1di ik kd d− i ( )2

ik kd d− i ( )2

ik kd d−∑ i

1 3 1 0,5 0,25 2 5 1,5 1 1

S1 RT

4 2 -1

0,5

-1,5 2,25

3,5

2di

2 3 0,5 -0,5 0,25 S2 TR 1 4 1,5

1 0,5 0,25

0,5

Page 156: APLICATII NUMERICE DE STATISTICA IN FARMACIE SI  · PDF fileSe spune, în acest caz, c:

Estimarea bioechivalentei a doua medicamente

154

2 3,5 0,5 43 2 2 3dS +

=+ −

= 0,5 1 0,5 0, 474 1 1 4 5* *3 3 2 3 6

T − −= = =

+−

Concluzie: Deoarece

1 21 ; 2 3;0,95 2,35n nt tα− + − = = , formularile sunt “egale”

d) Sa se testeze bioechivalenta folosind teste neparametrice

I. Testul Mann – Whitney – Wilcoxon de rang1

PI PII ikd ikL ik Lb d θ= − ( )ikLR b ikU ik Ub d θ= − ( )ikUR b 1 3 1 1,6 4 0,4 2 2 5 1,5 2,1 5 0,9 4

S1 RT

4 2 -1 -0,4 1 -1,6 1 ikL ikb d= ikU ikb d=

2 3 0,5 1,5 2 0,5 3 S2 TR 1 4 1,5 1,5 3 1,5 5

1 2 4 3 4353 2 3

2 12R∗

+ + ++

= = =

=

=

20%* 0.6L Rθ ∗= − = − 20%* 0.6U Rθ ∗= =

( )1

1

1 4 5 10n

L ikLi

R R b=

= = + +∑

( )1

12 4 1 7

n

U ikUi

R R b=

= = + +∑( )1 1 1 3*410 4

2 2L L

n nW R

+= − = − =

( )1 1 1 3*47 12 2U U

n nW R

+= − = − =

3;2;0.05 0w = 3;2;0.95 1 2 6w n n wα= − =

1 D.Hauschke, V.W.Steinijans, E.Diletti, A distribution – free procedure for the statistical analysis of bioequivalence studies, International Journal oh Clinical Pharmacology, Therapy and Toxicology, vol 28 no 2 – 1990 (72-78)

Page 157: APLICATII NUMERICE DE STATISTICA IN FARMACIE SI  · PDF fileSe spune, în acest caz, c:

Estimarea bioechivalentei a doua medicamente

155

LBioechivalenta: 1 2 1 2; ; ; ;1U n n n nW w w Wα α−⟨ ⟨ ⟨

Concluzie: Produsele nu sunt bioechivalente.

II. Construiti un interval de incredere 90% pentru raportul T

R

μμ

in

ipoteza ca nu avem nici efecte carry – over si nici efecte de perioada2

R T T/R 1 2 3 4 51 3 3,0 1 3,0 2 5 2,5 2 2,7 2,5 4 2 0,5 3 1,2 1,1 0,5 3 2 0,7 4 1,4 1,3 0,6 0,7 4 1 0,3 5 0,9 0,8 0,4 0,4 0,3

0,3; 0,4; 0,4; 0,5; 0,6; 0,7; 0,8; 0,9; 1,1; 1,2; 1,3; 1,4; 2,5; 2,7; 3,0 Intervalul de incredere: 0,4 – 2,7 Concluzie: Produsele nu sunt bioechivalente. 2 V.W.Steinijans, E.Diletti, Statistical analysis of biovailability studies: parametric and nonparametric confidence intervals, Eur. J. clin. Pharmacol 24, 1983, p. 127-136

Page 158: APLICATII NUMERICE DE STATISTICA IN FARMACIE SI  · PDF fileSe spune, în acest caz, c:

Estimarea bioechivalentei a doua medicamente

156

Page 159: APLICATII NUMERICE DE STATISTICA IN FARMACIE SI  · PDF fileSe spune, în acest caz, c:

Teste statistice de discordanta

157

TESTE STATISTICE DE DISCORDANTA

Problema valorilor discordante este extrem de complexa, ea fiind mai mult o problema de analiza a structurii si conditiilor intre datele experimentale si numai in secundar o problema matematica.

Ca metoda de matematica in esenta se folosesc doua tipuri de teste: • « teste de tip Dixon » care compara distanta intre valoarea « discordanta » si celelalte valori cu distantele intre aceste valori ; • teste de tip t care se bazeaza pe tendinta valorilor de a se acumula in jurul valorilor medii.

Consideram in continuare aplicarea celor doua tipuri de metode in cazul unui sir de valori pe care le consideram mai mult sau mai putin « normal » distribuite. Aplicatii: 1. Folosind testul Dixon, sa se determine valorile aberante din urmatorul sir de valori:

ix 1 2 3 4 5 10

0

2

4

6

8

10

12

1 2 3 4 5 6

Solutie :

Se calculeaza 555,095

110510

1

110 ==

−−

=−−

= −

xxxx

rn

nn .

Conform Criteriului Dixon pentru respingerea valorilor aberante pentru si un nivel de semnificatie 6=n 05,0=α obtinem valoarea 0,56 ceea ce inseamna ca orice valoare mai mare de 0,56 este o valoare aberanta.

Valoarea obtinuta de noi de 0,555 este frontiera domeniului.

Page 160: APLICATII NUMERICE DE STATISTICA IN FARMACIE SI  · PDF fileSe spune, în acest caz, c:

Teste statistice de discordanta

158

2. Pentru exercitiul precedent sa se determine valorile aberante folosind testul t. Solutie :

Vom considera variabila aleatoare s

xxT n

n−

= care este distribuita

Student cu grade de libertate. n

Avem : 16,46

1054321=

+++++== ∑

nx

x i si

( )

( ) ( ) ( ) ( ) ( ) ( )

16,1016

16,41016,4516,4416,4316,4216,411

222222

2

2

=

=−

−+−+−+−+−+−=

=−

−= ∑

nxx

s i

Obtinem astfel 18,3=s si inlocuind in formula de mai sus avem

83,118,388,5

6 ==T .

Deoarece conform tabelelor distributiei Student avem deci punctul este “normal”.

94,195,0;6 =t94,183,1 ⟨

3. Sa se determine valorile aberante din urmatorul sir de valori:

ix 1 2 3 4 5 10 12

0

2

4

6

8

10

12

14

1 2 3 4 5 6 7

Solutie : • Folosind testul Dixon, in mod similar exercitiului 1 avem :

Page 161: APLICATII NUMERICE DE STATISTICA IN FARMACIE SI  · PDF fileSe spune, în acest caz, c:

Teste statistice de discordanta

159

18,0112

1121012

1

110 ==

−−

=−−

= −

xxxx

rn

nn .

Conform Criteriului Dixon pentru respingerea valorilor aberante(Anexa VII) pentru 7=n si un nivel de semnificatie 05,0=α obtinem valoarea 0,507 ceea ce inseamna ca valoare 127 =x este o valoare normala fiind mai mica decat 0,507.

In acest caz observam ca valoarea anormala este 106 =x

• Folosind testul t avem variabila aleatoare s

xxT n

n−

= unde :

28,57

121054321=

++++++== ∑

nx

x i si

( )20,422,17

1

2

2 =⇒=−

−= ∑ s

nxx

s i ; 90,195,0;7 =t

Obtinem 60,120,4

28,5127 =

−=T .

Deoarece 90,160,1 ⟨ punctul este normal. 4. Sa se determine valorile aberante din urmatorul sir de valori:

ix 1 2 3 3 3 4 4 4 5 10 12

0

2

4

6

8

10

12

14

1 2 3 4 5 6 7 8 9 10 11

Solutie :

Deoarece sunt 11 valori, Dixon schimba regula de testare :

Page 162: APLICATII NUMERICE DE STATISTICA IN FARMACIE SI  · PDF fileSe spune, în acest caz, c:

Teste statistice de discordanta

160

7,0107

212512

2

221 ==

−−

=−−

= −

xxxx

rn

nn

Conform criteriului Dixon pentru respingerea valorilor aberante, pentru un prag 05,0=α avem valoarea 0,576, deci valoare este o valoare aberanta.

1211 =x

5. Consideram spre exemplu valorile concentratiilor maxime ale MELUOL, un metabolit activ al nicergolinei la 7 voluntari sanatosi. Pentru a lua o decizie cat mai corecta, vom examina atat valorile individuale, cat si raportul valorilor pentru un acelasi voluntar.

Mai mult decat atat, pentru a avea si o imagine a acestor valori si a raportului dintre ele, consideram reprezentarile valorilor pentru medicamentul de referinta (R) si pentru cel testat (T) precum si a raporturilor T/R si a „dependentei” T ( R ) ( care, daca valorile s-ar corela perfect, ar trebui sa fie o dreapta). Subject

maxTC ( )/ng ml max RC ( )/ng ml T/R 1 60 50 1,2 2 8 7 1,1 3 10 20 0,5 4 4 3 1,3 5 30 22 1,4 6 11 15 0,7 9 17 6 2,8

Mean 20,5 19,5 1,1 Stdev 19,5 16,0 0,7

CMAX,T (ng/ml)

0

10

20

30

40

50

60

70

4 2 3 6 9 5 1

CMAX,R (ng/ml)

0

10

20

30

40

50

60

9 4 2 3 6 5 1

T/R

0

0,5

1

1,5

2

2,5

3

3 6 2 1 4 5 9

Page 163: APLICATII NUMERICE DE STATISTICA IN FARMACIE SI  · PDF fileSe spune, în acest caz, c:

Teste statistice de discordanta

161

Vom ordona crescator valorile:

Subject maxTC ( )/ng ml Subject

max RC ( )/ng ml Subject T/R 4 4 9 2,8 3 0,5 2 8 4 3 6 0,7 3 10 2 7 2 1,1 6 11 3 15 1 1,2 9 17 6 20 4 1,3 5 30 5 22 5 1,4 1 60 1 50 9 2,8

Observam dupa ordonare, ca valorile concentratiilor maxime pentru

voluntarul 1 sunt cele mai mari si, cel putin pentru T, mult mai mari (aparent discordante) decat pentru ceilalti voluntari.

Voluntarul 9 apare normal in contextul valorilor individuale pentru T si R dar raportul lor este cel mai mare, si probabil destul de indepartat de celelalte rapoarte. In continuare sunt redate rezultatele aplicarii testelor Dixon si Tn pentru R, T si T/R

Vom calcula testul Dixon conform criteriului Dixon de respingere a outliers: avem 7 voluntari ( 7k = ) si este suspecta valoarea cea mai mare,

deci testul folosit este 110

1

k k

k

X XrX X

−−=

−, avand pragul de 0,507 pentru un

nivel de semnificatie de 5% • pentru referinta:

1 7 610

1 7 1

50 22 28 0,5950 2,8 47, 2

k k

k

X X X XrX X X X

−− − −= = = = =

− − −

• pentru testat: 1 7 6

101 7 1

60 30 30 0,5460 4 56

k k

k

X X X XrX X X X

−− − −= = = = =

− − −

• pentru raportul T/R: 1 7 6

101 7 1

2,8 1, 4 1, 4 0,612,8 0,5 2,3

k k

k

X X X XrX X X X

−− − −= = = = =

− − −

Vom aplica testul unilateral 1k

kX XT

S−

−= , 7k = , cuantila : 6,0,90 1, 44t =

• pentru referinta:

Page 164: APLICATII NUMERICE DE STATISTICA IN FARMACIE SI  · PDF fileSe spune, în acest caz, c:

Teste statistice de discordanta

162

2,8 3 ... 50 19,57

X + + += = ;

( )2

2

1iX X

Sk

−=

−∑

16S⇒ =

77 1

50 19,5 30,5 1,9116 16

X XTS−

− −= = = =

• pentru testat:

20,5X = ; ( )2

2

1iX X

Sk

−=

−∑

19,5S⇒ =

77 1

60 20,5 39,5 2,0319,5 19,5

X XTS−

− −= = = =

• pentru raportul T/R:

1,1X = ; ( )2

2

1iX X

Sk

−=

−∑

0,7S⇒ =

77 1

2,8 1,1 1,7 2, 430,7 0,7

X XTS−

− −= = = =

Aplicand testul , voluntarul 9 este de eliminat dat fiind raportul T/R discordant.

kT

Acelasi test arata insa ca voluntarul 1 este anormal din punct de vedere al celor doua valori, dar nu si din punct de vedere al raportului T/R.

Dat fiind ca decizia privind bioechivalenta este influentata doar de intravariabilitate si nu depinde de intravariabilitate, voluntarul 1 nu este de eliminat.

In final, decizia privind clasificarea unei valori drept discordante, depinde de analiza fenomenologica si mai putin de rezultatul testelor statistice.

Page 165: APLICATII NUMERICE DE STATISTICA IN FARMACIE SI  · PDF fileSe spune, în acest caz, c:

Distributia binomiala

163

DISTRIBUTIA BINOMIALA Aplicatii: 1. Distribuţia gravitatii HTA (hipertensiune arteriala), apreciata prin numarul de medicamente necesar in tratament, în funcţie de boala renală primară, la 3 luni de la iniţierea programului de dializă cronică (când s-a considerat că pacienţii au ajuns la un echilibru din punct de vedere hemodinamic), a fost următoarea:

HTA Boala renala primara

non - HTA monoterapie biterapie > 3 medicamente

1 GNC glomerulonefrite cronice 5 5 15 25

2 NTI nefropatii tubulointerstiţiale 59 9 6 5

3 NI nefropatie ischemica 19 3 2 0

4 NH nefropatie hipertensiva 0 7 14 16

5 BP boala polichistica renala 18 6 8 4

a. Sa se veriffice ipoteza potrivit careia in cazul GNC, HTA nu depinde semnificativ in ceea ce priveste severitatea (distributia) de NH. b. Sa se compare severitatea (distributia intre clase de HT) intre GNC si BP Se considera 0,10α = Solutie: a. Ipotezele statistice sunt:

0 : intH nu exista diferente re cele doua boli : intAH exista diferente re cele doua boli

Comparam DISTRIBUTIILE folosind testul 2χ . Valorile observate ( ) sunt prezentate in tabelul urmator: iO

non HTA monoterapie biterapie peste 3 medicamente sum

GNC 5 5 15 25 50 NH 0 7 14 16 37 sum 5 12 29 41 87

Page 166: APLICATII NUMERICE DE STATISTICA IN FARMACIE SI  · PDF fileSe spune, în acest caz, c:

Distributia binomiala

164

Valorile asteptate - expectation ( ) sunt prezentate in tabelul urmator:

iE

non HTA monoterapie biterapie peste 3 medicamente sum

GNC 550* 2,87

87=

1250* 6,9087

=2950 * 16,6787

=4150 * 23,5687

= 50

NH 537 * 2,13

87=

1237 * 5,1087

=2937 * 12,3387

=4137 * 17, 4487

= 37

sum 5 12 29 41 87 Testul statistic este:

( )( )( ) ( ) ( ) ( )2 2 2 2

2 232 1 4 1

5 2,87 0 2,13 16 17, 44... 5, 52

2,87 2,13 17, 44i i

i

O EE

χ χ− −

− − − −= = = + + + =∑

Pentru un nivel de semnificatie 0,05α = avem valoarea de prag pentru distributia 2χ cu 3 grade de libertate pentru aria de 0,95 de 7,85.

Concluzie: cu probabilitate mai mare de 95 % severitatea HT la

pacientii cu GNC este aceiasi cu cea la pacientii cu NH b. Ipotezele statistice sunt:

0 : intH nu exista diferente re cele doua boli : intAH exista diferente re cele doua boli

Comparam proportiile folosind testul 2χ . Valorile observate ( ) sunt prezentate in tabelul urmator: iO

non HTA monoterapie biterapie peste 3 medicamente sum

GNC 5 5 15 25 50 BP 18 6 8 4 36 sum 23 11 23 29 86

Page 167: APLICATII NUMERICE DE STATISTICA IN FARMACIE SI  · PDF fileSe spune, în acest caz, c:

Distributia binomiala

165

Valorile asteptate - expectation ( ) sunt prezentate in tabelul urmator:

iE

non HTA monoterapie biterapie peste 3 medicamente sum GNC 13.37 6.40 13.37 16.86 50 NH 9.63 4.60 9.63 12.14 36 sum 23 11 23 29 86

Testul statistic este:

( )( )( ) ( ) ( ) ( )2 2 2 2

2 232 1 4 1

5 13, 37 18 9, 63 4 12,14... 23,11

13, 37 9, 63 12,14i i

i

O EE

χ χ− −

− − − −= = = + + + =∑

Pentru un nivel de semnificatie 0,05α = avem valoarea de prag pentru distributia 2χ cu 3 grade de libertate pentru aria de 0,95 de 7,85.

Concluzie: cu probabilitate de 95 % distributia severitatii la cele

doua categorii de bolnavi este diferita 2. In cadrul unor loturi de hemodializaţi s-a comparat procentul de pacienţi care au necesitat tratament cu stimulatori ai eritropoiezei, precum şi doza medie administrată obtinandu-se urmatoarele valori: Boala renala

primara Anemie

necesitand ASEDoză ASE sub 5000

Doze ASE 5000-10000

Doze ASE peste 10000

1. GNC 50 6 9 29 2. NTI 79 26 22 0 3. NI 24 6 12 3 4. NH 37 22 8 0 5. BP 36 9 3 0 6. NV 37 28 20 3

Sa se verifice ipoteza potrivit careia: a. Dozele cele mai mari de ASE au fost necesare la GNC, cele mai mici predomina la BP. b. In randul bolnavilor cu NV, cei cu NH au nevoie de doze mai mici Solutie:

Page 168: APLICATII NUMERICE DE STATISTICA IN FARMACIE SI  · PDF fileSe spune, în acest caz, c:

Distributia binomiala

166

a. Vom testa ipotezele cu testul 2χ

ASE sub 5000

ASE 5000-10000

ASE peste 10000

TOTAL pacienti cu anemie

GNC 6 9 29 44 BP 9 3 0 12 NV 28 20 3 51 Total 43 32 32 107

0 :H distributia dozelor nu depinde de boala :AH distributia depinde de boala

Valorile observate ( ) sunt prezentate in tabelul urmator: iO

ASE sub 5000

ASE 5000-10000

ASE peste 10000

TOTAL pacienti cu anemie

GNC 6 9 29 44 BP 9 3 0 12 NV 28 20 3 51 Total 43 32 32 107

Valorile asteptate - expectation ( ) sunt prezentate in tabelul

urmator: iE

ASE sub 5000

ASE 5000-10000

ASE peste 10000

TOTAL pacienti cu anemie

GNC 43

44* 17, 68107

=32

44 * 13,16107

=32

44 * 13,16107

=44

BP 43

12* 4,82107

=32

12 * 3,59107

=32

12 * 3,59107

=12

NV 43

51* 20,50107

=32

51* 15, 25107

=32

51* 15, 25107

=51

Total 43 32 32 107

Testul statistic este:

( )( )( ) ( ) ( ) ( )2 2 2 2

2 243 1 3 1

6 17,68 9 4,82 3 15,25... 49,48

17,68 4,82 15, 25i i

i

O EE

χ χ− −

− − − −= = = + + + =∑

Pentru un nivel de semnificatie 10,0=α avem valoarea de prag pentru distributia 2χ cu patru grade de libertate pentru aria de 0,90 de 9,49.

Page 169: APLICATII NUMERICE DE STATISTICA IN FARMACIE SI  · PDF fileSe spune, în acest caz, c:

Distributia binomiala

167

Deoarece 49,48 este mai mare decat 9,49, se accepta ipoteza AH ,

deci ca doza depinde de boala (diferente semnificative). b. in randul bolnavilor cu NV, cei cu NH au nevoie de doze mai mici

ASE sub 5000

ASE 5000-10000

ASE peste 10000

TOTAL pacienti cu anemie

NI 6 12 3 21 NH 22 8 0 30 Total 28 20 3 51

0 : iH NI si NH nu difera re elent

nt

0 : iH NI si NH difera re ele Comparam proportiile folosind testul 2χ .

Valorile observate ( ) sunt prezentate in tabelul urmator: iO

ASE sub 5000

ASE 5000-10000

ASE peste 10000

TOTAL pacienti cu anemie

NI 6 12 3 21 NH 22 8 0 30 Total 28 20 3 51

Valorile asteptate - expectation ( ) sunt prezentate in tabelul urmator:

iE

ASE sub 5000

ASE 5000-10000

ASE peste 10000

TOTAL pacienti cu anemie

NI 28

21* 11,5351

=20

21* 8, 2451

=3

21* 1, 2451

=21

NH 28

30 * 16, 4751

=20

30* 11, 7651

=3

30* 1, 7651

=30

Total 28 20 3 51

Testul statistic este:

Page 170: APLICATII NUMERICE DE STATISTICA IN FARMACIE SI  · PDF fileSe spune, în acest caz, c:

Distributia binomiala

168

( )( )( ) ( ) ( ) ( )2 2 2 2

2 223 1 2 1

6 11,53 22 16, 47 0 1,76... 11,72

11,53 16, 47 1,76i i

i

O EE

χ χ− −

− − − −= = = + + + =∑

Pentru un nivel de semnificatie 10,0=α avem valoarea de prag pentru distributia 2χ cu doua grade de libertate pentru aria de 0,90 de 9,21.

Deoarece 11,72 este mai mare decat 9,21, se respinge ipoteza 0H ,

deci diferentele sunt semnificative. Concluzie : in randul bolnavilor cu nv, cei cu nh au nevoie de doze semnificativ mai mici 3. Aprecierea stării de nutriţie a fost realizată prin măsurarea albuminemiei serice (s-au luat mediile pe 6 luni) şi prin aplicarea chestionarului de evaluare globală subiectivă a stării de nutriţie (SGA = Subjective Global Assesment) la intervale de 1 an. S-au obtinut urmatoarele valori:

Boala renala primara

Malnutritie albumina

Alb 3-3,5 Alb 2,5-3 Alb < 2,5

1 GNC 16 6 8 2 2 NTI 12 8 3 1 3 NI 14 2 8 4 4 NH 10 4 4 2 5 BPI 6 4 2 0

Malnutritie Nr. pacienti

non Usoara SGA

Media – Severa SGA cu SGA Total

Procent

GNC 31 9 10 19 50 0.38 NTI 65 8 6 14 79 0.18 NI 5 4 15 19 24 0.79 NH 24 10 3 13 37 0.35 BP 29 6 1 7 36 0.19

Sa se verifice ipoteza ca: a. “distributiile“ non-malnutritie, SGA usoara, SGA medie sau severa difera semnificativ intre grupele de boli

Page 171: APLICATII NUMERICE DE STATISTICA IN FARMACIE SI  · PDF fileSe spune, în acest caz, c:

Distributia binomiala

169

ntnt

b. Din punct de vedere al albuminei serice - ca marker al malnutritiei – malnutritia este mai frecventa si mai severa la NI . Solutie:

0 : iH distributiile nu difera re ele

0 : iH distributiile difera re ele a. Comparam distributiile folosind testul 2χ .

Valorile observate ( ) sunt prezentate in tabelul urmator: iO

non Malnutritie

Usoara SGA

Media - Severa SGA sum

GNC 31 9 10 50NTI 65 8 6 79NI 5 4 15 24NH 24 10 3 37BP 29 6 1 36sum 154 37 35 226

Valorile asteptate - expectation ( ) sunt prezentate in tabelul urmator:

iE

non MalnutritieUsoara SGA Media - Severa SGA sum

GNC 154

50* 34,07226

=37

50* 8,19226

=35

50 * 7, 74226

=50

NTI 154

79 * 53,83226

=37

79 * 12,93226

=35

79 * 12, 23226

=79

NI 154

24 * 16,35226

=37

24* 3,93226

=35

24* 3,72226

=24

NH 154

37 * 25, 21226

=37

37 * 6, 06226

=35

37 * 5, 73226

=37

BP 154

36 * 24,53226

=37

36 * 5,89226

=35

36 * 5,58226

=36

sum 154 37 35 226 Testul statistic este:

( )( )( ) ( ) ( ) ( ) ( )2 2 2 2

2 283 1 5 1

31 34,07 65 53,83 3 5,73 1 5,58...

34,07 53,83 5,73 5,5859,02

i i

i

O EE

χ χ− −

− − − − −= = = + + + + =

=

∑2

Pentru un nivel de semnificatie 0,05α = avem valoarea de prag

pentru distributia 2χ cu 8 grade de libertate pentru aria de 0,95 de 15,51.

Page 172: APLICATII NUMERICE DE STATISTICA IN FARMACIE SI  · PDF fileSe spune, în acest caz, c:

Distributia binomiala

170

Deoarece 59,02 este mai mare decat 15,51, se respinge ipoteza

egalitatii.

b. Comparam proportiile folosind testul 2χ . Valorile observate ( ) sunt prezentate in tabelul urmator: iO

non Malnutritie

Albumina 3 - 3,5

Albumina 2,5 - 3

Albumina sub 2,5 sum

GNC 34 6 8 2 50NTI 67 8 3 1 79NI 10 2 8 4 24NH 27 4 4 2 37BP 30 4 2 0 36sum 168 24 25 9 226

Valorile asteptate - expectation ( ) sunt prezentate in tabelul urmator:

iE

non MalnutritieAlbumina 3 - 3,5

Albumina 2,5 - 3

Albumina sub 2,5 sum

GNC 168

50 * 37,17226

=24

50* 5,31226

=25

50* 5,53226

=9

50* 1,99226

=50

NTI 168

79 * 58, 73226

=24

79 * 8,39226

=25

79 * 8, 74226

=9

79* 3,15226

=79

NI 168

24 * 17,84226

=24

24* 2,55226

=25

24 * 2, 65226

=9

24* 0,96226

=24

NH 168

37 * 27,50226

=24

37 * 3,93226

=25

37 * 4, 09226

=9

37 * 1, 47226

=37

BP 168

36* 26, 76226

=24

36* 3,82226

=25

36* 3,98226

=9

36* 1, 43226

=36

sum 168 24 25 9 226Testul statistic este:

Page 173: APLICATII NUMERICE DE STATISTICA IN FARMACIE SI  · PDF fileSe spune, în acest caz, c:

Distributia binomiala

171

( )( )( ) ( ) ( ) ( ) ( )2 2 2 2

2 2124 1 5 1

34 37,17 67 58,73 2 1,47 0 1, 43...

37,17 58,73 1,47 1,4334,92

i i

i

O EE

χ χ− −

− − − − −= = = + + + +

=

∑2

=

Pentru un nivel de semnificatie 0,05α = avem valoarea de prag pentru distributia 2χ cu 12 grade de libertate pentru aria de 0,95 de 21,03.

Deoarece 34,92 este mai mare decat 21,03, se respinge ipoteza

egalitatii, deci calitatea fizica difera intre cele doua boli.

4. Incidenta osteodistrofiei la pacienti sub dializa renala s-a determinat prin compararea incidenţei hiperparatiroidismului şi hiperfosfatemiei in diferite subgrupuri, obtinandu-se rezultatele urmatoare:

Boala renala

primara

PTH > valoare optima

PTH normal sau suboptim

PTH ≥ 800pg/ml

P>N P in limite

1 GNC 36 14 2 36 14 2 NTI 56 23 18 51 28 3 NI 17 7 0 15 9 4 NH 27 10 0 24 13 5 BPI 26 10 1 22 14

PTH = parathormon, are valoare optimă în jur de 200pg/ml Hiperparatiroidism = creşterea PTH peste valoarea optimă

Sa se verifice ipoteza statistica potrivit careia hiperparatiroidismul şi hiperfosfatemia au incidenţe comparabile în diferitele subloturi etiologice (nu diferă statistic) Solutie: Verificarea statistica a ipotezei: hiperparatiroidismul şi hiperfosfatemia au incidenţe comparabile în diferitele subloturi etiologice (nu diferă statistic) a.1. hiperparatiroidismul

0 : intH nu exista diferente re boli : intAH exista diferente re boli

Comparam proportiile folosind testul 2χ . Valorile observate ( ) sunt prezentate in tabelul urmator: iO

Page 174: APLICATII NUMERICE DE STATISTICA IN FARMACIE SI  · PDF fileSe spune, în acest caz, c:

Distributia binomiala

172

PTH > valoare optima PTH normal sau suboptim total GNC 36 14 50 NTI 56 23 79 NI 17 7 24 NH 27 10 37 BP 26 10 36 sum 162 64 226

Valorile asteptate - expectation ( ) sunt prezentate in tabelul urmator:

iE

PTH > valoare optima PTH normal sau suboptim total

GNC 16250* 35,84226

= 6450* 14,16226

= 50

NTI 16279* 56,63226

= 6479* 22,37226

= 79

NI 16224* 17, 20226

= 6424* 6,80226

= 24

NH 16237* 26,52226

= 6437* 10, 48226

= 37

BP 16236* 25,81226

= 6436* 10,19226

= 36

sum 162 64 226 Testul statistic este:

( )( )( ) ( ) ( ) ( )2 2 2 2

2 242 1 5 1

36 35,84 56 56,63 10 10,19... 0,07

35,84 56,63 10,19i i

i

O EE

χ χ− −

− − − −= = = + + + =∑

Pentru un nivel de semnificatie 0,05α = avem valoarea de prag pentru distributia 2χ cu 4 grade de libertate pentru aria de 0,95 de 9,49.

Deci, cu o probabilitate mai mare de 95 % ipoteza ca hiperparatiroidismul are incidenţe comparabile în diferitele subloturi etiologice (nu diferă statistic) este adevarata

Page 175: APLICATII NUMERICE DE STATISTICA IN FARMACIE SI  · PDF fileSe spune, în acest caz, c:

Distributia binomiala

173

hiperfosfatemia 0 : intH nu exista diferente re boli

: intAH exista diferente re boli Comparam proportiile folosind testul 2χ .

Valorile observate ( ) sunt prezentate in tabelul urmator: iO

P>N P in limite total GNC 36 14 50 NTI 51 28 79 NI 15 9 24 NH 24 13 37 BP 22 14 36 sum 148 78 226

Valorile asteptate - expectation ( ) sunt prezentate in tabelul urmator:

iE

P>N P in limite total

GNC 14850* 32,74226

= 7850* 17, 26

226=

50

NTI 14879* 51,73226

= 7879* 27, 27

226=

79

NI 14824* 15,72226

= 7824* 8, 28

226=

24

NH 14837* 24, 23226

= 7837* 12, 27

226=

37

BP 14836* 23,58226

= 7836* 12, 42

226=

36 sum 148 78 226

Testul statistic este:

( )( )( ) ( ) ( ) ( )2 2 2 2

2 242 1 5 1

36 32,74 51 51,73 14 12,42... 1,37

32,74 51,73 12, 42i i

i

O EE

χ χ− −

− − − −= = = + + + =∑

Pentru un nivel de semnificatie 0,05α = avem valoarea de prag pentru distributia 2χ cu 4 grade de libertate pentru aria de 0,95 de 9,49.

Page 176: APLICATII NUMERICE DE STATISTICA IN FARMACIE SI  · PDF fileSe spune, în acest caz, c:

Distributia binomiala

174

Deci, cu o probabilitate mai mare de 95 % ipoteza ca

hiperparatiroidismul are incidenţe comparabile în diferitele subloturi etiologice (nu diferă statistic) este adevarata

Page 177: APLICATII NUMERICE DE STATISTICA IN FARMACIE SI  · PDF fileSe spune, în acest caz, c:

Puterea testului. Calculul numarului de voluntari

175

PUTEREA TESTULUI. CALCULUL NUMARULUI DE VOLUNTARI Aplicatii: 1. Sa se stabileasca numarului de subiecti necesari pentru testarea bioechivalentei a doua forme farmaceutice de supozitoare cu MELOXICAM. Dintr-un studiu pilot avem ca estimare a intravariabilitatii pentru AUC si maxC , 20%CV = si respectiv 30%.CV = Conform reglementarilor avem: • 0,10α = • diferenta semnificativa clinic 20%*μΔ = atat pentru maxC cat si AUC Solutie:

I. Se considera: secventele egale 1 2n n n= = puterea testului 80%, deci 0, 20β =

Formula cea mai simpla de aplicat, dar mai putin precisa este cea de la compararea a doua medii cu testul T. Pentru fiecare secventa avem:

22

2 22 2 22

2 22 22 2 2

ˆ2ˆ ˆ

22

*100

e

d e

z zCVn z z z z z z

α β

α β α β α β

σσ σ μ

μ μ

⎛ ⎞+⎜ ⎟⎛ ⎞ ⎛ ⎞ ⎛ ⎞⎝ ⎠= + = = + = +⎜ ⎟ ⎜ ⎟ ⎜ ⎟Δ Δ ⎛ ⎞ ⎛ ⎞Δ Δ⎝ ⎠ ⎝ ⎠ ⎝ ⎠

⎜ ⎟ ⎜ ⎟⎝ ⎠ ⎝ ⎠

2

22

2e

dσσ = 0.05

2

1,64z zα = = − 0,20 0,84z zβ = = −

Se alege CV valoarea cea mai mare, 30%. Pentru fiecare secventa vom avea:

( )2

2 301,64 0,84 13,84 1420

n ⎛ ⎞= − − = ≈⎜ ⎟⎝ ⎠

Deci, numarul total de subiecti trebuie sa fie de cel putin 28. II. Daca producatorul considera ca riscul 0, 20β = este prea mare si

doreste o putere de 0,90 , deci 0,10β = , n devine:

( ) ( ) ( )2

2 2 20,05 0,10

30 1,64 1, 28 1,5 19,1820

n z z ⎛ ⎞= + = + =⎜ ⎟⎝ ⎠

Deci, pentru studiu trebuiesc luati circa 40 de subiecti, ceea ce este deja cam mult din punct de vedere al comisiilor de etica.

Page 178: APLICATII NUMERICE DE STATISTICA IN FARMACIE SI  · PDF fileSe spune, în acest caz, c:

Puterea testului. Calculul numarului de voluntari

176

III. Formula de mai sus poate fi inlocuita cu una mai precisa bazata pe faptul ca testarea bioechivalentei foloseste testul T si nu testul Z.

In acest caz, numarul de subiecti in fiecare secventa este dat de: 2 2

2 2;2 2;2

nn

CVn t tα β−−

⎛ ⎞ ⎛ ⎞≥ +⎜ ⎟ ⎜ ⎟Δ⎝ ⎠⎝ ⎠

In cazul in care 0,10α = si 0, 20β = , avem:

( )2

22 2;0.05 2 2;0,20

3020n nn t t− −

⎛ ⎞≥ + ⎜ ⎟⎝ ⎠

Problema este ca n apare in ambii membri ai ecuatiei. Incercam intai cu valoarea obtinuta plecand de la testul Z: si

avem: 14n =

26; 0,05 1,71t = − si 26; 0,20 0,856t = −

( ) ( )2 214 1,71 0,856 1,5≥ − − ⇒ 14,81≥ 14 si deci rezultatul nu difera semnificativ de cel obtinut anterior. IV. Formulele anterioare au fost deduse pornind de la bioechivalenta tratata ca un test de egalitate. Cand aplicam insa un test bazat pe intervalul de incredere , echivalente cu cele doua teste Schuirmann, formula se modifica prin aceea ca

2 2;2

nt α

− trebuie inlocuit cu 2 2;nt α− si 2 2;nt β− trebuie

inlocuit cu 2 2;

2n

t β−

obtinandu-se:

2 2

2 2; 2 2;2

n n

CVn t tα β−−

⎛ ⎞ ⎛ ⎞≥ +⎜ ⎟ ⎜ ⎟Δ⎝ ⎠⎝ ⎠

Considerand tot 0,10α = si 0, 20β = , avem:

( )2

22 2;0,10 2 2;0,10

3020n nn t t− −

⎛ ⎞≥ + ⎜ ⎟⎝ ⎠

Incercam intai cu valoarea obtinuta plecand de la testul Z: si avem:

14n =

26; 0,10 1,32t = − ( ) ( )2 214 1,32 1,32 1,5 14 17,14⇒ ≥ − − ⇒ ≥ Incercam cu 16n = si avem:

30; 0,10 1,31t = − ( ) ( )2 216 1,31 1,31 1,5 16 15, 44⇒ ≥ − − ⇒ ≥ Deci, numarul de subiecti trebuie sa fie de 16 pe fiecare secventa.

Page 179: APLICATII NUMERICE DE STATISTICA IN FARMACIE SI  · PDF fileSe spune, în acest caz, c:

Puterea testului. Calculul numarului de voluntari

177

Comparand cu formula pentru testarea ipotezei punctuale, cifra difera fiind mai mare. Deci, formula anterioara duce la o subestimare a numarului necesar de subiecti.

V. Atunci cand intre produse exista efectiv o diferenta θ , formula pentru calculul numarului de subiecti pornind de la ipotezele de interval este:

( ) ( )( )

22

2 2; 2 2; 2%n n

CVn t tα β

θ− −≥ +

Δ −

unde % 100*R

θθμ

=

Pentru 0,10α = si 0, 20β = % 10%θ = pornind de la 20n = , avem:

( ) ( )( )

( )2

2 238;0,10 38;0,20 2

3020 20 1,30 0,848 *9 20 41

20 10t t≥ + ⇒ ≥ + ⇒ ≥

Rezultatele fiind prea diferite vom lua in calcul 30n =

( ) ( )( )

( )2

2 258;0,10 58;0,20 2

3030 30 1,30 0,848 *9 30 41

20 10t t≥ + ⇒ ≥ + ⇒ ≥

In fapt pentru 2 2 3n 0− ≥ avem 2 2;nt zα α− ≈ deci termenul din dreapta nu se mai modifica si alegerea este practic 40n = .

Pentru intreg studiul numarul de subiecti este urias 80 pentru un studiu de bioechivalenta.

Page 180: APLICATII NUMERICE DE STATISTICA IN FARMACIE SI  · PDF fileSe spune, în acest caz, c:

Puterea testului. Calculul numarului de voluntari

178

Page 181: APLICATII NUMERICE DE STATISTICA IN FARMACIE SI  · PDF fileSe spune, în acest caz, c:

Studii epidemiologice

179

STUDII EPIDEMIOLOGICE. CALCULAREA RISCULUI RETROSPECTIV (ODDS RATIO)

Riscul din cauza expunerii ( )( )DPDP

RNE

E= se evalueaza intr-un studiu

prospectiv si este definit ca raportul dintre probabilitatea imbolnavirii celor expusi si probabilitatea imbolnavirii celor neexpusi

Dar, in case – study, noi nu expunem subiectii, ci consideram bolnavi deci eveniment produs este boala, si obtinem: ( )•DP

Riscul prospectiv (“odds ratio”) Consideram raportul “defectelor - odds ratio” OR care se obtine

intr-un studiu retrospectiv (case-study): Rapoartele odds sunt rapoartele intre proportia celor expusi si

proportia celor de neexpusi in populatia de bolnavi si respectiv acelasi raport in populatia de sanatosi. Spre exemplu se considera proportia intr-un lot de bolnavi de cancer pulmonar si proportia fumatorilor intr-un lot din intreaga populatia. Raportul acestor proportii, numit odds ratio, este o masura a riscului de imbolnavire al celor expusi.

)()()()(

)()()(

)(

EPNEPNEPEP

NEPEP

NEPEP

ORNDD

NDD

ND

ND

D

D

==

In exemplul nostru:

lnproportia fumatorilor in populatia de bo aviORproportia fumatorilor in populatia de sanatosi

=

In cazul bolilor rare ar trebui determinat numarul de imbolnaviri intr-un lot expus comparativ cu un lot neexpus pe perioade foarte lungi ceea ce este foarte scump si, in general, nu este fezabil datorita iesirii din studiu a foarte multi dintre subiecti.

In aceasta situatie insa, daca aproximam ca probabilitatea imbolnavirii este aproximativ zero ( ) 0≅DP ) si probabilitatea de neimbolnavire este aproape 1 ( ( ) 1≅NDP ), riscul obtinum retrospectiv OR este o estimare a riscului din cauza expunerii : ORR ≅

Consideram rezultate dintr-un studiu privind incidenta cancerelor de gura efectuat in Olanda 1 1 KP Schepman, PD Bezemer, EH van der Meij, LE Smeele, I van der Waal: Tobacco usage in relation to the anatomical site of oral leukoplakia, Oral Diseases 7, 25-27, 2001

Page 182: APLICATII NUMERICE DE STATISTICA IN FARMACIE SI  · PDF fileSe spune, în acest caz, c:

Studii epidemiologice

180

Femei Fumătoare Nefumătoare Total Paciente cu Leucoplakie localizare mucoasă

obraji 6 5 11

Control (femei populaţie Olanda) 30.3 69.7 100 Total 36.3 74.7 111

Bărbaţi Fumători Nefumători Total

Pacienţi cu Leucoplakie localizare mucoasă obraji

11 1 12

Control (bărbaţi populaţie Olanda) 36.7 63.3 100 Aplicatie 1. Calculati riscul relativ retrospectiv ( OR ) si un interval de incredere pentru acest risc pentru cele doua populatii. Consideram notatia

uzuala a bc d

⎛ ⎞⎜ ⎟⎝ ⎠

a. Femei

Deci, a adcb bcd

= = ⇒OR 6*69,7 418, 2 2,765*30,3 151,5

OR = = =

Intervalul de incredere de 95% pentru ln este egal cu: OR

( ) 1 1 1 1ln 1,96ORa b c d

± + + +

Limitele inferioare si superioare ale lui ( )ORln sunt:

( ) ( ) 1 1 1 1ln ln 1,96LOR ORa b c d

= − + + + , limita inferioara (lower)

( ) ( ) 1 1 1 1ln ln 1,96UOR ORa b c d

= + + + + , limita superioara (upper)

Avem:

( ) ( ) 1 1 1 1ln ln 2,76 1,96 1,01 1, 26 0, 256 5 30,3 69,7LOR = − + + + = − = −

( ) ( ) 1 1 1 1ln ln 2,76 1,96 1,01 1, 26 2,076 5 30,3 69,7UOR = + + + + = + =

Intervalul de incredere in scala originala de risc relativ estimat este prin urmare dat de ( ) ( )[ ]UL OROR ee lnln ; Vom obtine un interval de incredere pentru riscul retrospectiv:

( ) ( )lnln 0,25 2,07; ;UL OROROR e e OR e e−⎡ ⎤ ⎡ ⎤∈ ⇒ ∈⎣ ⎦⎣ ⎦ ⇒ [ ]0,78 ; 7,93OR∈

Page 183: APLICATII NUMERICE DE STATISTICA IN FARMACIE SI  · PDF fileSe spune, în acest caz, c:

Studii epidemiologice

181

b. Barbati Aplicand acelasi rationament pentru barbati obtinem:

11*63,3 696,3 18,971*36,7 36,7

adORbc

= = = =

( ) ( ) 1 1 1 1ln ln 18,97 1,96 2,94 2,09 0,8511 1 36,7 63,3LOR = − + + + = − =

( ) ( ) 1 1 1 1ln ln 18,97 1,96 2,94 2,09 5,0311 1 36,7 63,3UOR = + + + + = + =

Vom obtine un interval de incredere pentru riscul retrospectiv: [ ]0,85 5,03; 2,34 ;152,93OR e e OR⎡ ⎤∈ ⇒ ∈⎣ ⎦

Cand avem mai multe studii clinice epidemiologice, de exemplu

unul pe femei si unul pe barbati, in ipoteza ca nu exista diferente semnificative intre cele doua sexe in ceea ce priveste riscul unei anumite boli indus de un factor de risc dat, este natural sa reunim loturile si sa facem calculele pentru populatia reunita. c. Populatia reunita

In acest caz 17a = , 6b = , 67c = si 133d = 17*133 2261 5,626*67 402

adORbc

= = = =

( ) ( ) 1 1 1 1ln ln 5,62 1,96 1,73 0,98 0,7517 6 67 133LOR = − + + + = − =

( ) ( ) 1 1 1 1ln ln 5,62 1,96 1,73 0,98 2,7117 6 67 133UOR = + + + + = + =

Vom obtine un interval de incredere pentru riscul retrospectiv: [ ]0,75 2,71; 2,12 ;15,03OR e e OR⎡ ⎤∈ ⇒ ∈⎣ ⎦

Daca insa nu putem presupune acest lucru, o metoda alternativa de

calcul este metoda Mantel-Haenszel .Metoda Mantel-Haenszel este folosită pentru a estima „pooled odds ratio” din mai multe straturi sau mai multe studii similare:

Page 184: APLICATII NUMERICE DE STATISTICA IN FARMACIE SI  · PDF fileSe spune, în acest caz, c:

Studii epidemiologice

182

2

12

1

ki i

i iMH

ki i

i i

a dn

ORb cn

=

=

⎛ ⎞⎜ ⎟⎝ ⎠=⎛ ⎞⎜ ⎟⎝ ⎠

∑,

unde i i i in a b c d= + + + i

Strat / Studii Cazuri Control Total

Expusi 1a 1b 11n

Neexpusi 1c 1d 01n

1

Total 11m 01m 1n

......... ........................ ............ ............ ............. Expusi

ja jb 1 jn

Neexpusi jc jd 0 jn

j

Total 1 jm 0 jm jn

......... ........................ ............ ............ ............. Expusi

Ka Kb 1Kn Neexpusi

Kc Kd 0Kn

K

Total 1Km 0Km Kn

Dispersia lui ORMH se calculează conform ecuaţiei

( )( ) 112

1 11

12

1

* **ln

22

*

2

KKj j j j j j j jj j j j

j j j j jj j jMH

K KK j j j jj j

j jj jj j

Kj j j j

j j j

Kj j

j j

b c a d b c a da d a dn n n nn n

D ORa d b ca dn nn

b c b cn n

b cn

==

= ==

=

=

⎛ ⎞+ +++⎜ ⎟⎜ ⎟

⎝ ⎠= + +⎛ ⎞⎛ ⎞⎛ ⎞⎜ ⎟⎜ ⎟⎜ ⎟ ⎜ ⎟⎜ ⎟⎜ ⎟ ⎝ ⎠⎝ ⎠⎝ ⎠

+

+⎛ ⎞⎜ ⎟⎜ ⎟⎝ ⎠

∑∑

∑ ∑∑

Page 185: APLICATII NUMERICE DE STATISTICA IN FARMACIE SI  · PDF fileSe spune, în acest caz, c:

Studii epidemiologice

183

Intervalul de încredere se poate obţine folosind ecuaţia:

( )( )2

exp logMH MHOR z D ORα

⎛ ⎞±⎜ ⎟⎝ ⎠

Aplicatie 2. Calculati riscul combinat al celor doua subpopulatii.

Vom aplica relatia 1

1

ki i

i iMH

ki i

i i

a dn

ORb cn

=

=

⎛ ⎞⎜ ⎟⎝=⎛ ⎞⎜ ⎟⎝ ⎠

∑⎠ in care avem:

1 6a = 2 11a =

1 5b = 2 1b =

1 30,3c = 2 36,7c =

1 69,7d = 2 63,3d =

1 111n = 2 112n = In cazul nostru obtinem:

1 1 2 2

1 2

1 1 2 2

1 2

6*69.7 11*63.3111 112 5.95*30.3 1*36.7111 112

MH

a d a dn nOR b c b cn n

+ += =

++=

deci riscul la nivelul intregii populatii este de circa 6 ori mai mare in cazul fumatorilor decat in cazul nefumatorilor.

In cazul nostru dispersia pentru OR va fi:

( )( )1 1 1 1 2 2 2 2

1 1 2 22

1 1 2 2

1 2

* *ln

2MH

a d a d a d a dn n n nD OR

a d a dn n

+ ++

= +⎛ ⎞

+⎜ ⎟⎝ ⎠

1 1 1 1 2 2 2 2

1 1 2 2

1 1 2 2 1 1 2 2

1 2 1 2

* *

2

b c a d b c a dn n n n

a d a d b c b cn n n n

+ ++

+ +⎛ ⎞⎛ ⎞

⎟⎠

+ +⎜ ⎟⎜⎝ ⎠⎝

1 1 1 1 2 2 2 2

1 1 2 22

1 1 2 2

1 2

* *

2

b c b c b c b cn n n n

b c b cn n

+ ++

⇒⎛ ⎞

+⎜ ⎟⎝ ⎠

Page 186: APLICATII NUMERICE DE STATISTICA IN FARMACIE SI  · PDF fileSe spune, în acest caz, c:

Studii epidemiologice

184

( )( ) 2

6*69,7 6 69,7 11*63,3 11 63,3* *111 111 112 112ln

6*69,7 11*63,32111 112

MHD OR

+ ++

= +⎛ ⎞+⎜ ⎟⎝ ⎠

5*30,3 6 69,7 1*36,7 11 63,3* *111 111 112 112

6*69,7 11*63,3 5*30,3 1*36,72111 112 111 112

+ ++

+ +⎛ ⎞⎛+ +⎜ ⎟⎜⎝ ⎠⎝

⎞⎟⎠

2

5*30,3 5 30,3 1*36,7 1 36,7* *111 111 112 112

5*30,3 1*36,72111 112

+ ++

+ ⇒⎛ ⎞+⎜ ⎟⎝ ⎠

( )( ) ( ) ( )( )22,57 4,12 0,93 0, 22ln

2 3,77 6, 22 1,36 0,332 3,77 6, 22MHD OR + +

= + ++ ++

( )20, 43 0,11

2 1,36 0,33+

+ ⇒+

Deci,

( )( ) 7 1,15 0,54ln 0,035 0,034 0,094 0,1632*100 2*10*1,69 2*2,85

MHD OR ≅ + + = + + =

deci, ( )( )ln 0,40MHD OR = ( )( )2

log 1,96*0,04 0,08MHz D ORα⇒ = =

Intervalul de încredere se poate obţine folosind ecuaţia:

( )( ) [ ]0,08 0,08

2

exp log 5,9* ;5,9* 5,46 ;6,39MH MHOR z D OR e eα−⎛ ⎞

⎡ ⎤± = =⎜ ⎟ ⎣ ⎦⎝ ⎠

Page 187: APLICATII NUMERICE DE STATISTICA IN FARMACIE SI  · PDF fileSe spune, în acest caz, c:

Anexa I

185

Tabele pentru z

z 0 1 2 3 4 5 6 7 8 9 0,0 0,0000 0,0040 0,0080 0,0120 0,0160 0,0199 0,0239 0,0279 0,0319 0,0359 0,1 0,0398 0,0438 0,0478 0,0517 0,0557 0,0596 0,0636 0,0675 0,0714 0,0754 0,2 0,0793 0,0832 0,0871 0,0910 0,0948 0,0987 0,1026 0,1064 0,1103 0,1141 0,3 0,1179 0,1217 0,1255 0,1293 0,1331 0,1368 0,1406 0,1443 0,1480 0,1517 0,4 0,1554 0,1591 0,1628 0,1664 0,1700 0,1736 0,1772 0,1808 0,1844 0,1879 0,5 0,1915 0,1950 0,1985 0,2019 0,2054 0,2088 0,2123 0,2157 0,2190 0,2224 0,6 0,2258 0,2291 0,2324 0,2357 0,2389 0,2422 0,2454 0,2486 0,2518 0,2549 0,7 0,2580 0,2612 0,2642 0,2673 0,2704 0,2734 0,2764 0,2794 0,2823 0,2852 0,8 0,2881 0,2910 0,2939 0,2967 0,2996 0,3023 0,3051 0,3078 0,3106 0,3133 0,9 0,3159 0,3186 0,3212 0,3238 0,3264 0,3289 0,3315 0,3340 0,3365 0,3389 1,0 0,3413 0,3438 0,3461 0,3485 0,3508 0,3531 0,3554 0,3577 0,3599 0,3621 1,1 0,3643 0,3665 0,3686 0,3708 0,3729 0,3749 0,3770 0,3790 0,3810 0,3830 1,2 0,3849 0,3869 0,3888 0,3907 0,3925 0,3944 0,3962 0,3980 0,3997 0,4015 1,3 0,4032 0,4049 0,4066 0,4082 0,4099 0,4115 0,4131 0,4147 0,4162 0,4177 1,4 0,4192 0,4207 0,4222 0,4236 0,4251 0,4265 0,4279 0,4292 0,4306 0,4319 1,5 0,4332 0,4345 0,4357 0,4370 0,4382 0,4394 0,4406 0,4418 0,4429 0,4441 1,6 0,4452 0,4463 0,4474 0,4484 0,4495 0,4505 0,4515 0,4525 0,4535 0,4545 1,7 0,4554 0,4564 0,4573 0,4582 0,4591 0,4599 0,4608 0,4616 0,4625 0,4639 1,8 0,4641 0,4649 0,4656 0,4664 0,4671 0,4678 0,4686 0,4693 0,4699 0,4706 1,9 0,4713 0,4719 0,4726 0,4732 0,4738 0,4744 0,4750 0,4756 0,4761 0,4767 2,0 0,4772 0,4778 0,4783 0,4788 0,4793 0,4798 0,4803 0,4808 0,4812 0,4817 2,1 0,4821 0,4826 0,4830 0,4834 0,4838 0,4842 0,4846 0,4850 0,4854 0,4857 2,2 0,4861 0,4864 0,4868 0,4871 0,4875 0,4878 0,4881 0,4884 0,4887 0,4890 2,3 0,4893 0,4896 0,4898 0,4901 0,4904 0,4906 0,4909 0,4911 0,4913 0,4916 2,4 0,4918 0,4920 0,4922 0,4925 0,4927 0,4929 0,4931 0,4932 0,4934 0,4936 2,5 0,4938 0,4940 0,4941 0,4943 0,4945 0,4946 0,4948 0,4949 0,4951 0,4952 2,6 0,4953 0,4955 0,4956 0,4957 0,4959 0,4960 0,4961 0,4962 0,4963 0,4964 2,7 0,4965 0,4966 0,4967 0,4968 0,4969 0,4970 0,4971 0,4972 0,4973 0,4974 2,8 0,4974 0,4975 0,4976 0,4977 0,4977 0,4978 0,4979 0,4979 0,4980 0,4981 2,9 0,4981 0,4982 0,4982 0,4983 0,4984 0,4984 0,4985 0,4985 0,4986 0,4986 3,0 0,4987 0,4987 0,4987 0,4988 0,4988 0,4989 0,4989 0,4989 0,4990 0,4990 3,1 0,4990 0,4991 0,4991 0,4991 0,4992 0,4992 0,4992 0,4992 0,4993 0,4993

Page 188: APLICATII NUMERICE DE STATISTICA IN FARMACIE SI  · PDF fileSe spune, în acest caz, c:

Anexa I

186

3,2 0,4993 0,4993 0,4994 0,4994 0,4994 0,4994 0,4994 0,4995 0,4995 0,4995 3,3 0,4995 0,4995 0,4995 0,4996 0,4996 0,4996 0,4996 0,4996 0,4996 0,4997 3,4 0,4997 0,4997 0,4997 0,4997 0,4997 0,4997 0,4997 0,4997 0,4997 0,4998 3,5 0,4998 0,4998 0,4998 0,4998 0,4998 0,4998 0,4998 0,4998 0,4998 0,4998 3,6 0,4998 0,4998 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 3,7 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 3,8 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 3,9 0,5000 0,5000 0,5000 0,5000 0,5000 0,5000 0,5000 0,5000 0,5000 0,5000

Page 189: APLICATII NUMERICE DE STATISTICA IN FARMACIE SI  · PDF fileSe spune, în acest caz, c:

Anexa II

187

Tabele pentru t

ν

55,0t 60,0t 70,0t 75,0t 80,0t 90,0t 95,0t 975,0t 99,0t 995,0t

1 0,158 0,325 0,727 1,000 1,376 3,08 6,31 12,71 31,82 63,66 2 0,142 0,289 0,617 0,816 1,061 1,89 2,92 4,30 6,96 9,92 3 0,137 0,277 0,584 0,765 0,978 1,64 2,35 3,18 4,54 5,84 4 0,134 0,271 0,569 0,741 0,941 1,53 2,13 2,78 3,75 4,60 5 0,132 0,267 0,559 0,727 0,920 1,48 2,02 2,57 3,36 4,03 6 0,131 0,265 0,553 0,718 0,906 1,44 1,94 2,45 3,14 3,71 7 0,130 0,263 0,549 0,711 0,896 1,42 1,90 2,36 3,00 3,50 8 0,130 0,262 0,546 0,706 0,889 1,40 1,86 2,31 2,90 3,36 9 0,129 0,261 0,543 0,703 0,883 1,38 1,83 2,26 2,82 3,25 10 0,129 0,260 0,542 0,700 0,879 1,37 1,81 2,23 2,76 3,17 11 0,129 0,260 0,540 0,697 0,876 1,36 1,80 2,20 2,72 3,11 12 0,128 0,259 0,539 0,695 0,873 1,36 1,78 2,18 2,68 3,06 13 0,128 0,259 0,538 0,694 0,870 1,35 1,77 2,16 2,65 3,01 14 0,128 0,258 0,537 0,692 0,868 1,34 1,76 2,14 2,62 2,98 15 0,128 0,258 0,536 0,691 0,866 1,34 1,75 2,13 2,60 2,95 16 0,128 0,258 0,535 0,690 0,865 1,34 1,75 2,12 2,58 2,92 17 0,128 0,257 0,534 0,689 0,863 1,33 1,74 2,11 2,57 2,90 18 0,127 0,257 0,534 0,688 0,862 1,33 1,73 2,10 2,55 2,88 19 0,127 0,257 0,533 0,688 0,861 1,33 1,73 2,09 2,54 2,86 20 0,127 0,257 0,533 0,687 0,860 1,32 1,72 2,09 2,53 2,84 21 0,127 0,257 0,532 0,686 0,859 1,32 1,72 2,08 2,52 2,83 22 0,127 0,256 0,532 0,686 0,858 1,32 1,72 2,07 2,51 2,82 23 0,127 0,256 0,532 0,685 0,858 1,32 1,71 2,07 2,50 2,81 24 0,127 0,256 0,531 0,685 0,857 1,32 1,71 2,06 2,49 2,80 25 0,127 0,256 0,531 0,684 0,856 1,32 1,71 2,06 2,48 2,79 26 0,127 0,256 0,531 0,684 0,856 1,32 1,71 2,06 2,48 2,78 27 0,127 0,256 0,531 0,684 0,855 1,31 1,70 2,05 2,47 2,77 28 0,127 0,256 0,530 0,683 0,855 1,31 1,70 2,05 2,47 2,76 29 0,127 0,256 0,530 0,683 0,854 1,31 1,70 2,04 2,46 2,76 30 0,127 0,256 0,530 0,683 0,854 1,31 1,70 2,04 2,46 2,75 40 0,126 0,255 0,529 0,681 0,851 1,30 1,68 2,02 2,42 2,70 60 0,126 0,254 0,527 0,679 0,848 1,30 1,67 2,00 2,39 2,66 120 0,126 0,254 0,526 0,677 0,845 1,29 1,66 1,98 2,36 2,62 ∞ 0,126 0,253 0,524 0,674 0,842 1,28 1,645 1,96 2,33 2,58

Page 190: APLICATII NUMERICE DE STATISTICA IN FARMACIE SI  · PDF fileSe spune, în acest caz, c:

Anexa II

188

Page 191: APLICATII NUMERICE DE STATISTICA IN FARMACIE SI  · PDF fileSe spune, în acest caz, c:

Anexa III

189

Tabele pentru 95,0F

2

ν

1 2 3 4 5 6 7 8 9 10

1 161 200 216 225 230 234 237 239 241 242 2 18,5 19,0 19,2 19,3 19,3 19,4 19,4 19,4 19,4 19,4 3 10,1 9,55 9,28 9,12 9,01 8,94 8,89 8,85 8,81 8,79 4 7,71 6,94 6,59 6,39 6,26 6,16 6,09 6,04 6,00 5,96 5 6,61 5,79 5,41 5,19 5,05 4,95 4,88 4,82 4,77 4,74 6 5,99 5,14 4,76 4,53 4,39 4,28 4,21 4,15 4,10 4,06 7 5,59 4,74 4,35 4,12 3,97 3,87 3,79 3,73 3,68 3,64 8 5,32 4,46 4,07 3,84 3,69 3,58 3,50 3,44 3,39 3,35 9 5,12 4,26 3,86 3,63 3,48 3,37 3,29 3,23 3,18 3,14

10 4,96 4,10 3,71 3,48 3,33 3,22 3,14 3,07 3,02 2,98 11 4,84 3,98 3,59 3,36 3,20 3,09 3,01 2,95 2,90 2,85 12 4,75 3,89 3,49 3,26 3,11 3,00 2,91 2,85 2,80 2,75 13 4,67 3,81 3,41 3,18 3,03 2,92 2,83 2,77 2,71 2,67 14 4,60 3,74 3,34 3,11 2,96 2,85 2,76 2,70 2,65 2,60 15 4,54 3,68 3,29 3,06 2,90 2,79 2,71 2,64 2,59 2,54 16 4,49 3,63 3,24 3,01 2,85 2,74 2,66 2,59 2,54 2,49 17 4,45 3,59 3,20 2,96 2,81 2,70 2,61 2,55 2,49 2,45 18 4,41 3,55 3,16 2,93 2,77 2,66 2,58 2,51 2,46 2,41 19 4,38 3,52 3,13 2,90 2,74 2,63 2,54 2,48 2,42 2,38 20 4,35 3,49 3,10 2,87 2,71 2,60 2,51 2,45 2,39 2,35 21 4,32 3,47 3,07 2,84 2,68 2,57 2,49 2,42 2,37 2,32 22 4,30 3,44 3,05 2,82 2,66 2,55 2,46 2,40 2,34 2,30 23 4,28 3,42 3,03 2,80 2,64 2,53 2,44 2,37 2,32 2,27 24 4,26 3,40 3,01 2,78 2,62 2,51 2,42 2,36 2,30 2,25 25 4,24 3,39 2,99 2,76 2,60 2,49 2,40 2,34 2,28 2,24 26 4,23 3,37 2,98 2,74 2,59 2,47 2,39 2,32 2,27 2,22 27 4,21 3,35 2,96 2,73 2,57 2,46 2,37 2,31 2,25 2,20 28 4,20 3,43 2,95 2,71 2,56 2,45 2,36 2,29 2,24 2,19 29 4,18 3,33 2,93 2,70 2,55 2,43 2,35 2,28 2,22 2,18 30 4,17 3,32 2,92 2,69 2,53 2,42 2,33 2,27 2,21 2,16 40 4,08 3,23 2,84 2,61 2,45 2,34 2,25 2,18 2,12 2,08 60 4,00 3,15 2,76 2,53 2,37 2,25 2,17 2,10 2,04 1,99 120 3,92 3,07 2,68 2,45 2,29 2,18 2,09 2,02 1,96 1,91 ∞ 3,84 3,00 2,60 2,37 2,21 2,10 2,01 1,94 1,88 1,83

Page 192: APLICATII NUMERICE DE STATISTICA IN FARMACIE SI  · PDF fileSe spune, în acest caz, c:

Anexa III

190

2

ν

12 15 20 24 30 40 60 120 ∞

1 244 246 248 249 250 251 252 253 254 2 19,4 19,4 19,5 19,5 19,5 19,5 19,5 19,5 19,5 3 8,74 8,70 8,66 8,64 8,62 8,59 8,57 8,55 8,53 4 5,91 5,86 5,80 5,77 5,75 5,72 5,69 5,66 5,63 5 4,68 4,62 4,56 4,53 4,50 4,46 4,43 4,40 4,37 6 4,00 3,94 3,87 3,84 3,81 3,77 3,74 3,70 3,67 7 3,57 3,51 3,44 3,41 3,38 3,34 3,30 3,27 3,23 8 3,28 3,22 3,15 3,12 3,08 3,04 3,01 2,97 2,93 9 3,07 3,01 2,94 2,90 2,86 2,83 2,79 2,75 2,71

10 2,91 2,85 2,77 2,74 2,70 2,66 2,62 2,58 2,54 11 2,79 2,72 2,65 2,61 2,57 2,53 2,49 2,45 2,40 12 2,69 2,62 2,54 2,51 2,47 2,43 2,38 2,34 2,30 13 2,60 2,53 2,46 2,42 2,38 2,34 2,30 2,25 2,21 14 2,53 2,46 2,39 2,35 2,31 2,27 2,22 2,18 2,13 15 2,48 2,40 2,33 2,29 2,25 2,20 2,16 2,11 2,07 16 2,42 2,35 2,28 2,24 2,19 2,15 2,11 2,06 2,01 17 2,38 2,31 2,23 2,19 2,15 2,10 2,06 2,01 1,96 18 2,34 2,27 2,19 2,15 2,11 2,06 2,02 1,97 1,92 19 2,31 2,23 2,16 2,11 2,07 2,03 1,98 1,93 1,88 20 2,28 2,20 2,12 2,08 2,04 1,99 1,95 1,90 1,84 21 2,25 2,18 2,10 2,05 2,01 1,96 1,92 1,87 1,81 22 2,23 2,15 2,07 2,03 1,98 1,94 1,89 1,84 1,78 23 2,20 2,13 2,05 2,01 1,96 1,91 1,86 1,81 1,76 24 2,18 2,11 2,03 1,98 1,94 1,89 1,84 1,79 1,73 25 2,16 2,09 2,01 1,96 1,92 1,87 1,82 1,77 1,71 26 2,15 2,07 1,99 1,95 1,90 1,85 1,80 1,75 1,69 27 2,13 2,06 1,97 1,93 1,88 1,84 1,79 1,73 1,67 28 2,12 2,04 1,96 1,91 1,87 1,82 1,77 1,71 1,65 29 2,10 2,03 1,94 1,90 1,85 1,81 1,75 1,70 1,64 30 2,09 2,01 1,93 1,89 1,84 1,79 1,74 1,68 1,62 40 2,00 1,92 1,84 1,79 1,74 1,69 1,64 1,58 1,51 60 1,92 1,84 1,75 1,70 1,65 1,59 1,53 1,47 1,39 120 1,83 1,75 1,66 1,61 1,55 1,50 1,43 1,35 1,25 ∞ 1,75 1,67 1,57 1,52 1,46 1,39 1,32 1,22 1,00

Page 193: APLICATII NUMERICE DE STATISTICA IN FARMACIE SI  · PDF fileSe spune, în acest caz, c:

Anexa IV

191

Tabele 2χ

Aria Numar grade de libertate 0,025 0,950 0,975 0,990 1 0 3,842 5,024 6,635 2 0,0501 5,992 7,378 9,210 3 0,216 7,815 9,348 11,345 4 0,484 9,488 11,143 13,277 5 0,831 11,071 12,833 15,086 6 1,237 12,592 14,449 16,812 7 1,690 14,067 16,013 18,475 8 2,180 15,507 17,535 20,090 9 2,700 16,919 19,023 21,666 10 3.247 18,307 20,483 23,209 11 3,816 19,675 21,920 24,725 12 4,404 21,026 23,337 26,217 13 5,009 22,362 24,736 27,688 14 5,629 23,685 26,119 29,141 15 6,262 24,996 27,488 30,578 16 6,908 26,296 28,845 32,000 17 7,564 27,587 30,191 33,409 18 8,231 28,869 31,526 34,805 19 8,907 30,144 32,852 36,191 20 9,591 31,410 34,170 37,566 21 10,283 32,671 35,479 38,932 22 10,982 33,924 36,781 40,289 23 11,689 35,173 38,076 41,638 24 12,401 36,415 39,364 42,980 25 13,120 37,653 40,647 44,314 26 13,844 38,885 41,923 45,642 27 14,573 40,113 43,195 46,963 28 15,308 41,337 44,461 48,278 29 16,047 42,557 45,722 49,588 30 16,791 43,773 46,979 50,892

Page 194: APLICATII NUMERICE DE STATISTICA IN FARMACIE SI  · PDF fileSe spune, în acest caz, c:

Anexa IV

192

Page 195: APLICATII NUMERICE DE STATISTICA IN FARMACIE SI  · PDF fileSe spune, în acest caz, c:

Anexa V

193

Tabel 1. Valorile “critice” ale celor doua sume de ranguri necesare pentru nivelul de semnificatie 5%, respectiv 1%, pentru N valori

Numarul de subiecti N

05,0=α 01,0=α

6 0 - 7 2 - 8 3 0 9 5 1

10 8 3 11 10 5 12 13 7 13 17 10 14 21 13 15 25 16 16 30 19 17 35 23 18 40 28 19 46 32 20 52 37

Tabel 2. Intervalele de incredere folosind testul de rang Wilcoxon Rangul limitei inferioare Rangul limitei superioare Numarul de subiecti

(N) 95% 90% 95% 90% 6 1 3 21 19 7 3 4 26 25 8 4 6 33 31 9 6 9 40 37

10 9 11 47 45 11 11 14 56 53 12 14 18 65 61 13 18 22 74 70 14 22 26 84 80 15 26 31 95 90 16 30 36 107 101 17 35 42 119 112 18 41 48 131 124 19 47 54 144 137 20 53 61 158 150 21 59 68 173 164 22 66 76 188 178 23 74 84 203 193 24 82 93 219 208

Page 196: APLICATII NUMERICE DE STATISTICA IN FARMACIE SI  · PDF fileSe spune, în acest caz, c:

Anexa V

194

Tabel 3: Coeficientul de corelatie de rang Spearman

n 4 5 6 7 8 9 10 11 12 13 0,10 0,99 0,87 0,77 0,69 0,64 0,59 0,56 0,53 0,51 0,49 0,05 - 0,95 0,85 0,78 0,73 0,68 0,64 0,61 0,59 0,56 0,02 - 0,99 0,87 0,87 0,82 0,77 0,73 0,70 0,67 0,64

α

0,01 - - 0,91 0,91 0,86 0,82 0,79 0,75 0,72 0,70

Page 197: APLICATII NUMERICE DE STATISTICA IN FARMACIE SI  · PDF fileSe spune, în acest caz, c:

Anexa VI

195

Criteriul Dixon pentru respingerea outliers

Nivel de semnificatie k 5% 1%

3 ( )( )1

1210 XX

XXrk −

−=

daca cea mai mica valoare este suspecta

0.941 0.988

4 0.765 0.889 5 ( )

( )1

110 XX

XXrk

kk−

−= −

daca cea mai mare valoare este suspecta

0.642 0.780

6 0.560 0.698 7 0.507 0.637 8 ( )

( )11

1211 XX

XXrk −

−=−

daca cea mai mica valoare este suspecta

0.554 0.683

9 0.512 0.635 10 ( )

( )2

111 XX

XXrk

kk−

−= −

daca cea mai mare valoare este suspecta

0.477 0.597

11 ( )( )11

1321 XX

XXrk

k−

−=−

daca cea mai mica valoare este suspecta

0.576 0.679

12 0.546 0.642 13 ( )

( )2

221 XX

XXrk

kk−

−= −

daca cea mai mare valoare este suspecta

0.521 0.615

14 ( )( )12

1322 XX

XXrk −

−=−

daca cea mai mica valoare este suspecta

0.546 0.641

15 0.525 0.616 16 ( )

( )3

222 XX

XXrk

kk−

−= −

daca cea mai mare valoare este suspecta

0.507 0.595

17 0.490 0.577 18 0.475 0.561 19 0.462 0.547 20 0.450 0.535 21 0.440 0.524 22 0.430 0.514 23 0.421 0.505 24 0.413 0.497 25 0.406 0.489

Page 198: APLICATII NUMERICE DE STATISTICA IN FARMACIE SI  · PDF fileSe spune, în acest caz, c:

Anexa VI

196

Valorile critice pentru t ca test bilateral la nivelul de semnificatie

5 % pentru eliminarea valorilor discordante:

Valoare T Valoare T 3 1.155 15 2.549 4 1.481 16 2.585 5 1.715 17 2.620 6 1.887 18 2.651 7 2.020 19 2.681 8 2.126 20 2.709 9 2.215 25 2.822 10 2.290 30 2.908 11 2.355 35 2.979 12 2.412 40 3.036 13 2.462 50 3.128 14 2.507 100 3.383

Page 199: APLICATII NUMERICE DE STATISTICA IN FARMACIE SI  · PDF fileSe spune, în acest caz, c:

IV. BIBLIOGRAFIE

197

1. W.J.Westlake: Use of confidence intervals in analysis of comparative biovalability trials, J. Pharm. Sci. , 61 (8), 1340 – 1, 1972. 2. F.Wilcoxon: Individual comparisons by ranking methods, Biometrics Bul.,180-83,1947 3. W.H.Kruskal, W.Allen Wallis: Use of ranks in one-criterion analysis of variance, J. Am. Stat. Assoc.,47,583-621,1952 4. Hollander, Wolfe DA; Non parametric statistical methods, J.Wiley, New York, 1973 5. Hollander, Wolfe DA; Non parametric statistical methods, J.Wiley, New York, 1973 6. Chow, S.C. & Liu, J.P. (1992) Design and analysis of bioavailability and bioequivalence studies. New York, Marcel Dekker (cap. 3) [1]. 7. Saporta, C. (1990) Probabilité, Analyse des données et statistique. Paris, Ed. Technip (cap. 15) [2]. 8. Vaduva, I. (1970) Analiză dispersională. Bucureşti, Ed. Tehnică (cap. 4) [3]. 9. K.A.Brownlee, Statistical Theory and metodology in Science and Engineering, J. Wiley, New – York, 1960 10. D. Ceausescu, Tratarea statstica a datelor chimico – analitice, Ed. Tehnica, Bucuresti, 1973 11. M. Tiron, teoria erorilor de masurare si metoda celor mai mici patrate, Ed. Tehnica, Bucuresti, 1972 12. F. Gremy, D. Salmon, Bases statistiques pur la recherchemedicale et biologique, Dunod, Paris, 1969 13. M. R. Spiegel, Probability and statistique, McGraw – Hill, New – York, 1980 14. D. Ceausescu, Utilizarea statisticii matematice in chimia analitica, Ed. Tehnica, Bucuresti, 1980 15. M. Iosifescu, T. Postelnicu, Curs de biomatematica, Univ. Ecologica, Bucuresti, 1990 16. M. Iosifescu, Gh. Mihoc, R. Teodorescu, Teoria probabilitatilor si statistica matematica, Ed. Tehnica, Bucuresti, 1966 17. S. Bolton, Statistics, in Remington: The Science and Practice of Pharmacy, 9 – th ed., Mark publ., Easton, Pennsylvania, 1995 18. United States Pharmacopoeia, ed. XXIII, cap. Statistical Procedures for Bioequivalence Studies Using a Standard Two – treatment Crossover design, 1995 19. P. G. Welling, F.L.S. tse, S. Dighe, Pharmaceutical Bioequivalence, cap. 3, C.M. Metzler: Statistical criteria, M. Dekker, New – York, 1991

Page 200: APLICATII NUMERICE DE STATISTICA IN FARMACIE SI  · PDF fileSe spune, în acest caz, c:

IV. BIBLIOGRAFIE

198

20. V.W.Steinijans, D. Hauschke, Update on the statistical analysis of bioequivalence studies, Int. J.Clin.Pharmacol. Ther. Toxicol,. 28(3), 105 – 110, 1990 21. M. Rowland (ed), Variability and Drug Therapy: Description, Estimation and Control, Raven Press, New York, 1985 22. S.C. Chow, J.P.Liu, Design and Analysis of Biovailability and Bioequivalence Studies, M. Dekker, London, New York, 1992 23. A. Rescigno. A. Marzo, U. Thyroff – Friesinger, A new measure of bioequivalence, 1 –st European Congress of Pharmacology, Milano, june 1995, poster nr. 19 24. A Marzo, Open questions in bioequivalence, 1 –st European Congress of Pharmacology, Milano, june 1995, poster nr. 18 25. E. Beyssac, C. Lauro. Marty, H-l Chabard, J-M Aiache, Study of bioequivalence metrics, 6-th European Biopharmaceutics and Pharmacokinetics, Atena, aprilie 1997 26. C. Mircioiu, V. Voicu: Degenerated, solutions of pharmacokinetics models for some lipophilic drugs, Canad. J. Physiol, Pharmacol. 72 (suppl.1), 305, 1994 27. C. Mircioiu, V. Voicu, M. Jiquidi: Mathematical algoritms and computer programs as source of variability in population drugs, 1-st Congress of the European Association for Clinical Pharmacology and Therapeutics, September, 27-30, 1995, Paris 28. C. Mircioiu: „Mathematical variability” in pharmacokinetics, 6-th Europ. Congress of Biopharmaceutics and Pharmacokinetics, Atena, 22-24 April 1996, Europ. J. Drug Metab. Pharmacokin. (special issue), abstract 371

Page 201: APLICATII NUMERICE DE STATISTICA IN FARMACIE SI  · PDF fileSe spune, în acest caz, c:

CUPRINS

1. Elemente de teoria probabilitatilor 1 2. Variabile aleatoare 11 3. Distributii de probabilitate 23 4. Estimarea intervalelor de incredere 35 5. Verificarea ipotezelor statistice 49 6. Teste neparametrice 81 7. Regresia liniara 105 8. Metode statistice de analiza factorilor de variabilitate in

experimentul biologic (ANOVA) 123

9. Estimarea bioechivalentei adoua medicamente 147 10. Teste statistice de discordanta 157 11. Distributia binomiala 163 12. Puterea testului. Calculul numarului de voluntari 175 13. Studii epidemiologice 179 14. Tabele pentru z 185 15. Tabele pentru t 187 16. Tabele pentru 95,0F 189 17. Tabele 2χ 191 18. Intervale de incredere folosind testul Wilcoxon 193 19. Criteriul Dixon pentru respingerea outiers 195 20. Bibliografie 197 21. Cuprins 199

199

Page 202: APLICATII NUMERICE DE STATISTICA IN FARMACIE SI  · PDF fileSe spune, în acest caz, c:

200