lp 5 excel 2009

5
LP 5 EXCEL – Testul t în Data Analysis Realizaţi următorul tabel în MS Excel : Nr.c rt. NUME Sex Vârs Glicem ie – mom. 0 Glicem ie – 3 luni Glicem ie – 6 luni Asigur at CAS 1 AB M 35 132 125 119 T 2 CA M 24 133 133 106 T 3 CD F 22 118 113 109 F 4 DE F 53 111 107 97 T 5 MN M 20 112 101 95 T 6 MA F 37 130 122 97 T 7 MD F 29 125 115 105 T 8 NB M 56 138 121 109 F 9 NC F 27 129 110 108 F 10 DC F 21 110 115 105 F 11 TR F 36 113 111 99 T 12 AT M 38 145 133 129 F 13 LD F 29 138 132 130 T 14 GF M 44 132 130 131 F 15 DS M 42 130 126 128 T 16 AC F 32 125 120 105 F 17 DM F 25 124 124 116 T 18 SG F 29 122 111 107 F 19 NR M 39 127 114 108 F 20 TS M 40 118 108 108 T 21 CA M 60 121 115 98 T 22 CD F 58 136 130 128 T 23 DE M 56 118 110 105 T 24 MN M 55 116 109 99 T 25 MA F 45 135 128 126 T 26 MD M 30 120 113 107 F 27 NB M 18 127 120 102 T 28 NC F 31 129 118 105 T 29 DC F 24 126 115 103 T 30 TR M 22 132 116 96 T 31 AT M 53 133 124 116 F 32 LD M 20 131 122 113 T 33 GF M 37 139 123 111 F 34 DS M 29 133 121 108 T 35 AC F 56 128 121 109 F 36 DM F 27 127 126 116 T 37 SG M 21 124 122 113 T 38 NR M 36 123 119 109 T 39 TS M 38 145 135 135 T 40 CA M 29 131 130 132 T 41 CD M 44 130 128 118 T 42 DE M 42 124 120 119 T 43 MN M 32 119 108 106 F

Upload: alynutza-geanina

Post on 23-Dec-2015

220 views

Category:

Documents


5 download

DESCRIPTION

lp

TRANSCRIPT

Page 1: LP 5 EXCEL 2009

LP 5 EXCEL – Testul t în Data Analysis

Realizaţi următorul tabel în MS Excel :Nr.crt. NUME Sex Vârstă Glicemie

– mom. 0Glicemie – 3 luni

Glicemie – 6 luni

Asigurat CAS

1 AB M 35 132 125 119 T2 CA M 24 133 133 106 T3 CD F 22 118 113 109 F4 DE F 53 111 107 97 T5 MN M 20 112 101 95 T6 MA F 37 130 122 97 T7 MD F 29 125 115 105 T8 NB M 56 138 121 109 F9 NC F 27 129 110 108 F10 DC F 21 110 115 105 F11 TR F 36 113 111 99 T12 AT M 38 145 133 129 F13 LD F 29 138 132 130 T14 GF M 44 132 130 131 F15 DS M 42 130 126 128 T16 AC F 32 125 120 105 F17 DM F 25 124 124 116 T18 SG F 29 122 111 107 F19 NR M 39 127 114 108 F20 TS M 40 118 108 108 T21 CA M 60 121 115 98 T22 CD F 58 136 130 128 T23 DE M 56 118 110 105 T24 MN M 55 116 109 99 T25 MA F 45 135 128 126 T26 MD M 30 120 113 107 F27 NB M 18 127 120 102 T28 NC F 31 129 118 105 T29 DC F 24 126 115 103 T30 TR M 22 132 116 96 T31 AT M 53 133 124 116 F32 LD M 20 131 122 113 T33 GF M 37 139 123 111 F34 DS M 29 133 121 108 T35 AC F 56 128 121 109 F36 DM F 27 127 126 116 T37 SG M 21 124 122 113 T38 NR M 36 123 119 109 T39 TS M 38 145 135 135 T40 CA M 29 131 130 132 T41 CD M 44 130 128 118 T42 DE M 42 124 120 119 T43 MN M 32 119 108 106 F44 MA F 25 129 115 114 T45 MD M 29 128 120 109 F46 NB M 39 127 125 108 T47 NC F 40 129 126 112 T48 DC M 24 132 128 113 T49 TR M 22 127 120 117 T

Page 2: LP 5 EXCEL 2009

50 AT M 53 128 115 116 T1. Stabiliţi dacă există diferenţe semnificative statistic între valorile variabilelor GLICEMIE – mom. 0,

GLICEMIE – 3 luni, GLICEMIE – 6 luni şi apreciaţi astfel dacă evoluţia bolnavilor a fost sau nu favorabilă în timp.

Având în vedere că se lucrează cu variabile cantitative, pentru a testa dacă există sau nu diferenţe semnificative statistic între valorile lor se va folosi Testul t.

Din cele 3 variante disponibile, se va folosi obligatoriu „t-Test: Paired Two Sample For Means”, deoarece aceasta este varianta proiectată pentru cazul când se doreşte compararea valorilor unei variabile pe acelaşi eşantion de pacienţi, în contexte diferite – de obicei la momente diferite în timp – pentru a se testa, de exemplu, eficienţa unui tratament. Testul t în această formă determină dacă valorile variabilei urmărite la cele două momente în timp provin din populaţii cu media aritmetică a variabilei egală. Nu este necesară verificarea unor condiţii privind varianţa parametrului în cele două populaţii.

Se selectează comanda Data / Data Analysis / t-Test: Paired Two Sample For Means:

Rezultatele sunt afişate după cum urmează:

Pentru valorile Glicemiei la momentul 0 şi după 3 luni sunt calculaţi următorii indicatori:- Media aritmetică, varianţa şi numărul de cazuri;- Coeficientul Pearson de corelaţie între cele 2 valori;- Hypothesized Mean Difference = 0: formularea ipotezei nule – se presupune că mediile pentru cele 2

variabile sunt egale, diferenţa între ele fiind 0;- Valoarea statisticii t calculate, t Stat = 10.45548823;

Se specifică şirul de celule în care se află valorile primei variabile (mom. 0).

Se specifică şirul de celule în care se află valorile celei de a doua variabile (la 3 luni).

Se bifează când în prima celulă din şir se află numele variabilei.

Se precizează locul de afişare a rezultatelor – pe foaia de calcul curentă, pe o nouă foaie de calcul sau chiar într-un registru de calcul nou.

Page 3: LP 5 EXCEL 2009

- P(T<=t) one-tail: probabilitatea de a se observa o valoare T = t real mai mică decât t = t Stat (când t Stat este un număr pozitiv) sau mai mare decât t Stat (când t Stat este un număr negativ) în ipoteza în care mediile variabilei Glicemie la mom. 0 şi după 3 luni sunt egale. Dacă această probabilitate este mai mică de 0.05 (5%), se poate considera că ipoteza de la care s-a pornit, că mediile variabilei Glicemie la cele 2 momente sunt egale, este INFIRMATĂ, deci EXISTĂ DIFERENŢE SEMNIFICATIVE STATISTIC ÎNTRE VALORILE MEDIEI LA CELE 2 MOMENTE ÎN TIMP, respectiv media glicemiei a scăzut în timp semnificativ, evoluţia pacienţilor fiind FAVORABILĂ*.

- t Critical one-tail: valoarea limită a statisticii t, pentru care P(t Stat > = t Critic) = 0.05.- P(T<=t) two-tail: probabilitatea de a se observa o valoare mai mică în valoare absolută decât t Stat în ipoteza

în care mediile variabilei Glicemie la mom. 0 şi după 3 luni sunt egale – este dublul valorii P(T<=t) one-tail.- t Critical two-tail: valoarea limită a statisticii t, pentru care P(t Stat > = t Critic) = 0.05.

În cazul nostru, P(T<=t) one-tail = 2.247E-14 0.000, deci este < 0.05, deci diferenţele între medii sunt semnificative statistic.

2. Stabiliţi dacă există diferenţe semnificative între valorile Glicemiei la mom. 0 între femei şi bărbaţi. Analog pentru valorile glicemiei la 3 luni şi la 6 luni, pentru a determina dacă evoluţia pacienţilor este diferenţiată între femei şi bărbaţi.

Având în vedere că se lucrează cu variabile cantitative, pentru a testa dacă există sau nu diferenţe semnificative statistic între valorile lor se va folosi Testul t.

De această dată se lucrează evident cu eşantioane diferite pentru care se înregistrează valorile Glicemiei (bărbaţii şi femeile din tabel), deci se va folosi testul t : Two-Sample; trebuie însă determinat care dintre cele 2 variante ale acestuia se va folosi: varianta „t-Test: Two-Sample Assuming Equal Variances” sau varianta „t-Test: Two-Sample Assuming Unequal Variances”. Prima variantă se foloseşte în cazul în care ştim că cele două eşantioane provin din populaţii cu varianţe egale (testul t homoscedastic), în timp ce a doua se foloseşte în cazul în care cele două eşantioane provin din populaţii de origine cu varianţe inegale (testul t heteroscedastic).

Având în vedere că de data aceasta valorile Glicemiei sunt în aceeaşi coloană, şi sunt amestecate între ele, mai întâi va trebui să sortăm tabelul după variabila Sex, după care putem aplica testele statistice.

Aşadar, pentru a putea decide ce variantă de test t se foloseşte în situaţia noastră, vom verifica mai întâi dacă cele două eşantioane au varianţele egale sau nu. Pentru aceasta, se va folosi un alt test statistic, şi anume testul F de egalitate a varianţelor.

Se selectează comanda Data / Data Analysis / F-Test Two Sample for Variances:

Rezultatele sunt afişate după cum urmează:

Se specifică şirul de celule în care se află valorile primei variabile – Glicemia la femei.

Se specifică şirul de celule în care se află valorile primei variabile – Glicemia la bărbaţi.

Nu se bifează, deoarece şirurile de valori de data aceasta nu au nume diferite.

Se precizează locul de afişare a rezultatelor – pe foaia de calcul curentă, pe o nouă foaie de calcul sau chiar într-un registru de calcul nou.

Page 4: LP 5 EXCEL 2009

Sunt calculaţi următorii indicatori:

- Media, varianţa şi numărul de observaţii pentru cele două şiruri de valori;- Valoarea statisticii calculate F = 1.020436697;- P(F<=f) one-tail: probabilitatea de a se observa o valoare F = F real mai mică decât F = F Stat (când F Stat

este un număr pozitiv) sau mai mare decât F Stat (când F Stat este un număr negativ) în ipoteza în care varianţele variabilei Glicemie la femei şi bărbaţi sunt egale. Dacă această probabilitate este mai mică de 0.05 (5%), se poate considera că ipoteza de la care s-a pornit, că varianţele variabilei Glicemie la femei şi bărbaţi, sunt egale, este INFIRMATĂ, diferenţele între ele fiind semnificative statistic.În cazul nostru P(F<=f) one-tail = 0.466980 > 0.05, deci ipoteza nulă este CONFIRMATĂ, VARIANŢELE

SUNT EGALE.

În continuare este clar că vom folosi testul t pentru varianţe egale, adică: Se selectează comanda Data / Data Analysis / t-Test Two-Sample Assuming Equal Variances:

Rezultatele sunt afişate după cum urmează:

Interpretarea lor este similară cu cea de la testul t pentru eşantioane perechi.Observăm că t Stat = -1.2089, P(T<=t) one-tail = 0.116297973 > 0.05, deci ipoteza nulă este

CONFIRMATĂ, diferenţele între valorile medii ale glicemiei la femei şi bărbaţi sunt NESEMNIFICATIVE STATISTIC.

Se specifică şirul de celule în care se află valorile primei variabile – Glicemia la femei.

Se specifică şirul de celule în care se află valorile primei variabile – Glicemia la bărbaţi.

Nu se bifează, deoarece şirurile de valori de data aceasta nu au nume diferite.Se precizează locul de afişare a rezultatelor – pe foaia de calcul curentă, pe o nouă foaie de calcul sau chiar într-un registru de calcul nou.