mg_lp05_2014

15
MG - Lucrarea practică 5 2014/2015 UMF “Carol Davila” – Informatică Medicală şi Biostatistică 58 Lucrarea practică 5 Indicaţii generale : Un important scop al lucrării practice este crearea de fişiere de tip chestionar (sau view-uri) pentru introducerea datelor în fişierele create în EpiInfo 2005. Acesta este un soft specific unor prelucrări statistice de date, utilizat în special în epidemiologie. Avantajul principal al acestui soft constă în faptul că nu impune cheltuieli majore, în condiţiile în care, cu ajutorul său, se pot obţine majoritatea rezultatelor prelucrărilor de date cu care ne întâlnim în cercetarea medicală. Punctul său forte, pentru care este recomandată folosirea sa, este posibilitatea creării unor chestionare care să nu permită, din start, introducerea de date eronate flagrant. Punctul său slab îl constituie slaba calitate a diagramelor pe care le poate crea. În această lucrare practică: a) vă veţi reaminti principalele capabilităţi ale unei aplicaţii de calcul tabelar (Microsoft Excel), şi anume cele de creare de diagrame şi cele de efectuare rapidă de calcule statistice; b) veţi aborda un prim exemplu de felul în care se formează opinii ştiinţifice, bazate pe date puţine, şi de felul în care ele se pot valida „statistic”; c) veţi crea fişiere de tip baze de date, chestionare în interiorul lor, apoi veţi introduce înregistrări; d) veţi începe să folosiţi modulul Analyze Data al aplicaţiei Epi Info; Teme 22: controlul detaliat al diagramelor Excel 23: calculul intervalelor de încredere în Excel 24: crearea chestionarelor în Epi Info 25: introducerea datelor în Epi Info 26: analiza statistică primară a datelor din fişiere Softul ce va fi utilizat în lucrarea practică: EpiInfo 2005, Excel

Upload: ciprian-iulian

Post on 25-Sep-2015

214 views

Category:

Documents


2 download

DESCRIPTION

medic

TRANSCRIPT

  • MG - Lucrarea practic 5 2014/2015 UMF Carol Davila Informatic Medical i Biostatistic

    58

    Lucrarea practic 5

    Indicaii generale:

    Un important scop al lucrrii practice este crearea de fiiere de tip chestionar (sau view-uri) pentru introducerea datelor n fiierele create n EpiInfo 2005. Acesta este un soft specific unor prelucrri statistice de date, utilizat n special n epidemiologie.

    Avantajul principal al acestui soft const n faptul c nu impune cheltuieli majore, n condiiile n care, cu ajutorul su, se pot obine majoritatea rezultatelor prelucrrilor de date cu care ne ntlnim n cercetarea medical.

    Punctul su forte, pentru care este recomandat folosirea sa, este posibilitatea crerii unor chestionare care s nu permit, din start, introducerea de date eronate flagrant.

    Punctul su slab l constituie slaba calitate a diagramelor pe care le poate crea.

    n aceast lucrare practic: a) v vei reaminti principalele capabiliti ale unei aplicaii de calcul tabelar

    (Microsoft Excel), i anume cele de creare de diagrame i cele de efectuare rapid de calcule statistice;

    b) vei aborda un prim exemplu de felul n care se formeaz opinii tiinifice, bazate pe date puine, i de felul n care ele se pot valida statistic;

    c) vei crea fiiere de tip baze de date, chestionare n interiorul lor, apoi vei introduce nregistrri;

    d) vei ncepe s folosii modulul Analyze Data al aplicaiei Epi Info;

    Teme 22: controlul detaliat al diagramelor Excel

    23: calculul intervalelor de ncredere n Excel

    24: crearea chestionarelor n Epi Info

    25: introducerea datelor n Epi Info

    26: analiza statistic primar a datelor din fiiere

    Softul ce va fi utilizat n lucrarea practic:

    EpiInfo 2005, Excel

  • UMF Carol Davila Informatic Medical i Biostatistic MG - Lucrarea practic 5 2014/2015

    59

    Tema 22: controlul detaliat al diagramelor Excel

    Cercettorii unei firme farmaceutice au imaginat un unguent (bazat pe un compus chimic nou) despre care cred c ar trebui s vindece mai rapid arsurile pielii. Unguentul a fost testat n laborator pe un numr de 7 oareci alei aleator dintre cei 16 de care dispunea laboratorul pentru aceste teste. (Tuturor celor 16 oareci li s-au provocat arsuri de piele, de graviti echivalente.)

    Pentru grupul celor 7 tratai au fost constatate urmtoarele durate de vindecare (n zile):

    9 4 3 19 10 2 14

    Pentru grupul de control al celor 9 netratai au fost constatate urmtoarele durate de vindecare (n zile):

    5 2 4 10 5 3 14 3 5

    Se poate afirma c tratamentul cu noul unguent grbete vindecarea arsurii? S utilizm aplicaia Excel pentru a-i explora posibilitile de a ne ajuta n a da

    rspunsuri justificate la ntrebri de tipul celei anterioare. Vei crea un fiier-carte de calcul denumit nume_UNGUENT.xls cu cel puin o foaie de

    calcul. Se recomand ca diagramele s NU fie plasate peste celulele foii de calcul, ci n foi separate!

    Redenumii prima foaie de calcul Arsuri i, n domeniul B2:B17, plasai una sub alta cele 16 durate de vindecare. n celula B1 vei plasa textul Durata de vindecare (n zile), iar n celula C1 textul Grupul.

    Alturat duratelor de vindecare, n domeniul C2:C17, plasai textele tratament sau control, dup caz.

    Coloana A o vei folosi pentru identificarea (numerotarea) cazurilor. Mai precis, n A1 vei plasa textul Individul nr., iar dedesubt vei plasa unul sub altul numerele 1, 2, ..., 16. (Reamintii-v cum se poate extinde, prin tragere de mner, o progresie aritmetic.)

    Poate c o reprezentare grafic a datelor ne va fi de ajutor. Cu Excel

    obinem repede o asemenea reprezentare; este suficient s selectm domeniul A1:B17 i s apelm comanda InserareDiagram.

    Probabil c diagrama cea mai potrivit pentru aceast situaie este cea cu bare orizontale. n etapele de control va trebui s prelum (n Clipboard) valorile seriei Individul nr. posibil prin tastarea combinaiei [Ctrl]+[C], apoi s-o eliminm, iar n final s plasm acele valori n caseta etichetelor axei X (prin

    lipire) a se vedea figura alturat. Recomandm realizarea diagramei pe

    o foaie separat, evitnd amestecul ntre grafic i calcule pe aceeai foaie de lucru. Denumii 16-1 foaia separat.

  • MG - Lucrarea practic 5 2014/2015 UMF Carol Davila Informatic Medical i Biostatistic

    - 92 -

    Durata de vindecare (n zile)

    0 2 4 6 8 10 12 14 16 18 20

    1

    2

    3

    4

    5

    6

    7

    8

    9

    10

    11

    12

    13

    14

    15

    16

    (zie)

    control

    tratament

    ncercai modificarea culorilor n care sunt afiate barele, de exemplu n rou pentru primele 7 bare (cele de jos) i n albastru pentru celelalte. Plasai de asemenea textele tratament i control colorate corespunztor, ca n figur.

    Duplicai foaia pe care ai depus diagrama, denumind 1-16 copia. ncercai, pe foaia 1-16, schimbarea ordinii de afiare a duratelor de vindecare (astfel nct barele orizontale tratament s apar deasupra celor control.

    Tema 23: calculul intervalelor de ncredere n Excel

    Compararea grafic, pe diagrame, este util atunci cnd vrem s transmitem rapid informaie privitorului, sau cazul nostru atunci cnd avem de-a face cu secvene lungi de numere, care se citesc cu dificultate. Din punct de vedere statistic, ar trebui s ncepem studiul nostru cu compararea mediilor celor dou grupuri. Mediile se obin uor, cu ajutorul funciei AVERAGE.

    Este ns de preferat s ncepem prin a organiza datele comparative pe foaia de calcul. De exemplu, s plasm n celula F1 textul Tratament, n celula G1 textul Control, n celula E2 textul Numr cazuri iar n celula E3 textul Medii.

    Chiar dac numrul de cazuri ne este cunoscut, recomandm obinerea sa cu ajutorul funciei COUNTIF. Activnd celula F2, apelai (comanda Inserare Funcie) aceast funcie din categoria celor statistice. Are dou argumente: domeniul datelor care ar trebui s fie C2:C17 i criteriul de selecie, care ar trebui s fie secvena de caractere tratament. ntruct aceast valoare se afl n cteva celule, printre care i C2, al doilea argument ar putea fi chiar C2.

    Analog, celula G2 ar trebui s aib drept coninut formula =COUNTIF(C2:C17,C17)

    Pentru calculul mediei vom face apel la funcia AVERAGE, i ea din categoria funciilor statistice. n celula F3 plasm formula (!)

    =AVERAGE(B2:B8)

  • UMF Carol Davila Informatic Medical i Biostatistic MG - Lucrarea practic 5 2014/2015

    - 93 -

    iar n celula G3 formula analoag. Dup o formatare adecvat a acestor dou celule, cernd afiarea cu 2 zecimale, ar trebui

    s obinem afiate valorile 8.71 respectiv 5.67. Cercettorii nu ar avea motive de optimism: n medie, durata de vindecare este mai mare

    pentru indivizii tratai cu unguent!

    Situaia de mai sus este excepional, de regul nu se ntmpl aa, dar nu trebuie excluse asemenea situaii!

    Copiai acum foaia Arsuri peste foaia a doua, pe care o vei denumi Corect. Copierea unei foi ntregi se face de asemenea cu tehnica de copiere/lipire, iar selectarea prealabil a ntregii foi se poate face prin apsarea butonului de col (aflat n stnga butoanelor A, B, C, ... care identific coloanele i deasupra butoanelor 1, 2, 3, ... care identific rndurile). Prin copiere/lipire au fost preluate toate formulele!

    nlocuii acum, n foaia Corect, datele din domeniul B2:B8 prin urmtoarele

    5 4 3 5 8 2 6

    De data aceasta durata medie de vindecare (pentru indivizii tratai) este de 4.71 zile, iar cercettorii pot afirma c unguentul este eficace n vindecarea arsurilor.

    Evident, aceast afirmaie va fi fcut la modul general, dar ea este bazat pe doar cteva cazuri constatate n laborator! Care sunt riscurile acceptrii acestei afirmaii ca fiind adevrat la modul general?

    Statistica ne nva s enunm afirmaii de forma: durata medie de vindecare la indivizii tratai este semnificativ mai mic dect la indivizii netratai. Dar cnd oare suntem ndreptii s facem asemenea afirmaii?

    Excel ne permite s calculm rapid ingredientele necesare justificrii unor asemenea afirmaii. Conform teoriei, ar trebui s obinem erorile standard ale celor dou medii, s identificm intervalele de ncredere (95%) i s constatm c cele dou intervale sunt disjuncte.

    Obinerea erorii standard a unei medii necesit mai multe calcule. Eroarea standard nu se obine direct, ci prin intermediul abaterii standard, care n Excel este dat de funcia STDEV. Formula este simpl:

    eroarea standard = abaterea standard / (numrul de indivizi)

    Odat obinut eroarea standard a mediei, intervalul de ncredere 95% pentru medie va fi:

    media eroarea standard * 1.96, media + eroarea standard * 1.96.

    Aadar, avem nevoie de medii (obinute cu AVERAGE), de abateri standard (obinute cu STDEV), i de numrul de indivizi (obinut cu COUNTIF).

    S organizm calculele n felul urmtor: n celula E4 s plasm textul Abateri standard, n celula E5 textul Erori standard, n E6 textul Extr. stng iar n E7 textul Extr. dreapt.

    Formulele de calcul pe care le vom introduce n coloana F vor fi, respectiv,

    =STDEV(B2:B8)

    =F4/SQRT(F2)

    =F3F5*1.96 =F3+F5*1.96

    n coloana G vom introduce formulele corespunztoare datelor de control, care au fost plasate n domeniul B9:B17.

  • MG - Lucrarea practic 5 2014/2015 UMF Carol Davila Informatic Medical i Biostatistic

    - 94 -

    Ar trebui s obinei intervalele de ncredere [3.25, 6.18] respectiv [3.14, 8.20]. Ele nu sunt disjuncte, astfel c statistica nu justific deloc afirmaia cercettorilor!

    Este momentul s atragem atenia asupra unui aspect extrem de important: duratele de vindecare nu ar trebui apreciate n medie, ntruct un singur caz aberant de lung ar putea schimba n mod esenial concluziile. Dimpotriv, aprecierea ar trebui s fie fcut dup mediane!

    Plasai n celula E8 textul Mediane, apoi n dreapta formulele de calcul, fcnd apel la funcia MEDIAN. Ar trebui s obinei, pentru ambele grupuri, mediana 5. Aceasta ar trebui s constituie un semnal de alarm privind incorectitudinea afirmaiei cercettorilor!

    Preluai n foaia a treia, prin copiere/lipire, coninutul foii Corect. Redenumii foaia a treia Ultima i, pe ea, efectuai urmtoarele modificri. Schimbai coninutul domeniului B8:B17 n urmtorul:

    5 7 6 11 6 9 14 6 10

    Ar trebui s constatai c mediile se modific sensibil, i c intervalele de ncredere 95% devin [3.25, 6.18] respectiv [6.27, 10.18].

    Se observ c cele dou intervale de ncredere sunt disjuncte, prin urmare pe aceste date putem accepta cu ncredere 95% ca adevrat afirmaia cercettorilor (sau a firmei de medicamente).

    Constatm i c medianele difer n mod esenial i, reamintim, acestea ar trebui s fie luate n consideraie n aprecierea validitii afirmaiei cercettorilor. Ar fi de dorit s dispunem de intervale de ncredere 95% pentru cele dou mediane. Din pcate, Excel nu ne poate ajuta n obinerea acestor intervale de ncredere; este nevoie de soft statistic specializat, care eventual s exploateze metode speciale cum ar fi tehnicile bootstrap.

    Salvai n aceast form cartea de calcul Excel, cu cele trei foi de calcul i dou grafice.

    Tema 24: crearea chestionarelor n Epi Info

    Epi Info este un pachet de programe destinat prelucrrii de date organizate sub form de chestionare i sistematizrii rezultatelor studiilor pentru a fi incluse n comunicri i rapoarte. Conceput n primul rnd pentru aplicaii n epidemiologie, Epi Info poate fi folosit cu succes n prelucrarea datelor din domeniul medical i din afara acestuia, pachetul incluznd faciliti de gestiune a datelor i de statistic de tipul celor oferite de programele SAS, SPSS, etc. faciliti cuprinse ntrun singur sistem al crui avantaj principal este faptul c este permis copierea i libera distribuire. La lansare, pagina de ntmpinare este urmtoarea:

    Principalele componente ale programului Epi Info sunt urmtoarele:

    Make View, care este un editor de text folosit pentru a defini cmpurile utilizate n

    introducerea datelor pe una sau mai multe pagini ale unui chestionar (View).

    Enter Data, care afieaz chestionarele construite cu Make View, controleaz procesul de introducere a datelor utiliznd setrile i codurile specificate n Make View; are i posibiliti de cutare a nregistrrilor.

    Analyze Data, care este folosit pentru analizarea datelor nregistrate n fiierele create nu numai cu Epi Info, dar i cu dBase, FoxPro, Excel etc. Aceste fiiere pot conine liste, frecvene, tabele, diagrame, date specifice studiilor epidemiologice.

    Create Maps, care este un instrument folosit pentru crearea hrilor epidemiologice.

  • UMF Carol Davila Informatic Medical i Biostatistic MG - Lucrarea practic 5 2014/2015

    - 95 -

    Create Reports, care este folosit pentru generarea rapoartelor.

    Alte componente sau utilitare ale softului, utile n diverse activiti, sunt urmtoarele:

    NutStat, care este folosit pentru nregistrarea i evaluarea msurtorilor referitoare la nlime, greutate, circumferina capului i a toracelui pentru copii i adolesceni.

    StatCalc, care este folosit pentru efectuarea de calcule statistice cu date plasate n tabele.

    Data Compare, care este folosit pentru identificarea diferenelor ntre dou tabele.

    Table to View, care se folosete pentru a genera un chestionar (view) pe baza unui tabel de date existent.

    VisData, utilizat pentru citirea fiierelor de date i schimbarea proprietilor.

    Epi Lock, care furnizeaz o criptare pentru a se proteja accesul la date i pentru a facilita att transmisia dar i crearea cpiilor de rezerv (backup).

    Compact, care este folosit la compactarea bazelor de date de tip (MS)Access.

    Aplicaia Epi Info cuprinde i un sistem de ajutorare a utilizatorului (help), care conine informaii despre

    facilitile oferite, un manual de utilizare, precum i un program de ndrumare interactiv n crearea fiierelor folosite n epidemiologie.

    Pentru crearea unui fiier-chestionar se va folosi modulul Make View, anume comanda:

    File New File name (numele bazei de date: nume_EPI) Open Name the View

    (Chest1 ca nume dat chestionarului)

    n pagina din partea stng gsii trei opiuni referitoare la gestiunea paginilor din chestionar (Add Page adugarea unei noi pagini la sfritul celor deja existente, Insert

  • MG - Lucrarea practic 5 2014/2015 UMF Carol Davila Informatic Medical i Biostatistic

    - 96 -

    Page adugarea unei pagini noi ntre dou deja existente, Delete Page eliminarea paginii curente) precum i comanda Program care face posibil programarea anumitor operaii de verificare, ducnd astfel la evitarea erorilor care pot aprea la introducerea datelor.

    Introducerea de cmpuri n pagina curent a chestionarului, conform indicaiei afiate, se

    efectueaz cu un clic pe butonul din dreapta la mausului, n poziia n care se dorete apariia cmpului respectiv (pentru fixarea poziiei este util grila). Ca urmare, va aprea caseta de dialog Field Definition n care se vor introduce caracteristicile cmpului: numele, tipul,

    dimensiunea, limitrile valorilor, codificri, valorile legale etc.

    Caseta de dialog Field Definition este prezentat n figura urmtoare. Se observ c tipul cmpului este fixat implicit pe Text.

  • UMF Carol Davila Informatic Medical i Biostatistic MG - Lucrarea practic 5 2014/2015

    - 97 -

    Chestionarul va conine urmtoarele 15 cmpuri:

    1. Codul numeric personal. n caseta text Question or Prompt vom introduce textul

    Codul Numeric Personal:, n grupul Field or Variable vom alege pentru Type valoarea Number, iar pentru Pattern valoarea ############# (adic 13 cifre); n sfrit, n caseta text Field Name vom introduce textul CNP.

    (De menionat c secvena de caractere CNP va servi drept nume al cmpului, iar secvena mai lung Codul Numeric Personal: va servi drept etichet pentru explicaii pe ecran.)

    2. Numele pacientului va fi de tip text i va avea cel mult 30 de caractere. De data aceasta n caseta text Question or Prompt vom introduce Numele:, pentru Type vom alege valoarea Text, iar Size va fi stabilit la 30. Numele cmpului poate fi lsat cel propus n caseta text Field Name.

    3. Prenumele pacientului va fi tratat similar ca i numele su.

    4. Sexul pacientului va avea dou valori posibile: F sau M. De data aceasta, n caseta text Question or Prompt vom introduce Sexul:, pentru Type vom alege valoarea Text, iar n grupul Code Tables vom apsa butonul Legal Values, apoi butonul Create New, i vom tasta valorile legale F, apoi M (vezi figura urmtoare). i n acest caz numele cmpului poate fi lsat cel propus n caseta text Field Name.

    5. Data naterii pacientului va fi evident de tip dat calendaristic. Pentru a putea preleva aceast dat, n caseta text Question or Prompt vom introduce Data naterii:, pentru Type vom alege valoarea Date, iar pentru Pattern valoarea aleas va fi DD-MM-YYYY. De data aceasta vom interveni n caseta text Field Name pentru a modifica numele cmpului n DataNast.

    6. Data internrii pacientului va fi tratat similar ca i data naterii.

    7. Edeme va fi o variabil cu dou valori posibile Yes/No. De data aceasta, n caseta text Question or Prompt vom introduce Edeme?, pentru Type vom alege valoarea Yes/No. n acest caz numele cmpului, n caseta text Field Name, va fi modificat n Edeme.

    n mod asemntor se procedeaz pentru urmtoarele 3 cmpuri: 8. Pleurezie.

    9. Palpitaii (numele cmpului Palpitatii).

  • MG - Lucrarea practic 5 2014/2015 UMF Carol Davila Informatic Medical i Biostatistic

    - 98 -

    10. Tuse.

    11. Temperatura va fi o variabil de tip numeric i va lua valori numai ntre 35 i 43. Pentru stabilirea valorilor limit se bifeaz caseta de validare Range i se aleg pentru Lower i Upper valorile 35, respectiv 43.

    Ultimele 5 cmpuri (Edeme, Pleurezie, Palpitatii, Tuse i Temperatura) vor fi grupate ntrun grup numit Manifestari. Pentru crearea unui grup se procedeaz n felul urmtor: se selecteaz cmpurile prin tragere cu mausul deasupra, apoi din meniul Insert se alege comanda Group.

    Pagina construit poate s aib urmtoarea form:

    Cu ajutorul comenzii Add Page (din meniul din pagina din stnga) se va aduga o nou pagin n care vor fi plasate ultimele trei cmpuri:

    12. Salariat, de tipul Yes/No,

    13. Numrul copiilor, de tip numeric cu valori ntre 0 i 14,

    14. Copii, o list-tabel care va conine numele i vrsta copiilor. Pentru aceasta n caseta text Question or Prompt vom introduce Copii:, iar n grupul Code Tables vom apsa butonul Grid. n caseta combinat Enter Column Name for Grid se va introduce textul Numele copilului, dup care se apas butonul Save Column i se procedeaz la fel pentru Vrsta copilului.

    15. Vrsta pacientului n momentul internrii, de tip numeric.

    Evident, odat ce cunoatem data naterii i data internrii, vrsta pacientului ar trebui s fie calculat automat! Pentru asemenea operaiuni se poate folosi comanda Program din pagina din stnga!

    Ca urmare a comenzii Program pe ecran va aprea o cu totul alt organizare: pagina din stnga va fi intitulat Check, iar cea din dreapta Check Commands.

    Vei alege Varsta drept cmp n care se va calcula valoarea, apoi vei comanda Assign, ncercnd s introducei expresia de calcul

    =YEARS(DataNast, DataIntern)

    (ca n figura de mai jos).

    Probabil c nu vei reui. Motivul: cmpurile DataIntern i DataNast sunt plasate pe alt pagin dect Varsta i valorile lor nu sunt disponibile pentru calcule! ncercai, ca

  • UMF Carol Davila Informatic Medical i Biostatistic MG - Lucrarea practic 5 2014/2015

    - 99 -

    soluie extrem, mutarea cmpului Varsta de pe pagina 2 pe pagina 1. Evident, vei face apel la comenzile Cut/Paste din meniul Edit. Dup mutare nu ar mai trebui s ntmpinai dificulti. (Atenie, nu se recomand tastarea expresiei, ci formarea ei din componente selectate!)

    Tema 25: introducerea datelor n Epi Info

    Se poate realiza direct din meniul File, comandnd Enter Data. Alte posibiliti, dup prsirea modulului Make View, din pagina principal Epi Info fie se alege direct modulul

  • MG - Lucrarea practic 5 2014/2015 UMF Carol Davila Informatic Medical i Biostatistic

    - 100 -

    Enter Data, fie se comand Enter Data din meniul Programs. n acest caz se deschide chestionarul creat, alegndu-se proiectul i view-ul corespunztor.

    Se vor introduce cel puin 4 nregistrri (adic se completeaz cmpurile cu date pentru cel puin 4 persoane, pe ambele pagini!). Dup care salvai fiierul nume_EPI.mdb i transferai-l n cminul d-voastr.

    n figura de mai jos este prezentat momentul completrii datei internrii, pe pagina 1 pentru nregistrarea a 3-a. De menionat c pentru toate inscripiile legate de valorile cmpurilor a fost ales un font standard de afiare (MS Sans Serif) de mrime 14 p.t.

    Se impune o observaie. n datele pe care le introducem apar redundante sexul i data naterii. Este posibil ca valoarea din cmpul DataNast s fie calculat automat odat ce a fost introdus codul numeric personal, la fel valoarea din cmpul Sexul. Putei realiza aceasta?

    Tema 26: analiza statistic primar a datelor din fiiere

    Pentru a efectua calcule statistice vom folosi modului Analyze Data. n cadrul acestui

    modul vom folosi mai multe comenzi pe care le putem alege din fereastra de comenzi din

    partea stng. Rezultatele execuiei comenzilor sunt afiate n fereastra din dreapta sus (intitulat Analysis Output). n fereastra din dreapta jos (intitulat Program Editor) se vor afia comenzile/seturile de comenzi care au fost executate anterior; de asemenea, se pot introduce noi comenzi, n regim de linie de comand.

    Comenzile pe care le putem alege sunt grupate, n fereastra din stnga, n cteva grupe.

    Distingem astfel comenzile de lucru cu datele (grupate n Data), cele ce opereaz asupra variabilelor (grupate evident n Variables), comenzile de selecie (grupate n Select/If), comenzile de analiz statistic primar (grupate n Statistics) etc.

    Read (Import) este comanda utilizat la nceputul oricrei sesiuni de lucru n modulul Analysis. Este folosit pentru preluarea datelor dintr-un fiier, date ce vor fi folosite pentru prelucrrile ulterioare (pn la o nou comand Read (Import).). Formatul implicit al datelor este Epi 2000, dar acesta poate fi schimbat astfel nct este posibil s se preia date i din alte tipuri de fiiere (de exemplu diverse versiuni de Excel, diverse versiuni de Fox Pro, Paradox sau chiar documente hipertext).

    Softul Epi Info este nsoit de mai multe proiecte pentru exemplificare i auto-nvare, dintre care cel mai simplu este Sample.mdb.

    Lansai n execuie comanda:

    Read (Import) Data Formats: Epi 2000 Data Source: Sample.mdb Show: Views

    Views: viewBabyBloodPressure

    Vei constata c aceasta este de fapt comanda:

    READ 'C:\...\Epi_Info\Sample.mdb':viewBabyBloodPressure

    List, din grupul Statistics, este comanda de afiare sub form tabelar (Grid sau HTML) a valorilor unor variabile din fiierul activ de date. Implicit, pentru valoarea * n lista Variables, vor fi afiate valorile pentru toate variabilele. Dac ns vor fi selectate doar unele variabile, afiarea valorilor se va efectua doar pentru aceste variabile. Aceast comand permite i modificarea valorilor variabilelor din fiierul activ de date (Allow Updates).

  • UMF Carol Davila Informatic Medical i Biostatistic MG - Lucrarea practic 5 2014/2015

    - 101 -

    Ca exemplu, vom afia doar valorile variabilelor (cmpurilor) Birthweight, SystolicBlood, AgeInDays sub form tabelar (Display Mode: Grid) dup ce aceste cmpuri au fost selectate din lista derulant Variables.

    Comanda efectiv este:

    LIST Birthweight SystolicBlood AgeInDays GRIDTABLE

    Frequencies, din grupul Statistics, este comanda cu care de obicei se ncepe analiza unui nou set de date, pentru c nainte de a face prelucrri statistice mai complicate, vrem s aflm cteva informaii de baz, legate de distribuiia datelor. Comanda se poate folosi att pentru variabile calitative, ct i pentru variabile cantitative, i conduce la obinerea unui tabel-sintez care conine toate valorile variabilelor specificate n lista Frequency of:, mpreun cu frecvenele absolute (numrul de apariii), procentele i procentele cumulate pentru fiecare valoare a variabilei.

    De asemenea, n tabel este trecut i o schi de reprezentare grafic de tip cu bare. n figura de mai jos este prezentat efectul comenzii

    FREQ Birthweight

    Birthweight in Oz (X1) Frequency Percent Cum Percent

    90 1 6.3% 6.3%

    95 1 6.3% 12.5%

    100 1 6.3% 18.8%

    105 2 12.5% 31.3%

    120 4 25.0% 56.3%

    125 3 18.8% 75.0%

    130 1 6.3% 81.3%

    135 1 6.3% 87.5%

    150 1 6.3% 93.8%

    160 1 6.3% 100.0%

    Total 16 100.0% 100.0%

  • MG - Lucrarea practic 5 2014/2015 UMF Carol Davila Informatic Medical i Biostatistic

    - 102 -

    95% Conf Limits

    90 0.2% 30.2%

    95 0.2% 30.2%

    100 0.2% 30.2%

    105 1.6% 38.3%

    120 7.3% 52.4%

    125 4.0% 45.6%

    130 0.2% 30.2%

    135 0.2% 30.2%

    150 0.2% 30.2%

    160 0.2% 30.2%

    Se observ c sunt afiate i intervalele de ncredere 95% (95% Confidence Limits) pentru fiecare valoare a variabilei. Ele trebuie citite n felul urmtor: avem ncredere 95% c procentul celor care la natere cntresc 90 oz se situeaz undeva ntre 0.2% i 30.2%. Acest rezultat este bazat pe nregistrarea unui caz din 16! La cursurile de biostatistic din anul al II-lea se va explica modul n care se obin aceste evaluri.

    n cazul n care se specific o variabil de stratificare, se obin mai multe tabele de frecven, cte unul pentru fiecare valoare a variabilei de stratificare.

    Comanda Means conduce, n plus fa de datele pe care le-am obinut deja cu comanda Frequencies, la obinerea unor indicatori statistici de centrare i mprtiere: media (Mean), mediana (Median), cuartilele (de 25% i de 75%), valoarea minim (Minimum) i maxim (Maximum), modul = valoarea avnd frecvena maxim (Mode), variana (Variance) i abaterea standard (Std Dev). Evident, Obs este numrul total de valori ale variabilei, iar Total este suma tuturor valorilor variabilei.

    n figura de mai jos este prezentat efectul comenzii

    MEANS AgeInDays

    Age in Days(X2) Frequency Percent Cum Percent

    2 3 18.8% 18.8%

    3 7 43.8% 62.5%

    4 4 25.0% 87.5%

    5 2 12.5% 100.0%

    Total 16 100.0% 100.0%

    Obs Total Mean Variance Std Dev

    16 53.0000 3.3125 .8958 .9465

    Minimum 25% Median 75% Maximum Mode

    2.0000 3.0000 3.0000 4.0000 5.0000 3.0000

    Comanda Means poate fi folosit ns numai pentru variabile cantitative; pentru cele calitative trebuie s ne mulumim cu rezultatele comenzii Frequencies.

    Comanda Select, din grupul Select/If, este folosit pentru selectarea unui grup de nregistrri care ndeplinesc un anumit criteriu. Dup selectarea grupului de nregistrri, n

  • UMF Carol Davila Informatic Medical i Biostatistic MG - Lucrarea practic 5 2014/2015

    - 103 -

    prelucrare vor fi luate n calcul doar acestea. Comanda Select rmne activ pna la anularea ei (Cancel select).

    Ca exemplu, s selectm noii nscui cu vrsta (exprimat n zile) mai mare de 3. n caseta Select Criteria: formai expresia AgeInDays>3. n urma unei comenzi List se va obine urmtorul rezultat:

    Ultimele dou coloane, intitulate UniqueKey i RecStatus, sunt cmpuri speciale pentru tabele create cu Epi Info. n cmpul RecStatus se pstreaz starea nregistrrii. Anume, pentru nregistrrile care au fost marcate pentru tergere valoarea va fi 0, iar pentru restul valoarea va fi 1. Cmpul UniqueKey este folosit pentru numrarea automat a nregistrrilor din tabel.

    Comanda Header, din grupul Output, poate fi folosit pentru a stabili un text ca titlu pentru rezultate, de asemenea pot fi precizate caracteristicile de redare (fontul, mrimea, etc.). Un exemplu:

    HEADER 2 "Rezultate pentru nou nascuti" (BOLD) TEXTFONT +4

    Comanda Type, din acelai grup Output, este analoag celei anterioare; evident, este folosit pentru inserarea unei secvene de caractere sau a coninutului unui fiier-text n fluxul de ieire (fie cel implicit monitorul , sau cel specificat cu comanda RouteOut).

    Comanda RouteOut redirecteaz ieirea (fluxul de rezultate) ctre coninutul unui fiier cu numele specificat; acest proces va fi terminat prin comanda CloseOut. Rezultatele

    obinute n urma unor comenzi precum Frequencies, List etc. vor fi inserate n coninutul fiierului cu numele specificat prin RouteOut.

    Deschidei (din Sample.mdb) cu ajutorul comenzii Read (Import) tabelul viewEstriolAndBirthweight. Folosii comanda RouteOut pentru a redireciona rezultatele obinute spre fiierul cu numele nume_EBW (evident, n folderul C:\Anul_2). Ce extensie va avea acest fiier?

    Introducei titlul Estriolul i greutatea la natere cu ajutorul comenzii Header bifnd opiunile Bold i Italic i alegnd mrimea fontului de 7. Introducei apoi textul Coninutul fiierului cu ajutorul comenzii Type bifnd i acum opiunile Bold i Italic, ns alegnd mrimea fontului de 5. Folosii comanda List pentru a lista valorile celor dou variabile Birthweight i Estriol, alegnd modul de afiare Web (HTML). Introducei un nou text: Prelucrri statistice pstrnd parametrii de la textul anterior. Cu ajutorul comenzii Means calculai indicatorii statistici pentru variabila Birthweight, apoi pentru Estriol. nchidei fiierul de rezultate cu ajutorul comenzii CloseOut.

    Probabil c suntem de acord cu toii c informaia prezentat grafic este mai uor de neles. Cele mai utilizate moduri de prezentare grafic sunt diagramele cu dreptunghiuri

    Observation

    Number

    Birthweight in

    Ounces (X1)

    Age in

    Days(X2)

    Systolic Blood Pres-

    sure (mm Hg)(Y) UniqueKey RecStatus

    2 120 4 90 2 1

    5 130 4 92 5 1

    6 125 5 98 6 1

    9 120 5 96 9 1

    10 90 4 95 10 1

    14 150 4 97 14 1

  • MG - Lucrarea practic 5 2014/2015 UMF Carol Davila Informatic Medical i Biostatistic

    - 104 -

    (Bar sau Rotated Bar), diagramele de tip rozet (Pie) i histogramele (Histogram). Primele dou tipuri sunt potrivite pentru afiarea informaiei despre variabilele care au un numr mic de valori (n special variabile calitative). Ultimul tip este adecvat prezentrii sumarizate a variabilelor care au un numr mare de valori numerice (aa cum este cazul greutii exprimat n grame, sau a nlimii exprimat n centimetri), bineneles dup ce se realizeaz gruparea valorilor n cteva intervale de valori.

    Comanda Graph, din grupul Statistics, este folosit pentru a realiza reprezentri grafice ale variabilelor din fiierul activ de date. Ca un exemplu, s deschidem (din sursa Sample.mdb) cu ajutorul comenzii Read (Import) tabelul viewSmoke. Cu ajutorul

    comenzii Graph vom prezenta valorile variabilei Sex ntro diagram cu bare (dreptunghiuri). Pentru aceasta n fereastra obinut prin lansarea comenzii, alegem Bar n lista Graph Type: i Sex n X-AXIS Main_Variable(s):. n Y-AXIS Show values of: va fi pstrat valoarea implicit Count. Titlul diagramei va fi: Repartitia pe sexe a persoanelor fumatoare | creat de ... (numele d-voastr). Dup afiare, diagrama obinut va

    fi exportat (File Export...) n format jpg dup care va fi redenumit nume_DISX.jpg

    alegnd i calea de acces prin opiunea Export Destination: File Browse.

    n mod asemntor se procedeaz pentru variabila Race pentru care vom alege tipul de diagram Rotated Bar, apoi pentru variabila Marital pentru care alegem tipul de grafic Pie. Salvai cele dou diagrame, dup ce ai ales titluri adecvate, n fiiere cu denumirile nume_DIRACE.jpg respectiv nume_DIMAR.jpg. Pentru variabila cantitativ Age tipul de diagram adecvat va fi Histogram, pentru care vei stabili lungimea intervalului de grupare la 10, iar prima valoare va fi 0. Diagrama obinut va fi salvat n fiierul nume_DIAGE.jpg. Ce titlu i-ai stabili?

    n continuare, dorim s reprezentm grafic variabila Weight separat pentru fiecare valoare a variabilei Sex. Pentru aceasta, alegem tipul de diagram Histogram, variabila principal Main_Variable(s): va fi aleas Weight, lungimea intervalului de grupare va fi 15, titlul principal va fi: Repartitia greutatii in functie de sex | creat de ... (numele d-voastr), la opiunea One Graph for Each Value of alegem variabila Sex, vom bifa opiunea Multiple Graph per Page i vom introduce valorile 2 pentru No Across/Horizontal respectiv 1 pentru No Down/Vertical. Vom salva diagramele obinute sub numele nume_DIAGESX1.jpg respectiv nume_DIAGESX2.jpg.

    Ca un exerciiu de control, deschidei tabelul viewOswego din proiectul Sample.mdb. Redirectai rezultatele prelucrrilor urmtoare spre fiierul nume_OSW. Fiecare comand va fi nsoit de un text explicativ, n care vei specifica ce se obine cu comanda respectiv. Listai coninutul fiierului. Pentru variabila Age vei calcula media pentru persoanele sntoase (criteriul ill=No) i separat pentru persoanele bolnave (ill=Yes).

    Reprezentai grafic adecvat variabilele Age, Sex, Ill, salvai diagramele obinute n format JPG i inserai-le, nsoite de comentariile d-voastr referitoare la ceea ce dorii s prezentai n diagramele respective, ntr-un document denumit nume_DIOSWEGO.doc.