biostatistica mg - lp 2

Upload: larisa-loredana

Post on 05-Feb-2018

244 views

Category:

Documents


1 download

TRANSCRIPT

  • 7/21/2019 Biostatistica MG - LP 2

    1/14

    Laboratorul al II-lea

    Biostatistic Medicin General

    Lucrarea de laborator Nr.2

    Scop: la sfritul laboratorului vei ti:

    Sfolosii facilitile pachetului Excel legate de calculul indicatorilor statistici i a altor funcii

    S calculai indicatori statistici i alte funcii Excel separat, la anumite categorii de pacieni

    S folosii tabelele de frecven pentru calculul unor indicatori statistici

    1. Funcii ExcelProgramul Excel pune la dispoziia utilizatorului un set de funcii foarte bogat care permite realizarea foarte

    rapid a unor calcule. Printre cele mai simple funcii sunt suma, media, mediana, cuartilele, minimul,maximul, numrarea valorilor, etc. n statistic, de obicei avem de calculat astfel de funcii pentru coloanede valori care sunt introduse ntr-un tabel. Deci ne vom pune problema de a calcula media sau mediana sau oalt funcie pentru valorile cuprinse ntr-o coloan numericdintr-un tabel.

    1.1. Folosind date introduse de la tastatur

    Dac valorile pentru care dorim s facem calculele nu sunt deja nregistrate pe calculator, ele trebuieintroduse de la tastatur. Nu se procedeaz aa dect cnd numrul de valorieste relativ mic.

    Lansai programul EXCEL i, dup ce numerotai pe coloana A, de la 1 la 15, ca n figura de mai jos,introducei pe coloanaB valorile din figur, sau unele asemntoare (ar putea fi valorile hemoglobinei la 15

    pacieni). Avei grij ca, numerotarea i valorile propriu-zise s nceap pe linia 2, deoarece pe linia 1 suntscrise titlurile coloanelor, Nrcrt, i respectiv, Hb. Avei de asemenea grij, s scriei numerele zecimalefolosind punctul zecimal, adic, de exemplu, 12.5 i nu 12,5.

    Apoi, n celula B18, scriei textul =average(b2:b16)i apoi apsai tasta Enter.Vei constata c n celul,apare numrul 13.69333, care este media celor 15 numere introduse. Pentru moment nu v preocupai defaptul c media este nscris n celul cu 5 zecimale (ceea ce este prea mult, n general trebuie s lucrm cuuna sau dou zecimale), lsai aa cum a inserat programul.

    Tastai apoi n celula A18, cuvntul Media, pentru a avea o informaie despre ce fel de indicator este calculatn celula B18.

    Pentru calculul deviaiei standard, a minimuluii a maximului, scriei ca n figur, n celulele B19, B20 iapoi n B21, textele: =stdev(b2:b16), apoi, =min(b2:b16), apoi,=max(b2:b16), de fiecare dat, apsnd

    1

  • 7/21/2019 Biostatistica MG - LP 2

    2/14

    Laboratorul al II-lea

    tasta Enter. Vor apare numerele 1.18229, care este deviaia standard a seriei celor 15 valori, 11.6, care estevaloarea minim, i 15.7, care este valoarea maxim.

    n acest mod, se pot calcula mai muli astfel de indicatori, care n Excel se numesc funcii(funcii Excel), cucondiia s le cunoatem numele(average, stdev, min, max, etc). n seciunea urmtoarevei vedea cum se

    pot folosi aceste funcii, prin alegerea lor dintr-o listoferit de program.Totdeauna cnd dorii s calculairepede o medie, putei proceda ca mai sus. Scriei numerele pe o coloan (sau pe o linie) i calculai media cu

    ajutorul funciei Average.1.2. Folosind date din tabele executate anterior.

    S presupunem c am nregistrat ntr-un tabel de pacieni,valorile bilirubinei, pe o coloan numit BRT, ic tabelul conine i multe alte coloane cu informaii despre pacienii respectivi. Este vorba de tabelulCIROZA.

    Deschideitabelul cu date, folosind secvena File->Open, i se alegeCiroza.xls

    Cutai coloana care v intereseaz. Aa cum am spus mai sus, ne intereseaz coloana valorilorbilirubinei totale (BRT). Coloana este P i valorile sunt nregistratede la P2 la P235. La P1, estenumele coloanei.

    Putem situa media sau alt calcul cu valorile de pe aceast coloan n orice celul liber. Totui,

    pentru a lucra organizat, ne vom deplasa cu ajutorul barelor de derulare sau cu ajutorul sgeilor depe tastatur, pn n celula P237, adic sub coloana de valori, lsnd o celul liber(P236).

    n celula P237, scriei textul: =average(p2:p235) fr s v preocupai de faptul c nu are loc exact n celul.Urmrii de fapt textul pe care l scriei n linia de stare situat imediat deasupra numelor coloanelor. Acoloeste redat ceea ce ai tastat la un moment dat. Cnd ai terminat de scris, apsai tasta ENTER.

    Vei constata c n locul formulei pe care ai scris-o, apare un numr, care nu este altceva dect mediavalorilor de pe coloana BRT.

    Dac vei executa un clic pe celula unde ai calculat media, adic pe celula p237, i vei privi n linia de stare,deasupra numelor coloanelor, vei constata c, dei n celul este scris un numr(media valorilor din coloanaP), n linia de stare este scris formula pe care ai aplicat-o. Dac executai clic pe orice alt celul careconine un numr, n linia de stare apare exact ceea ce este i n celul. Totui, celulele care conin un rezultatal unui calcul sau n general, al unei funcii, nu respect aceast regul. n timp ce n celul este afiatrezultatul calculului sau funciei, n bara de stare se afiaz formula.

    Pentru a continua cu exerciiile, n celula p238, scriei textul: =stdev(p2:p235) dup care apsai tastaENTER. Vei constata la fel, c n celula p238, apare deviaia standard a valorilor din coloana P. Dacexecutai clic pe celula p238 i urmrii linia de stare, vei vedea c programul a memorat acolo formulafolosit.Observai c deviaia standard a valorilor bilirubinei totale este 3,59, deviaie care, pentru media de3,89, care se afl deasupra, poate fi considerat ca indicnd o mprtiere mare a valorilor.

    2

  • 7/21/2019 Biostatistica MG - LP 2

    3/14

    Laboratorul al II-lea

    Pentru a nu ncurca formulele, precum i pentru a lucra organizat, este indicat ca lng o formul, ntr-ocelul de preferat n stnga s se scrie ce funcie a fost aplicat.

    Deci, ar fi bine s v deplasai n celula O237 i s scriei acolo cuvntul Media. La fel, n celula O238,scriei cuvintele Deviaia Standard,fr a v preocupa de faptul c textul nu are loc n celul. Dup ce aiterminat de scris, apsai tasta ENTER, i apoi facei o ajustare a coloanei O, aa cum se vede n figura demai sus, aa nct textul s fie vizibil ntr-un mod mai estetic.

    Calculai i indicatorii minim, maxim, mediana, numrul de valori, astfel:

    n celula p239 scriei formula =min(p2:p235),apoi apsai tasta ENTER

    n celula p240 scriei formula =max(p2:p235),apoi apsai tasta ENTER

    n celula p241 scriei formula =median(p2:p235),apoi apsai tasta ENTER

    n celula p242 scriei formula =count(p2:p235),apoi apsai tasta ENTER

    3

  • 7/21/2019 Biostatistica MG - LP 2

    4/14

    Laboratorul al II-lea

    n celulele corespunztoare de pe coloana O, scriei numele indicatorilor, astfel ca la sfrit s arate ca n

    figura de mai sus.Programul Excel, ofer posibilitatea copierii funciilor, astfel c, dac dorim s calculm media i lacoloanele vecine, acest lucru se simplific foarte mult.Pentru a copia formula mediei pentru coloanele dindreapta coloanei P,procedai astfel:

    Cu ajutorul barelor de defilare, aducei coloana Oastfel nct s fie prima din stnga. Aceast manevr estedestinat doar scopului de a aduce n ecran coloanele pentru care dorim s calculm media i anume,coloanele de la Q la Y.

    Executai clic n celula p237, apoi deplasai foarte fin cursorul mouse-ului n jurul colului din dreapta jos alacestei celule. Ar trebui ca, n funcie de poziia lui fa de acest col, s ia trei forme diferite:

    cursorul sgeat, apare n apropierea marginilor celulei active

    cursorul plus, numai n apropierea colului din dreapta jos, al celulei active. cursorul cruce,cursorul normal, apare pe restul paginii.

    Pentru a copia formula mediei, trebuie s tragei de mouse cu butonul stng apsat exact n momentul ncare cursorul a luat forma de plus. Tragei la dreapta pn n dreptul coloanei Y, chiar dac n timpuloperaiei avei impresia c programul nu face nimic, dup care eliberai butonul. Vei vedea cndeliberai butonul mouse-ului c celulele de pe linia 237, de la coloana Q la coloana Y, au n ele mediile

    calculate. S-au calculat astfel, mediile coloanelor de la Q la Y, adic pentru valorile urmtorilorparametri: bilirubina direct, bilirubina indirect, fosfataza acid, GGT, LAP, colesterol, TGP, TGO iLDH.

    4

  • 7/21/2019 Biostatistica MG - LP 2

    5/14

    Laboratorul al II-lea

    Repetai operaia de mai sus, trgnd din celula P238 pn n celula Y238, i aa i pe liniile 239 pn la 242.n final, ecranul ar trebui s arate ca n figura de mai sus. Nu v ngrijorai pentru apariia eventual pe Y240,sau n alte celule, a unor semne diez. Ele se datoreaz faptului c numrul care a rezultat din calcul este marei nu are loc n celul. Ajustai coloana Y, astfel ca numrul s fie afiat corect.

    Pn acum am inserat n diferite celule funcii EXCEL fr s ne preocupe de unde putem afla care sunt

    funciile oferite i care este numele lor. De fapt, s-a vzut c se poate calcula o funcie dac ne este cunoscutnumele ei: AVERAGE, MEDIAN, STDEV, etc. Dar aceste nume sunt destul de strine i, fiind de faptfoarte multe, nu pot fi inute minte. Funciile EXCEL pot fi folosite i apelnd la o list a lor, list mprit

    pe categorii, astfel nct s putem ajunge mai uor la funcia care ne intereseaz.

    Pe lng funciile pe care le-am calculat pn acum, ar mai fi util s tii s calculai cuartilele. Anume estebine ca ele s fie inserate la celulele P243 i P244.Pentru inserarea unei funcii EXCEL din lista de funcii,se procedeaz astfel:

    Se aaz cursorul pe celula P243, aceast celul devenind activ. Apoi se execut secvena InsertFunction,care deschide fereastra Paste Function (figura de ma jos, stnga).

    Fereastra conine dou liste. n stnga, este lista capitolelor sau familiilor de funcii care in de domenii de

    activitate diverse. Unul dintre capitole este Statistical. n lista din dreapta sunt listate funciile care in destatistic. Printre ele, observai pe locul al doilea i funcia Average pe care tocmai ai folosit-o. Mai suntfuncii matematice, financiare, logice, etc. Un capitol special este primul, al funciilor folosite recent (Most

    5

  • 7/21/2019 Biostatistica MG - LP 2

    6/14

    Laboratorul al II-lea

    Recently Used). Aici se ine evidena funciilor care au mai fost folosite recent i deci este mai probabil s legsim uor.

    Vei continua astfel:

    Vei alege n lista din stnga capitolul Statisticali vei executa un clic pe numele su

    Vei cuta n lista din dreapta funcia QUARTILEi vei da un clic i pe numele ei

    Apoi vei apsa butonul OK al ferestrei.Efectul, este apariia ferestrei din figura de mai sus, dreapta,

    n care va trebui s specificai ce cuartil dorii i unde sunt valorile de calculat. n caseta de dialog Array, introducei locul (intervalul) ncare se afl valorilede pe coloana care ne

    intereseaz pe noi, adicp2:p235

    n caseta de dialog Quart, scriei care cuartil o dorii. n cazul nostru este cuartila Q1, deci veiscrie 1, ca n figura de sus, din dreapta. n final, apsai OK

    Efectul este c n celula p243 a aprut valoarea cuartilei Q1.

    Procedai asemntor, punnd cursorul ncelula p244 i repetai paiide mai sus, ncepnd de la InsertFunction, cernd de data aceasta cuartila Q3, adic atunci cnd ajungei la caseta Quart, scriei 3 i nu 1. nfinal, scriei pe celulele O243 i O244, numele funciilor calculate, Q1 i Q3, sau Cuartila I i, respectiv,Cuartila III. Dup ce ai calculat n acest fel cuartilele pe coloana P, copiai formulele i pe celelalte coloane,de la Q la Y, aa cum ai procedat i la medie i la ceilali indicatori (prin tragere).

    Foaia de calcul, trebuie s arate ca n figura de mai sus.

    Programul Excelnuare o funcie special pentru calcululcoeficientului de variaie, care este un indicatorimportant. De aceea, calculul acestui indicator al mprtierii trebuie fcut prin mprirea mediei la deviaiastandard (conform formulei) i eventual nmulirea acestui raport cu 100, pentru a l exprima n procente.Deci, vei proceda astfel:n celula P245 scriei formula: =p238/p237*100, iar dup apsarea tastei ENTER,

    urmrii valoarea coeficientului de variaie care este exprimat n procente, deci trebuie s fie de ordinulzecilor (uneori chiar peste 100%). n cazul nostru este 92,28, sau o valoare apropiat. Apoi tragei spredreapta pentru multiplicarea formulei la coloanele de la Q la Y.

    6

  • 7/21/2019 Biostatistica MG - LP 2

    7/14

    Laboratorul al II-lea

    2. Statistic descriptivExcelare o funcie care returneaz indicatorii statistici mai importani pentru o serie de date numerice, nu pernd, ci toi odat. Pentru a ncepe lucrul, deschidei tabelul CIROZA, dac nu este deschis, folosindsecvena File->Open. Pentru a face apel la aceast funcie deosebit de util, trebuie mai nti s ne asigurmde urmtoarele:

    S presupunem c ne intereseaz indicatorii statistici pentru coloana de vrste ale pacienilor din tabel.Fixm coloana care ne intereseaz, innd minte numele ei, precum i care sunt celulele de nceput i desfrit ale irului de valori. n tabelul CIROZA, numele coloanei de vrste este evident VARSTA. datele seafl pe coloana D, de la celula D2 pn la celula D235. Acest lucru este bine s fie inut minte, pentru cfunciape care o vom folosi imediat, Descriptive Statistics, ne va ntreba acest lucru: unde se afl irul denumere pentru care dorim indicatorii statistici. Deocamdat ns, nu folosim aceast funcie ci urmrim mainti cteva amnunte importante:

    Punem cursorul pe prima celul a coloanei, n cazul nostru D1, i folosind tasta sgeat jos, de pe tastatur,facem s defileze valorile din coloan, urmrind dac datele coninute de coloan sunt numericei dac suntplauzibile. Aceast operaie este deosebit de important. Se ntmpl cteodat ca din eroare s apar pecoloana de vrste sau pe orice alt coloan i informaie eronat introdus accidental, cum ar fi diferitetexte sau numere mult prea mari, mult prea mici, etc. Chiar dac informaia este numeric, este bine s

    urmrim ce valori sunt introduse pentru a nu avea surpriza unor valori aberante. Cele mai des ntlnite valoriaberante sunt zerouri, care sunt inserate uneori la pacienii la care nu au fost disponibile valorile reale.

    Observaii.Excel scrie numerele uneori n format tiinific. De exemplu, numrul 0,0000000000234 este scris uneoride Excel ca 2,34E-11. Aceste valori trebuie terse, fiind erori de introducere. Nu este cazul acum, dar dac ntlniiastfel de valori, le tergei.

    De asemeni,pot aprea din diverse motive valori aberante, de exemplu este posibil ca un pacient s aibtrecut vrstade 223 ani, sau hemoglobina 145, n loc de 14,5, etc. Aceste valori aberante sau texte pe care le gsii ntr-un tabel,trebuie eliminate nainte de a face orice calcul, pentru a nu ajunge la rezultate false. Mai jos, avei o imagine care a fostfalsificat pentru exemplificare. Astfel, n celula AP12, apare valoarea 1428, probabil n loc de 14.28. nceluleleAP16-AP18, apar valori de 0.00, care trebuie i ele terse, dac le vei ntlnii.

    Mai observai n figura de mai jos c, celulelepot apreagoale, atunci cnd pacientul nu a fcut analiza respectiv. De

    exemplu, leucocitele nu sunt nregistrate pe coloana AQ (numit L) la pacienii de pe liniile 13, 16, 17, 18, 20. Acestlucru nu mpiedic programul s fac calculele pentru restul pacienilor. Pe coloanele AO i AR (numite C3 =complementul C3 i respectiv TR = trombocite) sunt chiar foarte multe locuri goale datorate faptului c pacieniirespectivi nu au fcut analiza respectiv.

    Revenim la tabelul CIROZA care este acum deschis. Calculele pe care le face comanda Descriptive

    statistics, pe care o vom folosi n continuare, impune ca valorile aberante s fie eliminate nainte de folosireaei. De aceea, urmrii pe coloana VARSTA, dac valorile sunt sau nu plauzibile. Dac nu suntei siguri cunele valori sunt sau nu aberante ntrebai cadrul didactic.

    7

  • 7/21/2019 Biostatistica MG - LP 2

    8/14

    Laboratorul al II-lea

    Pentru a ncepe lucrul, procedai astfel: executai secvena Tools->Data Analysis->Descriptive Statistics.Va apare o fereastr pe care o vedei n figura de mai sus i pe care trebuie s o completai cu deosebitatenie, dupcum urmeaz:

    Scriei n caseta de opiuni numit Input Range, D1:D235. Prin aceasta ai specificat programuluiintervalul de celule unde se afl nscrise numele coloanei i vrstele pacienilor, de la D1 pn laD235 (D1 are nscris numele coloanei, iar de la D2 sunt vrstele)

    Bifai caseta de validare numit Labels in First Row. Aceasta anun programul c de fapt, nintervalul D1:D235, prima celul, D1 conine numele coloanei (Label = Etichet) i nu vrsta

    primului pacient, iar vrstele pacienilor ncep de fapt de la D2 n jos

    Bifai butonul radio numit Output Range i scriei n csua de dialog corespunztoare D240. nmomentul bifrii butonului Output Range, vei constata c programul schimb automat textulintrodus mai devreme n caseta Input Range, din D1:D235 n $D$1:$D$235. Acest lucru estenormal i n acest moment nu trebuie s v preocupe. Am precizat prin D240, locul unde programulva depune rezultatele, din celula D240 spre dreapta i n jos. Pot fi specificate i alte celule cucondiia s fie libere aproximativ 18 celule n jos pe coloana respectiv i pe coloana vecin dindreapta. Practic, programul va scrie pe celulele de la D240 la D257 i de la E240 la E257. De aceea,

    aceste celule trebuie s fie libere

    Bifai butoanele de opiune numite Summary statistics, Kth Largest i Kth Smallest. n casetelede opiune ale ultimelor dou butoane, scriei 59 (ceea ce reprezint un sfert din numrul de

    pacieni). Aceast specificare se face atunci cnd dorim ca programul s calculeze cuartilele (Q1,pentru Kth Smallesti Q3 pentru Kth Largest). Dac nu dorim cuartilele, se poate scrie n casetelede dialog respective orice numere ntre 1 i numrul total de linii ale tabelului. De exemplu, dacvom scrie 10 n ambele, programul o s ne returneze al zecelea cel mai n vrst pacient i al zeceleacel mai tnr pacient.Apoi apsai butonul OK

    Rezultatul este afiat pe coloanele D i E, de la celula 240, n jos, aa cum se vede n figura de sus,stnga, pefond de culoare nchis. Apsai pe orice celul alb a ecranului i vei constata c fondul nchis dispare icelulele cu rezultate sunt ca i restul ecranului. Dup ce ajustai coloanele, lindu-le astfel ca rezultatele s

    se vad mai bine, gsii indicatorii statistici ca n figura de sus, dreapta (pe fond alb).Valorile indicatorilor statistici, sunt afiate cu un numr foarte mare de zecimale, lucru care le face greu decitit. Se pot afia cu un numr de zecimale mai mic, pentru a fi citite mai uor. Pentru a afia cu mai puine

    8

  • 7/21/2019 Biostatistica MG - LP 2

    9/14

    Laboratorul al II-lea

    zecimale, mai nti, selectai celulele de la e242 la e256. Apoi, din meniul principal, alegei opiuneaFormat, apoi Cell, i executai clic pe aceast opiune. Feresatra care se deschide (figura de mai jos, stnga),

    permite setarea celulelor selectate astfel ca afiarea s se fac n mai multe formate ca numr, dat, or,procent, fracie, text i altele.

    Alegei opiuna Number, care se vede c este marcat n figura de sus. n acest caz, programul permite ifixarea numrului de zecimale, care pentru indicatorii statistici obinui la pasul anterior, este suficient s fie2. n cazul n care ai dori 3 sau mai multe zecimale, putei s ajustai prin apsri pe cele dou triunghiuricare mresc sau micoreaz numrul dup dorin.La sfrit, apsai OK. Indicatorii pe care i furnizeazaceast funcie suntlistai nc odat n figura de mai sus, dreapta, mpreun cu numele lor n limba romn (nu este nevoie s scriei numele n romnete, sunt listate doarpentru uurarea reinerii lor).

    Observai c media de vrst este de 53,85, iar deviaia standard este de 9,79. Acest lucru se scrie maicondensat sub forma: 53,85 9,79. Mediana este 55 de ani, ceea ce nseamn c jumtate dintre pacieni suntmai tineri de 55 de ani i jumtate mai n vrst. Quartila Q1 este 48 de ani (Smallest(59)), adic un sfertdintre pacieni sunt sub 48 de ani i trei sferturi au vrsta peste 48 de ani. La fel, interpretai quartila Q3.

    Uneori, se arat tendina central a valorilor din serie i excentricitatea distribuirii lor n jurul mediei prinprecizarea medianei i a cuartilelor sub forma:mediana [cuartila Q1; cuartila Q3],adic n cazul nostru 55ani [48 ani; 60 ani]. Aceasta se face n special atunci cnd seria arat o excentricitate mare.

    ntre cele dou cuartile, adic ntre 48 i 60 de ani, se situeaz vrstele a jumtate dintre pacieni. Este deci oafeciune care afecteaz mai ales aceast grup de vrst. Programul returneaz i modul, care este cea maifrecvent valoare pe care o ntlnete n seria de valori. n cazul nostru este 58. Excentricitatea de 0,29,arat c distribuia valorilor n jurul mediei este aproximativ simetric. Boltirea de 0,25, arat c distribuiaeste boltit jos.

    De reinut: n cazul seriilor numerice cu valori foarte multe, mai ales cnd numerele sunt zecimale,modul nu are o semnificaie util i nu trebuie interpretat. n cazul seriilor de volum mic, sub 10 15valori, quartilele nu au o valoare informativ semnificativ i nu se interpreteaz.

    3. Subtotaluri

    Foarte des apare necesitatea de a calcula repede diverse funcii EXCEL dar nu folosind valorile nregistratela toipacienii ci numai pe ale acelora care ndeplinesc o condiie. De exemplu, am putea avea nevoie scalculm media de vrst numai pentru pacienii de sex masculin, sau s calculm ceamai mare valoare atensiunii arteriale numai la pacienii de sex feminin, etc.

    3.1.

    Subtotaluri pentru date introduse de la tastatur

    S presupunem c avem la dispoziie valorile calcemiei la un numr de 30 de pacieni, femei i brbai, aacum vedei n figura de jos, din stnga. Introducei datele aa cum le vedei n imagine, iar pentru calcul ulmediei, separat la cele dou sexe, vom proceda astfel:

    9

  • 7/21/2019 Biostatistica MG - LP 2

    10/14

    Laboratorul al II-lea

    Executai clic n orice celula a tabelului pe care l-ai introdus de la tastatur, de exemplu, n A1

    Sortai pacienii dup sex, cu ajutorul comenziiData->Sorti alegnd n caseta Sort by, numele coloaneiSex

    Apoi efectuai comanda Data->Subtotals, i completai ca n figura de mai sus (dreapta sus), n primacaset, numele coloanei Sex, n a doua, funcia de efectuat, Average(media), iar n a treia, trebuie srmm bifat numai numele coloanei Calcemia. Apoi urmrii s fie bifate i opiunile Replace current

    subtotalsi Summary below data, ca n figur. Apoi apsai butonul OKVei observa, aa ca n figura de mai sus, dreaptajos, c pe linia 16 a aprut pe coloana B, media calcemiei lafemei, iar n celula B33, media calcemiei la brbai. n plus, n celula B34, este media pentru toi pacienii,iar la C16, C33 i C34, sunt scrise scurte explicaii. F Average, nseamn media la categoria F, adic lafemei, i aa mai departe.n mod asemntor se pot calcula orice funcii excel, alegnd adecvat numele ei ncaseta n care ai ales nainte funcia Average

    3.2. Subtotaluri pentru date din tabele mari

    S ne punem problema de a calcula media de vrst a pacienilor din tabelul CIROZAseparat cea a femeilorde cea a brbailor.Aceast sarcin se poate realiza n EXCEL cel mai simplu, astfel:

    10

  • 7/21/2019 Biostatistica MG - LP 2

    11/14

    Laboratorul al II-lea

    Se deschide tabelul CIROZA, dac nu este deja deschis

    Folosind secvena Data->Sort,se realizeaz sortarea pacienilor dup coloana SEX, la finalul acesteioperaii fiind listai nti pacienii de sex masculin i apoi cei de sex feminin

    Apoi, se execut secvena Data Subtotals, care deschide fereastra Subtotal (vezi mai sus, stnga)

    n primacaset de dialog, alegei SEX. n a douacaset dedialog alegei Average(media). n atreiacaset de dialog, bifai caseta de validare VARSTA. Verificai s nu fie i alte nume de coloane

    bifate. Apoi, apsai butonul OKRezultatul este c au fost inserate unele linii n tabel, pe care sunt listate subtotalurile. Deoarece noi am cerutmedia (average) calculat dup fiecare schimbare de simbol pe coloana SEX, programul va calcula media devrst a brbailor i respectiv a femeilor.

    Prima linie este inserat dup ultimul pacient de sex masculin, dup lin ia 158, n celua D159. Acolo esteinserat numrul 55 pe coloana vrsta, iar pe coloana SEX este inserat cuvntul Average.Deci, media devrst(rotunjit),la brbai este 55 ani.Dac vei cuta la sfritul tabelului, vei gsi nc dou linii inserate,una cu media de vrst a femeilor i una cu media de vrst pentru toi pacienii.

    Dup cum ai observat, programul Excela afiat mediile de vrst rotunjite la un numr ntreg. Este greu decrezut c dup mprirea sumei vrstelor la numrul de pacieni, s-a ntmplat s dea o medie ntreag i la

    pacienii de sex feminin, i la cei de sex masculin, i la toi pacienii. Explicaia nu poate fi dect cprogramul a rotunjit mediile. Dac este nevoie de o precizie de una sau dou zecimale, procedai astfel:

    Executai clic pe celula D159, unde se afl media de vrst pentru pacienii de sex masculin (vezifigura de mai sus, stnga)

    Executai secvena Format Cells Din ferestra care apare, alegei din caseta de opiune Category, opiunea Number, iar n caseta

    Decimal places, optai pentru trei zecimale(vezi figura de mai sus, dreapta)

    Apoi apsai butonul OK. Media de vrst din celula D159 are acum 3 zecimale

    La fel procedai cu celulele D237 i D238. La final, mediile vor fi afiate cu numrul de zecimale dorit.

    Excel ofer posibilitatea de a face astfel de subtotaluri folosind nu numai o funcie cum este media ci maimulte. Acest lucru se realizeaz astfel:

    Deschidei tabelul LIMFOM.XLS. Urmrii pe coloana H, stadiul evolutiv al afeciunii pentru fiecare pacientn parte, iar pe coloana AC, durata supravieuirii, n luni. Ne propunem s calculm media duratei desupravieuire la pacienii care sunt n stadiul 1, separat la pacienii din stadiul 2, la cei din stadiul 3 i

    stadiul 4. n plus, vom calcula i deviaiile standard, i duratele minime i maxime de supravieuire, pentrufiecare grup de pacieni n parte.

    11

  • 7/21/2019 Biostatistica MG - LP 2

    12/14

    Laboratorul al II-lea

    Realizai sortarea pacienilor dup stadiul evolutiv al bolii, folosind secvena Data->Sorti alegndo singur coloan de sortare,coloana STADIUEV

    Apoi, cu secvena Data->Subtotals, cerei programului s calculeze mediile duratei de supravieuire,completnd ca n figura din stnga. Atenie,pentru a bifa csua de opiune din dreptul numeluiDURATASUP, trebuie s cutai n list cu ajutorul butoanelor triunghiulare. Verificai s nu fie

    bifat dectnumele coloanei DURATASUP, nu i alte nume de coloan. Atenie, s rmn nebifat

    caseta Replace current subtotals Pentru calculul deviaiilor standard la cele patru categorii, repetai secvena Data->Subtotals, i

    schimbai numai numele funciei: n locul funciei Average, alegei StdDev, apoi apsai OK

    Apoi, reluai aceeai secven de dou ori alegnd prima dat funcia Max, iar a doua oar funciaMin

    Acum vom urmri dac programul a calculat i media, i deviaia standard, i minimul i maximul, la toatecele patru grupe de pacieni.Cutai la H10 H13 i vei gsi scrise numele funciilor, precedate de numrul1 (adic au fost calculate pentru pacienii din stadiul 1). Apoi, la AC10 AC13, gsii Minimul (5 luni),Maximul(24 luni), Deviaia standard(6,15 luni) i Media(15,125 luni), pentru pacienii din stadiul I.

    n mod asemntor, vei gsi la H98 H101, numele funciilor precedate de numrul 4 (adic au fost

    calculate pentru pacienii aflai n stadiul 4).

    La H102 H105, gsii din nou numele funciilor precedate de cuvntul Grand (adic funciile au fostcalculate pentru ntregul lot). Rezultatele n sine sunt situate la AC98 AC101 i respectiv AC102 AC105.

    Deoarece programul a inserat valorile mediilor i ale deviaiilor standard cu multe zecimale, se poate face oajustare a numrului de zecimale folosind secvena Format->Cells..., din fereastra care apare alegeiNumberi apsai butonul OK. Vor fi afiate toate numerele cu dou zecimale.

    4. Exerciiii chestiuni de examen1. Calculai indicatorii statistici la tabelul CARDIO, la coloanele care reprezint tensiunile: TAMAXINT,TAMININT, TAMAX2S, TAMIN2S, TAMAX3L, TAMIN3L (tensiunile sistolic i diastolic ale

    pacienilor la internare, la dou sptmni de tratament i la 3 luni la controlul postspitalizare). ncepei cucoloana TAMAXINT, apoi prin copiere, calculai i pentru celelalte 5 coloane. Scriei pe o foaie de hrtie,ntr-un tabel, mediile, deviaiile standard i coeficienii de variaie pentru cele 6 coloane , iar ntr-un alt tabel,indicatorii de asimetrie.

    12

  • 7/21/2019 Biostatistica MG - LP 2

    13/14

    Laboratorul al II-lea

    2. Folosind funcia Descriptive statistics, calculai indicatorii statistici pentru coloana numit Hb,(TabelulCIROZA) pe care a fost nregistrat hemoglobina pacienilor. Pe o coal de hrtie, scriei n ordine, unul subaltul, urmtorii indicatori: media, deviaia standard, coeficientul de variaie (l calculai!), apoi valoareaminim, cuartila Q1, mediana, cuartila Q3, valoarea maxim. La sfrit, mai precizai excentricitatea(skewness) i boltirea (kurtosis).

    3. Folosind funcia Descriptive statistics, calculai indicatorii statistici pentru coloana BRT (bilirubina

    total) i observai c de data aceasta media i mediana difer foarte mult, iar excentricitatea este mult maimare. Scriei pe o foaie de hrtie centralizarea situaiei parametrului bilirubina total, preciznd media,deviaia standard, coeficientul de variaie, iar ca excentricitate, precizai mediana i quartilele sub formamediana [cuartila Q1; cuartila Q3].

    4. Un numr de 22 de pacieni au fost testai prin chestionarul scalei Oswestry, care urmrete s gradezeincapacitatea unui pacient cauzat de durerea lombar joas. Scorurile pot fi cuprinse ntre 0 i 100, cu 0

    pentru sntos i 100 pentru maximum de incapacitate. Cei 22 de pacieni au obinut urmtoarele scoruri: 56,42, 48, 64, 33, 34, 22, 68, 24, 57, 48, 46, 57, 51, 40, 63, 60, 49, 59, 45, 46, 43. Calculai indicatorii statistici

    pentru seria celor 22 de scoruri obinute de cei 22 de pacieni.

    5. Folosind subtotaluri, calculai mediile i deviaiile standard pentru tensiunea arterial sistolic la internare(TAMAXI), la pacienii din tabelul CARDIO, la fiecare profesie n parte.

    Va trebui s sortai pacienii dup profesie, cu ajutorul secvenei Data ->Sort, dup care executai de dou orisecvena Data->Subtotals. n fereastra Subtotal, n caseta numit At each change in, vei pune PROFESIE,n caseta Use function, vei pune Average, iar n caseta Add subtotal to, veiavea grij s fie bifat numaiTAMAXI. Apsai OK. Apoi reluai, cu secvena Data->Subtotals avnd grij s bifai n caseta Usefunction, numele funciei Stdev.

    6. Folosind subtotaluri, realizai calculul mediei i deviaiei standard pentru latena mediepe ochiul stng(LMS) la pacienii din tabelul MIGRENA, separat la fiecare afeciune.

    Afeciunile sunt nregistrate pe coloana DIAG, i sunt: MCLS (Migren clasic), MCOM (Migrena comun),HCEF (Hidrocefalie), PSN (Pseudo-neurastenie), SPB (Sindrom pseudo-bulbar), LC (Lacunarism cerebral)i NORM (Normali). n acest caz, nu este nevoie s realizai sortarea pacienilor, deoarece tabelul este grupat

    deja dup afeciuni (Coloana DIAG). Coloana nu este sortat alfabetic, ns pentru calculul subtotaluriloreste nevoie numai de gruparea pe daignostice. Dup ce laculai mediile, vei constata medii mult crescute laafeciunea numit LC.

    7. Folosind subtotaluri, calculai mediile i deviaiile standard i la coloanele LMD (Latena medie pe ochiuldrept), AMS (Amplitudinea medie pe ochiul stng) i AMD (Amplitudinea medie pe ochiul drept) la

    pacienii din tabelul MIGRENA, separat la fiecare afeciune. Vezi ex. 6 pentru indicaii.

    8. Un studiu complex, a urmrit printre altele, s stabileasc dac scorurile obinute pe scala IDG (Indexul deIncapacitate Cervical), la un lot de 105 pacieni cu disabiliti motorii, sunt influenate de vrst i de sex. Afost alctuit un eantion format din 105 pacieni, 39 femei i 66 brbai, cu diferite vrste. Repartizarea pegrupe de vrste a fost cea din tabelul de mai jos:

    Feminin Masculin Total

    55 ani 16 32 48

    Total 39 66 105

    Scorurile obinute de pacieni sunt listate n tabelul IDG.xls mpreun cu grupa de vrst i sexul fiecruiindivid. Calculai mediile scorului IDG separat la femei i la brbai. Apoi, calculai mediile scorului IDG la

    pacienii din diferite grupe de vrst. Pentru calculul mediilor la femei i la brbai, realizai nti sortareadup sex i apoi efectuai subtotaluri cernd funcia Average. Pentru calculul mediilor scorului IDG nfuncie de vrst, sortai din nou pacienii, de data aceasta dup coloana GRV, i apoi efectuai subtotalurile.

    13

  • 7/21/2019 Biostatistica MG - LP 2

    14/14

    Laboratorul al II-lea

    9. Folosind comanda FREQ, apreciai dac se distribuie simetric valorile hemoglobinei la pacienii dintabelul CIROZA.

    10. Apreciai dac talia i greutatea pacienilor din tabelul SHR se distribuie simetric. Coloanele unde au fostnregistrate aceste date n tabelul SHR se numesc Talie i respectiv, Greut1. Atenie, dac lucrai n EPIINFO, va fi nevoie s realizai nainte citirea tabelului SHR folosind comanda READ.

    11. Printre alte teste la care sunt supui pacienii cu astm, pentru a realiza o imagine a abilitilor lor motorii

    este i testul 6MWD (distana pe care o pot parcurge n 6 minute), iar pentru monitorizarea dispneei(greutii n respiraie), scala Borg. n tabelul ASTM, pe coloana BORGI a fost nregistrat scorul Borg la 240de pacieni. La aceiai 240 de pacieni bolnavi de astm, a fost msurat i scorul 6MWD pe coloana 6MWDI.Folosind comanda FREQ, stabilii dac valorile celor dou scoruri au o distribuie simetric.

    12. Calculai folosind funcii excel sau comanda Descriptive statistics, indicatorii statistici ai tendineicentrale pentru coloanele BRT i HB din tabelul CIROZA.

    13. Calculai indicatorii de mprtiere pentru tensiunea arterial sistolicla internare, la dou sptmni i la3 luni, la pacienii din tabelul CARDIO. Coloanele se numesc TAMAXI, TAMAX2S i TAMAX3L.

    14. n tabelul ASTM, pe coloanele 6MWDI, 6MWDM, 6MWDF, sunt nregistrate pentru fiecare din cei 240de pacieni bolnavi de astm bronic, distana parcurs n 6 minute la msurtoarea iniial, nainte de

    tratament, la msurtoarea intermediar, la mijlocul tratamentului, precum i la msurtoarea final, dupefectuarea tratamentului. Ateptrile celor care au aplicat tratamentul au fost c pacienii ar trebui sparcurg distane din ce n ce mai mari, cu avansarea tratamentului. Folosind comanda MEANS, calculaimedia la cele trei coloane i verificai dac n medie, distana parcurs iniial de pacieni, crete lamsurtoarea intermediar i apoi, din nou la msurtoarea final. Apreciai de asemenea, dac dispersiavalorilor la msurtoarea iniial este n cretere sau n descretere la msurtorile intermediar i final.

    14