lp 6 excel 2009
DESCRIPTION
lpTRANSCRIPT
LP 6 EXCEL Corelaii i regresii liniare n Data AnalysisRealizai urmtorul tabel n MS Excel:
Nr.crt.NUMESexVrst GreutateGlicemie mom. 0Glicemie 3 luniGlicemie 6 luniAsigurat CAS
1ABM3565132125119T
2CAM2470133133106T
3CDF2275118113109F
4DEF538011110797T
5MNM209011210195T
6MAF3710013012297T
7MDF2975125115105T
8NBM5698138121109F
9NCF2759129110108F
10DCF2155110115105F
11TRF366511311199T
12ATM3887145133129F
13LDF2982138132130T
14GFM4494132130131F
15DSM42115130126128T
16ACF3297125120105F
17DMF2598124124116T
18SGF29100122111107F
19NRM39112127114108F
20TSM4085118108108T
21CAM6010212111598T
22CDF58101136130128T
23DEM5692118110105T
24MNM559111610999T
25MAF4589135128126T
26MDM3088120113107F
27NBM1897127120102T
28NCF3175129118105T
29DCF2474126115103T
30TRM227613211696T
31ATM5380133124116F
32LDM2065131122113T
33GFM3770139123111F
34DSM2980133121108T
35ACF5660128121109F
36DMF2758127126116T
37SGM2168124122113T
38NRM3685123119109T
39TSM3893145135135T
40CAM2994131130132T
41CDM44103130128118T
42DEM42111124120119T
43MNM3297119108106F
44MAF2558129115114T
45MDM2969128120109F
46NBM3976127125108T
47NCF4077129126112T
48DCM2478132128113T
49TRM2284127120117T
50ATM5396128115116T
1. Determinai coeficienii de corelaie ntre Vrst, Greutate i Glicemie la mom. 0, pentru a putea afla dac vrsta sau greutatea influeneaz n vreun fel valorile Glicemiei.Una dintre condiiile necesare pentru a putea calcula coeficienii de corelaie este ca variabilele pentru care dorim s i calculm s fie situate n coloane nvecinate condiie realizat n cazul tabelului nostru altfel, coloanele respective ar trebui copiate i rearanjate separat.
Se selecteaz comanda Data / Data Analysis / Correlation:
Rezultatele sunt afiate dup cum urmeaz:
Se genereaz de fapt Matricea Coeficienilor de Corelaie, ce conine Coeficienii de corelaie Pearson ntre toate perechile posibile de variabile selectate prin comand.
Coeficienii de corelaie Pearson reprezint msura intensitii legturii liniare ntre dou variabile i au valori cuprinse ntre -1 i 1. Valorile apropiate de 0 indic absena corelaiei ntre variabilele respective, iar valorile apropiate de 1 sau de -1 indic prezena unei corelaii puternice ntre variabile.
Valorile negative indic prezena unei corelaii invers proporionale (atunci cnd valorile uneia dintre variabile cresc, valorile celeilalte variabile scad corespunztor), iar valorile pozitive indic prezena unei corelaii direct proporionale (atunci cnd valorile uneia dintre variabile cresc, valorile celeilalte variabile cresc i ele).
Colton (1974) a indicat urmtoarele reguli empirice pentru interpretarea coeficienilor de corelaie:
Un coeficient de corelaie ntre 0,00 i 0,25, semnific o corelaie nul sau foarte slab, Un coeficient de corelaie ntre 0,25 i 0,50 semnific o corelaie acceptabil,
Un coeficient de corelaie ntre 0,50 i 0,75 semnific o corelaie moderat spre bun, Un coeficient de corelaie peste 0,75 semnific o corelaie foarte bun.n cazul nostru, corelaia ntre greutate i vrst este 0.3879, deci pozitiv, acceptabil, dar corelaiile ntre glicemie i vrst (0.0697) respectiv glicemie i greutate (0.0660) sunt practic nule.
2. Determinai coeficienii de covarian ntre Vrst, Greutate i Glicemie la mom. 0, pentru a putea afla dac vrsta sau greutatea influeneaz n vreun fel valorile Glicemiei.
Covariana este o msur premergtoare calculului coeficienilor de corelaie ntre dou variabile, definit ca media produselor deviaiilor pentru fiecare pereche de puncte. Spre deosebire de coeficientul de corelaie, coeficientul de covarian nu aparine unui interval dat de valori, putnd lua ca valoare orice numr real.
Covariana se folosete pentru a determina doar natura legturii ntre cele 2 variabile: valorile pozitive ale ei indic o legtur direct proporional ntre variabile, valorile negative indic o legtur invers proporional, iar valorile apropiate de 0 indic absena unei influene ntre cele dou variabile.
Se selecteaz comanda Data / Data Analysis / Covariance: Rezultatele sunt afiate dup cum urmeaz:
ntre toate cele 3 variabile exist o legtur direct proporional, mai accentuat ntre Greutate i Vrst (69.0012), i foarte slab ntre Glicemie i Vrst (6.3772), respectiv Greutate (7.7596).
3. Construii modelul de regresie liniar ntre Vrst i Glicemie la mom. 0, respectiv Greutate i Glicemie la mom. 0, pentru a determina modul n care aceste variabile influeneaz valorile Glicemiei. Comentai rezultatele obinute i realizai reprezentarea grafic corespunztoare (de tip SCATTER). Se selecteaz comanda Data / Data Analysis / Regression:
Rezultatele sunt afiate dup cum urmeaz:
Regression Statistics:
Multiple R: este coeficientul de corelaie calculat anterior, ntre Vrst i Glicemie; R Square: se mai numete i Coeficient de Determinare, i reprezint proporia din variaia variabilei Y (Glicemie) care este explicat de influena liniar a variabilei X (0.0048 foarte mic n cazul nostru); Adjusted R Square: Coeficientul de Determinare corectat;
Standard Error: eroarea medie nregistrat la predicia valorilor medii ale variabilei Y (Glicemie) prin ecuaia de regresie liniar (7.9118 de asemeni foarte mic, dar nu pentru c modelul de regresie este bun, ci pentru c acesta este total inadecvat).
ANOVA: Analiza de regresie conine i un test cu ipotez nul, care afirm c panta dreptei de regresie este egal cu 0 (deci nu exist nici un fel de corelaie ntre cele 2 variabile). Pentru a se verifica testul respectiv, se calculeaz statistica F = 0.234971 i nivelul su de semnificaie p = 0.63007.
Dac p 0.05 nseamn c ipoteza nul este CONFIRMAT, panta dreptei de regresie este 0 i nu exist nici o relaie semnificativ ntre X i Y cazul de fa, p = 0.63007.
Regression: variaia lui Y explicat de X (= 14.70855)
Residual: variaia lui Y neexplicat de X (= 3004.671, mult mai mare dect cellalt coeficient)
Total: variaia total a lui Y, suma ntre Regression i Residual. Coefficients: reprezint coeficienii dreptei de regresie.Ecuaia dreptei de regresie are forma general y=ax+b, unde:
a = 0.046128 reprezint PANTA dreptei; cu ct este mai mare, cu att semnific o dreapt mai nclinat, deci o legtur mai puternic; cnd panta are o valoare pozitiv, atest o corelaie direct proporional ntre cele 2 variabile, n timp ce atunci cnd are o valoare negativ, atest o corelaie invers proporional ntre cele 2 variabile. b = 125.544281 reprezint INTERCEPTUL CU AXA OY: punctul n care dreapta intersecteaz axa vertical.Reprezentarea grafic se realizeaz folosind comanda SCATTER, n care pe axa Orizontal se pune variabila independent, iar pe cea Vertical variabila dependent (influenat de cealalt).Pentru a se figura pe acest grafic ecuaia dreptei de regresie, se selecteaz punctele din norul de puncte, dup care se activeaz menu-ul personalizat (click dreapta) din care se alege opiunea Add trendline.Se bifeaz tipul de regresie dorit Linear, i opiunile
Display Equation on chart: pentru afiarea pe grafic a ecuaiei dreptei de regresie,
Display R-squared value on chart: pentru afiarea pe grafic a coeficientului de determinare.
Graficul care se obine va fi:
Se precizeaz locul de afiare a rezultatelor pe foaia de calcul curent, pe o nou foaie de calcul sau chiar ntr-un registru de calcul nou.
Se bifeaz cnd n prima celul din fiecare coloan se afl numele variabilei.
Se specific modul de grupare a valorilor n coloane n cazul de fa.
Se specific irul de celule n care se afl valorile variabilelor pentru care dorim s calculm coeficienii de corelaie.
Se specific irul de celule n care se afl valorile variabilelor pentru care dorim s calculm coeficienii de corelaie.
Se precizeaz locul de afiare a rezultatelor pe foaia de calcul curent, pe o nou foaie de calcul sau chiar ntr-un registru de calcul nou.
Se bifeaz cnd n prima celul din fiecare coloan se afl numele variabilei.
Se specific modul de grupare a valorilor n coloane n cazul de fa.
Se precizeaz locul de afiare a rezultatelor pe foaia de calcul curent, pe o nou foaie de calcul sau chiar ntr-un registru de calcul nou.
Se vor calcula i intervalele de ncredere 95% n jurul dreptei de regresie.
Se bifeaz cnd n prima celul din fiecare coloan se afl numele variabilei.
Se specific irul de celule n care se afl valorile variabilei independente / care influeneaz - Vrsta.
Se specific irul de celule n care se afl valorile variabilei dependente / influenate - Glicemia.
Se vede clar din ecuaia dreptei de regresie c practic Vrsta nu influeneaz deloc Glicemia, dreapta fiind paralel cu axa orizontal.