lp 6 excel 2009

6
LP 6 EXCEL – Corelaţii şi regresii liniare în Data Analysis Realizaţi următorul tabel în MS Excel : Nr.c rt. NUME Sex Vârs Greuta te Glicem ie – mom. 0 Glicem ie – 3 luni Glicem ie – 6 luni Asigur at CAS 1 AB M 35 65 132 125 119 T 2 CA M 24 70 133 133 106 T 3 CD F 22 75 118 113 109 F 4 DE F 53 80 111 107 97 T 5 MN M 20 90 112 101 95 T 6 MA F 37 100 130 122 97 T 7 MD F 29 75 125 115 105 T 8 NB M 56 98 138 121 109 F 9 NC F 27 59 129 110 108 F 10 DC F 21 55 110 115 105 F 11 TR F 36 65 113 111 99 T 12 AT M 38 87 145 133 129 F 13 LD F 29 82 138 132 130 T 14 GF M 44 94 132 130 131 F 15 DS M 42 115 130 126 128 T 16 AC F 32 97 125 120 105 F 17 DM F 25 98 124 124 116 T 18 SG F 29 100 122 111 107 F 19 NR M 39 112 127 114 108 F 20 TS M 40 85 118 108 108 T 21 CA M 60 102 121 115 98 T 22 CD F 58 101 136 130 128 T 23 DE M 56 92 118 110 105 T 24 MN M 55 91 116 109 99 T 25 MA F 45 89 135 128 126 T 26 MD M 30 88 120 113 107 F 27 NB M 18 97 127 120 102 T 28 NC F 31 75 129 118 105 T 29 DC F 24 74 126 115 103 T 30 TR M 22 76 132 116 96 T 31 AT M 53 80 133 124 116 F 32 LD M 20 65 131 122 113 T 33 GF M 37 70 139 123 111 F 34 DS M 29 80 133 121 108 T 35 AC F 56 60 128 121 109 F 36 DM F 27 58 127 126 116 T 37 SG M 21 68 124 122 113 T 38 NR M 36 85 123 119 109 T 39 TS M 38 93 145 135 135 T 40 CA M 29 94 131 130 132 T 41 CD M 44 103 130 128 118 T 42 DE M 42 111 124 120 119 T 43 MN M 32 97 119 108 106 F

Upload: alynutza-geanina

Post on 03-Oct-2015

217 views

Category:

Documents


2 download

DESCRIPTION

lp

TRANSCRIPT

LP 6 EXCEL Corelaii i regresii liniare n Data AnalysisRealizai urmtorul tabel n MS Excel:

Nr.crt.NUMESexVrst GreutateGlicemie mom. 0Glicemie 3 luniGlicemie 6 luniAsigurat CAS

1ABM3565132125119T

2CAM2470133133106T

3CDF2275118113109F

4DEF538011110797T

5MNM209011210195T

6MAF3710013012297T

7MDF2975125115105T

8NBM5698138121109F

9NCF2759129110108F

10DCF2155110115105F

11TRF366511311199T

12ATM3887145133129F

13LDF2982138132130T

14GFM4494132130131F

15DSM42115130126128T

16ACF3297125120105F

17DMF2598124124116T

18SGF29100122111107F

19NRM39112127114108F

20TSM4085118108108T

21CAM6010212111598T

22CDF58101136130128T

23DEM5692118110105T

24MNM559111610999T

25MAF4589135128126T

26MDM3088120113107F

27NBM1897127120102T

28NCF3175129118105T

29DCF2474126115103T

30TRM227613211696T

31ATM5380133124116F

32LDM2065131122113T

33GFM3770139123111F

34DSM2980133121108T

35ACF5660128121109F

36DMF2758127126116T

37SGM2168124122113T

38NRM3685123119109T

39TSM3893145135135T

40CAM2994131130132T

41CDM44103130128118T

42DEM42111124120119T

43MNM3297119108106F

44MAF2558129115114T

45MDM2969128120109F

46NBM3976127125108T

47NCF4077129126112T

48DCM2478132128113T

49TRM2284127120117T

50ATM5396128115116T

1. Determinai coeficienii de corelaie ntre Vrst, Greutate i Glicemie la mom. 0, pentru a putea afla dac vrsta sau greutatea influeneaz n vreun fel valorile Glicemiei.Una dintre condiiile necesare pentru a putea calcula coeficienii de corelaie este ca variabilele pentru care dorim s i calculm s fie situate n coloane nvecinate condiie realizat n cazul tabelului nostru altfel, coloanele respective ar trebui copiate i rearanjate separat.

Se selecteaz comanda Data / Data Analysis / Correlation:

Rezultatele sunt afiate dup cum urmeaz:

Se genereaz de fapt Matricea Coeficienilor de Corelaie, ce conine Coeficienii de corelaie Pearson ntre toate perechile posibile de variabile selectate prin comand.

Coeficienii de corelaie Pearson reprezint msura intensitii legturii liniare ntre dou variabile i au valori cuprinse ntre -1 i 1. Valorile apropiate de 0 indic absena corelaiei ntre variabilele respective, iar valorile apropiate de 1 sau de -1 indic prezena unei corelaii puternice ntre variabile.

Valorile negative indic prezena unei corelaii invers proporionale (atunci cnd valorile uneia dintre variabile cresc, valorile celeilalte variabile scad corespunztor), iar valorile pozitive indic prezena unei corelaii direct proporionale (atunci cnd valorile uneia dintre variabile cresc, valorile celeilalte variabile cresc i ele).

Colton (1974) a indicat urmtoarele reguli empirice pentru interpretarea coeficienilor de corelaie:

Un coeficient de corelaie ntre 0,00 i 0,25, semnific o corelaie nul sau foarte slab, Un coeficient de corelaie ntre 0,25 i 0,50 semnific o corelaie acceptabil,

Un coeficient de corelaie ntre 0,50 i 0,75 semnific o corelaie moderat spre bun, Un coeficient de corelaie peste 0,75 semnific o corelaie foarte bun.n cazul nostru, corelaia ntre greutate i vrst este 0.3879, deci pozitiv, acceptabil, dar corelaiile ntre glicemie i vrst (0.0697) respectiv glicemie i greutate (0.0660) sunt practic nule.

2. Determinai coeficienii de covarian ntre Vrst, Greutate i Glicemie la mom. 0, pentru a putea afla dac vrsta sau greutatea influeneaz n vreun fel valorile Glicemiei.

Covariana este o msur premergtoare calculului coeficienilor de corelaie ntre dou variabile, definit ca media produselor deviaiilor pentru fiecare pereche de puncte. Spre deosebire de coeficientul de corelaie, coeficientul de covarian nu aparine unui interval dat de valori, putnd lua ca valoare orice numr real.

Covariana se folosete pentru a determina doar natura legturii ntre cele 2 variabile: valorile pozitive ale ei indic o legtur direct proporional ntre variabile, valorile negative indic o legtur invers proporional, iar valorile apropiate de 0 indic absena unei influene ntre cele dou variabile.

Se selecteaz comanda Data / Data Analysis / Covariance: Rezultatele sunt afiate dup cum urmeaz:

ntre toate cele 3 variabile exist o legtur direct proporional, mai accentuat ntre Greutate i Vrst (69.0012), i foarte slab ntre Glicemie i Vrst (6.3772), respectiv Greutate (7.7596).

3. Construii modelul de regresie liniar ntre Vrst i Glicemie la mom. 0, respectiv Greutate i Glicemie la mom. 0, pentru a determina modul n care aceste variabile influeneaz valorile Glicemiei. Comentai rezultatele obinute i realizai reprezentarea grafic corespunztoare (de tip SCATTER). Se selecteaz comanda Data / Data Analysis / Regression:

Rezultatele sunt afiate dup cum urmeaz:

Regression Statistics:

Multiple R: este coeficientul de corelaie calculat anterior, ntre Vrst i Glicemie; R Square: se mai numete i Coeficient de Determinare, i reprezint proporia din variaia variabilei Y (Glicemie) care este explicat de influena liniar a variabilei X (0.0048 foarte mic n cazul nostru); Adjusted R Square: Coeficientul de Determinare corectat;

Standard Error: eroarea medie nregistrat la predicia valorilor medii ale variabilei Y (Glicemie) prin ecuaia de regresie liniar (7.9118 de asemeni foarte mic, dar nu pentru c modelul de regresie este bun, ci pentru c acesta este total inadecvat).

ANOVA: Analiza de regresie conine i un test cu ipotez nul, care afirm c panta dreptei de regresie este egal cu 0 (deci nu exist nici un fel de corelaie ntre cele 2 variabile). Pentru a se verifica testul respectiv, se calculeaz statistica F = 0.234971 i nivelul su de semnificaie p = 0.63007.

Dac p 0.05 nseamn c ipoteza nul este CONFIRMAT, panta dreptei de regresie este 0 i nu exist nici o relaie semnificativ ntre X i Y cazul de fa, p = 0.63007.

Regression: variaia lui Y explicat de X (= 14.70855)

Residual: variaia lui Y neexplicat de X (= 3004.671, mult mai mare dect cellalt coeficient)

Total: variaia total a lui Y, suma ntre Regression i Residual. Coefficients: reprezint coeficienii dreptei de regresie.Ecuaia dreptei de regresie are forma general y=ax+b, unde:

a = 0.046128 reprezint PANTA dreptei; cu ct este mai mare, cu att semnific o dreapt mai nclinat, deci o legtur mai puternic; cnd panta are o valoare pozitiv, atest o corelaie direct proporional ntre cele 2 variabile, n timp ce atunci cnd are o valoare negativ, atest o corelaie invers proporional ntre cele 2 variabile. b = 125.544281 reprezint INTERCEPTUL CU AXA OY: punctul n care dreapta intersecteaz axa vertical.Reprezentarea grafic se realizeaz folosind comanda SCATTER, n care pe axa Orizontal se pune variabila independent, iar pe cea Vertical variabila dependent (influenat de cealalt).Pentru a se figura pe acest grafic ecuaia dreptei de regresie, se selecteaz punctele din norul de puncte, dup care se activeaz menu-ul personalizat (click dreapta) din care se alege opiunea Add trendline.Se bifeaz tipul de regresie dorit Linear, i opiunile

Display Equation on chart: pentru afiarea pe grafic a ecuaiei dreptei de regresie,

Display R-squared value on chart: pentru afiarea pe grafic a coeficientului de determinare.

Graficul care se obine va fi:

Se precizeaz locul de afiare a rezultatelor pe foaia de calcul curent, pe o nou foaie de calcul sau chiar ntr-un registru de calcul nou.

Se bifeaz cnd n prima celul din fiecare coloan se afl numele variabilei.

Se specific modul de grupare a valorilor n coloane n cazul de fa.

Se specific irul de celule n care se afl valorile variabilelor pentru care dorim s calculm coeficienii de corelaie.

Se specific irul de celule n care se afl valorile variabilelor pentru care dorim s calculm coeficienii de corelaie.

Se precizeaz locul de afiare a rezultatelor pe foaia de calcul curent, pe o nou foaie de calcul sau chiar ntr-un registru de calcul nou.

Se bifeaz cnd n prima celul din fiecare coloan se afl numele variabilei.

Se specific modul de grupare a valorilor n coloane n cazul de fa.

Se precizeaz locul de afiare a rezultatelor pe foaia de calcul curent, pe o nou foaie de calcul sau chiar ntr-un registru de calcul nou.

Se vor calcula i intervalele de ncredere 95% n jurul dreptei de regresie.

Se bifeaz cnd n prima celul din fiecare coloan se afl numele variabilei.

Se specific irul de celule n care se afl valorile variabilei independente / care influeneaz - Vrsta.

Se specific irul de celule n care se afl valorile variabilei dependente / influenate - Glicemia.

Se vede clar din ecuaia dreptei de regresie c practic Vrsta nu influeneaz deloc Glicemia, dreapta fiind paralel cu axa orizontal.