cap 11 cluster.doc
TRANSCRIPT
-
8/14/2019 Cap 11 Cluster.doc
1/8
-
8/14/2019 Cap 11 Cluster.doc
2/8
dinainte, ci urmeaz# a se stabili ulterior. Pentru acest tip de analiz# exist# 3'4 metodealgoritmi/ de formare a grupurilor, printre care) leg#tur# inter'grupuri, leg#tur# intra'grupuri, metoda vecinului cel mai apropiat, metoda 5ard etc. 6lasificareaneierarhic#, n schimb, presupune stabilirea anticipat# a num#rului de clustere,urm&nd ca analiza s# identifice indivizii din fiecare cluster. Pentru acest tip de analiz#
exist# dou# metode de clasificare) clasificare simpl#, pe de o parte, i iteraie iclasificare, pe de alt# parte. $n general, este bine ca la clasificarea neierarhic# s# selucreze cu variabile standardizate, mai ales dac# variabilele iniiale au unit#i dem#sur# foarte diferite.
7. Definirea i etichetarea (numirea clusterelor. Aceasta se face , un general, studiindcaracteristicile fiec#rui cluster i descriind un profil al indivizilor din fiecare grup unparte.
8. !alidarea clusterelor. uli analiti evit# aceast# ultim# etap#, deoarece este dificil#i nu exist# o metod# standard pentru realizarea sa. 9 posibil# metod# de validare esteaceea de a aplica o analiz# de discriminant pentru clusterele formate i a vedea dac#aceste clustere sunt suficient de diferite untre ele din punctul de vedere al variabilelorfolosite iniial n clasificare.
$n cele ce urmeaz# vom da dou# exemple de realizare a analizei cluster, pentru fiecare dincele dou# categorii) ierarhic# i nodal#.
Realizarea analizei cluster n SPSS
:om rula o analiz# cluster de tip ierarhic pe o baz# de date numit# judete.sav, carecuprinde o serie de date economico'sociale despre ;udeele #rii i despre municipiul Classify > Hierachical Cluster
:ariabilele de analiz# vor fi introduse un c&mpul !ariable(s"Pentru a alege metoda degrupare, se apas# butonul Method. 0intre metodele propuse de SPSS, vom alege#et$een%grouplinkage gruparea poate fi realizat# succesiv prin mai multe metode i compara eficienafiec#reia/. $ntruc&d datele folosite de noi sunt de tip numeric, vom utiliza ca indicator deproximitate distana euclidian#.
S# ap#s#m acum butonul Statistics, pentru a preciza o serie de aspecte legate de outputulfinal. $n cadranul &luster 'embershipselect#m opiuneaange of solutions, iar n c&mpurile)romi *hroughintroducem valorile + i 7, respectiv. Aceasta nseamn# c# i cerem programuluis# ne indice apartenena ;udeelor la fiecare cluster pentru trei tipuri de soluii posibile, av&ndfiecare +, 1 i 7 grupuri respectiv.
-
8/14/2019 Cap 11 Cluster.doc
3/8
$n final, s# ap#s#m butonul Savepentru a'i cere programului s# salveze ca variabilesoluiile finale, cu +, 1 i 7 grupuri respectiv select#m exact aceleai opiuni ca la butonulStatistics/.
=abelul cel mai important care se obine n urma realiz#rii analizei de cluster de tip
ierarhic este cel de mai ;os)
Cluster Membership
Case 4 Clusters 3 Clusters 2 Clusters
1:teleorman 1 1 1
2:mehedinti 2 1 1
3:olt 1 1 1
4:arges 3 2 1
5:valcea 1 1 1
6:botosani 1 1 1
7:suceava 3 2 1
8:iasi 3 2 1
9:neamt 1 1 11:vaslui 1 1 1
11:bacau 3 2 1
12:vrancea 1 1 1
13:covasna 2 1 1
14:galati 3 2 1
15:braila 1 1 1
16:bu!au 1 1 1
17:tulcea 2 1 1
18:harghita 2 1 1
19:constanta 1 1 1
2:calarasi 2 1 1
21:giurgiu 2 1 1
22:prahova 3 2 1
23:il"ov 2 1 1
24:dol# 3 2 1
25:bucuresti 4 3 2
26:mures 3 2 1
27:brasov 3 2 1
28:ialomita 2 1 1
29:bistrita$nasaud
2 1 1
3:dambovita 1 1 1
31:gor# 1 1 1
32:sibiu 1 1 1
33:maramures 1 1 134:clu# 3 2 1
35:hunedoara 1 1 1
36:satu$mare 1 1 1
37:alba 1 1 1
38:bihor 3 2 1
39:caras$severin
2 1 1
4:timis 3 2 1
-
8/14/2019 Cap 11 Cluster.doc
4/8
41:arad 1 1 1
42:sala# 2 1 1
Acest tabel ne indic# apartenena fiec#rui ;ude la un cluster, pentru cele trei soluii
posibile +'7 clustere/. Se observ# c# n fiecare situaie municipiul Classify > K-Means Cluster
ai nt&i vom introduce n c&mpul !ariablesvalorile standardizate generate anterior, iarn c&mpul+abel &ases byvom introduce variabile country.
>um#rul de opiuni disponibil aici este mult mai mic dec&t cel de la analiza tipologic#ierarhic#. $n c&mpul,umber of clustersintroducem valoarea 1 aadar, i impunem programului/s# genereze trei grupuri/. etoda de grupare aleas# va fi-terate and classify. ?#m&ne acum s#preciz#m o serie de elemente ale outputului final, astfel)
' ap#s#m butonul Savei select#m opiunea &luster membershipaceasta nseamn# c#programul va salva apartenena la clustere ntr'o variabil# categorial#/@
' ap#s#m butonul Optionsi select#m opiunea &luster information for each case.
at# cele mai importante tabele generate de aceast# analiz# cluster.
Cluster Membership
Case%umber
C&'%()* Cluster +istance
1 ,"ghanistan - -
2 ,rgentina 2 1-215
3 ,rmenia - -
4 ,ustralia 2 1-3495 ,ustria 2 1-665
6 ,!erbai#an - -
7 .ahrain - -
8 .angladesh 3 1-47
9 .arbados - -
1 .elarus - -
11 .elgium - -
12 .olivia 3 1-56
-
8/14/2019 Cap 11 Cluster.doc
5/8
13 .osnia - -
14 .ots/ana 3 1-298
15 .ra!il 2 2-416
16 .ulgaria - -
17 .ur0ina aso 3 2-137
18 .urundi 3 1-78
19 Cambodia 3 1-4852 Cameroon 3 -353
21 Canada 2 1-779
22 Cent- ,"ri-) 3 2-452
23 Chile 2 1-572
24 China 1 1-383
25 Colombia 2 1-619
26 Costa )ica 2 1-86
27 Croatia - -
28 Cuba - -
29 C!ech )ep- - -
3 +enmar0 2 1-731
31 +omincan )- 2 2-191
32 cuador 2 1-93733 gpt 3 2-136
34 l alvador 3 1-717
35 stonia - -
36 thiopia 3 2-27
37 inland 2 1-217
38 rance 2 1-68
39 abon 3 -884
4 ambia - -
41 eorgia - -
42 erman 2 1-52
43 reece 2 1-437
44 uatemala 3 1-219
45 aiti 3 1-695
46 onduras 3 1-838
47 ong ong - -
48 ungar 2 1-351
49 celand - -
5 ndia 1 1-383
51 ndonesia 3 1-959
52 ran 3 2-394
53 ra 2 2-145
54 reland 2 1-439
55 srael - -
56 tal 2 1-49
57 apan 2 1-88458 ordan 2 1-711
59 ena 3 -84
6 u/ait 2 1-367
61 ;atvia - -
62 ;ebanon - -
63 ;iberia 3 -924
64 ;iba 2 2-65
65 ;ithuania - -
-
8/14/2019 Cap 11 Cluster.doc
6/8
66 Malasia 2 1-954
67 Mea0istan - -
77 >anama 2 1-761
78 >aragua 2 1-787
79 >eru 3 2-356
8 >hilippines 3 2-55
81 >oland - -
82 >ortugal - -
83 )omania 2 1-397
84 )ussia - -
85 )/anda 3 2-9886 - orea - -
87 audi ,rabia 2 1-665
88 enegal 3 -885
89 ingapore 2 1-438
9 omalia 3 1-625
91 outh ,"rica - -
92 pain 2 1-98
93 /eden 2 1-47
94 /it!erland 2 2-259
95 ria - -
96 (ai/an - -
97 (an!ania 3 2-16
98 (hailand 3 2-431
99 (ur0e 2 1-253
1 '-,rab m- - -
11 ' 2 1-36
12 ', 2 2-816
13 'ganda 3 2-259
14 '0raine - -
15 'rugua 2 1-523
16 '!be0istan - -
17 ?ene!uela 2 1-645
18 ?ietnam 3 2-14
19 =ambia 3 1-898
Acest tabel ne arat# n ce cluster se afl# fiecare ar# numai pentru #rile pentru care nuexist# date lips#/, precum i distana n abateri standard/ de la fiecare ar# la centrul clusteruluic#ruia i aparine.
-
8/14/2019 Cap 11 Cluster.doc
7/8
inal Cluster Centers
Cluster
1 2 3
=score: >opulation in thousands 6-88817 $-145 $-9917
=score: >eople living in cities @AB $1-2613 -66244 $-97875=score: >eople /ho read @AB $-58281 -53741 $-97188
=score: ross domestic product capita $-8543 -6172 $-7773
=score: +ail calorie inta0e $-56325 -6515 $-87343
=score: ,verage "emale li"e eMB ,verage male li"ee
-
8/14/2019 Cap 11 Cluster.doc
8/8
Analiza cluster este o clas de tehnici folosite la clasificarea obiectelor i claselor n grupuri relativomogene, numite clustere. ai este denumit !analiza clasificrii", !analiz# tipologic#" sau !tiinaclasificrii numerice".$n analiza de cluster nu exist informaii a priori despre apartenena vreunui obiectla un grup, nici despre componena grupurilor.
Teste de control
*. Ar#tai care sunt principalii indicatori care trebui luai n considerare la interpretarea rezultatelor uneianalize cluster non'ierarhice.
+. ?ealizai i interpretai o analiz# cluster non'ierarhic#, pe o baz# de date la alegere.