cap 11 cluster.doc

Upload: ciprian-florin

Post on 04-Jun-2018

232 views

Category:

Documents


0 download

TRANSCRIPT

  • 8/14/2019 Cap 11 Cluster.doc

    1/8

  • 8/14/2019 Cap 11 Cluster.doc

    2/8

    dinainte, ci urmeaz# a se stabili ulterior. Pentru acest tip de analiz# exist# 3'4 metodealgoritmi/ de formare a grupurilor, printre care) leg#tur# inter'grupuri, leg#tur# intra'grupuri, metoda vecinului cel mai apropiat, metoda 5ard etc. 6lasificareaneierarhic#, n schimb, presupune stabilirea anticipat# a num#rului de clustere,urm&nd ca analiza s# identifice indivizii din fiecare cluster. Pentru acest tip de analiz#

    exist# dou# metode de clasificare) clasificare simpl#, pe de o parte, i iteraie iclasificare, pe de alt# parte. $n general, este bine ca la clasificarea neierarhic# s# selucreze cu variabile standardizate, mai ales dac# variabilele iniiale au unit#i dem#sur# foarte diferite.

    7. Definirea i etichetarea (numirea clusterelor. Aceasta se face , un general, studiindcaracteristicile fiec#rui cluster i descriind un profil al indivizilor din fiecare grup unparte.

    8. !alidarea clusterelor. uli analiti evit# aceast# ultim# etap#, deoarece este dificil#i nu exist# o metod# standard pentru realizarea sa. 9 posibil# metod# de validare esteaceea de a aplica o analiz# de discriminant pentru clusterele formate i a vedea dac#aceste clustere sunt suficient de diferite untre ele din punctul de vedere al variabilelorfolosite iniial n clasificare.

    $n cele ce urmeaz# vom da dou# exemple de realizare a analizei cluster, pentru fiecare dincele dou# categorii) ierarhic# i nodal#.

    Realizarea analizei cluster n SPSS

    :om rula o analiz# cluster de tip ierarhic pe o baz# de date numit# judete.sav, carecuprinde o serie de date economico'sociale despre ;udeele #rii i despre municipiul Classify > Hierachical Cluster

    :ariabilele de analiz# vor fi introduse un c&mpul !ariable(s"Pentru a alege metoda degrupare, se apas# butonul Method. 0intre metodele propuse de SPSS, vom alege#et$een%grouplinkage gruparea poate fi realizat# succesiv prin mai multe metode i compara eficienafiec#reia/. $ntruc&d datele folosite de noi sunt de tip numeric, vom utiliza ca indicator deproximitate distana euclidian#.

    S# ap#s#m acum butonul Statistics, pentru a preciza o serie de aspecte legate de outputulfinal. $n cadranul &luster 'embershipselect#m opiuneaange of solutions, iar n c&mpurile)romi *hroughintroducem valorile + i 7, respectiv. Aceasta nseamn# c# i cerem programuluis# ne indice apartenena ;udeelor la fiecare cluster pentru trei tipuri de soluii posibile, av&ndfiecare +, 1 i 7 grupuri respectiv.

  • 8/14/2019 Cap 11 Cluster.doc

    3/8

    $n final, s# ap#s#m butonul Savepentru a'i cere programului s# salveze ca variabilesoluiile finale, cu +, 1 i 7 grupuri respectiv select#m exact aceleai opiuni ca la butonulStatistics/.

    =abelul cel mai important care se obine n urma realiz#rii analizei de cluster de tip

    ierarhic este cel de mai ;os)

    Cluster Membership

    Case 4 Clusters 3 Clusters 2 Clusters

    1:teleorman 1 1 1

    2:mehedinti 2 1 1

    3:olt 1 1 1

    4:arges 3 2 1

    5:valcea 1 1 1

    6:botosani 1 1 1

    7:suceava 3 2 1

    8:iasi 3 2 1

    9:neamt 1 1 11:vaslui 1 1 1

    11:bacau 3 2 1

    12:vrancea 1 1 1

    13:covasna 2 1 1

    14:galati 3 2 1

    15:braila 1 1 1

    16:bu!au 1 1 1

    17:tulcea 2 1 1

    18:harghita 2 1 1

    19:constanta 1 1 1

    2:calarasi 2 1 1

    21:giurgiu 2 1 1

    22:prahova 3 2 1

    23:il"ov 2 1 1

    24:dol# 3 2 1

    25:bucuresti 4 3 2

    26:mures 3 2 1

    27:brasov 3 2 1

    28:ialomita 2 1 1

    29:bistrita$nasaud

    2 1 1

    3:dambovita 1 1 1

    31:gor# 1 1 1

    32:sibiu 1 1 1

    33:maramures 1 1 134:clu# 3 2 1

    35:hunedoara 1 1 1

    36:satu$mare 1 1 1

    37:alba 1 1 1

    38:bihor 3 2 1

    39:caras$severin

    2 1 1

    4:timis 3 2 1

  • 8/14/2019 Cap 11 Cluster.doc

    4/8

    41:arad 1 1 1

    42:sala# 2 1 1

    Acest tabel ne indic# apartenena fiec#rui ;ude la un cluster, pentru cele trei soluii

    posibile +'7 clustere/. Se observ# c# n fiecare situaie municipiul Classify > K-Means Cluster

    ai nt&i vom introduce n c&mpul !ariablesvalorile standardizate generate anterior, iarn c&mpul+abel &ases byvom introduce variabile country.

    >um#rul de opiuni disponibil aici este mult mai mic dec&t cel de la analiza tipologic#ierarhic#. $n c&mpul,umber of clustersintroducem valoarea 1 aadar, i impunem programului/s# genereze trei grupuri/. etoda de grupare aleas# va fi-terate and classify. ?#m&ne acum s#preciz#m o serie de elemente ale outputului final, astfel)

    ' ap#s#m butonul Savei select#m opiunea &luster membershipaceasta nseamn# c#programul va salva apartenena la clustere ntr'o variabil# categorial#/@

    ' ap#s#m butonul Optionsi select#m opiunea &luster information for each case.

    at# cele mai importante tabele generate de aceast# analiz# cluster.

    Cluster Membership

    Case%umber

    C&'%()* Cluster +istance

    1 ,"ghanistan - -

    2 ,rgentina 2 1-215

    3 ,rmenia - -

    4 ,ustralia 2 1-3495 ,ustria 2 1-665

    6 ,!erbai#an - -

    7 .ahrain - -

    8 .angladesh 3 1-47

    9 .arbados - -

    1 .elarus - -

    11 .elgium - -

    12 .olivia 3 1-56

  • 8/14/2019 Cap 11 Cluster.doc

    5/8

    13 .osnia - -

    14 .ots/ana 3 1-298

    15 .ra!il 2 2-416

    16 .ulgaria - -

    17 .ur0ina aso 3 2-137

    18 .urundi 3 1-78

    19 Cambodia 3 1-4852 Cameroon 3 -353

    21 Canada 2 1-779

    22 Cent- ,"ri-) 3 2-452

    23 Chile 2 1-572

    24 China 1 1-383

    25 Colombia 2 1-619

    26 Costa )ica 2 1-86

    27 Croatia - -

    28 Cuba - -

    29 C!ech )ep- - -

    3 +enmar0 2 1-731

    31 +omincan )- 2 2-191

    32 cuador 2 1-93733 gpt 3 2-136

    34 l alvador 3 1-717

    35 stonia - -

    36 thiopia 3 2-27

    37 inland 2 1-217

    38 rance 2 1-68

    39 abon 3 -884

    4 ambia - -

    41 eorgia - -

    42 erman 2 1-52

    43 reece 2 1-437

    44 uatemala 3 1-219

    45 aiti 3 1-695

    46 onduras 3 1-838

    47 ong ong - -

    48 ungar 2 1-351

    49 celand - -

    5 ndia 1 1-383

    51 ndonesia 3 1-959

    52 ran 3 2-394

    53 ra 2 2-145

    54 reland 2 1-439

    55 srael - -

    56 tal 2 1-49

    57 apan 2 1-88458 ordan 2 1-711

    59 ena 3 -84

    6 u/ait 2 1-367

    61 ;atvia - -

    62 ;ebanon - -

    63 ;iberia 3 -924

    64 ;iba 2 2-65

    65 ;ithuania - -

  • 8/14/2019 Cap 11 Cluster.doc

    6/8

    66 Malasia 2 1-954

    67 Mea0istan - -

    77 >anama 2 1-761

    78 >aragua 2 1-787

    79 >eru 3 2-356

    8 >hilippines 3 2-55

    81 >oland - -

    82 >ortugal - -

    83 )omania 2 1-397

    84 )ussia - -

    85 )/anda 3 2-9886 - orea - -

    87 audi ,rabia 2 1-665

    88 enegal 3 -885

    89 ingapore 2 1-438

    9 omalia 3 1-625

    91 outh ,"rica - -

    92 pain 2 1-98

    93 /eden 2 1-47

    94 /it!erland 2 2-259

    95 ria - -

    96 (ai/an - -

    97 (an!ania 3 2-16

    98 (hailand 3 2-431

    99 (ur0e 2 1-253

    1 '-,rab m- - -

    11 ' 2 1-36

    12 ', 2 2-816

    13 'ganda 3 2-259

    14 '0raine - -

    15 'rugua 2 1-523

    16 '!be0istan - -

    17 ?ene!uela 2 1-645

    18 ?ietnam 3 2-14

    19 =ambia 3 1-898

    Acest tabel ne arat# n ce cluster se afl# fiecare ar# numai pentru #rile pentru care nuexist# date lips#/, precum i distana n abateri standard/ de la fiecare ar# la centrul clusteruluic#ruia i aparine.

  • 8/14/2019 Cap 11 Cluster.doc

    7/8

    inal Cluster Centers

    Cluster

    1 2 3

    =score: >opulation in thousands 6-88817 $-145 $-9917

    =score: >eople living in cities @AB $1-2613 -66244 $-97875=score: >eople /ho read @AB $-58281 -53741 $-97188

    =score: ross domestic product capita $-8543 -6172 $-7773

    =score: +ail calorie inta0e $-56325 -6515 $-87343

    =score: ,verage "emale li"e eMB ,verage male li"ee

  • 8/14/2019 Cap 11 Cluster.doc

    8/8

    Analiza cluster este o clas de tehnici folosite la clasificarea obiectelor i claselor n grupuri relativomogene, numite clustere. ai este denumit !analiza clasificrii", !analiz# tipologic#" sau !tiinaclasificrii numerice".$n analiza de cluster nu exist informaii a priori despre apartenena vreunui obiectla un grup, nici despre componena grupurilor.

    Teste de control

    *. Ar#tai care sunt principalii indicatori care trebui luai n considerare la interpretarea rezultatelor uneianalize cluster non'ierarhice.

    +. ?ealizai i interpretai o analiz# cluster non'ierarhic#, pe o baz# de date la alegere.