aplicație analiza cluster - schelet analiza proiect

Upload: andrushee

Post on 09-Mar-2016

32 views

Category:

Documents


1 download

DESCRIPTION

analiza datelor

TRANSCRIPT

APLICAIE ANALIZA CLUSTER Identificarea structurii de clase a statelor member UE pornind de la indicatorii de dezechilibru

IntroducereScopul acestei analize este acela de a identifica grupele n care rile member UE care pot fi mprite pe baza similitudinii dintre ele, avnd la baz informaia furnizat de un numr de 14 indicatori referitori la dezechilibre mecroeconomice. Pornind de la aceast grupare a statelor se pot trage concluzii referitoare la caracteristicile majore ale clusterelor i a diferenelor dintre ele. Serii de date i metodologieSeriile de date folosite sunt ., sursa lor fiind Eurostat, ele reprezentnd cele mai recente observaii disponibile (anul 2014). nainte de a aplica analiza cluster, variabilele au fost standardizate, distantele nefiind, astfel, afectate de unitatea de msur a indicatorilor. Analiza cluster este o tehnic de analiza datelor..completai cu o scurt descriere n cele ce urmeaz, vor fi aplicate att metode de clasificare ierarhic, ct i algoritmi de partiionare (algoritmul K-means). Rezultatele analizei Putei compara rezultatele obinute prin aplicarea a doua metode ierarhice diferite (nearest neighbor i Ward, spre exemplu); ncepei cu una dintre metodele ierahice i vorbiti despre proximity matrix (matricea distanelor dintre variabile), de agglomeration schedule (paii n care se formeaz clusterele) i de dendrogram; Apoi reluai analiza cu cea de-a doua metoda ierahic i subliniai diferenele dintre cele dou, menionnd totodat numrul de clusere pe care l alegeti, de ce alegeti acel numr i de ce selectai o anumit metod; Dup identificarea numrului de grupe, aplicai algoritmul K-means preciznd numrul de grupe identificat anterior. n cadrul acestei analize v referiti: puin la procedur (porneste de la anumite puncte central ale clusterelor i n urma iteraiilor successive ajunge la un centroid final pentru fiecare dintre ele, atunci cnd modificarea centroizilor de la o iteraie la alta devine 0); apoi vorbii despre centroizii finali (final cluster centers), inserai graficul acestora i identificai variabilele care par a avea cea mai mare putere de separare a grupelor; apoi analizai tabelul ANOVA din perspectiva nivelului de semnificaie al variabilelor (Sig.) spunnd care variabile ajut i care nu la identificare clusterelor.

Concluziin aceast aplicaie ne-am propus identificarea grupelor n care n urma aplicrii celor dou clase de algoritmi am obinut un numr de grupe, ele avnd ca membri . n urma aplicrii algortimului k-means putem concluziona c trile din grupa 1 sunt cele pentru care indicatorii.. nregistreaza valorile cele mai, cele din grupa 2 se caracterizeaza mai degrab prin niveluri..... ale indicatorilor etc.