13-retele-kohonen

Upload: fuqupg

Post on 08-Jul-2015

269 views

Category:

Documents


1 download

TRANSCRIPT

Reele Kohonenncontinuaresuntabordatereelelelecuautoorganizarecarespredeosebiredemodeleleconvenionale sunt caracterizate de faptul c ieirea corect nu poate fi definit a priori. Dei nacestfelnupoatefidefinitomsuraeroriideaplicareaintrrilornieiri,procesuldenvare determin parametrii reelei pentru o anumit funcie dorit.Astfeldereelecuautoorganizareaufostconsideratecuocaziaprezentriialgoritmuluideclusteringnesupervizatcndcaractereleclustereloriapartenenaunuivectorlaunclusternuerau cunoscute sau impuse ci erau rezultatul unui proces de nvare.A Bfa1Fig. 1. Partiionarea spaiului de intrare al funcieiB A f : .Vectoriicareseprezintcaintrrintr-oreeacuautoorganizareconstituiemediulnconjurtorsaucontextulncarefuncioneazreeaua.Fiecarevectordeintrareprovoacoadaptareaparametrilorcareconstituieoreprezentareinternamediului.ntr-oreeacuautoorganizareetapeledenvareiexploatareseinterptrund.Ceamaistudiatclasdereelecuautoorganizare sunt reelele Kohonen. Atunci cnd o reea neuronal este antrenat i exploatat,intrrile fac parte din spaiul de intrare. Structura acestui spaiu este determinant pentru succesulantrenriiiexploatriireeleineuronale.SpresupunemcreeauaneuronalaproximeazofuncieB A f : ,R A .MulimeadedefiniieApoatefiacoperitdeoreeaKohonen(v.fig.1)astfelnctdacunvectordeintrareestealesdintr-oregiune 1r ,doarounitateareeleidevineactiv.Opartiionarenastfelderegiuniaspaiuluideintraresemainumetehartaspaiuluideintrare.ReeleleKohonennvasrealizezehrialespaiuluideintrareprinautoorganizare.Acesteconceptesebazeazpeanalogiacusistemelebiologice.Setiedeexemplucanumitezonedincmpulvizualalfiecruiochiarecorespondenenregiunidinlobuloccipital.Descoperirileactualedinmedicinsusinideeapotrivitcreiacreieruloconstruietenprimulrnd o reprezentare topologic a lumii. ntr-o astfel de reprezentare topologic, relaiile spaialeexterioare sunt aplicate n relaiile spaiale similare n cortex.Elementuldistinctivalreelelorlconstituiedefiniiavecintiiuneiunitidecalcul.ReeleleKohonensuntstructurimultidimensionalenformdegrilnalecrornodurisuntplasateuniti de calcul. Unitile au conexiuni ctre anumite uniti vecine.1.Algoritmul de nvareSpresupunemctrebuiecartografiatspaiuln -dimensionalidispunemdeostructurliniarde uniti Kohonen, numerotate de la 1 la m ca n fig 2. Fiecare unitate este dotat cu o intraren -dimensional i calculeaz excitaia corespunztoare. Celencomponente ale intrrii sunt trimisectrefiecareunitateprinarceponderate,unitiii fiindu-iasociatvectoruln -dimensionaldeponderi iw .Catografiereaurmrete ca fiecare unitate s se specializeze ntr-o zon distinct a spaiului deintrarensensulcdacointrareaparineuneiregiunipecares-aspecializatounitate,atunciacea unitate s furnizeze excitaia maxim....wm1 2 3w1xvecinatatea de raz 1 a unittii 2w2w3 m-1wmFig.2. Unitai de calcul conectate liniarO unitate Kohonen calculeaz distana euclidian ntre propriul vector de ponderi iwi intrareacurentx . Vecintatea) , ( r i Nde razra unitiiidin reeaeste format din toate unitilesituatelacelmultr poziiifadei .nexempluldinfig.2,vecintateaderaz2pentruunitatea4estemulimeaunitilor2, ( ) 5 , 4 , 3 ,6iarceaderaz1pentruunitatea1 m estemulimeaunitilor( ) m m m , 1 , 2 .Deasemenea,nvareareelelorKohonen,foloseteofunciedevecintate) , ( k i careesteomsuraintensitiicuplriintrecelulai ik .Unexemplu de funcie de vecintate este=) , ( , 0) , ( , 1) , (r k N ir k N ik i .Algoritm 1. Instruirea unei reele Kohonen.Start: Vectorii de ponderin -dimensionali mw w ,...,1 sunt iniializai cu valori aleatoare.Sealege o raz iniialr , o constant de nvare i o funcie de vecintate ) , ( k i .Pas 1: Sealegeunvectordeintrare dinsetuldeantrenarefolosindodistribuiadeprobabilitate dorit peste spaiul de intrare.Pas 2: Se alege unitateakpentru care excitaia este maxim, adic pentru care distana ntrei kweste minim, adic w wi k ,m i ,..., 1 = .Pas 3: Se actualizeaz vectorii de ponderi dup regula) )( , (i i iw w w + = k i ,m i ,..., 1 = .Pas 4: Dacnumrulmaximdeiteraiipermisafostatinsatuncistop.ncazcontrar,semodific i conform planificrii prestabilite i se reia pasul 1.Interpretarea regulii de actualizare este c noul vector de ponderi este mai apropiat de vectorul deintrare (v. fig. 3). Dar, tot aceast regul, are ca efect atragerea cu att mai puternic a vectorilorde ponderi cu ct acetia sunt mai apropiai de unitatea unde s-a nregistrat minimul. Intuitiv, amputeaprivioreeaKohonencaoplaselasticcaretindessemulezepeconfiguraiafizicaaintrrilor. Coordonatele nodurilor plasei sunt date de vectorii de ponderi iar topologia plasei estecea a reelei unitilor de calcul.wicurentwinou-wi( i,k)( -wi)Fig. 3. Atragerea vectorului de ponderi de ctre vectorul de intrare.n alte accepii, funcia de vecintate verific condiia1 ) , ( = k i dack i =dar poate fi funciedescresctoare n raport cu distana unitiiifa de unitateak . Ca efect, unitile care sunt maiapropiatedeunitateactigtoare(imaialesceactigtoare)ischimbponderilentr-omsur mai mare dect cele ndeprtate i aceasta este modalitatea de considerare a informaieitopologice.Dac intrrile au fost alese n mod uniform n spaiul de intrare, atunci la sfritul procesului denvare este de ateptat s obinem o distribuire uniform a vectorilor de ponderi n acest spaiu.Razavecintiiestesczutconformuneiplanificriiarecaefectcontraciavecintii.Deasemenea, funcia de vecintate are valori planificate din ce n ce mai mici pe msur ce procesuldenvareavanseazicaurmareinfluenauneiunitiasupraunitilorvecinedescrete.Constanta de nvare este de asemenea redus treptat i deci la nceput se vor face corecii mariidincencemaimicictresfritulprocesuluidenvare.Planuldedescretereavalorilorfuncieii ale constantei de nvare permite organizarea rapid a reelei n etapa iniial ireglareafinaadaptriireeleilavectoriideintrarenperioadafinalaantrenrii.Dacdescreterea lui merge pn la valoarea0 = atunci procesul este oprit.O alegere tipicpentru funcia ([HK93]) este222) , () , (k i diste k i= ,unde) , ( k i dist estedistanantreunitilei ik nreeauadeieire.Parametrul areodescreteremonotonnraportcutimpult (iteraiacurent).Alegeriuzualepentru) (t =sunt tt1) ( = sau = t t) ( , cu] 1 , 0 ( .Un exemplu de funcionare a algoritmului de nvare Kohonen este prezentat n fig. 4 n acre unpunct al liniei poligonale din interiorul triunghiului corespunde unei unitai de calcul. Domeniulde intrare este triunghiul n care se afl linia poligonal. Dup realizarea nvrii, punctele suntdistribuiteastfelnctfiecareunitatecorespundeuneiregiunidinspaiuldeintrareipentrupunctele din acea regiune ea va fi singura care se activeaz.Fig. 4. Trasarea unei reele Kohonen liniare n interiorul unui triunghi.0 20 1001000 10000 25000Fig. 5. Configuraii ale vectorului de ponderi n diferite stadii de nvare.Acelai exemplu rulat pentru reea Kohonen cu mai multe uniti este artat n diverse stadii denvarenfig.5.Lasfritulprocesuluidenvare(iteraia25000)razavecintiiadevenitnul, constanta de nvare ia o valoare foarte mic, iar ponderile unitilor formeaz o aa-ziscurb Peano.Un alt exemplu n care unitile reelei Kohonen sunt pe o gril bidimensional este artat n fig.6.Veciniiuneiunitisuntpuncteledingrilinclusenptratuldelatura1 2 r unitielementare ale grilei (pai) centrat n unitatea curent (v. fig. 7 pentru cazul r=2).Fig. 6. Maparea unui unui ptrat ntr-o reea bidimensional.ijFig. 7. Vecintate) 3 ), , (( j i Ncentrat n nodul) , ( j ial grileii 2.Analiza convergeneincontinuaresuntprezentatectevaelementepentrunelegereaintuitivaconceptuluideconvergen i stabilitate a procesului de nvare.FiepentrunceputcazulelementarcndreeauaKohonenareexactounitateiardomeniuldeintrare este intervalul] , [ b a . Algoritmul de nvare va conduce la o pondere situat n mijloculintervalului] , [ b a . Regula de nvare n acest caz este) (1 1 + =n n nx x x unde 1 nx estevaloareacurentaponderii, nx ceaactualizatnpasuln,iar careesteunnumr aleator n] , [ b a . Pentru] 1 , 0 ( , dac) , (0b a x atunci] , [ b a xn ,1 ) ( n .Valoarea mediex a luixestemrginit. nlocuind pe n cu argumentul continuu t, obinem cvaloarea medie a derivatei luixn raport cuteste nul0 =dtdxdeoarece n caz contrarxar putea depi intervalul] , [ b a . Dar( )|.|

\|+= = xb axdtdx2 i rezult c2 b ax+= .Efectul mrimii vecintaiiAsupra formei funciei de vecintate nu s-a fcut nici o ipotez dect c1 ) , ( = k i pentruk i =i0 ) , ( = k i pentruk i . Dac este considerat sub alt form care s reflecte o vecintate maiampl dect un punct, atunci apar mici dezechilibrelacapeteleuneireeleunidimensionalesaun colurile uneia bidimensionale. Efectul unei funcii de vecintate asupra strii stabile se poateconstata din exemplul n care ===.c.c. 012 / 11) , ( k ik ik i DacoreeaKohonenesteantrenatcuaceastfuncie,valorilemediialeponderilor 1x i 2xsunt -1/4 i 1/4 inu mpart domeniul de intrare] 1 , 1 [n segmente egale.Cuplareaputernicaunitilorfavorizeazconcentrareaponderilorunitilornjurulcentrelorvecintailor.Otendinoarecumcontrarsemanifestlaperiferiadistribuieicareatrage/ntindereeaua(v.fig.8).Aceasttendincontrabalanseazaglomerareasprecentrulreeleiaunitilor. Av\nd ]n vedere aceste comportamente, este bine s se nceap antrenarea cu o funciedevecintatecarecupleazputernicunitile,caapoispresfritulantrenrii,cuplareasfieredustreptat.Pedealtparte,oconcentrareexagerataponderilorctrecentruldistribuieipoate fi atenuat chiar din start prin iniializarea ponderilor cu valori mici.Fig. 8. Hart bidimensional deformatnrezumat,pentruasigurareaunuicomportamentconvergentpentruoreeaKohonenmultidimensional sunt necesare:o funcie de vecintate adecvat;o buniniializare pentru ponderile unitilor;o planificare a rcirii nvrii care s nu conduc la terminarea prematur a nvrii. Dimensionarea reelelor KohonenOaltproblemdeproiectareestedimensionareareelelorKohonen.Adesea,cnddateledeintraresuntvectorin -dimensionaliacesteas-arputeanlocuicudatededimensiunemaimic.Astfel,dacdateledeantrenaresuntpunctepeosfertridimensional,oreeaKohonenbidimensional poate oferi rezultate mai bune dect una tridimensional.Dimensiuneaefectivasetuluidedatedeintrarepoatefideterminatexperimentalprinmsurareavariaieinumruluidepuncteaflatladistanmaimicdectun0 > dat,cndestecrescutsaudescrescuttreptat.Astfel,spresupunemcdateledeintraresuntaproapecoplanare n spaiul tridimensional i selectm aleator un punctdin datele de intrare. Calculmapoi) ( Nnumrul de puncte din setul de date care se afl fa de la o distan mai mic[ sauultegalcu .Dacacestnumr) ( N urmeazolegedeforma 2) ( N atuncivomoptapentruoreeaKohonenbidimensional.Deobiceisereprezintgrafic)) ( log( N nfunciede) log( iarlimitapanteidrepteideregresiecnd0 esteaa-numitadimensiunefractalasetului de date.n[410]s-aartatexperimentalcesteadecvatcadimensiuneareeleiKohonensfiectmaiapropiat de dimensiunea fractal a datelor.Aplicaii ale reelelor KohonenAproximarea funciilor echilibrarea bageteiFieR d c b a f ] , [ ] , [ :o funcie continu i{ } ] , [ ], , [ / )) , ( , , ( d c y b a x y x f y x P = graficulacesti funcii. Mulimea P este o suprafa n 3Rpe care dorim s o aplicm pe o reea Kohonenbidimensional.ReeauaKohonenplanaridistribuieunitile,defaptponderileacestora,pentru a acoperi domeniulP . nvarea serealizeaz prin alegerea de triplete ntr-un domeniunchisnP ,eventualntr-ozonpreferenialdeexploatareafuncieif .ExploatareareeleiKohoneninstruitesefaceastfel.Spresupunemcpentruopereche) , ( y x neintereseazovaloare aproximativ pentru ) , ( y x f . Pentru aceasta, se determin o unitate de coordonate) , ( j idin reeaua bidimensional pentru distana euclidian ntre) , ( y xi( )) , (2) , (1,j i j iw weste minim nraportcucelelalteuniti,unde( )) , (3) , (2) , (1, ,j i j i j iw w w estevectoruldepondericorespunztorunitii (i,j). Valoarea aproximativ a lui) , ( y x feste tocmai valoarea nvat adic componenta) , (3j iw aceluimaiapropiatvectordeponderi.ReeauaKohonenlucreazcauntabeldevaloripentruf .Densitateaargumentelornacesttabelpoatefivariabilivafidictatdetipuldeaplicaie.nplus,utilizareaunuitabeldevectoriesteosoluiengeneralmairapiddectevaluarea direct a funciei dac expresia ei analitic se cunoate. Avantajul este i mai evidentcnd expresia ei analitic nu se cunoate dar sunt disponibile exemple de intrare ieire care vorfifolositennvare.OreeaKohoneninstruitpentruoastfeldesarcinipoatecontinuainstruireadac s-au produs schimbri n setul de antrenare la care trebuie s se adapteze.Oaplicaiefizicspectaculoasesteechilibrareabaghetei(v.fig.1).Sistemulconstdintr-obaghet care se poate roti cu un unghi n jurul punctului de fixare ntr-un plan perpendicular pecrucior. Deplasarea cruciorului se poate face pe durata interseciei ntre platforme n planul ncare se mic bagheta.fFig. 1. Sistemul pentru echilibrarea baghetei.Meninereanechilibruabagheteisefaceprindeplasareacrucioruluilastnga/dreaptaaplicnd o forf a crei mrime este o funcie de unghiul[RMS90] dtdf + = sin ) ( ,unde i suntconstante.PentruafolosioreeaKohonenpentruaproximarealuif seconsider = x ,dt d y / = iy x y x f + = sin ) , ( iseprocedeazcamaisus,reeafurniznd o aproximare a lui ) , ( y x fpentru o pereche) , ( y xdat.