gheorghe m.panaitescu - ac.upg-ploiesti.roac.upg-ploiesti.ro/gpanaitescu/msds_2007.pdf · •retele...

190
Gheorghe M.Panaitescu MODELAREA SI SIMULAREA DINAMICII SISTEMELOR Note de curs Universitatea “Petrol-Gaze” Ploiesti Catedra Automaticǎ si calculatoare 2007 1

Upload: hoangmien

Post on 03-Feb-2018

250 views

Category:

Documents


3 download

TRANSCRIPT

Page 1: Gheorghe M.Panaitescu - ac.upg-ploiesti.roac.upg-ploiesti.ro/gpanaitescu/msds_2007.pdf · •Retele neuronale •Retele neuronale artificiale stratificate •Analiza multirezolutie

Gheorghe M.Panaitescu

MODELAREA SI SIMULAREADINAMICII SISTEMELOR

Note de curs

Universitatea “Petrol-Gaze” PloiestiCatedra Automaticǎ si calculatoare

2007

1

Page 2: Gheorghe M.Panaitescu - ac.upg-ploiesti.roac.upg-ploiesti.ro/gpanaitescu/msds_2007.pdf · •Retele neuronale •Retele neuronale artificiale stratificate •Analiza multirezolutie

2

Page 3: Gheorghe M.Panaitescu - ac.upg-ploiesti.roac.upg-ploiesti.ro/gpanaitescu/msds_2007.pdf · •Retele neuronale •Retele neuronale artificiale stratificate •Analiza multirezolutie

P R E F A Ţ Ǎ

Lucrarea prezentǎ este suportul de curs al disciplinei Modelarea si simulareadinamicii sistemelor si este destinatǎ studentilor de la specializarea Automaticǎsi informaticǎ industrialǎ (AII), cursuri de zi dar si celor care urmeazǎ forma deînvǎtǎmânt cu frecventǎ redusǎ.

Existǎ si o versiune specialǎ a acestei lucrǎri dedicatǎ învǎtǎmântului cufrecventǎ redusǎ, versiune care se aliniazǎ instructiunilor de redactare elaboratede CNEAA.

Versiunea prezentǎ a acestor Note de curs cumuleazǎ o experientǎ dinamicǎ,care se mǎsoarǎ în peste 10 ani de predare. An de an cursul a suferit modificǎri,de aceea a fost mentinut în formǎ electronicǎ. Modificǎrile si îmbunǎtǎtirile celemai recente constau în suplimentarea cu un numǎr de exemple de modele si decalcule de simulare a unor sisteme dinamice sau a unor pǎrti ale lor: capitolelesunt însotite la finalul lor de un numǎr de probleme, unele rezolvate, altelepropuse spre rezolvare, si de câteva teste de autoevaluare.

Pentru efectuarea calculelor necesare rezolvǎrii unor aplicatii noi sau pentruverificarea exemplelor din corpul acestor Note de curs, autorul recomandǎstudentilor utilizarea pachetului de programe Matlab.

Alǎturi de Notele de curs, într-un volum separat afisat în acelasi loc, este dat unGhid de lucrǎri care contine un numǎr de teme si probleme propuse a fisolutionate în orele de aplicatii.

3

Page 4: Gheorghe M.Panaitescu - ac.upg-ploiesti.roac.upg-ploiesti.ro/gpanaitescu/msds_2007.pdf · •Retele neuronale •Retele neuronale artificiale stratificate •Analiza multirezolutie

C U P R I N S

INTRODUCERE ÎN TEHNICA MODELǍRII SI SIMULǍRII 7

• Sisteme si modele• Definitii• Utilitatea modelǎrii si simulǎrii• Etape ale modelǎrii dinamicii unui sistem• Clasificǎri ale modelelor• Relatia între multimea modelelor si multimea sistemelor• Probleme• Exercitii de autoevaluare

MODELE MATEMATICE DINAMICE 17

• Modele sub formǎ de ecuatii diferentiale ordinare• Efectul discretizǎrii timpului asupra modelelor de tipul ecuatiilor

diferentiale ordinare• Modele sub formǎ de ecuatii cu derivate partiale• Modele sub formǎ de ecuatii integrale sau ecuatii integro-diferentiale• Probleme• Exercitii de autoevaluare

PRINCIPII FUNDAMENTALE DE FIZICǍ, CHIMIE SI CHIMIEFIZICǍ ÎN MODELAREA SISTEMELOR DINAMICE 47

• Ecuatii de continuitate• Ecuatii de bilant energetic• Ecuatii de miscare• Ecuatii de transport• Ecuatii de stare• Spectre de componenti• Ecuatiile de stare si amestecurile complexe• Echilbre între faze• Ecuatii chimice generalizate, stoechiometrie, echilibru chimic

4

Page 5: Gheorghe M.Panaitescu - ac.upg-ploiesti.roac.upg-ploiesti.ro/gpanaitescu/msds_2007.pdf · •Retele neuronale •Retele neuronale artificiale stratificate •Analiza multirezolutie

• Alte principii si aspecte cantitative utilizate în scrierea modelelordinamicii sistemelor

• Probleme• Exercitii de autoevaluare

FORME STANDARD ALE MODELELORDINAMICII SISTEMELOR 67

• Dinamica sistemelor modelatǎ cu ecuatii de stare si ecuatii de observare• Modele matematice în domeniul complex• Dinamica sistemelor modelatǎ cu ecuatii care leagǎ iesirile de intrǎri• Modele matematice în domeniul frecventelor• Trecerea de la modelul liniar de tip ecuatii de stare/ecuatii de observare

la modelul tip intrare-iesire• Trecerea de la modelul liniar de tip intrare-iesire la modelul tip ecuatii

de stare/ecuatii de observare• Probleme• Exercitii de autoevaluare

ELEMENTE DE NATURǍ ALEATOARE ÎN DINAMICASISTEMELOR 89

• Spatiul evenimentelor• Probabilitǎti, probabilitǎti conditionate• Variabile aleatoare• Generarea de numere aleatoare• Raportul experiment-lege de repartitie teoreticǎ si verificarea legilor de

repartitie• Estimarea si verificarea parametrilor legii de repartitie teoretice• Estimarea de parametri în modelele sistemelor• Fenomene aleatoare dinamice• Modele dinamice stochastice• Modelul ARIMA• Forma Wiener-Kalman a modelelor pentru sisteme stochastice discrete• Estimarea recursivǎ a parametrilor unui model• Probleme• Exercitii de autoevaluare

5

Page 6: Gheorghe M.Panaitescu - ac.upg-ploiesti.roac.upg-ploiesti.ro/gpanaitescu/msds_2007.pdf · •Retele neuronale •Retele neuronale artificiale stratificate •Analiza multirezolutie

METODE NECONVENTIONALE ÎN MODELAREA DINAMICIISISTEMELOR 133

• Analiza componentelor principale• Regresia prin componente principale• Metoda celor mai mici pǎtrate partiale• Retele neuronale• Retele neuronale artificiale stratificate• Analiza multirezolutie• Exercitii de autoevaluare

MODELAREA SI SIMULAREA DINAMICIISISTEMELOR MARI 157

• Sisteme dinamice mari• Metode de modelare a sistemelor mari orientate pe ecuatii• Metode orientate pe module• Exercitii de autoevaluare

MODELE ALE DINAMICII SISTEMELOR CU EVENIMENTEDISCRETE 165

• Sisteme cu evenimente discrete• Introducere în teoria retelelor Petri• Semantica retelelor Petri• Marcaje• Timpi asociati cu pozitiile si tranzitiile• Reguli de functionare• Competitie si sincronizare• Mecanisme de control• Retele Petri speciale. Asincronism, masini de stare si automate• Grafuri cu evenimente temporizate• Probleme• Exercitii de autoevaluare

RǍSPUNSURI LA EXERCITIILE DE AUTOEVALUARE 187

B I B L I O G R A F I E 189

6

Page 7: Gheorghe M.Panaitescu - ac.upg-ploiesti.roac.upg-ploiesti.ro/gpanaitescu/msds_2007.pdf · •Retele neuronale •Retele neuronale artificiale stratificate •Analiza multirezolutie

INTRODUCERE ÎN TEHNICA MODELǍRII SI SIMULǍRII

• Sisteme si modele • Definitii • Utilitatea modelǎrii si simulǎrii • Etape ale modelǎrii dinamicii unui sistem • Clasificǎri ale modelelor • Relatia între multimea modelelor si multimea sistemelor• Probleme• Exercitii de autoevaluare

Sisteme si modele

Un sistem natural este într-un schimb permanent de informatie, de energiesi/sau de materie cu ambianta si numai extrem de rar relatia sistemului cumediul înconjurǎtor este mereu aceeasi. În cvasitotalitatea cazurilor existǎ oevolutie mai lentǎ sau mai rapidǎ, naturalǎ sau provocatǎ, care face ca timpul sǎcapete o importantǎ fundamentalǎ. Existǎ asadar aspecte dinamice care retinatentia fie în cadrul unei urmǎriri pasive a evolutiei sistemului, fie pentru scopulpractic al influentǎrii/conducerii evolutiei lui. Schimbul amintit cu mediulinseamnǎ atât receptare cât si generare. O parte din ceea ce sistemul primeste dela mediul înconjurǎtor, parte care deranjeazǎ în general o evolutie normalǎ nutotdeauna usor de definit se grupeazǎ sub numele generic de perturbatii.Perturbatiile se prezintǎ, de asemenea, în una sau mai multe din cele trei forme,adicǎ informatie, energie si/sau materie.Pentru un observator, un sistem fizic implicat într-un schimb de o naturǎ saualta cu ambianta poate fi caracterizat prin câteva tipuri de variabile, dupǎ cumurmeazǎ: • intrǎri manipulabile sau variabile de comandǎ, asupra cǎrora un utilizator

al sistemului poate actiona; • perturbatii, care uzual scapǎ interventiei dirijate, controlate; • iesiri, care pot fi mǎsurate sau cel putin detectate si care sunt expresia

actiunii sistemului asupra ambiantei; • variabile de stare, care sunt interioare sistemului, nu sunt neapǎrat direct

perceptibile, dar împreunǎ cu eventualele intrǎri guverneazǎ evolutiasistemului.

7

Page 8: Gheorghe M.Panaitescu - ac.upg-ploiesti.roac.upg-ploiesti.ro/gpanaitescu/msds_2007.pdf · •Retele neuronale •Retele neuronale artificiale stratificate •Analiza multirezolutie

Un model al unui sistem este, desigur, altceva decât sistemul însusi. Modelultrebuie însǎ sǎ imite, pânǎ la a reproduce dacǎ este posibil, comportarea si/sauevolutia sistemului modelat. Modelele unui sistem pot fi de naturi diferite. Potfi modele fizice, pot fi modele matematice sau pot fi o combinatie a acestora însensul simplu cǎ de cele mai multe ori nu se poate face o modelare fizicǎ fǎrǎ ase intermedia relatia model-sistem modelat prin ecuatii matematice. Modelelepot fi de cunoastere sau de reprezentare/conducere. În toate cazurile, sistemulexistǎ independent de orice model atasat, fie cǎ este vorba de o intentie sau alta,de a cunoaste un sistem sau de a-l conduce. Mai mult, modelele sunt încvasitotalitate simplificǎri, uneori “caricaturi” ale realitǎtii. Se spune adesea cǎmodelele sunt minciuni utile necesare în descoperirea adevǎrului. Sub aspectepistemologic se poate observa cǎ cel care elaboreazǎ modelul este de fapt parteintegrantǎ a modelului, cu care se aflǎ în interactiune strânsǎ, aproape intimǎ.Astfel, natura modelului depinde de obiectivele urmǎrite de cel care îl concepe,iar modelul adoptat modificǎ perceptia si întelegerea sistemului de cǎtrerealizatorul modelului. Modelele de cunoastere se bazeazǎ pe fenomenologia bogatǎ descrisǎ de legilefizicii, chimiei, biologiei, economiei etc. Variabilele unui model de cunoastereau semnificatii imediate: temperaturi, presiuni, curenti, acceleratii, forte, costurietc. Aceste modele sunt foarte bogate în semnificatii, spre deosebire demodelele de reprezentare/conducere. Ele contin în cvasitotalitate informatiileutile privitoare la sistemul studiat. Sunt însǎ în general dificil de manipulat înevaluǎrile numerice si în implementare. Modelele de reprezentare si conducere nu permit decât cu totul ocazionalinterpretǎri fizice ale fenomenelor din sistemul studiat. Aceste modele suntconstituite din relatii matematice care leagǎ diferite variabile ale sistemului într-un domeniu de valori precizat, de cele mai multe ori limitat. Variabilele careapar în modelele de acest tip pot sǎ nu aibǎ nici o legǎturǎ cu vreun sens fizicchiar dacǎ în particular acesta este cunoscut. Modelele de reprezentare pot fi: • modele de reguli care sunt de forma “o dublǎ actionare a lui A, produce o

deplasare a lui B” si sunt generate prin observarea sistemului înfunctionarea lui; sunt adesea dificil de manipulat dar se preteazǎ la metodeleinteligentei artificiale;

• modele gen fisier care sunt tabele de date intrare-iesire; sunt de cele maimulte ori punctul de plecare în elaborarea unor modele mai evoluate;

8

Page 9: Gheorghe M.Panaitescu - ac.upg-ploiesti.roac.upg-ploiesti.ro/gpanaitescu/msds_2007.pdf · •Retele neuronale •Retele neuronale artificiale stratificate •Analiza multirezolutie

• modele intrare-iesire care sunt relatii matematice între intrǎri si iesiri încadrul unor reprezentǎri de tip cutie neagrǎ (black box);

• modele de stare care recurg la descrierea stǎrii sistemului la momentediferite;

• modele grafice care pot fi sub forma unor scheme functionale, a unor grafuride fluentǎ, a unor retele Petri, sau a unor asa-numite bond-graph-uri.

Mare parte din modelele de reprezentare si conducere sunt obiecte matematicesau pot fi tratate ca obiecte matematice. De aceea, frecvent, în expunerile careurmeazǎ se va vorbi de modele matematice ale sistemelor, în particular aledinamicii sistemelor.

Definitii

Un model matematic este un sistem de relatii/ecuatii, care descriecomportamentul unui sistem real într-o mǎsurǎ rezonabilǎ. Într-un modelmatematic se disting anumite variabile independente care sunt puse încorespondentǎ cu intrǎrile sistemului real, în general manipulabile. Altevariabile sunt dependente de primele si sunt puse în legǎturǎ cu iesirilesistemului modelat. Mǎsura în care sistemul este reprezentat de model,calificatǎ vag mai sus ca rezonabilǎ constǎ în capacitatea modelului de aproduce practic aceleasi perechi intrǎri-iesiri ca si sistemul real. Coincidentariguroasǎ între model si sistemul modelat este scoasǎ din discutie pentrusimplul motiv cǎ aproape totdeauna realitatea este mai complexǎ decât ceea cese poate cuprinde într-un model, iar exactitatea, rigoarea reprezentǎrilor trebuiesǎ corespundǎ scopului urmǎrit. Modelele matematice mai cuprind si un numǎrde parametri. Parametrii fac particular un model, îl pun în acord cu realitateaunui sistem fizic. Cum s-a arǎtat, variabilele si parametrii unui model pot fiuneori în relatie directǎ cu cantitǎti fizice si/sau fizico-chimice din sistemul real.Prin simulare se întelege operatia de rezolvare în conditii precizate a sistemuluide relatii/ecuatii care constituie modelul matematic al dinamicii unui sistem realsau pe cale de a deveni real. Simularea se conduce cu referire la si princomparare permanentǎ cu sistemul simulat, real sau virtual, sau cu sistemesimilare. Prin urmare, este necesarǎ o actiune constantǎ de interpretare aprodusului calculelor de simulare din partea celui care elaboreazǎ sau utilizeazǎmodelul cu care se face simularea.Simularea se realizeazǎ cu ajutorul unor mijloace de calcul adecvate programatecorespunzǎtor.

Utilitatea modelǎrii si simulǎrii

Modelarea si simularea sistemelor este utilǎ cel putin în trei situatii.

9

Page 10: Gheorghe M.Panaitescu - ac.upg-ploiesti.roac.upg-ploiesti.ro/gpanaitescu/msds_2007.pdf · •Retele neuronale •Retele neuronale artificiale stratificate •Analiza multirezolutie

În cercetare si dezvoltare, modelarea matematicǎ permite adâncirea întelegeriiunui proces sau a unui sistem în ansamblu sau în pǎrti ale lui. Sunt utilizate aiciîn special modele din categoria celor de cunoastere. Detectarea mecanismuluifenomenelor, sensibilitatea sistemului la modificarea unor variabile, creareapremiselor unor modificǎri de scarǎ sunt ţeluri obisnuite în fazele de dezvoltarea unor sisteme tehnologice sau ingineresti. În proiectare, dimensionarea unor pǎrti ale unui sistem sau a sistemului întotalitate, unele evaluǎri privind dinamica si posibilitǎtile de automatizare suntde luat în considerare mai întâi prin simulare pe baza unui model matematicpotrivit. În operarea sistemelor, modelele si simularea pe baza acestora pot servi unorscopuri variate, de la pregǎtirea personalului de operare, la localizarea siremedierea operativǎ a unor defectiuni în functionarea sistemului, laoptimizarea functionǎrii acelui sistem.

Etape ale modelǎrii dinamicii unui sistem

Elaborarea modelului unui sistem dinamic este o experientǎ în mare mǎsurǎparticularǎ. Se pot totusi recomanda câtiva pasi de parcurs, care, evident, pot fiîmbogǎtiti si amendati chiar de la prima experientǎ proprie a cititorului. Asadar,câteva etape în modelare: A. Formularea problemei necesitǎ rǎspunsuri explicite sau subîntelese laurmǎtoarele întrebǎri: • care este sistemul fizic de reprezentat prin modelul matematic; • care este utilizarea/scopul modelului; • cât de complexǎ trebuie sǎ fie descrierea urmǎritǎ; • ce date sunt disponibile pentru verificarea modelului. Cele patru rǎspunsuri la cele patru întrebǎri nu sunt independete, ci mai multsau mai putin ele se conditioneazǎ reciproc. Un exemplu aparent simplu, care sereferǎ la modelul matematic al unui rezistor la extremitǎtile cǎruia se aplicǎ otensiune detaliazǎ întrucâtva etapa formulǎrii problemei de modelare. Relatia binecunoscutǎ U = RI exprimǎ tensiunea U la extremitǎtile unui rezistora cǎrui rezistentǎ electricǎ este R si prin care circulǎ curentul I. Acesta este unmodel matematic al sistemului constituit de rezistorul în discutie.Rezistorul este un element foarte concret, care are desigur limitele lui deutilizare. Este stiut de pildǎ cǎ în rezistor are loc o disipare de energie. Putereadisipatǎ este datǎ de expresia P = RI 2 si, dacǎ ne referim la un element decircuit, existǎ o limitǎ a puterii pe care rezistorul o poate disipa în mediulambiant. Dacǎ acea limitǎ este depǎsitǎ rezistorul îsi schimbǎ mai întâi drasticcaracteristica principalǎ, valoarea rezistentei electrice, iar dacǎ puterea disipatǎlimitǎ este încǎ mai accentuat depǎsitǎ atunci rezistorul se poate distruge înurma efectului de încǎlzire dincolo de limita care asigurǎ integritatea fizicǎ a

10

Page 11: Gheorghe M.Panaitescu - ac.upg-ploiesti.roac.upg-ploiesti.ro/gpanaitescu/msds_2007.pdf · •Retele neuronale •Retele neuronale artificiale stratificate •Analiza multirezolutie

materialului din care este confectionat. Sau, poate mai grav, el poate influentaprin energia dispersatǎ alte elemente din imediata vecinǎtate. Asadar, modelulmatematic al rezistorului trebuie completat cu relatia restrictivǎ P < P0, cu P0

acea limitǎ a capacitǎtii lui disipative, datǎ uzual de cataloage. Nu s-a spus nimic pânǎ acum despre tipul curentului (tensiunii) dar s-a admistacit cǎ este vorba de curenti si tensiuni continue. Dacǎ curentul (tensiunea)variazǎ în timp atunci lucrurile se complicǎ pe mai multe planuri. Dacǎ estevorba de curent alternativ de frecventǎ relativ joasǎ atunci modelul propus sementine, cu grija de a lucra în evaluarea puterilor mai curând cu valori eficacepentru curent si/sau tensiune, decât cu valori instantanee si cu valorea medie aputerii si nu cu valorile ei la un moment dat. Pe mǎsurǎ ce frecventa creste,valoarea însǎsi a rezistentei electrice se modificǎ fatǎ de aceea în curentcontinuu. Poate deveni importantǎ inductanta rezistorului si a conexiunilor lui sipot înceta a mai fi neglijabile capacitǎtile între diferite pǎrti ale rezistorului siîntre rezistor si unele elemente din proximitate. Modelul simplu de mai sus numai corespunde noii situatii. El trebuie modificat pentru a descrie un sistemmult mai complex, care cuprinde si elemente reactive, inductante si capacitǎti.Conditia de putere trebuie si ea reformulatǎ. În regim de impulsuri, puterea medie poate fi micǎ dar valorile instantanee aletensiunii pot fi foarte mari. În asemenea cazuri trebuie tinut seama deposibilitatea de strǎpungere pe zone restrânse a rezistorului. Iatǎ, asadar, o altǎlimitare care poate deveni necesarǎ: limitarea tensiunii între extremitǎtilerezistorului. Nu sunt lipsite de interes cazurile în care rolul unui rezistor este tocmai acela dea genera/disipa în mediul înconjurǎtor limitat sau infinit o cantitate de energie.Modelul matematic trebuie atunci completat cu relatii care descriu cantitativtransferul de energie între rezistor si mediu. Si aici rezistorul poate ceda termicdacǎ transferul cǎtre mediu nu este suficient de intens. Mediul însusi intervineîn comportarea rezistorului, stiut fiind cǎ fluxul energetic este cu atât mai intenscu cât diferenta de temperaturǎ între suprafata rezistorului si mediu este maimare. Sistemul si modelul lui se pot extinde asadar la mai mult decât ar pǎreastrict necesar la o primǎ examinare. B. Scrierea corectǎ a modelului si verificarea lui necesitǎ colectarea de datedespre sau de pe sistemul modelat. Pentru aceasta sunt necesare:• recursul la baze de date cu constante fizice si/sau fizico-chimice, mai ales

când este vorba de modelele de cunoastere; • selectarea variabilelor de modificat/manipulat si de observat; • selectarea tipului potrivit de modificǎri ale variabilelor manipulabile ale

sistemului; • elaborarea, dacǎ este cazul, a unor planuri de experimentare productive sub

aspectul informatiei referitoare la sistemul modelat.

11

Page 12: Gheorghe M.Panaitescu - ac.upg-ploiesti.roac.upg-ploiesti.ro/gpanaitescu/msds_2007.pdf · •Retele neuronale •Retele neuronale artificiale stratificate •Analiza multirezolutie

C. Tot pentru usurarea scrierii unui model reprezentativ în conditii de precizieadecvatǎ este necesarǎ analiza teoreticǎ a naturii sistemului de modelat/simulat.Sub acest aspect sunt necesare: • analiza mǎsurii în care principiile de bazǎ fizice si/sau fizico-chimice

guverneazǎ procesul sau sistemul, fie si partial; • stabilirea elementelor de naturǎ experimentalǎ, empiricǎ necesare pentru

definirea completǎ a modelului (parametri de estimat etc); • evaluarea proportiei elementelor empirice necesare în modelarea sistemului,

proportie care poate varia de la foarte putin la integral. D. Chiar din fazele timpurii ale procedurii de elaborare a modelului suntnecesare rezolvǎri ale modelului, un gen de simulare avant la lettre. Pentruaceasta, cel care elaboreazǎ modelul trebuie sǎ se preocupe de: • studiul de consistentǎ a modelului, studiul redundantelor existente; • selectarea metodelor de calcul adecvate în raport de liniaritatea sau

neliniaritatea sistemului modelat, de proportia elementelor deterministe sialeatoare etc.;

• selectarea metodelor numerice efective. E. Rezolvǎrile recomandate mai devreme au rolul principal de evaluare amodelului. Evaluarea modelului constǎ în principal în operatii de: • comparare si confruntare a modelului cu date experimentale sau alte date de

referintǎ; • estimare a parametrilor modelului, atunci când este formulat pe baze si

principii teoretice; • identificare a sistemului dacǎ modelarea este în cvasitotalitate de naturǎ

empiricǎ sau experimentalǎ. Se întelege cǎ etapele prezentate mai sus nu sunt inevitabile si nu trebuieparcurse obligatoriu în ordinea datǎ. Unele etape pot fi completate în functie denecesitǎtile practice, altele pot fi omise. Ordinea efectivǎ a pasilor modelǎriitrebuie sǎ fie cea potrivitǎ modelului si sistemului particular modelat. De celemai multe ori succesiunea aceasta are reveniri, cu reluarea unora dintre etape.

Clasificǎri ale modelelor

Diversitatea extraordinarǎ a modelelor matematice, chiar si pentru acelasisistem modelat face dificilǎ o taxonomie exhaustivǎ. În aceste conditii,clasificǎrile care urmeazǎ sunt fatalmente însuficiente dar majoritatea lor sereferǎ atât la modele cât si la sistemele modelate si simulate cu acele modele. Existǎ o clasificare (A) dupǎ numǎrul intrǎrilor si al iesirilor sistemului si/saumodelului. Modelele cu o singurǎ intrare si o singurǎ iesire, cunoscute în textescrise în limbi diverse si sub prescurtarea SISO (Single Input Single Output)sunt foarte utile în studiul fundamental al dinamicii sistemelor simple. Modelelecu mai multe intrǎri si mai multe iesiri, prescurtate MIMO (Multiple Input

12

Page 13: Gheorghe M.Panaitescu - ac.upg-ploiesti.roac.upg-ploiesti.ro/gpanaitescu/msds_2007.pdf · •Retele neuronale •Retele neuronale artificiale stratificate •Analiza multirezolutie

Multiple Output) aduc în prim plan complexitatea sistemelor cu comenzi sirǎspunsuri multiple. Existǎ de asemenea o clasificare (B) dupǎ natura variabilei timp; sistemele simodelele lor pot fi continue, dacǎ timpul ia valori pe multimea numerelor realesau pe un interval compact; sistemele si modelele pot fi discrete, dacǎ timpul iavalori pe multimea numerelor intregi sau pe o multime de valori numerabilǎ. Ecuatiile constitutive ale unui model matematic produc o clasificare (C) dupǎnatura ecuatiilor continute în model. Ecuatiile modelului pot fi exclusivalgebrice, caz în care este vorba uzual de modele stationare sau cvasistationare.Modelul poate fi constituit din ecuatii diferentiale ordinare din ecuatiiintegrale sau din ecuatii integro-diferentiale. Modelele care contin ecuatii cuderivate partiale sunt considerate ca fiind într-o clasǎ aparte. Ecuatiile cudiferente sunt în fond tot ecuatii algebrice dar, de obicei, cu aspectul temporalfoarte bine evidentiat. Dacǎ modelul este omogen în ceea ce priveste tipurile deecuatii din care este format atunci el împrumutǎ calificativul de la tipul deecuatii respectiv. Modelele matematice sunt în mare parte hibride, adicǎ continecuatii apartinând mai multor tipuri din cele enumerate mai sus. Modelele matematice nu pot ignora o anumitǎ spatialitate a obiectelor si asistemelor modelate. De aici o clasificare (D) dupǎ caracterizarea spatialǎ asistemului modelat/simulat. Modelele pot fi cu parametri concentrati sau cuparametri distribuiti dupǎ cum starea sistemului modelat poate fi descrisǎprintr-un numǎr finit sau infinit de valori. Ecuatiile diferentiale ordinare suntmodele tipice pentru sistemele cu parametri concentrati, cele cu derivatepartiale sunt tipice pentru sistemele cu parametri distribuiti. Foarte multe sisteme au manifestǎri aleatoare fie datorate unor factori externi,fie din cauza naturii lor intime. Functie de importanta fenomenelor aleatoare seobtine o clasificare în (E) modele de tip determinist si modele stochastice.Modelele de tip determinist nu au elemente întâmplǎtoare (aleatoare) îndescrierea matematicǎ, variabilele si parametrii au valori bine definite sisolutiile sunt, tot asa, numere bine precizate.Modelele stochastice au elemente aleatoare structurale si/sau exogene si valorilevariabilelor care le caracterizeazǎ, uneori inclusiv valorile parametrilor nu suntniciodatǎ cunoscute cu exactitate ci numai sub forma unor valori mai-mult-sau-mai-putin-probabile acompaniate de probabilitǎti cuantificabile. Existǎ sisteme care îsi mentin în timp caracteristicile ceea ce le face previzibilepe termen lung, existǎ altele care manifestǎ o evidentǎ evolutie. Sub acestaspect modelele si sistemele se clasificǎ în (F) modele/sisteme invariante saumodele/sisteme evolutive, care nu sunt invariante. Sistemele si modeleleinvariante au perechile de intrǎri/iesiri insensibile la translatia în timp. Aceastǎinvariantǎ înseamnǎ de regulǎ mentinerea constantǎ în timp a parametrilormodelului. Sistemele si modelele evolutive au dimpotrivǎ perechile deintrǎri/iesiri dependente de modificarea originei timpului.

13

Page 14: Gheorghe M.Panaitescu - ac.upg-ploiesti.roac.upg-ploiesti.ro/gpanaitescu/msds_2007.pdf · •Retele neuronale •Retele neuronale artificiale stratificate •Analiza multirezolutie

Dupǎ liniaritatea ecuatiilor modelului se obtin clase (G) de modele liniare simodele neliniare. Modelele/sistemele sunt liniare dacǎ fiind date douǎ perechide intrǎri/iesiri, altfel oarecare, orice combinatie liniarǎ a celor douǎ intrǎriproduce o combinatie liniarǎ cu aceeiasi coeficienti a celor douǎ iesiricorespunzǎtoare intrǎrilor aplicate separat. Liniaritatea unui model asigurǎaccesul la un numǎr important de metode analitice de tratare teoreticǎ si derezolvare consacrate. Modelele si sistemele sunt în marea lor majoritateneliniare adicǎ nu reproduc combinatiile liniare ale intrǎrilor în combinatiiliniare ale iesirilor cum sistemele si modelele liniare o fac. Aceste modele auhandicapul unui acces limitat la metode analitice consacrate. Sunt utilizatemetode numerice de tratare, cele mai multe din ele bazate pe liniarizǎri valabilepe domenii limitate.

Relatia între multimea modelelor si multimea sistemelor

Douǎ sisteme fizice distincte sau douǎ modele care la intrǎri identice au reactiiidentice sunt echivalente. O afirmatie cu valoare de truism: pentru fiecaresistem existǎ un model. Este posibil ca un acelasi sistem sǎ aibǎ mai multemodele matematice, fie de genuri diferite, fie de acelasi gen. Fiecare modelconstituie o realizare a sistemului modelat. Într-un anume sens, precizat de lacaz la caz, se poate pune problema unui model minimal. De asemenea, se poateafirma cǎ un acelasi model matematic poate servi la modelarea mai multorsisteme fizice, chiar de naturi diferite. Prin urmare nu existǎ o relatie cardinalǎclarǎ între cele douǎ multimi, cea a modelelor si cea a sistemelor. Nu se poatespune cǎ multimea sistemelor este mai cuprinzǎtoare decât cea a modelelor sinici invers.

Probleme

Problema 1.Urmǎrind etapele elaborǎrii modelului unui rezistor prezentate în acest capitol,încercati o dezvoltare similarǎ pentru un condensator sau pentru o inductantǎ.Problema 2.Un sistem hidrotehnic, de pildǎ cel de la Paltinu este un sistem cu o dinamicǎproprie. Este acesta un sistem invariant?Evidentiati presupusele variabile manipulabile ale sistemului.Evidentiati perturbatiile care actionazǎ asupra sistemului.Enumerati câteva aspecte aleatoare ale sistemului.

Exercitii de autoevaluare

1. Fie un sistem (dinamic) si un model al lui. Modelul este:

14

Page 15: Gheorghe M.Panaitescu - ac.upg-ploiesti.roac.upg-ploiesti.ro/gpanaitescu/msds_2007.pdf · •Retele neuronale •Retele neuronale artificiale stratificate •Analiza multirezolutie

a) sistemul însusi, b) descrierea matematicǎ riguroasǎ a sistemului

sau c) o exprimare matematicǎ a comportǎrii sistemului printre multe altele

posibile2. Fie un sistem dinamic invariant. Un astfel de sistem:

a) are un model matematic cu toti coeficientii constanti în timp;b) sub actiunea acelorasi intrǎri aplicate la momente diferite, rǎspunsul

este identic dacǎ starea sistemului este aceeasi în momenteleaplicǎrii intrǎrilor respective;

c) nu-si schimbǎ starea în timp.

Marcati afirmatia inadecvatǎ.3. Elaborarea unui model matematic al unui sistem dinamic se face

a) conform unei retete standard,b) cu reveniri asupra structurii matematice si asupra parametrilor care

intervin în model având în vedere utilizarea modeluluisau

c) se preiau din literaturǎ modele gata fǎcute?4. Un model matematic al unui sistem natural, alcǎtuit numai din ecuatii

algebrice poate descrie dinamica acelui sistem?a) niciodatǎ;b) numai dacǎ una din variabile este timpul;c) totdeauna.

5. Existǎ foarte multe sisteme (dinamice), existǎ foarte multe modelematematice ale sistemelor. Care este relatia dintre numǎrul de sisteme sinumǎrul de modele?

a) sunt mai multe modele decât sisteme modelate;b) sunt mai multe sisteme decât modele matematice;c) existǎ sisteme care au (fiecare) mai multe modele, existǎ modele

care servesc (fiecare) la modelarea mai multor sisteme, asadar nuexistǎ o relatie de tipul “≤”, “<”, “>” sau “≥” între cele douǎ numerecardinale, cel al mutimii de sisteme si cel al multimii de modele.

15

Page 16: Gheorghe M.Panaitescu - ac.upg-ploiesti.roac.upg-ploiesti.ro/gpanaitescu/msds_2007.pdf · •Retele neuronale •Retele neuronale artificiale stratificate •Analiza multirezolutie

16

Page 17: Gheorghe M.Panaitescu - ac.upg-ploiesti.roac.upg-ploiesti.ro/gpanaitescu/msds_2007.pdf · •Retele neuronale •Retele neuronale artificiale stratificate •Analiza multirezolutie

MODELE MATEMATICE DINAMICE

• Modele sub formǎ de ecuatii diferentiale ordinare • Efectul discretizǎrii timpului asupra modelelor de tipul ecuatiilor

diferentiale ordinare • Modele sub formǎ de ecuatii cu derivate partiale • Modele sub formǎ de ecuatii integrale sau ecuatii integro-diferentiale• Probleme• Exercitii de autoevaluare

În figura alǎturatǎ este reprezentat un sistem abstract care, fatǎ de sistemul maigeneral dat în capitolul anterior, capitol în bunǎ mǎsurǎ introductiv areparticularitatea cǎ nu este afectat de perturbatii, sau perturbatiile pot fi ignorate.

Se disting vectorul intrǎrilor u(t0, t) si vectorul iesirilor y(t0, t). Momentul t0

poate fi conventional o origine a timpului, momentul de început al aplicǎriiintrǎrilor care sunt functii de timp mai simple sau mai complicate. Ulteriormomentului initial t0 se observǎ iesirile. Acestea depind desigur de intrǎrileaplicate dar si de starea sistemului la momentul initial t0. Prin urmare iesirilesistemului, numite si rǎspunsul lui la intrǎri pot fi diferite dacǎ intrǎrile aplicatesunt repetat aceleasi dar starea sistemului este diferitǎ de la caz la caz înmomentul de început al aplicǎrii acelor intrǎri. Se poate spune cǎ, de fapt,intrǎrile actioneazǎ asupra stǎrii sistemului, iar iesirile observate sunt produsede modificǎrile în starea sistemului. Starea sistemului este descrisǎ uzual de un numǎr de variabile de stare, finit sauinfinit. Variabilele de stare sunt functii de timp si contin informatia minimalǎnecesarǎ la un moment t, altfel oarecare, pentru a determina comportareasistemului în momentele urmǎtoare, cu sau fǎrǎ intrǎri. Informatia privind stareaunui sistem este grupatǎ de obicei într-un vector x(t), asa-numitul vector destare. Vectorul x(t) nu este unic. Orice transformare liniarǎ nedegeneratǎ a

17

Page 18: Gheorghe M.Panaitescu - ac.upg-ploiesti.roac.upg-ploiesti.ro/gpanaitescu/msds_2007.pdf · •Retele neuronale •Retele neuronale artificiale stratificate •Analiza multirezolutie

spatiului componentelor acestui vector produce un vector de stare care continenealteratǎ informatia necesarǎ definirii stǎrii sistemului. Cu unele modificǎri în notatii, dacǎ starea sistemului în momentul initial t0 estedescrisǎ de vectorul x(t0) si dacǎ se aplicǎ sistemului intrǎrile u(t0, t) evolutiasistemului dupǎ t0 este observatǎ prin intermediul iesirilor y(t0, t).Relatiile care cuprind dependenta rǎspunsului unui sistem de starea lui curentǎsi de intrǎrile aplicate si care dau sansa calculului explicit al rǎspunsului seconstituie în modelul matematic al acelui sistem. Dupǎ cum s-a arǎtat în introducere, modelele matematice ale sistemelor suntde tipuri variate. În continuare sunt comentate câteva tipuri de modele, modulcum se scriu ele si se dau si metode de calcul menite a evalua rǎspunsulsistemelor la intrǎri special selectate sau la intrǎri oarecare. Mare parte dinelementele prezentate în cele ce urmeazǎ se regǎsesc în cǎrtile de matematicisau au mai fost abordate si la alte discipline pe care cititorul le-a parcursanterior. Pentru aprofundarea unor aspecte se recomandǎ revederea acelorsurse.

Modele sub formǎ de ecuatii diferentiale ordinare

Un exemplu relativ simplu, discutat mult în literaturǎ este cel al unui vasalimentat cu lichid si din care se evacueazǎ (o parte din) acel lichid. Vasul esteprezentat schematic în figura alǎturatǎ.

Se admite cǎ debitele de alimentare si de evacuare, Fi(t), Fo(t), sunt exprimate înunitǎti de volum în unitatea de timp. Într-un interval de timp scurt ∆t,alimentarea cu lichid a vasului si cantitatea de lichid evacuatǎ este datǎ determenii din partea dreaptǎ a relatiei care urmeazǎ.

tttFtttFtVttV oi ∆∆+−∆∆+=−∆+ )()()()( 21 θθCei doi termeni, prin coeficientii ]1,0[, 21 ∈θθ tin seama de o formulǎ de mediebinecunoscutǎ din analiza matematicǎ si diferenta lor egaleazǎ variatiavolumului de lichid din vas, care este reprezentatǎ de partea stângǎ a egalitǎtii.Ecuatia respectivǎ este o relatie de continuitate pentru intervalul finit de timpavut în vedere.

18

Page 19: Gheorghe M.Panaitescu - ac.upg-ploiesti.roac.upg-ploiesti.ro/gpanaitescu/msds_2007.pdf · •Retele neuronale •Retele neuronale artificiale stratificate •Analiza multirezolutie

Trecerea la limitǎ prin diminuarea intervalului de timp ∆t conduce la ecuatiadiferentialǎ

)()( tFtFdtdV

oi −=

care este modelul dinamicii sistemului în discutie. Dacǎ vasul are pe întreaga luiverticalǎ aria sectiunii transversale constantǎ (altfel spus, dacǎ este cilindric)atunci variabila de stare V poate fi înlocuitǎ de variabila de stare h, cotalichidului în vas, care descrie de asemenea complet starea sistemului la unmoment dat. Desigur, vasul poate avea alimentǎri multiple, în numǎr de ni, iar evacuarealichidului se poate face pe mai multe cǎi, în numǎr de no. Atunci ecuatia modelal dinamicii vasului este

∑∑==

−=oi n

kok

n

jij tFtF

dtdV

11

)()(

Este de retinut sensul fizic al acestei ecuatii numitǎ de continuitate: sumaalimentǎrilor minus suma evacuǎrilor egaleazǎ acumularea de lichid în vas.Ecuatiile de continuitate mai sunt numite uneori si ecuatii de bilant material.De observat cǎ ecuatiile de mai sus modeleazǎ vasul pentru un interval de valoriale volumului V sau ale înǎltimii h finit: nu se mai poate evacua lichid dintr-unvas gol, nu se mai poate alimenta lichid într-un vas care este deja plin.Starea unui sistem de acest gen poate fi modificatǎ fie prin debitul (debitele) dealimentare, fie prin debitul (debitele) de evacuare, fie prin modificarea unordebite din ambele categorii. Debitele acestea sunt, asadar, variabile de intrareale sistemului dinamic. Acestea pot fi manipulate prin mijloace de vehiculare(pompe, de pildǎ) combinate eventual cu elemente de comandǎ a debitelor(robinete). Iesirea sistemului poate fi înǎltimea coloanei de lichid din vas.Mijloacele de vehiculare, în fond surse de presiune, pot lipsi uneori, de pildǎ peevacuarea lichidului. Se poate utiliza în loc scurgerea naturalǎ a lichidelor subactiunea fortei gravitationale, ea însǎsi sursǎ de presiune, presiunea hidrostaticǎ.În acest caz modelul de mai sus se completezǎ cu modelul scurgerii libere alichidului, pe o cale sau alta de evacuare situatǎ la distanta h de suprafatalichidului din vas. Presiunea hidrostaticǎ medie în orificiul de scurgere esteprodusul densitǎtii lichidului, cu acceleratia gravitatiei si cu înǎltimea coloaneide lichid. Forta care actioneazǎ asupra unui element de jet cu aria sectiunii Ao,exact cât sectiunea orificiului de evacuare, si de o lungime micǎ ∆l esteproportionalǎ cu acea arie. Masa elementului de jet se obtine multiplicândvolumul respectiv, infinitesimal cu densitatea ρ a lichidului. Dintr-un bilant deenergii rezultǎ

2

21

∆=∆

o

ooo A

FlAlghA ρρ

19

Page 20: Gheorghe M.Panaitescu - ac.upg-ploiesti.roac.upg-ploiesti.ro/gpanaitescu/msds_2007.pdf · •Retele neuronale •Retele neuronale artificiale stratificate •Analiza multirezolutie

cu expresia vitezei jetului de lichid la iesirea din orificiu cuprinsǎ întreparanteze. În cele din urmǎ, debitul de evacuare dictat de fortele gravitationaleeste

ghAF oo 2=Este usor de observat cǎ ecuatia model se modificǎ si capǎtǎ forma

ghAtFdtdV

oi 2)( −=

mai complicatǎ într-un anume sens care va fi discutat mai departe (anticipând,ecuatia descrie acum un sistem neliniar). Pretutindeni debitele se exprimǎvolumetric. De observat cǎ bilanturile de energii reprezintǎ si ele o sursǎ deecuatii utilizabile în modelarea dinamicii sistemelor, ecuatii bazate pe fenomenefizice.Scurgerea naturalǎ a lichidului din vas capǎtǎ aspecte diferite atunci când seproduce printr-o conductǎ lungǎ si nu printr-un simplu orificiu de lungimeneînsemnatǎ. Apar fenomene de frecare pe calea de transport, care nu pot fiignorate. Astfel, dacǎ se face referire la figura alǎturatǎ, asupra lichidului dinconductǎ socotit incompresibil actioneazǎ pe lângǎ forta datoratǎ presiuniihidrostatice de la iesirea din vas si o fortǎ de frecare kf(Fo/Ap)2l, care depinde deun factor de frecare kf, de debitul de evacuare Fo si de aria sectiunii transversaleAp a conductei de lungime l. Aceastǎ fortǎ este datoratǎ caracteristicii fizice alichidului numitǎ vâscozitate si fortelor care determinǎ aderenta lichidului laperetele conductei. Ea este proportionalǎ cu lungimea conductei si, dacǎcurgerea este laminarǎ, adicǎ este lipsitǎ de agitatia, de turbulenta care apare laviteze mari de deplasare, este proportionalǎ cu pǎtratul vitezei medii dedeplasare prin conductǎ. În cazul vitezelor mari fenomenul frecǎrii este maicomplex, ceea ce se traduce prin relatii mai complicate pentru calculul aceleiforte. În cazul vitezelor medii mici, legea conservǎrii impulsului masei de lichidîn deplasare coduce la

lAFkghA

dt

AF

lAd

p

ofp

p

op 2

−=

ρρ

care dupǎ rearanjare se scrie 2

2 op

fpo FA

kh

lgA

dtdF

ρ−=

si care completeazǎ cu încǎ o ecuatie modelul de mai sus bazat exclusiv peecuatia de continuitate.Este de observat cǎ modelul dinamicii sistemului cu evacuare pe conducte lungiîsi schimbǎ ordinul, adicǎ numǎrul variabilelor de stare creste de la una (V) ladouǎ si se constituie într-un vector de stare (V Fo)T cu douǎ componente. Este de

20

Page 21: Gheorghe M.Panaitescu - ac.upg-ploiesti.roac.upg-ploiesti.ro/gpanaitescu/msds_2007.pdf · •Retele neuronale •Retele neuronale artificiale stratificate •Analiza multirezolutie

retinut cǎ scrierea modelului a fǎcut apel la o altǎ importantǎ lege a fizicii, legeaconservǎrii impulsului.

În general, o clasǎ foarte cuprinzǎtoare de sisteme fizice se poate modela prinsisteme de ecuatii cu derivate ordinare. Sistemele din aceastǎ clasǎ pot ficaracterizate printr-un vector de stare de dimensiune finitǎ care satisface ecuatiadiferentialǎ ordinarǎ în formǎ vectorialǎ

)](),(,[ tutxtfdtdx =

Ecuatia exprimǎ evolutia stǎrii sistemului descrisǎ de vectorul x(t) sub actiuneaintrǎrilor u(t), iar conditiile initiale despre care se vorbeste în manualele dematematicǎ se referǎ de fapt la starea initialǎ x(t0) a sistemului modelat.Modelul se referǎ desigur la un sistem real. Asadar, intereseazǎ ca ecuatia sǎaibǎ solutie, iar solutia sǎ fie unicǎ. Existenta si unicitatea solutiei se transformǎastfel dintr-o problemǎ matematicǎ într-o problemǎ foarte practicǎ. Formafunctiei din partea dreaptǎ a ecuatiei de mai sus poate fi mai simplǎ sau maicomplicatǎ, iar simplitatea sau complexitatea se reflectǎ din plin asupraproblemelor existentei si unicitǎtii solutiilor. Rǎspunsul este relativ simplupentru forma liniarǎ a ecuatiei de mai sus

GuFxdtdx +=

în care F si G sunt matrici de dimensiunile cuvenite. Dacǎ cele douǎ matricisunt invariante în timp, sistemul însusi se numeste invariant, iar solutia existǎaproape totdeauna si ea este unicǎ dacǎ se precizeazǎ conditia initialǎ x(t0) = x0.Pentru cazul în discutie, într-o primǎ etapǎ, ecuatia omogenǎ, adicǎ ecuatia cuintrǎri nule

Fxdtdx =

are solutia 00 )](exp[)( xttFtx −=

unde s-a notat

++++=!3!2

)exp(3322 tFtFFtIFt

21

Page 22: Gheorghe M.Panaitescu - ac.upg-ploiesti.roac.upg-ploiesti.ro/gpanaitescu/msds_2007.pdf · •Retele neuronale •Retele neuronale artificiale stratificate •Analiza multirezolutie

Matricea )](exp[)( 00 ttFtt −=−Φ

este matricea de tranzitie a stǎrii sistemului, asadar se poate scrie 00 )()( xtttx −Φ=

Într-o etapǎ secundǎ, pentru cazul neomogen, adicǎ atunci când intrǎrile suntefectiv aplicate, se pune

)()()( 0 tztttx −Φ=cu z(t) o functie derivabilǎ, deocamdatǎ neprecizatǎ. Prin derivare, relatiaaceasta conduce la

dtdztz

dtd

dtdx Φ+Φ= )(

Din relatia de definitie rezultǎ limpede cǎ functia de tranzitie verificǎ ea însǎsiecuatia omogenǎ si are proprietǎtile

I=Φ )0()()()( 00 tttt −Φ−Φ=−Φ ττ

[ ] 100 )()( −−Φ=−Φ tttt

exprimate matricial, cu I matricea unitate de ordin egal cu ordinul sistemuluimodelat. Dacǎ se dǎ curs demonstratiei cu luarea în seamǎ a observatiilorultime, se poate scrie

dtdzFx

dtdx Φ+=

si prin comparatie cu ecuatia initialǎ rezultǎ

Gudtdztt =−Φ )( 0

si mai departe

[ ] Guttdtdz 1

0 )( −−Φ=

admitând cǎ inversa matricei de tranzitie existǎ. Prin integrarea acestei ultimeecuatii rezultǎ

[ ]∫ −−Φ+=t

t

dGuttztz0

)()()()( 100 τττ

si înlocuind în expresia vectorului x(t) de mai sus, se obtine

[ ]∫ −−Φ−Φ+−Φ=t

t

dGutttxtttx0

)()()()()( 10000 τττ

unde termenul cu integrala reprezintǎ contributia intrǎrilor u(t) la modificareastǎrii sistemului sau, cum se mai obisnuieste a se spune, este solutia forţatǎ asistemului de ecuatii, spre a o distinge de solutia liberǎ a sistemului omogen.

22

Page 23: Gheorghe M.Panaitescu - ac.upg-ploiesti.roac.upg-ploiesti.ro/gpanaitescu/msds_2007.pdf · •Retele neuronale •Retele neuronale artificiale stratificate •Analiza multirezolutie

Cum functia de tranzitie din fata integralei nu depinde de variabila de integrareea poate fi introdusǎ sub integralǎ ceea ce transformǎ relatia de mai sus în

[ ]∫ −−Φ−Φ+−Φ=t

t

dGutttxtttx0

)()()()()( 10000 τττ

Dacǎ se tine seamǎ de proprietatea a doua a functiei de tranzitie, aceea decompunere multiplicativǎ a functiilor de tranzitie atunci se obtine o nouǎexpresie a solutiei sistemului de ecuatii

[ ]∫ −−Φ−Φ−Φ+−Φ=t

t

dGutttxtttx0

)()()()()()( 10000 τττττ

care ulterior conduce la

∫ −Φ+−Φ=t

t

dGutxtttx0

)()()()( 00 τττ

expresie în care efectul intrǎrilor este evaluat prin clasica integralǎ deconvolutie, într-o formǎ usor modificatǎ. Cazul examinat în detaliu imediat mai sus este destul de particular. Nici mǎcarsistemele aparent simple de la începutul sectiunii, ilustrative pentru modelareacu (sisteme de) ecuatii diferentiale ordinare nu pot fi cuprinse toate în categoriasistemelor de relatii de forma discutatǎ, adicǎ cu toti coeficientii din matricile Fsi G constanti. Un model de tipul adus în discutie este totusi utilizabil pe zonerestrânse ale domeniilor de definitie ale functiilor care apar în dreapta semnuluide egalitate din forma generalǎ a sistemului de ecuatii diferentiale. Zona estedeterminatǎ de aproximǎri ale acelor functii cu o eroare acceptabilǎ prindezvoltarea lor conform binecunoscutei formule a lui Taylor, dezvoltare limitatǎla termenii liniari.O formǎ mai generalǎ a sistemului de ecuatii diferentiale este

)()()()( tutGtxtFdtdx +=

cu matricile F si G dependente de timp. Se observǎ cǎ liniaritatea estementinutǎ dar sistemul înceteazǎ a mai fi invariant. Un sistem modelat astfel vafi denumit în continuare evolutiv, în sensul cǎ în afara proceselor dinamice,tranzitorii, procese temporale prin excelentǎ, mai existǎ o evolutie parametricǎ,uzual la o altǎ scarǎ de timp. Si în cazul acesta, pornind de la sistemul omogen

)()( txtFdtdx =

dacǎ se defineste o matrice de tranzitie );( 0ttΦ , ea satisface relatiile

);()();(

00 tttF

dtttd

Φ=Φ

23

Page 24: Gheorghe M.Panaitescu - ac.upg-ploiesti.roac.upg-ploiesti.ro/gpanaitescu/msds_2007.pdf · •Retele neuronale •Retele neuronale artificiale stratificate •Analiza multirezolutie

Itt =Φ );( 00

si atunci 00 );()( xtttx Φ=

Matricea de tranzitie a stǎrii sistemului depinde, asadar, de timpul stabilit caorigine t0 si are urmǎtoarele proprietǎti

);();();( 011202 tttttt ΦΦ=Φ

[ ] 100 );();( −Φ=Φ tttt

dovedite de Athans si Falb (M.Athans si P.L.Falb Optimal Control McGrawHill, 1966), similare celor din cazul sistemelor invariante, si cu timpul inital t0

ca parametru. Reluând pas cu pas firul demonstratiei de mai sus, în cazul unui sistem evolutiv,pornind cu

)();()( 0 tztttx Φ=într-o procedurǎ similarǎ se obtine

[ ]∫ −ΦΦ+Φ=t

t

duGtttxtttx0

)()();();();()( 10000 ττττ

si, în final

∫Φ+Φ=t

t

duGtxtttx0

)()();();()( 00 ττττ

Matricea F(t) trebuie sǎ fie continuǎ pe orice interval finit de timp. Calcululmatricei de tranzitie );( 0ttΦ nu este fǎrǎ probleme. O modalitate de calculconstǎ în a lua un numǎr limitat de termeni din dezvoltarea functiei exp[F(t)t]de mai sus, numǎr dependent de magnitudinea elementelor matricei F(t) si devalorile timpului t. De retinut relatia

[ ] r

FFt 2)exp()exp( τ=unde t = 2rτ cu numǎrul r întreg. Posibilitatea alegerii un interval τ pentru oconvergentǎ rapidǎ, apoi ridicarea la pǎtrat de r ori reprezintǎ o posibilitate deacoperire a unor largi orizonturi de timp. Metoda seriilor pentru calcululmatricei de tranzitie este simplu de aplicat si potrivitǎ calculului numeric. Ea nunecesitǎ valorile proprii ale matricei F ca în cazul altor metode (transformareaLaplace inversǎ, Hamilton-Cayley, transformǎrile matricei F prin asemǎnare). Câteva cuvinte acum despre sistemul de ecuatii adjunct. Pentru sistemul deecuatii diferentiale

GuFxdtdx +=

se defineste ca sistem de acuatii adjunct

zFdtdz T−=

24

Page 25: Gheorghe M.Panaitescu - ac.upg-ploiesti.roac.upg-ploiesti.ro/gpanaitescu/msds_2007.pdf · •Retele neuronale •Retele neuronale artificiale stratificate •Analiza multirezolutie

care este un model pentru sistemul real dacǎ acesta ar lucra parcurgând axatimpului în sens invers. Sistemul de ecuatii adjunct este util în tratarea unorprobleme de stabilitate a calculului numeric. Matricea de tranzitie );( 0ttΨasociatǎ sistemului adjunct verificǎ ecuatia

);();(

00 ttF

dtttd T Ψ−=

Ψ

si Itt =Ψ );( 00 , [ ] );();();( 0

100 ttttttT Φ=Φ=Ψ −

Exemplul prezentat în introducerea sectiunii acesteia a permis ilustrarea uneimodalitǎti de scriere a unor modele de tipul sistemelor de ecuatii diferentialeordinare. În prima variantǎ, cea a vasului cilindric cu alimentare si evacuarefortate sau manipulabile, modelul este liniar si invariant. Sistemul în varianta cuscurgere liberǎ datoratǎ presiunii hidrostatice, adicǎ prin actiunea fortelorgravitationale, pe un orificiu liber sau pe o conductǎ lungǎ este tot invariantdeoarece nu este sensibil la o deplasare a originii timpului: el evolueazǎ identicori de câte ori se repetǎ aceeasi stare initialǎ si aceleasi intrǎri. Sistemul esteînsǎ neliniar deoarece se modeleazǎ prin ecuatii diferentiale cu partea dreaptǎcontinând puteri fractionare sau întregi diferite de unitate ale unor variabile destare. Liniarizarea pe domenii restrânse este permisǎ, dar cu precautiilementionate mai devreme. Liniarizarea atunci când este posibilǎ produce sistemede ecuatii diferentiale liniare, în general usor de manipulat. Modurile deevolutie a sistemului sunt date sintetic de forma canonicǎ (bloc)diagonalǎ amatricii F. Diagonalizarea matricii F aduce pe diagonalǎ valorile proprii alematricei care sunt reale sau complexe si conjugate ori de câte ori elementelematricei sunt reale, adicǎ aproape totdeauna. Pentru sistemele liniare siinvariante sau liniarizate si deci local invariante se poate utiliza întregul arsenalde metode din calculul operational. La fel studiul în domeniul frecventelor esteposibil. Nu totdeauna însǎ liniarizarea produce rezultate utilizabile sub aspectpractic. Pentru forma brutǎ a sistemelor de ecuatii diferentiale neliniare, lucrulexclusiv în domeniul timp este inevitabil si de aceea sunt necesare metode deintegrare numericǎ adecvate. Iatǎ mai departe, pe scurt, câteva dintre cele maiutilizate. Metoda Runge-Kutta (de ordinul 4). Ecuatia de integrat are forma

),( xtfdtdx =

si se impune conditia initialǎ00 )( xtx =

Formulele utilizate pentru evaluarea vectorului x la fiecare pas al integrǎrii sunt

( ))(4

)(3

)(2

)(16

1 iiiii kkkkx +++=∆

25

Page 26: Gheorghe M.Panaitescu - ac.upg-ploiesti.roac.upg-ploiesti.ro/gpanaitescu/msds_2007.pdf · •Retele neuronale •Retele neuronale artificiale stratificate •Analiza multirezolutie

iii xxx ∆+=+1

în care( )ii

i xthfk ,)(1 =

++=

2,

2

)(1)(

2

i

iii kxhthfk

++=

2,

2

)(2)(

3

i

iii kxhthfk

( ))(3

)(4 , i

iii kxhthfk ++=

cu h cresterea elementarǎ a variabilei t si cu indicele i = 1, 2, ... care indicǎpasii succesivi de integrare. Metoda Adams. Primii trei pasi în variabila t se calculeazǎ cu o altǎ metodǎ, depildǎ cu metoda Runge-Kutta, si se noteazǎ x1 = (t0 + h), x2 = (t0 + 2h) si x3 = (t0

+ 3h). Apoi se calculeazǎ q0 = hx'0 = hf(t0, x0), q1 = hx'1 = hf(t1, x1), q2 = hx'2 = hf(t2, x2), q3 = hx'3 = hf(t3, x3) precum si diferentele de ordinul 1 ale valorilorfunctiei x(t), ∆xi = xi+1 – xi si diferentele de ordinele 1, 2 si 3 ale valorilor q, ∆qi

= qi+1 – qi, ∆2qi = ∆qi+1 – ∆qi si ∆3qi = ∆2qi+1 – ∆2qi. Metoda Adams constǎ în calculul unei noi diferente

33

22

1 83

125

21

−−− ∆+∆+∆+=∆ iiiii qqqqx

pentru i = 3, 4, ... prin extrapolare, ceea ce permite predictia unei noi valoriiii xxx ∆+=+1 . Cu valoarea nou calculatǎ xi+1 se recalculeazǎ cantitǎtile qi si

diferentele lor de ordinele 1, 2 si 3 si apoi

33

22

1 241

121

21

−−− ∆−∆−∆+=∆ iiiii qqqqx

care este o valoare corectatǎ. Eroarea de integrare este mǎsuratǎ de normacori

predi xx − , care dacǎ este dincolo de o limitǎ acceptatǎ impune modificarea

pasului de integrare. Metoda Adams este o metodǎ din categoria predictor-corector. Metoda oferǎ prin aceasta posibilitatea controlului asupra pasului deintegrare în variabila t. Pentru facilitarea calculelor si pentru utilizarea rationalǎa memoriei pot fi utilzate alternativ relatiile

( )3211 937595524 −−−+ ′−′+′−′+= iiiii

predi xxxxhxx

( )2111 519924 −−++ ′+′−′+′+= iiiii

cori xxxxhxx

cu accent pentru valorile derivatei.Metoda Milne este, de asemenea, o metodǎ din categoria predictor-corector.Necesitǎ la pornire perechile (ti, xi) pentru i = 0, 1, 2, 3 rezultate din conditia

26

Page 27: Gheorghe M.Panaitescu - ac.upg-ploiesti.roac.upg-ploiesti.ro/gpanaitescu/msds_2007.pdf · •Retele neuronale •Retele neuronale artificiale stratificate •Analiza multirezolutie

initialǎ si prin calcul (de pildǎ prin metoda Runge-Kutta). Formulele la fiecarepas urmǎtor sunt

( )12341 2234

−−−−+ ′+′−′+= iiiipredi xxxhxx

( )iiiicori xxxhxx ′+′+′+= −−−+ 1221 4

3Si în metoda Milne controlul pasului de integrare h în raport cu eroarea

cori

predi xx − este posibil.

Metodele datorate lui Adams si lui Milne nu sunt singurele din categoriapredictor-corector.Pachetul de programe Matlab, cu care se lucreazǎ uzual la orele de aplicatiicontine o gamǎ de functii care executǎ integrarea sistemelor de ecuatiidiferentiale ordinare. Functiile respective sunt relativ usor de utilizat. Un detaluide metionat: se vorbeste acole de sisteme rigide (stiff) care necesitǎ o atentiespecialǎ si versiuni speciale ale functiilor din pachet. Rigiditatea (sau proastaconditionare) se aseamǎna întrucâtva cu aceea de la sistemele de ecuatiialgebrice liniare când determinantul unui sistem (Kramer) este foarte aproapede a fi nul (comparativ cu determinantii ceilalti obtinuti prin subtituireatermenilor liberi pe coloane diferite ale determinantului principal). Aici proastaconditionare se referǎ la valorile proprii ale matricei F care pot fi de ordine demǎrime foarte diferite. Ordinele de mǎrime diferite indicǎ faptul cǎ modelulmodeleazǎ fenomene care se deruleazǎ în sistemul modelat cu viteze foartediferite. Procesele rapide coexistente cu procesele lente trebuie tratate cuatentie, altminteri rezultatele obtinute prin calcul pot fi alterate în semnificatialor.

Efectul discretizǎrii timpului asupra modelelor de tipul ecuatiilordiferentiale ordinare

Dinamica unor sisteme poate fi urmǎritǎ si pe multimi temporale discrete.Ecuatiile modelatoare sunt analoge ale ecuatiilor diferentiale ordinare daroperatorul diferential care opera pe multimi compacte lipseste pentru cǎvariabila t ia valori discrete si echidistante pe axa timpului. Un sistem estemodelat în aceste circumstante prin ecuatii de forma

( ) ( ) ( )[ ]kkkk tutxtftx ,,1 =+

si starea sistemului este descrisǎ numai la momente precizate, discrete, marcatede indicii atasati variabilei temporale. Intrǎrile se considerǎ de asemenea cǎ semodificǎ la aceleasi momente discrete. Iesirile se exprimǎ ca functii de vectoruldiscret de stare

( ) ( )[ ]kk txhty =+1

27

Page 28: Gheorghe M.Panaitescu - ac.upg-ploiesti.roac.upg-ploiesti.ro/gpanaitescu/msds_2007.pdf · •Retele neuronale •Retele neuronale artificiale stratificate •Analiza multirezolutie

Uneori un model de tipul acesta se referǎ la sisteme care efectiv, prin natura lorîsi modificǎ starea la momente de timp precizate. De foarte multe ori însǎ acestemodele se referǎ la sisteme fizice continue în timp. Se preferǎ modelele discretedin motive diverse: comoditatea unor reglǎri numerice, inertii mari alesistemului etc.Operatia de discretizare a unui sistem în esentǎ continuu meritǎ o atentiespecialǎ. Un sistem continuu în raport cu timpul, liniar, descris de ecuatiile

GuFxdtdx +=

Hxy =se poate discretiza în anumite conditii conform regulilor expuse mai departe. În cazul foarte general al sistemelor dinamice evolutive solutia sistemului este,dupǎ cum s-a vǎzut mai devreme

∫Φ+Φ=t

t

duGtxtttx0

)()();();()( 00 ττττ

unde );( 0ttΦ este matricea de tranzitie cu proprietǎtile binecunoscute

);();();( 011202 tttttt ΦΦ=Φ

[ ] 100 );();( −Φ=Φ tttt

dacǎ inversa matricei de tranzitie existǎ. Dacǎ sistemul este invariant atunci solutia ecuatiilor diferentiale de mai sus este

∫ −Φ+−Φ=t

t

dGutxtttx0

)()()()( 00 τττ

în care matricea de tranzitie este Φ(t) = exp(Ft) si are proprietǎtile I=Φ )0(

)()()()()( 122121 tttttt ΦΦ=+Φ=ΦΦ[ ] 1)()( −−Φ=Φ tt

dacǎ Φ(t) este nesingularǎ. Din relatiile ultime rezultǎ[ ] ktkt )()( Φ=Φ

Discretizarea are la bazǎ în cazul din urmǎ relatia

)()();()();(

)()();()();()(

1

1

11

111

k

t

tkkkk

t

tkkkkk

tudGttxtt

duGttxtttx

k

k

k

k

Φ+Φ=

=Φ+Φ=

∫+

+

++

+++

τττ

ττττ

unde s-au introdus intrǎrile u(tk) socotite constante pe orice interval [tk, tk+1).(Mentinerea constantǎ a intrǎrilor este una din mai multe alegeri posibile.Discretizǎri mai rafinate se pot realiza prin interpolarea liniarǎ a intrǎrii între

28

Page 29: Gheorghe M.Panaitescu - ac.upg-ploiesti.roac.upg-ploiesti.ro/gpanaitescu/msds_2007.pdf · •Retele neuronale •Retele neuronale artificiale stratificate •Analiza multirezolutie

douǎ momente consecutive tk, tk+1, prin aproximǎri biliniare Tustin etc.)Cunostinte elementare de calcul integral oferǎ mai multe posibiltǎti deaproximare a integralei din ultima expresie a evolutiei stǎrii sistemului înintervalul mentionat. Dacǎ se tine seamǎ de echivalenta multimii momentelor tk

cu multimea numerelor întregi sau cu o parte a ei, se poate scrie )()()()()1( kukGkxkFkx +=+

cu expresiile pentru F(k) si G(k) usor de identificat. Dacǎ pasul timpului T sementine mic fatǎ de constantele de timp ale sistemului, atunci

( )+++≈

!2)()()(

2TtFTtFIkF kk

( )∫+

+++≈

1

!2)(

)()()(2k

k

t

t

kkk d

tFtFItGkG τ

ττ

sunt exprimǎri aproximative convenabile pentru cele douǎ matrici, care suntutilizabile atât pentru sisteme invariante cât si pentru sisteme cu evolutie.Tratarea modelului discret/discretizat al unui sistem dinamic se face într-unanumit mod pentru cazul invariant si diferit pentru cazul evolutiv. În cazulliniar si invariant matricile F(k) si G(k) sunt constante în timp si ecuatia deevolutie a stǎrii sistemului este datǎ de

)()()1( kGukFxkx +=+Urmând metoda de la ecuatiile diferentiale ordinare, ecuatia omogenǎ aresolutia generalǎ

)0()( xFkx k=Matricea de tranzitie este, asadar

kFk =Φ )(si

)0()()( xkkx Φ=În cazul neomogen

)0()0()1( GuFxx +=)1()0()0()1()1()2( 2 GuFGuxFGuFxx ++=+=

si în general

∑−

=

−−+=1

0

1 )()0()(k

i

ikk iGuFxFkx

O scriere alternativǎ, cu înlocuirea puterilor matricii F cu matricea de tranzitiecorespunzǎtoare este

∑−

=

−−Φ+Φ=1

0

)()1()0()()(k

i

iGuikxkkx

În oricare din ultimele douǎ expresii suma are semnificatia unei convolutiinumerice.

29

Page 30: Gheorghe M.Panaitescu - ac.upg-ploiesti.roac.upg-ploiesti.ro/gpanaitescu/msds_2007.pdf · •Retele neuronale •Retele neuronale artificiale stratificate •Analiza multirezolutie

În cazul coeficientilor variabili în timp, matricile F(k) si G(k) depind de timp sievolutia sistemului dupǎ un pas este exprimatǎ de relatia

)()()()()1( kukGkxkFkx +=+datǎ ceva mai devreme.Matricea de tranzitie verificǎ relatia

)0;()()0;1( kkFk Φ=+Φcu I=Φ )0;0( si )0()0;()( xkkx Φ= . Matricea de tranzitie discretǎ se evalueazǎ direct

)0()0;1( F=Φ)0()1()0;2( FF=Φ

. . . . . . . . . . . . . . . . . . . . . . . .)0()1()2()1()( FFkFkFk −−=Φ

si au loc relatiile evidente )0;();()0;( jjkk ΦΦ=Φ

[ ] );0()0;( 1 kk Φ=Φ −

ultima numai dacǎ toate matricile F(k) sunt nesingulare. Solutia ecuatieineomogene este

∑−

=

+Φ+Φ=1

0

)()()1;()0()0;()(k

iiuiGikxkkx

pentru orice 1≥k .

Modele sub formǎ de ecuatii cu derivate partiale

Se considerǎ o barǎ din material omogen, de formǎ si dimensiuni transversalefixe pe toatǎ lungimea, izolatǎ de mediul ambiant în ceea ce priveste un posibilschimb de energie, dar prevǎzutǎ cu posibilitatea ca la capete sǎ fie încǎlzitǎ(rǎcitǎ) dupǎ vointǎ. Dacǎ temperatura este aceeasi la ambele capete, maidevreme sau mai târziu întreaga barǎ va avea practic aceeasi temperaturǎ, aceeade la capetele ei. Dacǎ temperaturile la capete sunt diferite, dupǎ un timp se vastabili un “relief” de tempertaturǎ de-a lungul barei, care va rǎmâne practicacelasi pânǎ la o modificare a temperaturii la cel putin unul din capete. Pâna laatingerea uneia sau alteia din stǎrile (cvasi)stationare se poate observa un regimdinamic, tranzitoriu guvernat de fenomenul conductiei termice. Acest fenomenare ca fortǎ motoare diferenta de temperaturǎ: are loc un transfer de energie dela un punct mai cald la altul mai rece.

30

Page 31: Gheorghe M.Panaitescu - ac.upg-ploiesti.roac.upg-ploiesti.ro/gpanaitescu/msds_2007.pdf · •Retele neuronale •Retele neuronale artificiale stratificate •Analiza multirezolutie

Cu notatiile din figura alǎturatǎ la care se adaugǎ, în ipoteza sectiunii circulare,raza r a barei, se poate scrie cǎ prin conductie, în intervalul scurt ∆t, prinplanele limitǎ ale portiunii [x, x + ∆x], perpendiculare pe barǎ, are loc untransfer de energie datorat gradientului de temperaturǎ, care aduce o variatie aenergiei în elementul de lungime ∆x

xcd

xxcd x

TtrkxTtrk

∂∂∆−

∂∂∆

∆+

22 ππ

cu T(x, t) temperatura barei [K] în punctul x la momentul t si kcd o constantǎ dematerial numitǎ conductivitate termicǎ. Lungimile sunt exprimate coerent în[m], timpul în [s], iar conductivitatea în [J/s.m.K].În volumul πr2∆x, pe durata ∆t are loc o acumulare de energie calculatǎ astfel

[ ]),(),( 212 xxtTxxttTcxr ∆+−∆+∆+∆ θθρπ

cu ρ densitatea barei în [kg/m3] si c capacitatea caloricǎ a materialului barei în[J/kg.K], cu ]1,0[, 21 ∈θθ . Egalarea celor douǎ cantitǎti de energie si trecerea lalimitǎ 0, →∆∆ xt produc ecuatia

0122

2

=∂∂−

∂∂

tT

axT

care este ecuatia transmiterii cǎldurii într-o barǎ cilindricǎ, izolatǎ fatǎ demediul ambiant. Constanta a2 poate fi identificatǎ usor cu kcd /ρc. Temperatura T(x, t) este o functie de timp si de pozitia punctului în lungul barei.Dacǎ bara este de lungime finitǎ, singura modalitate de a actiona asupra“reliefului” ei termic o oferǎ extremitǎtile ale cǎror temperaturi se pot modificaconform relatiilor generale

)(),0( 1 tTtT =)(),( 2 tTtlT =

Acestea sunt conditii la limita barei presupusǎ a avea lungimea l. Se mai adaugǎun “relief” initial

],0[)()0,( lxxTxT init ∈=care este conditia initialǎ a problemei.Din lipsa posibilitǎtilor tehnice sau din necesitatea expresǎ de a relaxa conditiilede schimb energetic cu ambianta, izolarea barei poate sǎ nu mai fie o conditieriguros îndeplinitǎ. Atunci fenomenele energetice care determinǎ dinamicasistemului barǎ metalicǎ cilindricǎ sunt mai bogate. Pe lângǎ fenomenul deconductie pot apǎrea transferuri de energie datorate fenomenelor de convectie siradiatie. Prin convectie, datoritǎ fenomenului de ventilare naturalǎ sau dincauza circulatiei fluidului în care bara ar putea fi imersatǎ, elementul de barǎ [x,x + ∆x] disipeazǎ în mediul înconjurǎtor într-un interval scurt ∆t o energie

[ ]acv TttxxTtxrk −∆+∆+∆∆− ),(2 43 θθπ

31

Page 32: Gheorghe M.Panaitescu - ac.upg-ploiesti.roac.upg-ploiesti.ro/gpanaitescu/msds_2007.pdf · •Retele neuronale •Retele neuronale artificiale stratificate •Analiza multirezolutie

proportionalǎ cu diferenta de temperaturǎ fatǎ de cea ambiantǎ Ta, cu arialateralǎ expusǎ cǎtre mediu si cu timpul scurs, factorul de proportionalitate fiindkcv o constantǎ de transfer exprimatǎ în [J/s.m2.K]. Numerele ]1,0[, 43 ∈θθ apardin nou pentru a accede la valori medii convenabile pentru temperatura barei peelementul în discutie si pe durata luatǎ în considerare.Mai poate avea loc un transfer energetic prin radiatie, proportional si de dataaceasta cu suprafata elementului, cu timpul scurs si cu puterea a patra a uneitemperaturi medii a elementului de barǎ

[ ] 485 ),(2 ttxxTtxr ∆+∆+∆∆− θθεσπ

cu σ constanta Stefan-Boltzmann exprimatǎ în [w/m2.K4] si cu ε emisivitateasuprafetei materialului din care este confectionatǎ bara, un numǎr subunitar cuatât mai apropiat de unitate cu cât emisivitatea este mai apropiatǎ de aceea acorpului negru.Ecuatia generalǎ care descrie dinamica barei pentru cazul complet este

42

2 2)(2

Tcr

TTcr

kxT

ck

tT

acvcd

ρεσ

ρρ−−−

∂∂=

∂∂

Termenii din partea dreaptǎ a ecuatiei pot avea, de la caz la caz, importantǎdiferitǎ.Exemplul parcurs mai sus este o ilustrare a modalitǎtii de a descrie dinamicaunui sistem prin ecuatii cu derivate partiale. Este de observat cǎ stareasistemului este descrisǎ de un vector cu numǎr nelimitat de componente: înfiecare punct, temperatura T(x, t) exprimǎ starea sistemului în acel punct, iarnumǎrul de puncte este numǎrul de puncte din intervalul [0,l] . Între ecuatiile cu derivate partiale, de forme altfel foarte diverse, de o atentieaparte s-au bucurat ecuatiile liniare în partea lor asa-numitǎ principalǎ, aceeacare contine derivatele de cel mai înalt ordin. Astfel, în particular si în legǎturǎcu sisteme si fenomene naturale, ecuatiile cu derivate partiale de ordinul I siliniare

),(),(),()( yxcyzyxb

xzyxazL =

∂∂+

∂∂=

sau de ordinul II si liniare

∂∂

∂∂=

∂∂+

∂∂∂+

∂∂=

yz

xzyxf

yzyxc

yxzyxb

xzyxazL ,,,),(),(),()(

2

22

2

2

si similarele lor în mai mult de douǎ variabile au tratǎri cvasiexhaustive înliteratura matematicǎ devenitǎ deja clasicǎ. De fiecare datǎ L(z) desemneazǎpartea principalǎ a ecuatiei, care este si liniarǎ în derivatele de ordinul cel maiînalt. Una din variabilele de care depinde functia necunoscutǎ z poate fi timpul siatunci este vorba de un model dinamic al unui sistem, în particular cu parametridistribuiti. În cazurile exemplificate, altfel foarte generale, ramâne o variabilǎ

32

Page 33: Gheorghe M.Panaitescu - ac.upg-ploiesti.roac.upg-ploiesti.ro/gpanaitescu/msds_2007.pdf · •Retele neuronale •Retele neuronale artificiale stratificate •Analiza multirezolutie

care are semnificatie spatialǎ. Desigur, numǎrul variabilelor spatiale poate fimai mare, douǎ sau poate chiar trei.În terminologia teoriei sistemelor, z descrie starea sistemului în puncte decoordonate spatiale diverse, infinit vecine si depinde concomitent de variabilatemporalǎ t.Asa cum s-a schitat în exemplul barei, functia z (în particular functia T) poate fiasimilatǎ vectorului de stare din cazul sistemelor descrise într-o sectiuneanterioarǎ prin ecuatii cu derivate ordinare, calificate obisnuit ca sisteme cuparametri concentrati. Functia z descriptoare a stǎrii sistemului ar putea ficonsideratǎ un vector de stare cu extrem de multe componente, numǎrulacestora fiind un cardinal transfinit din categoria continuului. În cele ce urmeazǎ sunt tratate pe cale analiticǎ, fǎrǎ pretentia exhaustivitǎtii,unele ecuatii cu derivate partiale în care functiile cunoscute sau necunoscutedepind de una, douǎ sau trei varibile spatiale dar si de timp, în mod explicit. Ecuatiile cu derivate partiale de ordinul I liniare se pot rezolva pe caleanaliticǎ luând în considerarea asa-numitul sistem de ecuatii caracteristicasociat. Astfel, ecuatiei cu derivate partiale

),(),(),( txctztxb

xztxa =

∂∂+

∂∂

i se asociazǎ sistemul caracteristic

),(),(),( txcdz

txbdt

txadx ==

care este un sistem integrabil prin determinarea asa-numitelor integrale prime.La notiunea de integralǎ primǎ se ajunge pe calea explicatǎ în continuare. Dacǎuna din variabile este consideratǎ independentǎ, pentru a face o alegere fieaceea t, sistemul are solutia generalǎ

),,( 211 cctfx =),,( 212 cctfz =

în care apar, cum este si firesc, douǎ constante arbitrare c1 si c2. Prin rezolvareasistemului de relatii de mai sus în raport cu cele douǎ constante se obtinexpresiile

11 ),,( ctxz =ϕ

22 ),,( ctxz =ϕcare sunt integralele prime anuntate putin mai devreme. Orice functie arbitrarǎdar derivabilǎ

0),( 21 =ϕϕνcontine sub formǎ implicitǎ solutia z(x, t) a ecuatiei cu derivate partiale, initiale.Desigur, doza de arbitrar face solutia inutilizabilǎ. Ea trebuie particularizatǎ laun sistem dinamic concret, sistemul de modelat. Problema particularizǎriisolutiei este cunoscutǎ în matematicǎ sub numele de problema lui Cauchy. Înparticular, functia z(x, t) trebuie sǎ satisfacǎ anumite conditii pentru valori

33

Page 34: Gheorghe M.Panaitescu - ac.upg-ploiesti.roac.upg-ploiesti.ro/gpanaitescu/msds_2007.pdf · •Retele neuronale •Retele neuronale artificiale stratificate •Analiza multirezolutie

precizate ale variabilelor independente. Uzual, în modelarea dinamiciisistemelor se precizeazǎ o conditie initialǎ, în cazul în discutie z(x, t0) = z0(x).Ecuatiile cu derivate partiale de ordinul II cu partea principalǎ liniarǎ

2

22

2

2

),(),(),()(y

zyxcyxzyxb

xzyxazL

∂∂+

∂∂∂+

∂∂=

se clasificǎ pe domenii mai largi sau mai restrânse, tocmai în raport cu anumiteparticularitǎti ale acestei pǎrti principale. Prin schimbǎri adecvate de variabilesi/sau functie partea principalǎ poate fi adusǎ la una din formele: hiperbolicǎ,dacǎ b2 – 4ac > 0, parabolicǎ, dacǎ b2 – 4ac = 0, sau elipticǎ, dacǎ b2 – 4ac < 0.Cazuri particulare de ecuatii hiperbolice, parabolice si eliptice, de importantǎpracticǎ remarcabilǎ sunt respectiv ecuatia undelor

02

2

2

2

=∂∂−

∂∂

tz

xz

ecuatia cǎldurii

02

2

=∂∂−

∂∂

tz

xz

si ecuatia Laplace (Poisson atunci când apare si o parte dreaptǎ)

[ ]),(02

2

2

2

yxfy

zx

z ==∂∂+

∂∂

Este cunoscut faptul cǎ integrarea unei ecuatii cu derivate partiale sau a unuisistem de ecuatii cu derivate partiale pune probleme diferite fatǎ de ecuatiile cuderivate ordinare. În particular, în conditii similare de precizie, metodelenumerice pentru ecuatiile cu drivate partiale sunt consumatoare de timp decalcul si de memorie mult mai importante.Existǎ posibilitǎti de transformare a ecuatiilor cu derivate partiale în ecuatii cuderivate ordinare. O ecuatie diferentialǎ cu derivate partiale în raport cu ovariabilǎ spatialǎ si una temporalǎ poate fi adusǎ la forma unei ecuatii cuderivate ordinare prin utilizarea transformatei Laplace, dacǎ sunt îndepliniteanumite conditii.Fie, de pildǎ, ecuatia cu derivate partiale

),()()()()()(2

2

2

2

txxtzx

tzx

xzxb

xzxa ϕγβα =+

∂∂+

∂∂+

∂∂+

∂∂

cu a, b, α, β, γ functii numai de x, continue pe un interval [0, l]. Se admite cǎsolutia ei satisface conditiile initiale

)()0,( xfxz = si )(0

xgxz

t

=∂∂

=

pentru orice x în intervalul [0,l], si conditiile la limitǎ

)(0

thCzxzB

xzA

x

=

+

∂∂+

∂∂

=

34

Page 35: Gheorghe M.Panaitescu - ac.upg-ploiesti.roac.upg-ploiesti.ro/gpanaitescu/msds_2007.pdf · •Retele neuronale •Retele neuronale artificiale stratificate •Analiza multirezolutie

)(1111 thzCxzB

xzA

lx

=

+

∂∂+

∂∂

=

pentru orice t > 0, cu A, B, C, A1, B1, C1 constante. O asemenea ecuatie poate fitratatǎ cu ajutorul transformǎrii Laplace dacǎ functia ),( txϕ admite otransformatǎ Φ(x, s), la fel functia necunoscutǎ z(x, t) si primele ei douǎderivate, asemenea si functiile de timp din partea dreaptǎ a conditiilor la limitǎ.Având în vedere cǎ derivatele primǎ si secundǎ în raport cu timpul ale functieinecunoscute sunt respectiv

)(),( xfsxsZ −[ ])()(),(2 xgxsfsxZs +−

se obtine ecuatia cu derivate ordinare

dcdxdZb

dxZda =++2

2

cu c si d usor de interpretat, cu s ca parametru si cu conditiile la limitǎ

)0()()(0

BfsHZCBsxZA

x

+=

++

∂∂

=

)()()( 1111 lBfsHZCsBxZA

lx

+=

++

∂∂

=

Dupǎ integrarea ecuatiei cu derivate ordinare, solutiilor cu parametrul s li seaplicǎ transformarea Laplace inversǎ. Conditiile la limitǎ si initiale se cer a firacordate adicǎ trebuie sǎ ia valori la limitǎ si initiale compatibile si fizicplauzibile. Ecuatia rezultatǎ este de obicei mai usor de integrat analitic. TransformareaLaplace inversǎ este calea naturalǎ de a obtine solutia z(x, t) a ecuatiei cuderivate partiale. O revenire la ecuatia cu derivate partiale descriptoare a dinamicii bareiomogene furnizeazǎ un exemplu de utilizare a metodei a cǎrei descriere s-aîncheiat imediat mai sus.Dacǎ functia T(x, t) admite o transformatǎ Laplace relativ la variabila t, la felfunctiile T1(t) si T2(t), dupǎ calculul transformatelor T*(x, s), respectiv T1*(s),T2*(s), în cazul simplu al evolutiei tranzitorii exclusiv prin fenomenulconductiei si pe intervale de temperaturǎ relativ restrânse pentru a puteaconsidera caracteristicile de material constante, ecuatia de mai sus si conditiilela capete iau înfǎtisarea

[ ] 0)(*1*22

2

=−− xTsTadx

Tdi

)(*),0(* 1 sTsT =)(*),(* 2 sTslT =

Se obtine, asadar, o ecuatie diferentialǎ ordinarǎ, care contine parametrul s.

35

Page 36: Gheorghe M.Panaitescu - ac.upg-ploiesti.roac.upg-ploiesti.ro/gpanaitescu/msds_2007.pdf · •Retele neuronale •Retele neuronale artificiale stratificate •Analiza multirezolutie

În sprijinul dezvoltǎrii unor aplicatii numerice, se dau în tabelul urmǎtor câtevavalori tipice ale constantelor din ecuatia cea mai simplǎ, pentru douǎ metale,cuprul si fierul.

Cupru Fierc 390 470 [J/kg.K]ρ 8900 7800 [kg/m3]kcd 385 50 [J/smK]

În cazul variantei complete, se recomandǎ pentru evaluarea constantei detransfer prin convectie în aer expresia

( ) 25.0/165.4 dTkcv ∆=cu d diametrul barei.Pentru fenomenul de radiatie valoarea constantei Stefan-Boltzmann este s =5,6704.10– 8 în [w/m2.K4], iar emisivitatea medie comunǎ este ε = 0,3 – 0,4. Mult mai interesantǎ din punctul de vedere al studiului dinamicii sistemelorpare a fi metoda colocatiei. Metoda transformǎ ecuatiile diferentiale cu derivatepartiale, care prin structura lor descriu sisteme cu parametri distribuiti, sistemecu o multime a variabilelor de stare infinitǎ, în ecuatii cu derivate ordinare.Acestea descriu în anumite limite de precizie un sistem aproape echivalent darcu o multime finitǎ a variabilelor de stare. Dacǎ, de pildǎ, trebuie rezolvatǎecuatia cu derivate partiale

∂∂

∂∂

z t xt

f x z t xz

( , ) ( ) ( , )=2

2

se admite o exprimare aproximativǎ a functiei necunoscute în forma

∑=

=n

jjnj xtzLxtz

0

),(),(

cu Lnj coeficientii unui polinom de interpolare Lagrange, constanti pentru opozitionare datǎ a valorilor fixe xj (j = 0, 1, ..., n) în intervalul de valori deinteres ale variabilei spatiale x. Polinomul de interpolare poate fi de gradul n învariabila spatialǎ x, sau, dacǎ functia aproximatǎ este o functie parǎ, poate fi degradul 2n si atunci polinomul aproximant este de gradul n în x2. Polinomul treceexact prin asa-numitele puncte de colocatie, xj (j = 0, 1, ..., n), puncte care pot fiamplasate, în principiu, la libera alegere a analistului. Expresia polinomului de interpolare a unei functii care în punctele xi (i = 0,1, ..., n) ia respectiv valorile yi este

L x yx x

x xn i

kk

n

i kk

ni

n

( )( )

( )

'

'=

=

=

=

∏∑ 0

0

0

36

Page 37: Gheorghe M.Panaitescu - ac.upg-ploiesti.roac.upg-ploiesti.ro/gpanaitescu/msds_2007.pdf · •Retele neuronale •Retele neuronale artificiale stratificate •Analiza multirezolutie

în care accentul care însoteste semnul produselor multiple reprezintǎ absentafactorului de indice k = i.Ecuatia cu derivate partiale datǎ ca exemplu se transformǎ în

Ldz t x

dtf x

d L xdx

z t xnjj

jn j

j

( , )( )

( )( , )=

2

2

cu (j = 0, 1, ..., n). Acesta este un sistem de ecuatii cu derivate ordinare, caredescrie un sistem cu parametri concentrati, pentru care vectorul de stare arecomponentele z(xj, t), (j = 0, 1, ..., n).Pentru o relativǎ echipartitie a erorilor de aproximare este indicat a se lua capuncte de colocatie rǎdǎcinile polinomului Jacobi de gradul n

[ ]G p q u u uq q q n

ddu

u un

q q p n

nq n p n q( , ; ) ( )

( )...( )( )= −

+ + −−

− −+ − + −

111

1 11

în care cei doi parametri trebuie sǎ satisfacǎ conditiile q > 0 si p > q – 1.Polinoamele Jacobi asigurǎ o repartitie judicioasa a punctelor de colocatie înintervalul de valori ale variabilei spatiale x si au în plus proprietatea importantǎde a fi ortogonale pe intervalul (0, 1). Astfel

u u G p q u G p q u duq p qi j

− −− =∫ 1

0

11 0( ) ( , ; ) ( , ; )

pentru ji ≠ si

)()1)...(1()1()(

2!

);,();,()1(1

0

1

ipiqqqiqpq

ipi

duuqpGuqpGuu jiqpq

+Γ−++++−ΓΓ

+=

=−∫ −−

pentru k = j.Este de retinut în particular, pentru cazurile practice, valorile p = q = 1 cândpolinoamele Jacobi de grade n diferite sunt generate cu relatia simplǎ

G xn

ddx

x xn

n

nn n( , ; )

![ ( ) ]1 1 1 1= −

Modelele matematice se pot prezenta si sub forma unor sisteme de ecuatii cuderivate partiale. În exemplul care urmeazǎ modelul matematic nu mai este osingurǎ ecuatie cu derivate partiale ci se constituie ca un sistem de astfel deecuatii. De pildǎ, modelul matematic al transferului de energie în straturigranulare traversate de fluide care au temperaturi variabile în timp este alcǎtuitdin douǎ ecuatii cu derivate partiale. Modelul trebuie sǎ punǎ în evidentǎtransferul de energie bilateral, de la solid la fluid si invers, în functie de semnuldiferentelor de temperaturǎ existente între solid si fluid. Starea sistemului înfiecare punct al volumului de granule solide este descrisǎ de temperaturasolidului Ts(x, t) si de temperatura fluidului Tg(x, t), ambele dependente de timpsi de o coordonatǎ spatialǎ x, axialǎ dacǎ se face referire la figura alǎturatǎ careare o simetrie cilindricǎ. Se admite cǎ deplasarea fluidului este în esentǎ axialǎ,

37

Page 38: Gheorghe M.Panaitescu - ac.upg-ploiesti.roac.upg-ploiesti.ro/gpanaitescu/msds_2007.pdf · •Retele neuronale •Retele neuronale artificiale stratificate •Analiza multirezolutie

cu o presupusǎ constanţǎ a vitezelor pe raza vasului care de cele mai multe orieste un reactor chimic.

Relatia de bilant energetic pentru fluidul cuprins într-un element de înǎltimemicǎ din stratul granular trebuie sǎ tinǎ seama de aportul energetic prin schimbsolid-fluid dar si de aportul natural de energie al fluxului care se propagǎ printregranulele stratului. În ipoteza unor variatii relativ mici de temperaturǎ se poatescrie ecuatia

wTx

Tt

hRTc P

T Tg g s

gg s

∂∂

∂∂

ρ σα

+ + − =0 0( )

si în urma scrierii bilantului energetic pentru solidul din acelasi spatiu rezultǎecuatia

∂∂

σTt

hc

T Ts

ss g+ − =( ) 0

În cele douǎ ecuatii cu derivate partiale s-au folosit notatiile: w [m/s] pentruviteza efectivǎ a fluidului, ρs [kg/m3] pentru densitatea solidului, σ [m2/kg]pentru suprafata specificǎ exterioarǎ a solidului, h [W/m2.K] pentru constantade transfer medie solid-fluid, R [J/mol] pentru constanta universalǎ a gazelor, T0

[K] pentru temperatura medie localǎ, α pentru fractia de goluri a spatiului cugranule, cg [J/mol.K] pentru cǎldura specificǎ a fluidului, P [Pa] pentrupresiunea în sistem si cs [J/kg.K] pentru cǎldura specificǎ a solidului.Adǎugarea unor conditii initiale si la limitǎ

T x T x Tg s( , ) ( , )0 0 0= =T t T tg ( , ) ( )0 =

face modelul complet. El îndeplineste toate conditiile pentru a fi tratat cuajutorul transformǎrii Laplace. Metoda colocatiei este, de asemenea, aplicabilǎ.

38

Page 39: Gheorghe M.Panaitescu - ac.upg-ploiesti.roac.upg-ploiesti.ro/gpanaitescu/msds_2007.pdf · •Retele neuronale •Retele neuronale artificiale stratificate •Analiza multirezolutie

Modele sub formǎ de ecuatii integrale sau ecuatii integro-diferentiale

Dinamica unui circuit electric simplu RC, serie, pentru a face o alegere,alimentat cu o tensiune e(t) se modeleazǎ printr-o ecuatie binecunoscutǎ

e t Ri tC

i dt

( ) ( ) ( )= + ∫1

0

τ τ

în care R este valoarea rezistentei si C este valoarea capacitǎtii, iar i(t) estecurentul stabilit în circuit. Dacǎ valoarea C este constantǎ, factorul caremultiplicǎ curentul poate fi scos în afara integralei si printr-o simplǎ derivarerelatia de mai sus poate fi transformatǎ într-o ecuatie diferentialǎ cu derivateordinare, usor de tratat. Dacǎ însǎ valoarea capacitǎtii se modificǎ în timp, ca încazul utilizǎrii unor elemente de circuit neliniare sau în cazul modulatoarelor,atunci ecuatia model rǎmâne o ecuatie integralǎ si trebuie tratatǎ în consecintǎ. Un mediu multimolecular este adesea descris de o functie de distributie(pseudo)continuǎ în raport cu o anumitǎ caracteristicǎ. Sunt foarte cunoscute, depildǎ, curbele punctelor reale de fierbere (PRF), care caracterizeazǎ fractiilepetroliere prin cota parte din amestecul complex care este fractia respectivǎ,fractie care fierbe si se evaporǎ pânǎ la o anumitǎ temperaturǎ. Sunt deasemenea familiare tehnologilor chimisti repartizarea polimerilor sicaracterizarea lor în raport cu masele lor moleculare. O transformare chimicǎ într-un mediu molecular (pseudo)continuu în raport cuo anumitǎ caracteristicǎ poate fi cuprinsǎ sub aspectul mecanismului, într-oschemǎ conform cǎreia speciile moleculare de caracteristici x si x' se transformǎreversibil sau nu, dupǎ cum ambele constante de vitezǎ sunt nenule sau una estepractic nulǎ, conform ecuatiei

),()()(

),(

xxkxAxA

xxk

′′←→

Viteza de transformare exprimatǎ pe întreaga distributie de componenti seexprimǎ prin ecuatia integro-diferentialǎ

∂∂

c x tt

k x x c x t dx k x x c x t dxa

b

a

b( , ) ( , ) ( , ) ( , ) ( , )= − ′ + ′ ′ ′∫∫Ecuatia de mai sus exprimǎ variatia în timp a distributiei componentilor c(x, t)având în vedere consumul prin reactia directǎ exprimat de prima integralǎ siproductia exprimatǎ prin a doua integralǎ din partea dreaptǎ a ecuatiei model. Exemplele de mai sus sunt ilustrative în ceea ce priveste posibilitatea camodelul dinamicii unor sisteme sǎ fie sau sǎ continǎ ecuatii integrale sauintegro-diferentiale.Teoria matematicǎ se ocupǎ de obicei de ecuatii integrale de douǎ tipuri: Ecuatiile Fredholm se prezintǎ sub forma

39

Page 40: Gheorghe M.Panaitescu - ac.upg-ploiesti.roac.upg-ploiesti.ro/gpanaitescu/msds_2007.pdf · •Retele neuronale •Retele neuronale artificiale stratificate •Analiza multirezolutie

g t K t y da

b

( ) ( , ). ( ).= ∫ τ τ τ

sau sub forma

y t G t K t y da

b

( ) ( ) ( , ). ( ).= + ∫ τ τ τ

Ecuatiile Volterra se deosebesc de cele precedente prin existenta unei limite deintegrare variabile

g t K t y da

t

( ) ( , ). ( ).= ∫ τ τ τ

sau

y t G t K t y da

t

( ) ( ) ( , ). ( ).= + ∫ τ τ τ

În ambele cazuri, y(t) este functia necunoscutǎ. Celelalte functii, g(t), G(t) si K(t, τ) sunt cunoscute analitic, grafic sau numeric. Ultima, K(t, τ) este numitǎfunctia nucleu al ecuatiei integrale.Existǎ o legǎturǎ între ecuatiile integrale si ecuatiile diferentiale ordinare. Depildǎ, ecuatia neliniarǎ

d ydt

f t y2

2 = ( , )

integratǎ în douǎ etape, produce mai întâi dydt

f y d ct

= +∫ ( , )τ τ0 1

si apoi

210 0)](,[)( ctcdtdyfty

t t++= ∫ ∫ τττ

cu c1 si c2 constante arbitrare. O expresie alternativǎ pentru y(t) este

y t t f y d G tt

( ) ( ) [ , ( )] ( )= − +∫ τ τ τ τ0

obtinutǎ dupǎ o integrare prin pǎrti si cu G(t) = c1t+c2. Ultima expresie este oecuatie integralǎ Volterra de tipul II. Constantele c1 si c2 se determinǎ dinconditii initiale asupra functiei si asupra derivatei functiei necunoscute sau dinconditii în douǎ puncte distincte y(a) = ya si y(b) = yb. Dacǎ una din limitele integralei care apare în ecuatia integralǎ este infinitǎecuatia se numeste singularǎ.O posibilitate de solutionare prin aproximǎri succesive constǎ în a admite osolutie y0(t) aproximativǎ, care introdusǎ în ecuatie permite evaluarea unei noifunctii y1(t), mai apropiatǎ de solutia corectǎ y(t) într-un anume sens. Admitândcǎ procesul este convergent, ceea ce nu este totdeauna obligatoriu, sirul defunctii y0(t), y1(t), y2(t), … este convergent cǎtre solutia y(t). Conditiile de

40

Page 41: Gheorghe M.Panaitescu - ac.upg-ploiesti.roac.upg-ploiesti.ro/gpanaitescu/msds_2007.pdf · •Retele neuronale •Retele neuronale artificiale stratificate •Analiza multirezolutie

convergentǎ sunt greu de specificat, dar aceasta este o cale cel putin tentantǎpentru rezolvarea ecuatiilor integrale. Ecuatiile integro-diferentiale au una din formele generale

dy tdt

a y t K t y dt( ) ( ) ( ) ( )= + −∫ τ τ τ0

sau ∂

∂τ τ τy x t

ta y x t K t y x d

t( , ) ( , ) ( ) ( , )= + −∫0

dupǎ cum functia necunoscutǎ depinde numai de timp sau si de o a douavariabilǎ. Fǎrǎ prea mare efort, între exemplele prezentate mai devreme si tipurile deecuatii enumerate se poate stabili o corespondentǎ.Este de retinut faptul cǎ modelele matematice de forme variate care au fostprezentate în capitolul care se încheie aici au fost scrise cu referire la fenomenefizice si fizico-chimice cunoscute, prin folosirea unor legi care guverneazǎcantitativ astfel de fenomene. În capitolul urmǎtor sunt cuprinse sistematic unnumǎr de astfel de legi foarte utile în scrierea unor modele matematice si înstudiul dinamicii unor sisteme.

Probleme

Problema 1.Scrieti modelul dinamicii încǎrcǎrii/descǎrcǎrii unui rezervor de formǎ sfericǎcu diametrul D, care contine un fluid incompresibil, de pildǎ apǎ. Rezervorulare aerisire la partea cea mai de sus si este alimentat cu acelasi fluid la un debitconstant Fi. Fluidul se scurge printr-un orificiu circular de diametru 0,02D,situat în punctul cel mai de jos al rezervorului, la un debit stabilit prin actiuneafortei gravitationale.Pentru nivelul de referintǎ h0 mǎsurat de la punctul cel mai de jos, se cere a sescrie un model liniar (aproximant) al sistemului, valabil în jurul acestui nivel.Determinati intervalul de valori ale nivelului h, în care modelul liniar are oeroare fatǎ de modelul riguros de ±1%.Date numerice: D = 1,5 m; h0 = (p + 2)/(pmax + 5) m. Parametrul p reprezintǎpozitia studentului în catalogul grupei. Numǎrul pmax este numǎrul total alstudentilor din grupǎ.Solutia problemei.Bilantul material este dat prin ecuatia de continuitate

ghDtFdtdV

i 24

)02,0()(2π−=

cu V volumul calotei sferice pline cu lichid

41

Page 42: Gheorghe M.Panaitescu - ac.upg-ploiesti.roac.upg-ploiesti.ro/gpanaitescu/msds_2007.pdf · •Retele neuronale •Retele neuronale artificiale stratificate •Analiza multirezolutie

−= 32

31

21 hDhV π

Cu aceastǎ ultimǎ expresie

dtdhhhD

dtdV )( 2−= π

ceea ce aduce modelul la forma

)(

24

)02,0()(2

hDh

ghDtF

dtdh i

−=

π

π

o ecuatie diferentialǎ neliniarǎ (h apare si sub radical si la numitor etc.).În regim stationar

)(

24

)02,0(

0 200

0

2

0

hDh

ghDFi

−=

π

π

si debitul de alimentare trebuie sǎ fie exact

0

2

0 24

)02,0( ghDFiπ=

egal cu cel de evacuare dictat de forta gravitationalǎ.Liniarizarea se face punând

+≈=−

−),(),(

)(

24

)02,0()(002

2

uhfuhfhhD

ghDtFi

π

π

)()( 0),(

0),( 0000

uuufhh

hf

uhuh

−∂∂+−

∂∂+

cu notatia )(tFu i≡ pentru unica intrare/comandǎ a sistemului. Sistemul cuintrarea constantǎ 00 iFuu == nu-si modificǎ starea si 0),( 00 =uhf .Derivatele partiale

22

22

)(

)2(24

)02,0()(24

)02,0(1

hDh

hDghDuhDhhgD

hf

−−−−

=∂∂

ππ

π

)(1

hDhuf

−=

∂∂

πîn punctul ),( 00 uh devin

42

Page 43: Gheorghe M.Panaitescu - ac.upg-ploiesti.roac.upg-ploiesti.ro/gpanaitescu/msds_2007.pdf · •Retele neuronale •Retele neuronale artificiale stratificate •Analiza multirezolutie

)(24

)02,0(1

00

0

2

, 00hDh

hgD

hf

uh −

−=

∂∂

π

π respectiv )(

100, 00

hDhuf

uh −=

∂∂

π

0 500 1000 1500 2000 2500 3000 3500 4000 4500 50000.5

0.55

0.6

0.65

0.7

0.75

Tim p [s ]

h [

m]

RÃ S P UNS LA UN S A LT A L DE B ITULUI FI DE 20%

Dacǎ a si b sunt valorile celor douǎ derivate partiale de mai sus, în punctul),( 00 uh , atunci modelul liniarizat este

)()()(

000 uubhha

dthhd

dtdh −+−=

−=

Integrarea celor douǎ ecuatii model pentru mh 5,00 = si D = 1m, integrarefǎcutǎ cu functia Matlab ode23, produce rezultatul din graficul alǎturat.Cele douǎ curbe reprezintǎ: una rezultatul integrǎrii modelului riguros, cealaltǎrezultatul integrǎrii modelului liniarizat, aproximant. Pentru a compararǎspunsurile celor douǎ modele, se face o astfel de evaluare numericǎ pentru unsalt pozitiv în debitul de alimentare de 10-20% si se retine momentul (si h) când∆h = |hexact – haproximativ| traverseazǎ limita de 1% din nivelul corect. Se repetǎevaluarea pentru un salt negativ tot de 10-20% si se procedeazǎ analog.Rezultatul acestui al doilea calcul este de asteptat a fi diferit de primul. Seobtine astfel un interval (hinferior, hsuperior) de precizie prescrisǎ.

43

Page 44: Gheorghe M.Panaitescu - ac.upg-ploiesti.roac.upg-ploiesti.ro/gpanaitescu/msds_2007.pdf · •Retele neuronale •Retele neuronale artificiale stratificate •Analiza multirezolutie

Problema 2.Formulati si rezolvati o problemǎ similarǎ celei de mai sus, pentru un vas conic,cu vârful în jos sau cu vârful în sus.

Problema 3.Scrieti modelul dinamicii unui sistem de douǎ vase cilindrice, care sunt umplutepartial cu un lichid (apǎ) si care comunicǎ unul cu altul printr-un tub orizontalsuficient de lung pentru ca frecarea în acel tub sǎ devinǎ importantǎ.Starea initialǎ a sistemului este: niveluri diferite în cele douǎ vase, comunicareaprin tubul de legǎturǎ întreruptǎ.Se (re)stabileste legǎtura brusc.Care este evolutia în timp a sistemului?În ce conditii comportarea sistemului este oscilantǎ?Dupǎ cât timp oscilatiile se reduc sub 10% din cotele stationare spre caresistemul tinde?Indicatie. Circulatia lichidelor prin conducte lungi este modelatǎ în lucrareasemnatǎ de Chuei-Tin Chang si Jung-Ing Hwang si publicatǎ în AIChE Journal,44, nr.6, p.1392-1403 (1998), prin relatia

−= 52

2 84 d

qLqfgh

Ld

dtdq

πρ

ρρ

π

Relatia este întrucâtva diferitǎ de aceea datǎ într-un exemplu prezentat maidevreme. Unele diferente sunt numai de notatii, q pentru Fo sau πd2/4 pentru Ap,cu utilizarea diametrului conductei de sectiune circularǎ în locul ariei eitransversale. Apare în relatie si factorul de frecare f care aici este adimensional.Legǎtura lui cu coeficientul kf utilizat mai sus este kf = πdfρ/8.În lucrarea citatǎ se dau si unele valori numerice: d = 0,0508 m; L = 5 m; f =2,509.10–3 specific pentru apǎ, la fel densitatea ρ = 1000 kg/m3. Vasele au ariitransversale de 1 m2 si înǎltimi maxime de h = 1,378 m sau 0,689 m. Debitelesunt în jur de q = 0,015 m3/s. Aceste ultime valori sunt orientative si utilizarealor în calculele proprii este facultativǎ.

Exercitii de autoevaluare

1. Un vas cilindric de sectiune circularǎ asezat orizontal se poate alimenta cuun lichid la un debit dorit si are o evacuare care poate fi stabilitǎ, deasemenea, la dorintǎ. Nivelul de lichid din vas este obiectul unei reglǎriautomate prin douǎ comenzi: debitul alimentat si debitul evacuat. Vasul casistem dinamic este

a) invariant, liniar, de ordinul 1; b) invariant, neliniar, de ordinul 1;

c) variant (cu evolutie parametricǎ), neliniar, de ordinul 2.Marcati afirmatia adecvatǎ.

44

Page 45: Gheorghe M.Panaitescu - ac.upg-ploiesti.roac.upg-ploiesti.ro/gpanaitescu/msds_2007.pdf · •Retele neuronale •Retele neuronale artificiale stratificate •Analiza multirezolutie

2. Fie acelasi vas de la exercitiul 1, asezat de data aceasta cu axul vertical.Vasul ca sistem dinamic este

a) invariant, liniar, de ordinul 1; b) invariant, neliniar, de ordinul 1;

c) variant (cu evolutie parametricǎ), neliniar, de ordinul 2.Marcati afirmatia adecvatǎ.

3. Fie );( 0ttΦ functia (matricialǎ) de tranzitie a unui sistem dinamic variant(evolutiv parametric) si continuu în timp. Care din afirmatiile urmǎtoare nueste adevǎratǎ?

a) Itt =Φ );( 00

b) )];([);( 100

−Φ=Φ ttttc) );().;().,();( 011220 tttttttt ΦΦΦ=Φ cu tttt <<< 210

4. Se dǎ ecuatia

GuFxdtdx +=

care descrie evolutia în timp a stǎrii x(t) a unui sistem dinamic invariant. Semai dǎ solutia pentru x(0) = x0

∫ −Φ+−Φ=t

t

dGutxtttx0

)()()()( 00 τττ

Care termen al sumei din dreapta ultimei expresii reprezintǎ solutia liberǎ(fǎrǎ intrǎri) a sistemului?

a) primul termen; b) al doilea termen;c) suma nu contine explicit solutia liberǎ.

5. Marcati mai jos afirmatia corectǎ relativ la metoda colocatiei ortogonale.a) reducerea dimensionalitǎtii modelului unui sistem dinamic cu

parametri distribuiti;b) trecerea de la modele matematice proprii sistemelor cu parametri

concentrati la modele matematice aproximante proprii sistemelor cuparametri distribuiti;

c) integrarea aproximativǎ a unor ecuatii cu derivate ordinare.6. Pentru integrarea numericǎ a sistemelor de ecuatii cu derivate ordinare se

folsesc între altele metodele Runge-Kutta de ordine variate, metoda Gauss,metoda Milne, metoda Adams. Care din aceste metode sunt de tipulpredictor-corector?

a) Runge-Kutta,b) Gauss si Runge-Kutta sauc) Milne si Adams?

7. Se noteazǎ uzual cu Φ asa-numita matrice de tranzitie a unui sistemdinamic. Matricea Φ are ca elemente functii de timp. Relatiile de mai jos

(i) I=Φ )0(

45

Page 46: Gheorghe M.Panaitescu - ac.upg-ploiesti.roac.upg-ploiesti.ro/gpanaitescu/msds_2007.pdf · •Retele neuronale •Retele neuronale artificiale stratificate •Analiza multirezolutie

(ii) )()()( 00 tttt −Φ−Φ=−Φ ττ

(iii) [ ] 100 )()( −−Φ=−Φ tttt

exprimǎ proprietǎtile matricei de tranzitie care caracterizeazǎ un anumitsistem. Sistemul acela este

a) liniar invariant, b) neliniar sau c) variant?

46

Page 47: Gheorghe M.Panaitescu - ac.upg-ploiesti.roac.upg-ploiesti.ro/gpanaitescu/msds_2007.pdf · •Retele neuronale •Retele neuronale artificiale stratificate •Analiza multirezolutie

PRINCIPII FUNDAMENTALE DE FIZICǍ, CHIMIE SI CHIMIEFIZICǍ ÎN MODELAREA SISTEMELOR DINAMICE

• Ecuatii de continuitate • Ecuatii de bilant energetic • Ecuatii de miscare • Ecuatii de transport • Ecuatii de stare • Spectre de componenti • Ecuatiile de stare si amestecurile complexe • Echilbre între faze • Ecuatii chimice generalizate, stoechiometrie, echilibru chimic • Alte principii si aspecte cantitative utilizate în scrierea modelelor

dinamicii sistemelor• Probleme• Exercitii de autoevaluare

În sectiunea referitoare la diferitele tipuri de modele ale dinamicii sistemelor s-aapelat mai mult sau mai putin explicit la principii fizice si fizico-chimicepresupuse ca fiind însusite de cititor în cursul studiilor preuniversitare sau înanii de studii precedenti. Aici sunt revǎzute mai sistematic acele principii sisunt aduse în discutie altele suplimentare.

Ecuatii de continuitate

Ecuatiile de continuitate sunt relatii care modeleazǎ asa-numitele bilanturimateriale. Bilanturile acestea pot fi generale sau pe componenti. O ecuatie decontinuitate globalǎ se poate exprima în cuvinte astfel:

Debitul masic care alimenteazǎ un sistem – debitul masic care pǎrǎsestesistemul = viteza de schimbare a cantitǎtii de material din sistem.

Termenii în ecuatiile de continuitate sunt mǎsurati uzual în unitǎti de masǎ înunitatea de timp, dar pot fi exprimati tot asa de bine în numǎr de moli înunitatea de timp. Exceptie de la aceastǎ regulǎ de bilant material o fac proceselenucleare. Ecuatiile trebuie sǎ continǎ în acel caz termeni care sǎ corespundǎunor disparitii sau aparitii de materie asociate unor transformǎri masǎ-energie.

47

Page 48: Gheorghe M.Panaitescu - ac.upg-ploiesti.roac.upg-ploiesti.ro/gpanaitescu/msds_2007.pdf · •Retele neuronale •Retele neuronale artificiale stratificate •Analiza multirezolutie

O ecuatie de continuitate pe componenti se exprimǎ în cuvinte astfel:

Debitul de component care alimenteazǎ sistemul – debitul din acelasicomponent care pǎrǎseste sistemul + viteza de formare a acelui component

= viteza de schimbare cantitativǎ a componentului în sistem.Unitǎtile în ecuatiile de continuitate pe componenti sunt uzual moli în unitateade timp dar pot fi si unitǎti de masǎ în unitatea de timp. Viteza de formare poatefi o vitezǎ de disparitie sau de consum a componentului în reactiile chimice careau loc în sistem. În cazul din urmǎ semnul plus din fata vitezei se înlocuieste cusemnul minus.

Ecuatii de bilant energetic

Dupǎ cum si numele le aratǎ, ecuatiile de la acest punct modeleazǎ bilanturilede energie într-un sistem. Din nou în cuvinte, o astfel de ecuatie are urmǎtoriitermeni:

Fluxul de energii care alimenteazǎ sistemul – fluxul de energii carepǎrǎsesc sistemul + energia adǎugatǎ sistemului prin posibile reactii

chimice – lucrul efectuat de sistem asupra mediului ambiant = viteza deschimbare a energiei în interiorul sistemului.

Termenii din relatia de bilant energetic se exprimǎ în unitǎti de energie peunitatea de timp sunt asadar puteri. Semnele pentru termenii ultimi din parteastângǎ a ecuatiilor de bilant enegetic pot fi contrare celor specificate mai sus,dupǎ cum este vorba de un aport energetic sau de un consum energetic. Depildǎ, într-o reactie se poate degaja energie, dar se poate consuma energie(reactii exoterme, reactii endoterme). Tot asa, sistemul poate efectua un lucrumecanic asupra mediului dar poate si primi o cantitate de energie prin lucrulmecanic efectuat de mediu asupra sistemului.

Ecuatii de miscare

Forma cunoscutǎ din primii ani de fizicǎ

2

2

dtxdmF =

care exprimǎ forta în functie de masǎ si de acceleratie poate fi insuficientǎ încazurile în care masa este ea însǎsi variabilǎ în timp. De aceea, mai general, estepreferatǎ legea conservǎrii impulsului sau a momentului. Aceastǎ variantǎ aratǎastfel:

48

Page 49: Gheorghe M.Panaitescu - ac.upg-ploiesti.roac.upg-ploiesti.ro/gpanaitescu/msds_2007.pdf · •Retele neuronale •Retele neuronale artificiale stratificate •Analiza multirezolutie

dtmvd

F in

jji

)(1

=∑=

si însumeazǎ fortele pe directia i, care pot fi componente ale unor forte multiple,aplicate asupra sistemului din diverse directii.Conservarea impulsului a fost utilizatǎ într-o sectiune anterioarǎ la scriereamodelului unui sistem care consta într-un vas din care evacuarea lichidului seefectua printr-o conductǎ lungǎ. Un exemplu suplimentar este prezentat încontinuare.Conductele de produse petroliere sunt utilizate pentru transportul unor lichidede calitǎti variate. Între procedurile de pompare succesivǎ a douǎ lichidediferite, pentru a evita contaminarea unui lichid cu altul se trimite pe conductǎ osferǎ plasticǎ de diametrul conductei care este împinsǎ de un inert. Fortele careactioneazǎ asupra lichidului în cantitate variabilǎ sunt urmǎtoarele: • forta de frecare Kf(L – x)v2 proportionalǎ cu pǎtratul vitezei medii si cu

lungimea pǎrtii din conductǎ ocupatǎ încǎ de lichid• forta inertialǎ a masei de lichid pe care sfera o împinge; aceastǎ masǎ este

(L – x)Ap ρ• forta de împingere datoratǎ presiunii pe sferǎ, P0Ap , în esentǎ constantǎ.Notatiile sunt L pentru lungimea coductei, x pentru coordonata curentǎ acentrului sferei, v pentru viteza de deplasare a acesteia, Kf pentru factorul defrecare în conductǎ, Ap pentru aria transversalǎ a conductei, ρ pentru densitatealichidului în curs de dislocuire si P0 presiunea aplicatǎ asupra sferei. Ecuatiacare descrie dinamica golirii conductei este

20 )(])([ vxLKAPvxLA

dtd

fpp −−=−ρ

care dupǎ înlocuirea vitezei cu derivata coordonatei spatiale a centrului sferei sialte modificǎri evidente devine

20 )()(

−−=

dtdxxL

AKP

dtdxxL

dtd

p

k

ρρAcesta este un model de forma unei ecuatii diferentiale cu derivate ordinare,este neliniar si de ordinul al doilea.

Ecuatii de transport

Între puncte vecine ale spatiului gazdǎ a unor fenomene fizico-chimice are locun transfer de masǎ, de energie si/sau de moment de îndatǎ ce apare o diferentǎde concentratii, de temperaturǎ, respectiv de vitezǎ. În toate cazurile transportulnumit uneori si transfer are caracteristicile unui flux printr-o suprafatǎ (unitarǎ),proportional cu o “fortǎ” motrice care este tocmai diferenta de concentratii, detemperaturǎ sau de vitezǎ.

49

Page 50: Gheorghe M.Panaitescu - ac.upg-ploiesti.roac.upg-ploiesti.ro/gpanaitescu/msds_2007.pdf · •Retele neuronale •Retele neuronale artificiale stratificate •Analiza multirezolutie

Pentru transferul de masǎ, pentru elaborarea de modele matematice existǎ legealui Fick

xnDJ x ∂

∂−=

care exprimǎ debitul de substantǎ în directia x în functie de gradientul deconcentratie în acea directie. Coeficientul D este numit coeficient de difuzie si,dacǎ n este numǎrul de molecule în unitatea de volum si Jx este debitul numericde molecule prin unitatea de suprafatǎ, atunci D se exprimǎ în [m2/s] adicǎ înunitǎti de suprafatǎ pe unitatea de timp. O variantǎ localǎ foarte generalǎ a legiilui Fick

nDtn ∆=

∂∂ .

exprimǎ relatia dintre variatiile în timp si în spatiu ale concentratiei n. În ultimarelatie, cu ∆ s-a notat operatorul laplacean.Pentru transferul de energie, de multe ori sub formǎ de cǎldurǎ, forta motriceeste, cum s-a mai spus, diferenta de temperaturǎ. Legea lui Fourier

xThq

∂∂=

este aceea care modeleazǎ transferul termic. În expresia matematicǎ a legii luiFourier s-a notat cu q fluxul de energie prin unitatea de suprafatǎ, în [J/s.m2], cuh conductivitatea spatiului dintre zonele sau punctele între care are loctransferul de energie, în [J/s.m.K], iar gradientul de temperaturǎ, aici derivatatemperaturii în raport cu unica variabilǎ spatialǎ specificatǎ, în [K/m].Gradientul se exprimǎ în unele cazuri prin raportarea unor diferente finite aletemperaturii si variabilei spatiale x.Transferul de moment într-un mediu fluid are ca fortǎ motrice gradientul devitezǎ mǎsurat în [1/s], iar coeficientul de proportionalitate este vâscozitateamǎsuratǎ în [kg/m.s]. Ecuatia modelatoare a fenomenului cea mai cunoscutǎ

dxdvSF η=

poartǎ numele de legea lui Newton. În ecuatia datǎ raportul F/S este o fortǎspecificǎ de forfecare, η este coeficientul de vâscozitate sau, simplu,vâscozitatea mediului în deplasare, iar derivata este gradientul de vitezǎ. Legealui Newton este aplicabilǎ la o clasǎ restrânsǎ de fluide, fluidele newtoniene.Pentru medii foarte vâscoase se folosesc ecuatii diferite.Mai departe este dat un exemplu care se referǎ la deplasarea laminarǎ a unuiflux de lichid incompresibil newtonian. Mai în amǎnunt, calificativulnewtonian se leagǎ tocmai de faptul cǎ forta de forfecare sau rezistenta detrecere a douǎ straturi adiacente de lichid unul pe lângǎ altul este proportionalǎcu viteza relativǎ sau cu gradientul de vitezǎ

50

Page 51: Gheorghe M.Panaitescu - ac.upg-ploiesti.roac.upg-ploiesti.ro/gpanaitescu/msds_2007.pdf · •Retele neuronale •Retele neuronale artificiale stratificate •Analiza multirezolutie

rvz

rz ∂∂−= ητ

cu forta de forfecare în [N/m2], cu vâscozitatea fluidului η în [kg/m.s] si cugradientul de vitezǎ în directia razei conductei presupusǎ cilindricǎ de sectiunecircularǎ, în [1/s]. Sistemul este cu simetrie axialǎ, axa fiind orientatǎ pedirectia z de deplasare a fluidului. Asupra elementului inelar de grosimi dr, dzactioneazǎ în directia pozitivǎ a axei tubului o fortǎ de frecare/forfecare, τrz

(2πrdz) si o fortǎ (2πrdr)P datoratǎ presiunii, iar în directia inversǎ fortesimilare de forfecare

( )drrdzr

rdz rzrz τπτπ 22∂∂+

si datorate presiunii

( )dzrdrPz

rdrP ππ 22∂∂+

Viteza de modificare a momentului elementului inelar 2πrdrdz de densitate ρeste

( )zvrdrdzt

ρπ2∂∂

Dupǎ combinarea acestor forte si ordonarea termenilor ecuatiei se obtine

( ) 0=∂∂+

∂∂+

∂∂

zPrr

rtvr rz

z τρ

care este o ecuatie cu derivate partiale nu dintre cele mai simple.

Ecuatii de stare

Modelele matematice cer precizarea unor proprietǎti ale materialelor dinsistemul modelat, cum sunt densitǎtile, entalpiile etc. Aceste mǎrimi sunt uzualfunctii de presiune, de temperaturǎ si de compozitie. Frecvent mǎrimile amintitepot fi exprimate prin relatii simple. De pildǎ pentru entalpia vaporilor uneisubstante, relatia liniarǎ în temperaturǎ

H = Cp T + λv

este suficient de precisǎ pentru intervale de temperaturǎ si de presiune deîntindere moderatǎ. Pentru intervale mai largi de temperaturǎ evaluarea trebuieîmbunǎtǎtitǎ

v

T

Tp dTTCH λ+= ∫

0

)(

În cele douǎ expresii apar cǎldura specificǎ Cp, temperatura T si cǎldura latentǎde vaporizare λv. În varianta a doua cǎldura specificǎ apare într-o integralǎdeoarece este variabilǎ cu temperatura. Sunt cazuri, dupǎ cum se va explica mai

51

Page 52: Gheorghe M.Panaitescu - ac.upg-ploiesti.roac.upg-ploiesti.ro/gpanaitescu/msds_2007.pdf · •Retele neuronale •Retele neuronale artificiale stratificate •Analiza multirezolutie

departe, în care si energia latentǎ de vaporizare trebuie exprimatǎ în functie detemperaturǎ si presiune.În evaluarea unor proprietǎti ale materialelor vehiculate prin sistemeledinamice, de mare utilitate sunt ecuatiile de stare1. Ecuatiile de stare exprimǎ olegǎturǎ completǎ între presiune, volum si temperaturǎ pentru substante pure siau în vedere si compozitia când este vorba de amestecuri. Expresia generalǎ (siimplicitǎ) a unei ecuatii de stare este

F(P, V, T) = 0cu presiunea, volumul si temperatura notate ca de obicei cu P, V, T.Legea gazelor perfecte

PV = nRTîn care mai apare constanta universalǎ a gazelor R si numǎrul de moli n, este oecuatie de stare. Valabilitatea ei este restrânsǎ la asa-numitele gaze perfecte sauideale, care în conditii normale de temperaturǎ si presiune satisfac cu foartebunǎ precizie respectiva ecuatie.În ecuatiile de stare se preferǎ uneori folosirea densitǎtii molare ρ, exprimatǎ în[mol/m3] sau mai uzual în [mol/l]. În aceste conditii ecuatia gazelor perfecte sescrie sub forma

P = ρRTCele mai multe ecuatii de stare se pot explicita în raport cu presiunea

P = f(ρ, T)O ecuatie de stare îmbunǎtǎtitǎ fatǎ de aceea a gazelor perfecte

2

ρρ a

bRTP −

−=

a fost propusǎ de Van der Waals (1827-1923) la sfârsitul secolului al XIX-lea sicaracterizeazǎ mult mai riguros gazele reale deoarece coeficientii a si b suntspecifici fiecǎrei specii moleculare. Mai precis, valorile lor sunt legate deparametrii critici ai substantei respective. Pentru o presiune si o temperaturǎdate, ecuatia rezultatǎ este o ecuatie cubicǎ în ρ.Ecuatia de stare de mai sus face parte dintr-o clasǎ foarte cuprinzǎtoare deecuatii de stare, ecuatii cubice în densitatea ρ, cubice de asemenea în volumulmolar v. Clasa aceasta a fost îmbogǎtitǎ considerabil în deceniul al optulea si alnouǎlea al secolului trecut. Iatǎ câteva ecuatii de stare cubice în densitatea ρ,dezvoltate în perioada mentionatǎ si foarte utilizate, inclusiv în simulatoarelecomerciale: • ecuatia de stare Soave-Redlich-Kwong (1972)

ρρ

ρρ

ba

bRTP

+−

−=

11

2

1 Aceste ecuatii de stare se referǎ la starea unor substante pure sau amestecuri, starea lor deagregare, starea energeticǎ, starea entropicǎ etc. Ele sunt particulare în sensul cǎ nu se confundǎdecât eventual în parte cu ecuatiile care descriu starea unui sistem.

52

Page 53: Gheorghe M.Panaitescu - ac.upg-ploiesti.roac.upg-ploiesti.ro/gpanaitescu/msds_2007.pdf · •Retele neuronale •Retele neuronale artificiale stratificate •Analiza multirezolutie

• ecuatia de stare Peng-Robinson (1976)

22

2

211 ρρρ

ρρ

bba

bRTP

−+−

−=

• ecuatia de stare Patel-Teja (1982)

2

2

)(211 ρρρ

ρρ

bccba

bRTP

−++−

−=

Acestea si încǎ o serie întreagǎ de alte ecuatii de stare produse în anii din urmǎreusesc sǎ modeleze în egalǎ mǎsurǎ atât comportarea substantelor pure cât si aamestecurilor, pe largi intervale de temperaturǎ si presiune, din vecinǎtateapunctului triplu si pânǎ mult dincolo de punctele critice. Astfel de ecuatii suntsurse nu numai de presiuni, volume si temperaturi ci si de alti parametri fizicide foarte mare importantǎ cum sunt energiile interne (sau entalpiile) sientropiile.Ecuatiile de stare permit evaluarea repartizǎrii componentilor între faze înechilibru, permit calculul asa-numitelor constante de echilibru, care sunt foarteimportante în modelarea si simularea proceselor chimice si petrochimice.Referitor la parametrii care apar în ecuatiile de stare si la calculul lor, seexemplificǎ în continuare cazul ecuatiei de stare Peng-Robinson care continedoi asemena parametri, a si b. Pentru substante pure acestia au expresiile

αc

c

PRTa

2)(45724.0=

c

c

PRTb 0778.0=

în care apar temperatura criticǎ Tc si presiunea criticǎ Pc si, pentru a, factorul

( )[ ]211 rTs −+=α

care contine la rându-i temperatura redusǎ, Tr = T/Tc si coeficientuls = 0.384401 + 1.52276ω – 0.213808ω 2 + 0.034616ω 3 – 0.001976ω 4

un polinom în factorul acentric ω.Se observǎ cǎ fiind dati parametrii critici Tc si Pc si factorul acentric ω,constante caracteristice fiecǎrei specii moleculare, se pot calcula coeficientii dinecuatia de stare. Coeficientii numerici din expresiile de mai sus au fostdeterminati printr-o procedurǎ de regresie cu luarea în considerare a unui numǎrapreciabil de specii moleculare si a unui numǎr de proprietǎti care depind destarea substantelor respective. Aceastǎ procedurǎ este cunoscutǎ sub numele deanalizǎ multiplǎ a proprietǎtilor, în englezeste, multiproperty analysis.Pentru amestecuri, forma ecuatiei de stare se mentine dar coeficientii suntcalculati din cei pentru componentii puri pe baza unor asa-numite reguli deamestecare. Fǎrǎ a intra în prea multe detalii, coeficientul b pentru amestec esteo medie ponderatǎ cu concentratiile molare, a coeficientilor bi, i = 1, 2, ..., n,

53

Page 54: Gheorghe M.Panaitescu - ac.upg-ploiesti.roac.upg-ploiesti.ro/gpanaitescu/msds_2007.pdf · •Retele neuronale •Retele neuronale artificiale stratificate •Analiza multirezolutie

asociati celor n componenti din amestec. Coeficientul a este o formǎ pǎtraticǎ înconcentratiile molare cu coeficientii calculati prin luarea mediei geometrice acoeficientilor ai, aj, i, j = 1, 2, ..., n, medie corectatǎ cu factori 1 – kij apropiatide unitate, specifici fiecǎrei perechi de componenti. Constantele kij se numescparametri de interactiune, sunt nule pentru i = j si sunt în general diferite pentruecuatii de stare diferite.În calculele de modelare-simulare sunt necesare evaluǎri ale entalpiilor si uneoriale entropiilor. Frecvent se considerǎ, fǎrǎ vreo verificare, cǎ entalpiile suntvariabile liniar cu temperatura, cǎ entalpiile de vaporizare ale substantelor suntconstante, cǎ presiunea nu ar avea nici o influentǎ asupra acestora.Punerea corectǎ a problemei este sintetizatǎ în formulǎrile care urmeazǎ.Entalpia unei substante la temperatura T si la presiunea P are trei componente:a) entalpia de formare în starea standard, uzual la 298K si presiune cvasinulǎ;b) o diferentǎ de entalpie la temperatura T în starea de gaz ideal, fatǎ de starea

standard;c) o abatere de entalpie la temperatura T si la presiunea P, fatǎ de starea de

gaz ideal, la aceeasi temperaturǎ.Într-o relatie cuprinzǎtoare entalpia se descompune astfel

)()( 000

000 HHHHHH −+−+=

Primul si al doilea termen din relatia genericǎ de mai sus sunt furnizati de tabelesau de baze de date computerizate. Datele stocate într-un mod sau altul suntparticulare pentru fiecare specie molecularǎ si sunt mereu aceleasi oricare ar fistarea substantei în conditiile date de temperaturǎ si presiune. Termenul altreilea este furnizat de o ecuatie de stare, în particular de ecuatia Peng-Robinson, printr-un calcul simplu. Relatia de calcul al abaterii de entalpie este

∂∂−+−=−

ρ

ρρ

ρ 02

0 )( dTPTPRTPHH

si include, dacǎ este cazul, si entalpia latentǎ de trecere de la o stare fluidǎ laalta. Entalpia latentǎ este cunoscutǎ uzual ca o constantǎ specificǎ uneisubstante date. Aceastǎ perceptie este corectǎ dacǎ se tine seamǎ de faptul cǎalǎturi de valoarea datǎ în tabele mai este specificatǎ si o presiune: presiuneanormalǎ. Entalpia latentǎ se modificǎ la alte presiuni diferite de cea normalǎ.Apropierea de punctul critic de pildǎ duce la diminuarea treptatǎ a acesteientalpii si la anularea ei la presiuni superioare presiunii critice când practic numai existǎ faze fluide distincte.În cazul amestecurilor, termenii asociati formǎrii si stǎrii de gaz ideal secalculeazǎ prin ponderarea termenilor corespunzǎtori componentilor puri cuconcentratiile lor molare. Termenul al treilea, abaterea de entalpie se calculeazǎdin ecuatia de stare pentru amestec.Entropia, o proprietate la fel de importantǎ uneori ca si entalpia are douǎcomponente

54

Page 55: Gheorghe M.Panaitescu - ac.upg-ploiesti.roac.upg-ploiesti.ro/gpanaitescu/msds_2007.pdf · •Retele neuronale •Retele neuronale artificiale stratificate •Analiza multirezolutie

S = S 0 + (S – S 0)prima este entropia în starea de gaz ideal la temperatura T, a doua este abatereade entropie la temperatura T si la presiunea P, fatǎ de starea de gaz ideal laaceeasi temperaturǎ. Primul termen din descompunerea de mai sus contineuzual o parte legatǎ de formarea substantei din elementele constitutive înconditii standard si o altǎ parte dependentǎ de temperaturǎ. Toate elementelenecesare calculǎrii termenului prim se iau din tabele sau baze de date. Termenulal doilea se evalueazǎ pe baza unei ecuatii de stare cu relatia

∂∂−−−=−

ρ

ρρρρ

02

0 )ln()( dTPRRTRSS

Spectre de componenti

Existǎ amestecuri de foarte multi componenti cum sunt titeiurile sau fractiilepetroliere sau cum sunt polimerii. Asemenea amestecuri nu pot fi tratatecomponent cu component cum se procedeazǎ cu amestecurile mai simple, dinmai putini componenti, ci sunt considerate a avea spectre de componenticontinue. Dealtfel, o specificare a tuturor componentilor este de cele mai multeori imposibilǎ. În aceste cazuri se alege o anumitǎ caracteristicǎ, de pildǎ asa-numitele puncte reale de fierbere (PRF) sau masele moleculare si se exprimǎprocentual sau în fractii partea din amestec, care are caracteristica definitoriesub o anumitǎ valoare. Exprimarea aceasta se constituie într-o functie derepartitie a componentilor si, ca orice functie de repartitie are valori între zero(0%) si 1 (100%), este nedescrescǎtoare si admite o derivatǎ în fiecare punct,derivatǎ care este o densitate de repartitie. Valorile caracteristicii se întind pe uninterval finit. În cazul punctelor reale de fierbere intervalul este marcat de unpunct initial si un punct final de fierbere. Aceste douǎ functii sunt cunoscutemai ales prin graficele lor (curba punctelor reale de fierbere, de pildǎ) si suntnotate generic cu F(x) si f(x), x fiind caracteristica în raport cu care se facesortarea componentilor. Aceleasi notatii se regǎsesc si în sectiunea referitoare lavariabilele aleatoare si multe rezultate de acolo pot fi aplicate si la functiile derepartitie pentru amestecuri complexe. Deosebirea majorǎ constǎ în lipsacaracterului aleator al caracteristicii fatǎ de care se calculeazǎ repartitiacomponentilor.

Ecuatiile de stare si amestecurile complexe

În cazul amestecurilor complexe, asa cum s-a spus, este mai convenabil a seconsidera cǎ amestecul contine un spectru de componenti continuu în raport cuo caracteristicǎ datǎ. Cea mai uzualǎ caracteristicǎ este aceea a punctelor realede fierbere (PRF). Fractia respectivǎ sau titeiul brut sunt descrise compozitionalprintr-o curbǎ a acestor puncte reale de fierbere care sunt temperaturile de

55

Page 56: Gheorghe M.Panaitescu - ac.upg-ploiesti.roac.upg-ploiesti.ro/gpanaitescu/msds_2007.pdf · •Retele neuronale •Retele neuronale artificiale stratificate •Analiza multirezolutie

fierbere ale unor fractii înguste din amestec, în conditii normale de presiune.Fractiile înguste sunt rezultatul unei operatii de distilare în cursul cǎreia distilǎmai întâi componentii mai volatili, cu temperaturi de fierbere mai scǎzute, apoicomponenti din ce în ce mai putin volatili, cu temperaturi de fierbere din ce înce mai ridicate, pânǎ la epuizarea amestecului sau cel putin al unei pǎrtiimportante a lui. O asa-numitǎ curbǎ PRF este o relatie între procentele dinamestec care fierb pânǎ la o temperaturǎ datǎ si acea temperaturǎ. Asa cum s-aarǎtat mai devreme, o curbǎ PRF este similarǎ unei curbe de repartitie si chiareste o curbǎ de repartitie dar nu în sensul utilizat în cazul variabilelor aleatoare. Pentru amestecuri nedefinite, tratarea este diferitǎ pânǎ la un punct de aceea aamestecurilor de componenti cu nume. Prin divizarea intervalului de punctereale de fierbere specific amestecului se defineste un numǎr depseudocomponenti. Uzual se folosesc diviziuni cu intervale egale. Numǎrul depseudocomponenti este ales astfel încât sǎ reprezinte adecvat amestecul, deregulǎ pânǎ la câteva zeci.Frecvent, fractiile petroliere sunt caracterizate în plus prin relatia procente-medii-densitate. Aceastǎ relatie este uzual o listǎ de fractii înguste definite prinpunctul de fierbere mediu si prin densitatea lor. Prin interpolare se pot evaluadensitǎtile pseudocomponentilor definiti. Din punctul de fierbere si dindensitatea fiecǎrui pseudocomponent se pot estima costante caracteristice, întrecare masele moleculare, parametrii critici si factorii acentrici. Maselemoleculare sunt utile pentru conversii fractii/procente molare – fractii/procentemasice si invers. Celelate constante stabilite pe aceastǎ cale sunt utilizate pentruevaluarea coeficientilor din ecuatiile de stare, pentru pseudocomponenti sipentru orice amestec al lor.Premisele stabilite pânǎ acum permit a se calcula densitǎti în conditii detemperaturǎ si presiune date si echilibre între faze lichid-vapori. Relativ ladensitate, se mentioneazǎ în literaturǎ diferenta de precizie în evaluarea cuecuatiile de stare a densitǎtii fazelor: foarte precis pentru faza vapori, mult maiputin precis pentru faza lichid. Pentru calculul de echilibre între faze impreciziaîn valorile pentru densitatea fazei lichid nu are prea mare importantǎ: conditiilede echilibru nu-s foarte sensibile la aceastǎ mǎrime. Dacǎ însǎ densitatea se aflǎîntre obiectivele calculelor atunci este necesarǎ precautie în utilizarea valorilordensitǎtilor calculate cu ecuatiile de stare. În cazul hidrocarburilor clarindividualizate sau sub formǎ de amestecuri pseudocontinue cum sunt fractiilepetroliere, o compensare a erorilor în evaluarea densitǎtilor se poate realizaprintr-o variantǎ a ecuatiei de stare Peng-Robinson, ecuatia cu translatie devolum (de densitate) care dateazǎ din anii ‘80 ai secolulului trecut. Aceastǎvariantǎ a ecuatiei face o corectie a densitǎtii rezultatǎ din constantele critice sidin factorii acentrici care caracterizeazǎ (pseudo)componentii, cu efectulnecesar în densitatea amestecurilor.

56

Page 57: Gheorghe M.Panaitescu - ac.upg-ploiesti.roac.upg-ploiesti.ro/gpanaitescu/msds_2007.pdf · •Retele neuronale •Retele neuronale artificiale stratificate •Analiza multirezolutie

În ceea ce priveste entalpiile (entropiile), pseudocomponentii definiti ca mai sussunt tratati asemǎnǎtor componentilor cu nume, cu deosebirea cǎ expresiile siconstantele referitoare la starea de gaz ideal sunt evaluate tot pe calea estimǎriiprealabile a constantelor fundamentale din date PRF si procente-medii-densitate. Ca si în cazul componentilor individualizati, în cazul amestecurilortermenul asociat stǎrii de gaz ideal se calculeazǎ prin ponderarea termenilorcorespunzǎtori pseudocomponentilor cu concentratiile lor molare. Termenul aldoilea, deviativ fatǎ de starea de gaz ideal se calculeazǎ din ecuatia de starepentru amestec.

Echilbre între faze

În multe aplicatii prezentate în capitolele precedente, în care fluidele eraumediul care determina dinamica unui sistem, starea de agregare a materialuluivehiculat era unicǎ sau, cum se spune, fluidele se prezentau într-o singurǎ fazǎ.În foarte multe sisteme dinamice fluidele se prezintǎ în mai multe faze fiepentru cǎ, de pildǎ, este vorba de lichide imiscibile si atunci coexistǎ douǎ saumai multe faze lichide, fie pentru cǎ temperatura este suficient de ridicatǎpentru ca o parte din fluid sǎ se vaporizeze caz în care avem pe lângǎ faza(fazele) lichid si o fazǎ vapori.Aparitia fazelor multiple este caracteristicǎ amestecurilor. Desigur, pentru uncomponent singular nu ne putem astepta la mai mult de douǎ faze fluide. La unamestec este posibilǎ coexistenta unui numǎr de faze mai mare.Nu are importantǎ dacǎ sistemul este închis sau deschis, ceea ce echivaleazǎ cua avea un spatiu finit sau infinit care poate fi ocupat de fluid, tendinta naturalǎeste ca fazele posibile în conditiile de presiune si de temperaturǎ date sǎ sesepare una de alta. Iau nastere suprafete separatoare ale fazelor sau interfeteunde existǎ relatii precise între concentratiile componentilor în cele douǎ faze.Relatiile respective se numesc relatii de echilibru între faze si au forma generalǎ

yi = ki xi (i = 1, 2, …, n)pentru fiecare din cei n componenti, cu fractiile molare xi, yi în cele douǎ faze înechilibru si cu ki asa-numitele constante de echilibru, impropriu numiteconstante deoarece ele depind totdeauna de temperaturǎ, uneori de presiune side compozitie. Dacǎ sistemul este deschis, echilibrul are loc numai la interfatǎ.Dacǎ sistemul este închis atunci echilibrul se poate stabili pentru un spatiu mailarg si se pot distinge faze omogene care ocupǎ fiecare un volum dat din spatiultotal al sistemului. Echilibrul nu se stabileste instantaneu. El are dinamica luiproprie dictatǎ de fenomenul difuziei în fiecare fazǎ, care face ca treptatconcentratiile de la interfatǎ sǎ se generalizeze în întreg spatiul ocupat de fazarespectivǎ. Prin metode de intensificare a omogenizǎrii fazelor, de pildǎ agitareaintensǎ, scara de timp la care se realizeazǎ echilibrul de faze într-un sistemînchis poate sǎ fie mult diferitǎ de aceea a altor fenomene care determinǎ

57

Page 58: Gheorghe M.Panaitescu - ac.upg-ploiesti.roac.upg-ploiesti.ro/gpanaitescu/msds_2007.pdf · •Retele neuronale •Retele neuronale artificiale stratificate •Analiza multirezolutie

dinamica sistemului. Modul cum echilibrul fazelor intervine în modelarea unorsisteme dinamice este ilustrat în exemplul unui separator de faze.

Variabilele care descriu separatorul sunt urmǎtoarele: • cantitǎtile din componentul i în faza lichid, ui (i = 1, 2, ..., n) [mol]; • cantitǎtile din componentul i în faza vapori wi (i = 1, 2, ..., n) [mol]; • debitul componentului i în alimentare fi (i = 1, 2, ..., n) [mol/s]; • debitul componentului i în lichidul extras li (i = 1, 2, ..., n) [mol/s]; • debitul componentului i în vaporii extrasi vi (i = 1, 2, ..., n) [mol/s]; • constanta de echilibru pentru componentul i, ki (i = 1, 2, ..., n)Ecuatiile care modeleazǎ bilantul material în conditii izoterme sunt:a) Ecuatiile de conservare

iiiii vlf

dtdw

dtdu −−=+ , (i = 1, 2, ..., n)

b) Ecuatiile de echilibru lichid-vapori

∑∑==

=n

jj

iin

jj

i

u

ukw

w

11

, (i = 1, 2, ..., n)

c) Ecuatii care leagǎ debitele de lichid extras, pe componenti, de compozitialichidului din separator;

li = q.ui , (i = 1, 2, ..., n)d) Ecuatii care leagǎ debitele vaporilor extrasi, pe componenti, de compozitiavaporilor din separator;

vi = p.wi , (i = 1, 2, ..., n)cu factorii q si p dependenti de timp;e) Conditia de volum limitat al vasului

Cwu

V

n

ii

L

n

ii

=+∑∑

==

ρρ11

unde ρL si ρV sunt densitǎtile celor douǎ faze.

58

Page 59: Gheorghe M.Panaitescu - ac.upg-ploiesti.roac.upg-ploiesti.ro/gpanaitescu/msds_2007.pdf · •Retele neuronale •Retele neuronale artificiale stratificate •Analiza multirezolutie

O numǎrare a ecuatiilor aratǎ cǎ sunt în total 4n + 1 ecuatii, unele diferentiale,altele algebrice. Ecuatiile contin 6n + 5 simboluri. Unele dintre ele noteazǎconstante, de pildǎ cele n constante de echilibru si capacitatea vasului C. Altelesunt definite implicit, cum sunt densitǎtile ρL si ρV care sunt deplin determinatede compozitia fazelor, de presiune si de temperaturǎ. Rǎmân încǎ de discutat 5n+ 2 simboluri. Pentru ca sistemul de ecuatii sa poatǎ fi rezolvat este necesar a fispecificate încǎ n + 1 variabile sau acelasi numǎr de relatii între ele. Desigur,alimentarea separatorului este uzual cunoscutǎ în fiecare moment, ceea ceînseamnǎ n specificatii în plus. Rǎmâne de fǎcut o ultimǎ specificare. Aceastapoate fi, de pildǎ, o conditie de operare. Relatia

Llmn

iii =∑

=1

cu L un debit masic de lichid constant poate fi o astfel de conditie. În ultimarelatie s-au notat cu mi (i = 1, 2, ..., n) masele moleculare ale componentilor.Renuntarea la coditia de izotermicitate a echilibrului aduce o ecuatie nouǎ, oecuatie de bilant energetic. În configuratia separatorului de mai sus aportulenergetic extern este datorat exclusiv fluxului de alimentare, iar transportul deenergie cǎtre exterior se produce numai prin fluxurile de lichid si de vaporievacuate din vas, care sunt evident purtǎtoare de energie. Relatia de bilantenergetic este

∑∑∑===

−−=n

iii

n

iii

n

iii vHlhfh

dtdE

111

*

în care E este energia continutului vasului separator de faze, hi*, hi, Hi (i = 1,

2, ..., n) sunt entalpiile specifice ale componentilor în alimentare, în lichid,respectiv în vapori.Separatorul de faze examinat mai sus este prototipul unui alt separator de faze,foarte frecvent si multiplu utilizat în coloanele de separare cu echilibre de faze.Este vorba de asa-numitul echilibru teoretic sau taler teoretic. Sunt câtevadeosebiri dar nu de esentǎ. Astfel, conform figurii de mai jos o sectiune dintr-ocoloanǎ poate fi echivalatǎ cu un separator de faze cu mai multe alimentǎri, oeventualǎ alimentare propriu-zisǎ Fj, alimentǎri cu vapori de la sectiunea dededesubt si cu lichid de la sectiunea de deasupra, cu douǎ fluxuri careevacueazǎ lichid cǎtre sectiunea situatǎ mai jos si vapori spre sectiunea situatǎdeasupra, cu eventuale alte fluxuri de vapori Sj’ sau de lichid Sj" spre exterior.Relatiile de continuitate si de bilant energetic sunt similare cu acelea din cazulseparatorului de faze. Ele diferǎ prin numǎrul de termeni, mai multi în cazulsectiunii unei coloane de separare cu echilibre de faze. Aportul sau extragerealocalǎ de energie este, de asemenea, posibilǎ. Sectiunea coloanei poate ficonstituitǎ fizic dintr-un asa-numit taler, o constructie unde poate stationa ocantitate de lichid care este în contact cu o cantitate de vapori, uzual departe deechilibrul teoretic. Sectiunea poate sǎ fie si o portiune de coloanǎ cu umpluturǎ

59

Page 60: Gheorghe M.Panaitescu - ac.upg-ploiesti.roac.upg-ploiesti.ro/gpanaitescu/msds_2007.pdf · •Retele neuronale •Retele neuronale artificiale stratificate •Analiza multirezolutie

care asigurǎ o contactare între un curent ascendent de vapori si un fluxdescendent de lichid. În ambele cazuri modelele matematice pentru regimulstationar si/sau pentru regimul dinamic al reuniunii de sectiuni care este coloanarecurg la abstractia numitǎ echilibru teoretic sau taler teoretic. Echilibrulteoretic este echivalentul unui separator de faze care ar avea un timp destationare suficient de îndelungat pentru a se atinge echilibrul fazelor în formadatǎ de relatiile de echilibru prezentate mai sus.

O observatie se cuvine a fi fǎcutǎ: ordinul sistemului dinamic numit separatorde faze este cel putin egal cu numǎrul de componenti din amestecul supusseparǎrii. Ordinul sistemului creste multiplicativ cu numǎrul de echilibreteoretice (j = 1, 2, ..., m) cu care poate fi asimilatǎ coloana. Rezultǎ, asadar,modele care constau în foarte multe ecuatii diferentiale care produc dificultǎtide calcul uneori neasteptate.

Ecuatii chimice generalizate, stoechiometrie, echilibru chimic

Transformǎrile chimice au un mecanism propriu care aratǎ ce specii molecularese consumǎ, dispar pentru a fi produse alte specii moleculare. Proportia acestorcombinǎri si transformǎri este datǎ de stoechiometrie. Ecuatia unei transformǎrichimice, scrisǎ pentru speciile moleculare generice Ai (i = 1, 2, ..., n), cu totitermenii grupati în partea stângǎ a semnului transformǎrii

01

↔∑=

n

iii Aν

exprimǎ consumul sau producerea de Ai în reactie în cantitatea de νi moli, dupǎcum coeficientul stoechiometric νi este negativ sau, respectiv, pozitiv. Dacǎviteza globalǎ a reactiei este r [mol/s] atunci viteza de producere sau dedisparitie a speciei Ai este obtinutǎ prin multiplicarea acestei viteze cucoeficientul stoechiometric respectiv.Transformǎrile pot fi multiple, în mai multe reactii paralele sau succesive. Înasemenea situatii se poate vorbi de un vector al vitezelor si de o matrice acoeficientilor stoechiometrici. Vitezele cu care speciile se formeazǎ sau dispar

60

Page 61: Gheorghe M.Panaitescu - ac.upg-ploiesti.roac.upg-ploiesti.ro/gpanaitescu/msds_2007.pdf · •Retele neuronale •Retele neuronale artificiale stratificate •Analiza multirezolutie

în sistem se calculeazǎ multiplicând vectorul transpus al vitezelor cu matriceacare exprimǎ stoechiometria globalǎ a mecanismului transformǎrilor

[ ] [ ]

=

mnm

n

mAA rrrrn

νν

νν

1

111

11

Aici m este numǎrul reactiilor chimice care constituie mecanismul. În relatiilede bilant material pe componenti, vitezele de formare si/sau disparitie care seintroduc au exact aceste valori din partea stângǎ a relatiei de mai sus.Toate transformǎrile chimice sunt teoretic reversibile dar au viteze diferite într-un sens fatǎ de celǎlalt. Existǎ asadar posibilitatea ca vitezele transformǎrilordirectǎ si inversǎ sǎ fie egale, ceea ce se întâmplǎ la asa-numitul echilibruchimic. Si aceste detalii legate de echilibrul chimic intervin în scrierea corectǎ arelatiilor de bilant material.La transformǎrile chimice ale unor amestecuri de foarte multi componenti,titeiuri sau fractii petroliere, suma din relatia de mai sus referitoare la reactiichimice se transformǎ într-o integralǎ. În locul componentilor se utilizeazǎspectre pseudocontinue de componenti descrise de repartitii de genul unei curbea punctelor reale de fierbere. Un exemplu se poate vedea în sectiunea unde aufost descrise modelele de tipul ecuatiilor integro-diferentiale.În toate cazurile trebuie luat în considerare un posibil efect termic al reactiilor.Pentru aceasta în relatia de bilant energetic trebuie introdusi termeni de formarj∆hj (j = 1, 2, ..., m) care dau mǎsura disparitiei de energie în spatiulintramolecular sau, dimpotrivǎ, degajarea de energie în spatiul extramolecular,rj fiind viteza în [mol/s] a unei reactii anumite si ∆hj energia în [J/mol] asociatǎtransformǎrii unui mol în directia sǎgetii din ecuatia chimicǎ respectivǎ scrisǎ înforma generalizatǎ de mai sus.

Alte principii si aspecte cantitative utilizate în scrierea modelelor dinamiciisistemelor

Faptul cǎ în sectiunea prezentǎ se insistǎ mai ales asupra principiilor propriidomeniului tehnologiilor chimice se datoreazǎ în principal complexitǎtii uneoriexcesive a sistemelor din aceastǎ ramurǎ a productiei materiale. Desigur, astanu exclude luarea în considerare a altor fenomene a cǎror descriere matematicǎcantitativǎ este accesibilǎ din mecanica teorerticǎ, din electrotehnicǎ sau dinalte domenii. În continuare este prezentat un exemplu care apeleazǎ la legi dindomenii diferite.Modelul matematic al unui motor de curent continuu, de pildǎ, se scrie pe bazaunei duble referiri la legile mecanicii si la legile electrotehnicii. Un motor decurent continuu poate fi modelat în circumstante diferite.

61

Page 62: Gheorghe M.Panaitescu - ac.upg-ploiesti.roac.upg-ploiesti.ro/gpanaitescu/msds_2007.pdf · •Retele neuronale •Retele neuronale artificiale stratificate •Analiza multirezolutie

Se admite mai întâi cǎ motorul este comandat prin tensiunea aplicatǎ indusului,care este si mǎrime de intrare. Mǎrimea de iesire este de naturǎ mecanicǎ. Eaeste deplasarea unghiularǎ a axului motorului. Curentul de excitatie estepresupus constant. Modelul motorului în aceste conditii se compune din:a) o relatie de echilibru între tensiunile electrice

)()()()( tedt

tdiLtiRtu ciii ++=

în care Ri si Li sunt rezistenta si inductanta indusului, i(t) este curentul în indussi ec (t) este tensiunea contraelectromotoare.b) expresia tensiunii contraelectromotoare care este proportionalǎ cu viteza derotatie relativǎ rotor/stator

dttdkte e

ec)()( θ=

cu coeficientul ke constant numai în limitele în care reactia indusului se poateneglija (ipoteza de flux constant în rotor).c) o relatie de echilibru mecanic

km i(t) = Idt

dfdt

d ee θθ +2

2

cu termenul din stânga care exprimǎ cuplul electromagnetic proportional cucurentul prin indus, cu partea dreaptǎ compusǎ dintr-un termen legat de cuplulinertial al elementului care se roteste si care are un moment inertial I si un alttermen care reprezintǎ forta de frecare vâscoasǎ a aceluiasi corp rotitor.Cele trei ecuatii au în vedere unitǎti de mǎsurǎ adecvate. În conditii obisnuiteefectul inductiv dat de Li si efectul frecǎrilor concretizat în coeficientul f se potneglija.O altǎ ipostazǎ de functionare a unui motor de curent continuu este aceea încare comanda este pe excitatie. Tensiunea pe indus este presupusǎ constantǎ, iariesirea este tot de naturǎ mecanicǎ, în spetǎ viteza de deplasarea unghiularǎ aaxului motorului.Ecuatiile dinamicii motorului sunt în aceste coditii întrucâtva diferite. Astfel seexprimǎa) echilibrul electric cu ecuatia

U = Ri I + ec = Ri I + fu[ie(t), Ω(t)]b) cuplul mecanic la ax cu relatia

cm(t) = fc[I, ie(t)](caracteristicile motorului, fu[ie(t), Ω(t)] si fc[I, ie(t)], care apar în aceste douǎecuatii sunt familii de hiperbole)c) echilibrul dinamic al rotorului cu relatia

cm(t) = I dtdΩ

+ f Ω(t) + cr(t)

62

Page 63: Gheorghe M.Panaitescu - ac.upg-ploiesti.roac.upg-ploiesti.ro/gpanaitescu/msds_2007.pdf · •Retele neuronale •Retele neuronale artificiale stratificate •Analiza multirezolutie

Notatiile noi care apar în acest al doilea model al motorului sunt, de asemenea,modificate si suplimentate: I pentru curentul în indus, Ω(t) pentru vitezaunghiularǎ a axului, ie(t) pentru curentul de excitatie, cm(t) pentru cuplulrezistent la axul motorului.Sectiunea prezentǎ a acestor Note de curs nu si-a propus nicidecum epuizareasubiectului atât de vast al scrierii modelelor matematice pe baza legilorfundamentale ale fizicii, ale chimiei fizice sau a unor relatii preluate din altedomenii. Rǎmâne în seama cititorului, poate ca exercitiu, scrierea altor modeledinamice, în baza cunostintelor proprii dobândite la alte discipline, inclusiv încursul studiilor preuniversitare.

Probleme

Problema 1.Pentru propan (C3H8), parametrii critici sunt Tc = 369,8 K, Pc = 4,25.106 Pa,factorul acentric este ω = 0,153. Constanta universalǎ a gazelor ideale este R =8,3145 J K–1 mol–1.Verificati cǎ dacǎ temperatura fluidului este mai mare decât temperatura criticǎ,atunci o ecuatie de stare, de pildǎ ecuatia Peng-Robinson are o singurǎ solutiecorespunzǎtoare unei stǎri de agregare unice. Arǎtati cǎ un fapt similar seîntâmplǎ si dacǎ presiunea la care se aflǎ fluidul este superioarǎ presiuniicritice.Dacǎ atât presiunea cât si temperatura fluidului sunt sub valorile lor criticeatunci ecuatia de stare are trei solutii. Care dintre ele corepunde unei stǎri devapori, care unei stǎri de lichid?

Problema 2.Scrieti ecuatiile de continuitate pentru un separator de faze (lichid si vapori) la otemperaturǎ fixatǎ. Alimentarea (unicǎ si masic constantǎ) este un amestec dedoi componenti în proportie de 50%/50% masic. Constantele de echilibru latemperatura datǎ sunt k1 = 1,5 si k2 = 0,5.Ce se întâmplǎ dacǎ alimentarea îsi schimbǎ brusc compozitia la 25%/75%masic?Masele moleculare ale componentilor sunt 30 si 44, evacuǎrile materiale suntsub formǎ de vapori si lichid în cantitǎtile rezultate din echilbru.

Problema 3.Mai sus, în sectiunea referitoare la ecuatiile de miscare, s-a scris modelulmatematic al golirii de lichid a unei conducte în vederea transportului prin aceaconductǎ, a unui lichid de altǎ calitate. Din context se întelege cǎ respectivaconductǎ este orizontalǎ.

63

Page 64: Gheorghe M.Panaitescu - ac.upg-ploiesti.roac.upg-ploiesti.ro/gpanaitescu/msds_2007.pdf · •Retele neuronale •Retele neuronale artificiale stratificate •Analiza multirezolutie

Scrieti un model pentru o conductǎ care nu este orizontalǎ, de pildǎ pentru unacare are o treime ascendentǎ cu o pantǎ de 1%, apoi o treime descendentǎ cu opantǎ de 1,5% si, în fine, ultima treime ascendentǎ cu o pantǎ de 2%.

Exercitii de autoevaluare

1. Modelele dinamicii sistemelor includ adesea si ecuatii de continuitate.Marcati în lista care urmeazǎ termenul care nu poate apǎrea într-o ecuatie decontinuitate scrisǎ corect.

a) acumularea de material într-un sistem vecinb) debitele fluxurilor care intrǎ/ies în/din sistemc) vitezele transformǎrilor chimice din sistem

2. În sectiunea Ecuatii de miscare este dat modelul operatiei de golire deprodus a unei conducte în vederea utilizǎrii ei la transportul unui alt produs.Tipul acelui model este:

a) liniar, b) neliniar sau c) depinde de lungimea conductei?3. Starea fluidelor poate fi descrisǎ de o ecuatie de stare cubicǎ în densitatea

molarǎ ρ, de pildǎ de ecuatia Peng-Robinson. Pentru o presiune si otemperaturǎ fixate, ecuatia poate avea una sau trei rǎdǎcini reale pozitive. Seadmite cǎ ecuatia are trei astfel de rǎdǎcini. Ce reprezintǎ cea mai micǎdintre ele?

a) densitatea fazei vapori; b) densitatea fazei lichid;c) nu are nici o semnificatie fizicǎ.

4. Sunt în general ecuatiile de bilant energetic independente de ecuatiile decontinuitate?

a) da; b) uneori;c) cele douǎ tipuri de ecuatii sunt cuplate cel putin prin energiile (entalpiile)

fluxurilor materiale si prin efectul termic al reactiilor chimice (dacǎ acesteaau loc).

5. Echilibrul între faze se produce:a) Instantaneu,b) într-un timp finit, diferit de zero, fix sauc) într-un timp finit, diferit de zero, cu o dinamicǎ proprie cu atât mai

rapidǎ cu cât constantele de echilibru sunt mai depǎrtate de unitate si cucât fazele au o interfatǎ mai extinsǎ (de pildǎ în conditii de amestecareturbulentǎ)?

6. De ce în modelarea amestecurilor foarte complexe cum sunt titeiurile brute,fractiile petroliere sau polimerii se utilizeazǎ nu componenti individualizati,ci pseudocomponenti care grupeazǎ dupǎ o anumitǎ caracteristicǎ (punctereale de fierbere, masǎ molecularǎ) numerosi componenti reali?a) Existǎ o traditie care s-a impus cu timpul;

64

Page 65: Gheorghe M.Panaitescu - ac.upg-ploiesti.roac.upg-ploiesti.ro/gpanaitescu/msds_2007.pdf · •Retele neuronale •Retele neuronale artificiale stratificate •Analiza multirezolutie

b) Dimensionalitatea ecuatiilor de continuitate si/sau a ecuatiilor deechilbru între faze ar creste inacceptabil;

c) Nu se cunosc mai mult de jumǎtate din componentii prezenti.7. Despre entalpia de vaporizare/condensare se poate spune cǎ:

a) Este constantǎ indiferent de temperaturǎ sau presiune;b) Este în valoare absolutǎ una pentru vaporizare, alta pentru condensare;c) Este variabilǎ cu temperatura si presiunea si se anuleazǎ la punctul

critic.Marcati afirmatia adevǎratǎ.

8. Cele douǎ modele matematice ale motorului de curent continuu, prezentateîn sectiunea ultimǎ a capitolului prezent sunt:a) liniare;b) neliniare sauc) unul liniar, celǎlalt neliniar?

65

Page 66: Gheorghe M.Panaitescu - ac.upg-ploiesti.roac.upg-ploiesti.ro/gpanaitescu/msds_2007.pdf · •Retele neuronale •Retele neuronale artificiale stratificate •Analiza multirezolutie

66

Page 67: Gheorghe M.Panaitescu - ac.upg-ploiesti.roac.upg-ploiesti.ro/gpanaitescu/msds_2007.pdf · •Retele neuronale •Retele neuronale artificiale stratificate •Analiza multirezolutie

FORME STANDARD ALE MODELELOR DINAMICII SISTEMELOR

• Dinamica sistemelor modelatǎ cu ecuatii de stare si ecuatii de observare• Modele matematice în domeniul complex • Dinamica sistemelor modelatǎ cu ecuatii care leagǎ iesirile de intrǎri • Modele matematice în domeniul frecventelor • Trecerea de la modelul liniar de tip ecuatii de stare/ecuatii de observare

la modelul tip intrare-iesire • Trecerea de la modelul liniar de tip intrare-iesire la modelul tip ecuatii

de stare/ecuatii de observare• Probleme• Exercitii de autoevaluare

Douǎ sunt tipurile de modele matematice întrebuintate frecvent în studiuldinamicii sistemelor. Ambele sunt la fel de utile si în anumite conditii sunt siechivalente. În continuare sunt prezentate aceste tipuri de modele cu variantelelor si cu posibilele lor echivalente.

Dinamica sistemelor modelatǎ cu ecuatii de stare si ecuatii de observare

Asa-numita ecuatie de stare cuprinde exclusiv evolutia stǎrii sistemului. Ecuatiaare ca necunoscutǎ functia vectorialǎ x(t) adicǎ tocmai vectorul care descriestarea sistemului la orice moment t, în conditiile aplicǎrii unor intrǎri u(t). Îngeneral, dacǎ componentele vectorului de stare a sistemului sunt definite pe uninterval compact de valori ale timpului atunci ecuatia de stare se poate pune subforma unei ecuatii diferentiale

)](),(,[ tutxtfdtdx =

cu functia vectorialǎ cu n componente f mai mult sau mai putin complicatǎ. Dinamica sistemului nu poate fi urmǎritǎ totdeauna prin mǎsurarea sauobservarea nemijlocitǎ a componentelor vectorului de stare, fie pemtru cǎinteresul practic impune atentiei numai anumite componente, fie pentru cǎ unelecomponente nu pot fi mǎsurate eficient, dar înainte de toate pentru motivulsimplu cǎ vectorul de stare poate fi uneori numai vag legat de elementemǎsurabile el fiind mai curând un purtǎtor de informatie privind stareasistemului la un moment dat, purtǎtor care poate lua înfǎtisǎri foarte diferite. De

67

Page 68: Gheorghe M.Panaitescu - ac.upg-ploiesti.roac.upg-ploiesti.ro/gpanaitescu/msds_2007.pdf · •Retele neuronale •Retele neuronale artificiale stratificate •Analiza multirezolutie

aceea, dinamica sistemului este urmǎritǎ prin intermediul unei ecuatii demǎsurare/observare de forma generalǎ

y(t) = h[t, x(t), u(t)]cu functia vectorialǎ cu m componente h, de asemenea, mai mult sau mai putincomplicatǎ.În ambele ecuatii timpul t poate sǎ aparǎ sau sǎ nu aparǎ explicit, dar de fiecaredatǎ intervine implicit prin vectorul de stare x(t) si prin variabilelemanipulabile, de intrare u(t).Un caz particular – foarte instructiv datoritǎ facilitǎtilor matematice de trataremult mai bogate decât pentru cazul general – este acela al ecuatiilor de stare side observare liniare. Ecuatiile pot fi liniare din cauzǎ cǎ sistemul modelat însusieste liniar sau ele pot fi obtinute prin liniarizarea mai mult sau mai putin localǎa unor ecuatii de formǎ generalǎ. Ecuatiile în forma linarǎ sunt

)()( tGutFxdtdx +=

y(t) = Hx(t)cu F, G si H matrici de dimensiuni adecvate. Dacǎ cele trei matrici au toateelementele constante în timp modelul este invariant si se referǎ la un sisteminvariant. Dacǎ cel putin unul din elementele matricilor mentionate variazǎ întimp atunci sistemul nu mai este invariant ci evolueazǎ din punct de vedereparametric si se modeleazǎ cu un model el însusi evolutiv parametric. Cazulcorespunde formei generale a modelului când timpul apare explicit în pǎrtile dindreapta ale ecuatiilor.Dacǎ sistemul este discret/discretizat în raport cu variabila timp atunci formamodelului în realizarea ecuatie de stare – ecuatie de observare este

x(k + 1) = Fx(k) + Gu(k)y(k) = Hx(k)

Se întelege cǎ momentele succesive sunt asociate cu variabila întreagǎ k.Invarianţa modelului si a sistemului modelat este asiguratǎ dacǎ elementelematricilor F, G si H, în general diferite de cele notate la fel în ecuatiile de maiînainte, au toate elementele constante pentru orice k. Existǎ, asadar, simodele/sisteme discrete parametric evolutive, caz în care cel putin o parte dinelementele matricilor depind de variabila temporalǎ discretǎ k.

Modele matematice în domeniul complex

Un model liniar si invariant, raportat la o multime de momente compactǎ setrateazǎ foarte comod în spatiul operational complex la care se ajunge printransformarea Laplace. Prin aceastǎ transformare integralǎ, fiecǎrei functii detimp f(t) care îndeplineste anumite conditii (nulitate pentru timp negativ,derivabilitate pe portiuni, mǎrginire de cǎtre o functie Meσt cu M, σ > 0, cu σ

68

Page 69: Gheorghe M.Panaitescu - ac.upg-ploiesti.roac.upg-ploiesti.ro/gpanaitescu/msds_2007.pdf · •Retele neuronale •Retele neuronale artificiale stratificate •Analiza multirezolutie

eventual nul) i se asociazǎ biunivoc o functie F(s) în spatiul operationalcomplex

∫∞

−=0

)()( dtetfsF st

Se poate verifica cu usurintǎ cǎ transformarea Laplace este liniarǎ. Dacǎ estedatǎ imaginea F(s) se poate reveni la functia original f(t) prin transformareainversǎ

∫∞+

∞−

=ja

ja

st dsesFj

tf )(21)(π

o integralǎ pe o verticalǎ în spatiul complex, situatǎ la stânga verticalei Re(s) =σ, cu σ precizat mai sus, care delimiteazǎ un semiplan de olomorfie a functieicomplexe F(s), cel din dreapta. Se mai pun încǎ unele conditii asupra functiei F(s) care fac ca integrala sǎ fie convergentǎ si care se pot regǎsi si revedea înmanualele de matematicǎ specifice. Transformarea Laplace se poate aplica siderivatelor sau integralelor functiilor de timp f(t). Echivalentul operatiilor dederivare si integrare sunt considerabil mai simple în planul complex. Ele devinmultiplicǎri, divizǎri etc. Se sugereazǎ cititorului revederea unor proprietǎti aletransformǎrii Laplace.Cu cele câteva proprietǎti enumerate, ecuatiile de stare se transformǎ în ecuatiialgebrice

sX(s) – x(0) = F.X(s) + G.U(s)cu notatiile evidente, cu x(0) conditia initialǎ asupra stǎrii sistemului.Prelucrǎrile ulterioare sunt mult facilitate datoritǎ operatiilor simplu de efectuat,operatii algebrice.Pentru sistemele discrete/discretizate, echivalentul într-un fel al operatoruluiintegral Laplace este operatorul z–1, notat uneori cu B. Este un operator dedeplasare în trecut cu un pas (de unde si notatia a doua, B de la Backward shift),care, simplu, face din x(k), x(k – 1), adicǎ x(k – 1) = Bx(k). Operatorul poate fiiterat de un numǎr oarecare de ori. Astfel, x(k – p) = Bpx(k) = B(B...(Bx(k))...)prin aplicarea deplasǎrii înapoi de p ori. Cu acest operator, ecuatiile de stare alesistemului se pot scrie

(B.I – F)x(k) = G.u(k)cu I matricea unitate de ordin egal cu ordinul sistemului.

Dinamica sistemelor modelatǎ cu ecuatii care leagǎ iesirile de intrǎri

Modelele intrare-iesire ignorǎ cel putin aparent stǎrile recurente ale sistemuluimodelat. Asemenea modele aplicǎ multimea intrǎrilor pe multimea iesirilorposibile. Ecuatiile model, pentru un sistem continuu în timp trebuie sǎ continǎun operator pe un spatiu de functii, cel al intrǎrilor, cu rezultatul într-un alt

69

Page 70: Gheorghe M.Panaitescu - ac.upg-ploiesti.roac.upg-ploiesti.ro/gpanaitescu/msds_2007.pdf · •Retele neuronale •Retele neuronale artificiale stratificate •Analiza multirezolutie

spatiu de functii, cel al iesirilor. În sectiunea Modele matematice dinamice aprezentei lucrǎri a fost prezentatǎ relatia

∫ −Φ+−Φ=t

t

dGutxtttx0

)()()()( 00 τττ

care se referǎ la sisteme liniare invariante si care este o aplicatie a multimiiuntrǎrilor u(t) pe multimea stǎrilor x(t). Dacǎ se admite cǎ starea initialǎ estedescrisǎ de un vector cu toate componentele nule, ceea ce printr-o translatiepotrivitǎ este totdeauna posibil, dacǎ relatia este multiplicatǎ cu matricea H careapare în ecuatia de observare se obtine modelul

∫ −Φ=t

t

dGutHty0

)()()( τττ

care aplicǎ efectiv intrǎrile pe multimea iesirilor printr-un operator integral,liniar, operatorul de convolutie. Printr-o notatie condensatǎ h(t) = HΦ(t)Gmodelul se poate rescrie

∫ −=t

t

duthty0

)()()( τττ

cu functia h(t) cunoscutǎ sub numele de functia pondere a sistemului. Aceastǎfunctie este rǎspunsul teoretic al sistemului la intrarea nu mai putin teoreticǎdenumitǎ impulsul unitar δ(t), impuls permanent nul exceptând momentulanulǎrii argumentului când este foarte intens. Despre functia pondere asistemului se mai poate spune cǎ trebuie sǎ fie nulǎ pentru timpi negativideoarece, altfel, sistemul nu ar fi cauzal, adicǎ ar exista iesire/rǎspuns fǎrǎ casistemului sǎ i se aplice o intrare/excitatie, rǎspunsul h(t) ar premerge intrarea δ(t), ceea ce pentru sistemele naturale este absurd. Intrarea u(t) se considerǎ, deasemena, nulǎ înainte de momentul t0. În aceste conditii limitele integralei demai sus pot fi puse infinite fǎrǎ ca rezultatul sǎ se schimbe:

∫∞

∞−

−= τττ duthty )()()(

Functia pondere contine informatii privind stabilitatea sistemului. Astfel,

sistemul este stabil dacǎ si numai dacǎ integrala ∫∞

0

)( dtth este mǎrginitǎ.

În conditiile deplasǎrii momentului initial în originea timpului, expresia intrare-iesire datǎ mai devreme are un echivalent în spatiul operational

Y(s) = H(s)U(s)cu Y(s), H(s), U(s) transformatele Laplace respectiv ale functiilor y(t), h(t), u(t).Functia H(s) se mai numeste în aceste conditii si functia de transfer asistemului.

70

Page 71: Gheorghe M.Panaitescu - ac.upg-ploiesti.roac.upg-ploiesti.ro/gpanaitescu/msds_2007.pdf · •Retele neuronale •Retele neuronale artificiale stratificate •Analiza multirezolutie

Modele matematice în domeniul frecventelor

Studiul dinamicii sistemelor poate fi efectuat si prin examinarea rǎspunsului lorla intrǎri particulare pe care în paragraful curent vor fi numite semnale. Dacǎsemnalul aplicat la intrare este sinusoidal este aproape de la sine înteles cǎpentru un sistem liniar se obtine la iesire o sinusoidǎ de aceeasi frecventǎ, îngeneral de altǎ amplitudine si altǎ fazǎ. Alte frecvente nu pot apǎrea decǎt dacǎsistemul este neliniar.O intrare sinusoidalǎ se poate reprezenta în mai multe moduri. Modul cel maicomun este cel sub formele A sin(ω t + ϕ) sau A cos(ω t + ϕ) care pun înevidentǎ o amplitudine, o frecventǎ si o fazǎ. O altǎ reprezentare este cea subforma exponentialǎ Aej(ω t + ϕ). Desigur, A, ω si ϕ nu sunt aceleasi în toateexprimǎrile dar marcheazǎ de fiecare datǎ respectiv o amplitudine, o frecventǎsi o fazǎ. Prin observarea reactiei sistemului la mai multe frecvente se potobtine asa-numitele caracteristici dinamice de frecventǎ ale acelui sistem.Mijlocul matematic principal pentru studiul caracteristicilor dinamice defrecventǎ este transformarea Fourier.Fie functia de timp f(t) denumitǎ generic semnal. Transformata Fourier a unuisemnal este prin definitie

∫+∞

∞−

−= dtetfjF tjωω )()(

Pentru ca integrala de mai sus sǎ existe, semnalul f(t) trebuie sǎ îndeplineascǎanumite conditii. Acestea sunt conditiile lui Dirichlet cu referire la oriceinterval finit si constau în: a) mǎrginire si numǎr finit de discontinuitǎti; b)existenta unei partitii finite a oricǎrui interval finit astfel încât pe oricesubinterval al partitiei functia sǎ fie monotonǎ. Se întelege cǎ discontinuitǎtilesunt numai de prima specie. Valoarea functiei sau a semnalului într-unasemenea punct se considerǎ a fi egalǎ cu media aritmeticǎ a limitelor lateraleîn acel punct. Conditia a doua se poate citi si altfel: semnalul pe orice intervalfinit are cel mult un numǎr finit de extreme.Se mai cere ca functia f(t) sǎ fie absolut integrabilǎ pe axa realǎ, adicǎ integrala

∫+∞

∞−

dttf )( sǎ existe sau, cum se mai spune, sǎ fie convergentǎ.

Existǎ o transformare Fourier inversǎ care permite revenirea la functia de timp

∫+∞

∞−

= ωωπ

ω dejFtf tj)(21)(

Perechea f(t), F(jω) reprezintǎ douǎ expresii ale aceluiasi semnal în domeniultimp, respectiv în domeniul frecventǎ. Oricare dintre ele descrie completsemnalul si trecerea de la o formǎ la cealaltǎ se face pe calea transformǎriiFourier directe sau inverse. Semnificatia transformatei Fourier F(jω) a unui

71

Page 72: Gheorghe M.Panaitescu - ac.upg-ploiesti.roac.upg-ploiesti.ro/gpanaitescu/msds_2007.pdf · •Retele neuronale •Retele neuronale artificiale stratificate •Analiza multirezolutie

semnal, pentru o frecventǎ fixatǎ este urmǎtoarea: functia complexǎ F(jω) esteun numǎr complex cu un modul si o fazǎ

)()()()()( ωωωωω jjejFjjQjPjF Φ=+=calculate dupǎ regulile bine cunoscute din algebra numerelor complexe. Prinmodificarea frecventei se obtin diferite module si diferite faze. Pentru unsemnal dat se poate vorbi asadar de un spectru de amplitudini, de un spectru defaze.O valoare importantǎ relativ la un semnal este datǎ de integrala

[ ]∫+∞

∞−

= dttfE 2)(

care are caracteristicile unei energii. Un calcul care face uz de expresiasemnalului în domeniul frecventǎ produce rezultatul urmǎtor

∫∫

∫ ∫∫ ∫∞+

∞−

∞+

∞−

+∞

∞−

+∞

∞−

+∞

∞−

+∞

∞−

=−=

=

=

=

ωωπ

ωωωπ

ωωπ

ωωπ

ωω

djFdjFjF

ddtetfjFdtdejFtfE tjtj

2)(21)()(

21

)()(21)(

21)(

o relatie care este cunoscutǎ si sub numele de teorema lui Parseval. Osemnificatie de retinut are expresia

πωω 2/)( 2 djFcare este o fractiune din energia functiei/semnalului f(t) asociatǎ intervalului defrecvete infinitesimal [ω/2π, (ω + dω)/2π]. Pǎtratul modulului transformateiFourier apare, asadar, ca o densitate spectralǎ de energie, o functie parǎ defrecventa unghiularǎ ω. Se poate vorbi, asadar, de un spectru de puteri al unuisemnal.Modelul matematic intrare-iesire în domeniul timp discutat mai devreme

∫∞

∞−

−= τττ duthty )()()(

are un echivalent în domeniul frecventelor, care aratǎ ca un produs de imaginiprin transformarea Fourier

Y(jω) = H(jω)U(jω)Calitatea de semnale a functiilor de timp y(t), u(t), h(t), ultima în conditii decauzalitate este folositǎ pentru a lucra cu imaginile lor în domeniul frecventelor.Functia H(jω) se numeste din nou functie de transfer. Functia de transfer cafunctie cu valori complexe are un modul si o fazǎ proprie. Multiplicarea dinrelatia ultimǎ, model al dinamicii sistemului în domeniul frecventelor modificǎamplitudinea intrǎrii prin multiplicare de module, modificǎ faza intrǎrii prinadunare de exponenti.

72

Page 73: Gheorghe M.Panaitescu - ac.upg-ploiesti.roac.upg-ploiesti.ro/gpanaitescu/msds_2007.pdf · •Retele neuronale •Retele neuronale artificiale stratificate •Analiza multirezolutie

Transformarea Fourier prezentatǎ sumar mai devreme este de fapt odescompunere a functiei/semnalului în raport cu o bazǎ de functii/semnale maisimple, semnalele sinusoidale. Semnalele care alcǎtuiesc baza au si proprietateade ortogonalitate deoarece

021 =∫+∞

∞−

− dtee tjtj ωω

ori de câte ori cele douǎ frecvente ω 1 si ω 2 sunt diferite.Descompunerea Fourier, desi este o transformare de referintǎ nu este singuradescompunere posibilǎ a unui semnal.Semnalele de duratǎ finitǎ sau definite pe suport compact, cum se mai spune sepot descompune într-o bazǎ de functii diferitǎ. Functiile pot fi ortogonale sauchiar ortonormale pe intervalul de timp pe care semnalul este definit.În conditiile suprapunerii unor perturbatii de naturǎ aleatoare, foarteconvenabilǎ este descompunerea Karhunen-Loève. Baza este constituitǎ în acestcaz din functiile proprii ale unui anumit operator integral.Semnalele de bandǎ limitatǎ, acele semnale pentru care spectrul de amplitudinieste nul sau neglijabil dincolo de o anumitǎ frecventǎ pot fi descompuse prinraportare la o bazǎ alcǎtuitǎ din asa-numitele functii esantion. Relativ la functiaesantion centralǎ

WtWtts

ππ

22sin)(0 =

si la functiile celelalte care completeazǎ baza, obtinute prin translatie pe axatimpului cu multipli întregi ai intervalului 1/2W

Zn

WntW

WntW

tsn ∈

= ,

22

22sin

)(π

π

se enuntǎ o teoremǎ de esantionare care spune cǎ un semnal de bandǎ limitatǎpoate fi reconstituit din esantioanele sale prelevate la intervale regulate,distantate la 1/2W dacǎ mǎrimea W este mai mare sau cel putin egalǎ cufrecventa maximǎ din spectrul semnalului. Dacǎ semnalul este notat încontinuare cu f(t) atunci relatia de reconstituire este

∑∞+

−∞=

=

n

WntW

WntW

Wnftf

22

22sin

2)(

π

π

în care se identificǎ functiile esantion multiplicate cu esantioanele functiei-semnal în momentele n/2W, cu n întreg. O formulare complementarǎ în cazulcând W este exact frecventa limitǎ superioarǎ a spectrului este urmǎtoarea:

73

Page 74: Gheorghe M.Panaitescu - ac.upg-ploiesti.roac.upg-ploiesti.ro/gpanaitescu/msds_2007.pdf · •Retele neuronale •Retele neuronale artificiale stratificate •Analiza multirezolutie

semnalul poate fi reconstituit din esantioanele sale dacǎ acestea sunt prelevatemai frecvent decǎt dublul frecventei W sau la intervale de timp regulate maiscurte decât 1/2W.Teorema esantionǎrii se poate pune în legǎturǎ cu problema discretizǎrii unuisistem dinamic cu variatie continuǎ în timp. Se poate estima bandasemnificativǎ de frecvente a unui sistem, se pot evidentia benzile de frecventeale semnalelor care actioneazǎ asupra sistemului sau sunt observate relativ ladinamica lui. Aceste mǎrimi fiind evaluate, se poate stabili intervalul potrivit dediscretizare care sǎ poatǎ servi la conducerea sistemului.

Trecerea de la modelul liniar de tip ecuatii de stare – ecuatii de observarela modelul tip intrare-iesireCu notatiile întrucâtva modificate, ecuatiile model în domeniul operational, învarianta ecuatii de stare – ecuatii de observare sunt

)()()0()( sBUsAXxssX +=−)()()( sDUsCXsY +=

sau, într-o scriere matricialǎ

=

−)(

)0()(

)(sY

xsU

sXDCBAsI n

Sunt adǎugate aici ca observate/mǎsurate si intrǎrile sistemului.Matricea

−=

DCBAsI

sT n)(

este denumitǎ matricea sistemului. Matricea de transfer se deduce direct dinrelatiile de mai sus

DBAsICsM n +−= −1)()(si corespunde, dacǎ intrǎrile sunt nule pânǎ la momentul initial, ecuatiei

)()()( sUsMsY =la care, cu notatii usor diferite, s-a fǎcut referire într-un paragraf precedent.Dacǎ Ci este linia i a matricei C si Bj este coloana j a matricei B, atunci, cunotatiile mij(s), respectiv dij pentru elementele matricilor M(s) si D, i = 1, 2, ...,n, j = 1, 2, ..., l, exprimarea elementelor matricii de transfer M(s) este

ijjniij dBAsICsm +−= −1)()(sau încǎ

)det()(

,,...,2,1.,..,2,1

AsIT

smn

innjnn

ij −=

++

cu numǎrǎtorul fractiei minorul matricei T(s) alcǎtuit din liniile 1, 2, ..., n, n + i si din coloanele 1, 2, ..., n, n + j. Pe aceastǎ cale se poate trece de la formastandard ecuatii de stare – ecuatii de observare la forma intrare-iesire.

74

Page 75: Gheorghe M.Panaitescu - ac.upg-ploiesti.roac.upg-ploiesti.ro/gpanaitescu/msds_2007.pdf · •Retele neuronale •Retele neuronale artificiale stratificate •Analiza multirezolutie

Ca exemplu, fie sistemul de ordinul doi cu matricile din modelul ecuatii destare – ecuatii de observare

=

=

−=

−−

=0000

,1011

,0110

,21

10DCBA

Matricea sistemului si determinantul matricei de inversat (sI2 – A) sunt atunci

22 )1()det(,

001000110121101

)( +=−

−−−+

−−

= sAsIs

s

sT

si elementele matricei de transfer M(s), care rezultǎ din calcul sunt

11

01112101

)1(1)(

211 +=

−−+−

+=

ss

s

ssm

11

01102111

)1(1)(

212 +−=

−−+

−−

+=

ss

s

ssm

2221 )1(01012101

)1(1)(

+=

−+−

+=

sss

s

ssm

2222 )1(1

01002111

)1(1)(

+=

−+

−−

+=

ss

s

ssm

Matricea M(s) se spune cǎ este proprie dacǎ are limita nulǎ când variabilaoperationalǎ tinde cǎtre infinit sau, echivalent, dacǎ matricea de transfer directD este nulǎ. O proprietate importantǎ: determinantul matricii de transfer M(s)este egal cu determinantul matricii T(s) divizat prin polinomul caracteristic almatricii A. Într-adevǎr, conform formulei lui Schur

)det(detdet 1 WUVTTWVUT

+=

de unde rezultǎ1)])[det((det)(det −−= AsIsTsM n

În cazul particular al unui sistem cu o singurǎ intrare si o singurǎ iesire (SISO)DBAsICsF n +−= −1)()(

75

Page 76: Gheorghe M.Panaitescu - ac.upg-ploiesti.roac.upg-ploiesti.ro/gpanaitescu/msds_2007.pdf · •Retele neuronale •Retele neuronale artificiale stratificate •Analiza multirezolutie

)()(

)()(

)()()( 1

sUsY

ssN

DssNsF =

∆=+

∆=

cu)det()( AsIs n −=∆

DCBAsI

sDsNsN n

−−

=∆+= )(.)()(1

0)(

CBAsI

sN n

−−

=

Calculul inversei (sIn – A)–1 tine seama de expresia polinomului caracteristic01

11 ...)det()( asasasAsIs n

nn

n ++++=−=∆ −−

Se pune

)(...

)()()( 01

111

sVsVsV

ssVAsI

nn

n ∆+++

=∆

=−−

−−

cu Vi, i = 1, 2, ..., n –1 matrici )( nn × cu elemente reale, obtinute recursiv prinidentificarea termenilor de acelasi grad din relatia

)...)((... 011

1011

1 VsVsVAsIIasIaIsaIs nnnnnn

nnn

n +++−=++++ −−

−−

Formulele lui Newton produc coeficientii ai, i = 1, 2, ..., n –1. Astfel11 σ−=−=− trAan

. . . . . . . . . .

]...[11111 σσσ +−−−− +++−= knknkkn aa

ka

. . . . . . . . . .

]...[111110 σσσ aa

na nnn +++−= −−

cu notatia obisnuitǎ σi = tr Ai, urma matricei Ai. Algoritmul propriu-zis estenn IV =−1 )( 11 AVtra nn −− −=

nnnn IaAVV 112 −−− += )()2/1( 22 AVtra nn −− −=

nnnn IaAVV 223 −−− += )()3/1( 33 AVtra nn −− −=. . . . . . . . . . . . . . . . . . . . . . . .

nininin IaAVV 11 +−+−− += )()/1( AVtria inin −− −=. . . . . . . . . . . . . . . . . . . . . . . .

nIaAVV 110 += )()/1( 00 AVtrna −=

si o ultimǎ relatienIaAVV 001 0 +==−

care poate servi ca verificare.

76

Page 77: Gheorghe M.Panaitescu - ac.upg-ploiesti.roac.upg-ploiesti.ro/gpanaitescu/msds_2007.pdf · •Retele neuronale •Retele neuronale artificiale stratificate •Analiza multirezolutie

Trecerea de la modelul liniar de tip intrare-iesire la modelul tip ecuatii destare – ecuatii de observare

Fie un sistem dinamic descris de ecuatiile

)()()( tGutFxdt

tdx +=

)()( tHxty =cu vectorul variabilelor de stare n-dimensional. Prin definitie el este completcontrolabil dacǎ matricea

[ ]GFGFFGG n 12 −

are rangul n. Controlabilitatea echivaleazǎ cu posibilitatea de a ajunge în oricestare a sistemului, pornind de la orice stare initialǎ, în timp finit, prin aplicareaunor intrǎri (printr-o actiune de comandǎ). Sistemul este complet observabildacǎ matricea

[ ]TnTTTTTT HFHFHFH 12 )()( −

are rangul n. Observabilitatea reprezintǎ reflectarea în iesirile y(t) a oricǎreimodificǎri în starea sistemului. Identificarea din date intrare-iesire este posibilǎpentru sistemele complet controlabile si complet observabile. În cazulcontrolabilitǎtii partiale si/sau observabilitǎtii partiale se poate identifica,eventual, acea parte a sistemului care este simultan controlabilǎ si observabilǎ.Realizǎri ale unui sistem dinamic, realizarea minimalǎ. Un sistem cu o intraresi o iesire este desigur mai simplu de tratat matematic. Rezultatele sunt însǎextrapolabile la cazul mai general al sistemelor cu mai multe intrǎri si maimulte iesiri. Pentru cazul simplu mentionat modelul se prezintǎ sub forma

)()()( tgutFxdt

tdx +=

)()( thxty =cu g si h vectori de dimensiuni adecvate.Un triplet (F, g, h) se numeste o realizare a sistemului. Realizarea estecanonicǎ dacǎ ea reprezintǎ un sistem atât complet controlabil cât si completobservabil. Realizǎrile canonice diferǎ între ele numai printr-o schimbare debazǎ în spatiul variabilelor de stare. O altǎ realizare canonicǎ (F1, g1, h1) seobtine prin relatiile F1 = TFT –1, g1 = gT si h1 = hT –1, cu T o matrice asociatǎunei transformǎri liniare nedegenerate. Functia de transfer a sistemului îndomeniul complex are expresia

gFsIhs 1)()( −−=Φcu 0)( =∞Φ . Rǎspunsul sistemului la intrarea impuls este

gFthty )exp()(0 =

77

Page 78: Gheorghe M.Panaitescu - ac.upg-ploiesti.roac.upg-ploiesti.ro/gpanaitescu/msds_2007.pdf · •Retele neuronale •Retele neuronale artificiale stratificate •Analiza multirezolutie

Dezvoltǎrile în serie Taylor ale functiilor de mai sus, prima în jurul punctului s= ∞, a doua în jurul originii timpului t = 0, sunt date de expresiile

∑∞

=

−−=Φ0

1)(k

kk sYs

∑∞

=

=0

0 !)(

k

k

k ktYty

si pun în evidentǎ coeficientii Yk (k = 0, 1, 2, ...) cunoscuti sub numele deparametri Markov. Prin derivarea dezvoltǎrii ultime se obtine relatia generalǎ

ghFdt

tydY k

k

k

k ==)(0

cu derivatele luate în origine. Ultima relatie leagǎ tripletul realizǎrii (F, g, h) deparametrii Markov.Realizare completǎ minimalǎ. Fiind dat un sir Y0, Y1, Y2, ... de parametriMarkov, tripletul (F, g, h) este o realizare completǎ minimalǎ dacǎ

(i) ghFY kk = pentru k = 0, 1, 2, …

(ii) n este minimRealizare partialǎ minimalǎ. Fiind datǎ o secventǎ finitǎ Y0, Y1, Y2, ..., YM – 1de parametri Markov, tripletul (F, g, h) este o realizare partialǎ minimalǎ dacǎ

(i) ghFY kk = pentru k = 0, 1, 2, …, M – 1

(ii) nM este minimRealizǎrile minimale partiale sunt mai utile din punct de vedere practicdeoarece, dacǎ evaluarea se bazeazǎ pe date experimentale, numai un numǎrfinit de parametri Markov pot fi evaluati în conditii de sigurantǎ. Pe de altǎparte, admiterea tacitǎ a ipotezei liniaritǎtii si invarianţei sistemului trebuielimitatǎ la un interval de timp rezonabil.Teoremǎ: Sirul Y0, Y1, Y2, ... genereazǎ o realizare finit dimensionalǎ dacǎ sinumai dacǎ existǎ un întreg n si n constante α1, α2, ..., αn astfel încât

∑=

+−+ =n

ijinijn YY

1

α

pentru toti j ≥ 0. Numǎrul n este în acest caz dimensiunea realizǎrii minimale siαi sunt coeficientii polinomului caracteristic. Pentru o secventǎ finitǎ deparametri Markov se preferǎ exprimarea în raport cu matricea Hankel

=

−+−

21

21

110

),(

jijj

i

i

YYY

YYYYYY

jiH

unde i, j = 1, 2, ...

78

Page 79: Gheorghe M.Panaitescu - ac.upg-ploiesti.roac.upg-ploiesti.ro/gpanaitescu/msds_2007.pdf · •Retele neuronale •Retele neuronale artificiale stratificate •Analiza multirezolutie

Teoremǎ: O secventǎ finitǎ de parametri Markov Y0, Y1, Y2, ..., YM – 1genereazǎ o realizare partialǎ minimalǎ, care este esential unicǎ (exceptând oschimbare de bazǎ în spatiul variabilelor de stare) dacǎ si numai dacǎ existǎîntregii pozitivi α si β astfel încât

(i) α + β = M(ii) rang Hβα = rang Hβ+1α = rang Hβα+1

Dimensiunea nM a realizǎrii este în acest caz rangul matricii Hβα. Realizareaobtinutǎ pe aceastǎ cale genereazǎ un sir de parametri Markov dincolo depozitia M – 1 din sir.Legǎtura între matricea Hankel si sistemul descris de tripletul (F, g, h) estediscutatǎ imediat. Matricea

[ ]gFgFFggQ jj

12 −=

este parte din matricea de controlabilitate, iar matricea[ ]TiTTTTTT

i hFhFhFhR 12 )()( −=

este parte din matricea de observabilitate. Acum se poate verifica usorfactorizarea

H(i, j) = Ri Qj

Asadar, sub aspect algebric, problema realizǎrii implicǎ o factorizare a uneimatrici Hankel în o matrice de controlabilitate si una de observabilitate

H(n, n) = Rn Qn

si câte factorizǎri, atâtea realizǎri canonice.În continuare sunt prezentati algoritmii de trecere de la functia de transfer larealizarea minimalǎ.Formularea problemei. Fiind datǎ o secventǎ finitǎ si partialǎ de parametriMarkov Y0, Y1, Y2, ..., YN, N = 1, 2, 3, ... sǎ se gǎseascǎ o secventǎ de realizǎripartiale minimale (Fn, gn, hn) astfel încât dacǎ numerele naturale M, N sunt înrelatia M < N atunci ),,(),,( NNNMMM hgFhgF ≤ . Ultima relatie de inegalitatetrebuie înteleasǎ astfel: matricile cu indicele M se regǎsesc ca submatrici înmatricile cu indicele N. Algoritmul cerut este în esentǎ recursiv.Algoritmul lui Rissanen factorizeazǎ portiuni din ce în ce mai mari din matriceaHankel

H n m R n n Q n m( , ) ( , ) ( , )+ = + + +1 1 1 1m > n si rang H n m n( , )+ ≥1 , astfel încât matricea R(n + 1, n + 1) este inferiortriunghiularǎ cu 1 pe diagonalǎ. Se adoptǎ o schemǎ de calcul de tipul eliminǎriiGauss. Ultima linie din matricea H este dependentǎ liniar de celelalte dacǎ sinumai dacǎ ultima linie din Q este o linie de zerouri.Exemplu: Secventa de parametri Markov 0, 1, –10, 98, –974, 9726, –97230,pentru covenientǎ alcǎtuitǎ din numere intregi produce succesiunea de evaluǎriprezentatǎ în continuare.În prima etapǎ

H R Q( , )2 2 2 2=

79

Page 80: Gheorghe M.Panaitescu - ac.upg-ploiesti.roac.upg-ploiesti.ro/gpanaitescu/msds_2007.pdf · •Retele neuronale •Retele neuronale artificiale stratificate •Analiza multirezolutie

0 11 10

11

0 1−

=

x a b.

Matricea R2 se construieste inferior triunghiularǎ cu 1 pe diagonalǎ. Pe primalinie a matricii Q2 se trec parametri Markov din secventa datǎ, în ordine.Rezultǎ imediat a = 1. Se pune b = 0 deoarece o alegere trebuie fǎcutǎ întrucâtecuatiile sunt mai putine decât necunoscutele. Rezultǎ imediat x = –10.În etapa a doua

33)3,3( QRH =

0 1 101 10 9810 98 974

110 1

1

0 1 101 00 0

−−

− −

= −

x y

ab

.

Matricea R3 se construieste inferior triunghiularǎ cu 1 pe diagonalǎ. Pe primalinie a matricii Q3 se trec parametri Markov din secventa datǎ, în ordine.Coloanele din Q3 care contin cel putin un element nenul deja stabilit secompleteazǎ cu zerouri. Exceptie face coloana ultimǎ. Rezultǎ mai întâi x = 98,y = –10, apoi a = –2 si b = –14.În etapa urmǎtoare

H R Q( , )4 4 4 4=

−−−

−−

=

=

−−−−

−−−

cba

zyx 0001400201

981010

.

111098

1101

9723097269749897269749810

97498101981010

Matricea R4 se construieste la fel ca mai sus, inferior triunghiularǎ cu 1 pediagonalǎ. Pe prima linie a matricii Q4 se trec parametri Markov din secventadatǎ, în ordine. Coloanele din Q4 în care existǎ cel putin un element nenul dejastabilit se completeazǎ cu zerouri, cu exceptia ultimei coloane. Rezultǎ maiîntâi x = –974, y = 98, z = –13, apoi a = 6, b = 182, c = 0. Algoritmul se încheieaici. Linia ultimǎ din Q4 este alcǎtuitǎ numai din zerouri ceea ce aratǎ faptul cǎultima linie din H(4, 4) este dependentǎ liniar de celelalte. Conditiile dinteorema enuntatǎ mai devreme au fost atinse.

80

Page 81: Gheorghe M.Panaitescu - ac.upg-ploiesti.roac.upg-ploiesti.ro/gpanaitescu/msds_2007.pdf · •Retele neuronale •Retele neuronale artificiale stratificate •Analiza multirezolutie

−−−

−−−

−=

=

−−−−

−−−

00001821400

6201981010

.

1139897411098

1101

9723097269749897269749810

97498101981010

Realizarea urmǎritǎ se extrage din ultima egalitate matricialǎ pe baza relatiilorcare urmeazǎ

F R R= −3

130

cu R03 obtinut din R4 prin omiterea primei linii si a ultimei coloane,

gT = [ ]0 1 0nu altceva decât prima coloanǎ din Q3 si

h = [ ]1 0 0prima linie din R3. Dimensiunea realizǎrii este n = 3.Se cuvine a fi fǎcut un comentariu: ce înseamnǎ zerouri în ultima linie din Qn+1?O parte din zerouri, primele n, sunt introduse prin algoritm. Ultimul zerotrebuie interpretat ca un element qn+1n+1 mic în raport cu o normǎ a vectoruluiconstituit din elementele ultimei coloane din Qn+1, de pildǎ suma modulelor

primelor n elemente ale acelei coloane qi ni

n

+=∑ 1

1. Un zero în pozitia (n +1, n +1)

ar putea însemnaq

q

n n

i ni

n+ +

+=∑

<1 1

11

ε

cu ε fixat/propus convenabil.Algoritmul general. Fie secventa Y0, Y1, Y2, ..., YN N = 1, 2, 3, ...1. Fie k cel mai mic numǎr natural pentru care 0>kY . Se pune N = 2k +1 si seformeazǎ matricea Hankel H(k +1, k +1). Aceasta are rangul cel putin egal cu k.2. Se aplicǎ algoritmul de factorizare si se determinǎ Rk+1 si Qk+1. Dacǎ liniaultimǎ a matricei Qk+1 nu este în totalitate alcǎtuitǎ din zerouri atuncirangH k k k( , )+ + = +1 1 1 . Se mǎreste N cu douǎ unitǎti si se realizeazǎmatricea Hankel H(k + 2, k + 2) si se continuǎ cu factorizarea. Pasul se repetǎpânǎ când, la un N = 2n +1, ultima linie din matricea Qn+1 este în esentǎ nulǎ.Dimensiunea si ordinul sistemului este n.3. Relatia

81

Page 82: Gheorghe M.Panaitescu - ac.upg-ploiesti.roac.upg-ploiesti.ro/gpanaitescu/msds_2007.pdf · •Retele neuronale •Retele neuronale artificiale stratificate •Analiza multirezolutie

F R Rn n= −1 0

dǎ matricea principalǎ a realizǎrii care este de dimensiune n. Inversa matricei Rn

se poate calcula recursiv deoarece este triunghiularǎ ca si precedenta, Rn–1.Matricile g si h sunt respectiv prima coloanǎ din Qn, prima linie din Rn.4. Dacǎ se aduc în secventǎ parametri Markov noi sau îmbunǎtǎtiti se reiacalculul din punctul unde matricea Hankel s-a modificat din cauza noilor valori.În fiecare etapǎ a procedurii recursive de calcul al realizǎrii partiale minimale,matricea Q este matricea de controlabilitate a sistemului

Q g Fg F g= [ ...]2

Evolutia stǎrii sistemului pornind de la starea initialǎ datǎ de vectorul x(0) = 0,la aplicarea impulsului δ(t) este datǎ de expresia

x(t) = exp(Ft)gcare dezvoltatǎ în serie Taylor în jurul punctului t = 0 devine

x t g Fgt F g t( ) ...= + + +22

2!coeficientul Fkg este cea de a k derivatǎ în origine a rǎspunsului respectiv.Liniile matricei Q rezultatǎ din algoritmul prezentat mai sus sunt componenteale rǎspunsului în stare scris mai devreme. Sunt ignorate sau neglijate acelecomponente care sunt sub un ε selectat mai sus. Este vorba de o aproximareinginereascǎ printr-un model de dimensiune redusǎ, într-o manierǎalgoritmizatǎ foarte convenabilǎ.Încǎ un rezultat este demn de retinut. Dacǎ H(n + 1, n + 1) = Rn+1Qn+1 si ultimalinie din Qn+1 este formatǎ din zerouri atunci din scrierea

R–1h = QF = R–1R0

care conchide algoritmul, scriere permisǎ deoarece R este nesingularǎ princonstructie, face ca pe ultima linie a inversei matricei R sǎ aparǎ coeficientiipolinomului caracteristic al matricii F. Este un rezultat asteptat în conformitatecu teorema Hamilton-Cayley. În cazul exemplificat

R41

110 12 10 120 32 13 1

− =

si polinomul caracteristic este s3 + 13s2 + 32s + 20

Practic este greu de realizat intrǎri idealizate cum sunt impulsul unitar, saltultreaptǎ etc. Se recurge uzual la intrǎri care se pot realiza experimental. Acesteasunt de obicei mǎsurate sau observate la intervale regulate de timp t0, t1, …, tn.Tot asa si iesirea sistemului. Intrarea naturalǎ ca si rǎspunsul sistemului la

82

Page 83: Gheorghe M.Panaitescu - ac.upg-ploiesti.roac.upg-ploiesti.ro/gpanaitescu/msds_2007.pdf · •Retele neuronale •Retele neuronale artificiale stratificate •Analiza multirezolutie

actiunea ei se pot aproxima liniar între oricare douǎ momente succesive deobservare ti, ti+1. Într-o asemenea tratare, transformatele lor Laplace sunt

U ss

a sti ii

n

( ) exp( )= −=∑1

20

respectiv

Y ss

b sti ii

m

( ) exp( )= −=∑1

20

uzual cu m > n si cu a0 = (u1 – u0)/∆t, ai = (ui+1 – 2ui + ui–1)/∆t (i = 1, 2, ..., n – 1)si an = (un–1 – un)/∆t. Formule similare se folosesc si pentru coeficientii bi. Seobtine apoi functia de transfer Y(s)/U(s) care, pentru parametrii Markov, artrebui dezvoltatǎ în serie Taylor în jurul punctului s = ∞, operatie practic maidificilǎ decât s-ar pǎrea la prima vedere. Este preferabil sǎ se recurgǎ latransformarea Laplace inversǎ si sǎ se obtinǎ functia pondere, rǎspunsul îndomeniul timp la perturbatia δ(t), impuls unitar. Tabelele de echivalente de ladomeniul timp la domeniul Laplace nu contin decât un numǎr fatalmente limitatde perechi f t F s( ) ( )↔ . Se recurge la metode numerice de calculat inversaLaplace a functiei Y(s)/U(s). De pildǎ, metoda lui Stehfest cuprinsǎ în formula

f t eroaret

V F iti

i

N

( ) ln ( ln )+ ==

∑2 21

cu N par arbitrar dar legat de precizia de calcul (numǎrul de digiti semnificativicu care se lucreazǎ) si cu

+

=

+

−−−

+

−=2

,min

21

22

)!2()!()!1(!!2

)!2()1(

Ni

ik

N

iN

i

ikkikkkNkkV

Functia pondere obtinutǎ se poate interpola polinomial, pentru usurareacalculelor cu polinoame ortogonale si se pot obtine apoi parametrii Markov.

Probleme

Problema 1.Se dǎ functia de timp

[ )[ )

[ ) [ )( )

∪−−∈∈

−∈−=

τττ

τ

,00,0,01

0,1)(

Rtt

ttf

Pe baza proprietǎtilor transformǎrii Fourier (liniaritate, efectul translatiei pe axatimpului) si folosind transformata functiei rectangulare egalǎ cu unitatea pe

83

Page 84: Gheorghe M.Panaitescu - ac.upg-ploiesti.roac.upg-ploiesti.ro/gpanaitescu/msds_2007.pdf · •Retele neuronale •Retele neuronale artificiale stratificate •Analiza multirezolutie

intervalul

2,

2ττ

si nulǎ în rest, scrieti transformata Fourier a functiei date.

Estimati frecventa (frecventele) cu cea mai mare valoare în spectrul deamplitudini? Date numerice: τ = 1 + 1/p.Solutie. Impulsul rectangular de amplitudine 1/τ, simetric fatǎ de originea t = 0si de duratǎ τ are transformata Fourier

2

2sin

)(ωτ

ωτ

ω =jF

Semnalul propus este suma a douǎ semnale: un impuls rectangular ca acela demai sus, dar de altǎ amplitudine si întârziat cu τ/2 si unul similar dar negativ sidecalat (anticipativ) cu –τ/2. Asadar, abstractie fǎcând de un acelasi coeficientconstant (τ), transformatele Fourier ale acestor semnale sunt

2

2

2sin ωτ

ωτ

ωτj

e−

, respectiv 2

2

2sin ωτ

ωτ

ωτj

e−

Transformarea Fourier este liniarǎ si prin urmare suma celor douǎ semnale areca transformatǎ suma transformatelor celor douǎ semnale

−22

2

2sin ωτωτ

ωτ

ωτjj

ee

Paranteza contine o diferentǎ de exponentiale care poate fi rescrisǎ, recurgând launa din formulele lui Euler, sub forma

2sin2 ωτj−

În consecintǎ, transformata Fourier a semnalului din enunt este

ωτωττ

ωτ

ωτ

τ cos12

2

2sin

22

−−=− jj

Extremele (modulului) acestei functii, cele între care se aflǎ si extremele deamplitudine cerute în enunt sunt situate în punctele de anulare a derivatei.Functia

xxcos1−

84

Page 85: Gheorghe M.Panaitescu - ac.upg-ploiesti.roac.upg-ploiesti.ro/gpanaitescu/msds_2007.pdf · •Retele neuronale •Retele neuronale artificiale stratificate •Analiza multirezolutie

-10 -8 -6 -4 -2 0 2 4 6 8 10-1.5

-1

-0.5

0

0.5

1

1.5

om ega*tau

Va

loa

rea

fu

nc

tie

i/va

loa

rea

de

riva

tei

are derivata

2

1cossinx

xxx −+

si nulurile ei coincid cu nulurile numǎrǎtorului fractiei. Rezolvarea ecuatieirespective se face numeric, cel putin partial. O parte din solutii se pot aflaanalitic având în vedere scrierea

02

sin2

cos2

sin22

sin22

cos2

sin21cossin 2 =

−=−=−+ xxxxxxxxxxx

Graficul alǎturat dǎ o idee asupra pozitiei pe axa frecventelor a rǎdǎcinilorderivatei (a se observa curba care nu depǎseste în modul valoarea 0,5). Valorilecare anuleazǎ primul factor din descompunerea de mai sus nu corespund unormaxime de amplitudune. De fapt în acele puncte transformata Fourier seanuleazǎ. Amplitudinile cele mai mari sunt vizibile pe cealaltǎ curbǎ (care faceabstractie de faze) si sunt situate la aproximativ 33,2±=ωτ (calculul poate fifǎcut, desigur, si mai precis). Aceste rǎdǎcini sunt evaluate numeric si sunt alefactorului al doilea al descompunerii de mai devreme, cel din parantezǎ.Mai urmeazǎ acum o înlocuire a duratei τ cu valoarea ei particularǎ si calcululfrecventei cerute din relatia ω = 2πf.

Exercitii de autoevaluare

85

Page 86: Gheorghe M.Panaitescu - ac.upg-ploiesti.roac.upg-ploiesti.ro/gpanaitescu/msds_2007.pdf · •Retele neuronale •Retele neuronale artificiale stratificate •Analiza multirezolutie

1. Care din cele de mai jos este avantajul major ale trecerii modelelor de ladomeniul timp la domeniul complex?

a) lucrul cu numere complexe este mai comod decât cu numere reale,b) ecuatiile diferentiale liniare cu derivate ordinare sunt transformate în

ecuatii algebrice sauc) permite verificarea solutiilor în domeniul timp cu cele în domeniul

complex si reciproc?

2. Se dǎ functia +−∈

=restîn

ttts

0]2/,2/[cos

)( 000 ωπωπω, o functie care are

forma unui puls sinusoidal pozitiv, simetric fatǎ de originea timpului t = 0,parte a unei sinusoide de frecventǎ ω 0. Marcati în lista de mai jostransformata Fourier a acestui semnal.

a) [ ] [ ]

+

++−

00

00

00

00

0 2/)(2/)(sin

2/)(2/)(sin

2 ωωωπωωωπ

ωωωπωωωπ

ωπ

b) [ ]

00

00

0 2/)(2/)(sin

2 ωωωπωωωπ

ωπ

−−

c) [ ]

00

00

0 2/)(2/)(sin

2 ωωωπωωωπ

ωπ

++

3. Se dau functiile de timp/semnalele x(t), y(t) si transformatele lor Fourier X(ω), respectiv Y(ω). Functia

∫+∞

∞−

−= τττ dtayaxtc )]([)/()(

este o convolutie a celor douǎ semnale rescrise pentru scǎri ale timpuluimodificate prin comprimare si prin dilatare cu acelasi factor a > 0.Transformata Fourier a semnalului c(t) este:

a) X(ω)Y(ω); b) X(aω)Y(ω /a) sau c) X(ω /a)Y(aω)?4. Existǎ o legǎturǎ între teorema esantionǎrii si constantele de timp ale unui

sistem dinamic?a) nu, nu este nici o legǎturǎ;b) un sistem dinamic poate avea constante de timp multiple, frecventa

esantioanelor ar putea fi legatǎ de una dintre ele;c) un sistem poate fi privit si ca un filtru trece jos: el permite transferul

variatiilor lente (frecventele joase, constantele de timp mari) de laintrare la iesire si atenueazǎ considerabil variatiile rapide(frecventele înalte, constantele de timp mici) observate la iesire.Asadar, semnalele observate la iesirea sistemului pot fi consideratesemnale de bandǎ limitatǎ. Frecventa de esantionare definitǎ deteorema esantionǎrii este legatǎ nemijlocit de intervalul de timp dediscretizare a unui sistem de tipul continuu.

86

Page 87: Gheorghe M.Panaitescu - ac.upg-ploiesti.roac.upg-ploiesti.ro/gpanaitescu/msds_2007.pdf · •Retele neuronale •Retele neuronale artificiale stratificate •Analiza multirezolutie

5. Care din formele modelelor dinamicii sistemelor este mai apropiat deobservarea experimentalǎ a sistemelor?

a) forma ecuatii-de-stare-ecuatii-de-observare,b) forma de reprezentare în complex sauc) forma intrare-iesire?

87

Page 88: Gheorghe M.Panaitescu - ac.upg-ploiesti.roac.upg-ploiesti.ro/gpanaitescu/msds_2007.pdf · •Retele neuronale •Retele neuronale artificiale stratificate •Analiza multirezolutie

88

Page 89: Gheorghe M.Panaitescu - ac.upg-ploiesti.roac.upg-ploiesti.ro/gpanaitescu/msds_2007.pdf · •Retele neuronale •Retele neuronale artificiale stratificate •Analiza multirezolutie

ELEMENTE DE NATURǍ ALEATOARE ÎN DINAMICASISTEMELOR

• Spatiul evenimentelor • Probabilitǎti, probabilitǎti conditionate• Variabile aleatoare• Generarea de numere aleatoare • Raportul experiment – lege de repartitie teoreticǎ si verficarea legilor

de repartitie • Estimarea si verificarea parametrilor legii de repartitie teoretice • Estimarea de parametri în modelele sistemelor • Fenomene aleatoare dinamice • Modele dinamice stochastice • Modelul ARIMA • Forma Wiener-Kalman a modelelor pentru sisteme stochastice discrete • Estimarea recursivǎ a parametrilor unui model• Probleme• Exercitii de autoevaluare

Sistemele reale prezintǎ o serie de aspecte aleatoare datorate unor factori denaturi foarte diferite. O enumerare a lor, departe de a fi exhaustivǎ ar putea fi:Dacǎ starea unui sistem este numai partial controlabilǎ atunci parteanecontrolabilǎ poate evolua spontan si la întâmplare cu efect aleator asuprastǎrii întregului sistem.Unele intrǎri ale sistemelor sunt inevitabil fluctuante ceea ce influenteazǎ, deasemenea aleator, dinamica sistemului.Existǎ totdeuna erori mai mari sau mai mici în observarea si mǎsurareasistemului, erori care uneori pot fi importante.Unele fenomene fizico-chimice, definitorii pentru o anumitǎ categorie desisteme sunt în esentǎ de naturǎ statisticǎ.Ignorarea aspectelor de acest gen poate duce întelegerea sistemului si problemareglǎrii lui în impas. Remediul este unul singur: studiul atent al acestei laturi asistemelor dinamice. De aceea, în continuare sunt aduse în discutie mai întâicâteva complemente de teoria probabilitǎtilor si statisticǎ matematicǎ.

89

Page 90: Gheorghe M.Panaitescu - ac.upg-ploiesti.roac.upg-ploiesti.ro/gpanaitescu/msds_2007.pdf · •Retele neuronale •Retele neuronale artificiale stratificate •Analiza multirezolutie

Spatiul evenimentelor

Un experiment oarecare poate avea rezultate diverse. Aceste rezultate suntnumite în continuare evenimente. Astfel, rostogolirea unui zar perfect pe osuprafatǎ planǎ orizontalǎ poate avea ca rezultat aparitia pe fata de deasupra a,sǎ spunem, cinci puncte. S-a produs asadar evenimentul aparitiei deasupra afetei cu cinci puncte. Tot asa, conform definitiei de mai sus, extragerea valetuluide cupǎ dintr-un pachet de cǎrti de joc bine amestecat este un eveniment însensul definitiei date mai devreme.Fie E multimea evenimentelor posibile relativ la un experiment. Multimea Eeste numitǎ uneori spatiu al evenimentelor. Evenimentele unui astfel de spatiuse pot gǎsi în anumite relatii, cu evenimentele acelui spatiu se pot face uneleoperatii.O relatie importantǎ între evenimente este implicatia. Implicatia se noteazǎ

BA ⊂ si se citeste evenimentul A implicǎ evenimentul B, ceea ce înseamnǎ cǎproducerea evenimentului A conduce la producerea obligatorie a evenimentuluiB; implicatia reciprocǎ, BA ⊂ si AB ⊂ este un mod de a exprima egalitatea(echivalenta) a douǎ evenimente.Operatiile cu evenimente sunt unare sau binare. Operatia de luare a contraruluiunui eveniment dat este unarǎ, opereazǎ cu un singur eveniment. Reuniunea siintersectia de evenimente sunt operatii binare, lucreazǎ cu (cel putin) douǎevenimente.Luarea contrarului unui eveniment constǎ în considerarea acelui eveniment carese produce când nu se produce evenimentul al cǎrui contrar se exprimǎ. Dacǎevenimentul asupra cǎruia se opereazǎ este A atunci evenimentul contrar estenotat cu A . De ce se foloseste calificativul contrar se va explica dupǎ definireacelor douǎ operatii binare anuntate.Reuniunea a douǎ evenimente se noteazǎ BA ∪ si este evenimentul care constǎîn producerea a cel putin unuia din cele douǎ evenimente A, B.Intersectia a douǎ evenimente se noteazǎ BA ∩ si este evenimentul care constǎîn producerea deodatǎ a ambelor evenimente A si B.Existǎ douǎ evenimente speciale care se includ în multimea E. Unul esteevenimentul imposibil notat cu ∅ si celǎlalt este evenimentul sigur notat cu E,nu întâmplǎtor cu aceeasi literǎ ca si multimea de evenimente (o notatiealternativǎ: Ω). Evenimentul imposibil nu se produce niciodatǎ, evenimentulsigur se produce de fiecare datǎ.O relatie de forma A B∩ = ∅ exprimǎ incompatibilitatea reciprocǎ a douǎevenimente, adicǎ producerea unuia exclude producerea celuilalt.Acum se poate formula mai precis raportul între un eveniment si contrarul lui:A A∩ = ∅ , A A E∪ = . Cu alte cuvinte un eveniment este incompatibil cucontrarul sǎu, producerea unui eveniment sau a contrarului sǎu este sigurǎ. Este

90

Page 91: Gheorghe M.Panaitescu - ac.upg-ploiesti.roac.upg-ploiesti.ro/gpanaitescu/msds_2007.pdf · •Retele neuronale •Retele neuronale artificiale stratificate •Analiza multirezolutie

momentul sǎ fie adusǎ precizarea cǎ contrarul contrarului unui eveniment esteacel eveniment. Simbolic, A A= .Multimea E este partial ordonatǎ, relatia de ordine este implicatia. Multimea Eîmpreunǎ cu operatiile de luare a contrarului unui eveniment, de reuniune si deintersectie a evenimentelor se organizeazǎ ca o algebrǎ booleanǎ.Între evenimentele dintr-o multime E se disting atomi sau evenimenteelementare si evenimente compuse. De pildǎ, prin aruncarea zarului se potproduce între altele evenimentele A2 si A5 care constau în aparitia pe fata dedeasupra, a numǎrului de puncte trecut ca indice. Ambele sunt atomi sauevenimente elementare în sensul cǎ nu existǎ alte evenimente încǎ mai simpledecât ele. Reuniunea A A2 5∪ este însǎ un eveniment compus.Fie acum Ω multimea evenimentelor elementare dintr-o multime finitǎ E deevenimente. Evident Ω ≠ Ø. O submultime de pǎrti ale lui Ω, K ⊂ P(Ω) seorganizeazǎ ca un corp dacǎ

A∈K ⇒ ∈A KA, B∈K ⇒ A ∪ B∈KA, B∈K ⇒ A ∩ B∈K

În aceste coditii perechea (Ω, K) este un corp de evenimente si este un σ-corpsau corp borelian de evenimente dacǎ orice reuniune sau intersectie deevenimente din E, finite sau infinite apartin multimii E.Într-un spatiu E complet si atomic, orice eveniment A ≠ ∅ se poate scrie ca oreuniune de elemente din Ω

Ω∈

=i

iAω

ω

Se numeste partitie a unui eveniment A din K o multime de evenimente Ai∈K (i= 1, 2, …, n) mutual incompatibile, adicǎ Ai ∩ Aj = Ø pentru i ≠ j, astfel încât

A Aii

n

=

=1

Dacǎ A = Ω atunci, în aceleasi conditii, evenimentele Ai∈K (i = 1, 2, …, n)alcǎtuiesc un sistem complet de evenimente.

Probabilitǎti, probabilitǎti conditionate

Pe multimea evenimentelor dintr-un corp K se defineste o functie realǎ Pnumitǎ probabilitate, care are proprietǎtile: 1. 0)( ≥AP pentru ∈∀A K2. P(Ω) = 13. ( ) ∑= )( ii APAP pentru Ai∈K cu Ai ∩ Aj = Ø dacǎ i ≠ j.

91

Page 92: Gheorghe M.Panaitescu - ac.upg-ploiesti.roac.upg-ploiesti.ro/gpanaitescu/msds_2007.pdf · •Retele neuronale •Retele neuronale artificiale stratificate •Analiza multirezolutie

Dacǎ ultima proprietate are loc si pentru reuniuni numerabile, atunciprobabilitatea P se numeste complet aditivǎ (sau σ−aditivǎ) pe corpul (borelian)de evenimente (Ω, K).Tripletul (Ω, K, P) se numeste câmp (borelian) de probabilitate. Dacǎ Ω este omultime finitǎ sau numerabilǎ atunci (Ω, K, P) este un câmp de probabilitatediscret.Din proprietǎtile de mai sus derivǎ alte câteva proprietǎti importante aleprobabilitǎtii P. Astfel4. P(Ø) = 05. )(1)( APAP −=6. P A B P A P A B( ) ( ) ( )− = − ∩7. 0 1≤ ≤P A( )8. P A B P A P B P A B( ) ( ) ( ) ( )∆ = + − ∩29. P A B P A P B P A B( ) ( ) ( ) ( )∪ = + − ∩unde A B A B− = ∩ si A B A B B A∆ = − ∪ −( ) ( ) sunt diferenta, respectivdiferenta simetricǎ a douǎ evenimente. O extindere a relatiei ultime la reuniuneaa n evenimente este urmǎtoarea

∑=

+

=

−=

n

jj

jn

ii SAP

1

1

1

)1( cu S P A A j nj i ii i i n

jj

= ∩ ∩ ≤≤

∑ ( ... ), ,... ,

11 2

Dacǎ F = IiiA ∈ este o familie numerabilǎ de evenimente mutual incompa-

tibile, atunci 0=

IiiAP . Dacǎ familia F = IiiA ∈ este si exhaustivǎ, adicǎ se

constituie ca un sistem complet de evenimente, atunci 1=

IiiAP .

Evenimentele se pot afla în relatie de conditionare reciprocǎ în sensul cǎ uneveniment odatǎ produs poate modifica probabilitatea de producere a altuieveniment. Relatia de bazǎ pentru calculul probabilitǎtilor conditionate este

P A P A B P A B P BB ( ) ( / ) ( ) / ( )= = ∩cu evenimentul B, cel care conditioneazǎ producerea evenimentului A, trecut caindice sau pe pozitia a doua în argumentul functiei probabilitate.În general, p A B P A( / ) ( )≠ si P B A P B( / ) ( )≠ ceea ce indicǎ o dependentǎ, oconditionare efectivǎ între cele douǎ evenimente. Dacǎ are loc egalitatea înambele relatii atunci evenimentele sunt independente.Dacǎ probabilitatea unei intersectii finite de evenimente este nenulǎ

0≠

IiiAP

atunci probabilitatea respectivǎ se poate calcula cu formula

92

Page 93: Gheorghe M.Panaitescu - ac.upg-ploiesti.roac.upg-ploiesti.ro/gpanaitescu/msds_2007.pdf · •Retele neuronale •Retele neuronale artificiale stratificate •Analiza multirezolutie

)()/(.../ 112

1

11

APAAPAAPAPn

iin

n

ii

=

==

care se demonstreazǎ inductiv pornind de la relatia pentru douǎ evenimentederivatǎ din formula probabilitǎtii conditionate

P A B P A B P B P B A P A( ) ( / ) ( ) ( / ) ( )∩ = =Dacǎ F = IiiA ∈ este o partitie a câmpului Ω, atunci probabilitatea unuieveniment oarecare se poate calcula cu relatia

P A P A P A Ai ii

n

( ) ( ) ( / )==∑

1

cunoscutǎ ca formula probabilitǎtii totale.Mai este de retinut formula lui Bayes

P A A P A P A A P A P A Ai i i i ii

n

( / ) ( ) ( / ) / ( ) ( / )==∑

1

care în aceleasi conditii, F = IiiA ∈ o partitie a câmpului Ω, permite calcululprobabilitǎtii fiecǎrui eveniment al partitiei conditionat de evenimentul A∈K,altfel oarecare.

Variabile aleatoare

O variabilǎ aleatoare este o functie X R:Ω → cu proprietatea cǎ∈<Ω∈⇒< )(/ xXxX ωω K, Rx ∈∀

O variabilǎ aleatoare simplǎ ia un numǎr finit de valori. De exemplu, functiaindicator a unui eveniment A∈K

∈∉

=AA

A ωω

χ10

este o variabilǎ aleatoare simplǎ, care ia numai douǎ valori, 0 si 1.Dacǎ X este o variabilǎ aleatoare definitǎ pe câmpul (Ω, K, P) atunci pentruoricare douǎ valori x x R x x1 2 1 2, ,∈ ≤ toate intervalele finite sau infinitedelimitate de cele douǎ valori corespund unor evenimente din K si, pringeneralizare, pentru orice multime I, reuniune de intervale din multimeanumerelor reale R, se poate calcula P I P X I P X IX ( ) [ ( ) ] [ ( )]= ∈ = −ω 1 . PX(I)reprezintǎ distributia de probabilitate a variabilei aleatoare X. Se poate vorbi dePX ca de o probabilitate definitǎ pe câmpul asociat (R, KX) în care KX = I ⊂ R/X–

1(I)∈K.Dacǎ variabila aleatoare X ia valori într-o multime cel mult numerabilǎ

/ , , x x R i I I Ni i ∈ ∈ ⊂ +

atunci ea se numeste discretǎ si

93

Page 94: Gheorghe M.Panaitescu - ac.upg-ploiesti.roac.upg-ploiesti.ro/gpanaitescu/msds_2007.pdf · •Retele neuronale •Retele neuronale artificiale stratificate •Analiza multirezolutie

P xX ii I

( ) =∈∑ 1

∑∈

∈∀=Jx

iXXi

JxPJP ),()( KX

Dacǎ X variazǎ continuu pe un interval I∈KX atunciP I f x dxX X

I

( ) ( )= ∫si este o functie absolut continuǎ. Functia fX(x) este densitatea de probabilitatesau densitatea de repartitie a variabilei aleatoare X, este nenegativǎ pentru oricex si are proprietatea

f x dxX ( ) =−∞

∫ 1

Se numeste functie de repartitie a variabilei aleatoare X functiaF x P X x P xX X( ) [ ( ) ] [( , )]= < = −∞ω

Functia de repartitie este nedescrescǎtoare pe întreaga axǎ realǎa b F a F b a b RX X< ⇒ ≤ ∀ ∈( ) ( ) ,

si este continuǎ la stânga în fiecare punct

RaaFxFaxax XX ∈∀=

<→)()(

,lim

Valorile minimǎ si maximǎ ale unei functii de repartitie sunt date de

1)(lim

,0)(lim

=+∞→

=−∞→

xFx

xFx XX

Eventualele discontinuitǎti sunt de specia primǎ si sunt cel mult numerabile.Reciproc, orice functie cu proprietǎtile de mai sus poate fi pusǎ încorespondentǎ cu un câmp de probabilitate.Pentru o variabilǎ aleatoare discretǎ

F x P xX X ix xi

( ) ( )=<

∑iar pentru una continuǎ

F x f x dx f x ddx

F xX X

x

X X( ) ( ) , ( ) ( )= =−∞∫

Pentru orice interval [ , )a b R⊂ P a b F b F aX X X[ , ) ( ) ( )= − si PX(a) = 0

Se noteazǎ cu V(Ω, K, P) multimea tuturor variabilelor aleatoare definite pecâmpul de probabilitate (Ω, K, P). Dacǎ X, Y∈V(Ω, K, P), atunci suma,produsul celor douǎ variabile aleatoare, modulul, puterea, în general o functiemǎsurabilǎ Borel de oricare dintre ele sunt toate variabile aleatoare dinmultimea V(Ω, K, P). Ori de câte ori nu existǎ posibilitatea vreunei confuzii,

94

Page 95: Gheorghe M.Panaitescu - ac.upg-ploiesti.roac.upg-ploiesti.ro/gpanaitescu/msds_2007.pdf · •Retele neuronale •Retele neuronale artificiale stratificate •Analiza multirezolutie

indicele asociat cu variabila aleatoare, care marcheazǎ functia de repartitie saufunctia de densitate de repartitie se poate omite.Dacǎ se reia exemplul foarte frecventat în manualele de teoria probabilitǎtilor,al zarului perfect care este fǎcut la fiecare experientǎ sǎ se rostogoleascǎ pe osuprafatǎ planǎ orizontalǎ, atunci multimea evenimentelor elementare (atomi) Ωeste alcǎtuitǎ din aparitiile pe rând, deasupra, ale celor sase fete marcate uzualcu unu pânǎ la sase puncte. Multimea de pǎrti ale lui Ω este alcǎtuitǎ din toatereuniunile posibile de evenimente elementare la care se adaugǎ evenimentulimposibil. Multimea K organizatǎ ca un corp de evenimente coincide chiar cumultimea P(Ω), iar functia numitǎ probabilitate ia valoarea 1/6 pentru fiecaredin evenimentele elementare deoarece fetele zarului au sanse egale de a apǎreadeasupra. O variabilǎ aleatoare poate fi chiar numǎrul de puncte afisat pe fata dedeasupra. În acest caz functia de repartitie se prezintǎ ca în desenul alǎturat sieste, ca pentru orice variabilǎ aleatoare discretǎ, o functie în trepte.Dar pe acelasi câmp de probabilitate se pot defini si alte variabile aleatoare. Pecâmpul asociat zarului perfect se poate imagina, de pildǎ, functia X R:Ω →definitǎ astfel

5,10862,35,11654321

−ωωωωωω

si atunci functia de repartitie se prezintǎ diferit: cu toate cǎ salturile suntaceleasi ca amplitudine, ele sunt situate la abscisele –1 1,5 3,2 6 8 si 10,5adicǎ în dreptul valorilor pe care variabila aleatoare le poate lua efectiv.Asadar, multimea de variabile aleatoare V(Ω, K, P) este foarte bogatǎ.De variabilele aleatoare sunt legate câteva valori remarcabile. Una foarteimportantǎ este media

∫+∞

∞−

= dxxxfxM )()(

Media face parte din lista nesfârsitǎ a momentelor de diferite ordine alevariabilei, acesta fiind momentul de ordinul unu.Similar se poate calcula media unei functii g(x) de variabila aleatoare X

95

Page 96: Gheorghe M.Panaitescu - ac.upg-ploiesti.roac.upg-ploiesti.ro/gpanaitescu/msds_2007.pdf · •Retele neuronale •Retele neuronale artificiale stratificate •Analiza multirezolutie

M g x g x f x dx[ ( )] ( ) ( )=−∞

+∞

∫si dacǎ g(x) = xr, cu r numǎr natural, avem tocmai momentul de ordinul r desprecare s-a amintit.În cazul particular g(x) = [x – M(x)]2 se obtine o altǎ valoare importantǎ relativla variabila aleatoare descrisǎ de functia de repartitie F(x) sau de densitatea derepartitie f(x), si anume dispersia. Rǎdǎcina pǎtratǎ pozitivǎ a dispersiei senumeste abatere medie pǎtraticǎ sau abatere standard. Dispersia estemomentul centrat de ordinul doi al variabilei aleatoare, unul din multiplelemomente centrate de diferite ordine ale variabilei.Nu numai variabilele aleatoare continue au momente, medii, dispersii, ci si celediscrete. În cazul discret, formulele de calcul contin sume în locul integralelor sivalorile variabilei parcurg întreaga listǎ de valori posibile, iar densitatea derepartitie este înlocuitǎ de probabilitǎtile asociate valorilor pe care variabila lepoate lua.Câteva legi de repartitie teoretice, foarte utilizate sunt prezentate pe scurt încontinuare.Legea binomialǎ

P m C p pnm m n m( ) ( )= − −1

cu 0 ≤ ≤m n si p un numǎr în intervalul [0, 1] este de tip discret. Variabilaaleatoare este m si are media np si dispersia np(1 – p). Modelul fizic îlconstituie urna cu bile de douǎ culori, iar evenimentele constau în extragerearepetatǎ a câte unei bile dupǎ care bila extrasǎ este reintrodusǎ în urnǎ.Variabila m reprezintǎ numǎrul bilelor de o anumitǎ culoare în n extragerisuccesive, conform schemei cu bila returnatǎ. Numǎrul p reprezintǎ proportia debile de acea culoare în urnǎ, cu alte cuvinte probabilitatea ca la o extragererezultatul sǎ fie o bilǎ de culoarea respectivǎ.Legea Poisson

P mm

m

( )!

exp( )= −µ µ

cu µ > 0 si m natural ca variabilǎ aleatoare. Media variabilei este µ, dispersia eieste de asemenea µ. Un model fizic îl reprezintǎ numǎrul dezintegrǎrilorradioactive, numǎrul de apeluri telefonice solicitate într-o centralǎ etc. într-uninterval de timp precizat, scurt.Legea normalǎ (gaussianǎ) care este datǎ de densitatea de probabilitate

f x ex m

( )( )

=−

−12

2

22

σ πσ

în care m este media variabilei x si σ 2 este dispersia ei. Legea normalǎ esteperceputǎ în particular ca o lege limitǎ pentru sumele de variabile aleatoare. Un

96

Page 97: Gheorghe M.Panaitescu - ac.upg-ploiesti.roac.upg-ploiesti.ro/gpanaitescu/msds_2007.pdf · •Retele neuronale •Retele neuronale artificiale stratificate •Analiza multirezolutie

fenomen afectat de foarte multi factori aleatori se prezintǎ de cele mai multe orica un fenomen aleator descris de o lege normalǎ.Variabilele aleatoare din expunerea teoreticǎ sau din exemplele prezentate maisus au fost toate simple, adicǎ a fost vorba în toate cazurile de o singurǎaplicatie X R:Ω → legatǎ de un unic câmp de probabilitate (Ω, K, P). Se potimagina variabile aleatoare cu mai multe componente variabile aleatoare, subforma unor vectori cu componente aleatoare definite relativ la un acelasi câmpde probabilitate sau chiar la câmpuri de probabilitate diferite. Astfel legeaurmǎtoare se referǎ la o variabilǎ aleatoare vectorialǎ.Legea normalǎ multidimensionalǎ datǎ de densitatea de repartitie

)()(21

2

1

det)2(

1)(mxWmx

n

T

eW

xf−−− −

cu media m, un vector cu n componente, si cu matricea de covariatie W, omatrice pozitiv definitǎ.Pentru ca exemplul sǎ aibǎ consistenta necesarǎ trebuie definitǎ mai exactmatricea W.Este de discutat în prealabil problema corelatiei a douǎ variabile aleatoare carepot fi independente, caz în care valorile uneia nu influenteazǎ în nici un felvalorile pe care le poate lua cealaltǎ, dar pot fi mai mult sau mai putindependente ceea ce înseamnǎ cǎ dacǎ una din variabile a luat o valoare atuncilegea de repartitie a celeilalte se modificǎ în functie de acea valoare a primeivariabile.Fiind date douǎ variabile aleatoare x si y de medii nule, media produsului lor M(xy) se numeste covariatie. Dacǎ covariatia este nulǎ se poate spune în general cǎcele douǎ variabile nu sunt corelate. Dimpotrivǎ, dacǎ M(xy) ≠ 0, atuncivariabilele sunt corelate, existǎ o corelatie între ele, existǎ o dependentǎ întrevalorile pe care ele le iau în sensul arǎtat putin mai devreme. Dacǎ mediile suntdiferite de zero, afirmatia si definitia se mentin pentru abaterile de la medie.Întrucât covariatia M(xy) poate lua valori foarte diferite, pentru o aprecierecantitativǎ mai riguroasǎ a tǎriei corelatiei se utilizeazǎ coeficientul de corelatie

ρ = M xyM x M y

( )( ) ( )2 2

care ia valori în intervalul [–1, 1] si în expresia cǎruia se disting dispersiilecelor douǎ variabile, M(x2) si M(y2). O valoare pentru ρ apropiatǎ de extremeleintervalului indicǎ o corelatie strânsǎ, o valoare apropiatǎ de zero exprimǎ ocorelatie slabǎ.Componentele unui vector aleator, privite ca variabile aleatoare simple suntmutual mai mult sau mai putin corelate. Se defineste ca matrice a covariatiilorunui vector aleator x media produsului xxT, media produsului vectorului cutranspusul sǎu. Se obtine o matrice pǎtratǎ simetricǎ care are pe diagonalǎ

97

Page 98: Gheorghe M.Panaitescu - ac.upg-ploiesti.roac.upg-ploiesti.ro/gpanaitescu/msds_2007.pdf · •Retele neuronale •Retele neuronale artificiale stratificate •Analiza multirezolutie

dispersiile individuale ale componentelor. Aceasta este matricea W utilizatǎ înexpresia densitǎtii de repartitie a variabilei aleatoare normale multidimensionaledin exemplul de mai sus. Dacǎ matricea covariatiilor este diagonalǎ (are toateelementele nule cu exceptia celor de pe diagonala principalǎ) atuncicomponentele sunt mutual independente. Împǎrtirea fiecǎrui element al matriceicovariatiilor cu abaterile medii pǎtratice ale componentelor corespunzǎtoare alevectorului x produce o matrice a coeficientilor de corelatie, cu 1 pe diagonalǎ,cu valori in intervalul [–1, 1] în rest.

Generarea de numere aleatoare

În modelarea si mai ales în simularea sistemelor este necesarǎ deseori generareade numere aleatoare a cǎror aparitie sǎ se producǎ conform unei anumite legi derepartitie: unele valori mai frecvent, altele mai rar.În sprijinul acestei cerinte, aproape toate limbajele de programare evoluate au înbiblioteca lor alǎturi de alte functii, functii generatoare de numere aleatoareuniform repartizate pe un interval precizat, de regulǎ intervalul (0, 1). ÎnPASCAL, de pildǎ, existǎ functia random, cu sau fǎrǎ argument, care genereazǎastfel de numere. Subprogramul randomize invocat înaintea primului apel lafunctia random asigurǎ secvente de numere diferite la fiecare nouǎ utilizaresuccesivǎ într-un program, a functiei de bibliotecǎ generatoare de numerealeatoare. Versiunea fǎrǎ argument a functiei random produce numere reale înintervalul (0, 1), uniform repartizate pe acel interval. Versiunea cu argument detip word, random(w), produce numere aleatoare de tipul word, cuprinse între 0si w – 1. Pentru cazul continuu al functiei random fǎrǎ argument, se poatefigura functia densitate de repartitie si functia de repartitie comform graficeloralǎturate.

98

Page 99: Gheorghe M.Panaitescu - ac.upg-ploiesti.roac.upg-ploiesti.ro/gpanaitescu/msds_2007.pdf · •Retele neuronale •Retele neuronale artificiale stratificate •Analiza multirezolutie

Cu generatorul de numere aleatoare random sau cu generatoarele similare dinalte limbaje se pot genera numere aleatoare repartizate dupǎ legi diferite de ceauniformǎ. Pentru aceasta se pot utiliza metode analitice sau o metodǎ directǎcare are în vedere functia de repartitie a variabilei care trebuie generatǎ.Legea de repartitie normalǎ normatǎ (de medie nulǎ si de de dispersie 1) estelegatǎ de legea de repartitie uniformǎ prin una sau alta dintre relatiile urmǎtoare

u x x1 1 22 2= − ln cos( )π

u x x2 1 22 2= − ln sin( )πîn care x1 si x2 sunt douǎ numere aleatoare independente, cu repartitie uniformǎpe intervalul (0, 1). Este un exemplu de generare analiticǎ a unor numerealeatoare supuse unei legi de repartitie diferitǎ de cea uniformǎ.Un alt exemplu este cel al generǎrii de numere aleatoare uniform repartizate peun interval finit (a, b), a < b, oarecare. Trecerea la noua variabilǎ se realizeazǎprin mijlocirea relatiei

u = a + (b – a)xcu x generat de functia de bibliotecǎ random. Variabila u este uniformrepartizatǎ pe intervalul finit specificat.Unele produse software, cum este de pildǎ pachetul Matlab, contin functiicapabile a genera direct numere aleatoare conform unei legi de repartitieprecizate. Dar generarea pe cale analiticǎ sau prin software consacrat a unornumere aleatoare repartizate conform unei legi particulare nu este totdeaunaposibilǎ. Modul de generare alternativ este descris în continuare.Se admite cǎ este datǎ functia de repartitie F(u) a unei variabile u sau functia eidensitate de repartitie f(u) din care se poate calcula F(u). Se genereazǎ valori xuniform repartizate pe intervalul (0, 1) cu ajutorul functiei de bibliotecǎ randomsau similara ei din alte limbaje de programare. Se calculeazǎ de fiecare datǎ u =F– 1(x), unde F– 1(.) este inversa functiei de repartitie a variabilei u de generat.Functia de repartitie este totdeauna o functie monotonǎ, deci este inversabilǎpentru orice x ∈( , )0 1 . Intervalul (0, 1) este multimea de valori comunǎ tuturorfunctiilor de repartitie. Variabila aleatoare u este cu sigurantǎ repartizatǎconform legii descrise de functia F(u) sau de derivata ei f(u).

Raportul experiment – lege de repartitie teoreticǎ si verficarea legilor derepartitie

Variabilele aleatoare pot fi observate prin valorile pe care ele le iau efectiv.Numǎrul observatiilor este inevitabil finit. Forma matematicǎ a legii derepartitie precum si parametrii ei, inclusiv cei mai simpli cum sunt media sidispersia, sunt elemente care trebuie inferate, estimate prin inferentǎ, din acesteobservatii experimentale. Inferenta este operatia logicǎ prin care se admite o

99

Page 100: Gheorghe M.Panaitescu - ac.upg-ploiesti.roac.upg-ploiesti.ro/gpanaitescu/msds_2007.pdf · •Retele neuronale •Retele neuronale artificiale stratificate •Analiza multirezolutie

judecatǎ, al cǎrui adevǎr nu este verificat direct ci în virtutea unei legǎturi a eicu alte judecǎti considerate adevǎrate.Cu toate cǎ ipoteza normalitǎtii unei variabile aleatoare este satisfǎcǎtoare înfoarte multe cazuri, în special atunci când fenomenul este rezultatul actiuniiîntâmplǎtoare a unui numǎr foarte mare de factori, uneori reprezentativitatealegii de repartitie însǎsi trebuie verificatǎ. Verificarea se face, asa cum s-a spus,pe baza unui volum limitat de observatii experimentale.Observatiile experimentale, fie acestea x1, x2, ..., xn, sunt mai întâi sortate pe mintervale Ik (k = 1, 2, ..., m) în care se partitioneazǎ axa realǎ. Sortarea se face înraport cu apartenenta lor la unul sau la altul din acele intervale. Se calculeazǎfrecventele absolute nk (k = 1, 2, ..., m) pentru fiecare interval adicǎ numǎrul devalori observate care apartin unuia sau altuia din intervalele Ik . Cu acestefrecvente sau cu frecventele relative obtinute prin împǎrtirea lor la numǎrul totalde valori observate n se poate trasa un grafic sub forma unor dreptunghiuri cubaza cât fiecare interval si înǎltimea egalǎ cu frecventa. Aceste grafice suntdenumite histograme ale frecventelor relative sau absolute. Prin cumulareaordonatǎ a frecventelor se obtine un grafic numit poligonul frecventelorcumulate, relative sau absolute. Cele douǎ functii grafice sunt pentru colectia dedate experimentale ceea ce pentru variabila aleatoare sunt probabilitǎtile saudensitatea de repartitie si functia de repartitie. În termeni de frecvente relativefunctiile sub formǎ de grafic care au ca sursǎ experimentul ar trebui sǎ estimezefunctiile teoretice corespondente. Dacǎ ele sunt sau nu estimatii ale acelorfunctii teoretice, dacǎ legea de repartitie teoreticǎ reprezintǎ într-adevǎrvariabila aleatoare observatǎ se apreciazǎ prin calculul unei valori

χ 22

1

= −=

∑ ( )n npnp

k k

kk

m

în care intervin atât frecventele experimentale cât si probabilitǎtile teoreticep P x Ik k= ∈( ) , (k = 1, 2, ..., m) si care este o variabilǎ aleatoare deoarece,evident, la un nou set de observatii se obtine aproape sigur altǎ valoare.Variabila χ 2 este consacratǎ în statistica matematicǎ si este definitǎ ca o sumǎde pǎtrate ale unor variabile aleatoare normale normate (de medie nulǎ si dedispersie egalǎ cu unitatea) independente. Variabila are un numǎr de grade delibertate egal cu numǎrul de termeni din suma definitorie. Functia de repartitie avariabilei χ 2 este tabelatǎ sau poate fi evaluatǎ si este folositǎ în verificareaipotezelor statistice de natura celei formulate mai devreme sau de altǎ naturǎ.Intuitiv, valoarea χ 2 calculatǎ din observatii experimentale ar trebui sǎ fie câtmai apropiatǎ de zero. Atunci, probabilitǎtile pk ar fi foarte apropiate defrecventele relative nk/n rezultate din experiment. Ipotezei modelul teoretic esteverificat de observatiile experimentale (H0) i se opune ipoteza alternativǎ (H1)modelul teoretic pe cale de a fi adoptat nu este verificat de observatiileexperimentale. Pragul discriminator între cele douǎ adevǎruri mutual exclusive

100

Page 101: Gheorghe M.Panaitescu - ac.upg-ploiesti.roac.upg-ploiesti.ro/gpanaitescu/msds_2007.pdf · •Retele neuronale •Retele neuronale artificiale stratificate •Analiza multirezolutie

este stabilit ca limitǎ superioarǎ a unui interval definit pentru un nivel desemnificatie sau pentru un nivel de încredere precizat q (uzual 0,95), intervalcare grupeazǎ 100q% din valorile χ 2 firesti, plauzibile în cazul valabilitǎtiiipotezei H0. Schema acceptǎrii (sau respingerii) uneia sau alteia dintre ipotezeeste

χ χ20

1

2

H

Hq

<>

cu valoarea de provenientǎ experimentalǎ în stâga semnului discriminator, cuvaloarea teoreticǎ, tebelarǎ în dreapta acelui semn. Pe calea aceasta se poateselecta legea de repartitie adecvatǎ.

Estimarea si verificarea parametrilor legii de repartitie teoretice

Asa cum s-a arǎtat, legea de repartitie cea mai frecvent utilizatǎ în general dar siîn modelarea si simularea dinamicii sistemelor este legea normalǎ. Ipotezele siverificǎrile parametrice discutate în cele ce urmeazǎ se referǎ în exclusivitate lavariabile aleatoare repartizate normal sau, cum se mai spune, gaussian.O listǎ de valori observate x1, x2, ..., xn ale unei variabile aleatoare poartǎ numeleconsacrat de selectie. Numele ar putea pǎrea impropriu prin prisma etimologieicuvântului selectie si de aceea trebuie subliniat cǎ valorile din lista de observatiinu comportǎ nici un proces subiectiv de alegere. Prin selectie se întelege numairetinerea experimentalǎ a unui numǎr finit de valori ale variabilei aleatoare dinnumǎrul extrem de mare de valori pe care aceasta le-ar putea lua.Se admite cǎ variabila are o repartitie normalǎ cu media µ si dispersia σ 2. Se defineste ca medie de selectie media aritmeticǎ a valorilor observate

n

xx

n

ii∑

== 1

Ea este o estimatie absolut corectǎ a mediei µ si se repartizeazǎ ca si variabila xobservatǎ, normal cu aceeasi medie µ dar cu dispersia σ 2/n. Din datele carealcǎtuiesc selectia se pot calcula douǎ dispersii de selectie

sx

n

ii

n

2

2

1=−

=∑( )µ

si

sx x

n

ii

n

2

2

1

1=

−=∑( )

101

Page 102: Gheorghe M.Panaitescu - ac.upg-ploiesti.roac.upg-ploiesti.ro/gpanaitescu/msds_2007.pdf · •Retele neuronale •Retele neuronale artificiale stratificate •Analiza multirezolutie

Ambele sunt estimǎri absolut corecte ale dispersiei σ 2, prima cu n grade delibertate, a doua, mai uzualǎ deoarece nu necesitǎ cunoasterea mediei teoreticeµ, cu n – 1 grade de libertate.Sintagma estimatie absolut corectǎ exprimǎ faptul cǎ media unei astfel deetimatii este exact valoarea parametrului estimat.Asupra mediei, ipoteza cea mai frecventǎ are forma µ = µ 0 si se noteazǎ cu H0.Opusa ei se noteazǎ cu H1. Uneori se formuleazǎ ipoteze în foma unilateralǎ, încare semnul egal este înlocuit cu un semn de inegalitate. Verificarea uneia saualteia dintre ipoteze se face în baza unei selectii.Dacǎ dispersia σ 2 este cunoscutǎ, atunci se poate calcula o valoare

z x

n

= − µσ

0

care este o variabilǎ aleatoare repartizatǎ normal si este în plus si normatǎ adicǎare media nulǎ si dispersia egalǎ cu unitatea. Se stabileste un nivel de încrederesau de semnificatie q, uzual de 0,95 (95%), pentru care în tabele sau prin calculse gǎseste un zq, în particular z0,95 = 1,96. Aceastǎ valoare delimiteazǎ uninterval (– zq, + zq ), numit interval de încredere, care contine 95% din valorile zcalculate din datele selectiilor de tipul si de volumul specificat mai devreme.Prin urmare, valorile din afara intervalului de încredere sunt cu totulimprobabile, probabilitatea lor fiind complementara 1 – q. Aparitia unei valori zdin aceastǎ categorie pune sub semnul îndoielii valabilitatea ipotezei formulate.Asadar, dacǎ valoarea calculatǎ z z zq q∈ − +( , ) ipoteza se acceptǎ, în caz contrarse respinge sau într-o exprimare care pune în evidentǎ ambele ipoteze mutualexclusive

zH

Hzq

0

1

<>

Dacǎ dispersia σ 2 nu este cunoscutǎ se utilizeazǎ variabila Student, în careintervine radicalul pozitiv al dispersiei de selectie

t xsn

= − µ0

Variabila Student este o variabilǎ aleatoare în legǎturǎ cu care se mentioneazǎ siun numǎr de grade de libertate, acelasi cu al estimatiei s 2. Se stabileste un nivelde încredere q si un interval de încredere (– tq, + tq ). Tabelele sau calculul dauaceste valori pentru diverse niveluri de încredere, cel mai uzual fiind acelasi0,95, dar si pentru grade de libertate diferite. Ipoteza H0 se confirmǎ dacǎvaloarea Student calculatǎ se situeazǎ în interiorul intervalului de încredere.Ipoteza se respinge în caz contrar. Sintetic

102

Page 103: Gheorghe M.Panaitescu - ac.upg-ploiesti.roac.upg-ploiesti.ro/gpanaitescu/msds_2007.pdf · •Retele neuronale •Retele neuronale artificiale stratificate •Analiza multirezolutie

tH

Htq

0

1

<>

Ipoteze se fac, de asemenea, asupra dispersiei. Ipotezele acestea trebuie uneorisi ele verificate. Astfel, fiind date douǎ estimatii ale aceleiasi dispersii, 2

1s si 22s ,

valoarea bazatǎ pe experiment

F ss

= 12

22

are cracteristicile unei variabile aleatoare si se spune cǎ are f1 si f2 grade delibertate, egale respectiv cu gradele de libertate ale celor douǎ estimatiiraportate. Variabila este cunoscutǎ in statistica matematicǎ sub numele devariabila F (Fisher-Snedecor). În particular, gradele de libertate pot fi f1 si ∞ siatunci

F s= 12

2σeste o variabilǎ F cu f1 si ∞ grade de libertate. O ipotezǎ σ 2 = σ0

2 se poateverifica prin calcularea unei valori F cu σ0

2 la numitor. Un nivel de semnificatieq delimiteazǎ si în acest caz un interval de încredere. Un F calculat din dateexperimentale superior lui Fq tabelar cu gradele de libertate respective impunerespingerea ipotezei H0 formulate si acceptarea ipotezei alternative H1. Cazulcontrar face ca ipoteza H0 sǎ fie acceptatǎ. Schema globalǎ este cuprinsǎ înexprimarea

FH

HFq

0

1

<>

Criteriul F se aplicǎ de obicei unilateral.Variabila z normalǎ normatǎ si variabilele aleatoare t si F care sunt înconexiune directǎ cu legea de repartitie normalǎ permit formularea si testareaunui numǎr important de ipoteze statistice. O altǎ variabilǎ aleatoare importantǎlegatǎ de variabila repartizatǎ normal este variabila χ 2 despre care s-a vorbit laverificarea calitǎtii de model al unei variabile aleatoare observate experimental,îndeplinitǎ sau nu de o lege de repartitie teoreticǎ. Variabila χ 2 este o sumǎ depǎtrate ale unor variabile normale normate independente si are gradele delibertate egale cu numǎrul de termeni în sumǎ. Variabila χ 2 permite ea însǎsiverificarea de ipoteze asupra dispersiei dat fiind faptul cǎ într-o estimatie s2 adispersiei teoretice σ 2 se poate separa o sumǎ de pǎtrate de variabile z normalenormate independente si implicit o variabilǎ χ 2. Tabelele sau calculul direct dausi în cazul acesta valori χq

2 care constituie pragul discriminator între ipoteze laun nivel de semnificatie q precizat.

103

Page 104: Gheorghe M.Panaitescu - ac.upg-ploiesti.roac.upg-ploiesti.ro/gpanaitescu/msds_2007.pdf · •Retele neuronale •Retele neuronale artificiale stratificate •Analiza multirezolutie

Estimarea de parametri în modelele sistemelor

Problema estimǎrii unor parametri ai legilor de repartitie normalǎ fac partedintr-un cadru mai larg cunoscut sub numele generic de estimare aparametrilor. O adâncire a subiectului este absolut necesarǎ deoarece frecventmodelul matematic al unui sistem se poate scrie relativ usor sub forma luigeneralǎ pe baza unor considerente fenomenologice sau de altǎ naturǎ, darnumai precizarea valorilor unor parametri îl fac specific unui anumit sistemfizic real. Aceastǎ acordare a modelului pe sistemul modelat se bazeazǎ pe dateobservate în experimente organizate special sau prin observarea pasivǎ afunctionarii sistemului.

Estimarea de parametri în relatii-model algebrice

Un model algebric are în general formay = f(x, a)

cu f o functie vectorialǎ cu m componente de vectorul de variabile x cu ncomponente si de vectorul de parametri a cu p componente.Problema estimǎrii parametrilor se pune în termenii urmǎtori: fiind datǎ o listǎde perechi de valori experimentale x si y se cere a se determina parametrii aastfel încât sǎ fie minimizatǎ o anumitǎ distantǎ model-experiment. Dintrecriteriile posibile sunt frecvent utilizate cel al celor mai mici pǎtrate cu sau fǎrǎponderi, suma modulelor abaterilor absolute sau relative. În toate aceste alegeridistanta model-experiment se referǎ numai la valorile y cu acceptarea tacitǎ sauexplicitǎ, a unei precizii mult mai bune în mǎsurarea variabilelor x decât înobservarea lui y. Uneori însǎ variabilele independente x sunt afectate ele înseside erori de observare si de mentinere în cursul experimentelor, erori care nu potfi ignorate. În cazul acesta, în evaluarea acelei distante model-experiment intrǎsi variabilele x dupǎ cum se va explica mai departe.Metoda celor mai mici pǎtrateParametrii a din relatia

y = f(x, a)pot fi determinati din date experimentale având în vedere cǎ în realitate relatiaeste îndeplinitǎ sub forma aproximativǎ

y = f(x, a) + εScrisǎ pentru mai multe puncte experimentale

yk = f(xk, a) + εk (k = 1, 2, …, N)aceasta permite constituirea unui criteriu de apropiere model-experiment deforma

S = εTQε

104

Page 105: Gheorghe M.Panaitescu - ac.upg-ploiesti.roac.upg-ploiesti.ro/gpanaitescu/msds_2007.pdf · •Retele neuronale •Retele neuronale artificiale stratificate •Analiza multirezolutie

cu ε vectorul rezidualelor εk si Q o matrice de ponderi pozitiv definitǎ. MatriceaQ este de cele mai multe ori diagonalǎ si dǎ ponderi diferite unor observatii yk

afectate de erori variabile cu k. Dacǎ erorile sunt constante si descrise statisticde aceeasi lege de repartitie, admisǎ a fi normalǎ de medie nulǎ, atunci matriceaQ poate fi matricea unitate I multiplicatǎ eventual cu valoarea reciprocǎ adispersiei unice, caz în care avem metoda celor mai mici pǎtrate clasicǎ, cuponderi constante pentru cele N observatii experimentale, de fapt fǎrǎ ponderi.Parametrii a cǎutati sunt aceia care minimizeazǎ pe S, care este o sumǎ depǎtrate ale abaterilor model-experiment, ponderate sau nu.Cazul cel mai frecvent în aplicatii si în consecintǎ cel mai pus la punct subaspect teoretic este cel liniar în parametrii a, liniar, de asemenea, în x. Aparentparticular, cazul devine mai general decât pare dacǎ se iau în consideratieposibilitǎtile de liniarizare în x fie prin substitutii adecvate fie prin dezvoltǎriTaylor valabile pe regiuni limitate ale spatiului variabilelor independente x. Prinurmare, meritǎ o atentie aparte cazul liniar

y = xTaîn care vectorul x poate contine o primǎ componentǎ constantǎ si egalǎ cuunitatea, care corespunde unui coeficient liber de orice influentǎ datoratǎmodificǎrilor lui x si în care vectorul a al parametrilor este (n + 1)-dimensionaladicǎ are n componente, câte una pentru fiecare componentǎ variabilǎ avectorului x si încǎ una ca termen liber cum s-a spus mai devreme. Dacǎ yk suntvalorile observate si xk sunt valori particulare ale vectorului x în experientelesau observatiile k = 1, 2, ..., N atunci minimul sumei S se obtine pentru solutiasistemului în necunoscutele a

Xa = Yîn sensul celor mai mici pǎtrate. În relatia ultimǎ X are ca linii vectorii xk

T, iar Yeste vectorul observatiilor yk. Sistemul este liniar în componentele lui a si sepoate rezolva, în etape, prin premultiplicarea mai întâi cu transpusa matricei X

XTXa = XTYsi, dupǎ aceea, prin multiplicarea la stânga cu inversa matricei produs XTX,numitǎ si inversa generalizatǎ sau pseudoinversa matricei X, dacǎ inversarespectivǎ existǎ

a = (XTX)– 1XTYExistenta inversei utilizate este un alt mod de a vorbi despre diversitateapunctelor xk. Desigur, în matricea X se pot incorpora valori ale vectorului xvariate, asa cum rezultǎ din observarea curentǎ a sistemului de modelat. Estecazul experimentului pasiv, nedirijat. Experimentul se poate însǎ planifica, înprimul rând pentru a asigura acea diversitate de valori ale componentelorvectorului x capabilǎ sǎ punǎ în evidentǎ efectele lor asupra valorilor y.Planificarea poate merge încǎ mai adânc, alegând componentele vectorului x înasa fel încât sǎ aibǎ loc relatia

105

Page 106: Gheorghe M.Panaitescu - ac.upg-ploiesti.roac.upg-ploiesti.ro/gpanaitescu/msds_2007.pdf · •Retele neuronale •Retele neuronale artificiale stratificate •Analiza multirezolutie

x xikk

N

jk=

∑ =1

0

pentru oricare douǎ componente distincte i ≠ j. De pildǎ, experimentul dintabelul alǎturat are aceastǎ proprietate, numitǎ si proprietatea de ortogonalitate.

Experienta nr. x0 x1 x2

1 1 –1 –12 1 –1 13 1 1 –14 1 1 15 1 0 0

Pare dificil de pus în aplicare un asemenea plan experimental. Dar în tabelul demai sus nu este vorba de valorile naturale ale variabilelor ci de valori legateîntr-un mod potrivit de cele naturale. Mai explicit, dacǎ variabilele din realitatesunt, sǎ spunem, o temperaturǎ T si un debit d, care în cursul experimentǎrii iauvalorile 50, 75, 100 oC, respectiv 1000, 1200, 1400 kg/orǎ atunci variabilele

x T1

7525

= −

x d2

1200200

= −

pot lua exact valorile din tabel. Coeficientii relatiei-model se estimeazǎ înraport cu aceste variabile si apoi se revine la variabilele naturale, reale, T si d.Avatajul unui experiment planificat si, în plus, ortogonal este dublu. Pe de oparte matricea XTX este diagonalǎ si deci usor de inversat. Pe de altǎ parteefectul fiecǎrei variabile

ax y

xl nl

lk kk

N

lkk

N= ==

=

∑1

2

1

0 1 2( , , ,..., )

poate fi pus în evidentǎ separat, în deplina lui semnificatie sau lipsǎ desemnificatie. În aceste conditii, suma de pǎtrate ale rezidualelor εk minimizatǎse descompune sub forma

∑∑∑∑

====

=

−−−−=

=−−−−

N

knkn

N

kk

N

kk

N

kk

N

knknkkk

xaxaxay

xaxaxay

1

22

1

21

21

1

20

20

1

2

1

21100

...

)...(

care rearanjatǎ duce la

106

Page 107: Gheorghe M.Panaitescu - ac.upg-ploiesti.roac.upg-ploiesti.ro/gpanaitescu/msds_2007.pdf · •Retele neuronale •Retele neuronale artificiale stratificate •Analiza multirezolutie

=∑=

N

kky

1

2

∑∑∑

=

===

−−−−+

++++=

N

knknkkk

N

knkn

N

kk

N

kk

xaxaxay

xaxaxa

1

21100

1

22

1

21

21

1

20

20

)...(

...

Aceastǎ ultimǎ expresie pune în evidentǎ o interesantǎ descompunere a sumeipǎtratelor valorilor observate yk, din partea stângǎ a egalitǎtii. Descompunereacontine termeni legati clar de câte un efect al unei variabile si un ultim termencare este însǎsi suma rezidualelor ridicate la pǎtrat minimizatǎ. Cu terminologiasume de pǎtrate si grade de libertate asociate, termenii din dreapta semnului deegalitate au fiecare câte 1 grad de libertate exceptând ultimul care are N – (n +1) grade de libertate. Dacǎ nu existǎ nici un efect real, adicǎ semnificativ al x-ilor asupra lui y, atunci se poate considera cǎ valorile a0, a1, a2, ..., an suntdatorate exclusiv zgomotului care acompaniazǎ observatiile y si atunci termeniisumei de mai sus pot servi la calculul unor estimatii cu 1 sau N – (n + 1) gradede libertate ale dispersiei valorilor y. Cu aceste estimatii se pot calcula valori F(Fisher-Snedecor) cu gradele de libertate respective. De pildǎ raportul

Fa x

y a x a x a x

N n

l lkk

N

k k k n nkk

N=− − − −

− +

=

=

2 2

1

0 0 1 12

1

1

( ... )

( )este o valoare F cu 1 si N – (n + 1) grade de libertate. Selectând un nivel desemnificatie q (uzual 0,95) tabelele dau o valoare Fq criticǎ. Un F calculat carese situeazǎ sub valoarea criticǎ aratǎ cǎ efectul variabilei xl nu existǎ sau, în altitermeni, nu este semnificativ, valoarea F calculatǎ fiind datoratǎ exclusivzgomotului. Dimpotrivǎ, un F calculat care este mai mare decât valoarea criticǎindicǎ un efect semnificativ: variabila y depinde efectiv de xl. Termenul legat dereziduale poate fi el însusi testat ca semnificatie dacǎ este raportat la o estimarea dispersiei din puncte experimentale repetate. Pentru fiecare punct repetat înaceleasi conditii x se calculeazǎ o dispersie experimentalǎ s2. Se calculeazǎ apoiun s2 global ca o medie ponderatǎ cu gradele de libertate ale estimatiilorpunctuale. Acest din urmǎ s2 are ca grade de libertate suma gradelor de libertateale estimatiilor s2 punctuale componente. Un F calculat ca raport al estimatieidin reziduale la estimatia din experiente repetate, care este sub valoarea criticǎtabelarǎ indicǎ o situatie normalǎ: modelul reprezintǎ experimentul în limitelezgomotelor care afecteazǎ mǎsurǎtorile y. Din contra, depǎsirea valorii criticedezvǎluie relatii mai complicate între y si x, efecte ignorate, sau o inadecvare dealtǎ naturǎ a modelului la experimentul efectuat pe sistemul de modelat.

107

Page 108: Gheorghe M.Panaitescu - ac.upg-ploiesti.roac.upg-ploiesti.ro/gpanaitescu/msds_2007.pdf · •Retele neuronale •Retele neuronale artificiale stratificate •Analiza multirezolutie

Valoarea F calculatǎ în acest mod, sau numai termenul din suma pǎtratelorasociat rezidualelor când calculul unui F nu este posibil se poate constitui încriteriu de discriminare între douǎ sau mai multe modele posibile ale aceluiasiobiect, pe baza acelorasi date experimentale. Este de preferat aproape totdeaunamodelul cu F mai mic, asadar cu reziduale mai mici. Desigur, variabilele carepot fi modificate dupǎ dorintǎ într-un experiment planificat sunt cele de intrare,independente.Existǎ o variabilǎ deosebitǎ, timpul, care este mai putin planificabilǎ. Cel maicurent mod de a trata timpul în observatiile experimentale este de a-l mǎsura simarca la intervale regulate. Pe o secventǎ de momente egal distantate esteposibilǎ o ortogonalizare a matricei X prin utilizarea unor polinoame ortogonalepe multimea de puncte de pe axa timpului. Aceasta presupune cǎ sunt decalculat dependenţe de timp sub formǎ de polinoame. Existǎ polinoame de grad0, 1, 2 etc. care pe o retea de puncte echidistante t0, t1, ..., tN au proprietateaimportantǎ

P t P ti k j kk

N

( ) ( ) ==

∑ 00

ori de câte ori gradele lor i si j sunt diferite. Aceste polinoame au expresiileurmǎtoare

P t

P t tN

P t tN

t tN N

P t tN

t tN N

t t tN N N

P t m km k k k

tNm

kk

kk

m

0

1

2

3

0

10

10 2

10 6 6 11

10 12 30 11

20 1 21 2

1

( ) .

( ) .

( ) . ( )( )

( ) . ( )( )

( )( )( )( )

. . . . . . . . . . . . . . .

( ) ( ) ( )!( )! ! !

( )

( )

=

= −

= − + −−

= − + −−

− − −− −

= − +−=

∑în care s-a notat x x x x x kk( ) ( )( )...( )= − − − +1 2 1 .Multe functii pot fi aproximate prin polinoame de acest tip si în general prinpolinoame. Adǎugând treptat câte un polinom cu grad mai mare cu o unitatefatǎ de etapa precedentǎ se pot calcula coeficienti ai unui polinom-modelglobal, a cǎror semnificatie poate fi judecatǎ separat.Metoda verosimilitǎtii maximeAtunci când nu existǎ variabile care sunt observate si mǎsurate cu precizii netsuperioare fatǎ de altele, când distinctia între variabilele independente sidependente este dificil de stabilit se recurge la alte metode de estimare a

108

Page 109: Gheorghe M.Panaitescu - ac.upg-ploiesti.roac.upg-ploiesti.ro/gpanaitescu/msds_2007.pdf · •Retele neuronale •Retele neuronale artificiale stratificate •Analiza multirezolutie

parametrilor din modelele sistemelor. Una este metoda verosimilitǎtii maximeprezentatǎ în continuare.Fie X o multime de vectori care sunt în corespondentǎ cu un numǎr de puncteexperimentale. Fiecare vector x X∈ are o parte δ aleatoare, de medie zero, carese adunǎ la valoarea lui teoreticǎ, adevǎratǎ. Adaosul δ este presupus repartizatdupǎ o lege normalǎ. Fie f un vector de functii care modeleazǎ sau coreleazǎdatele experimentale, functii care contin parametri de estimat. Ideal, dacǎ x estefoarte precis mǎsurat si modelul este exact pe date, atunci

f(x,a) = 0în toate punctele experimentale. Practic însǎ, niciodatǎ cele douǎ conditii deprecizie si de adecvare a modelului la experiment nu sunt satisfǎcute si atunciare loc mai curând relatia

f(x,a) = εcu ε un vector care nu are toate componentele nule. Dacǎ modelul descrie dateleîn manierǎ satisfǎcǎtoare atunci ε se explicǎ si se exprimǎ complet prin erorilede determinare ale lui x

ε = JX δunde JX este matricea jacobianǎ a functiilor f în raport cu x. Evident, matricea JX

depinde de punct. Vectorul ε este normal distribuit si are media nulǎ pentru cǎ δeste admis a fi normal distribuit si are media nulǎ. Matricea de covariatie a lui εse calculeazǎ din matricea de covariatia a lui δ cu relatia

W J W Jx xT

ε δ=Functia densitate de repartitie pentru ε într-un anumit punct experimental estedatǎ de

fA

AmT( )

det

( )exp( )ε

πε ε= −

2

122

unde A este inversa matricei Wε si m este numǎrul componentelor lui ε. Celemai verosimile valori ale parametrilor a sunt acelea care fac maximǎprobabilitatea

fA

Ak

N

kk

m kT

k kk

N

= =∏ ∏= −

1 21 2

12

( )det

( )exp( )ε

πε ε

sau fac minimǎ suma

S AkT

k kk

N

==

∑ε ε1

dacǎ se admite o variatie moderatǎ a determinantilor matricilor Ak de la unpunct experimental la altul. În relatiile scrise, k numǎrǎ punctele experimentale.Printr-o metodǎ sau alta se determinǎ valorile parametrilor a care fac maxime(minime) expresiile de mai sus. Asupra acestor valori existǎ incertitudini, ele au

109

Page 110: Gheorghe M.Panaitescu - ac.upg-ploiesti.roac.upg-ploiesti.ro/gpanaitescu/msds_2007.pdf · •Retele neuronale •Retele neuronale artificiale stratificate •Analiza multirezolutie

partea lor de variatie aleatoare. Este necesarǎ analiza semnificatiei acestorvariatii aleatoare pentru cel putin douǎ motive. Primul este acela cǎ valorileunor componente ale lui a pot fi în esentǎ nule. Al doilea provine din aceea cǎpot exista alte valori ale parametrilor, echivalente sub incidenta statisticiiadoptate. Pentru analiza vectorului a se rescrie o ecuatie de mai sus în forma

J Jx aδ α+ = 0cu α partea aleatoare de medie nulǎ a vectorului a, cu Jα matricea jacobianǎ afunctiilor f relativ la vectorul a. Dacǎ se admite cǎ modelul si datele sunt înrelatie corectǎ, atunci

Jαα = − εpentru fiecare punct experimental. Ultima ecuatie scrisǎ pentru toate puncteleexperimentale duce la

Bα = − eunde matricile B si e cumuleazǎ în ordine linii din Jα, respectiv din ε pentrutoate punctele experimentale. Calcularea vectorului α se face prin multiplicareaecuatiei la stânga cu inversa generalizatǎ a matricei B

α = − −( )B B B eT T1

Medierea produsului ααT duce la obtinerea matricei de covariatie a vectorului a(α)

W B B B W B B BT Te

Tα = − −( ) ( )1 1

si densitatea de repartitie a lui α este

fQ

QlT( )

det

( )exp( )α

πα α= −

2

122

cu l numǎrul componentelor lui a si Q inversa matricei Wα. În spatiile ε si αsunt anumite hipersuprafete pe care functiile densitate de repartitie suntconstante. Din cauza formelor pǎtratice continute, cu A sau Q pozitiv definite,hipersuprafetele pe care f(ε), respectiv f(α) sunt constante sunt hiperelipsoizi.Hipervolumele continute în aceste hipersuprafete (notate ca domeniul D) pot ficalculate cu integrala multiplǎ

VQ

Q dlT

D

= −∫∫∫det

( )... exp( )

2

122π

α α α

si sunt egale cu probabilitatea ca punctul marcat de vectorul α sǎ se afle înhiperelipsoid. Probabilitatea complementarǎ q = 1 – V se asociazǎ cazurilor încare α are vârful în afara hiperelipsoidului. Se poate defini un nivel de încrederesau de semnificatie. Similar intervalului de încredere, apar elipsa de încredere,elipsoidul de încredere etc. Integrala multiplǎ de mai sus se poate calcula printr-o dublǎ schimbare de variabilǎ. Prima aduce matricea Q în forma diagonalǎ, a

110

Page 111: Gheorghe M.Panaitescu - ac.upg-ploiesti.roac.upg-ploiesti.ro/gpanaitescu/msds_2007.pdf · •Retele neuronale •Retele neuronale artificiale stratificate •Analiza multirezolutie

doua transformǎ hiperelipsoidul într-o hipersferǎ de o razǎ notatǎ cu ρ.Rezolvarea ecuatiei în ρ

V(ρ) = 1 – qproduce o valoare unicǎ asociatǎ lui q. Revenirea la coordonatele initiale redǎhipersuprafata care contine toti vectorii α echivalenti probabilistic. Fiecǎruipunct x experimental i se asociazǎ un ρ care poate fi comparat cu o valoare ρcriticǎ, asociatǎ unui q precizat, uzual 0,05. Fǎcându-l pe ρ criteriu discriminantse pot elimina punctele experimentale grav eronate. Toatǎ discutia se poatereformula în termeni de distante generalizate. Se poate calcula, de asemenea, unρ mediu care poate fi utilizat în discriminarea între modele diferite.

Fenomene aleatoare dinamice

O variabilǎ aleatoare simplǎ X∈V(Ω, K, P) definitǎ pe un câmp de probabilitate(Ω, K, P) poate avea un aspect temporal. Fiind datǎ o multime de momente Tdiscretǎ sau de puterea unei interval, variabila X este mereu alta în multimea V(Ω, K, P) pe mǎsurǎ ce indicele t parcurge multimea T. Variabila devine în acestmod un proces aleator. Mai general, variabila poate avea mai multecomponente, asadar poate fi vectorialǎ, dar cu acelasi gen de evolutietemporalǎ.Astfel pusǎ problema, pentru un moment fixat variabila Xt poate lua valoriconform unei legi de repartitie care în momentul urmǎtor poate fi alta si apoialta s.a.m.d.Succesiunea de valori x(t) pe care varibila aleatoare le ia efectiv pe mǎsurǎ cemultimea T este parcursǎ în sensul natural de curgere a timpului este o functiede timp care constituie o realizare din foarte multe posibile a procesului aleatorrespectiv.Se întelege din cele expuse pânǎ acum cǎ într-un proces aleator douǎ aspectesunt de luat în considerare. Unul se referǎ la un moment fixat t = t1, altfeloarecare, în care variabila vectorialǎ x(t1) poate fi privitǎ ca o variabilǎ aleatoarecu functia de repartitie F(x;t1), eventual cu densitatea de repartitie f(x;t1).Celǎlalt aspect are în vedere multiplele realizǎri posibile ale functiei x(t).Dupǎ cum se observǎ, timpul apare în functia de repartitie ca un parametru si îngeneral, o descriere mai bunǎ a fenomenului aleator, cu aspectul lui temporal cutot se poate face cu functii de repartitie de forma F x x t tn n( ,..., ; ,..., )1 1 , pentru unvector de n valori ale functiei de timp x(t) la n momente distincte. Asemenea sidensitatea de repartitie, dacǎ ea existǎ, se referǎ la un vector de n valori ale lui x(t), luate la n momente diferite. Descrierea este cu atât mai completǎ cu câtnumǎrul n este mai mare. Desigur, timpul poate fi discret sau continuu, x(t)poate lua valori discrete sau continue. Pentru douǎ momente diferite dar fixate,

111

Page 112: Gheorghe M.Panaitescu - ac.upg-ploiesti.roac.upg-ploiesti.ro/gpanaitescu/msds_2007.pdf · •Retele neuronale •Retele neuronale artificiale stratificate •Analiza multirezolutie

pentru variabilele aleatoare x(t1) si x(t2), se poate pune problema corelǎrii caredevine aici autocorelare.Dacǎ timpul ia valori într-o multime T discretǎ procesul se mai numeste serietemporalǎ.Un proces aleator poate fi stationar sau nestationar. Un proces stationar areproprietatea specificǎ conform cǎreia

F x x t t F x x t tn n n n( ,..., ; ,..., ) ( ,..., ; ,..., )1 1 1 1= + +τ τpentru orice τ. În cuvinte, functia de repartitie multitemporalǎ ca si densitateade repartitie multitemporalǎ, dacǎ aceasta existǎ, nu depind de originea timpuluisau sunt invariante la o translatie pe axa timpului. Un proces aleator nestationarnu are aceastǎ proprietate. Proprietatea de stationaritate are implicatii asupraparametrilor care apar în expresia matematicǎ a legilor de repartitie pentruvariabilele aleatoare x(t1), x(t2) etc. simple sau luate împreunǎ, cu eventuala lorcorelare statisticǎ. Parametrii respectivi rǎmân constanti în timp. Se includ aicimediile, dispersiile, covariatiile etc.Despre un proces aleator stationar care are functia de autocorelatie nulǎ pentruorice decalaj de timp diferit de zero se spune cǎ are caracteristicile unui zgomotalb.Un proces aleator pur este acela pentru care functia de repartitie si densitatea derepatitie sunt mereu aceleasi indiferent de valorile pe care x(t) le-a luat anterior.Într-un asemenea caz timpul înceteazǎ a mai fi un parametru. Este un faptsubînteles cǎ starea la un moment dat a unui sistem depinde în general de stareasistemului pe un interval de valori anterioare sau, în cazul discret, de stareasistemului la un numǎr oarecare de momente anterioare. Asa-numitele matricide tranzitie contin probabilitǎti de trecere de la o stare la urmǎtoarea din maimulte posibile, probabilitǎti conditionate de stǎrile ocupate anterior. Cu cât maimulte stǎri ocupate anterior determinǎ efectiv o stare urmǎtoare cu atât maimulte informatii trebuie cuprinse în aceste matrici de tranzitie.Existǎ procese aleatoare de tip discret care pot fi asociate unui sistem cu unnumǎr de stǎri distincte, care pot fi ocupate la fiecare moment cu o anumitǎprobabilitate. Trecerile de la o stare la alta sunt aleatoare si li se poate asocia ounicǎ matrice de tranzitie cu elemente dependente numai de starea imediatanterioarǎ celei care urmeazǎ a fi ocupatǎ. Acesta este un caz cu foarte multeaplicatii practice, chiar dacǎ unele din ele aproximante, cunoscut sub numele deproces Markov. În acest caz, elementele matricei de tranzitie permit calcululprobabilitǎtii unei stǎri urmǎtoare când starea curentǎ este datǎ. Dacǎ starea laun moment t este descrisǎ probabilistic de vectorul p(t), atunci matricea P detranzitie într-un moment urmǎtor t1, la o stare urmǎtoare permite calcululprobabilitǎtii combinate p(t1) = Pp(t). Matricea P nu poate avea decât elementepozitive cu suma 1 pe linii si elementele unei linii au particularitǎtile unorprobabilitǎti conditionate

112

Page 113: Gheorghe M.Panaitescu - ac.upg-ploiesti.roac.upg-ploiesti.ro/gpanaitescu/msds_2007.pdf · •Retele neuronale •Retele neuronale artificiale stratificate •Analiza multirezolutie

)1/(])1/([)1/()1/()/(

12 −+−−−

−−=− ttPHRHttPHHttP

ttPttPTT

În ultima expresie s-au înlocuit momentele tn cu numerele întregi trecute caindice, operatie care subliniazǎ echivalenţa cardinalǎ a multimii momentelor detimp cu multimea numerelor întregi. Este interesant de urmǎrit comportareaasimptoticǎ a unuii proces Markov si posibila lui periodicitate.Un exemplu numeric ajutǎ la întelegerea mai exactǎ a proceselor Markov.Astfel, un proces Markov definit de matricea de tranzitie

P t t A P t t A RT( / ) ( / )+ = +1 1

cu primele ei puteri

=

= 475,0525,0

350,0650,055,045,030,070,0 32 PP

aflat în starea initialǎ descrisǎ de vectorul de probabilitǎti pT = [0,1 0,9], se vaafla dupǎ trei tranzitii într-o stare nouǎ descrisǎ de vectorul de probabilitǎti

[ ]4625,05375,0)]0([)3( 3 == TT pPp .

Modele dinamice stochastice

Teoria clasicǎ a sistemelor dinamice ignorǎ caracteristica stochasticǎ a unorperturbatii care actioneazǎ asupra multor sisteme reale. Practica aratǎ cǎexaminarea rǎspunsului unui sistem la perturbatiile luate uzual în consideratienu conduc automat la concluzii valabile pentru orice alt gen de perturbatie, înparticular pentru cazul perturbatiilor aleatoare.În forma generalǎ a sistemului de ecuatii diferentiale, care descrie evolutia stǎriiunui sistem

dxdt

F t x t G t w t= +( ) ( ) ( ) ( )

nu este precizatǎ forma intrǎrilor. Asadar se poate admite cǎ intrǎrile pot fi siperturbatii w(t) de natura unui proces aleator sau, cum se mai spune, stochastic.Dupǎ cum s-a arǎtat într-o sectiune precedentǎ, sistemul are o matrice detranzitie Φ(t;t0) care satisface ea însǎsi ecuatia omogenǎ

d t tdt

F t t tΦ Φ( ; ) ( ) ( ; )00=

si are proprietatea Φ(t0;t0) = I. Solutia sistemului cu perturbatia w(t) este

x t t t x t G w dt

t

( ) ( ; ) ( ; ) ( ) ( )= + ∫Φ Φ0 0

0

τ τ τ τ

Integrala din expresia solutiei sistemului de ecuatii diferentiale este o integralǎparticularǎ în sensul cǎ ea are altǎ si altǎ valoare pentru fiecare realizare a

113

Page 114: Gheorghe M.Panaitescu - ac.upg-ploiesti.roac.upg-ploiesti.ro/gpanaitescu/msds_2007.pdf · •Retele neuronale •Retele neuronale artificiale stratificate •Analiza multirezolutie

functiei w(t). Desigur, vectorul care descrie starea sistemului este el însusialeator, este la rându-i un proces stochastic. Media la un moment dat t este

Φ+Φ=

=

Φ+Φ==

t

tw

t

t

dGttt

dwGtMxttMtxMt

0

0

)()();();(

)()();(]);([)]([)(

00

00

ττµττµ

ττττµ

deoarece Φ(t;t0) si G(t) sunt matrici cu elemente deterministe sau derivate dinmatrici cu elemente deterministe, iar integrarea este echivalentǎ unei sume.Efectul perturbatiei w(t) asupra stǎrii sistemului modelat este caracterizat încǎmai consistent dacǎ se evalueazǎ si matricea de autocorelatie a vectoruluivariabilelor de stare x(t). Calculul conduce la

2122221111

020001

221121

1

0

2

0

);()(),()();(

);(),();()]()()][()([),(

ττττττττ

µµ

ddtGGt

ttttttttxttxMtt

t

t

t

t

TT

T

T

∫ ∫ ΦΣΦ+

+ΦΣΦ==−−=Σ

Dacǎ în cazul relatiilor deterministe evolutia în timp a unui sistem dinamic eraapreciatǎ exclusiv prin valorile pe care le luau componentele vectorului de stare,în cazul stochastic problema se pune în mod diferit. Comportarea dinamicǎ asistemului este apreciatǎ prin evolutia mediei si prin autocovariatia vectoruluide stare. Tot asa, pentru reglarea automatǎ criteriile de apreciere a calitǎtiireglǎrii sunt diferite. Este o apreciere nu numai în medie ci si prin matricea decovariatie a componentelor vectorului de stare.Modelul procesului dinamic cu intrǎri aleatoare prezentat mai sus este dintr-unpunct de vedere, extrem de particular. Particularitatea lui constǎ tocmai în faptulcǎ elementele stochastice sunt introduse exclusiv ca intrǎri ale sistemului. Înrealitate unele elemente de naturǎ stochasticǎ sunt interioare sistemului. Întermeni mai exacti si consacrati, se spune cǎ variabilele de stare ale unui sistemdinamic se împart în variabile de stare controlabile, acelea care pot fi modificateprin actiunea unor intrǎri si variabile de stare observabile, acelea ale cǎror valorisi evolutie pot fi evaluate sau estimate prin mǎsurǎtorile y(t) la un moment datsau la mai multe momente consecutive. Variabilele care descriu stareasistemului pot sǎ nu fie toate controlabile, pot sǎ nu fie toate observabile, asaîncât cele douǎ multimi de variabile de stare pot sǎ nu coincidǎ si pot fisubmultimi stricte ale multimii tuturor variabilelor care descriu starea unuisistem. Variabilele de stare necontrolabile evolueazǎ imprevizibil, previzibilinsǎ în probabilitate si sunt sursa unor evolutii aleatoare ale celorlalte variabilede stare si, de asemenea, sursa unor observatii sau mǎsurǎtori afectate de asa-numitele zgomote, un alt nume pentru procesele aleatoare de cele mai multe oriparazitare, nedorite.

114

Page 115: Gheorghe M.Panaitescu - ac.upg-ploiesti.roac.upg-ploiesti.ro/gpanaitescu/msds_2007.pdf · •Retele neuronale •Retele neuronale artificiale stratificate •Analiza multirezolutie

Dezvoltarea teoreticǎ de mai sus are o valoare aplicativǎ relativ scǎzutǎ. Eaformuleazǎ numai un nou gen de probleme în legǎturǎ cu dinamica sistemelor,probleme diferite de cele întâlnite la tratarea în maniera clasicǎ a sistemelordeterministe. În practicǎ, de mare utilitate sunt modelele discrete în timp. Suntexaminate mai departe douǎ modalitǎti de tratare a dinamicii sistemelor afectatede prezenta unor fenomene aleatoare dintre cele mai comune în aplicatii care tinde dinamica sistemelor. Unul este modelul ARIMA (AutoRegressive-Integrated-Moving-Average), cu variantele ARMA, ARMAX, ARX etc., cu Xpentru adjectivul eXogen alǎturat intrǎrilor, si este datorat lui Box si Jenkins.Celǎlalt este modelul liniar al lui Wiener perfectionat de Kalman. Ambelemodele se referǎ la sisteme dinamice discrete în timp.

Modelul ARIMA

O relatie intrare-iesire pentru un sistem de ordinul unu se exprimǎ în forma y t a y t b u t( ) ( ) ( )= − + −1 01 1

sau în forma

y t ba B

u t( ) ( )=−

−0

111

unde B este operatorul de deplasare în timp, care aplicat o datǎ opereazǎconform relatiei By(t) = y(t – 1), aplicat de k ori are efectul Bky(t) = y(t – k). Mai general, un sistem de ordinul (r, s, f) este modelat în maniera intrare-iesirede ecuatia

y tb b B b B b B

a B a B a Bu t fs

s

rr( )

......

( )=+ + + +

− − − −− −0 1 2

2

1 221

1

Este limpede cǎ cei trei întregi (r, s, f) au semnificatia numǎrului de valorisuccesive anterioare ale iesirii, care influenteazǎ iesirea sistemului, numǎrul deintrǎri succesive, care au ecou în iesirea curentǎ si, respectiv, întârzierea cu careintrarea actioneazǎ asupra iesirii sistemului.Pentru stabilitate, rǎdǎcinile polinomului de la numitor tratat ca un polinom înoperatorul B trebuie sǎ se situeze toate în afara cercului de razǎ unitate. Modelulde mai sus este de tip determinist si se referǎ la un sistem care are o singurǎintrare si o singurǎ iesire.Un model ARIMA pentru evolutia aleatoare a unui sistem dinamic poate ficonceput ca o serie temporalǎ iesire a unui sistem dinamic care are ca intrarezgomotul alb adicǎ un proces aleator cu autocorelatia nulǎ indiferent deintervalul de timp de decalare. Relatia de definitie a seriei temporale este

N tb B b B

B a B a Ba tq

q

dp

p( )...

( ) ( ... )( )=

+ + +− − − −

11 1

1

1

115

Page 116: Gheorghe M.Panaitescu - ac.upg-ploiesti.roac.upg-ploiesti.ro/gpanaitescu/msds_2007.pdf · •Retele neuronale •Retele neuronale artificiale stratificate •Analiza multirezolutie

în care factorul de la numitor (1 – B)d are d rǎdǎcini pe cercul unitate ceea ceface ca sistemul sǎ poatǎ fi si nestationar dacǎ d > 0 . Celelalte p rǎdǎcini alenumitorului sunt mai mari în modul decât unitatea deoarece, se presupune,sistemul este stabil. Sistemul de mai sus este de ordinul (p, d, q). Un modelcomun si un exemplu pentru discutia curentǎ este cel de ordinul (0, 1, 1)

N t bBB

a t( ) ( )= +−

11

cu a(t) o secventǎ de zgomot alb de medie nulǎ si de dispersie σa2. Expresia

oferǎ o posibilitate de predictie, de anticipare. Cu notatiaN t i t M N t it( / ) [ ( )]+ = +

pentru media statisticǎ a valorilor posibile N(t + i) evaluatǎ la momentul t,succesiunea de ralatii

N t N t a t b B a t( ) ( ) ( ) ( )= − + +1N t t N t b a t( / ) ( ) ( )− = − + −1 1 1

N t N t t a t( ) ( / ) ( )− − =

1asigurǎ predictia cu un pas a valorii N(t). Detaliat, prima relatie din cele trei esterescrierea ecuatiei model al sistemului cu evolutie aleatoare, de ordinul (0, 1, 1).Ecuatia a doua reprezintǎ rezultatul operatiei de mediere la momentul t – 1,când valorile N(t – 1) si a(t – 1) sunt deja cunoscute. Scǎderea primelor douǎrelatii conduce la a treia.În general efectele zgomotului sunt aditive, asa încât modelul ARIMA cu intrǎriare forma

y tP BP B

u t fP B

P Ba ts

r

qd

p

( )( )( )

( )( )

( )( )= − − +

∇1

în care polinoamele în B din formele anterioare sunt exprimate în simbolicaobisnuitǎ cu gradul trecut ca indice. Procesul are ordinul (r, s, f) în partea luideterministǎ, are ordinul (p, d, q) în partea lui aleatoare. De observat notatia∇ = −1 B . Figura alǎturatǎ aratǎ schematic modul cum opereazǎ sistemulconsiderat a avea pe lângǎ intrǎrile reale si intrarea fictivǎ dar cu efecte realeconstituitǎ de zgomotul alb a(t).

116

Page 117: Gheorghe M.Panaitescu - ac.upg-ploiesti.roac.upg-ploiesti.ro/gpanaitescu/msds_2007.pdf · •Retele neuronale •Retele neuronale artificiale stratificate •Analiza multirezolutie

Modelul echivalent dar cu specificarea variabilelor de stare aratǎ astfel x t Ax t Gu t a t( ) ( ) ( ) ( )+ = + +1 Γ

y t H x t( ) ( )=cu x(t) vectorul de stare, y(t) vectorul observatiilor, a(t) vectorul de zgomot alb,u(t) vectorul intrǎrilor, A, G, Γ si H matrici de dimensiuni adecvate. Trecerea dela modelul acesta, care pune în evidentǎ vectorul de stare al sistemului, lamodelul intrare-iesire este relativ usoarǎ

y t H I A B GB u t H I AB B a t V B u t N t( ) ( . ) ( ) ( ) ( ) ( ) ( ) ( )= − + − = +− −1 1 ΓTrecerea inversǎ este mai complicatǎ, fie si numai din motivul neunicitǎtiivectorului de stare, considerând secundarǎ problema pǎrtii neobservabile asistemului modelat. Totusi se poate elabora o reprezentare cu evidentierea unorvariabile de stare, dacǎ relatia intrare-iesire se rescrie sub forma

τ µ α( ) ( ) ( ) ( ) ( ) ( )B y t B u t f B a td= ∇ − − +1în care

τ τ τ( ) ( ) ( ) ...B P B P B B Bdr p n

n= ∇ = − − −1 1

µ µ µ µ( ) ( ) ( ) ...B P B P B B Bs p nn= = − − − −

−0 1 1

1

α α α( ) ( ) ( ) ...B P B P B B Bq r nn= = − − −1 1

cu numǎrul n r p d r q s p= + + + + +max , , 1 . Polinoamele în operatorul B potavea, asadar, unii coeficienti nuli si pot fi de grade mai mici decât n sau n – 1.O primǎ versiune a modelului cu variabile de stare poate fi

+

=

++

++

−−−

)()(

.......)()(

.

01...........

11

)1()1(

.........)1()1(

1

2

1

1

2

1

1

2

1

txtx

txtx

txtx

txtx

n

n

n

n

n

n

ττ

ττ

)(...........)(.......

11

22

11

1

2

1

0

taftu

nn

nn

d

n

n

−−

−−

+−∇

−−

−+

−−

ατατ

ατατ

µµ

µµ

si [ ]y t x t a t( ) . . . ( ) ( )= +1 0 0

A doua posibilitate este

117

Page 118: Gheorghe M.Panaitescu - ac.upg-ploiesti.roac.upg-ploiesti.ro/gpanaitescu/msds_2007.pdf · •Retele neuronale •Retele neuronale artificiale stratificate •Analiza multirezolutie

)1(.......

1

)(.......

)()(

.......)()(

.

001...........

11

)1()1(

.........)1()1(

1

2

1

1

0

1

2

1

2

1

1

2

1

+

−−

−+−∇

−−

−+

+

=

++

++

−−

++

taftu

txtx

txtx

txtx

txtx

n

n

d

n

n

n

nn

n

n

αα

α

µµ

µµ

τ

ττ

si[ ]y t x t( ) . . . ( )= 1 0 0

Ambele reprezentǎri au un minim de variabile care descriu starea sistemuluimodelat. În matricile din partea dreaptǎ care multiplicǎ vectorul de stare,submatricea cu unitǎti pe diagonalǎ este o matrice unitate In–1 de ordinul trecutca indice.Dezvoltǎrile de mai sus sunt sugerate de rescriea ecuatiei intrare-iesire pentruun moment imediat urmǎtor t + 1 , într-o formǎ întrucâtva mai detaliatǎ

)1()()()1()(

)1()...1( 221

++−−=

=+−−−−

taBftuBB

tyBBBd

nn

αµ

τττ

Se sugereazǎ cititorului parcurgerea acestei transformǎri ca exercitiu.

Forma Wiener-Kalman a modelelor pentru sisteme stochastice discrete

În aceastǎ variantǎ de reprezentare a sistemelor liniare stochastice, procesulstochastic observat este compus (descompus) din (în) douǎ componenteînsumate: un semnal (eventual aleator) si un zgomot care afecteazǎ observatiile.Forma

x t A x t G u t w t( ) ( ) ( ) ( )+ = + +1y t Hx t v t( ) ( ) ( )= +

este foarte generalǎ si foarte utilizatǎ. În cele douǎ ecuatii, w(t) si v(t) suntvectori de dimensiunea n respectiv m, care reprezintǎ secvente de zgomot albindependente care au matricile de (auto)covariatie

M w t w t j j RT[ ( ) ( )] ( )+ =δ 1

M v t v t j j RT[ ( ) ( )] ( )+ = δ 2

M w t v t jT[ ( ) ( )]+ = 0

118

Page 119: Gheorghe M.Panaitescu - ac.upg-ploiesti.roac.upg-ploiesti.ro/gpanaitescu/msds_2007.pdf · •Retele neuronale •Retele neuronale artificiale stratificate •Analiza multirezolutie

cu δ(j) functia impuls unitar si cu R1, R2 matrici pozitiv definite si simetrice fatǎde diagonala principalǎ. Modelul poate fi adus la forma ARIMA care dupǎ uniispecialisti are avantajul economiei de parametri si, încǎ mai important, este maiusor de identificat si parametrii ei mai usor de estimat din datele intrare-iesirecare uzual se recolteazǎ de pe sistemele reale. Dupǎ cum s-a discutat, si lamodelele ARIMA anticiparea, predictia, prognozarea evolutiei sistemuluimodelat este foarte importantǎ. Din nou, cea mai bunǎ predictie trebuieînteleasǎ în sensul unei abateri medii pǎtratice minime si ea se realizeazǎ pebaza observatiilor y(t) si a intrǎrilor u(t) curente si anterioare. Aceste anticipǎrise obtin recursiv sau secvential conform relatiei

)]1/()([])1/([)1/()1/()/(

12 −−+−−+−=

=− ttxHtyRHttPHHttPttx

ttxTT

si x t t A x t t G u t( / ) ( / ) ( )+ = +1

cu matrici de covariatie succesive date de relatia

)1/(])1/([)1/()1/()/(

12 −+−−−

−−=− ttPHRHttPHHttP

ttPttPTT

si cuP t t A P t t A RT( / ) ( / )+ = +1 1

cu starea initialǎ x(0/0) si cu covariatia de început P(0/0). În relatiile de mai suscele douǎ argumente care apar separate de bara înclinatǎ trebuie întelese cavalori evaluate la momentul din stânga barei din informatii/date accesibile pânǎla momentul din dreapta barei, inclusiv. Estimǎrile, anticipǎrile, valorileprognozate sunt marcate prin semnul special asezat deasupra valorii, vectoruluisau functiei respective.Regimul stationar, ceea ce rezultǎ dupǎ ce efectul intrǎrilor se stinge, este ceeace foarte frecvent se urmǎreste. Pentru un sistem complet observabil se poatearǎta cǎ matricile P(t/t) si P(t/t – 1) evolueazǎ spre matrici pozitiv definite, devalori unice, constante. Întrucât relatiile pentru aceste matrici nu contin termenisi factori dependenti de observatii, ele pot fi iterate a priori pânǎ când se obtineconvergenta.Estimatorul de stare Kalman – un alt nume pentru secventa de mai sus – poate fiutilizat si pentru ecuatiile de stare asociate cu modelul ARIMA în variantasecundǎ, cu R1 = Γ Σ ΓT si R2 = 0. Când modelul corespunde unei formeARIMA, în forma cu ecuatia de stare si ecuatia de observare, estimatorul stǎriisistemului x t t( / )+ 1 este vectorul x t( )+ 1 însusi care poate fi obtinut directdin ecuatia de stare

=Γ++−=+ )()()1/()/1( tatuGttxAttx

)]1/()([)()1/( −−Γ++−= ttxHtytuGttxA

În plus, deoarece x t t x t( / ) ( )+ = +1 1 , matricea de covariatie

119

Page 120: Gheorghe M.Panaitescu - ac.upg-ploiesti.roac.upg-ploiesti.ro/gpanaitescu/msds_2007.pdf · •Retele neuronale •Retele neuronale artificiale stratificate •Analiza multirezolutie

P t t M x t t x t x t t x t T( / ) [ ( / ) ( )].[ ( / ) ( )] + = + − + + − +1 1 1 1 1

este nulǎ.Acelasi model este valabil si dacǎ matricea A este variabilǎ în timp, ceea ce seîntâmplǎ când sistemul modelat este parametric evolutiv si intrarea sa este nulǎ,chiar si pentru regimul stationar

x t A t t x t G t w t( ) ( , ) ( ) ( ) ( )+ = + +1 1y t H t x t v t( ) ( ) ( ) ( )= +

Conditiile initiale sunt, de asemenea, x x( / ) ( )0 0 0= si P(0/0) = P(0), iarcaracteristicile statistice rǎmân aceleasi, adicǎ matricile de covariatie sunt

M w t w t Q tT[ ( ) ( )] ( )=M v t v t R tT[ ( ) ( )] ( )=M w t v tT[ ( ) ( )]1 2 0=

ultima pentru orice pereche de valori t1, t2. Se mai adaugǎM x x PT[ ( ) ( )] ( )0 0 0= , M x wT[ ( ) ( )]0 0 0= , M x vT[ ( ) ( )]0 0 0=

Extrapolarea, anticiparea sau prognozarea vectorului de stare se face conformrelatiei

x t t A t t x t t( / ) ( , ) ( / )+ = +1 1Matricea de covariatie anticipatǎ este

P t t A t t P t t A t tT( / ) ( , ) ( / ) ( , )+ = + +1 1 1ecuatia de filtrare este

x t t x t t K t y t H t x t t( / ) ( / ) ( )[ ( ) ( ) ( / )]+ + = + + + + − + +1 1 1 1 1 1 1iar matricea de covariatie curentǎ este

P t t I K t H t P t t( / ) [ ( ) ( )] ( / )+ + = − + + +1 1 1 1 1Matricea de amplificare a sistemului se identificǎ a fi

K t P t t H t H t P t t H t R tT T( ) ( / ) ( )[ ( ) ( / ) ( ) ( )]+ = + + + + + + + −1 1 1 1 1 1 1 1

Ca un exemplu, fie un sistem simplu de ordinul unu, cu ecuatia de starex(t + 1) = x(t) + w(t)

în care vectorul w(t) este repartizat normal cu media nulǎ si dispersia unitarǎ sicu ecuatia de observare

y(t) = x(t) + v(t)cu adaosul aleator v(t), la fel, normal reapartizat cu media nulǎ si dispersia 1.Observatiile la t = 0, 1, 2, 3, 4, 5, 6 sunt y(t) = 1, –2, 4, 3, –1, 1, 1. Se cerestimatiile ( / )x t t+ 1 si P(t + 1/t), pentru t = 1, 2, 3, 4, 5, 6, 7 în urmǎtoareleconditii:a) p(0) = ∞, ceea ce corespunde unei totale incertitudini asupra parametrilor

zgomotului;b) p(0) = 0, ceea ce înseanmǎ cǎ estimarea initialǎ este deplin cunoscutǎ;c) p(0) = 1, ceea ce corespunde unei situatii clare sub aspect statistic.Tabelul dat mai jos cuprinde evolutia calculelor de estimare-filtrare.

120

Page 121: Gheorghe M.Panaitescu - ac.upg-ploiesti.roac.upg-ploiesti.ro/gpanaitescu/msds_2007.pdf · •Retele neuronale •Retele neuronale artificiale stratificate •Analiza multirezolutie

t 0 1 2 3 4 5 6)/(ˆ ttx 0 1 –1 2.125 2.667 0.4 0.771

P(t/t) 0 1 0.667 0.625 0.619 0.618 0.618( / )x t t+ 1 0 1 –1 2.125 2.667 0.4 0.771P(t + 1/t) ∞ 2 1.667 1.625 1.619 1.618 1.618K(t + 1) 1 0.697 0.625 0.619 0.618 0.618 0.618

)1/1(ˆ ++ ttx 1 –1 2.125 2.667 0.7 0.771 0.912P(t + 1/t + 1) 1 0.667 0.625 0.619 0.618 0.618 0.618

În cazul liniar si continuu, filtrul Kalman are aspectul urmǎtor: ecuatia de starese prezintǎ ca

dxdt

F t x t G t w t= +( ) ( ) ( ) ( )

iar ecuatia de observarey(t) = H(t)x(t) + v(t)

Caracteristicile statistice ale proceselor aleatoare w(t) si v(t) sunt caracterizateprin medii nule, zgomot alb, lipsǎ de corelare mutualǎ.Conditiile initiale sunt ( )x x0 0= si P M x x PT( ) [ ( ) ( )]0 0 0 0= = .Ecuatia de filtrare are forma diferentialǎ

dx tdt

F t x t K t y t H t x t( ) ( ) ( ) ( )[ ( ) ( ) ( )]= + −

Matricea de amplificare are expresiaK t P t H t R tT( ) ( ) ( ) ( )= −1

Matricea de covariatie rezultǎ din relatiadP t

dtF t P t P t F t P t H t R H t P t G t Q t G tT T T( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( )= + − +−1

Schema algoritmicǎ cu sistemul, cu observarea si filtrarea se mentine ca maisus. Dacǎ existǎ intrǎri u(t) atunci se introduce în ecuatia de anticipare-prognozare contributia acestora, G(t)u(t).Un exemplu mai detaliat: Estimarea unei constante aleatoareModelul procesului. În acest exemplu simplu se prezintǎ încercarea de a estimao constantǎ afectatǎ de zgomot, de pildǎ o tensiune. Se presupune cǎ se potmǎsura/observa valori ale constantei dar observatiile/mǎsurǎtorile sunt afectatede un zgomot alb care are o abatere medie pǎtraticǎ de 0,1 volti. În exemplul defatǎ procesul este guvernat de ecuatia liniarǎ

kkkkkk wxwBuAxx +=++= −− 11

si se face o singurǎ mǎsurǎtoare care urmeazǎ relatia

121

Page 122: Gheorghe M.Panaitescu - ac.upg-ploiesti.roac.upg-ploiesti.ro/gpanaitescu/msds_2007.pdf · •Retele neuronale •Retele neuronale artificiale stratificate •Analiza multirezolutie

kkkkk vxvHxy +=+=Starea nu se schimbǎ de la un pas la altul si de aceea A = 1. Nu existǎ vreocomandǎ/intrare si de aceea u = 0. Mǎsurǎtoarea afectatǎ de zgomot este stareaînsǎsi si de aceea H = 1. (Dacǎ în continuare uneori se renuntǎ la indici, estepentru cǎ mǎrimile respective sunt constante).Ecuatiile si parametrii filtrului. Ecuatiile de actualizare în timp sunt

1ˆˆ −− = kk xx

QPP kk += −−

1

si ecuatiile de actualizare a mǎsurǎtorilor sunt

( )RP

PRPPK

k

kkkk +

=+=−

−−−− 1

( )−− −+= kkkkk xyKxx ˆˆˆ( ) −−= kkk PKP 1

Se admite o varianţǎ micǎ pentru proces, Q = 1.10–5 (Se poate lua Q = 0, dar cuo dispersie micǎ dar nenulǎ acordarea filtrului se dovedeste mai flexibilǎ). Sepresupune cǎ se cunoaste din experientǎ faptul cǎ valoarea constantei de estimatare o lege de distributie statisticǎ normalǎ. Asadar, o pornire cu valoarea 1,1este acceptabilǎ. Prin urmare, se pune la pornire 1,1ˆ 1 =−kx .Similar, trebuie aleasǎ o valoare initialǎ pentru Pk–1, sǎ-i spunem P0. Dacǎ esteabsolut sigur cǎ estimarea initialǎ 1,1ˆˆ 01 ==− xxk este corectǎ se poate pune P0 =0. Totusi, datǎ fiind incertitudinea asupra estimǎrii initiale 0x , prin alegerea P0

= 0 se aduce filtrul la întelesul cǎ initial si la orice moment 0ˆ =kx . Cumcalculul o dovedeste, alegerea nu este criticǎ. Se poate alege P0 nenul si filtrulva aduce o convergentǎ ulterioarǎ la un P legat de realitate. Se va porni aici cuP0 = 0,5.Simulǎri. Pentru început se alege valoarea constantei scalare y = 1 (fǎrǎ vreo“cǎciulǎ” pentru cǎ valoarea aleasǎ reprezintǎ “adevǎrul”). Se simuleazǎ apoi unnumǎr de 100 de observatii/mǎsurǎri distincte yk afectate de erori distribuitenormal cu media zero si o deviatie standard de 0,1, asa cum s-a admis mai sus.Mǎsurǎtorile individuale pot fi generate în chiar bucla filtrului dar s-a preferatpre-generarea lor pentru posibile comparatii în parcurgerea estimǎrii cu diversiparametri.În prima simulare s-a fixat dispersia mǎsurǎtorilor la R = (0,1)2 = 0,01. Dincauzǎ cǎ aceasta este adevǎrata dispersie a erorilor de mǎsurare este de asteptatca filtrul sǎ arate cea mai bunǎ performantǎ sub aspectul capacitǎtii de rǎspunssi al varianţei estimǎrii. Acest fapt va deveni mai vizibil în simularea a doua si atreia prezentate mai departe. Figura alǎturatǎ aratǎ rezultatele primei simulǎri. Valoarea adevǎratǎ aconstantei estimate este, cum s-a spus, x = 1 si este reprezentatǎ de linia dreaptǎ

122

Page 123: Gheorghe M.Panaitescu - ac.upg-ploiesti.roac.upg-ploiesti.ro/gpanaitescu/msds_2007.pdf · •Retele neuronale •Retele neuronale artificiale stratificate •Analiza multirezolutie

orizontalǎ continuǎ; mǎsurǎtorile afectate de zgomot sunt reprezentate prin “+”si valoarea estimatǎ este situatǎ pe curba continuǎ.

0 10 20 30 40 50 60 70 80 90 1000.6

0.7

0.8

0.9

1

1.1

1.2

1.3

Iteratia

Te

ns

iun

e (

V)

F ILTRA RE A K A LM A N A UNE I TE NS IUNI (R= 0,01)

0 5 10 15 200

0.05

0.1

0.15

0.2

0.25

0.3

0.35

0.4

0.45

0.5

P (

V)2

Iteratia

20 40 60 80 1003

3.5

4

4.5

5

5.5

6x 10

-4

P (

V)2

Iteratia

123

Page 124: Gheorghe M.Panaitescu - ac.upg-ploiesti.roac.upg-ploiesti.ro/gpanaitescu/msds_2007.pdf · •Retele neuronale •Retele neuronale artificiale stratificate •Analiza multirezolutie

Când s-a discutat mai sus despre alegera matricei P0 s-a arǎtat cǎ alegerea nueste criticǎ atât timp cât este nenulǎ deoarece filtrul va converge cândva maitârziu la valori corecte. În figura arǎtatǎ imediat mai sus s-au reprezentatvalorile pentru Pk în succesiunea iteratiilor. La iteratia a 100-a valoarea Pk s-aasezat, fatǎ de valoarea initialǎ grosierǎ de 0,5, la circa 0,00032 (V)2.În figurile urmǎtoare se poate vedea ce se întâmplǎ când R este mǎrit saumicsorat cu un factor de 100.

0 10 20 30 40 50 60 70 80 90 1000.6

0.7

0.8

0.9

1

1.1

1.2

1.3

Iteratia

Te

ns

iun

e (

V)

F ILTRARE A K A LM A N A UNEI TE NS IUNI (R= 1)

0 10 20 30 40 50 60 70 80 90 1000.6

0.7

0.8

0.9

1

1.1

1.2

1.3

Iteratia

Te

ns

iun

e (

V)

F ILTRA RE A K A LM A N A UNE I TENS IUNI (R=0,0001)

124

Page 125: Gheorghe M.Panaitescu - ac.upg-ploiesti.roac.upg-ploiesti.ro/gpanaitescu/msds_2007.pdf · •Retele neuronale •Retele neuronale artificiale stratificate •Analiza multirezolutie

În prima figurǎ filtrul “aflǎ” cǎ R = 1, de 100 de ori mai mare decât normal, asaîncât el este mai retinut în “a crede” în mǎsurǎtori.În figura a doua filtrul este informat cǎ dispersia mǎsurǎtorilor este de 100 deori mai micǎ fatǎ de normal, R = 0,0001, asa încât el devine foarte încrezǎtor înmǎsurǎtori.Desi estimarea unei constante este relativ simplǎ si directǎ, ea demonstreazǎclar cum lucreazǎ un filtru Kalman. În toate cazurile estimarea este considerabilmai netedǎ decât mǎsurǎtorile.Se pune uneori problema ajustǎrii performantelor filtrului prin alegereaadecvatǎ a parametrilor R si Q.

Estimarea recursivǎ a parametrilor unui model

Acest mod de estimare a parametrilor unui model al dinamicii unui sistem sedeosebeste de cel prezentat într-un paragraf precedent prin maniera în care suntprelucrate datele experimentale. Dacǎ în discutia anterioarǎ datele erau colectatesi apoi prelucrate în totalitatea lor, în formularea diferitǎ a problemei datǎ înacest capitol datele sunt colectate treptat si prelucrate în acelasi mod, prinadǎugarea la fiecare etapǎ a unor informatii noi privind sistemul modelat si,eventual, renuntarea la informatii mai vechi, cǎzute în desuetudine. Desigur, s-ar putea proceda la prelucrarea ansamblului de date dupǎ una din metodeledezvoltate mai devreme, pe mǎsura dezvoltǎrii lui. Volumul de calcul ar cresteînsǎ inacceptabil dupǎ relativ putini pasi în acumularea de informatii privindsistemul modelat. Este necesar si potrivit sub raportul timpului de calcul si almemoriei necesare a se folosi informatia sinteticǎ obtinutǎ deja si corectarea eiprin contributia informatiei nou sosite. De pildǎ, sistemului descris de relatiaintrare-iesire

γ µ α( ) ( ) ( ) ( ) ( ) ( )B y t B u t B a t+ = +1cu γ(B), µ(B), α(B) polinoame în operatorul de deplasare B [By(t) = y(t – 1)],fǎrǎ divizori comuni, γ(B) cu rǎdǎcini în afara cercului unitate, i se pot estimaparametrii din date de forma

y t y t y t m u t d u t d u t d m( ), ( ),..., ( ), ( ), ( ),..., ( )− − − − − − − −1 1 2recoltate pânǎ la momentul t si care tine seamǎ de o eventualǎ întârziere d înreactia sistemului la intrǎrile aplicate. Numǎrul m este ordinul sistemului, suntde estimat 2m parametri si, în consecintǎ, sunt necesare N > 2m seturi de date detipul arǎtat.Cu intrǎrile si iesirile mǎsurate se poate scrie

)(~)()(...)1()(...)1()()(

1

1

tytymdtudtumtytytyte

m

m

−=−−−−−−−−−++−+=

µµγγ

cu θψ )()(~ tty T= în care, în detaliu

125

Page 126: Gheorghe M.Panaitescu - ac.upg-ploiesti.roac.upg-ploiesti.ro/gpanaitescu/msds_2007.pdf · •Retele neuronale •Retele neuronale artificiale stratificate •Analiza multirezolutie

])()1()()1([)( mdtudtumtytytT −−−−−−−−= ψ][ 11 mm

T µµγγθ =În metoda celor mai mici pǎtrate ar fi, de pildǎ, de minimizat o sumǎ de pǎtrate

S e tt m d

N m d

== +

+ +

∑ 2( )

Caracterul recursiv apare dupǎ ce într-o primǎ fazǎ se evalueazǎ parametrii prinmetoda celor mai mici pǎtrate în maniera clasicǎ, nu recursivǎ. Cu notatiile

])()1()([ NdmydmydmyyT +++++=

Ψ =− + − − + − −

− + − + − − +

− + + − − + + − − +

− −−

+ − + −

y m d y m d y dy m d y m d y d

y m d N y m d N y d N

u m u m uu m u m u

u m N u m N u N

( ) ( ) ... ( )( ) ( ) ... ( )

... ... ... ...( ) ( ) ... ( )

( ) ( ) ... ( )( ) ( ) ... ( )... ... ... ...

( ) ( ) ... ( )

1 21 1

1 2

1 2 01 1

1 2sistemul

Ψθ = yse rezolvǎ multiplicând la stânga relatia matricialǎ de mai sus, cu inversageneralizatǎ a matricei observatiilor si intrǎrilor Ψ

yPy TTT Ψ=ΨΨΨ= −1)(θunde s-a notat cu P matricea (ΨTΨ)–1. O nouǎ mǎsurǎtoare se concretizeazǎ într-o linie nouǎ în matricea Ψ si un element suplimentar în y. Se scrie

)1()1()()1( 11 +++=+ −− tttPtP Tψψcu ψ vectorul care transpus devine linie în matricea Ψ. Ultima formulǎ are labazǎ teorema inversǎrii binomiale a matricilor

1111111 )()( −−−−−−− +−=+ MAAMABAMMMABA TTT

usor de demonstrat, care aplicatǎ pentru P –1(t +1) conduce la=+++=+ −− 11 )]1()1()([)1( tttPtP Tψψ

)()1()]1()()1(1)[1()()( 1 tPtttPtttPtP TT +++++−= − ψψψψnecesarǎ la evaluarea estimǎrii urmǎtoare, la pasul t + 1, a vectorului deparametri

)1()1()1()1(ˆ ++Ψ+=+ tyttPt TθMai importantǎ este aceeasi relatie scrisǎ în functie de ( )θ t . Primul pas constǎîn evaluarea produsului ΨΤy la pasul t + 1 care este

126

Page 127: Gheorghe M.Panaitescu - ac.upg-ploiesti.roac.upg-ploiesti.ro/gpanaitescu/msds_2007.pdf · •Retele neuronale •Retele neuronale artificiale stratificate •Analiza multirezolutie

)1()1()1()1(

+++Ψ=

+−−−−−

+

−−−−−Ψ

tytyty

y

t

T

T

T

ψ

ψapoi, cu notatia

1)]1()()1(1[ −+++= ttPtT ψψαse obtine

−+++++−=

=+++Ψ++−=+

)1()1()()(ˆ)1()1()()(ˆ)]1()1()][()1()1()()([)1(ˆ

tyttPttttPt

tytytPtttPtPtT

TT

ψθψψαθ

ψψψαθ

)](ˆ)1()1()[1()()(ˆ

)1()1()()11()(ˆ)1()1()()(ˆ

)1()1()()1()1()(

tttyttPt

tyttPttttPt

tyttPtttP

T

T

T

θψψαθ

ψα

ααθψψαθ

ψψψα

+−+++=

=++−−+++−=

=++++−

unde, evident, ααψψ /)1()1()()1( −=++ ttPtT , ceea ce permite începereaestimǎrii cu ( )θ 0 0= si P(0) = M.I cu M un numǎr mare si I matricea unitate.Vectorul

K t P t t( ) ( ) ( )+ = +1 1α ψeste interpretat ca un vector al amplificǎrilor si cu notatia

)(ˆ)1()1()1( tttyt T θψε +−+=+relatia de recurenţǎ devine

( ) ( ) ( ) ( )θ θ εt t K t t+ = + + +1 1 1Din ratiuni practice vizând convergenta calculului de estimare, mai ales când seporneste cu ( )θ 0 0= , în expresia lui α se pune nu 1 ci ω(t) definit de expresiarecursivǎ

ω ω ω ω( ) ( ) ( )t t+ = + −1 10 0

cu ω 0 = 0,99 valoare apropiatǎ de 1 si cu ω(0) apropiat de asemenea de 1 si cuîmpǎrtirea matricii P(t +1) cu ω(t +1), P(t +1)/ω(t +1). Acest ω(t) mai are rolulde a face uitate estimǎrile slabe/inconsistente din fazele timpurii ale operatiei deestimare recursivǎ. Mǎrimea variabilǎ ω(t) tinde asimptotic cǎtre 1, ceea ce sepoate verifica imediat prin teoria progresiilor geometrice.Metoda celor mai mici pǎtrate nu este singura modalitate de estimare recursivǎa parametrilor unui model dinamic. Formulele specifice metodelor recursivesunt în general

)]1()()1()1(/[)1()()1( +++++=+ tztPtttztPtK Tψω++++−=+ )1(/[)()1()1()()()1( ttPttztPtPtP T ωψ

)1(/)]1()()1( ++++ ttztPtT ωψ

127

Page 128: Gheorghe M.Panaitescu - ac.upg-ploiesti.roac.upg-ploiesti.ro/gpanaitescu/msds_2007.pdf · •Retele neuronale •Retele neuronale artificiale stratificate •Analiza multirezolutie

Relatiile acestea se diversificǎ prin “umplerea” vectorilor z(t) si ψ(t) cu anumitevalori particulare. Se obtin metodele enumerate imediat.Metoda celor mai mici pǎtrate recursivǎ cu z(t) = ψ(t), ca mai sus.În cazul în care diferentele reziduale ε(t) sunt corelate, parametrii estimati potcontine diferente semnificative/sistematice fatǎ de cei care reprezintǎ într-adevǎr sistemul modelat. Se produce o convergentǎ la valori diferite sistematicde valorile reprezentative.Metoda celor mai mici pǎtrate generalizatǎ, elaboratǎ pentru a rezolvaproblema diferentelor reziduale corelate, cu z(t) = ψ(t) si implementatǎ în douǎetape iterative care alterneazǎ:a) cele mai mici pǎtrate recursive pentru parametrii propriu-zisi ai modeluluib) cele mai mici pǎtrate recursive pentru reziduale, o autoregresie care filtreazǎpartea corelatǎ si care are ca rezultat reziduale necorelate.Metoda celor mai mici pǎtrate extinsǎ, similarǎ metodei celor mai mici pǎtrategeneralizatǎ, cu cele douǎ etape ale metodei anterioare puse laolaltǎ, parametriimodelului si parametrii de autoregresie pentru reziduale sunt grupati într-unvector unic, extins

][ 111 mmmT δδµµγγθ =

cu δi, unii nuli, parametri într-un polinom δ(B) care apare la numǎrǎtorulfractiei-filtru care multiplicǎ rezidualele ε(t). Estimarea se face concomitent si

][)()( TTTTT uyttz εψ −==în care

])()1([ mtytyyT −−=

])()1([ mtutuuT −−=

)]()1([ mttT −−= εεε

si)(ˆ)1()1()1( tttyt T θψε +−+=+

Metoda verosimilitǎtii maxime este cu vectorul parametrilor de estimat acelasica mai sus

][ 111 mmmT δδµµγγθ =

dar, în notatii ca mai sus, cu

][)(

1)()( TTTTT uyB

ttz εδ

ψ −⋅==

si ε(t) determinat din ecuatiaδ ε γ µ( ) ( ) ( ) ( ) ( ) ( )B t B y t B u t= −

ceea ce presupune rezolvarea la fiecare pas al estimǎrii, a unui sistem de ecuatiiîn necunoscutele ε. Se acceptǎ uneori solutia aproximativǎ

)(ˆ)1()1()1( tttyt T θψε +−+=+

128

Page 129: Gheorghe M.Panaitescu - ac.upg-ploiesti.roac.upg-ploiesti.ro/gpanaitescu/msds_2007.pdf · •Retele neuronale •Retele neuronale artificiale stratificate •Analiza multirezolutie

Metoda variabilei instrumentale este singura metodǎ în care z(t) este diferit deψ(t), care se mentine acelasi ca în cazul metodei celor mai mici pǎtraterecursivǎ

])()1()()1([)( mtutumtytytT −−−−−−= ψla fel rǎmân vectorul parametrilor de estimat

][ 11 mmT µµγγθ =

si relatia de calcul al diferentei experimental – estimat/anticipat)(ˆ)1()1()1( tttyt T θψε +−+=+

Vectorul asa-numitelor variabile instrumentale z(t) trebuie sǎ satisfacǎ coditiile

∑=

=∞→

N

t

T RttzNN 1

)()(1limψ

cu R o matrice nesingularǎ si

0)()()(1lim

1

=∞→ ∑

=

N

t

T tettzNN

δ

Asadar z(t) este un vector de componente necorelate cu cele ale vectoruluirezidualelor filtrate prin δ(B) care poate fi δ(B) ≡ 1. Existǎ deci posibilitateaunei alegeri în ceea ce priveste z(t). Literatura recomandǎ, de pildǎ,

])()1()()1([)( mtutumtxtxtzT −−−−−−=

cu

x t BB

u t( ) ( )( )

( )= µδ

intrǎrile filtrate cu polinoamele supraliniate de grad m la numitor si mai mic cam la numǎrǎtor. În particular, µ( )B si δ ( )B pot fi chiar polinoamele în B careapar în modelul sistemului, estimate pânǎ la momentul curent. Se poate utilizala fel de bine o tehnicǎ bootstrap, în vectorul z(t), în pozitiile x-ilor se pun

)(ˆ)()(ˆ ttztx T θ=cu componentele x(t) la început, la pornire arbitrare.

Probleme

Problema 1. Se aruncǎ douǎ zaruri, unul corect, altul incorect. Cel incorect areprobabilitǎtile fetelor cu 1, 2, 3, 4, 5, 6 puncte nu egale ci P(1) = P(2) = P(3) =2P(4) = 2P(5) = 2P(6). Fie X variabila aleatoare care ia valorile de pe zarulcorect si Y variabila aleatoare care ia valori conform zarului incorect.

a) Calculati probabilitǎtile asociate valorilor variabilei aleatoare Yb) Calculati valorile medii si dispersiile celor douǎ variabile aleatoare, X si

Yc) Fie Z variabila aleatoare Z = X – Y. Valorile posibile ale lui Z sunt 0, ±1,

±2, ±3, ±4, ±5. Evaluati probabilitǎtile P(Z = 0), P(Z = ±1), P(Z = ±2),

129

Page 130: Gheorghe M.Panaitescu - ac.upg-ploiesti.roac.upg-ploiesti.ro/gpanaitescu/msds_2007.pdf · •Retele neuronale •Retele neuronale artificiale stratificate •Analiza multirezolutie

P(Z = ±3), P(Z = ±4), P(Z = ±5). Faceti o diagramǎ P(Z = z) cu z înabscisǎ, pentru z = 0, ±1, ±2, ±3, ±4, ±5.

d) Fie S o secventǎ de 36 de perechi (i, j), cu i = 1, 2, 3, 4, 5, 6 valori alevariabilei aleatoare X, cu j = 1, 2, 3, 4, 5, 6 valori ale variabilei aleatoareY. În altǎ exprimare X(i, j) = i, Y(i, j) = j pentru oricare din perechilesecventei, (i, j)∈S. Fie evenimentul Z = 4. Calculati probabilitatea caevenimentul acesta sǎ nu aparǎ nici mǎcar o datǎ într-o asemeneasecventǎ.

Problema 2. Se alege la întâmplare o lunǎ a anului. Apoi se alege o zi din acealunǎ tot la întâmplare (se admite cǎ anul nu este bisect).

a) Descrieti toate rezultatele (lunǎ, zi) care formeazǎ spatiul evenimentelorpentru acest experiment aleator

b) Care este probabilitatea ca luna sǎ fie de 31 de zile?c) Care este probabilitatea ca ziua aleasǎ sǎ fie între a zecea (inclusiv) si a

douǎzecea (inclusiv)?d) Care este rǎspunsul la punctul c) dacǎ anul este bisect?

Problema 3. Fie A, B evenimente produse de un acelasi experiment aleator.Dacǎ probabilitatea ca cel putin unul din cele douǎ evenimente sǎ se producǎeste 0,7 si dacǎ probabilitatea ca cel putin unul din cele douǎ evenimente sǎ nuse producǎ este 0,6, calculati probabilitatea ca exact unul dintre cele douǎevenimente sǎ se producǎ.

Problema 4. Trei evenimente A, B, C asociate cu un anumit experiment aleatorsatisfac relatiile urmǎtoare:

• P(A) = 0,25; P(B) = 0,2; P(C) = 0,25• P(A ∩ B) = 0,1; P(A ∩ B ∩ C) = 0,05; P(A∩ C) = 2P(B ∩ C)• Probabilitatea ca cel putin douǎ din evenimentele A, B, C sǎ se producǎ

este 0,3a) Calculati probabilitatea ca nici unul dintre cele trei evenimente sǎ nu se

producǎb) Calculati probabilitatea ca sǎ se producǎ exact unul dintre cele trei

evenimente

Problema 5. O variabilǎ aleatoare continuǎ X are functia de densitate deprobabilitate

∈∈

=]1,0[\0

]1,0[2)(

Rxxx

xf X

a) Verificati cǎ functia de mai sus este într-adevǎr o densitate deprobabilitate.

130

Page 131: Gheorghe M.Panaitescu - ac.upg-ploiesti.roac.upg-ploiesti.ro/gpanaitescu/msds_2007.pdf · •Retele neuronale •Retele neuronale artificiale stratificate •Analiza multirezolutie

b) Calculati media si dispersia variabilei aleatoare.c) Comparati valorile de la punctul anterior cu media, respectiv dispersia

unei variabile aleatoare continue, repartizatǎ uniform pe intervalul [0,1].

Problema 6. Fie X o variabilǎ aleatoare continuǎ cu densitatea de probabilitate

<≥=

000)(

xxexf

x

X

(legea de repartitie exponentialǎ).a) Verificati cǎ functia de mai sus este o densitate de probabilitate (sub alt

nume, o densitate de repartitie).b) Stabiliti functia de repartitie a variabilei X.c) Calculati probabilitatea ca variabila X sǎ ia valori cuprinse între 1 si 2.d) Calculati media si dispersia variabilei X.

Exercitii de autoevaluare

1. Prin calitatea de a fi ortogonal, un plan de experimentare aduce ca avantaje:a) facilitarea analizei semnificatiei efectului datorat fiecǎrei variabile

independenteb) diversificarea punctelor experimentale în spatiul variabilelor

dependentec) facilitarea calculului unei relatii de regresie

Marcati afirmatia inadecvatǎ.2. În estimarea recursivǎ prin metoda celor mai mici pǎtrate a parametrilor θ ai

unui sistem dinamic se foloseste relatia)](ˆ)1()1()[1()()(ˆ)1(ˆ tttyttPtt T θψψαθθ +−+++=+

cu notatiile cunoscute. Continutul parantezei drepte, )(ˆ)1()1( ttty T θψ +−+este:

a) diferenta dintre iesirea efectiv observatǎ si valoarea ei prezisǎb) eroarea de predictie a modelului recursiv la un moment datc) diferenta a douǎ numere oarecare

Marcati afirmatia inadecvatǎ.3. În relatia din problema precedentǎ, factorul )1()( +ttP ψα , care multiplicǎ

paranteza dreaptǎ este:a) un factor care multiplicǎ eroarea de predictie pentru a corecta

vectorul de stareb) un factor care multiplicǎ eroarea de predictie pentru a corecta

vectorul de parametric) un factor de amplificare al estimatorului

Marcati afirmatia inadecvatǎ.

131

Page 132: Gheorghe M.Panaitescu - ac.upg-ploiesti.roac.upg-ploiesti.ro/gpanaitescu/msds_2007.pdf · •Retele neuronale •Retele neuronale artificiale stratificate •Analiza multirezolutie

4. O listǎ de valori ale unei variabile aleatoare x observate experimental, x1, …,xN , este o selectie. Media de selectie x este media aritmeticǎ a valorilorobservate si este tot o variabilǎ aleatoare. Dispersia variabilei x este:

a) egalǎ cu aceea a variabilei xb) de N ori mai micǎ fatǎ de aceea a variabilei xc) de N ori mai micǎ fatǎ de aceea a variabilei x

8. Se dau densitǎtile de repartitie

=restîn

xxf

0]1,0[1

)(1 si ∈

=restîn

xxxf

0]1,0[2

)(2 .

Se noteazǎ cu 21σ , respectiv cu 2

2σ dispersiile celor douǎ variabile aleatoarecare au repartitiile descrise de f1(x), f2(x). Marcati în seventa de mai josrelatia corectǎ între cele douǎ dispersii.

a) 22

21 σσ < ; b) 2

221 σσ = ; c) 2

221 σσ >

6. Coeficientul de corelatie a douǎ variabile aleatoare este:a) un numǎr oarecare,b) un numǎr pozitiv subunitar sauc) un numǎr care apartine intervalului [–1, 1]?

132

Page 133: Gheorghe M.Panaitescu - ac.upg-ploiesti.roac.upg-ploiesti.ro/gpanaitescu/msds_2007.pdf · •Retele neuronale •Retele neuronale artificiale stratificate •Analiza multirezolutie

METODE NECONVENTIONALE ÎN MODELAREA DINAMICIISISTEMELOR

• Analiza componentelor principale• Regresia prin componente principale• Metoda celor mai mici pǎtrate partiale• Retele neuronale• Retele neuronale artificiale stratificate• Analiza multirezolutie• Exercitii de autoevaluare

În anii din urmǎ au apǎrut si sunt în plinǎ dezbatere metode noi de tratare adinamicii sistemelor prin modelare si simulare. Aceste tehnici noi sunt generatede unele neajunsuri ale metodelor care pot fi numite clasice.Astfel, metodele regresionale traditionale au neajunsul cǎ a) forma algebricǎ arelatiilor-model trebuie sa fie cunoscutǎ; b) este necesarǎ o sortare cât de câtclarǎ a variabilelor în douǎ clase: independente si dependente.Pe de altǎ parte, ipoteza liniaritǎtii este greu de satisfǎcut pentru multe dinsistemele fizice, reale.În sfârsit, studiul sistemelor în domeniul timp si în domeniul frecventelor esteafectat de aspecte contradictorii privitoare la localizarea în timp a fenomenelorsi la localizarea lor în frecventǎ.Problema independentei sau dependentei variabilelor este rezolvatǎ cel putinsatisfǎcǎtor de analiza componentelor principale (PCA – de la PrincipalComponent Analysis). Regresia în spatii în care componentelor principale aufost puse în evidentǎ este tratatǎ prin metoda celor mai mici pǎtrate partiale(PLS – de la Partial Least Squares) în conditii de liniaritate sau de neliniaritate.Forma relatiilor de regresie înceteazǎ a mai fi o problemǎ dacǎ se folsescretelele neuronale. Problema alegerii unor anumite relatii în care sǎ sedetermine anumiti coeficienti se transformǎ în stabilirea unei structuri adecvatea retelei neuronale utilizate, în selectarea unor functii de activare a neuronilorartificiali din retea, în evaluarea unor ponderi asociate legǎturilorinterneuronale. Problema liniaritǎtii se estompeazǎ în cazul utilizǎrii retelelorneuronale.Prin mijlocirea asa-numitelor functii wavelet – numele lor ar putea fi traduse înromâneste, dupǎ modelul frantuzesc (ondelettes), prin undelete – se rezolvǎstrǎlucit problemele legate de localizarea în timp si în frecventǎ a unor

133

Page 134: Gheorghe M.Panaitescu - ac.upg-ploiesti.roac.upg-ploiesti.ro/gpanaitescu/msds_2007.pdf · •Retele neuronale •Retele neuronale artificiale stratificate •Analiza multirezolutie

fenomene tranzitorii, deci variabile în timp. Analiza multirezolutivǎ (MRA – dela MultiResolution Analysis) face posibilǎ abordarea concomitentǎ afenomenelor rapide si lente într-o tratare unitarǎ.Aceste metode, în aspectele lor cele mai elementare dar fundamentale suntprezentate în sectiunea prezentǎ.

Analiza componentelor principale

Nu sunt putine situatiile în care volumul de date experimentale este importantdar valorile notate, înregistrate, stocate nu spun mare lucru despre relatiiledintre variabilele observate. Analiza componentelor principale este (încǎ) unadin metodele statistice de analizǎ a relatiilor între variabile diverse într-unspatiu multidimensional. Eficienta ei este doveditǎ în special în cazurile foartefrecvente când stabilirea variabilelor independente si dependente ale unuisistem nu este o problemǎ simplǎ. În esentǎ, variabilele observate sunt afectatede zgomote si, posibil, sunt mutual corelate. Prin analiza componentelorprincipale ele sunt reduse la o multime de variabile latente care sunt expresiaunui gen de sumar al informatiei relevante asupra sistemului obtinutǎ printr-oproiectie a informatiei brute pe un subspatiu de dimensiune mai redusǎ. Analizacomponentelor principale este o procedurǎ de a explica întreaga variatie adatelor observate, grupate uzual într-o matrice X Rm n∈ + , cu m numǎrul deobservatii si cu n numǎrul de variabile observate. Descompunerea conformmetodei cunoscutǎ sub numele de analiza componentelor principale este datǎ deexpresia

X t p t p t p ET Tk k

T= + + + +1 1 2 2 ...unde ti si pi sunt, pentru orice i = 1, 2, …, k, vectori scor, respectiv vectoriloading, iar E este o matrice de diferente reziduale care completeazǎ sumapentru a avea loc egalitatea. Vectorii ti sunt mutual ortogonali. Vectorii pi larândul lor sunt de asemenea ortogonali dar mai sunt si de lungime egalǎ cuunitatea. Numǎrul de termeni în suma de mai sus nu poate depǎsi n. Primacomponentǎ principalǎ este aceea care explicǎ cea mai mare parte a variatiilordin matricea de observatii X. În spatiul n-dimensional al vectorilor pi, vectorulp1 este pe directia celei mai mari variabilitǎti a datelor si vectorul t1 esteproiectia fiecǎrui vector de observatii pe directia datǎ de p1. De aici si expresiat1 = Xp1.A doua componentǎ principalǎ este aceea care este a doua ca importantǎ. Eaeste ca si prima o combinatie liniarǎ a vectorilor variabilelor observate si esteortogonalǎ în raport cu prima. Mai departe, componentele sunt ordonatedescrescǎtor, în ordinea contributiei lor la variatia generalǎ a datelor observate.Pentru o matrice X de rang n se pot stabili n asemenea componente. Dacǎ suntcorelatii puternice între variabilele observate si zgomote importante leafecteazǎ, atunci se retin numai k < n astfel de componente care pot fi suficiente

134

Page 135: Gheorghe M.Panaitescu - ac.upg-ploiesti.roac.upg-ploiesti.ro/gpanaitescu/msds_2007.pdf · •Retele neuronale •Retele neuronale artificiale stratificate •Analiza multirezolutie

pentru a explica variabilitatea datelor observate. Restul componentelor sunt lasau sub nivelul zgomotelor si prin eliminarea lor, procedurǎ obisnuitǎ, se obtineun benefic efect de filtrare. Calculul componentelor principale se poate face pecǎi diverse. Una din posibilitǎti constǎ în determinarea asa-numitelor valorisingulare ale matricei X urmatǎ de descompunerea acesteia conform relatiei

X U V u v u v u vT T Tn n n

T= = + + +Σ σ σ σ1 1 1 2 2 2 ...cu valorile singulare ordonate crescǎtor, nσσσ <<< 21 . Prima componentǎprincipalǎ este σ1u1, primul vector loading este v1 etc.Algoritmul alternativ este cel al celor mai mici pǎtrate partiale, iterativ sineliniar. Acest algoritm calculeazǎ pe rând fiecare componentǎ principalǎ.Perechea t p1 1, este calculatǎ din matricea X, celelalte sunt evaluate analog dinmatricile rezidualelor rezultate la fiecare etapǎ

X t p ET= +1 1 1

E t p ET1 2 2 2= +

si în continuare asemǎnǎtor. În detaliu, algoritmul constǎ în pasii de mai jos sise aplicǎ pentru fiecare componentǎ principalǎ inlocuind în pasii urmǎtori X cuE i ni , , ,...,= −1 2 1.(1)Se selecteazǎ la întâmplare un vector xj din X si se redenumeste t1: t1 = xj;(2)Se calculeazǎ p p t X t tT T

1 1 1 1 1: /= ;(3)Se normalizeazǎ p p p p1 1 1 1: /= cu . norma euclidianǎ;(4)Se calculeazǎ t t Xp p pT

1 1 1 1 1: /= ;(5)Se comparǎ t1 utilizat la pasul (2) cu cel calculat la pasul (4); dacǎ variatiavectorului scor t1 este minorǎ calculul se încheie; în caz contrar se reiaalgoritmul cu pasul (2).Rezultǎ din cele expuse cǎ analiza componentelor principale este o metodǎ de areduce dimensionalitatea unei matrici de observatii care este produsul unuiexperiment pasiv, altceva decât un experiment planificat în acceptiunea datǎacestor termeni într-o sectiune anterioarǎ. Dar analiza componentelor principaleeste în acelasi timp un procedeu de ortogonalizare a unui experiment. Laproblema regresiei multiple discutatǎ mai devreme s-a subliniat importantaortogonalizǎrii unui experiment. Acest aspect devine încǎ o datǎ important dacǎeste vorba de calculul unor relatii de regresie partialǎ a unor date experimentale.În formularea obisnuitǎ, se considerǎ douǎ matrici de observatii X si Y. Seurmǎreste o explicare a variatiilor în Y prin variatiile din X. Metoda calculelorregresionale prin metoda clasicǎ a celor mai mici pǎtrate nu dǎ totdeaunarezultate. Se preferǎ o metodǎ a celor mai mici pǎtrate partialǎ care porneste dela descompunerile celor douǎ matrici în componentele lor principale

X t p t p t p ET Tk k

T= + + + +1 1 2 2 ...Y u q u q u q FT T

l lT= + + + +1 1 2 2 ...

135

Page 136: Gheorghe M.Panaitescu - ac.upg-ploiesti.roac.upg-ploiesti.ro/gpanaitescu/msds_2007.pdf · •Retele neuronale •Retele neuronale artificiale stratificate •Analiza multirezolutie

urmatǎ de corelarea prin regresie a primei componente principale din Y cucomponentele principale din X.Repetarea procedeului pentru componentele urmǎtoare ca importantǎ ale lui Yproduce acea explicare a relatiei X → Y care se urmǎreste.

Regresia prin componente principale

Regresia prin componente principale (prescurtatǎ în literaturǎ prin PCR, de laPrincipal Components Regression) este o metodǎ de regresie liniarǎ utilizabilǎatunci când variabilele asa-zis independente sunt de fapt corelate, auproprietatea de multicoliniaritate, cum se mai spune.Problema clasicǎ a regresiei liniare prezentatǎ într-o sectiune anterioarǎ

yi = bxi + ei

se rezolvǎ prin metoda celor mai mici pǎtrate. Vectorul de coeficienti obtinutare expresia b = (XTX)–1XTycu X matricea ale cǎrei coloane sunt vectorii xi, cu y vectorul observatiilorasupra variabilei dependente, de rǎspuns. Dacǎ variabilele xi sunt multicoliniareevaluarea coeficientilor b devine instabilǎ numeric.Regresia prin componente principale evitǎ dificultǎtile regresiei clasice, posibileîn asemenea ocazii, prin calcule similare derivate din metoda celor mai micipǎtrate dar în raport cu alte variabile. Relatiile urmǎtoare explicǎ detaliile.

y = Xb + E = XUUTb + E = Sc + Eunde S = XU, c = UTb, cu o matrice de vectori loading pi care coincid cu vectoriiproprii de lungime unitate ai matricei XTX. Evaluarea estimǎrilor vectorului decoeficienti c se face cu relatia c = (STS)–1STyÎntrucât colanele din S sunt vectori score matricea STS este diagonalǎ, la felinversa ei, din cauza ortogonalitǎtii vectorilor ti care o compun. Datoritǎ acesteiproprietǎti de ortogonalitate, mult discutatǎ si în sectiunea referitoare la regresialiniarǎ clasicǎ si la experimentele ortogonale, eliminarea unui coeficient dinvectorul c nu afecteazǎ celelalte valori. Aceasta permite eliminarea unora dinvariabilele latente ti care au efect neînsemnat asupra variabilei y. Prin aceasta sereduce dimensionalitatea regresiei la nivelul strict necesar.

Metoda celor mai mici pǎtrate partiale

Metoda clor mai mici pǎtrate partiale (prescutatǎ în literaturǎ ca PLS de laPartial Least Squares) este capabilǎ ca si analiza componetelor principale sǎreducǎ numǎrul de dimensiuni. Deosebirea de regresia prin componenteprincipale (PCR) constǎ în faptul cǎ dacǎ la PCR directiile principale pi eraualese independent de variabila y, la PLS directiile respective sunt alese sǎ

136

Page 137: Gheorghe M.Panaitescu - ac.upg-ploiesti.roac.upg-ploiesti.ro/gpanaitescu/msds_2007.pdf · •Retele neuronale •Retele neuronale artificiale stratificate •Analiza multirezolutie

reprezinte corespunzǎtor variabila de rǎspuns y. Variabila y poate fi vectorialǎ.Algoritmii PLS sunt diferiti pentru cazul variabilei y simple si pentru cazulvariabilei y vectoriale.Algoritmul pentru cazul variabilei de rǎspuns simple este secvential. La pasul kal algoritmului se extrage un singur vector loading din variabilele xi care sǎexplice adecvat prin vectorul score asociat variatiile în variabila de rǎspunsrǎmase/reziduale dupǎ k – 1 pasi.0. Initializare. Se pune indicele legat de dimensiune, k = 1. Se copiazǎ în D0 siîn e0 continutul matricilor X si y dupǎ o prealabilǎ centrare pe medie. În etapeleurmǎtoare D0 si e0 vor fi cópii ale matricilor reziduale pentru X si y din etapaanterioarǎ.1. Selectarea vectorilor loading si a vectorilor score. Vectorul loading sedefineste ca

),cov( 1121 −−−− == kkkTkk eDeDu

si vectorul score se defineste ca kkk uDs 1−=

De notat cǎ acele coloane din Dk–1 care sunt asociate puternic cu ek–1 vor primiîncǎrcǎri mari fatǎ de coloanele cu asociere mai slabǎ.2. Regresarea vectorilor score pe variabilele x si y. Se estimeazǎ cu metodacelor mai mici pǎtrate coeficientii wk si vk

( )[ ]k

Tk

kTk

T

kTkk

Tkk ss

sDDsssw 1

11 −

−− ==

si

( )[ ]k

Tk

kTk

T

kTkk

Tkk ss

seesssv 1

11 −

−− ==

3. Calcularea rezidualelor. Se calculeazǎ rezidualele cu relatiaTkkkk wsDD −= −1

respectiv cu relatiaTkkkk vsee −= −1

De notat ca 0=kTk sD , în dreapta cu un vector nul de dimensiune potrivitǎ, si

0=kTk se . Relatiile pot fi utilizate pentru a arǎta cǎ pentru indici i, j diferiti,

vectorii si si sj sunt ortogonali.4. Reluare (eventualǎ). Se mǎreaste k si se revine la pasul 1, pânǎ cândrezidualele matricilor Dk si ek devin suficient de mici.Expresia predictivǎ (model) datǎ de PLS este

∑∑=

−=

==r

kkkk

r

kkk vuDvsy

11

1

ˆ

137

Page 138: Gheorghe M.Panaitescu - ac.upg-ploiesti.roac.upg-ploiesti.ro/gpanaitescu/msds_2007.pdf · •Retele neuronale •Retele neuronale artificiale stratificate •Analiza multirezolutie

cu r numǎrul de factori principali extrasi. Din cauzǎ cǎ procedeul este repetat perezidualele variabilelor asa-zis independente si nu pe variabilele insesi, s-arpǎrea cǎ algoritmul expus nu s-ar potrivi exact cu forma generalǎ a regresiei. Sitotusi...Algoritmul pentru cazul variabilei de rǎspuns vectoriale este o extindere aalgoritmului precedent. În cea de a k etapǎ se extrage un vector loading uk dinvariabilele asa-zis independente si un vector loading vk din variabileledependente. Perechea de vectori loading este selectatǎ astfel încât variabilascore sk pentru asa-numitele veriabile independente sǎ prezicǎ adecvat variabilascore din spatiul rǎspunsurilor. Variabilele score legate de variabilele depredictie si cele legate de variabilele de rǎspuns sunt regresate. Variabilelescore legate de variabilele de predictie si cele legate de rǎspunsuri prezic, deasemenea, variabilele observate specifice. Procesul este repetat pe matricilereziduale pânǎ când un anumit criteriu de oprire este satisfǎcut. Mai în detaliu,fie D0 si E0 respectiv, ceea ce se obtine din X si Y în urma unei operatii decentrare pe medie. PLS realizeazǎ relatii între variabilele asa-zis independentesi variabilele lor score conform relatiilor

sk = Dk–1 uk

cu uk vector loading si cu sk un vector score al variabilelor asa-zis independente.Analog, variabilele de rǎspuns sau dependente sunt legate de variabilele lorscore prin

sk = Dk–1 uk

cu vk vector loading si cu tk un vector score al variabilelor dependente. Functia

stabilitǎ prin PLS este

kkk ubt =ˆ

cu bk termenul de pantǎ într-o regresie liniarǎ si kt valoarea prezisǎ a lui tk.

Retele neuronale

O descriere fie si sumarǎ a unui neuron natural nu poate ocoli caracterul lui dedispozitiv de calcul cu un numǎr de intrǎri (stimuli) si o iesire unicǎ pe un axon,iesire care uzual existǎ sau nu existǎ (este binarǎ) si care poate servi ca intrarepentru un alt neuron sau, în general, pentru alti neuroni în cadrul unor asa-zisesinapse.Intrǎrile unui neuron sunt combinate într-un gen de intrare unicǎ prin însumareaponderatǎ a intrǎrilor propriu-zise, dupǎ anumite reguli. Existǎ un prag desensibilitate sub care iesirea neuronului este nulǎ. Depǎsirea pragului produce oiesire, mereu aceeasi, asadar neuronul este principial un element cu iesirebinarǎ, pe numai douǎ niveluri. În general, functia care leagǎ iesirea neuronuluide intrarea lui sinteticǎ se numeste functie de activare. Functia de activare tip

138

Page 139: Gheorghe M.Panaitescu - ac.upg-ploiesti.roac.upg-ploiesti.ro/gpanaitescu/msds_2007.pdf · •Retele neuronale •Retele neuronale artificiale stratificate •Analiza multirezolutie

prag asociatǎ uzual cu neuronii naturali este ilustratǎ în figura alǎturatǎ. Seobservǎ pragul de sensibilitate nenul si se sugereazǎ o tranzitie în timp finit dela o stare, cea cu iesire nulǎ, la cealaltǎ stare cu iesire nenulǎ. Ca deobicei, niciîn cazul neuronilor nu este posibilǎ variatia instantanee a unei mǎrimi, iesirealui.

Posibilitǎtile de interconectare a neuronilor sunt foarte diverse si de aicistructurile foarte variate si complexe ale sistemelor si subsistemelor nervoaseprecum si capacitatea de a executa calcule paralel de mare amploare. Sistemeleneuronale au în plus capacitatea de a învǎta. Toate aceste caracteristici au atrasatentia de timpuriu tehnicienilor în încercarea lor de a simula prin elemente decalcul procesele inteligente care au loc în sistemele nervoase, deseori în legǎturǎdirectǎ cu sisteme tehnice foarte concrete.În contiunare discutia se limiteazǎ la retelele neuronale organizate în straturi,adicǎ fǎrǎ cicluri în care un neuron ar putea furniza siesi, pe o cale mai mult saumai putin ocolitǎ, intrǎri.

Retele neuronale artificiale stratificate

Într-o retea neuronalǎ artificialǎ stratificatǎ unitǎtile neuronale procesoare deinformatie sunt dispuse într-o secventǎ de trei sau mai multe straturi de neuroni.Iesirile neuronilor dintr-un strat ponderate convenabil sunt intrǎri pentruneuronii care apartin exclusiv stratului urmǎtor sau sunt iesiri ale retelei dacǎeste vorba de stratul ultim, de iesire. Primul strat primeste intrǎrile (stimulii) dinambiantǎ. Ultimul strat produce iesirile, în fond rezultatul unui calcul mai multsau mai putin complex. Intrǎrile neuronilor din straturile interioare, ascunse siale ultimului strat, cel de iesire sunt combinatii liniare ale iesirilor produse deneuronii din stratul premergǎtor. Coeficientii acelor combinatii liniare sunt nisteponderi care au un rol foarte importatnt în asa-zisa instruire a unei reteleneuronale, într-un proces de învǎtare care face o structurǎ cu neuroni stratificatǎsǎ fie adaptatǎ unui anumit scop tehnic sau tehnologic. Rolul oricǎrui stratneuronal interior, ascuns este acela de a reformula si de a reaplica iesirilestratului anterior pentru a obtine o reprezentare mai capabilǎ a separa, aclasifica datele de la intrarea retelei.

139

Page 140: Gheorghe M.Panaitescu - ac.upg-ploiesti.roac.upg-ploiesti.ro/gpanaitescu/msds_2007.pdf · •Retele neuronale •Retele neuronale artificiale stratificate •Analiza multirezolutie

Straturile interioare permit atasarea unei semantici particulare combinatiilor deintrǎri ale retelei.Structura retelelor neuronale stratificate poate fi foarte diferitǎ dacǎ se iau înconsiderare numǎrul de straturi si numǎrul de neuroni în fiecare strat. Figura demai sus aratǎ structura unei retele neuronale cu trei straturi, unul de intrare, unulascuns si unul de iesire, cu l, m, respectiv n celule neuronale. Trebuie spus cǎstratul de intrare al unei retele neuronale artificiale are uzual numai rolul de apregǎti intrǎrile stratului urmǎtor. Neuronii din primul strat au câte o singurǎintrare pe care o aduc prin translatie si prin scalare la valori potrivite pentru a fistimuli valabili pentru celulele neuronale din stratul urmǎtor.Un rǎspuns la întrebǎrile posibile si legitime referitoare la structurarea uneiretele neuronale artificiale a fost dat cu multǎ vreme în urmǎ de Kolmogorov încadrul teoriei aproximǎrii functiilor. Astfel, fiind datǎ o functie continuǎφ φ: , ( )I R x yd c→ = , unde I = [0, 1] si, în consecintǎ, Id este cubul unitate d-dimensional, functia φ poate fi implementatǎ într-o retea neuronalǎ cu exact treistraturi, cu d unitǎti în stratul de intrare, cu (2d +1) neuroni în unicul stratascuns si cu c unitǎti în stratul de iesire.Stratul ascuns, interior realizeazǎ aplicatia

z x k kkk

jj

d

= + +=

∑λ ψ ε( )1

în care xj sunt intrǎrile retelei, λk constante reale si ψ o functie, independente defunctia de reprezentat φ, iar ε este un numǎr rational pozitiv, mǎrginit. Functiaψ de activare a neuronilor din stratul ascuns trebuie sǎ îndeplineascǎ cunoscutaconditie a lui Lipschitz ψ ψ α( ) ( )u v cu v− ≤ − pentru orice α ∈( , ]01 si pentruorice argumente u v I d, ∈ .

140

Page 141: Gheorghe M.Panaitescu - ac.upg-ploiesti.roac.upg-ploiesti.ro/gpanaitescu/msds_2007.pdf · •Retele neuronale •Retele neuronale artificiale stratificate •Analiza multirezolutie

Stratul de iesire face aplicatia

y g zi i kk

d

==

+

∑ ( )1

2 1

unde functiile gi, i = 1, 2, ..., c sunt reale si continue si depind de φ si ε.Teorema datǎ de Kolmogorov este numai o teoremǎ de existentǎ. Construireaefectivǎ a functiilor ψ si gi este deschisǎ. Posibilitǎtile de aproximare a functieiφ(x) cu functii de un gen sau altul rǎmâne de discutat în continuare.În procesul de instruire/învǎtare pentru retelele neuronale artificiale stratificatese utilizeazǎ o multime de învǎtare H alcǎtuitǎ din perechi (ik, tk), k = 1, 2, ..., Nde vectori de intrare (i de la input – intrare) si de vectori de rǎspuns asociati (tde la target – tintǎ). Operatiile de bazǎ cunoscute si sub numele cuprinzǎtor deregula delta generalizatǎ sunt:• Se aplicǎ retelei neuronale intrǎri (stimuli) ik din multimea de învǎtare;• Se calculeazǎ pas cu pas iesirile tuturor unitǎtilor retelei neuronale, având în

vedere functiile de activare specifice, în cele din urmǎ iesirile ok (o de laoutput – iesire);

• Se comparǎ pe baza unui criteriu prestabilit vectorul ok, iesire a stratuluiultim al retelei, stratul de iesire, cu vectorul de iesire tk pereche în multimeaH cu intrarea aplicatǎ retelei;

• Se calculeazǎ eroarea si se propagǎ mǎsura ei în sens invers, de la iesirecǎtre intrare;

• Se minimizeazǎ eroarea la fiecare etapǎ prin modificarea ponderilor retelei.Pentru minimizarea erorii E de predictie a iesirilor tk prin iesirile calculate ok sepoate utiliza orice metodǎ de determinare a extremelor unei functii, în cazul îndiscutie functia care mǎsoarǎ eroarea de predictie. Metodele de gradient suntdesigur utilizabile dacǎ functia care mǎsoarǎ diferentele (în sens larg) între tk siok este derivabilǎ. Vectorul derivatelor partiale ∂E/∂wji în raport cu ponderile wji

atasate intrǎrilor pentru celula j din stratul i dǎ directia de modificare aponderilor, care trebuie sǎ fie în sensul invers al vectorului gradient. Asadar,modificǎrile ∆wji trebuie sǎ fie proportionale cu componentele vectoruluigradient cu semn schimbat. Calculul acestor derivate contine o procedurǎ dederivare a unor functii care la rândul lor au ca argumente alte functii. Intervinaici inevitabil functiile de activare ale celulelor neuronale. Dacǎ acestea sunt detipul prag teoretic, derivata lor este pretutindeni nulǎ, iar în punctulcorespunzǎtor pragului derivata nu existǎ. Pentru a evita acest inconvenient,pragul teoretic – salt pentru argument egal cu pragul de sensibilitate alneuronului – este înlocuit în aplicatii de functia sigmoidǎ care are expresia

σ α( )xe x=

+ −

11

si înfǎtisarea din figura alǎturatǎ (unde apare si un prag).

141

Page 142: Gheorghe M.Panaitescu - ac.upg-ploiesti.roac.upg-ploiesti.ro/gpanaitescu/msds_2007.pdf · •Retele neuronale •Retele neuronale artificiale stratificate •Analiza multirezolutie

Din coeficientul pozitiv α se poate aranja ca panta de trecere de la nivelulminim la cel maxim (si invers) sǎ fie oricât de abruptǎ: cu cât mai mare α cuatât mai mare panta si, la limitǎ, când α este foarte mare, sigmoida devinepragul ideal. Avantajul functiei sigmoidale este acela cǎ ea este derivabilǎpretutindeni, asadar metodele de minimizare a distantei dintre prezis siobservat, bazate pe gradient sunt deplin abordabile.Retelele neuronale artificiale sunt deja larg utilizate pentru a rezolva problemede învǎtare în diverse domenii. Prin utilizarea unor date experimentaleexistente, retelele neuronale învatǎ în fond relatiile între intrǎri si iesiri.Relatiile neliniare sunt cu totul empirice si nu sunt bazate pe vreo teorie dinfundamentele fizicii, de pildǎ. Sub acest unghi, retelele neuronale sunt pur sisimplu modele regresionale complexe a cǎror structurǎ este determinatǎempiric. Desi retelele neuronale artificiale sunt inspirate de retelele de celulenervoase ale organismelor vii, dezvoltǎrile aplicative ulterioare, pânǎ la celemai recente ale acestor retele numite si modele conexioniste sunt puternicinfluentate de dezvoltǎrile recente înregistrate de analiza functionalǎ.În domeniul ingineriei sistemelor se observǎ cu certitudine o explozie aintersului academic dar si industrial/comercial fatǎ de retelele neuronaleartificiale cu aplicatii în proiectarea de procese si de produse, în operarea sireglarea automatǎ a proceselor, multe din ele de remarcabilǎ complexitate.Câteva exemple:• Generarea de modele neliniare destinate proiectǎrii sistemelor de reglare

predictivǎ, fixe sau adaptive• Diagnoza functionǎrii defectuoase a sistemelor si identificarea cauzelor• Monitorizarea si interpretarea tendintelor unor procese continue si/sau

discontinue, cu evaluarea performantelor tehnologice si a calitǎtiiproduselor

• Modelarea comportǎrii haotice a sistemelor dinamice deterministe.Varietatea de reprezentǎri pe care retelele neuronale le pot cuprinde (booleene,calitative, semicantitative si/sau analitice/cantitative), gradul mare de paralelismal calculelor pe care retelele neuronale îl pemit si simplitatea structurii lor le-autransformat într-un instrument de mare popularitate printre ingineri, s-ar puteaspune, cu utilizǎri pentru rezolvarea unei varietǎti largi de probleme.

142

Page 143: Gheorghe M.Panaitescu - ac.upg-ploiesti.roac.upg-ploiesti.ro/gpanaitescu/msds_2007.pdf · •Retele neuronale •Retele neuronale artificiale stratificate •Analiza multirezolutie

O retea neuronalǎ tipicǎ (din cele stratificate, deocamdatǎ cele mai utilizate)este constituitǎ din mai multe straturi de noduri interconectate, fiecare cu ofunctie de activare, si ponderi pe fiecare arc care conecteazǎ nodurile reteleiîntre ele. Iesirea fiecǎrui nod este o functie neliniarǎ de toate intrǎrile sale.Astfel, reteaua este o dezvoltare a relatiei neliniare necunoscute între intrǎrile xsi iesirile F într-un spatiu generat de asa-numitele functii de activare alenodurilor retelei. În particular, învǎtarea prin propagare directǎ în retelestratificate poate fi privitǎ ca sintetizarea unei aproximǎri a unei functiimultidimensionale în spatiul generat de functiile de activare φ i (x), i = 1, 2, ...,m, adicǎ

F x c xi ii

m

( ) ( )==

∑ φ1

Cu date empirice la dispozitie, cu functiile de activare date si cu topologiaretelei cunoscutǎ, parametrii ci, i = 1, 2, ..., m sunt ajustati astfel încât eroareaaproximǎrii sǎ fie oricât de micǎ.S-au prezentat mai devreme douǎ functii de activare, functia prag ideal sifunctia sigmoidalǎ. Ambele au rǎspunsuri pentru orice intrare, nu importǎ cât demare sau cǎt de micǎ. De aceea ele sunt calificate drept functii de activareglobale si nu sunt singurele în genul lor. Ele sunt doar cele mai cunoscute,prima utilizatǎ pentru celulele neuronale din retelele numite si perceptroni sicealaltǎ utilizatǎ pe larg în retelele stratificate cu învǎtare prin propagaresecventialǎ inversǎ (BPN – BackPropagation Network). Asadar, în general,neuronii cu functii de activare globale sunt activi pe un domeniu larg de valoriale intrǎrilor si asigurǎ o aproximare globalǎ a datelor empirice.Cu functia sigmoidalǎ de activare si retele neuronale de tipul stratificat,secvential, cu un singur strat ascuns compus din m noduri, functii diverse se potaproxima prin functii din multimea

S f x f x c xw w R c Rm i i ii

n

id

i i≡ = + ∈ ∈

=

∑( ) / ( ) ( ), , ,σ θ θ1

unde wi, ci, θ i sunt parametri ajustabili. Se poate arǎta cǎ dacǎ m este suficientde mare atunci orice functie continuǎ poate fi aproximatǎ oricât de exactconform cu formula de mai sus.O alternativǎ la functiile de activare globale o constiutie functiile de activarelocale care produc iesiri ale neuronului cu precǎdere într-o vecinǎtate restrânsǎ aunor valori de intrare. Iesirea lor se estompeazǎ pentru valori situate departe decentrul de maxim rǎspuns al functiei de activare si, implicit, de maximǎreceptivitate a celulei neuronale cǎreia functia îi este atasatǎ.Functiile de tipul radial de pildǎ sunt în esentǎ locale si sunt utilizate în retelelecu baze de functii radiale (RBFN - Radial Basis Function Network). Figura careurmeazǎ reprezintǎ o asemenea functie, functia gaussianǎ.

143

Page 144: Gheorghe M.Panaitescu - ac.upg-ploiesti.roac.upg-ploiesti.ro/gpanaitescu/msds_2007.pdf · •Retele neuronale •Retele neuronale artificiale stratificate •Analiza multirezolutie

În general, o functie radialǎ este de forma( )φi ix h x x( ) = −

si este asociatǎ unui nod sau centru de coordonate xi .Functia gaussianǎ în varianta ei multidimensionalǎ

φπ

i n iT

inx W x x W x x x R( ) det

( )exp ( ) ( ) ,= − − −

∈2

122

cu W o matrice pozitiv definitǎ (o matrice de ponderi în directii diverse din Rn)este de tipul radial.În cazul unidimensional ilustrat putin mai devreme aceeasi functie se scrie subforma

φπ σ σi

i

i

i

x x x x R( ) exp ( ) ,= − −

∈1

2 2

2

2

Retelele de tipul RBFN pot si ele sǎ aproximeze functiile continue cu o eroareoricât de micǎ. Retelele de acest tip necesitǎ o prealabilǎ sortare a intrǎrilor, ooperatie de aglomerare (clustering) în clase de intrǎri similare.Din discutia de pânǎ acum rezultǎ cǎ în foarte multe cazuri retelele neuronaleartificiale sunt utilizate pentru aproximarea unor functii de cele mai multe orinecunoscute. Este un motiv foarte temeinic pentru a studia mai îndeaproapeproblema aproximǎrii.Fie f(x) o functie realǎ si continuǎ definitǎ pe o multime X. Fie F(A, x) o functieaproximantǎ realǎ continuǎ în orice punct x din multimea X si în cei n parametrigrupati în A. Fiind precizatǎ o distantǎ ρ se pot determina parametrii A* pentrucare

ρ ρ[ ( , ), ( )] [ ( , ), ( )]*F A x f x F A x f x≤relativ la toti A∈A , A fiind spatiul parametrilor, uzual un spatiu euclidean.Distanta ρ este o mǎsurǎ a aproximǎrii si este de obicei norma Lp a diferentei F(A*, x) – f(x), adicǎ

ppp dxxfxAFxfxAFL

/11

0

** )(),()](),([

−=−= ∫ρ cu p ≥ 1

144

Page 145: Gheorghe M.Panaitescu - ac.upg-ploiesti.roac.upg-ploiesti.ro/gpanaitescu/msds_2007.pdf · •Retele neuronale •Retele neuronale artificiale stratificate •Analiza multirezolutie

Într-o privire foarte generalǎ, o retea neuronalǎ aproximantǎ poate fi, de pildǎ,liniarǎ

F(W, X) = WXcu W o matrice de coeficienti (ponderi), X un vector de intrǎri. Multeaproximǎri – de pildǎ de tipul spline, în baze ortogonale, cu retele BPN(BackPropagation Network) cu un singur strat – se pot scrie ca

F(W, X) = WΦ(X)adicǎ sub forma unei combinatii liniare de functiile unei baze potrivit alese,Φ Φ= =[ ( ), , ,..., ]i x i m1 2 , care corespunde unei retele cu un singur strat ascuns.Reprezentarea retelelor ca scheme de aproximare este foarte utilǎ pentru analizaproprietǎtilor teoretice ale retelelor neuronale cu structuri variate. Retelele cufunctii de bazǎ radiale pot fi obtinute si ca rezultat al teoriei regularizǎrii.Aproximarea prin functii de bazǎ radiale si teoria regularizǎrii. Se considerǎproblema clasicǎ a interpolǎrii formulatǎ astfel: fiind dati N vectori de intraredistincti, NiRx n

i ,...,2,1, =∈ si iesirile corespunzǎtoare NiRyi ,...,2,1, =∈ ,

sǎ se gǎseascǎ o functie RRF n →: care sǎ satisfacǎ conditiile de interpolareF x y i Ni i( ) , ,...,= = 1 2

Solutia problemei de mai sus este o functie care este o combinatie liniarǎ de Nfunctii de bazǎ radiale, adicǎ

( )∑=

−=N

iii xxhcxF

1

)(

În acest scop pot fi utilizate functii gaussiene, multipǎtratice si alte functiiradiale.Interpolarea în sensul clasic este echivalentǎ cu aproximarea cu eroare nulǎ înnodurile (xi, yi). Functiile de bazǎ radiale pot fi utilizate pentru problemaaproximǎrii luând în considerare numai K din cele N intrǎri tk, k = 1, 2, ..., K cuK < N , astfel încât

( )∑=

−=K

kkk txhcxF

1

)(

Prin utilizarea teoriei regularizǎrii se poate rezolva problema aproximǎrii prindeterminarea functiei F(x) care minimizeazǎ urmǎtoarea functionalǎ

H F x y F x PF xi ii

N

[ ( )] ( ( )) ( )= − +=

∑ 2

1

în care yi sunt valori mǎsurate ale functiei necunoscute, F(x) este aproximareaacelei functiei necunoscute si λ este un numǎr real pozitiv numit parametru deregularizare. S-a notat cu P un operator restrictiv denumit si stabilizator, a cǎruistructurǎ dǎ expresie cunostintelor apriori despre solutie si depinde, asadar, departicularitǎtile problemei de rezolvat. În mod normal P este un operatordiferential asa încât el reflectǎ gradul de netezime dorit al functiei necunoscute.Prin urmare H[F(x)] exprimǎ un compromis între eroarea de aproximare si

145

Page 146: Gheorghe M.Panaitescu - ac.upg-ploiesti.roac.upg-ploiesti.ro/gpanaitescu/msds_2007.pdf · •Retele neuronale •Retele neuronale artificiale stratificate •Analiza multirezolutie

gradul de netezime al functiei necunoscute. În alte cuvinte ea exprimǎ uncompromis între interpolare si generalizare. Solutia aproximantǎ în problemaminimizǎrii functionalei de mai sus este o combinatie liniarǎ de ceea cematematicienii numesc functii de bazǎ radiale generalizate, adicǎ

F x c G x tk kk

K

( ) ( ; )==

∑1

unde G(x; tk) este functia Green a operatorului diferential PP cu P operatoruladjunct al lui P. Dacǎ P este un operator cu simetrie radialǎ, atunci functiaGreen este radialǎ ea însǎsi si functia aproximantǎ devine

( )∑=

−=K

kkk txGcxF

1

2)(

Coeficientii ck si centrele tk sunt necunoscute ale cǎror valori se stabilesc prinoptimizare numericǎ.Toate functiile de bazǎ radiale considerate pânǎ acum sunt de aceeasi rezolutie.Astfel, dacǎ sunt gaussiene ele au aceeasi deviatie standard σ. Dacǎ seutilizeazǎ functii de bazǎ radiale generalizate cu rezolutii diferite atunci seintroduce conceptul de hiperfunctii de bazǎ. Aceste functii pot genera solutiaurmǎtoarei forme modificate a problemei regularizǎrii

min [ ( )] ( )f

H F x f x y P fm

m k km

L

k

N

m m mm

L

= −

+

== =∑∑ ∑

1

2

1

2

1

λ

în care functia necunoscutǎ F(x) este socotitǎ a fi o sumǎ de mai nultecomponente, Lmxfm ,...,2,1),( = , adicǎ

F x f xmm

L

( ) ( )==

∑1

Astfel, solutia problemei de minimizare a ultimei fuctionale este datǎ de

F x c G x tmk m kk

K

m

L

( ) ( ; )===

∑∑11

unde functiile de bazǎ radiale LmtxG km ,...,2,1),;( = definesc comportareafunctiei necunoscute F(x) la rezolutii diverse ale variabilelor de intrare.Coeficientii cmk si centrele tk se stabilesc prin optimizare numericǎ globalǎ.Un rezultat foarte important al teoriei de aproximare cu retele neuronale afunctiilor continue este o teoremǎ care aratǎ cǎ retelele cu propagare inversǎ cubazǎ de functii sigmoide nu sunt cea mai bunǎ aproximare, ele nu minimizeazǎnici o normǎ. Pe de altǎ parte, retelele bazate pe teoria regularizǎriiminimizeazǎ norma L∞ sau norma Cebîşev când numǎrul de functii din bazǎeste egal cu numǎrul de date experimentale de instruire. Aceastǎ proprietate nuse mentine dacǎ numǎrul functiilor din bazǎ nu egaleazǎ numǎrul punctelorexperimentale de instruire si al centrelor tk ale dezvoltǎrii sunt necunoscute. Cutoate acestea, s-au pus la punct tehnici de instruire pentru retele de regularizare

146

Page 147: Gheorghe M.Panaitescu - ac.upg-ploiesti.roac.upg-ploiesti.ro/gpanaitescu/msds_2007.pdf · •Retele neuronale •Retele neuronale artificiale stratificate •Analiza multirezolutie

care pǎstreazǎ proprietatea de ce mai bunǎ aproximare, dupǎ cum se aratǎ încontinuare.Proceduri de instruire pentru retele cu baze de functii radiale. Retelele cu bazede functii radiale cele mai comune sunt proiectate ierarhic. Proiectarea uneiretele cu baze de functii radiale implicǎ determinarea parametrilor ck , tk si σk

minimizatori ai erorii globale de aproximare. Problema poate fi tratatǎ ca osingurǎ problemǎ de optimizare globalǎ prin instruire supravegheatǎ. Se poateîncerca totusi determinarea parametrilor în douǎ etape. În prima se determinǎcentrele tk si deviatiile standard σk în mod nesupervizat. În a doua etapǎ sestabilesc ck într-o procedurǎ de optimizare prin instruire supervizatǎ. Aceastǎprocedurǎ în douǎ faze este, se pare, mai eficientǎ. Iat-o în cele ce urmeazǎ.Faza I. Instruire autoorganizatǎ. În aceastǎ fazǎ se calculeazǎ centrele tk alecelor K functii de bazǎ radiale si extinderea lor datǎ de σk. Pentru a gǎsi cele Kcentre de maximǎ receptivitate din setul de intrǎri din multimea de instruire s-afolosit algoritmul standard de aglomerare cu k medii (k-means clusteringalgorithm). Fiecare grupare este legatǎ de un nod ascuns al retelei. Centrulgrupǎrii determinǎ valoarea tk a functiei de bazǎ. Pasul curent alocǎ nodurinumai pentru regiunile unde existǎ date. Lǎrgimea (sau dispersia) fiecǎrui câmpeste apoi stabilitǎ printr-o euristicǎ a contiguitǎtii. Pot fi utilizate multe dineuristicile de tipul vecinului celui mai p-apropiat (p-nearest neighbor). Deexemplu, lǎrgimea poate fi datǎ de media geometricǎ σ = d d1 2 unde d1 si d2

sunt distantele euclidiene de la centrul k la douǎ centre cele mai apropiate.Aceastǎ euristicǎ asigurǎ o oarecare suprapunere pentru fiecare unitate cuunitǎti vecine ceea ce conduce la o interpolare netedǎ pe spatiul intrǎrilor.Instruirea autoorganizatǎ din faza curentǎ reduce efortul de instruire supervizatǎdin faza a doua în care trebuie evaluate numai ponderile.Faza II. Minimizarea erorii medii pǎtratice. Ponderile ck ale functiilor de bazǎradiale sunt gǎsite prin minimizarea erorii medii pǎtratice

E y F xk kk

= −∑[ ( )]2

Determinarea ponderilor este o problemǎ liniarǎ a cǎrei convergentǎ este sigurǎ.S-au sugerat multe îmbunǎtǎtiri si alternative pentru instruirea retelelor cu bazede functii radiale. Unii autori si cercetǎtori au utilizat coeficienti care suntfunctii liniare de intrǎri, care permit functii gaussiene asimetrice si o functiepǎtraticǎ de cost de forma

E y c y x c c x xii

k i k iik

k llk

k i l ii

=

+

∑ ∑∑ ∑∑ ∑1

212

2 Φ Φ Φ( ) ( ) ( )

cu (xi, yi) perechi intrare-iesire si cu Φk(xi), Φl(xi) functii din bazǎ. Metodaaceasta se aratǎ a fi superioarǎ precedentei la predictia seriilor de timp haotice.

147

Page 148: Gheorghe M.Panaitescu - ac.upg-ploiesti.roac.upg-ploiesti.ro/gpanaitescu/msds_2007.pdf · •Retele neuronale •Retele neuronale artificiale stratificate •Analiza multirezolutie

Faza primǎ, euristicǎ, de instruire a retelelor cu baze de functii radiale necesitǎreluǎri cu diferite numere de unitǎti ascunse pentru a obtine un optim structuralal retelei.

Analiza multirezolutie

În sectiunea Forme standard ale modelelor dinamicii sistemelor a acestor Notede curs s-au prezentat transformarea Fourier directǎ si inversǎ si cele douǎforme de reprezentare ale semnalelor, în domeniul timp si în domeniulfrecventǎ. Sunt multe alte lucruri de adǎugat la acea sumarǎ discutie dar celputin un aspect nu poate fi omis: relatia între asa-numita localizare în timp aunui semnal si localizarea lui în frecventǎ. Problema poate fi înteleasǎ mai binedintr-un exemplu. Sǎ admitem cǎ avem un semnal rectangular f(t) ca în figuraalǎturatǎ.

Semnalul are durata τ si înǎltimea 1/τ si este simetric fatǎ de originea timpului.Prin transformarea Fourier se obtine semnalul în domeniul frecventǎ

2

2sin

)(τω

τωω =jF

care este reprezentat în modul în figura alǎturatǎ.

Se observǎ cǎ spectrul este foarte bogat în apropierea frecventei zero. Se mairemarcǎ, de asemenea, cǎ existǎ frecvente pentru care componentele spectrului

148

Page 149: Gheorghe M.Panaitescu - ac.upg-ploiesti.roac.upg-ploiesti.ro/gpanaitescu/msds_2007.pdf · •Retele neuronale •Retele neuronale artificiale stratificate •Analiza multirezolutie

sunt nule. Acest fapt se produce pentru toate nulurile numǎrǎtorului fractiei careeste F(jω), adicǎ ori de câte ori argumentul sinusului este mutiplu întreg nenulde π, în alti termeni la frecventele 2kπ/τ cu 0−∈ Zk . Cea mai mare parte aenergiei semnalului este concentratǎ în banda de frecvente [-2π/τ, 2π/τ].Dacǎ durata semnalului este mai scurtǎ atunci banda de frecvente mentionatǎ sedilatǎ. Invers, dacǎ durata semnalului se mareste, concentrarea energeticǎ asemnalului în domeniul frecventǎ este mai pronuntatǎ. Asadar, localizarea întimp si localizarea în frecventǎ a unui semnal sunt contradictorii si afirmatiapoate fi generalizatǎ pentru orice semnal. O bunǎ localizare în timp duce la oproastǎ localizare în spectrul de frecvente si invers. Intervine aici principiulindeterminǎrii al lui Heisenberg, principiu care se referǎ la mǎrimi asa-zisconjugate: vitezǎ – pozitie (a unei particule elementare), timp – energie (pentruun semnal) etc. Problema localizǎrii este sustinutǎ deplin si de una dinproprietǎtile transformǎrii Fourier care se exprimǎ prin aceea cǎ dacǎ f(t) si F(jω) sunt perechi Fourier atunci transformata semnalului contractat (dilatat) întimp f(αt) (α > 0) se scrie simplu ca (1/α)F(jω/α) cu dilatarea (contractarea)spectrului corespunzǎtoare.Sub aspect practic observarea unui semnal se face pe o duratǎ totdeauna finitǎ.Observarea este echivalentǎ cu “privirea” semnalului printr-o fereastrǎrectangularǎ defintǎ în timp în genul celei comentate mai devreme în aceastǎsubsectiune. Fereastra poate fi de lǎrgime diferitǎ si poate avea diverse pozitiipe axa timpului, nu numai pozitia particularǎ de mai devreme care dǎ o simetriefatǎ de origine. Natural, o sinusoidǎ de frecventǎ joasǎ va trebui observatǎ untimp mai îndelungat pentru a o detecta deplin, ca amplitudine, ca frecventǎ, cafazǎ. Un semnal analog de frecventǎ mai mare va necesita un timp de observaremai scurt. Afirmatiile privind timpul de observare se pot extinde calitativ lafenomene lente si la fenomene rapide. De altfel frecventele joase suntcaracteristice fenomenelor lente, frecventele înalte corespund fenomenelorrapide.În manifestarea dinamicii unor sisteme, deseori apar concomitent fenomenelente si fenomene rapide sau în orice caz fenomene care au viteze semnificativdiferite. De aici necesitatea unei observǎri la rezolutii diferite a fenomenelorcare au viteze diferite.În partea referitoare la modelele în domeniul frecventǎ ale dinamicii sistemelor,în sectiunea Forme standard ale modelelor dinamicii sistemelor s-a amintitposibilitatea reprezentǎrii semnalelor în alte baze, diferite de aceea a functiilorsinusoidale utilizatǎ de transformarea Fourier. Bazele de care se vorbeste încontinuare sunt niste hiperbaze, conform terminologiei deja consacratementionatǎ si în subsectiunea precedentǎ în legǎturǎ cu problema aproximǎrii,iar functiile din bazǎ sunt niste familii de hiperfunctii care alcǎtuiesc o asa-numitǎ hiperbazǎ. Functiile au câteva proprietǎti remarcabile care vor rezultadin discutarea unui caz particular.

149

Page 150: Gheorghe M.Panaitescu - ac.upg-ploiesti.roac.upg-ploiesti.ro/gpanaitescu/msds_2007.pdf · •Retele neuronale •Retele neuronale artificiale stratificate •Analiza multirezolutie

Se admite în general cǎ un semnal privit ca functie de timp se poate reprezentaaproximativ oricât de precis prin functii în scarǎ. Pe de altǎ parte, dacǎ semnalulare o bandǎ de frecvente limitatǎ el poate fi deplin determinat din esantioanelelui prelevate mai frecvent decât dublul frecventei celei mai înalte din spectru,conform teoremei esantionǎrii prezentate în altǎ sectiune. Putem pune laolaltǎaceste douǎ elemente de reprezentare a unui semnal si pe aceastǎ cale sǎ seobtinǎ o informatie relativǎ la semnal discretǎ în timp, discretǎ în amplitudine.Fie un numǎr de opt esantioane ale semnalului

2448565632164864echidistante în timp. Ele au fost alese deliberat numere întregi pentru asimplifica cât se poate de mult calculele care urmeazǎ.Aceastǎ secventǎ se poate rescrie sub forme derivate succesiv din secventa datǎ,prin douǎ operatii simple, una de mediere si alta de luare a diferentelor.

120881016343120881016464012088365624562448565632164864

−−−−

Se observǎ cǎ primele patru numere din linia a doua sunt mediile aritmetice peperechi ale numerelor din prima linie. Aceasta este operatia de mediere care seobservǎ si în derivarea primelor numere din linia a treia si în obtinerea primuluinumǎr din linia ultimǎ. Celelalte patru numere din linia a doua se obtin prinluarea diferentei între primul numǎr al perechii mediate si media perechii.Asemenea numerele de pe linia a treia care urmeazǎ imediat noilor medii, la felnumǎrul al doilea de pe linia ultimǎ. De retinut cǎ numerele rezultate dindiferente se reproduc pe liniile urmǎtoare oricâte ar fi ele. Cu rememorarearegulilor de calcul, linia ultimǎ contine aceeasi informatie despre semnal ca siprima: oricând operatiile inverse se pot efectua cu rezultat final linia primǎreconstituitǎ.Se admite cǎ semnalul are ca suport intervalul [0, 1] si se încearcǎ reconstituirealui pas cu pas. Functia

=realeaxeirestulîn0

)1,0[pentru1)(

ttϕ

multiplicatǎ cu ultima medie din tabel produce o reprezentare extrem deaproximativǎ a semnalului, prin media lui. Dacǎ la 43ϕ(t) se adaugǎ functia

150

Page 151: Gheorghe M.Panaitescu - ac.upg-ploiesti.roac.upg-ploiesti.ro/gpanaitescu/msds_2007.pdf · •Retele neuronale •Retele neuronale artificiale stratificate •Analiza multirezolutie

∈−

=

restîn0

1,21pentru1

21,0ntrupe1

)( t

t

multiplicatǎ cu ultima diferentǎ calculatǎ se obtine pentru semnal o reprezentareîmbunǎtǎtitǎ 43ϕ(t) – 3χ(t) care pe intervale egaleazǎ cele douǎ medii carefigureazǎ în linia penultimǎ a tabelului. Dacǎ, în continuare, la reprezentareaobtinutǎ pânǎ la aceastǎ etapǎ se adunǎ functiile

∈−

=

restîn021,

41pentru1

41,0ntrupe1

)(10 t

t

∈−

=

restîn0

1,43pentru1

43,

21ntrupe1

)(11 t

t

multiplicate cu diferentele din pozitiile 3 si 4 ale liniei ultime se obtine oreprezentare încǎ mai bunǎ a semnalului prin expresia 43ϕ(t) – 3χ(t) + )(16 1

0 tχ+ )(10 1

1 tχ , care pe portiuni egaleazǎ mediile din linia a doua a tabelului de maisus. Încǎ un pas similar si se ajunge la reprezentarea semnalului prin valoriledin prima linie a tabelului. Reprezentarea ultimǎ si cea mai completǎ este

)(12)(0)(8)(8

)(10)(16)(3)(4323

22

21

20

11

10

00

00

tttt

tttt

χχχχ

χχχϕ

++++

+++−

unde s-au notat pentru uniformitate ϕ(t) cu )(00 tϕ si χ(t) cu )(0

0 tχ .În reprezentǎrile succesive ale semnalului, la reprezentarea prin medie, cea maigrosierǎ, se adaugǎ treptat detalii ale semnalului.Functia ϕ(t) definitǎ mai sus se numeste functie de scalare, în particular functiade scalare a lui Haar. Functiile χ(t) cu indici variati se numesc functii wavelet(sau, mai simplu si ca o propunere, undelete). Functiile wavelet permitadǎugarea de detalii ale semnalului din ce în ce mai fine pe mǎsurǎ ce indicele

151

Page 152: Gheorghe M.Panaitescu - ac.upg-ploiesti.roac.upg-ploiesti.ro/gpanaitescu/msds_2007.pdf · •Retele neuronale •Retele neuronale artificiale stratificate •Analiza multirezolutie

superior creste. Functiile wavelet de un anumit ordin marcat prin indicelesuperior asociate unei anumite definitii se obtin din functiile wavelet de ordinmai mic, cu un indice superior mai mic, printr-un procedeu de dilatare îndirectia axei timpului (cuprinzând în acest termen si contractia) si prin translatiecu un multiplu întreg al duratelor lor.Functia de scalare satisface ecuatia functionalǎ

∑∈

−=Zi

i itct )2()( ϕϕ

cu toti coeficientii nuli exceptând c0 = c1 = 1, adicǎϕ(t) = ϕ(2t) + ϕ(2t – 1)

Functia wavelet de acelasi ordin, functia wavelet mamǎ cum se mai numeste secalculeazǎ ca o combinatie liniarǎ de functii de scalare cu argumente similare,cu aceiasi coeficienti dar cu semne schimbate pentru indicii impari

∑∈

−−=Zi

ii itct )2()1()( ϕχ

ceea ce produce în particularχ(t) = ϕ(2t) – ϕ(2t – 1)

Functia de scalare si functiile wavelet alcǎtuiesc o hiperbazǎ în spatiulsemnalelor de energie finitǎ cunoscut în matematicǎ ca spatiul L2 al functiilor depǎtrat sumabil. Ortogonalitatea lor asigurǎ independenta lor liniarǎ.Pentru fiecare 0 ≤ i ≤ 23 – 1 se poate obtine o functie de scalare indusǎ diadic,dilatatǎ si deplasatǎ prin translatie. De pildǎ, pentru nivelul cel mai fin derezolutie în exemplul prezentat

)2()( 33 itti −= ϕϕFunctiile wavelet pentru detalii din ce în ce mai fine se obtin din functiawavelet mamǎ prin relatii analoge

120),2()( 111 −≤≤−= iitti χχ120),2()( 222 −≤≤−= iitti χχ

asadar tot prin dilatare si translatie. Ortogonalitatea sistemului de functii sepoate verifica cu usurintǎ. Integrala

∫+∞

∞−

=⟩⟨ dttgtfgf )()(,

care este un produs vectorial în spatiul L2 este nenulǎ numai cǎnd f(t) si g(t)coincid cu una si aceeasi din functiile de scalare sau una si aceeasi functiewavelet.Functiile de scalare descrise mai devreme, transformate în familii infinite prinoperatia de translatie cu multipli întregi ai lǎrgimii suportului lor finit sunt bazepentru spatii de functii în scarǎ care sunt în relatia 3210 VVVV ⊂⊂⊂ cuindicii în corespondentǎ cu indicii superiori ai functiilor de scalare respective.Desigur, secventa de spatii incluse unul în altul poate fi extinsǎ atât în jos, la

152

Page 153: Gheorghe M.Panaitescu - ac.upg-ploiesti.roac.upg-ploiesti.ro/gpanaitescu/msds_2007.pdf · •Retele neuronale •Retele neuronale artificiale stratificate •Analiza multirezolutie

definitii mai slabe cǎt si spre indici superiori, la definitii superioare. Pentrufiecare j = 0, 1, 2 se defineste un spatiu W j generat de functiile wavelet ca fiindcomplementul lui V j în V j+1 astfel încât are loc descompunerea (ortogonalǎ) însumǎ directǎ

jjj WVV ⊕=+1

Se obtine apoi2100211223 WWWVWWVWVV ⊕⊕⊕=⊕⊕=⊕=

Fiecare spatiu complementar W j are o bazǎ naturalǎ constituitǎ din functiiwavelet si contine detaliile necuprinse în spatiul V j de acelasi indice.O îmbunǎtǎtire a hiperbazei de functii constǎ în normarea hiperfunctiilorconform relatiilor

)2(2)( 2 itt jj

ji −= ϕϕ si )2(2)( 2 itt j

jj

i −= χχOperatia aduce functiile de scalare si functiile wavelet la normǎ unitarǎ, iarhiperbaza devine ortonormalǎ.Hiperbaza generatǎ de functia de scalare Haar nu este unica posibilǎ. În vremeadin urmǎ au apǎrut generalizǎri tulburǎtoare atât pentru comunitateamatematicienilor cât si pentru inginerii dedicati aplicatiilor.O varietate largǎ de functii wavelet este acum la îndemânǎ pentrudescompunerea, analiza si sinteza datelor continue sau discrete. În general, ofunctie wavelet este o functie ale carei dilatǎri si translatii alcǎtuiesc o bazǎRiesz pentru spatiul functiilor de pǎtrat sumabil L2. Ignorând de dragulsimplitǎtii problema normalizǎrii si considerând toate functiile reale, se poatespune ca functiile wavelet sunt deduse dintr-o anumitǎ functie de scalare realǎϕ care satisface o ecuatie de scalare

∑∈

−=Zi

i itct )2()( ϕϕ

Fiind datǎ o asemenea functie, se defineste spatiul V0 ca închiderea spatiuluiliniar generat de translatiile întregi ale functiei ϕ, Ziitti ∈−= ),()(0 ϕϕ si,pentru orice j întreg, se ia spatiul V j ca închidere a spatiului liniar generat detranslatiile întregi ale functiei ϕ dilatate, Ziitt jj

i ∈−= ),2()( ϕϕ . Se spune cǎavem de a face cu o analizǎ multirezolutie dacǎ mutimea dublu infinitǎ de spatii

...... 21012 ⊂⊂⊂⊂⊂⊂ −− VVVVVsatisface trei criterii:1. ZjVtfVtf jj ∈∀∈⇔∈ − ,)2()( 0

2. ZiiV

∈= 0

3. )(2 RLVZi

i =∈

Odatǎ analiza multirezolutie pusǎ la punct este usor de stabilit functia waveletmamǎ

153

Page 154: Gheorghe M.Panaitescu - ac.upg-ploiesti.roac.upg-ploiesti.ro/gpanaitescu/msds_2007.pdf · •Retele neuronale •Retele neuronale artificiale stratificate •Analiza multirezolutie

∑∈

−−=Zi

ii itct )2()1()( ϕχ

cu aceleasi valori ci din ecuatia functionalǎ verificatǎ de functia de scalare.Aceastǎ functie wavelet are integrala pe întreaga axǎ realǎ nulǎ.O cale de generalizare a functiei de scalare Haar, care este o functie B-spline deordinul unu si a functiei wavelet corespunzǎtoare este urmǎtoarea: pentru oricek natural, functia B-spline de ordinul k, care poate fi gânditǎ ca o convolutie afunctiei Haar cu ea însǎsi de k – 1 ori, satisface ecuatia de scalare

∑=

+− −=k

i

ik

k itCt0

1 )2(2)( ϕϕ

Aceasta produce o analizǎ multirezolutie si, deci, o functie wavelet în manieradescrisǎ mai devreme. Aceste functii wavelet spline sunt definite pe suportcompact si au k – 2 derivate continue, dar numai pentru cazul Haar se obtineortogonalitatea functiilor familiei induse de functii dilatate si deplasate printranslatie.Dacǎ asupra ortogonalitǎtii functiilor din bazǎ nu se insistǎ totdeauna în moddeosebit, este considerat în general cǎ este de dorit ca functiile sǎ fie definite pesuport compact sau cel putin sǎ înregistreze o descrestere rapidǎ în afara unuiinterval compact. Aceastǎ comportare este în total contrast cu aceea a fuctiilorsinusoidale, centrale în analiza Fourier. Aceastǎ particularitate face din functiilewavelet o bazǎ de reprezentare a functiilor neperiodice, care au puncteunghiulare si discontinuitǎti. Cel putin un lucru trebuie observat: mult maiputini coeficienti sunt necesari la reprezentarea prin functii wavelet decât lareprezentarea Fourier a acetui gen de functii.Sunt aici trei lucruri care trebuie puse în acord: netezimea, finitudineasuportului si ortogonalitatea. Din pǎcate nu sunt posibile toate deodatǎ. Nuexistǎ functii wavelet indefinit diferentiabile ortonormale care sǎ aibǎ scǎderiexponentiale – nici gând de a fi definite pe suport compact – ceea ce impuneanumite compromisuri.Construirea unor functii wavelet spline ca mai sus poate fi modificatǎ pentru agenera functiile wavelet Battle-Lemarié, care au scǎderi exponentiale, suntdiferentiabile de k – 2 ori si ortonormale.În 1988 Ingrid Daubechies a reusit sǎ spargǎ canoanele prin realizarea unorfunctii wavelet pe suport compact, ortonormale si care au un grad de netezimedorit oarecare. Cel mai simplu exemplu dat de ea, fǎrǎ sǎ fie trivial estecontinuu si este derivat din functia de scalare ϕ care satisface relatia

)32(4

31)22(4

33

)12(4

33)2(4

31)(

−−+−−+

+−+++=

tt

ttt

ϕϕ

ϕϕϕ

154

Page 155: Gheorghe M.Panaitescu - ac.upg-ploiesti.roac.upg-ploiesti.ro/gpanaitescu/msds_2007.pdf · •Retele neuronale •Retele neuronale artificiale stratificate •Analiza multirezolutie

Nu existǎ formǎ explicitǎ pentru aceastǎ functie. Studiul ei se face pe bazaanalizei amǎnuntite a transformatei Fourier a ecuatiei de scalare. Pentru un tanumit se poate rezolva pentru ϕ(t) ca o limitǎ a sirului de valori φ j(t) definitrecursiv prin relatia

∑ ∈ − −=Zi jij itct )2()( 1φφ

cu initializare pentru φ 0(t) exact functia de scalare Haar. Contrar instinctuluicomun de a rezolva orice ecuatie, analiza poate fi condusǎ aici prin concentrareasupra coeficientilor ci.Aceste functii wavelet mai rafinate sunt utilizate cu precǎdere în prelucrarea deimagini, în comprimarea informatiei generate la preluarea de imagini, învederea transmiterii si/sau stocǎrii ei eficiente.

Exercitii de autoevaluare

1. Marcati în lista urmǎtoare afirmatia care nu se potriveste retelelor neuronaleartificiale stratificate.

a) neuronii dintr-un strat ascuns au intrarile si iesirile observabilenemijlocit

b) sunt structuri care pot fi instruitec) au cel putin trei straturi de neuroni

2. Fie o retea neuronalǎ artificialǎ stratificatǎ cu stratul de intrare format din 2neuroni, cu douǎ straturi ascunse având 7, respectiv 5 neuroni si cu stratulde iesire alcǎtuit din 3 neuroni. Câte ponderi se stabilesc în procesul deinstruire a retelei?

a) 64, b) 17 sau c) 100;3. Pentru aceeasi retea neuronalǎ din enunţul anterior, care din perechile de

vectori (xT, yT) de mai jos nu poate face parte dintr-o multime de învǎtarepentru reteaua neuronalǎ specificatǎ?

a) [(3 1), (–1 2 0)], b) [(2 1 0), (1 1)], c) [(0 2), (0 1 2)]?4. Care dintre functiile de activare ale celulelor neuronale sunt capabile a

modela efectele locale ale variabilelor de intrare ale neuronului artificial?a) toate tipurile de functii de activare;b) functiile sigmoidale;c) functiile radiale.

5. Analiza componentelor principale oferǎ posibilitatea ca:a) sǎ se extragǎ informatia din date experimentale;b) sǎ se reducǎ dimensionalitatea unui volum de date experimentale;c) sǎ transforme un model stochastic într-unul determinist.

Marcati afirmatia nepotrivitǎ.6. Analiza multirezolutie permite:

a) reprezentarea la scǎri diferite a unor fenomene cu constante de timpvariate;

155

Page 156: Gheorghe M.Panaitescu - ac.upg-ploiesti.roac.upg-ploiesti.ro/gpanaitescu/msds_2007.pdf · •Retele neuronale •Retele neuronale artificiale stratificate •Analiza multirezolutie

b) reprezentarea functiilor de timp care descriu dinamica unui sistemîntr-o altǎ bazǎ de functii numitǎ si hiperbazǎ;

c) rezolutii diferite la viteze diferite ale dinamicii sistemelor;d) speculatii matematice foarte elegante dar gratuite.

Marcati afirmatia nepotrivitǎ.

156

Page 157: Gheorghe M.Panaitescu - ac.upg-ploiesti.roac.upg-ploiesti.ro/gpanaitescu/msds_2007.pdf · •Retele neuronale •Retele neuronale artificiale stratificate •Analiza multirezolutie

MODELAREA SI SIMULAREA DINAMICII SISTEMELOR MARI

• Sisteme dinamice mari• Metode de modelare a sistemelor mari orientate pe ecuatii• Metode orientate pe module• Exercitii de autoevaluare

Sisteme dinamice mari

Sistemele dinamice mari sunt sisteme care atât fizic cât si matematic prezintǎ oamploare si o complexitate deosebitǎ. În ceea ce priveste modelarea matematicǎa unor asemenea sisteme, tipice sunt urmǎtoarele caracteristici:• modelul matematic este un sistem de ecuatii diferentiale si algebrice;• dimensionalitatea modelului matematic este neobisnuitǎ, sute sau chiar mii

de variabile si functii, în conditiile unei slabe cuplǎri; numai câteva procentedin matricea jacobianǎ (în fond o matrice de incidentǎ) sunt ocupate devalori nenule; se spune cǎ matricea de incidentǎ este o matrice rarǎ;

• sistemul de ecuatii care modeleazǎ sistemul este de cele mai multe ori rǎucoditionat (rigid) algebric si/sau diferential; algebric prin coexistentavalorilor foarte mari si foarte mici, diferential prin constantele de timpfoarte diferite ca ordin de mǎrime;

• modelul matematic este neliniar, iar linearizarea lui este numai uneoriposibilǎ;

• modelul este deseori afectat de discontinuitǎti (în timp sau în stare).Exemple tipice de sisteme mari se gǎsesc din abundentǎ în industria chimicǎ side prelucrare a titeiului, dar sisteme care pot fi calificate mari se pot întâlni si înalte ramuri industriale. Desigur, sistemele mari cunosc regimuri stationare sauaproape stationare, care intereseazǎ poate în primul rând. De aceea au fostcreate si lansate pe piatǎ un numǎr apreciabil de produse software de simulare asistemelor mari în regim stationar. Nu acelasi lucru s-a întâmplat cu simulareadinamicii sistemelor mari. Dupǎ cunostinta autorului, nu existǎ încǎ un sistemde simulare a dinamicii unui sistem mare adus la perfectiunea simulatoarelor deregimuri stationare. Motivele sunt urmǎtoarele:• neliniaritǎtile mari si variatiile importante ale stǎrii sistemului

fac inoperante metodele aplicate în cazul liniar; intrǎ în actiune metodelenumerice de integrare a ecuatiilor diferentiale;

157

Page 158: Gheorghe M.Panaitescu - ac.upg-ploiesti.roac.upg-ploiesti.ro/gpanaitescu/msds_2007.pdf · •Retele neuronale •Retele neuronale artificiale stratificate •Analiza multirezolutie

• posibilele discontinuitǎti temporale sau în starea sistemului cer rutine sialgoritmi de detectare si de localizare a acestora si de reinitializare eficientǎa calculului când aceste discontinuitǎti se manifestǎ;

• reaua conditionare (rigiditatea) temporalǎ, cu alte cuvinte constantele detimp foarte diferite, de cele mai multe ori prin ordine de mǎrime aduce îndiscutie nu numai precizia calculului dar si stabilitatea lui; controlul pasuluide integrare devine crucial pentru stabilitatea calculului.

Pachetul Simulink pare a fi o promisiune majorǎ în domeniul acesta almodelǎrii si simulǎrii sistemelor dinamice mari, deocamdatǎ pe modelesimplificate si liniar(izat)e.Atât în cazul simulǎrii regimului stationar cât si în cazul simulǎrii regimuluidinamic simularea poate fi orientatǎ pe ecuatii sau în manierǎ modularǎ,modulele având de cele mai multe ori un echivalent fizic în unele subsistemeale sistemului mare care trebuie modelat.

Metode de modelare a sistemelor mari orientate pe ecuatii

Metodele bazate pe ecuatii opereazǎ pe ecuatii si urmǎresc rezolvarea eficientǎa sistemului de ecuatii modelator. Metodele din aceastǎ categorie încearcǎ sǎprofite de faptul cǎ matricea jacobianǎ (de incidentǎ) a sistemului este o matricerarǎ si se cautǎ o rezolvare eficientǎ prin partitionarea matricei si rearanjareaecuatiilor. De pildǎ, o aranjare a matricei de incidentǎ într-o formǎ bloc-triunghiularǎ reprezintǎ o posibilitate de eficientizare a calculelor prindescompunerea problemei în subprobleme mai simple, care se pot rezolva înetape.Iatǎ un algoritm simplu de bloc-triangularizare a matricii de incidentǎ datoratlui D.V.Stewart. Pasii care trebuie parcursi sunt urmǎtorii:1. Se cautǎ în matricea de incidentǎ o linie fǎrǎ elemente în afara diagonalei si

se eliminǎ acea linie odatǎ cu coloana care contine elementul nenul;2. Se repetǎ pasul 1 pânǎ la epuizare;3. Se cautǎ perechi de linii cu proprietatea de la pasul 1, se eliminǎ liniile si

coloanele cu elemente nenule;

c1 f2 h1 q1 h2 q2

Ecuatia 5 xEcuatia 0 xEcuatia 1 x x xEcuatia 2 x xEcuatia 3 x xEcuatia 4 x x x

4. Se reia pasul 1;

158

Page 159: Gheorghe M.Panaitescu - ac.upg-ploiesti.roac.upg-ploiesti.ro/gpanaitescu/msds_2007.pdf · •Retele neuronale •Retele neuronale artificiale stratificate •Analiza multirezolutie

5. Se reia pasul 3 cu trei sau mai multe linii;6. Se încheie algortimul în momentul când nu mai sunt linii de eliminat,

matricea de incidentǎ a fost epuizatǎ.Aplicarea algoritmului poate duce, de exemplu, la o matrice rearanjatǎ ca întabelul alǎturat. Noul aranjament al ecuatiilor si varibilelor de determinat(încadrate în dreptunghiuri) sugereazǎ prin sine însusi ordinea calculelor.Dacǎ liniile sunt ecuatii, coloanele matricei de incidentǎ sunt variabile care aparîn ecuatii conform prezentei sau absentei semnului x.Aceasta nu este singura modalitate de a trata problema prin metoda pe ecuatii.O modalitate este si aducerea blocurilor în corespondentǎ cu unitǎti fiziceurmatǎ de o procedurǎ predictor-corector; rezolvarea fiecǎrei unitǎti fizice serealizeazǎ în dinamica ei particularǎ, într-un numǎr specific de iteratii.O altǎ modalitate o reprezintǎ descompunerea sistemului de ecuatii în douǎsubsisteme: unul rapid (cu constante de timp mici) si unul lent (cu constante detimp mari, comparativ cu cele din prima clasǎ). Cele douǎ subsisteme suntrezolvate prin metode specifice, cu pasi de integrare specifici si sunt apoireconectate prin polinoame de interpolare/extrapolare într-o metoda multirate(cu mai multe viteze). Problema proastei conditionǎri este practic rezolvatǎ peaceastǎ cale.Partitionarea sistemului de ecuatii poate fi fǎcutǎ si pe criteriul liniar/neliniar.Metodele bazate pe ecuatii au dezavantajul pierderii uneori a legǎturii cusemnificatia fizicǎ concretǎ a unora dintre variabile, a unora dintre ecuatii. Suntmetode mai degrabǎ pentru matematicieni. Pentru ingineri sunt mai indicatemetodele cuprinse sub genericul

Metode orientate pe module

Metodele din aceastǎ categorie au o caracteristicǎ principalǎ: fiecare modul esteo unitate fizicǎ sau un grup de unitǎti legate conform topologiei sistemuluisi/sau procesului tehnologic. Fiecarui modul i se furnizeazǎ intrǎri si fiecaremodul genereazǎ iesiri. Modulele pot fi tratate simultan sau în manierǎsecventialǎ.Varianta simultanǎ necesitǎ o etapǎ premergǎtoare de liniarizare care trebuierepetatǎ, refǎcutǎ la fiecare nou punct de început al unei noi etape de simulare.Metoda în varianta simultanǎ este mai curând potrivitǎ simulǎrii regimurilorstationare. Din nou, existǎ riscul sǎ se piardǎ semnificatia tehnicǎ-tehnologicǎ acalculelor si a rezultatelor lor. În cele ce urmeazǎ se acordǎ o atentie mai mare,nu atât de mare pe cât ar fi necesar, metodei modular-secventiale.Mai întâi este adusǎ în discutie varianta stationarǎ care contine unele elementede naturǎ topologicǎ comune si situatiilor dinamice. Modulele unui sistem maresunt conectate între ele prin fluxuri materiale, de energie sau de informatie. Întermeni topologici un sistem este un ansamblu de noduri (module) legate prin

159

Page 160: Gheorghe M.Panaitescu - ac.upg-ploiesti.roac.upg-ploiesti.ro/gpanaitescu/msds_2007.pdf · •Retele neuronale •Retele neuronale artificiale stratificate •Analiza multirezolutie

fluxuri (arce) orientate. Este posibil ca sistemul sǎ fie simplu ramificat, fǎrǎreveniri, si atunci calculul se executǎ o singurǎ datǎ. Este însǎ posibil ca unmodul calculat sǎ depindǎ de informatii generate de un modul care nu a fostîncǎ evaluat. În acest din urmǎ caz, sub aspect topologic existǎ unul sau maimulte cicluri în graful model al circulatiei informatiei în sistem care trebuietratat(e) iterativ.Cum se face distinctia între sisteme ciclice si neciclice? Desigur, pentru unelesisteme observarea unor cicluri poate fi o opratie vizualǎ, pentru altele estesuficientǎ o minimǎ algoritmizare. În orice caz, pentru simularea pecalculatoare, algoritmizarea este obligatorie. Algoritmizarea este obligatorie sipentru cǎ evaluǎrile se fac iterativ, prin sectionarea unor fluxuri si prinefectuarea în decursul calculului a unor comparatii între valorile pe cele douǎfete ale sectiunii, cea prezisǎ si cea rezultatǎ din calcul.Un exemplu simplu format dintr-un reactor chimic si o sectiune de separare aproduselor de reactie este dat în figura imediat urmǎtoare. Convertirea fluxuluide alimentare a reactorului în produsele de interes este numai partialǎ astfelîncât materialul neconvertit trebuie reintrodus în reactor. Se realizeazǎ astfel unreciclu material care este în particular un reciclu de informatie: fluxurile suntcaracterizate de anumiti parametri care în procesul de modelare-simularereprezintǎ informatii. În calculul modul cu modul reactorul nu poate fi calculatdeoarece nu este cunoscutǎ alimentarea lui ci numai partea proaspǎtǎ dinalimentare. Pentru partea recirculatǎ din alimentare trebuie fǎcutǎ o ipotezǎasupra calitǎtii si cantitǎtii pentru a face posibil un calcul si apoi, dupǎ calcululseparǎrii sǎ se aprecieze dacǎ ipoteza a fost corectǎ sau nu. Jocul ipotezǎ –comparatie între ipotetic si calculat este echivalent cu sectionarea(informationalǎ) a unui flux din ciclu, cu admiterea unor valori pe una din feteletǎieturii si compararea rezultatului asociat celeilalte fete a tǎieturii.

Un criteriu de apropiere între caracterisiticile ipotetice si cele calculate binestabilit poate spune când calculul se poate considera încheiat. Se observǎ cǎ printǎietura efectuatǎ s-a desfiintat un ciclu al grafului asociat sistemului. Ciclulpoate fi întrerupt si altfel dupǎ cum se poate usor observa în figura de mai sus.Maniera de calcul, în esentǎ iterativǎ se mentine.Algoritmul de analizǎ structuralǎ a sistemului de modelat trebuie sǎ spunǎ dacǎsistemul contine cicluri sau nu. Dacǎ contine cicluri trebuie sǎ indice care

160

Page 161: Gheorghe M.Panaitescu - ac.upg-ploiesti.roac.upg-ploiesti.ro/gpanaitescu/msds_2007.pdf · •Retele neuronale •Retele neuronale artificiale stratificate •Analiza multirezolutie

anume fluxuri trebuie sǎ fie tǎiate pentru deschiderea ciclurilor si, desigur,trebuie sǎ indice totodatǎ numǎrul strict necesar de asemenea sectionǎri.O retea de module cu conexiunile lor tehnologice si pur informationale poate sǎnu continǎ cicluri. Un exemplu de retea neciclicǎ este dat în figura alǎturatǎ.

Matricea de incidentǎ (cu 1 pentru fluxuri care acced un modul, cu –1 pentrufluxuri care pǎrǎsesc un modul) este datǎ în continuare.

1 2 3 4 5 6 7 8A 1 –1 –1B 1 –1C 1 –1D 1 1 –1E 1 1 –1

Se fac sume pe verticalele matricei, care corespund fluxurilor din schemasistemului. Acolo unde se obtin zerouri fluxurile sunt interioare, în rest fluxurilesunt periferice. Algoritmul de analizǎ a structurii sistemului este urmǎtorul:1. Se sterg fluxurile periferice;2. Un modul numai cu iesiri poate fi calculat; se sterge din lista de module;

rǎmân alte fluxuri periferice; se reia pasul 1.Operatia se opreste în douǎ situatii: a) nu mai sunt module de eliminat; b) numai pot fi eliminate module. În cazul a) sistemul este neciclic, ordinea de calculeste ordinea în care au fost eliminate modulele. În cazul b) sistemul este ciclicîn partea rǎmasǎ; modulele eliminate dau o ordine de calcul a pǎrtii neciclice.Iatǎ acum un exemplu de retea ciclicǎ.

Matricea de incidentǎ asociatǎ acestei retele este:

161

Page 162: Gheorghe M.Panaitescu - ac.upg-ploiesti.roac.upg-ploiesti.ro/gpanaitescu/msds_2007.pdf · •Retele neuronale •Retele neuronale artificiale stratificate •Analiza multirezolutie

1 2 3 4 5 6 7 8 9A 1 –1 1B 1 1 –1 –1C 1 –1 –1D 1 –1E –1 1F –1 1

Eliminarea fluxurilor periferice nu aduce nici un modul în starea cu zero intrǎri.Asadar, reteaua este ciclicǎ.Algoritmul de deciclizare porneste cu sectionarea tuturor fluxurilor. Apoi:1. Se numǎrǎ fluxurile de iesire sectionate, pentru fiecare nod (modul);2. Se calculeazǎ o functie de eficientǎ a înlocuirii iesirilor cu intrǎri astfel: se

scade din numǎrul total de fluxuri sectionate numǎrul de fluxuri de iesiresectionate ale modulului si apoi se adunǎ la rezultat numǎrul de intrǎrinesectionate ale aceluiasi modul;

3. Se cautǎ minimul pe noduri al functiei de eficientǎ. Dacǎ minimul egaleazǎsau depǎsesete numǎrul total de fluxuri sectionate nu mai este posibilǎ nici oîmbunǎtǎtire; secventa 1, 2, 3 este încheiatǎ si se continuǎ cu 5. Altminteri:

4. Pentru nodul retinut se trec toate iesirile în categoria fluxurilor nesectionatesi toate intrǎrile în categoria celor sectionate; se reia de la 1.

5. În matricea de incidentǎ se sterg valorile 1 din coloanele corespunzǎtoarefluxurilor sectionate; schema a fost deciclizatǎ, se stabileste ordinea decalcul conform algoritmului de la schemele fǎrǎ cicluri.

În cazul exemplificat, matricea de incidentǎ, dupǎ eliminarea fluxurilorperiferice are aspectul din tabelul alǎturat

2 3 4 5 6 7 8 I II III IVA –1 1 1 6 1 4 1*2 0B 1 1 –1 –1 2*5 0 5 0 3 0C 1 –1 –1 2 5 2*4 0 3 0D 1 0 7 0 7 0 3 0E –1 1 1 6 1 5 1 3 1 2F –1 1 1 6 1 4 1 3 1 2

Tabelul contine în ultimele patru coloane rezultatele numǎrǎrii fluxurilor dinschemǎ tǎiate la fiecare etapǎ a algoritmului de deciclizare. Tabelul urmǎtorcompleteazǎ operatia de reducere treptatǎ a numǎrului de fluxuri sectionate lafiecare etapǎ a algoritmului.

162

Page 163: Gheorghe M.Panaitescu - ac.upg-ploiesti.roac.upg-ploiesti.ro/gpanaitescu/msds_2007.pdf · •Retele neuronale •Retele neuronale artificiale stratificate •Analiza multirezolutie

2 3 4 5 6 7 8I x x x x x x xII x x x x xIII x x xIV x x

Calculul iterativ în cazul stationar are în vedere potrivirea unor valori prezise sicalculate, la tǎieturi. Cazul dinamic este mult, mult mai complicat deoarece secere potrivirea unor functii de timp în punctele respective. Problema se poaterezolva de pildǎ în manierǎ directǎ

( ) ( ) ( ) ( )f t f t f t+ = + + −1 1 1α αca o combinatie liniarǎ convexǎ între predictia anterioarǎ si valoarea curentǎ.Sansele de convergentǎ a calculului sunt nebuloase. O metodǎ mai perfectionatǎutilizeazǎ informatii pe mai multe intervale de timp (orizonturi de timp)anterioare si o extrapolare a intrǎrilor/iesirilor de formǎ polinomialǎ. Gradulpolinomului (polinoamelor) evolueazǎ de la 1 la un numǎr propus, pe mǎsurǎ cecantitatea informatiei sporeste.Algoritmizat:A. Prezicerea variabilelor fluxurilor tǎiate la t(n + 1);B. Calculul secvential al modulelor în ordinea stabilitǎ conform algoritmilor de

deciclizare de mai sus care au în vedere topologia sistemului.1. Se calculeazǎ diferentele între valorile calculate si cele anticipate ale

intrǎrilor si derivatelor lorεδ

= −= −

+ +

+ +

u u tu u t

n n n

n n n

1 1

1 1

( ) ( )

2. Se actualizeazǎ polinoamele de interpolare/extrapolare eventual cu oformulǎ recursivǎ de genul

b Db L Ln n+ = + +1 1 2ε δ3. Se utilizeazǎ un+1(t) pentru integrare pe orizontul de timp propus;

C. Se calculeazǎ eroarea de prezicere a fluxurilor sectionate;D. Actualizarea orizontului de timp.Simularea sistemelor mari nu este de aplicat în timp real decât pentru sistemelente. Simularea este mult aplicatǎ off line pentru pregǎtirea unor schimbǎri alefunctionǎrii sistemului (porniri, opriri, schimbǎri de regim tehnologic).

Exercitii de autoevaluare

1. Dinamica sistemelor mari se deosebeste de dinamica sistemelor simple prin:a) modelul matematic foarte voluminos;b) constantele de timp foarte diferite pentru diferite pǎrti sau fenomene

din sistem;

163

Page 164: Gheorghe M.Panaitescu - ac.upg-ploiesti.roac.upg-ploiesti.ro/gpanaitescu/msds_2007.pdf · •Retele neuronale •Retele neuronale artificiale stratificate •Analiza multirezolutie

c) frecventele situatii de rea conditionare a relatiilor/ecuatiiloralgebrice si/sau diferentiale;

d) scara la care se lucreazǎ.Marcati afirmatia inexactǎ.

2. În calculele de simulare bazate pe ecuatii, la finalul calculelor se pot obtineadesea solutii multiple. Cum se procedeazǎ în asemenea situatii?

a) se retin toate solutiile,b) se retin numai solutiile pozitive sauc) se retin acele solutii care au semnificatie tehnologicǎ si sunt

fezabile?3. Metoda de modelare-simulare bazatǎ pe module se aplicǎ într-un fel în cazul

sistemelor secventiale si secvential-ramificate si în alt fel în cazul sistemelorcu recirculare de materie, de energie si/sau de informatie. Marcati mai jostipul de calcul utilizat pentru sistemele cu recirculare.

a) calcul unic;b) un calcul iterativ, repetat pânǎ când se îndeplineste un criteriu de

convergentǎ;c) un calcul de bazǎ reluat imediat pentru verificare.

4. Metoda de simulare bazatǎ pe module se aplicǎ într-un fel pentru regimurilestationare, în alt fel pentru regimurile dinamice. În cazul calculelor iterative,care vizeazǎ regimurile dinamice, ce elemente intrǎ în criteriul deconvergentǎ?

a) functii de timp,b) variabile simple independente de timp sauc) convergenta nu este o problemǎ, ea se produce deja de la prima

evaluare?

164

Page 165: Gheorghe M.Panaitescu - ac.upg-ploiesti.roac.upg-ploiesti.ro/gpanaitescu/msds_2007.pdf · •Retele neuronale •Retele neuronale artificiale stratificate •Analiza multirezolutie

MODELE ALE DINAMICII SISTEMELOR CU EVENIMENTEDISCRETE

• Sisteme cu evenimente discrete• Introducere în teoria retelelor Petri• Semantica retelelor Petri• Invarianti• Conflicte, paralelism, viabilitate, mǎrginire, sigurantǎ• Marcaje• Timpi asociati cu pozitiile si tranzitiile• Reguli de functionare• Competitie si sincronizare• Mecanisme de control• Retele Petri speciale. Asincronism, masini de stare si automate• Grafuri cu evenimente temporizate• Probleme• Exercitii de autoevaluare

Sisteme cu evenimente discrete

Sistemele cu evenimente discrete, altceva decât sistemele discrete pur si simplu,constituie o categorie de sisteme nu mai putin importantǎ din punctul de vedereal inginerului automatist. Asemenea sisteme au o evolutie temporalǎ, deci odinamicǎ, dictatǎ de evenimente care se produc la momente variate fǎrǎ a fimultiplu întreg al vreunui tact de ceasornic sau al vreunui pas de timp.Fie cǎ este vorba de sisteme de productie flexibile, fie cǎ este vorba de retele decalculatoare, mai restrânse sau mai cuprinzǎtoare, de retele de automatebancare, sisteme tipice cu evenimente discrete, dinamica functionǎrii lor areputernice influente asupra unor parametri cu nuante economice caproductivitate, asigurarea fǎrǎ blocaje a unor servicii, accesibilitate etc.Capitolul prezent se referǎ cu precǎdere la sistemele productive, dar majoritateadacǎ nu totalitatea discutiei se poate extinde la multe alte tehnologii si nu înultimul rând la sistemele informatice în permanentǎ “sete” de resurse, utilizateîn competitie si în diviziune.Un instrument foarte popular printre ingineri si foarte eficace în tratareadinamicii sistemelor cu evenimente discrete este cel constituit de retelele Petri.

165

Page 166: Gheorghe M.Panaitescu - ac.upg-ploiesti.roac.upg-ploiesti.ro/gpanaitescu/msds_2007.pdf · •Retele neuronale •Retele neuronale artificiale stratificate •Analiza multirezolutie

Introducere în teoria retelelor Petri

Retelele Petri sunt un instrument matematic de naturǎ graficǎ datorat lui CarlAdam Petri. Aceste grafuri cu structurǎ specialǎ sunt utilizate la reprezentarea,modelarea si simularea unor sisteme foarte diverse în care dinamicaevenimentelor, evolutiile paralele, dependenţele conditionate (cum estesincronizarea), competitia pentru resurse etc. sunt nu numai prezente dar sunt sideterminante. Fenomene de aceste tipuri apar frecvent în sistemele de productie,în protocoalele de comunicare, în calculatoare si în retelele de calculatoare, înprogramele în timp real, în sistemele de transport etc. Toate aceste sisteme suntcunoscute în prezent ca sisteme cu evenimente discrete.Un punct de vedere din unghiul teoriei grafurilor. O retea Petri este opereche (G, M) compusǎ dintr-un graf bipartit orientat G = (E,V) si un marcajinitial M. Multimea nodurilor V este împǎrtitǎ în douǎ submultimi disjuncte, Psi T. Elementele din P se numesc pozitii, elementele din T se numesc tranzitii.Pozitiile se noteazǎ Pi, i = 1,…, |P|, tranzitiile se noteazǎ Tj, j = 1,…, |T| (barelede modul exprimǎ numǎrul de elemente din multimea scrisǎ între ele sau, cumse mai spune, cardinalul acelei multimi). Arcele cuprinse în multimea E mergde la pozitii la tranzitii si de la trazitii la pozitii. Graful este bipartit si un arc nupoate uni o pozitie cu o pozitie si nici o tranzitie cu o tranzitie. În reprezentareagraficǎ pozitiile se reprezintǎ uzual prin cercuri, tranzitiile prin bare îngrosate(uneori prin dreptunghiuri). Arcelor li se atribuie ponderi, totdeauna numereîntregi. Absenta graficǎ a ponderilor face subîntelese existenta unor ponderiegale cu unitatea. Pentru o definire completǎ a unei retele Petri trebuie introdusǎnotiunea de marcaj initial. Marcajul initial atribuie fiecǎrei pozitii Pi un numǎrnenegativ Mi. La reprezentarea graficǎ acele numere sunt trecute, dacǎ e posibil,în cercurile care reprezintǎ pozitiile (sau stǎrile). Vectorul coloanǎ M cucomponentele Mi se numeste marcajul initial al retelei. Se spune cǎ pozitia Pi

este anterioarǎ tranzitiei Tj dacǎ existǎ un arc de la Pi la Tj. Analog, se spune cǎpozitia Pi este ulterioarǎ tranzitiei Tj dacǎ existǎ un arc de la Tj la Pi.Uzual, pozitiile reprezintǎ conditii, iar tranzitiile reprezintǎ evenimente. Otranzitie (un eveniment) implicǎ un anumit numǎr de pozitii anterioare siulterioare, care reprezintǎ pre-conditii si post-conditii pentru acel eveniment.Dacǎ ponderile tuturor arcelor sunt egale cu unitatea, prezenta unui marcaj(denumit adesea si jeton) într-o pozitie se poate interpreta ca o conditieverificatǎ, îndeplinitǎ asociatǎ acelei pozitii. O altǎ interpretare mai generalǎeste: Mi jetoane prezente în pozitia Pi indicǎ o resursǎ disponibilǎ în cantitateaMi.Dintr-un punct de vedere clasic, marcajul unei retele Petri este identificat custarea retelei. Schimbarea stǎrii se produce dupǎ regulile care urmeazǎ:

166

Page 167: Gheorghe M.Panaitescu - ac.upg-ploiesti.roac.upg-ploiesti.ro/gpanaitescu/msds_2007.pdf · •Retele neuronale •Retele neuronale artificiale stratificate •Analiza multirezolutie

• O tranzitie Tj poate fi abilitatǎ si eventual amorsatǎ, activatǎ dacǎ toatepozitiile anterioare acelei tranzitii contin atâtea jetoane cât este pondereaarcului care duce la tranzitia în discutie.

• Când o tranzitie Tj este activatǎ, din fiecare pozitie anterioarǎ se consumǎ unnumǎr de jetoane si, în consecintǎ, se diminueazǎ numǎrul jetoanelor dinacea pozitie exact cu numǎrul pondere a arcului care conecteazǎ pozitia latranzitia respectivǎ; totodatǎ, se adaugǎ pozitiilor ulterioare tranzitiei Tj

atâtea jetoane câte sunt înscrise ca ponderi pe arcele emergente din Tj spreacele pozitii.

Observatie: în loc de a asocia ponderi arcelor, se poate face o reprezentare cuarce exclusiv cu pondere unitarǎ; atunci între pozitii si tranzitii apar arcemultiple în paralel.

Un punct de vedere din algebra liniarǎ. Într-o analizǎ a marcajului si apozitiilor, dacǎ se considerǎ vectorul (coloanǎ) M al marcajului, se spune ca maisus cǎ Mi este numǎrul de jetoane din pozitia Pi. Fie o matrice de dimensiuni |P|x|T| notatǎ −D cu elementul generic −

ijd egal cu ponderea arcului care pleacǎdin Pi si ajunge în Tj (arcele cu 0=−

ijd sunt inexistente). Analog, fie matricea+D de dimensiuni |P|x|T| cu +

ijd egal cu ponderea arcului de la tranzitia Tj lapozitia Pi (din nou, 0=+

ijd semnaleazǎ arce care nu existǎ). Pornind de laaceste definitii se spune cǎ tranzitia Tj este abilitatǎ si este amorsabilǎ dacǎ sinumai dacǎ −≥ jDM . . Activarea tranzitiei produce un marcaj nou M~ careverificǎ ecuatia:

−+ −+= jj DDMM ..~

Dacǎ se defineste matricea −+ −= DDD atunci se poate scrieDuMM +=~

în care u este vectorul coloanǎ definit ca uj = 1, ui = 0 pentru ji ≠ .Pentru mai multe tranzitii succesive, de pildǎ pentru douǎ, se poate scrie

++=++=++=+= DuMuuDMuDDuMuDMM )~(~~~~~

cu +u un vector sumǎ a vectorilor u asociati unor tranzitii simple, în particulardouǎ, un vector care nu poate avea componente negative.Observatie: Existenta unui vector de componente nenegative u astfel ca

DuMM +=~ nu implicǎ obligatoriu posibilitatea de a obtine marcajul M~ din

167

Page 168: Gheorghe M.Panaitescu - ac.upg-ploiesti.roac.upg-ploiesti.ro/gpanaitescu/msds_2007.pdf · •Retele neuronale •Retele neuronale artificiale stratificate •Analiza multirezolutie

marcajul M, prin una sau mai multe tranzitii. Conditia −≥′ jDM . trebuie sǎ severifice la fiecare pas intermediar când un marcaj M ′ trece la marcajul M ′′prin executarea unei anumite tranzitii Tj. În plus, în cazul unei succesiuni detranzitii, vectorul u nu spune nimic relativ la ordinea în care tranzitiile trebuiesǎ aibǎ (au) loc, ceea ce este foarte important. Datoritǎ acestor restrictii sistemulnu este realmente liniar si principiul suprapunerii efectelor nu se verificǎ decâtocazional.

Un exemplu: Pentru reteaua Petri din figura alǎturatǎ, conform definitiilorenuntate

=−

001003100110

D ,

=+

100210001001

D si

−−

−−−

=

101213101111

D

Sǎgetile (cenusii) din figurǎ indicǎ stǎrile succesive ale retelei dupǎ executareatranzitiilor înscrise pe acele sǎgeti. Dupǎ executarea secventei de tranzitii

2123 TTTT , toate executabile în ordinea mentionatǎ, se obtine marcajul

=

+

=

+

+

+

+

=

0110

121

0012

010

001

010

100

0012

~ DDM

Semantica retelelor Petri

Componentele diverse ale unei retele Petri au semnificatiile care urmeazǎ:

168

Page 169: Gheorghe M.Panaitescu - ac.upg-ploiesti.roac.upg-ploiesti.ro/gpanaitescu/msds_2007.pdf · •Retele neuronale •Retele neuronale artificiale stratificate •Analiza multirezolutie

• Marcajele reprezintǎ resurse în deplinul sens al cuvântului. Poate fi vorba deresurse fizice, cum sunt cele materiale, sau de informatii, mesaje, conditiietc.

• Din pozitii se asteaptǎ accesul la anumite resurse• Tranzitiile reprezintǎ actiuni consumatoare de resurse spre a fi prelucrate,

tranzitiile sunt producǎtoare de alte resurse• Ponderile arcelor care leagǎ o pozitie cu o tranzitie reprezintǎ numǎrul

minim de resurse din categoria stocatǎ în acea pozitie necesar pentru aexecuta tranzitia

• Ponderile arcelor care unesc o tranzitie cu o pozitie reprezintǎ numǎrulexact de resurse noi din categoria celor stocate în acea pozitie, resurseproduse prin actiunea definitǎ de tranzitie

• Numǎrul total de marcaje, de jetoane dintr-o retea Petri nu se conservǎobligatoriu: se pot imagina actiuni de asamblare, se pot imagina actiuni dedemontare a unor ansambluri în pǎrti componente; mesajele pot ficombinate pentru obtinerea unui mesaj nou (cum este cazul însumǎrii adouǎ numere) sau un mesaj dat poate fi difuzat cǎtre mai multe pozitii.

Invarianti

Invarianti în pozitii. Se admite cǎ v este un vector linie de dimensiune |P| careverificǎ relatia vD = 0. Atunci, produsul vM, produs care se poate interpreta ca osumǎ ponderatǎ a valorilor marcajului, cu ponderile egale cu componentelevectorului v se mentine constant oricare ar fi secventa de tranzitii executatǎ. Depildǎ pentru un marcaj M~ rezultat din M are loc implicatia evidentǎ

vMvDuvMMvDuMM =+=⇒+= ~~

Exemplu. Pentru reteaua Petri datǎ mai devreme se observǎ cǎ

[ ] [ ] [ ]0000

101213101111

10101010 =

−−

−−−

=D

Asta se traduce prin aceea cǎ numǎrul total al marcajelor din pozitiile P2 si P4 sementine constant independent de tranzitiile executate.Invarianti pentru tranzitii. Fie acum un vector coloanǎ u de dimensiune |T| sicu componente nenegative care verificǎ egalitatea Du = 0. Atunci, oricaresecventǎ de tranzitii fezabilǎ reprezentatǎ de vectorul u conservǎ marcajulinitial. Într-adevǎr

MDuMM =+=~

Cum s-a discutat mai sus, secventa de tranzitii fezabile cuprinsǎ în u poate si sǎnu existe.

169

Page 170: Gheorghe M.Panaitescu - ac.upg-ploiesti.roac.upg-ploiesti.ro/gpanaitescu/msds_2007.pdf · •Retele neuronale •Retele neuronale artificiale stratificate •Analiza multirezolutie

Exemplu. Pentru reteaua Petri din figura alǎturatǎ

=

−−

−−−

=000

101

101212101111

Du

Se poate verifica faptul cǎ vectorul u = [1 0 1]T ar putea reprezenta fie secventa13TT , fie secventa 31TT dar numai una din ele este fezabilǎ.

Conflicte, paralelism, viabilitate, mǎrginire, sigurantǎ

Conflicte.Definitie. Se spune cǎ douǎ tranzitii diferite Ti si Tj sunt în conflict structuraldacǎ

0: ≠×∃ −−kjki DDk

ceea ce înseamnǎ cǎ pozitia Pk premerge ambele tranzitii. Se spune despre unconflict structural cǎ este si efectiv dacǎ, în plus, la marcajul M ambele tranzitiipot fi activate, adicǎ atât −≥ iDM . cât si −≥ jDM . .Exemplu. În reteaua Petri de mai sus tranzitiile T2 si T3 sunt în conflictstructural (pozitia P1 este anterioarǎ ambelor tranzitii). Acest conflict este siefectiv în prima parte a figurii (a), dar nu este efectiv dupǎ ce tranzitia T3 s-aprodus, în partea din dreapta a figurii (b).Termenul de conflict provine din aceea cǎ dacǎ tranzitiile Ti si Tj sunt în conflictstructural efectiv, atunci nu se poate produce, nu se poate amorsa decât una dinaceste tranzitii si nu ambele deoarece nu sunt suficiente jetoane în pozitiileanterioare oricum s-ar succeda tranzitiile în discutie. În situatiile de acest geneste necesarǎ o decizie: care din cele douǎ tranzitii urmeazǎ a se amorsa. Altfelspus, douǎ tranzitii în conflict structural sunt în competitie pentru resurseleaccesibile din cel putin o pozitie anterioarǎ pe care o împart.Paralelism. Definitie. Se spune cǎ douǎ tranzitii Ti si Tj sunt structural paralele dacǎ

0.. =× −−j

Ti DD

170

Page 171: Gheorghe M.Panaitescu - ac.upg-ploiesti.roac.upg-ploiesti.ro/gpanaitescu/msds_2007.pdf · •Retele neuronale •Retele neuronale artificiale stratificate •Analiza multirezolutie

ceea ce înseamnǎ cǎ tranzitiile Ti si Tj nu au pozitii anterioare în comun. Sespune cǎ paralelismul structural este efectiv la un marcaj M dacǎ, în plus,ambele tranzitii pot fi activate (fiind deja abilitate), adicǎ atât −≥ iDM . cât si

−≥ jDM . .Exemplu. În reteaua Petri de mai devreme tranzitiile T1 si T2 sunt structuralparalele. Acest paralelism este efectiv în cazul din figura secundǎ, cea dindreapta (b), ceea ce nu este cazul cu prima figurǎ (a).Viabilitate.Definitie. Tranzitia Ti este viabilǎ (sau vie) atunci când oricare ar fi marcajulaccesibil din marcajul initial, existǎ o secventǎ de tranzitii fezabile, secventǎcare conduce la un marcaj pentru care tranzitia este abilitatǎ, este gata pentruamorsare. O retea Petri se spune cǎ este viabilǎ dacǎ toate tranzitiile ei suntviabile.De notat cǎ dacǎ o tranzitie este viabilǎ atunci ea poate fi amorsatǎ indefinit (sezice cǎ existǎ o suceesiune de tranzitii fezabile prin care acea tranzitie este viela nesfârsit). Dacǎ o tranzitie nu este viabilǎ atunci existǎ posibilitatea careteaua Petri sǎ functioneze numai un timp finit, dar prin repetarea unei anumitegrupe de tranzitii poate fi în functiune si un timp indefinit.Exemplu. Reteaua Petri din figura cu cinci faze datǎ mai sus nu este viedeoarece secventa de tranzitii consideratǎ conduce la un marcaj pentru care nicio tranzitie nu mai este abilitatǎ pentru executie (situatie de blocaj, “dead-lock”).Mǎrginire, sigurantǎ.Definitie. O pozitie Pi este k-mǎrginitǎ dacǎ marcajul ei nu este (nu poate fi)mai mare decât k, oricare ar fi marcajul (accesibil). O pozitie se numeste sigurǎdacǎ este 1-mǎrginitǎ. O retea Petri este sigurǎ dacǎ toate pozitiile sale sunt 1-mǎrginite (sigure).Notǎm cǎ dacǎ o pozitie este de tipul magazie, buffer cu o capacitate finitǎ k (undepozit, o memorie, de pildǎ) atunci în mod necesar reteaua Petri trebuie sǎ fiek-mǎrginitǎ dacǎ modelarea este corect fǎcutǎ. Mai departe se va da o metodǎsimplǎ de asigurare a mǎrginirii corecte.Exemplu. Secventa de tranzitii T3, T1 din figura alǎturatǎ conduce la un marcajcare coincide cu cel initial, cu exceptia celui pentru pozitia P3 care are un jetonîn plus. Mai mult, dacǎ secventa de tranzitii mentionatǎ se repetǎ de k ori, înpozitia P3 se acumuleazǎ k jetoane si, în consecintǎ, pozitia nu este mǎrginitǎ.Sub aspect matematic se scrie (cu u vectorul asociat secventei T3, T1):

>

=

−−

−−−

=

0000

0100

101

101211101111

Du

171

Page 172: Gheorghe M.Panaitescu - ac.upg-ploiesti.roac.upg-ploiesti.ro/gpanaitescu/msds_2007.pdf · •Retele neuronale •Retele neuronale artificiale stratificate •Analiza multirezolutie

si atunciMDuMM >+=~

Prin repetarea secventei de tranzitii mentionate, permanent fezabilǎ, se obtine ocrestere a marcajului pozitiei P3 indefinitǎ. Pornind de la acest exemplu se poateobserva cǎ ori de câte ori o retea Petri admite o secventǎ de tranzitii fezabilǎpentru care vectorul u verificǎ relatia Du > 0, reteaua Petri este nemǎrginitǎ(rationamentul pentru cazul general este similar celui din exemplul de mai sus).

Marcaje

Majoritatea proprietǎtilor de mai sus se pot verifica dacǎ se cunoaste multimeamarcajelor accesibile pornind de la marcajul initial. Desigur, calculul tuturormarcajelor accesibile din marcajul initial nu este în general o sarcinǎ usoarǎ.Figura care urmeazǎ ilustreazǎ un asemenea calcul într-un caz simplu.

172

Page 173: Gheorghe M.Panaitescu - ac.upg-ploiesti.roac.upg-ploiesti.ro/gpanaitescu/msds_2007.pdf · •Retele neuronale •Retele neuronale artificiale stratificate •Analiza multirezolutie

Timpi asociati cu pozitiile si tranzitiile

Teoria originalǎ a retelelor Petri trateazǎ evenimentele în ordinea lor si, înconsecintǎ, diamica retelei a fost consideratǎ ca o succesiune de evenimente (detranzitii) restrânsǎ numai la considerente de logicǎ (o tranzitie se poatedesfǎsura numai dacǎ este abilitatǎ). În acest context, întrebarea “cât timpconsumǎ un eveniment?” nu se pune. Dar pentru a rǎspunde la întrebǎri relativla performantele retelei si ale sistemului modelat cu reteaua (de pildǎ, “cât derepede poate produce sistemul?”) este necesar a introduce în discutie timpul.Într-adevǎr, cu pozitiile si cu tranzitiile se pot asocia durate pe calea urmǎtoare:• Durate asociate cu pozitiile: duratele minime pentru ca jetoanele sǎ devinǎ

permanente într-o pozitie, înainte de fi capabile a contribui la abilitarea (siamorsarea) unei/unor tranzitii urmǎtoare. Duratele acestea se numesc timpide asteptare.

• Durate asociate tranzitiilor: durate care separǎ momentul de început(consumul de jetoane din pozitiile premergǎtoare) si momentul de finalizarea actiunii (producerea de jetoane destinate pozitiilor urmǎtoare)corespunzǎtoare tranzitiilor. Aceste durate au primit numele de timpi deactiune.

Duratele de executie pot fi utilizate, de pildǎ, pentru a reprezenta timpul deproductie în cazul sistemelor de productie (unde tranzitia reprezintǎ timpuluzual consumat pe masina unealtǎ). Timpii de asteptare ar putea reprezentaduratele transportului (în cazul în care o pozitie reprezintǎ o rutǎ sau un canalprin care comunicǎ douǎ procese) sau la fel de bine timpul minim de accesnecesar accesibilitǎtii (cum ar fi timpul de rǎcire al unei piese trecute printr-uncuptor, înainte de a i se putea aplica prelucrarea urmǎtoare). Timpii, duratele deasteptare si de executie pot fi constante sau variabile, pot fi deterministe saualeatoare. Nu trebuie ignorat nici timpul de constituire a numǎrului de jetoanedintr-o pozitie necesar abilitǎrii unei tranzitii.Observatie. În realitate, fǎrǎ pierdere din generalitate, se poate admite cǎ toateactiunile sunt instantanee (toate tranzitiile se petrec în timp nul). Tranzitiile cuduratǎ nenulǎ se divid în douǎ tranzitii instantanee (începutul si terminareaactiunii) separate de o pozitie care are timpul de asteptare egal cu timpul deexecutie al tranzitiei originare (v.figura alǎturatǎ).

Tranzitii de intrare si de iesire. Tranzitiile care nu au pozitii premergǎtoare senumesc tranzitii de intrare sau surse. Actiunile de acest tip depind de deciziiexterne, sunt controlate din exterior. Tranzitiile care nu au pozitii urmǎtoare se

173

Page 174: Gheorghe M.Panaitescu - ac.upg-ploiesti.roac.upg-ploiesti.ro/gpanaitescu/msds_2007.pdf · •Retele neuronale •Retele neuronale artificiale stratificate •Analiza multirezolutie

numesc tranzitii de iesire sau consumatori. Tranzitiile de acest gen indicǎproducerea de jetoane destinate exteriorului.Aceleasi definitii se pot aplica si pozitiilor: pozitiile de intrare trebuieaprovizionate cu jetoane din exterior. În realitate, cum se va vedea mai departe,în acord cu clasa particularǎ a retelei Petri în studiu, poate rezulta mai potrivitǎutilizarea la periferie a tranzitiilor (si nu a pozitiilor de intrare si de iesire) sau apozitiilor (si nu a tranzitiilor de intrare si de iesire).

Reguli de functionare

Pânǎ aici executǎrii tranzitiilor li s-au impus numai restrictii de ordin logic fǎrǎa specifica momentul în care o tranzitie este efectiv executatǎ. Acum, cǎ s-aadus în discutie timpul, se poate defini regula de functionare cunoscutǎ caregula timpului de actiune cel mai apropiat: tranzitiile se executǎ cât de promptposibil, adicǎ de-îndatǎ ce sunt asigurate toate jetoanele necesare pentru aabilita trazitia.În imediatǎ legǎturǎ cu regula de mai sus se introduc reguli de prioritate,regulile de arbitraj în cazul pozitiilor implicate într-un conflict, sau modalitateade a indica ce tranzitie trebuie sǎ se execute atunci când apare un conflict sitraiectoriile la intrare, functii +→ RNui : (una pentru fiecare tranzitie deintrare Ui) cu ui(n) instanţa în care tranzitia de intrare Ui se aflǎ la momentul n.Cu aceste reguli de functionare se pot determina toate momentele la care seproduc evenimentele din retea ca, de exemplu, actiunile succesive, sosirea siplecarea unor jetoane într-o/dintr-o pozitie etc. În particular, se ajunge lamomentele când se executǎ tranzitiile de iesire ceea ce constituie traiectoriile laiesire.

Competitie si sincronizare

Competitia pentru a produce, reunirea într-o pozitie. Aceastǎ situatie seîntâlneste atunci când o pozitie are mai multe tranzitii premergǎtoare. În acestcaz existǎ mai multe surse care produc jetoane destinate acelei pozitii (v.figura).Ca exemplu de acest tip poate servi cazul unei pozitii-depozit unde sosescproduse ale mai multor masini, tranzitiile reprezentând tocmai actiunile acestormasini.

174

Page 175: Gheorghe M.Panaitescu - ac.upg-ploiesti.roac.upg-ploiesti.ro/gpanaitescu/msds_2007.pdf · •Retele neuronale •Retele neuronale artificiale stratificate •Analiza multirezolutie

Competitia pentru a consuma, ramificarea dintr-o pozitie. În acest caz o pozitieare mai multe tranzitii care o urmeazǎ (v.figura urmǎtoare). Tranzitiile sunt încompetitie pentru jetoanele acestei pozitii. Situatia se trateazǎ ca un conflictstructural cum s-a discutat mai devreme.

Sincronizarea în a produce, ramificarea dintr-o tranzitie. Aici o tranzitie aremai multe pozitii urmǎtoare (v.figura). În aceste cazuri jetoanele (resurse, pǎrticomponente, mesaje etc.) sunt emise simultan cǎtre pozitiile consumatoareurmǎtoare.

Tranzitia ar putea corespunde, de pildǎ, unei operatii de dezmembrare a uneipiese în pǎrtile ei componente.Sincronizarea în consum, reunirea într-o tranzitie. Situatia corespunde cazuluiîn care o tranzitie are mai multe pozitii premergǎtoare.

Jetoanele asteaptǎ în acele pozitii momentul în care apare ultimul jeton careabiliteazǎ tranzitia (se spune cǎ starea fiecǎrei pozitii dureazǎ cel putin câtdurata de asteptare a celei pozitii). În acel moment se consumǎ concomitenttoate jetoanele necesare pentru activarea tranzitiei.

Mecanisme de control

Prevenirea activǎrii multiple simultane a unei tranzitii. În conformitate cudefinitiile de mai devreme, nimic nu împiedicǎ o tranzitie sǎ devinǎ activǎsimultan de mai multe ori: dacǎ activarea unei tranzitii nu este instantaneeatunci se poate întâmpla ca tranzitia sǎ se amorseze da mai multe ori înainte ca

175

Page 176: Gheorghe M.Panaitescu - ac.upg-ploiesti.roac.upg-ploiesti.ro/gpanaitescu/msds_2007.pdf · •Retele neuronale •Retele neuronale artificiale stratificate •Analiza multirezolutie

actiunea determinatǎ de prima activare sǎ se fi isprǎvit. Asta ar însemna ca omasinǎ destinatǎ efectuǎrii unei anumite operatii pe un tip de piese, pe rândpentru fiecare piesǎ, sǎ fie “inundatǎ” de alte piese similare care, evident, nu potfi servite paralel. Pentru a preveni o situatie de acest gen se ataseazǎ aceleitranzitii o pozitie suplimentarǎ. Aceastǎ pozitie trebuie sǎ aibǎ ca unicǎ tranzitieanterioarǎ si unicǎ tranzitie urmǎtoare tranzitia în discutie. Figura care urmeazǎexplicǎ metoda în douǎ variante echivalente. În varianta din stânga tranzitia aredurata t, duratǎ necesarǎ executǎrii actiunii cǎreia îi corespunde. Pozitiasuplimentarǎ are durata θ de punere în miscare a actiunii. În varianta din dreaptatranzitia a fost descompusǎ în douǎ tranzitii instantanee cu o pozitie între ele cudurata de asteptare t. Pozitia suplimentarǎ are aceleasi caracterisitici.

Agregatul mai simplu sau mai complex al buclei create se numeste reciclareatranzitiei. În plus, se poate atribui un timp de asteptare pozitiv pozitieireciclante pentru a forta un timp minim între finalizarea unei actiuni si initiereaurmǎtoarei (se poate vorbi de un timp de punere în miscare/în functiune). Seobservǎ cǎ pozitia jetonului în buclǎ indicǎ dacǎ tranzitia este ocupatǎ sauliberǎ, ocuptǎ atunci când jetonul din pozitia suplimentarǎ lipseste.Controlul fluxului. O modificare similarǎ permite limitarea fluxului de jetoaneprintr-o tranzitie cu timp de actiune nul. Se observǎ (v.figura urmǎtoare) cǎ dacǎmarcajul initial al pozitiei suplimentare asociate tranzitiei (pozitie care, deasemenea, trebuie sǎ aibǎ ca unicǎ tranzitie premergǎtoare si urmǎtoare tranzitiaconsideratǎ) este m si timpul ei de asteptare t atunci fluxul maxim de jetoaneprin acea tranzitie este de m jetoane la fiecare t unitǎti de timp.

Figura indicǎ un debit maxim de douǎ jetoane la fiecare trei unitǎti de timp.

176

Page 177: Gheorghe M.Panaitescu - ac.upg-ploiesti.roac.upg-ploiesti.ro/gpanaitescu/msds_2007.pdf · •Retele neuronale •Retele neuronale artificiale stratificate •Analiza multirezolutie

Pozitii cu capacitate limitatǎ. Modelarea unor sisteme fizice pune problemapracticǎ a capacitǎtii limitate a unor pozitii. Existǎ firesc o limitǎ superioarǎ anumǎrului de jetoane pe care o pozitie le poate contine. Mǎrginirea specificatǎsi sigurǎ a unei pozitii se poate obtine pe baza urmǎtorului algoritm:1. Pentru o pozitie p k-mǎrginitǎ se adaugǎ o pozitie suplimentarǎ p’ cu

marcajul initial M(p’) = k – M(p)2. Între fiecare tranzitie t si pozitiile suplimentare de genul p’ se definesc arce

suplimentare cu ponderile w(t, p’) = w(p, t) si w(p’, t) = w(t, p) ceea ce faceca suma jetoanelor din pozitia p si din pozitia complementarǎ p’ sǎ fieaceeasi si înainte su dupǎ executarea unei tranzitii.

Figura alǎturatǎ este un exemplu.

Este aici vorba de un depozit intermediar între douǎ servicii marcate printranzitiile din figurǎ. Capacitatea depozitului este de maximum 6 unitǎti.Sincronizarea activǎrii tranzitiilor. Uneori se poate întâmpla ca douǎ sau maimulte tranzitii sǎ reprezinte aceeasi actiune fizicǎ. Într-un asemenea caztranzitiile trebuie sǎ se sincronizeze pentru a se amorsa simultan. Asta se poaterealiza cel putin în douǎ moduri care duc la un gen de “unire” a tranzitiilorconsiderate (Unul din cele douǎ moduri nu este deplin acceptabil sub incidentateoriei clasice a retelelor Petri; cum se va arǎta mai departe, sub aspectmatematic modul acela este totusi corect si adecvat în a exprimasimultaneitatea). Este vorba de a face sǎ coincidǎ începutul si sfârsitul uneietape pentru mai multe resurse implicate simultan într-o anumitǎ etapǎ. Seapeleazǎ la “circuite de sincronizare” fǎrǎ temporizare si fǎrǎ jetoane. Fiecaredin cele douǎ arce ale circuitului de sincronizare include si impune câte oinegalitate, una de sens opus celeilalte, la momentele de activare a tranzitiilor,de unde egalizarea momentelor de activare a tranzitiilor. Aceste tranzitii potapoi sǎ fie puse laolaltǎ, pot fuziona (v.figurile urmǎtoare).

177

Page 178: Gheorghe M.Panaitescu - ac.upg-ploiesti.roac.upg-ploiesti.ro/gpanaitescu/msds_2007.pdf · •Retele neuronale •Retele neuronale artificiale stratificate •Analiza multirezolutie

Existenta de circuite fǎrǎ jetoane (si fǎrǎ temporizare), acceptabilǎ sub aspectmatematic, este contrarǎ regulilor ortodoxe ale retelelor Petri. Se poate justificafunctionarea spunând cǎ se “împrumutǎ” jetoanele (absente din circuitul desincronizare) pentru a activa tranzitiile si cǎ schema este în mǎsurǎ a restituiaceste jetoane într-un timp nul. Fuziunea tranzitiilor sincronizate înlǎturǎ oricediscutie.De notat cǎ un numǎr egal de sǎgeti intrǎ în si ies din tranzitiile sincronizate. Înconsecintǎ, numǎrul total de jetoane din graf (si nu numai din circuite) seconservǎ în timpul functionǎrii. Se recupereazǎ de asemenea interpretarea de“resurse” a jetoanelor însesi.O altǎ solutie foarte diferitǎ permite si aceasta sincronizarea a douǎ tranzitii.Aceastǎ solutie evitǎ circuitele de sincronizare cu pretul introducerii unortranzitii fictive înaintea tranzitiilor adevǎrate. Solutia este ilustratǎ în figuraalǎturatǎ. Se poate verifica prin simularea functionǎrii retelei Petri si, maideparte, prin ecuatii, cǎ sincronizarea este efectivǎ.

Aceastǎ diversitate de solutii grafice produs al aceleiasi ecuatii matematice esteo ilustrare a interesului de a pune în ecuatii grafurile de evenimente.

178

Page 179: Gheorghe M.Panaitescu - ac.upg-ploiesti.roac.upg-ploiesti.ro/gpanaitescu/msds_2007.pdf · •Retele neuronale •Retele neuronale artificiale stratificate •Analiza multirezolutie

Retele Petri speciale. Asincronism, masini de stare si automate

Retelele Petri asincrone sunt acelea în care toate tranzitiile au cel mult o pozitieanterioarǎ si cel mult o pozitie urmǎtoare (v.figura care urmeazǎ). În asemenearetele nu existǎ tranzitii de intrare si de iesire si, de aceea, “terminalele” sunt detipul pozitiilor (ceea ce face ca fiecare tranzitie sǎ posede exact o singurǎpozitie premergǎtoare si o singurǎ pozitie urmǎtoare).O retea Petri cu toate tranzitiile având exact o pozitie premergǎtoare si exact opozitie urmǎtoare se numeste masinǎ de stare. În masinile de stare asignareatimpului pentru tranzitii si pozitii nu este importantǎ. Singurul efect al atribuiriieste de întârziere a executǎrii tranzitiilor. Aici problema principalǎ este cealogicǎ (accesibilitatea marcajelor, eliminarea blocajelor etc.). În general efortulprincipal de control este orientat pe executarea tranzitiilor. Când numǎrul totalde marcaje este 1, gândul poate duce la faptul cǎ acel marcaj unic aratǎ stareasistemului (pozitiile reprezintǎ stǎrile posibile ale sistemului) si reteaua obtinutǎse poate interpreta ca fiind un automat. Dacǎ în plus fiecare pozitie are exact otranzitie urmǎtoare, acel automat rezultǎ a fi determinist. Dacǎ nu acesta estecazul, automatul nu este determinist (v.figura) si atunci pentru fiecare stare suntposibile traiectorii diferite. În cazul non-determinist se atribuie probabilitǎtiarcelor care pleacǎ dintr-o pozitie si atunci se obtine un automat stochastic.Partea pe fond cenusiu din figura de mai jos detaliazǎ cǎile alternative de aajunge de la pozitia P1 la pozitia P3.

Invarianti. Cum într-o masinǎ de stare fiecare tranzitie are o pozitiepremergǎtoare si una urmǎtoare, matricea −+ −= DDD contine pe coloanaasociatǎ cu tranzitia un –1 si un 1 (dacǎ arcele toate au ponderea unitarǎ). Înrealitate matricea D poate fi consideratǎ o matrice de incidentǎ noduri-arcuri îngraful orientat, care se obtine dacǎ fiecare tranzitie se înlocuieste cu un arc careleagǎ pozitia anterioarǎ de pozitia urmǎtoare acelei tranzitii (nodurile acestuigraf sunt pozitiile grafului initial). Cu aceastǎ observatie si cu rezultatele simpledin teoria grafurilor se obtin consecintele care urmeazǎ.• Invarianti pentru pozitii: deoarece matricea D are structura coloanelor

arǎtatǎ (un –1 si un +1) rezultǎ cǎ0)...1...1...( =D

179

Page 180: Gheorghe M.Panaitescu - ac.upg-ploiesti.roac.upg-ploiesti.ro/gpanaitescu/msds_2007.pdf · •Retele neuronale •Retele neuronale artificiale stratificate •Analiza multirezolutie

motiv pentru care numǎrul total de jetoane într-o masinǎ de stare estepermanent acelasi.Pentru ca o retea Petri sǎ fie viabilǎ este necesar ca marcajul initial sǎ nu fienul. Pentru o masinǎ de stare aceastǎ conditie este si suficientǎ dacǎstructura este conexǎ.

• Invarianti pentru tranzitii: dacǎ u este un vector coloanǎ caracteristic al unuicircuit (matricea de incidentǎ arcuri-noduri este transpusa matricei deincidentǎ noduri-arce) se spune cǎ componentele lui u care corespundarcelor (tranzitiilor) unui circuit au valoarea 1 si componentele celelalatesunt nule. Atunci se verificǎ relatia

0=Du

Grafuri cu evenimente temporizate

Se considerǎ grafurile de evenimente temporizate (GET) cu ponderile arcelorunitare si temporizare constantǎ si numai pentru pozitii. Se demonstreazǎ cǎsistemele de acest gen pot fi modelate ca sisteme “liniare” într-o semnificatiediferitǎ a termenului.Punctul de vedere “dater”. Este convenabil a se considera cǎ GET suntdelimitate de tranzitii adicǎ toate pozitiile au tranzitii premergǎtoare siurmǎtoare. Aceastǎ conventie nu implicǎ vreo restrictie deoarece:• Orice pozitie de intrare îsi ia jetoanele din exterior si despre ele se poate

gândi ca provenind de la o tranzitie premergǎtoare controlatǎ dinafarǎ.• Orice pozitie de iesire poate fi urmatǎ de o tranzitie care se activeazǎ numai

pentru jetoanele care sosesc la acea pozitie.Se noteazǎ tranzitiile de intrare activate cu uj cu j = 1, . . . , m, etc. cu indicele jasociat unei ordonǎri temporale. În formǎ similarǎ se noteazǎ tranzitiile de iesireactivate cu yl, l = 1, . . . , p si tranzitiile interne activate cu xi, i = 1, . . . , n. Dincauza succesiunii lor în timp, aceste numere functii de timp se numesc dater-e(cele care dateazǎ, care fac calendarul).Cu adoptarea regulii cǎ tranzitiile sunt amorsate imediat ce este posibil si cumentiunea cǎ orice conflict este absent, singurele elemente necesar a ficunoscute pentru a realiza o simulare sunt:• Momentele când sunt activate tranzitiile de intrare (prin decizii externe) pe

întreaga duratǎ a simulǎrii• Momentele când sunt disponibile jetoanele prezente în marcajul initial (se

poate considera cǎ aceste jetoane sunt prezente de un anumit timp, înaintede a începe simularea)

Cunoscând aceste informatii, este posibil a determina când se vor producetranzitiile interne si tranzitiile de iesire.Ecuatiile dater. Se prezintǎ dater-ele asociate cu fiecare tranzitie. Pentru otranzitie xi, variabila asociatǎ xi(k) se interpreteazǎ ca momentul în care se

180

Page 181: Gheorghe M.Panaitescu - ac.upg-ploiesti.roac.upg-ploiesti.ro/gpanaitescu/msds_2007.pdf · •Retele neuronale •Retele neuronale artificiale stratificate •Analiza multirezolutie

produce cea de a k amorsare. De la începutul simulǎrii activǎrile succesive aleunei tranzitii sunt numǎrate secvential de la o origine generalǎ (uzual zero, darpoate fi si un numǎr negativ). Asadar, functia k → xi(k) este nedescrescǎtoare(unele activǎri se pot produce simultan si, de aceea, functia poate sǎ nu fie strictcrescǎtoare).Timpul se poate observa pe o scarǎ realǎ, rationalǎ sau întreagǎ, de la caz lacaz, x(k) ∈ R, Q sau Z.Ecuatiile de datare (daters) rezultǎ din consideratiile urmǎtoare:• Dacǎ tranzitia xi este ulterioarǎ tranzitiei xj si este separatǎ de o pozitie

notatǎ Pij, atunci cea de a k executare a tranzitiei xi va consuma jetonulprodus de executarea numǎrul k – Mij a tranzitiei xj cu Mij marcajul initial alpozitiei Pij.

• Dacǎ timpul de asteptare în pozitia Pij este tij, executarea numǎrul k atranzitiei xi nu se poate produce dacǎ nu s-a scurs cel putin tij unitǎti de timpde la amorsarea numǎrul k – Mij a tranzitiei xj.

• Tinând cont de aceastǎ relatie pentru toate tranzitiile xj anterioare tranzitieixi, maximumul tuturor acestor momente determinǎ momentul amorsǎriinumǎrul k a tranzitiei xi.

În final, notând cu *i multimea de indici ai tranzitiilor anterioare tranzitiei xi,ecuatia fundamentalǎ pentru GET este

( )ijijji tMkxij

kx +−∈

= )(*

max)(

Ecuatiile sunt valide totdeauna, chiar si când jetoanele considerate au fostproduse prin activarea tranzitiilor în timpul simulǎrii. Dacǎ numǎrǎtoareaactivǎrilor începe cu k = 0, ecautiile se valideazǎ pentru k ≥ Mij. Ecuatiile suntvalide fǎrǎ restrictii când jetoanele marcajului initial nu contribuie la operatia deluare a maximumului.Jetoanele marcajului initial constituie lista de utilizare la momentul –∞,acoperitor. Se vorbeste atunci de conditii initiale canonice.În continuare se expune modul cum actioneazǎ conditiile initiale arbitrare (nuneapǎrat canonice).Din ecuatia genericǎ de mai sus, validǎ cu restrictia din paragraful anterior,rezultǎ în mod evident cǎ forma generalǎ a ecuatiilor de datare pentru un GETcomplet este urmǎtoarea (pentru explicatii privind operatorii din relatiileprezentate, a se citi NOTA2 din subsolul paginii):2 NOTA: Relatiile sunt scrise într-o algebrǎ specialǎ, algebra dioizilor.

181

Page 182: Gheorghe M.Panaitescu - ac.upg-ploiesti.roac.upg-ploiesti.ro/gpanaitescu/msds_2007.pdf · •Retele neuronale •Retele neuronale artificiale stratificate •Analiza multirezolutie

⊕−⊕⊕⊕−⊕= )1()()1()()( 1010 kuBkuBkxAkxAkx ⊕−⊕⊕⊕−⊕= )1()()1()()( 1010 kuDkuDkxCkxCky

în care• x(.), u(.) si y(.) sunt vectori coloanǎ de dimensiuni n, m, p• Ai, Bi, Ci, Di, sunt matrici de dimensiunile nxn, nxm, pxn si pxm. Numǎrul

maxim de matrici (nenule) din fiecare tip este egal cu maximumulmarcajului initial al pozitiilor din GET, cum se explicǎ în continuare

• Regula cǎreia i se supune elementul (r, s) al matricei Ai este: dacǎ r este otranzitie internǎ imediat ulterioarǎ tranzitiei interne s si dacǎ are i jetoane înmarcajul initial al pozitiei Prs atunci elementul (Ai)rs nu este nul (adicǎ estedistinct de ε) si este egal cu timpul de asteptare al pozitiei Prs. Cu alte

Pe multimea numerelor reale se defineste o structurǎ algebricǎ de dioid, descrisǎ pe scurtimediat.Definitie: Un dioid este o multime D dotatǎ cu douǎ operatii notate “ ⊕ ” si “ ⊗ ”, care senumesc respectiv “adunare” si “multiplicare” si care verificǎ axiomele:

Adunarea este asociativǎ:)()( cbacba ⊕⊕=⊕⊕

Adunarea este comutativǎ:abba ⊕=⊕

Adunarea admite un element neutru (notat ε si denumit “zero”):aa =⊕ ε

Multiplicarea este asociativǎ:)()( cbacba ⊗⊗=⊗⊗

Multiplicarea admite un element neutru (notat e si denumit “identitate”):aeaae =⊗=⊗

Multiplicarea este distributivǎ fatǎ de adunare:)()()( cabacba ⊗⊕⊗=⊕⊗

si analog pentru multiplicarea sumei la dreapta“Zero”-ul este absorbant pentru multiplicare:

εεε =⊗=⊗ aaAdunarea este idempotentǎ:

aaa =⊕Ca si în algebra uzualǎ, semnul de multiplicare este uneori omis. Dioidul este comutativ dacǎoperatia de multiplicare este si ea comutativǎ. Un sub-dioid este o submultime de elemente aleunui dioid stabilǎ la operatiile “ ⊕ ” si “ ⊗ ” si care contine elementele speciale ε si e.Câteva exemple.(1) Nmax, Zmax, Qmax, Rmax: multimile N, Z, Q respectiv R (de numere naturale, întregi, rationale,

reale) completate cu elementul ∞− cu rol de “zero” (ε), cu operatiile max=⊕ ,+=⊗ , cu 0 ca element “identitate”

(2) Zmin: multimea Z completatǎ cu + ∞ si cu operatiile min=⊕ , +=⊗ . Elementul“zero” este + ∞, elementul “identitate” este 0.

În formulele prezentate, algebra în care se fac calculele este aceea a dioidului Rmax.

182

Page 183: Gheorghe M.Panaitescu - ac.upg-ploiesti.roac.upg-ploiesti.ro/gpanaitescu/msds_2007.pdf · •Retele neuronale •Retele neuronale artificiale stratificate •Analiza multirezolutie

cuvinte dacǎ se considerǎ graful GET cu tranzitiile ca noduri si cu pozitiileca arcuri si se mentin numai nodurile interne si arcele cu exact i jetoaneinitiale atunci acesta este graful de precedentǎ al tranzitiilor, cu ponderi pearce egale cu timpii de asteptare al pozitiilor corespunzǎtoare.

• De o forma asemǎnǎtoare, Bi se bazeazǎ pe un graf care rentine numainodurile corespunzǎtoare tranzitiilor de intrare si interne si arcele cu exact ijetoane initiale dintre o tranzitie de intrare si o tranzitie internǎ; de dataaceasta este vorba de graful de tranzitie corespunzǎtor.

• De formǎ analogǎ, Ci se bazeazǎ pe un graf care rentine nodurile interne side iesire si arcele cu exact i jetoane initiale dintre o tranzitie internǎ si otranzitie de iesire fiind acesta graful de tranzitie al acestei matrici.

• Matricea Di se defineste la fel cu cele precedente; se rentin numai graful cunodurile de intrare si de iesire cu arce care au exact i jetoane initiale

• Algebra utilizatǎ este algebra max-plus• Conditiile initiale sunt x(k) = ε pentru orice k negativ ceea ce reflectǎ

supozitia cǎ prima activare a fiecǎrei tranzitii care modificǎ marcajul initialal pozitiei anterioare este zero.

O formǎ canonicǎ. Ecuatiile de mai sus sunt implicite deoarece variabilele x(k)sunt prezente în ambii termeni ai relatiei prime. Aceste ecuatii se pot rezolva.Fǎrǎ a intra în detalii, rezultatul este

( ) ⊕−⊕⊕⊕−= )1()()1()( 101*0 kuBkuBkxAAkx

Aceastǎ formǎ permite o examinare mai atentǎ din punct de vedere practic. S-aluat mai sus solutia minorantǎ. Întrebare: dacǎ aceasta nu-i unicǎ, ce efect areaceastǎ alegere? Rǎspunsul este în relatie cu urmǎtoarele douǎ reguli alejocului:1. Tranzitiile se activeazǎ de îndatǎ ce este posibil, ceea ce face compatibil

dater-ul cel mai mic posibil cu ecuatiile2. Ecuatiile implicite sunt valide în virtutea influentei marcajului initial; se

selectioneazǎ conditiile initiale de asa naturǎ încât oricare altǎ alegere poatenumai sǎ întârzie evenimentele ulterioare.

Relatiile de mai sus sunt foarte asemǎnǎtoare cu ecuatiile care descriu un sistemîn varianta ecuatie-de-stare – ecuatie-de-observare si multe rezultate din teoriasistemelor se pot aplica aici schimbând doar regulile de calcul conform algebreidioidului Rmax.

Probleme

Problema 1. Reteaua Petri din figura alǎturatǎ reprezintǎ circulatia într-unatelier a trei tipuri de piese, P1, P2 si P3 în cǎutarea unor operatii/servicii pemasinile M1, M2 si M3. Piesele P3 sunt în cantitate dublǎ fatǎ de P1 si P2 caresunt ambele în aceeasi cantitate.

183

Page 184: Gheorghe M.Panaitescu - ac.upg-ploiesti.roac.upg-ploiesti.ro/gpanaitescu/msds_2007.pdf · •Retele neuronale •Retele neuronale artificiale stratificate •Analiza multirezolutie

• Verificati faptul cǎ reteaua modeleazǎ o deplasare care asigurǎ fǎrǎ blocajeurmǎtoarele succesiuni de operatii pentru cele trei tipuri de piese:

P1 : M1 → M2 → M3

P2 : M3 → M2

P3 : M1 → M3

• Verificati faptul cǎ pe cele trei masini sunt posibile succesiunile de servire apieselor-clienti din lista urmǎtoare:

M1 : P1 → P3 → P3

M2 : P1 → P2

M3 : P1 → P2 → P3 → P3

184

Page 185: Gheorghe M.Panaitescu - ac.upg-ploiesti.roac.upg-ploiesti.ro/gpanaitescu/msds_2007.pdf · •Retele neuronale •Retele neuronale artificiale stratificate •Analiza multirezolutie

Exercitii de autoevaluare

1. O retea Petri este:a) un graf fǎrǎ vreo orientare,b) un graf orientat, cu multimea de noduri partitionatǎ într-o

submultime de pozitii si o submultime de tranzitii, cu arce care leagǎfie o pozitie cu o tranzitie, fie o tranzitie cu o pozitie,

c) un graf partial orientat

2. În figura de mai jos este dat un fragment dintr-o retea Petri, model al unuisistem de productie flexibil. În ce coditii tranzitia t1 nu este posibilǎ?

a) cu pozitiile p1 si p2 (exclusiv) marcate?b) cu pozitiile p3 si p4 (exclusiv) marcate?

c) cu toate pozitiile marcate?

3. Pozitiile dintr-o retea Petri reprezintǎ:a) actiuni, b) conditii, resurse sau

c) noduri în retea fǎrǎ vreo semnificatie?4. Tranzitiile dintr-o retea Petri sunt în realitate:

a) actiuni, b) conditii, resurse sauc) noduri în retea fǎrǎ vreo semnificatie?

5. O retea Petri (si sistemul de productie modelat de ea) este viabilǎ dacǎ:a) functioneazǎ indefinit, b) dupǎ 100 de tranzitii apare un blocaj sau

c) douǎ tranzitii se pot produce simultan6. O situatie conflictualǎ apare atunci când în reteua Petri:

a) o tranzitie premerge douǎ pozitii;b) o pozitie premerge douǎ tranzitii;

c) în ambele cazuri de la punctele a) si b).

185

Page 186: Gheorghe M.Panaitescu - ac.upg-ploiesti.roac.upg-ploiesti.ro/gpanaitescu/msds_2007.pdf · •Retele neuronale •Retele neuronale artificiale stratificate •Analiza multirezolutie

186

Page 187: Gheorghe M.Panaitescu - ac.upg-ploiesti.roac.upg-ploiesti.ro/gpanaitescu/msds_2007.pdf · •Retele neuronale •Retele neuronale artificiale stratificate •Analiza multirezolutie

REZULATELE EXERCITIILOR DE AUTOEVALUARE

Capitolul Introducere în tehnica modelǎrii si simulǎrii

1. c) 2. c) 3. b) 4. b) 5. c)

Capitolul Modele matematice dinamice

1. b) 2. a) 3. b) 4. a) 5. a) 6. c)

Capitolul Principii fundamentale de fizicǎ, chimie si chimie fizicǎ în modelarea sistemelor dinamice

1. a) 2. b) 3. a) 4. c) 5. c) 6. b) 7. c) 8. b)

Capitolul Forme standard ale modelelor dinamicii sistemelor

1. b) 2. a) 3. b) 4. c) 5. c)

Capitolul Elemente de naturǎ aleatoare în dinamica sistemelor

1. b) 2. c) 3. a) 4. c) 5. c) 6. c)

Capitolul Metode neconventionale în modelarea dinamicii sistemelor

1. a) 2. a) 3. b) 4. c) 5. c) 6. d)

Capitolul Modelarea si simularea dinamicii sistemelor mari

1. d) 2. c) 3. b) 4. a)

Capitolul Modele ale dinamicii sistemelor cu evenimente discrete

1. b) 2. c) 3. b) 4. a) 5. a) 6. b)

187

Page 188: Gheorghe M.Panaitescu - ac.upg-ploiesti.roac.upg-ploiesti.ro/gpanaitescu/msds_2007.pdf · •Retele neuronale •Retele neuronale artificiale stratificate •Analiza multirezolutie

188

Page 189: Gheorghe M.Panaitescu - ac.upg-ploiesti.roac.upg-ploiesti.ro/gpanaitescu/msds_2007.pdf · •Retele neuronale •Retele neuronale artificiale stratificate •Analiza multirezolutie

B I B L I O G R A F I E

1. S.Cǎlin, Th.Popescu, B.Jora si V.Sima Conducerea adaptivǎ si flexibilǎ

a proceselor industriale Bucuresti, Ed.Tehnicǎ 1988

2. G.Cohen Théorie algébrique des systèmes à événiments discrets Centre

Automatique et Système, École des Mines de Paris, Fontainbleau &

INRIA Rocquencourt, 1995

3. G.Cohen Analysis y control de sistemas de eventos discretos: de redes

Petri temporizadas al algebra Universidad de Rosario, Argentina, 2001

4. W.L.Luyben Process Modeling, Simulation, and Control for Chemical

Engineers, McGraw-Hill Company, New York etc.,1973

5. V.Marinoiu si N.Paraschiv Automatizarea proceselor chimice vol. 1 si 2

Editura Tehnicǎ, Bucuresti, 1992

6. O.Pǎstrǎvanu Sisteme cu evenimente discrete. Tehnici calitative bazate

pe formalismul retelelor Petri Editura MATRIX-ROM, Bucuresti, 1997

7. C.J. Savant Jr. Calculul sistemelor automate, Editura Tenhicǎ,

Bucuresti, 1967

8. J.H.Seinfeld si L.Lapidus Mathematical Methods in Chemical

Engineering, Prentice-Hall Inc. Englewood Cliffs, N.J., 1974

9. Publicatii periodice: AIChE Journal vol.36-48 (1990-2002),

Chem.Eng.Sci. vol.48-50 (1993-1995), Comput.Chem.Eng. vol.14-18

(1990-1993) etc.

10. Surse Internet multiple

189

Page 190: Gheorghe M.Panaitescu - ac.upg-ploiesti.roac.upg-ploiesti.ro/gpanaitescu/msds_2007.pdf · •Retele neuronale •Retele neuronale artificiale stratificate •Analiza multirezolutie

190