1. capitolul_1_f

21
1-1 Cap. 1 Introducere Majoritatea tehnicilor curente pentru proiectarea sistemelor de conducere se bazează pe o bună înţelegere a procesului ce trebuie condus, precum şi a condiţiilor de funcţionare a acestuia. În practică, există multe situaţii în care procesul ce trebuie condus este foarte complex, iar fenomenele fizice care se produc în diversele subprocese ale acestuia nu sunt complet cunoscute. În aceste cazuri, tehnicile de proiectare a comenzilor trebuie augmentate cu o tehnică de identificare, care să aibă drept scop o mai bună cunoaştere a procesului de condus. Se ajunge astfel la o agregare a operaţiilor de conducere şi a celor identificare. De cele mai multe ori, cele două operaţii sunt tratate separat. Dacă însă, identificarea sistemului este recursivă – adică modelul procesului este actualizat periodic pe baza estimărilor anterioare şi a datelor noi culese din proces – operaţiile de identificare şi control pot fi realizate concurent. Conducerea adaptivă va fi privită ca o agregare directă a unei metodologii (neadaptive) de control cu o anumită metodă de identificare recursivă a procesului. 1.1. Etapele proiectării unui sistem de conducere În multe aplicaţii de conducere, proiectarea unui regulator (controller) care să poată influenţa sau modifica comportarea şi răspunsul unui proces incomplet cunoscut sau necunoscut, pentru a satisface anumite cerinţe de performanţă, poate fi o problemă dificilă, dar şi interesană şi provocatoare. Prin proces, în general, vom înţelege orice proces caracterizat printr-un anumit număr de intrări, notate cu u, şi ieşiri, notate cu y, reprezentat schematic ca în Fig. 1.1. Intrările u sunt prelucrate pentru a produce anumite ieşiri y, care reprezintă, de obicei, răspunsurile măsurate ale instalaţiei. Scopul proiectării unui sistem de conducere constă în determinarea intrării u astfel încât ieşirea y(t) să satisfacă anumite performanţe impuse. Deoarece, în practică, procesul ce trebuie condus este foarte complex, în sensul că poate conţine diverse părţi mecanice, electrice, electronice, hidraulice etc., interconectate în diverse structuri funcţionale, face ca o alegere corespunzătoare a lui u să nu fie o problemă simplă. Etapele de proiectare parcurse de majoritatea proiectanţilor de sisteme de conducere, respectiv de determinare a comenzii u, sunt prezentate în Fig. 1.2 şi explicare mai jos. Etapa 1. Modelarea În această etapă, inginerul proiectant trebuie să analizeze şi să înţeleagă funcţionarea procesului, care, pentru un semnal de intrare u(t), produce un semnal Proces P Intrări Ieşiri u y Fig.1.1. Reprezentarea unui proces

Upload: mircea-parpanete

Post on 13-Dec-2015

215 views

Category:

Documents


0 download

DESCRIPTION

Curs - Controlul adaptiv al structurilor robotice

TRANSCRIPT

1-1

Cap. 1 Introducere

Majoritatea tehnicilor curente pentru proiectarea sistemelor de conducere se

bazează pe o bună înţelegere a procesului ce trebuie condus, precum şi a condiţiilor de funcţionare a acestuia. În practică, există multe situaţii în care procesul ce trebuie condus este foarte complex, iar fenomenele fizice care se produc în diversele subprocese ale acestuia nu sunt complet cunoscute. În aceste cazuri, tehnicile de proiectare a comenzilor trebuie augmentate cu o tehnică de identificare, care să aibă drept scop o mai bună cunoaştere a procesului de condus. Se ajunge astfel la o agregare a operaţiilor de conducere şi a celor identificare. De cele mai multe ori, cele două operaţii sunt tratate separat. Dacă însă, identificarea sistemului este recursivă – adică modelul procesului este actualizat periodic pe baza estimărilor anterioare şi a datelor noi culese din proces – operaţiile de identificare şi control pot fi realizate concurent. Conducerea adaptivă va fi privită ca o agregare directă a unei metodologii (neadaptive) de control cu o anumită metodă de identificare recursivă a procesului. 1.1. Etapele proiectării unui sistem de conducere

În multe aplicaţii de conducere, proiectarea unui regulator (controller) care să poată influenţa sau modifica comportarea şi răspunsul unui proces incomplet cunoscut sau necunoscut, pentru a satisface anumite cerinţe de performanţă, poate fi o problemă dificilă, dar şi interesană şi provocatoare.

Prin proces, în general, vom înţelege orice proces caracterizat printr-un anumit număr de intrări, notate cu u, şi ieşiri, notate cu y, reprezentat schematic ca în Fig. 1.1. Intrările u sunt prelucrate pentru a produce anumite ieşiri y, care reprezintă, de obicei, răspunsurile măsurate ale instalaţiei.

Scopul proiectării unui sistem de conducere constă în determinarea intrării u astfel încât ieşirea y(t) să satisfacă anumite performanţe impuse. Deoarece, în practică, procesul ce trebuie condus este foarte complex, în sensul că poate conţine diverse părţi mecanice, electrice, electronice, hidraulice etc., interconectate în diverse structuri funcţionale, face ca o alegere corespunzătoare a lui u să nu fie o problemă simplă. Etapele de proiectare parcurse de majoritatea proiectanţilor de sisteme de conducere, respectiv de determinare a comenzii u, sunt prezentate în Fig. 1.2 şi explicare mai jos.

Etapa 1. Modelarea În această etapă, inginerul proiectant trebuie să analizeze şi să înţeleagă

funcţionarea procesului, care, pentru un semnal de intrare u(t), produce un semnal

Proces P Intrări Ieşiri

u y

Fig.1.1. Reprezentarea unui proces

1-2

de ieşire (răspuns) y(t); este etapa în care relaţiile intrare-ieşire pot fi descrise prin anumite ecuaţii matematice. Aceste ecuaţii constituie modelul matematic al procesului. Un model exact al procesului ar trebui să producă un răspuns identic cu cel al procesului real, dacă intrarea în model şi condiţiile iniţiale sunt identice cu cele aplicate procesului real. Complexitatea majorităţii proceselor fizice face ca dezoltarea unui astfel de model (exact) să fie nejustificată sau chiar imposibilă. Dar, chiar dacă modelul exact al procesului poate fi obţinut, dimensiunea acestuia ar putea fi foarte mare, modelul ar putea fi puternic neliniar şi variabil în timp, ceea ce face apropape imposibilă utilizarea sa pentru proiectarea unui sistem de conducere. Aceasta face ca sarcina modelării să fie chiar mai dificilă, dar şi mai interesantă, deoarece proiectantul trebuie să obţină în final un model matematic care să descrie cu acurateţe comportarea intrare/ieşire (I/O-Input/Output) a procesului şi, în plus, să fie destul de simplu pentru a putea fi utilizat pentru proiectarea sistemului de conducere propus. Un model simplu conduce de regulă la un controller simplu, care este uşor de implementat şi mult mai sigur pentru scopuri practice.

Determinarea unui model al procesului poate fi obţinută prin folosirea legilor fizicii sau prin procesarea datelor de intrare/ieşire (I/O) ale procesului, date obţinute prin efectuarea unor experimente. Totuşi, din punctul de vedere al

Procesul P

u y

Pasul 1: Modelarea

Modelul procesului Pm

u y

Incertitudine ΔIntrare de

Modelul procesului Pm

ControllerC

referinţă

Intrare de Proces

P

uControllerC

referinţă y

Pasul 2: Proiectarea controllerului

Pasul 3: Implementarea

y

Fig.1.2. Etapele proiectării unui sistem de conducere

1-3

proiectantului sistemului de conducere, un astfel de model poate fi destul de complicat, fiind astfel necesară o simplificare ulterioară a acestuia. Pentru a obţine un model simplificat, câteva dintre abordările cele mai utilizate sunt:

(i) Liniarizarea modelului în jurul punctelor de funcţionare; (ii) Tehnici de reducere a ordinului modelului. În prima abordare (i), procesul este aproximat printr-un model liniar, care este

valid numai în jurul unui punct de funcţionare. Puncte de funcţionare diferite pot conduce la modele liniare diferite, care pot fi folosite ca modele valide ale procesului în jurul acelor puncte. Liniarizarea se obţine fie prin dezvoltarea în serie Taylor a modelului neliniar şi aproximarea liniară a acestuia, fie prin potrivirea datelor experimentale la un model liniar, fie prin alte metode.

În cea de-a doua abordare (ii), efectele nesemnificative şi fenomenele situate în afara domeniului de frecvenţe de interes sunt neglijate, conducând la un model al procesului mai simplu şi de ordin mai scăzut. Pentru detalii privind tehnicile de aproximare şi reducere a ordinului modelelor folosind metoda perturbaţiilor singuare se poate consulta [1].

În general, modelarea implică o bună înţelegere a instalaţiei de automatizat, a funcţionarii acesteia şi a cerinţelor de performanţă impuse şi poate reclama o anumită experienţă a inginerului automatist. Etapa a 2-a. Proiectarea algoritmului de conducere

Odată ce dispunem de un model al procesului se poate trece la etapa proiectării sistemului de conducere. Controllerul se proiectează pe baza acestui model astfel încât sistemul de conducere (în circuit închis) să satisfacă performanţele impuse. Dacă modelul reprezintă o bună aproximare a procesului, atunci putem spera ca performanţele controllerului, respectiv ale sistemului de conducere, proiectat pe baza modelului procesului, să fie apropiate de performanţele sistemului obţinute când acelaşi controller se aplică procesului real.

Deoarece modelul reprezintă întotdeauna o aproximare a procesului real, efectul oricărei discrepanţe între proces şi model asupra performanţelor controllerului nu va fi cunoscut decât după implementarea şi testarea controllerului direct pe instalaţia reală (etapa a 3-a). Din această cauză, se poate introduce o etapă intermediară în care performanţele controllerului proiectat pentru un anumit model al procesului să poată fi analizate utilizând acelaşi model la care se include însă o clasă de incertitudini ale modelului procesului, notate cu Δ în Fig. 1.2.

Dacă Δ conţine majoritatea fenomenelor nemodelate ale procesului, reprezentarea sa prin ecuaţii matematice nu este posibilă. Dar, în multe aplicaţii, caracterizarea sa prin anumite limite cunoscute poate fi posibilă. Prin considerarea existenţei unei clase generale de incertitudini Δ, care ar putea fi prezente în proces, proiectantul poate modifica sau reproiecta controllerul astfel încât acesta să fie mai puţin senzitiv la incertitudini, adică să fie mai robust în raport cu incetitudinea Δ. Această analiză a robusteţii precum şi reproiectarea controllerului în aceste condiţii pot conduce la o implementare practică de succes (Etapa a 3-a).

1-4

Etapa a 3-a. Implementarea În acestă etapă, un controller proiectat în etapa a 2-a, care satisface

performanţele impuse pentru modelul procesului şi este robust în raport cu posibilele incertitudini de modelare Δ, este “gata” pentru a fi utilizat pentru conducerea procesului real (incomplet cunoscut). Implementarea poate fi realizată utilizând un calculator numeric, chiar dacă în anumite aplicaţii pot fi folosite şi regulatoare analogice. Indiferent de tipul calculatorului utilizat, tipul interfeţei între calculator şi proces, software-ul corespunzător etc. trebuie să fie alese a priori. Viteza de calcul şi acurateţea pot constitui restricţii asupra complexităţii controllerului, care îl pot determina pe proiectant să se reîntoarcă la etapa a 2-a sau chiar la pasul (etapa) 1 pentru a obţine un controller mai simplu, fără a afecta însă performanţele impuse.

Un alt aspect important al implementării este ajustarea finală a parametrilor numită adesea acordare a controllerului pentru îmbunătăţirea performanţelor de compensare a incertitudinilor de modelare. Acordarea se face de regulă prin încercări şi depinde foarte mult de experienţa şi intuiţia proiectantului.

În acest curs ne vom concentra atenţia pe etapa a 2-a. Ne vom ocupa de proiectarea algoritmilor de conducere pentru o clasă de modele descrise prin ecuaţii diferenţiale linare de forma:

DuxCy

xxBuAxxT +=

=+= 0)0(;& (1.1.1)

În (1.1.1), nx ℜ∈ este starea modelului, ru ℜ∈ este intrarea procesului, iar ly ℜ∈ este ieşirea modelului procesului. Matricele nnA ×ℜ∈ , rnB ×ℜ∈ , lnC ×ℜ∈

şi rlD ×ℜ∈ pot fi constante sau variabile în timp. Această clasă de modele este destul de generală deoarece ea poate servi şi ca un aproximant al proceselor neliniare în jurul punctelor de funcţionare. Este de aşteptat ca un controller proiectat pe baza modelului liniar (1.1.1) să fie mai simplu şi mai uşor de înţeles decât un controller proiectat pe baza unui model mai complicat (exact), dar neliniar.

Mai mult, clasa modelelor descrise prin (1.1.1) poate fi generalizată, dacă se consideră că elementele matricelor A, B sau C sunt fie complet necunoscute, fie se modifică în timp sau cu schimbarea condiţiilor de funcţionare. Conducerea proceselor descrise prin modelele (1.1.1) cu A, B, C şi D parţial cunoscute sau necunoscute este inclusă în domeniul sistemelor adaptive şi constituie subiectul principal al acestui curs. 1.2. Controlul adaptiv

Corespunzător dicţionarului Webster, a adapta înseamnă "a se schimba (pe sine) astfel încât comportarea sa să fie în concordanţă cu noile circumstanţe sau cu circumstanţele modificate". Cuvintele "sisteme adaptive" şi "control adaptiv" au fost utilizate înainte de anul 1950 [2, 3].

1-5

Unul din motivele iniţiale care au determinat cercetări active asupra controlului adaptiv, înainte de 1950, l-a constituit proiectarea autopiloţilor pentru aparate de zbor de înaltă performanţă.

Aparatele de zbor funcţionează într-un domeniu larg de viteze şi altitudini, iar dinamicile lor sunt neliniare şi variabile în timp. Totuşi, pentru un punct de funcţionare dat, precizat prin viteza aparatului (numărul Mach) şi altitudinea sa, dinamica aparatului poate fi aproximată printr-un model liniar de forma (1.1.1). De exemplu, pentru un punct de funcţionare i, modelul liniar al aparatului are următoarea formă [4]:

uDxCy

xxuBxAx

iTi

ii

+=

=+= 0)0(;& (1.2.1)

unde Ai, Bi, Ci şi Di corespund punctului de funcţionare i. Cum, aparatul trece prin diferite condiţii de zbor, punctele de funcţionare se schimbă conducând la diferite valori pentru Ai, Bi, Ci şi Di. Deoarece răspunsul y(t) conţine informaţie despre starea x, precum şi despre parametrii aparatului, se poate argumenta că, în principiu, un controller cu reacţie (după stare sau ieşire) ar putea fi capabil să sesizeze schimbarea valorilor parametrilor procesului prin procesarea răspunsului y(t) şi să folosească factori de amplificare corespunzători pentru a se adapta la variaţiile acestora. Acestă argumentaţie conduce la o structură de conducere cu reacţie pe care se bazează controlul adaptiv. Structura sistemului adaptiv constă dintr-o buclă de reacţie şi un controller cu factori de amplificare ajustabili, reprezentată în Fig. 1.3. Procedeul de schimbare a factorilor de amplificare, ca răspuns la schimbările din dinamica instalaţiei şi a perturbaţiilor, face distincţia dintre o schemă şi o alta. 1.2.1. Controlul robust

Controlul robust presupune proiectarea unui controller cu amplificare constantă, care să facă faţă schimbării parametrilor procesului, cu condiţia ca aceste schimbări să rămână în interiorul unor anumite limite. O schemă bloc a unui

Fig.1.3. Structura controllerului cu factori de amplificare variabili

ControllerC

Proces P

Strategia pentru ajustarea factorilor

de amplificare

Intrare de referinţă

u

u(t)

y(t)

y

1-6

astfel de controller este prezentată în Fig. 1.4, unde G(s) este funcţia de transfer a procesului, iar C(s) este funcţia de transfer a controllerului.

Fig.1.4. Controller cu factor de amplificare constant

Funcţia de transfer de la y* la y este:

)()(1)()(

* sGsCsGsC

yy

+= , (1.2.2)

unde C(s) trebuie aleasă astfel încât sistemul în circuit închis este să fie stabil, în pofida schimbării parametrilor sau incertitudinilor în G(s), şi *yy ≈ în domeniul frecvenţelor de interes. Această ultimă condiţie poate fi realizată dacă C(s) se alege astfel încât factorul de amplificare al buclei |C(jω)G(jω)| este cât mai mare posibil, în spectrul de frecvenţă a lui y*, cu condiţia ca acestă valoare a factorului de amplificare să nu afecteze cerinţele de stabilitate în circuit închis. Obiectivele de urmărire şi stabilitate pot fi realizate prin proiectarea lui C(s) cu condiţia ca schimbările din G(s) să se situeze între anumite limite. Mai multe detalii despre controlul robust vor fi prezentate într-un capitol viitor.

Un sistem de conducere robust nu este considerat un sistem adaptiv, chiar dacă acesta poate trata anumite clase de incertitudini parametrice şi dinamice. 1.2.2. Planificarea amplificării (Gain Scheduling)

Se consideră modelul aparatului de zbor (1.2.1) unde, pentru fiecare punct de funcţionare i, i = 1, 2, ..., N, parametrii Ai, Bi, Ci, Di se consideră a fi cunoscuţi. Pentru fiecare astfel de punct de funcţionare i, considerând modelul liniar corespunzător, din condiţiile de satisfacere a performanţelor impuse, se poate proiecta un controller cu factorul de amplificare constant, iθ . Se obţine astfel un controller, C(θ), care conţine un set de factori de amplificare },,,,,{ 21 Ni θθθθ KK corespunzători celor N puncte de funcţionare.

În timpul funcţionării, atunci când este detectat un punct de funcţionare i, amplificarea controllerului se poate schimba la valoarea corespunzătoare lui iθ , valoare obţinută dintr-un set de factori de amplificare precalculaţi.

Tranziţiile dintre diferitele puncte de funcţionare, care conduc la schimbări semnificative ale parametrilor, pot fi rezolvate prin interpolare sau prin creşterea numărului de puncte de funcţionare.

Pentru implementarea metodei Gain Scheduling sunt esenţiale două elemente: (i) un tabel predefinit în care se memorează valorile lui iθ şi (ii) măsurătorile auxiliare din proces corelate cu schimbările corespunzătoare punctelor de

Proces G(s)C(s)Σ _

u yy* +

1-7

funcţionare. Această abordare se numeşte planificare a amplificării (gain scheduling) şi este ilustrată în Fig. 1.5.

Planificatorul amplificării (gain scheduler) constă într-un tabel cu factori de amplificare predefiniţi, o logică corespunzătoare pentru detectarea punctului de funcţionare şi alegerea din tabel a valorii corespunzătoare a lui iθ . În cazul aparatelor de zbor, măsurătorile auxiliare sunt numărul Mach şi presiunea dinamică.

Cu această abordare, variaţiile parametrilor procesului pot fi compensate prin schimbarea amplificării controllerului în funcţie de măsurătorile auxiliare.

Fig.1.5. Schema Gain scheduling Avantajul planificării amplificării constă în aceea că amplificările controller-

ului pot fi schimbate cu aceeaşi viteză cu care măsurătorile auxiliare răspund la modificările valorilor parametrilor. Totuşi, schimbări frevente şi rapide ale amplificărilor controllerului pot conduce la instabilitate [5]; de aceea, există o limită a cât de lent sau cât de rapid pot fi schimbate amplificările controllerului.

Unul din dezavantajele metodei gain scheduling constă în faptul că în mecanismul de ajustare, amplificările sunt precalculate off-line şi, de aceea, nu furnizează informaţie (reacţie) pentru a compensa programele incorecte. Schimbările neprevăzute în dinamica procesului pot conduce la deteriorarea performanţelor sau chiar la avarie. Un alt posibil dezavantaj al metodei gain scheduling constă în costurile mari de proiectare şi implementare care cresc cu numărul de puncte de funcţionare.

În pofida limitărilor sale, gain scheduling a fost şi este o metodă uzuală pentru tratarea variaţiei parametrilor în controlul zborului [4, 6] şi a altor sisteme [7]. 1.2.3. Controlul adaptiv direct şi indirect

Un controller adaptiv se obţine prin combinarea unui estimator on-line al parametrilor, care furnizează estimări ale parametrilor necunoscuţi la fiecare moment de timp t, cu o lege de comandă, calculată pentru cazul parametrilor consideraţi cunoscuţi ai procesului. Modul în care estimatorul parametrilor, referit de multe ori şi lege de adaptare, se combină cu legea de comandă, dă naştere la două abordări diferite.

În prima abordare, denumită control adaptiv indirect, mai întâi parametrii procesului sunt estimaţi on-line şi apoi sunt folosiţi în calcularea parametrilor

ControllerC(θ) Proces

auxiliareGain

SchedulingMăsurători

Program sau semnal de referinţă

u y

θi

1-8

controllerului. Această abordare a fost de asemenea referită şi sub denumirea de control adaptiv explicit, deoarece proiectarea se bazează pe un model explicit al procesului.

În cea de-a doua abordare, denumită control adaptiv direct, modelul procesului este parametrizat în funcţie de parametrii controllerului, care sunt estimaţi direct, fără alte calcule intermediare care să implice estimarea parametrilor procesului. Această abordare este este cunoscută şi sub denumirea de control adaptiv implicit, deoarece proiectarea se bazează pe estimarea unui model implicit al procesului.

În controlul adaptiv indirect, modelul procesului P(θ*) este parametrizat în raport cu elementele vectorului parametrilor necunoscuţi θ*. De exemplu, pentru un model liniar invariant în timp (LTI-Linear Time Invariant) cu o singură intrare şi o singură ieşire (Single-Input Single-Output (SISO)), θ* poate reprezenta coeficienţii necunoscuţi ai numărătorului şi numitorului funcţiei de transfer a modelului.

Prin prelucrarea intrării procesului u şi a ieşirii y, un estimator on-line al parametrilor generează, la fiecare moment t, o estimare θ(t) a lui θ*. Parametrul estimat θ(t) determină un model estimat al procesului descris prin ))((ˆ tP θ .

În procesul de proiectare a comenzii, ))((ˆ tP θ este considerat drept model "adevărat" şi este folosit pentru calcularea parametrilor controllerului sau a vectorului de amplificare θc(t) prin rezolvarea, la fiecare moment t, a unei anumite ecuaţii algebrice θc(t) = F(θ(t)).

Forma legii de comandă C(θc) şi ecuaţia algebrică θc = F(θ) sunt alese astfel încât să fie identice cu cea a legii de comandă )( *

cC θ şi respectiv a ecuaţiei )( ** θ=θ Fc , care ar fi fost utilizate pentru satisfacerea cerinţelor de performanţă

corespunzătoare modelului P(θ*), în situaţia în care θ* ar fi fost considerat cunoscut.

Schema bloc a unui sistem de control adaptiv indirect este prezentată în Fig. 1.6.

Fig.1.6. Controlul adaptiv indirect

ControllerC(θc)

Proces P(θ∗)

Estimarea on-line a

parametrului θ*

Calcule θc(t) = F(θ(t))

r - Intrare de referinţă

θ(t)

u y

r

θc

1-9

Este clar că, în această abordare, C(θc(t)) se proiectează astfel încât, la fiecare moment t, pentru modelul estimat ))((ˆ tP θ - care poate diferi de modelul necunoscut P(θ*) - sistemul în circuit închis să satisfacă performanţele impuse. De aceea, principala problemă în controlul adaptiv indirect constă în alegerea clasei de legi de comandă C(θc) şi a clasei de estimatoare ale parametrilor, care să genereze θ(t), precum şi a ecuaţiei algebrice θc(t) = F(θ(t)), astfel încât C(θc(t)) să satisfacă cerinţele de performanţă pentru modelul P(θ*) cu θ* necunoscut. Această problemă va fi studiată în detaliu în Cap. 4, iar proprietăţile de robusteţe în controlul adaptiv indirect vor fi considerate în Cap. 5.

În control adaptiv direct, modelul procesului P(θ*) este parametrizat în funcţie de vectorul parametrilor necunoscuţi *

cθ ai controllerului, pentru care C( *cθ )

satisface cerinţele de performanţă, corespunzătoare modelului P(θ*), în situaţia în care θ* ar fi fost considerat cunoscut. Se obţine modelul Pc( *

cθ ) cu aceleaşi caracteristici de intrare/ieşire ca şi P(θ*).

În loc de a utiliza P(θ*), estimatorul on-line al parametrilor se proiectează pe baza lui Pc( *

cθ ), sarcina sa fiind de a furniza direct, la fiecare moment de timp t, prin prelucrarea intrării u şi ieşirii y, estimările θc(t) ale lui *

cθ . Pentru actualizarea vectorului θc al parametrilor controllerului va fi folosită

estimarea θc(t), fără alte calcule intermediare. Alegerea clasei legilor de comandă C(θc) şi a estimatoarelor parametrilor, care să genereze θc(t) pentru care C(θc(t)) satisface cerinţele de performanţă pentru modelul P(θ*), constituie problema fundamentală în controlul adaptiv direct.

Proprietăţile modelului P(θ*) sunt esenţiale în obţinerea modelului parametrizat Pc( *

cθ ) - convenabil în estimarea on-line. Drept urmare, controlul adaptiv direct este restricţionat la o anumită clasă de modele ale procesului. Aşa cum se va arăta în Cap. 5, o clasă de modele convenabilă pentru controlul adaptiv direct o constituie clasa modelelor SISO-LTI cu minim de fază, adică, cu zerourile plasate în Re[s] < 0. Schema bloc a unui sistem de control adaptiv direct este prezentată în Fig 1.7.

Fig.1.7. Controlul adaptiv direct

ControllerC(θc)

Estimarea on-line a

parametrului *cθ

r - Intrare de referinţă

u y

r θc

Proces )()( **

ccPP θ→θ

1-10

Principiul proiectării schemelor de control adaptiv direct şi indirect, prezentate în Fig. 1.6 şi 1.7 este, conceptual, simplu. Proiectarea lui C(θc) consideră estimările θc(t) (în cazul controlului adaptiv direct) sau estimările θ(t) (în cazul controlului adaptiv indirect) ca şi când acestea ar fi parametrii adevăraţi. Această abordare a proiectării se numeşte echivalenţă certă (certainty equivalence) şi poate fi utilizată pentru a genera o clasă largă de scheme de control adaptiv prin combinarea diferitelor estimatoare on-line ale parametrilor cu diferite legi de comandă.

Ideea din spatele echivalenţei certe constă în aceea că estimările parametrilor θc(t) şi θ(t) converg către valorile lor adevărate *

cθ , respectiv θ*, performanţa controllerului adaptiv C(θc) tinde către aceea realizată de C( *

cθ ) în cazul parametrilor cunoscuţi.

Pentru majoritatea cititorilor, distincţia între controlul adaptiv direct şi indirect poate fi confuză din următoarele motive: Structura controlului adaptiv direct prezentată în Fig. 1.7 poate fi făcută identică cu cea a controlului adaptiv indirect prin includerea unui bloc pentru efectuarea calculelor cu o transformare identitate între parametrii actualizaţi şi parametrii controllerului ( )())(()( ttFt cc θ=θ=θ ).

În general, pentru un anumit model, distincţia dintre abordarea directă şi cea indirectă devine clară numai dacă se intră în detalii de proiectare şi analiză. De exemplu, pentru un proces cu minim de fază, se poate arăta că metoda de control adaptiv direct poate satisface anumite cerinţe de performanţă, care implică stabilitatea şi urmărirea asimptotică. Nu este încă clar cum se proiectează scheme directe pentru procese fără minim de fază. Dificultatea apare din faptul că, în general, o parameterizare convenabilă (în scopul estimării) a modelului procesului în funcţie de parametrii controllerului nu este posibilă pentru modele fără minim de fază.

Pe de altă parte, controlul adaptiv indirect, este aplicabil atât proceselor cu minim de fază, cât şi fără minim de fază. Cu toate acestea, nu se poate garanta că

legătura dintre θ(t) şi θc(t), definită prin ecuaţia algebrică ))(()( tFtc θ=θΔ

, există la fiecare moment t, determininând aşa-numita problemă a stabilizabilizării, care va fi discutată în Cap. 5. Aşa cum vom arăta în Cap. 5, soluţii ale problemei de stabilizabilitate vor fi posibile cu preţul unei complexităţi suplimentare.

O serie de eforturi pentru a relaxa ipoteza de minim de fază în controlul adaptiv direct şi a rezolva problema de stabilizabilitate în controlul adaptiv indirect conduc la scheme de control adaptiv, unde atât parametrii controllerului cât şi cei ai procesului sunt estimaţi on-line, obţinând scheme combinate direct/indirect, care de regulă sunt mult mai complexe [8].

1.2.4. Controlul adaptiv cu model de referinţă

Controlul adaptiv cu model de referinţă (MRAC-Model Reference Adaptive Control) derivă din problema urmăririi modelului sau problema controlului cu model de referinţă (MRC-Model Reference Control). În MRC, o bună înţelegere a procesului şi a cerinţelor de performanţă trebuie să-i permită proiectantului să

1-11

formuleze (propună) un model numit model de referinţă, care să descrie proprietăţile I/O dorite ale sistemului în circuit închis.

Obiectivul MRC constă în a găsi o lege de comandă cu reacţie, după stare sau după ieşire, care să schimbe structura şi dinamica sistemului în circuit închis, astfel încât proprietăţile sale I/O să fie identice cu cele ale modelului de referinţă.

Structura unui MRC corespunzătoare unui proces SISO-LTI, este reprezentată în Fig. 1.8. Funcţia de transfer a modelului de referinţă Wm(s) este aleasă astfel încât pentru un semnal de referinţă r(t), ieşirea ym(t) a modelului de referinţă să reprezinte răspunsul dorit pe care ar trebui să-l urmărească ieşirea y(t) a procesului.

Controllerul, notat prin C( *cθ ), este proiectat astfel încât toate semnalele să fie

mărginite şi funcţia de transfer a sistemului în circuit închis de la r la y să fie egală cu Wm(s). Această potrivire (ajustare) a funcţiei de transfer garantează că pentru

orice referinţă r(t), eroarea de urmărire myye −=Δ

1 , care reprezintă diferenţa dintre ieşirea procesului şi traiectoria dorită ym, converge (în timp) la zero.

Ajustarea funcţiei de transfer este obţinută prin intermediul controllerului (cu reacţie) C( *

cθ ) şi constă în compensarea zerourilor funcţiei de transfer a procesului G(s) şi înlocuirea acestora cu cele ale modelului Wm(s).

Compensarea zerourilor procesului impune ca procesul să fie cu minim de fază, adică, trebuie să aibă zerourile stabile. Dacă un zerou al procesului este instabil, compensarea sa poate să conducă la semnale nemărginite.

Proiectarea lui C( *cθ ) impune cunoaşterea coeficienţilor funcţiei de transfer a

procesului G(s). Dacă θ* este un vector care conţine toţi coeficienţii lui G(s) = G(s,θ*), atunci vectorul parametru *

cθ poate fi calculat prin rezolvarea unei ecuaţii algebrice de forma:

)( ** θ=θ Fc (1.2.3)

Este deci clar că, pentru atingerea obiectivului MRC, modelul procesului trebuie să fie cu minim de fază, iar vectorul parametrilor θ* trebuie să fie cunoscut cu exactitate.

Fig.1.8. Schema de control cu model de referinţă

Când θ* este necunoscut, schema MRC din Fig. 1.8 nu poate fi implementată deoarece *

cθ nu poate fi calculat utilizând (1.2.3) şi este deci necunoscut. O metodă

r

ControllerC( *

cθ ) u yProces

G(s)

Model de referinţăWm(s)

ym

e1

+

_

1-12

de a trata cazul parametrului necunoscut constă în folosirea echivalenţei certe, care ne permite înlocuirea în legea de comandă a parametrului *

cθ necunoscut cu estimarea sa θc(t), obţinută utilizând abordarea directă sau indirectă. Schemele de control rezultate sunt cunoscute ca MRAC şi pot fi clasificate în MRAC indirect, prezentat în Fig. 1.9 şi MRAC direct, prezentat în Fig. 1.10.

Alegeri diferite ale estimatoarelor on-line ale parametrilor conduc la o altă clasificare a MRAC. Aceste clasificări, precum şi proprietăţile de stabilitate atât ale MRAC direct, cât şi indirect, vor fi studiate în detaliu în Cap. 5.

Pentru proiectarea schemelor MRAC directe şi indirecte pot fi utilizate şi alte abordări similare abordării echivalenţei certe. Structura acestor scheme se obţine prin modificarea schemelor din Fig. 1.9 şi 1.10 şi vor fi studiate în Cap. 5.

Fig.1.9. MRAC indirect

Fig.1.10. MRAC direct

r – Intrare de referinţă

ControllerC( *

cθ ) u

yProces G(s)

Model de referinţăWm(s)

ym

e1

+

_

Estimarea on-line a

parametrului θ*

Calcule θc(t) = F(θ(t))

θ(t)

rθc

r – Intrare de referinţă

ControllerC( *

cθ ) u

yProces

)()( **ccPP θ→θ

Model de referinţăWm(s)

ym

e1

+

_

Estimarea on-line a

parametrului *cθ

rθc

1-13

1.2.5. Controlul adaptiv cu plasarea polilor

Controlul adaptiv cu plasarea polilor (APPC - Adaptive Pole Placement Control) este derivat din problema controlului cu plasarea polilor (PPC - Pole Placement Control) şi problema reglării utilizată în cazul proceselor LTI cu parametrii cunoscuţi.

În PPC, cerinţele de performanţă se transpun în alegerea unor locaţii dorite ale polilor sistemului în circuit închis. Se dezvoltată apoi o lege de comandă cu reacţie, care plasează polii sistemului în circuit închis în locaţiile dorite. O structură tipică a unui PPC, pentru un proces SISO-LTI, este prezentată în Fig. 1.11.

Fig.1.11. Controlul cu plasarea polilor

Structura controllerului C( *cθ ) şi a vectorului parametru *

cθ sunt alese astfel încât polii funcţiei de transfer a sistemului în circuit închis de la r la y să fie egali cu cei doriţi. Vectorul *

cθ se calculează utilizând o ecuaţie algebrică de forma

)( ** θ=θ Fc (1.2.4)

unde θ* este un vector care conţine coeficienţii funcţiei de transfer ai procesului G(s).

Dacă θ* este cunoscut, atunci *cθ este calculat din (1.2.4) şi folosit apoi în

legea de comandă. Când θ* este necunoscut, *cθ este de asemenea necunoscut şi

schema PPC din Fig. 1.11 nu poate fi implementată. Ca şi în cazul MRC, putem trata cazul parametrului necunoscut prin intermediul metodei echivalenţei certe, care ne permite înlocuirea vectorului necunoscut *

cθ cu estimarea sa θc(t). Schema astfel obţinută este denumită controlul adaptiv cu plasarea polilor (APPC). Dacă θc(t) este actualizat direct printr-un estimator on-line al parametrilor, schema este referită prin APPC direct. Dacă θc(t) este calculat prin intermediul ecuaţiei

θc(t) = F(θ(t)) (1.2.5) unde θ(t) este estimarea lui θ* generată printr-un estimator on-line, schema este referită ca APPC indirect. Structura unui APPC direct şi respectiv indirect este aceeaşi cu cea prezentată în Fig. 1.6 şi respectiv 1.7 corespunzătoare cazului general.

Proiectarea schemelor APPC este foarte flexibilă în raport cu alegerea formei controllerului C(θc) şi a estimatorului on-line al parametrului.

De exemplu, legea de comandă poate fi bazată pe tehnica proiectării liniar-pătratice, tehnici de proiectare în domeniul frecvenţă, sau orice altă metodă PPC

r – Intrare Controller

C( *cθ )

u yProces G(s)

de referinţă

1-14

utilizată în cazul în care parametrul se consideră a fi cunoscut. Diverse combinaţii ale estimatoarelor on-line şi ale legilor de comandă conduc la o clasă largă de scheme APPC care vor fi studiate în detaliu în Cap. 5.

În literatura dedicată controlului adaptiv, schemele APPC sunt adesea referite ca regulatoare cu autoacordare (self-tuning regulators) şi sunt distincte faţă de MRAC. Distincţia dintre APPC şi MRAC este mai mult istorică decât conceptuală, deoarece, aşa cum se va arăta în Cap. 5, MRAC poate fi considerat ca o clasă specială a APPC. MRAC a fost iniţial dezvoltat pentru procese continue în timp pentru urmărirea modelului, pe când APPC a fost iniţial dezvoltat pentru procese discrete în timp în domeniu stochastic utilizând tehnici de minimizare.

1.2.6. Proiectarea on-line a estimatoarelor parametrilor

Aşa cum s-a menţionat în subcapitolele anterioare, un controller adaptiv poate fi considerat ca o combinaţie a unui estimator on-line al parametrilor necunoscuţi cu o lege de control proiectată pentru cazul în care parametrii se consideră cunoscuţi. Modul în care se face această combinare şi tipul estimatorului şi a legii de comandă utilizată dau naştere unei clase de controllere adaptive diferite, cu diferite proprietăţi. În literatura dedicată controlului adaptiv, estimatorul on-line al parameterului (parametrilor) a fost de obicei denumit lege de adaptare, lege de actualizare sau mecanism de ajustare. În acest curs, acesta va fi denumit lege de adaptare. Proiectarea legii de adaptare este crucială pentru proprietăţile de stabilitate ale controllerului adaptiv. Aşa cum vom vedea în acest curs, legea de adaptare introduce o neliniaritate multiplicativă care face ca sistemul în circuit închis să fie neliniar şi de regulă variabil în timp. Din această cauză, analiza şi înţelegerea stabilităţii şi robusteţii schemelor de control adaptiv sunt mult mai interesante (provocatoare).

Câteva dintre metodele de bază utilizate pentru proiectarea legilor adaptive sunt:

(i) Metoda de senzitivitate; (ii) Metoda de pozitivitate şi proiectare Lyapunov; (iii) Metoda gradientului şi metode ale celor mai mici pătrate bazate pe funcţia

cost a erorii de estimare. Aceste metode vor fi utilizate în Cap. 4 şi 5 pentru proiectarea unor clase de

legi de adaptare. Metoda senzitivităţii este una dintre cele mai vechi metode utilizate în proiectarea legilor de adaptare şi va fi prezentată pe scurt în acest paragraf.

(i) Metoda de senzitivitate Această metodă a devenit foarte populară în anii 1960 [9, 10] şi este încă

folosită în multe aplicaţii industriale pentru conducerea proceselor cu incertitudini. În controlul adaptiv, metoda senzitivităţii este utilizată pentru proiectarea legii

adaptive astfel încât parametrii estimaţi să fie ajustaţi într-o direcţie care să minimizeze o anumită funcţie cost (performanţă). Legea de adaptare este obţinută din derivata parţială a funcţiei cost în raport cu parametrii estimaţi, multiplicată cu

1-15

un semnal de eroare care reprezintă nepotrivirea (diferenţa) dintre comportarea actuală şi comportarea dorită. Această derivată este denumită funcţie de senzitivitate şi, dacă ea poate fi generată on-line, atunci legea adaptivă este implementabilă. În practică însă, în majoritatea cazurilor de control adaptiv, funcţia de senzitivitate nu poate fi generată on-line, şi acesta constituie unul din principalele dezavantaje ale metodei. Pentru implementarea metodei, se încercă folosirea funcţiilor de senzitivitate aproximative, care sunt implementabile, dar care conduc la scheme de control adaptiv ale căror proprietăţi de stabilitate sunt fie slabe, fie nu pot fi stabilite.

Ca exemplu, considerăm proiectarea unei legi adaptive pentru actualizarea vectorului parametru al controllerului θc din schema MRAC directă din Fig. 1.10.

Eroarea de urmărire e1 reprezintă diferenţa dintre ieşirea procesului y şi cea a modelului de referinţă ym, adică, e1 = y - ym. Deoarece, în regim staţionar, θc = *

cθ are drept urmare e1 = 0, se poate considera că o valoare nenulă a lui e1 implică

*cc θ≠θ .

Deoarece y depinde de θc, adică y = y(θc), se obţine că e1 = e1(θc) şi deci, o metodă de reducere a lui e1 la zero constă în a ajusta θc într-o direcţie care să minimizeze o anumită funcţie cost (performanţă) ce depinde de e1. O funcţie cost simplă ce depinde de e1 este funcţia pătratică:

2)()(

21 c

ceJ θ

=θ . (1.2.6)

O metodă simplă pentru adjustarea lui θc care minimizează J(θc) este metoda celei mai rapide descreşteri sau metoda gradientului (vezi Anexa B), care furnizează legea de adaptare:

)()( 11 ccc eeJ θ∇γ−=θ∇γ−=θ& (1.2.7)

unde T

cnccc

eeee ⎥⎦

⎤⎢⎣

⎡θ∂∂

θ∂∂

θ∂∂

=θ∇Δ

1

2

1

1

11 ,,,)( K (1.2.8)

este gradientul lui e1 în raport cu Tcnccc ],,,[ 21 θθθ=θ K .

Deoarece )()(1 cc ye θ∇=θ∇ , se obţine

)()( 1 ccc yeJ θ∇γ−=θ∇γ−=θ& (1.2.9)

unde γ > 0 este o constantă arbitrară de proiectare denumită factor de amplificare a legii de adaptare (adaptive gain), iar ciy θ∂∂ / , ni ,,2,1 K= sunt funcţiile de senzitivitate ale lui y în raport cu elementele vectorului parametrilor controllerului θc. Funcţiile de senzitivitate ciy θ∂∂ / reprezintă senzitivitatea ieşirii procesului la schimbările parametrilor θc ai controllerului.

1-16

În (1.2.7) vectorul parametrilor θc este ajustat în direcţia celei mai rapide descreşteri a lui 2/)()( 2

1 cc eJ θ=θ . Dacă J(θc) este o funcţie convexă, atunci aceasta are un minim global care satisface 0)( =θ∇ cy , adică, în punctul de minim,

0=θc& şi adaptarea se opreşte.

Implementarea lui (1.2.9) necesită generarea on-line a funcţiilor de senzitivitate ciy θ∂∂ / care, de regulă, depind de parametrii necunoscuţi ai procesului şi de aceea nu sunt disponibile. În aceste cazuri, în locul funcţiilor de senzitivitate actuale (reale) sunt folosite valorile lor aproximate. Pentru a calcula funcţiile de senzitivitate, o metodă de aproximare necesită şi utilizează a priori o anumită informaţie despre parametrii procesului.

O metodă cunoscută pentru calculul funcţiilor de senzitivitate aproximative este aşa-numita regulă MIT. Cu această regulă, parametrii necunoscuţi, dar necesari în generarea funcţiilor de senzitivitate, sunt înlocuiţi cu estimările lor on-line. În general, prin utilizarea funcţiilor de senzitivitate aproximative, nu este posibilă demonstrarea stabilităţii globale în circuit închis şi convergenţa la zero a erorii de urmărire. Totuşi, în simulări, s-a observat că regula MIT, dar şi alte tehnici de aproximare, lucrează bine când factorul de amplificare al legii de adaptare γ şi amplitudinea semnalului de referinţă sunt mici.

Pentru a confirma aceste observaţii şi a demonstra stabilitatea locală a unei anumite clase de semnale de referinţă în [11] sunt utilizate tehnici de mediere. Cu toate acestea, global, schemele bazate pe regula MIT şi pe alte aproximări pot duce la instabilitate. Exemple de instabilitate sunt prezentate în [12, 13, 14].

Vom ilustra utilizarea regulii MIT pentru proiectarea unei scheme MRAC pentru procesul:

uyayay +−−= 21 &&& , (1.2.10)

unde a1 şi a2 sunt parametrii necunoscuţi ai procesului, iar y& şi y sunt măsurabile. Modelul de referinţă ce urmează a fi urmărit de către sistemul în circuit închis

este descris prin: ryyy mmm +−−= &&& 2 . (1.2.11)

Se vede că legea de comandă

ryyu +θ+θ= *2

*1 & , (1.2.12)

unde 21

*1 −=θ a ; 12

*2 −=θ a , (1.2.13)

iar r este mărimea de referinţă, va realiza urmărirea perfectă a modelului, adică y = ym.

Ecuaţia (1.2.13) se numeşte ecuaţie de ajustare (a parametrilor regulatorului). Deoarece a1 şi a2 sunt necunoscuţi, valorile dorite ale parametrilor controllerului

1-17

*1θ şi *

2θ nu pot fi calculate din (1.2.13). De aceea, în locul lui (1.2.12) se utilizează legea de comandă:

ryyu +θ+θ= 21 & , (1.2.14)

unde θ1 şi θ2 sunt estimările lui *1θ şi *

2θ , ce sunt ajustate utilizând regula MIT astfel:

111 θ∂

∂γ−=θ

ye& , 2

12 θ∂∂

γ−=θye& , (1.2.15)

unde e1 = y - ym. Pentru a implementa (1.2.15), trebuie generate on-line funcţiile de senzitivitate 1/ θ∂∂ y , 2/ θ∂∂ y . Utilizând (1.2.10), adică uyayay +−−= 21 &&& şi (1.2.14), adică ryyu +θ+θ= 21 & , se obţine:

12

11

12

11

1 θ∂∂

θ+θ∂

∂θ++

θ∂∂

−θ∂

∂−=

θ∂∂ yyyyayay &

&&&&

(1.2.16)

22

21

22

21

2 θ∂∂

θ+θ∂

∂θ++

θ∂∂

−θ∂

∂−=

θ∂∂ yyyyayay &&&&

(1.2.17)

Presupunând că viteza de adaptare este lentă, adică, 1θ& şi 2θ& au valori mici, iar schimbările lui y&& şi y& în raport cu 1θ şi 2θ sunt de asemenea mici, putem interschimba ordinea de diferenţiere şi se obţine:

yyaytd

daytd

d&+

θ∂∂

−θ+θ∂

∂−θ=

θ∂∂

122

111

12

2

)()( (1.2.18)

yyaytd

daytd

d+

θ∂∂

−θ+θ∂

∂−θ=

θ∂∂

222

211

22

2

)()( (1.2.19)

care poate fi rescrisă sub forma

yapap

y&

)()(1

22112

1 −θ−−θ−=

θ∂∂ (1.2.20)

yapap

y)()(

1

22112

2 −θ−−θ−=

θ∂∂ (1.2.21)

unde )()( ⋅=⋅Δ

tddp este operatorul diferenţial.

Deoarece a1 şi a2 sunt necunoscuţi, funcţiile de senzitivitate de mai sus nu pot fi utilizate. Folosind regula MIT, înlocuim în ecuaţia de ajustare (1.2.13), adică

21*1 −=θ a , 12

*2 −=θ a , pe a1 şi a2 cu estimările lor 1a şi 2a (mai exact, facem

legătura între estimările 1a şi 2a şi 1θ şi 2θ ) folosind

2ˆ 11 +θ=a , 1ˆ 22 +θ=a (1.2.22)

şi obţinem funcţiile de senzitivitate aproximative:

1-18

ypp

y&

121

21 ++

≅θ∂

∂ , ypp

y12

12

2 ++≅

θ∂∂ . (1.2.23)

Ecuaţiile descrise prin (1.2.23) sunt cunoscute ca filtre sau modele de senzitivitate, şi pot fi uşor implementate pentru a genera funcţiile de senzitivitate aproximative pentru legea de adaptare (1.2.15).

Aşa cum s-a arătat în [12, 11], schema MRAC bazată pe regula MIT este local stabilă cu condiţia ca amplificarea să fie mică, semnalul de referinţă să aibă o amplitudine mică şi un număr suficient de frecvenţe, iar condiţiile iniţiale 1θ (0) şi

2θ (0) sunt apropiate de *1θ , respectiv *

2θ . Pentru valori mari ale lui γ şi 1θ (0) şi 2θ (0) depărtate de *

1θ şi *2θ , regula MIT

poate duce la instabilitate şi semnal răspuns nemărginit. Lipsa stabilităţii schemelor de control adaptiv bazate pe regula MIT a stimulat

numeroşi cercetători să caute alte metode pentru proiectarea legilor adaptive. Aceste metode includ pozitivitatea şi tehnica Lyapunov, precum şi metodele de gradient şi metodele bazate pe tehnica celor mai mici pătrate, care la rândul lor sunt bazate pe minimizarea unor criterii ce depind de eroarea de estimare. Aceste metode ce vor fi studiate în detaliu în Cap. 4 şi 8, sunt prezentate succint în cele ce urmează.

(ii) Metoda de pozitivitate şi proiectare Lyapunov Această metodă de dezvoltare a legilor adaptive este bazată pe metoda directă

Lyapunov şi legătura sa cu funcţiile real-pozitive. În această abordare, problema proiectării unei legi adaptive este formulată ca o problemă de stabilitate, unde ecuaţia diferenţială a legii de adaptare este aleasă astfel încât să fie satisfăcute condiţiile de stabilitate certă bazate pe teoria Lyapunov.

Legea adaptivă astfel dezvoltată este foarte asemănatoare celei bazate pe metoda senzitivităţii. Singura diferenţă constă în aceea că funcţiile de senzitivitate din prima abordare sunt înlocuite cu alte funcţii care pot fi generate on-line. În plus, schemele de conducere adaptivă bazate pe tehnici Lyapunov nu au nici unul din dezavantajele schemelor bazate pe regula MIT.

Proiectarea legilor adaptive utilizând metoda Lyapunov directă a fost sugerată de Grayson [15], Parks [13] şi Shackcloth şi Butchart [14] înainte de anul 1960. Ulterior, metoda a fost dezvoltată şi generalizată la o clasă largă de procese de către Phillipson [16], Monopoli [17], Narendra [18] ş.a.

O parte însemnată din Cap. 4 şi 6 vor fi dedicate dezvoltării legilor adaptive folosind abordarea Lyapunov.

(iii) Metode de gradient şi metode ale celor mai mici pătrate bazate pe

funcţia cost a erorii de estimare

Principalul dezavantaj al metodelor de senzitivitate folosite în anii 1960 constă în aceea că minimizarea funcţiei cost conduce la funcţii de senzitivitate care nu sunt implementabile. O cale de a evita acest neajuns constă în alegerea unei funcţii

1-19

criteriu care să conducă la funcţii de senzitivitate care depind de semnale ce sunt disponibile (pot fi măsurate). O clasă de astfel de funcţii cost se bazează pe aşa-numita eroarea de estimare, care furnizează o măsură a diferenţei dintre parametrii estimaţi şi cei actuali. Legătura erorii de estimare cu parametrii estimaţi este aleasă astfel încât funcţia cost să fie convexă, iar gradientul său în raport cu parametrii estimaţi să fie implementabil.

Pentru a genera funcţii de senzitivitate corespunzătoare pot fi utilizate numeroase funcţii cost şi pot fi adoptate o serie de metode cum ar fi metodele de gradient şi metode ale celor mai mici pătrate.

Ca exemplu, vom proiecta legea adaptivă pentru schema MRAC direct (1.2.14) pentru procesul (1.2.10).

Mai întâi rescriem ecuaţia procesului, uyayay +−−= 21 &&& , în funcţie de parametrii doriţi ai controllerului daţi prin (1.2.13), adică, vom substitui

*11 2 θ+=a , *

22 1 θ+=a în (1.2.10) rezultând:

uyyyyy +θ−θ−−−= *2

*12 &&&& , (1.2.24)

care poate fi rescrisă ca

fff uyyy +θ+θ= *2

*1 & , (1.2.25)

unde

yss

y f &&12

12 ++

−= , yss

y f 121

2 ++−= , u

ssu f 12

12 ++

= (1.2.26)

sunt semnale ce pot fi generate prin filtrare. Dacă acum în ecuaţia (1.2.25) înlocuim *

1θ şi *2θ cu estimările lor 1θ şi 2θ ,

vom obţine:

fff uyyy +θ+θ= 21ˆ & (1.2.27)

unde y este „estimarea” lui y bazată pe estimările 1θ şi 2θ ale lui *1θ şi *

2θ . De aceea, eroarea

fff uyyyyy −θ−θ−=−=εΔ

211 ˆ & (1.2.28)

este o măsură a diferenţei dintre 1θ , 2θ şi *1θ , *

2θ pe care o vom numi eroare de estimare. Acum, estimările 1θ şi 2θ pot fi ajustate într-o direcţie care să minimizeze o anumită funcţie criteriu care implică ε1. O astfel de funcţie criteriu este:

( )221

21

21 21

2),( fff uyyyJ −θ−θ−=

ε=θθ & , (1.2.29)

care urmează a fi minimizată în raport cu 1θ , 2θ . Este clar că ),( 21 θθJ este o funcţie convexă de 1θ , 2θ şi ca urmare, minimul este dat de 0=∇J .

1-20

Dacă acum utilizăm metoda gradientului pentru a minimiza ),( 21 θθJ , vom obţine următoarele legi de adaptare:

fyJ&&

111

11 εγ=θ∂

∂γ−=θ , fyJ

122

22 εγ=θ∂

∂γ−=θ& , (1.2.30)

unde 0, 21 >γγ sunt factori de amplificare, iar ff yy ,,1 &ε sunt toate semnale implementabile.

În locul lui (1.2.29), pentru ε1 se poate utiliza o funcţie cost diferită şi o metodă de minimizare diferită obţinând o clasă de legi adaptive. În Cap. 4, 5, 6 vom examina proprietăţile de stabilitate ale unei largi clase de scheme de control adaptiv bazate pe folosirea unei funcţii criteriu a erorii de estimare şi metode de gradient şi ale celor mai mici pătrate din tehnicile de optimizare. Bibliografie 1. Kokotovic, P.V., H.K. Khalil and J. O'Reilly, Singular Perturbation Methods in

Control: Analysis and Design, Academic Press, New York, 1986. 2. Aseltine, J.A., A.R. Mancini and C.W. Sartune, A Survey of AdaptiveControl Systems,

IRE Transactions on Automatic Control, Vol. 3, no. 6, pp. 102-108, 1958. 3. Caldwell, W.I., Control System with Automatic Response Adjustment. American patent,

2,517,081. Filed 25, April 1947, 1950. 4. McRuer, D., I. Ashkenas and D. Graham, Aircraft Dynamics and Automatic Control,

Princeton University Press, Princeton, New Jersey, 1973. 5. Tsakalis, K.S. and P.A. Ioannou, Linear Time Varying Systems: Control and

Adaptation, Prentice Hall, Englewood Cliffs, New Jersey, 1993. 6. Stein, G., Adaptive Flight Control - A Pragmatic View, in K.S. Narendra and R.V.

Monopoli (Eds.), Applications of Adaptive Control, Academic Press, New York, 1980. 7. Andreiev, N., A Process Controller that Adapts to Signal and Process Conditions,

Control Engineering, Vol. 38, 1977. 8. Kreisselmeier, G., An indirect adaptive controller with a self-excitation capability, IEEE

Transactions on Automatic Control, Vol. 34, no. 5, pp. 524-528, 1989. 9. Cruz, Jr, J.B. System Sensitivity Analysis, Dowden, Hutchinson & Ross Inc.,

Stroudsburg, Pennsylvania, 1973. 10. Kokotovic, P.V. Method of Sensitivity Points in the Investigation and Optimization of

Linear Control Systems, Automation and Remote Control, Vol. 25, pp. 1512-1518, 1964.

11. Mareels, I.M.Y., B.D.O. Anderson, R.R. Bitmead, M. Bodson, and S.S.Sastry, Revisiting the MIT Rule for Adaptive Control, Proceedings of the 2nd IFAC Workshop on Adaptive Systems in Control and Signal Processing, Lund, Sweden, 1986.

12. James, D.J., Stability of a Model Reference Control System, AIAA Journal, Vol. 9, no. 5, 1971.

13. Parks, P.C. Lyapunov Redesign of Model Reference Adaptive Control Systems, IEEE Transactions on Automatic Control, Vol. 11, pp. 362-367, 1966.

14. Shackcloth, B. and R.L. Butchart, Synthesis of Model Reference Adaptive Systems by Lyapunov's Second Method, Proc. of the 2nd IFAC Symposium on the Theory of Self-Adaptive Control Systems, Teddington, England, 1965.

15. Grayson, L.P., Design via Lyapunov's Second Method, Proceedings of the 4th JACC, Minneapolis, Minnesota, 1963.

1-21

16. Phillipson, P.H., Design Methods for Model Reference Adaptive Systems, Proc. Inst. Mech. Engrs., Vol. 183, no. 35, pp. 695-700, 1969.

17. Monopoli, R.V., Lyapunov's Method for Adaptive Control Design, IEEE Transactions on Automatic Control, Vol. 12, no. 3, pp. 334-335, 1967.

18. Narendra, K.S. and A.M. Annaswamy, Stable Adaptive Systems, Prentice Hall, Englewood Cliffs, New Jersey, 1989.