identificarea sistemelor

CAPITOLUL 2 . Clase de modele utilizate în identificare ……………………..………………………………………11 2.1. Clasificarea modelelor……………………………………………………………………………………………….….……..11 1. Modele liniare si neliniare……………………………………………………………….………………………………………11 2. Modele neparametrice si parametrice…………………………………………………………………………………….11 3. Modele intrare -iesire si modele de stare……………………………………………..…………………..…………….12 4. Modele invariante si variante în timp………………………………………………………………………….……………12 5. Modele discrete si modele cu timp continuu………………………………………………………………….………..12 6. Modele în domeniul timp si în domeniul frecventelor…………………………………………..…………………12 7. Modele deterministe si modele stohastice…………………………………………………………………….…..…..12 8. Modele cu parametri concentrati si modele cu parametri distribuiti………………………………….…….13 9. Modele cu o singura intrare, o singura iesire (SISO) si modele multivariabile……………………………13 2.2 Modele intrare -iesire ……………………………………………………………………………………………………....…..14 Exemplul 1,2,3, Observatie ………………………………………………………………………………………………….……….17 2.3. Modele de stare………………………………………………………………………………………………………….………….21 2.4. Conceptul de identificabilitate…………………………………………………………………………………….………….22 Exemplul 2.1. .…………………………………………………………… …………………………………………………………….…..25 Def1-sistem identificabil,def2-sistem sigur identificabil………………………………………………………………..26 Def3-sistem parametric identificabil…………………………………………………………………………..….………………27 CAPITOLUL 3 .Semnale de intrare …………………………………………………………………………….………….………..28 3.1. Descrierea matematica a semnalelor deterministe…………………………………………………………………..29 Def1-patrat in tegrabil,def2-produs scalar sau produsul interior………………………………………………………..29 Aproximarea continua în sensul celor mai mici patrate…………………………………………………………….………..30 Observatii, Def3 - sir ortogonal………………………………………....................................................................31 Def4-sistem orthogonal,def5-coeficienti Fouriér ai unei functii………………………………………………..…………32 Aproximarea discreta în sensul celor mai mici patrate…………………………………………………………………………..33 Seturi uzuale de functii ortogonale utilizate………………………………………………………………………………….………34 Tabelul 3.1,3.2, Observatii………………………………………………………………………………………………………………………35 Analiza spectrala a semnalelor deterministe. Consideratii energetice…………………………………………………….36 Analiza Fourier a semnalelor continue periodice, de perioada T……………………………………………………………..38 Analiza Fouriér a semnalelor continue neperiodice…………………………………………………………………………………40 Observatii………………………………………………………………………………………………………………..………………………………..41 Analiza Fourér a semnalelor discrete…………………………………………………………………………………..………………………42 A. Transformata Fouriér în timp discret (TFTD)………………………………………………………………………………….………43 B. Transformata Fouriér discreta (TFD)……………………………………………………………………………………………….……..43 Exemplul 1……………………………………………………………………………………………………………………….…………………………45 Exemplul 2…………………………………………………………………………………………………………………………………………………46 Exemplul 3,4,5, 3.2. Descrierea matematica a semnalelor aleatoare…………………………………………………….47 Tabelul 3.3…………………………………………………………………………………………………………………………………………………..48 semnal pseudoaleator binar (SPAB),propr1,2………………………………………………………………………………………………50 3.3. Persistenta semnalelor………………………………………………………………………………………………………………………………………….51 Def6,Observatie……………………………………………………………………………………………………………………………………………………..……………..52 Propr 1,dem, Propr2,dem,propr3,4,dem……………………………………………………………………………………………………….…………….………..53 Observatii,def7………………………………………………………………………………………………………………………………………………………………..……..54 Proprietatea 5…………………………………………………………………………………………………………………………………………………………………..……55 Proprietatea 6……………………………………………………………………………………………………………………………………………………………..…..…….56 CAPITOLUL 5. Metode neparametrice , 5.1. Identificarea sistemelor liniare cu semnale de proba deterministe ………….….65 5.1.1. Identificarea cu semnale de proba neperiodice…………………………………………………………………………………………………..…….65 5.1.2. Identificarea cu semnale de proba periodice………………………………………………………………………………………………………..…...68 5.1.3 Deducerea functiei de transfer din raspunsul indicial, a) Metoda comparatiei folosind atlase de functii normate…… .71 b) Aproximarea prin modele cu functii de transfer simplificate…………………………………………………………………………………..…………71 Observatie………………………………………………………………………………………………………………………………………………………………………………72 c) Aproximarea curbelor experimentale prin expresii de forma solutiilor unor ecuatii diferentiale liniare cu coeficienti constanti ……………………………………………………………………………………………………………………………………………………………………………….72 Pasul 1,2…………………………………………………………………………………………………………………………………………………………………….………….73 d) Metode de optimizare parametrica…………………………………………………………………………………………………………………………………….74 5.1.4. Deducerea functiei de transfer din caracteristicile de frecventa determinate experimental…………………………………….75 a) Metoda bazata pe aproximarea caracteristicilor logaritmice de frecventa………………………………………………………………………….75

b) Metoda de optimizare parametrica…………………………………………………………………………………………………………………………………..76 5.2. Identificarea sistemelor liniare cu semnale de proba aleatoare…………………………………………………………………………………..77 5.2.1. Principiul metodelor de identificare………………………………………………………………………………………………………………………….78 5.2.2. Estimarea functiilor de corelatie………………………………………………………………………………………………………………………………82 5.2.3. Estimarea densitatilor spectral………………………………………………………………………………………………………………………………….83 5.2.4. Identificarea sistemelor liniare folosind marimile din functionarea normal……………………………………….……………………87 CAPITOLUL 6. Estimatori de risc minim, 6.1. Introducere…………………………………………………………………………………………………..89 Def1,2,3,4,…………………………………………………………………………………………………………………………………………………………………………….92 Def5,Lema1,dem,lema2…………………………………………………………………………………………………………………………………………………………93 Demonstratie, Teor ema 1. (Cramér -Rao), Demonstratie………………………………………………………………………………………………………94 Exemplul 1,2,3……………………………………………………………………………………………………………………………………………….………………………96 6.2. Estimatorul Markov, Formularea problemei……………………………………………………………………………………………………..……………98 Proprietatile estimatorului Markov…………………………………………………………………………………………………………………………………..…….99 Observatie, Teorema 2, Demonstratie………………………………………………………………………………………………………………………………….100 6.3 Estimatorul celor mai mici patrate…………………………………………………………………..…………………………………………………………..101 CAPITOLUL 7. Identificarea prin metode parametrice directe, 7.1. Metoda celor mai mici patrate…………………………..………102 Observatii……………………………………………………………………………………………………………………………………………………………………………..103 7.1.1 Analiza estimatorului celor mai mici patrate………………………………………………………………………………………………………………104 Teorema, Demonstratie………………………………………………………………………………………………………………………………………………………105 Teorema (L. Ljung), Teorema (R. Chung)………………………………………………………………………………………………………………………………106 7.1.2. Extensii ale estimatorului celor mai mici patrate………………………………………………………………………………………………………108 Observatie, 7.2. Metoda celor mai mici patrate în doua etape……………………………………………………………………………………………111 7.3 Metoda verosimilitatii maxime, 7.3.1. Definirea EVM…………………………………………………………………………………………………..115 Observatia 1………………………………………………………………………………………………………………………………………………………………….……..116 Observatia 2, Observatia 3………………………………………………………………………………………………………………………..………………………….117 7.3.2. Analiza estimatorului de verosimilitate maxima…………………………………………………….………………………………………………..121 7.4 Metoda minimizarii erorii de predictie de pas (MEP), 7.4.1. Definirea estimarii MEP…………………………………………………125 7.4.2. Metoda celor mai mici patrate generalizate……………………………………………………………………………………………………………..126 Teorema, Demonstratie………………………………………………………………………………………………………………………………………………………..127 Observatia 1…………………………………………………………………………………………………………………………………………………………………….…..128 Observatia 2, 7.4.3. Variante ale metodei CMMPG, Varianta 1……………………………………………………………………………….…….…..129 Varianta 2…………………………………………………………………………………………………………………………………………………………………………...131 Algortm(pas1-4)Observatii, Varianta 3……………………………………………………………………………………………………………………………….132 7.5. Metode de variabila instrumental, 7.5.1. Esenta metodei de variabila instrumental…………………………………..………….133 7.5.2. Alegerea variabilelor ins trumentale de baza……………………………………………………………………………………………………………134 Lema, Demonstratie, 7.5.3. Distributia estimatorului de variabila instrumentala (VI)……………………………………………………….137

11

CAPITOLUL 2 Clase de modele utilizate în identificare

2.1. Clasificarea modelelor Alegerea clasei de modele este strâns conditionata de informatia apriorica si de scopul final al identificarii, în particular de tipul de sistem automat ce trebuie proiectat. Asa cum sistemele pot fi clasificate din mai multe puncte de vedere, în acelasi mod pot fi clasificate si modelele asociate lor. În cele ce urmeaza vom analiza câteva categorii de modele. 1. Modele liniare si neliniare - Distinctia dominanta între cele doua categorii este data de principiul suprapunerii efectelor care este valabil numai în primul caz si care se refera la relatia dintre variabilele dependente de timp. Pentru estimarea parametrilor un concept la fel de important este cel de liniaritate (neliniaritate) în parametri, în raport cu relatia dintre variabilele dependente si parametri. Un sistem poate fi neliniar din punct de vedere dinamic si totusi liniar (sau liniarizabil) în parametri. Exemplu : Fie y(t) si u(t) marimile de iesire/intrare ale sistemului si

y(t)=Cua (t) relatia de legatura între aceste marimi care reprezinta modelul dinamic al sistemului. Acesta este neliniar dar liniarizabil în parametrii C si α prin transformarea v(t)=lny(t) ; x(t)=lnu(t) care conduce la modelul:

v(t)=lnC+αx(t) sau, daca a=lnC si b=α,

v(t)=a+bx(t). Daca, prin transformari corespunzatoare, un model nu poate fi facut liniar în parametri atunci el este intrinsec neliniar. 2. Modele neparametrice si parametrice. În alegerea clasei de modele sunt posibile doua moduri de abordare. Primul mod foloseste ideea transformarii definite pe un spatiu al functiilor care ofera o reprezentare a semnalelor de intrare-iesire din sistem. În acesti termeni problema modelarii consta în a gasi transformarea de la spatiul functiilor de intrare la spatiul functiilor de iesire, transformare care caracterizeaza sistemul. Deoarece nu se foloseste nici o informatie despre structura fizica a sistemului, acest mod de abordare este foarte general si conduce la asa numitele modele neparametrice (raspunsuri la impuls, caracteristici de frecventa, serii Voltera etc.). Al doilea mod de abordare porneste de la o presupusa descriere matematica a dinamicii procesului în "spatiul parametrilor". Coordonatele acestui spatiu sunt valorile numerice ale parametrilor modelului, considerati ca iesiri ale acestuia. Daca modelul este de exemplu, ecuatia diferentiala ordinara, coordonatele pot fi coeficientii ecuatiei si valorile conditiilor initiale. Daca exista o functie de excitatie (de fortare) atunci parametrii acestei functii (semnal) maresc dimensiunea spatiului parametrilor, care ramâne totusi finita.

12

Modelele care intra în aceasta categorie se numesc modele parametrice (ecuatii diferentiale de forma si ordin determinat, functii de transfer, modele de stare etc.). 3. Modele intrare -iesire si modele de stare. Consideram ca începând cu un moment initial t0 se aplica sistemului o marime de intrare (marime cauza) u(t), t≥t0 , pe o durata de timp finita, numita interval de observare. În acest interval se masoara marimea de iesire y(t) (marimea efect). Pe baza experimentelor se deduce usor ca y(t) depinde de u(t) si de starea initiala x(t0). Orice descriere din punct de vedere functional a unui sistem se bazeaza pe conceptele de marime de intrare u(t), marime de iesire y(t) si marime de stare x(t). Modelul matematic al unui sistem real poate fi exprimat prin doua seturi de ecuatii, una care leaga marimea (marimile) de stare de marimile de intrare (ecuatii de stare) si altul care leaga iesirea (iesirile) de marimea de stare (ecuatii de iesire), adica:

( )( )

==

)t(u),t(x,tg)t(y)t(u),t(x,tf)t(x&

cu x(t0) dat, în care f,g,x,y sunt marimi vectoriale de dimensiuni adecvate. Aceasta descriere este asa numita reprezentare intrare-stare-iesire a sistemului (model de stare). În anumite conditii, prima ecuatie admite solutia:

( ) 0000 tt )t,t(u),t(x,t,t)t(x ≥ϕ= unde u(t, t

0) reprezinta restrictia functiei u(t) la intervalul [t

0 ,t], functia ϕ fiind

functia de transfer a starilor. Eliminând starea x(t) din cele doua relatii rezulta:

( ) 0000 tt)t(u),t,t(u),t(x),t,t(,tg)t(y ≥ϕ= care este asa numita reprezentare intrare-iesire (model intrare-iesire) a sistemului. Reprezentarea de stare prezinta facilitati deosebite în analiza si sinteza sistemelor automate în domeniul timpului, o serie de metode specifice fiind usor de implementat pe calculator. Reprezentarea intrare-iesire este avantajoasa în cazul sistemelor dinamice liniare invariante în timp, pentru care se pot aplica avantajos transformarile integrale Laplace si Fouriér. 4. Modele invariante si variante în timp. Modelele invariante sunt cele care au parametri constanti, de exemplu. Modelele sistemelor variante în timp necesita metode speciale de identificare recurgând la algoritmi de estimare în timp real a parametrilor. 5. Modele discrete si modele cu timp continuu sunt cele care descriu adecvat sistemele corespunzatoare pentru care sunt valabile consideratiile facute în introducere. 6. Modele în domeniul timp si în domeniul frecventelor. Exemplul tipic de model în domeniul timp este ecuatia diferentiala sau ecuatia cu diferente în cazul discret, în timp ce functia de transfer sau caracteristicile de frecventa reprezinta modele în domeniul frecventelor. 7. Modele deterministe si modele stohastice. Pentru un model determinist marimea de iesire poate fi calculata exact cât timp intrarea este un

13

semnal cunoscut. În opozitie, un model stohastic contine termeni care fac imposibil acest calcul, de regula acesti termeni constituind descrieri ale perturbatiilor. Problema controlului este de cele mai multe ori generata de existenta perturbatiilor. O contributie importanta în teoria moderna a reglarii a fost modelarea perturbatiilor ca procese stohastice si exploatarea proprie tatilor sistemelor stohastice pentru a obtine strategii de control care sa minimizeze actiunea acestora. 8. Modele cu parametri concentrati si modele cu parametri distribuiti. Cele doua categorii de modele corespund sistemelor omoloage. Modelele sistemelor cu parametri concentrati contin de regula un numar finit de ecuatii diferentiale ordinare, iar cele corespunzatoare sistemelor cu parametri distribuiti contin fie un numar infinit de ecuatii diferentiale ordinare fie un numar finit de ecuatii cu derivate partiale . 9. Modele cu o singura intrare, o singura iesire (SISO) si modele multivariabile. Cele multivariabile pot avea mai multe intrari si o singura iesire (MISO) sau mai multe intrari si mai multe iesiri (MIMO). Desigur, un model matematic oarecare se poate încadra în mai multe astfel de categorii (de exemplu modelul stohastic cu timp discret cu parametri constanti). În cele ce urmeaza vom trece în revista modelele liniare invariante, cele mai utilizate în identificare, deoarece majoritatea metodelor prezentate se vor referi la sisteme liniare. Procesele industriale sunt în marea lor majoritate neliniare, totusi, în cele mai multe cazuri intereseaza comportarea dinamica la variatii mici în jurul unui punct stationar de functionare, situatie în care un model liniar poate aproxima suficient de bine comportarea procesului real.

2.2 Modele intrare -iesire Fie sistemul determinist ilustrat în fig. 2.1 în care u(t) este marimea de intrare si y(t) marimea de iesire.

u(t) y(t)

Fig. 2.1

În domeniul timpului, modelul intrare-iesire continuu este ecuatia diferentiala liniara cu coeficienti constanti, daca sistemul este liniar, invariant în timp si cu parametri concentrati :

(M1) )t(ub)t(yam

0j

)j(j

)i(n

0ii ∑∑

===

sau Q(p)y(t)=P(p)u(t), în care p=d/dt este operatorul de derivare, iar Q si P sunt polinoamele:

01n

n

01m

m

apa....paQ(p)

bpb....pbP(p)

+++=

+++=

presupuse prime între ele.

14

Modelul corespunde unui sistem fizic realizabil daca m<n, stabil daca radacinile ecuatiei caracteristice Q(p)=0 sunt în semiplanul complex stâng si de faza minima daca radacinile P(p)=0 sunt de asemenea în semiplanul stâng. Ecuatia diferentiala este evident un model parametric, vectorul:

Tm10n10 ]b.....b,b,a....a,a[=θ

continând coeficientii ecuatiei diferentiale. Pentru solutionarea ecuatiei este necesara cunoasterea intrarii u(t) si a conditiilor initiale care se refera la y(0) si ( )( ) 1n,1k,0y k −= , precum si a parametrilor concentrati în vectorul θ. Clasa de modele (M1) este specificata daca se cunosc gradele polinoamelor Q si P (numite si indici de structuri, care dau dimensiunea vectorului θ) si este complet specificat daca se cunosc si valorile numerice ale parametrilor. Ca rezultat al principiului suprapunerii efectelor, comportarea dinamica a unui sistem liniar poate fi descrisa cu ajutorul unei functii h(t) de raspuns la impuls (functia pondere). Orice functie de timp u(t) poate fi considerata formal ca fiind o combinatie liniara de functii impuls. Aceasta conduce la integrala de convolutie, care, pentru conditii initiale nule, este:

(M2) 0td)t(u)(hd)(u)t(h)t(y0

t

>ττ−τ=τττ−= ∫∫∞

∞−

Pentru realizabilitatea fizica, h(t)≡0 pentru t<0. Modelul (M2) constituie un model continuu neparametric care este complet specificat daca se cunosc valorile functiei pondere h(t). Cum timpul este continuu, se observa ca modelul este infinit dimensional, deoarece este necesara precizarea unei infinitati de valori ale functiei pondere. Desigur, functia pondere poate avea o reprezentare parametrizata (de exemplu o combinatie de exponentiale) astfel încât perechile de valori (t, h(t)) sa poata fi deduse cu ajutorul unui numar finit de parametri, însa modelul (M2) ramâne si în acest caz neparametric. Pentru un sistem asimptotic stabil ( ) 0thlim

t=

∞→.

În cazul multivariabil, u(t) si y(t) sunt vectori de dimensiune nu/1 si respectiv ny/1, polinoamele P(p) si Q(p) sunt polinoame matriceale, iar operatorul de derivare p, de dimensiuni ny/ny si respectiv ny/nu. În fond, în cazul MIMO, ecuatia diferentiala este înlocuita cu un sistem de ecuatii diferentiale. De asemenea, în cazul multivariabil, functia pondere este înlocuita de o matrice de raspuns la impuls. Considerând conditiile initiale nule, prin aplicarea transformatei Laplace modelului (M1) obtinem functia de transfer:

(M3) [ ][ ] )s(Q

~)s(P

~

sa

sb

)t(uL)t(yL

)s(W n

0i

ii

m

0j

jj

===∑

∑

=

=

15

care este modelul parametric în domeniul frecventelor pentru un sistem liniar SISO. În mod frecvent, functia de transfer este fractie rationala care poate fi pusa în diferite forme:

)s(Q)s(P

k)s(W =

în care P(s) si Q(s) polinoame monice, iar k este amplificarea, sau:

( )

( )∏

∏

=

=

−

−= n

1iin

m

1jim

psa

zsb)s(W

unde zi si pi sunt zerourile si respectiv polii f.d.t., sau:

( )

( )

( )

( )∏

∏

∏

∏

∏

∏

=

=

=

=

=

=

+

τ+=

+

τ+= n

1ii

m

1jj

n

1ii

m

1jj

n

1iin

m

1jim

sT1

s1k

sT1

s1

pa

zb)s(W

în cazul în care toti polii sunt reali, unde k este factorul de amplificare iar τj si Ti sunt constante de timp. Timpul mort Tm , poate fi usor pus în evidenta în reprezentarea prin functii de transfer, prin multiplicarea cu exponentiala sTme− .

msTe)s(Q)s(P

)s(W −=

Transformata Fouriér a functiei pondere: M(4) W(jω)=F[h(t)]

reprezinta factorul de amplificare complex si este modelul neparametric în domeniul frecventelor. Dupa cum se stie acesta este echivalent cu caracteristicile de frecventa:

ω=ωϕω=ω

)j(Warg)()j(W)(A

sau caracteristicile logaritmice de frecventa:

M(5)

ω=ωϕω=ω)j(Warg)(

)j(Wlg20)(AdB

În cazul multivariabil, în domeniul complex, functia de transfer este înlocuita de matricea de transfer de dimensiune ny/nu:

W(s)=[Wij(s)] nu1,j ,nj1,i == ale carei elemente Wij(s) reprezinta functiile de transfer de la intrarile uj la iesirile yi atunci când toate celelalte marimi de intrare sunt nule. În mod asemanator, factorul de amplificare complex se înlocuieste cu o matrice ale carei elemente sunt Wij(jω). Pentru descrierea comportarii dinamice a sistemelor în care sunt disponibile numai valorile esantionate ale marimilor de intrare-iesire se pot

16

utiliza ecuatiile cu diferente în locul ecuatiilor diferentiale. Fie deci un sistem discret cu intrarea u(t) si iesirea y(t) cu t=0,1∆,2∆,... în care ∆ este perioada de esantionare. Pentru simplificarea scrierii vom considera ∆ unitar. Ecuatia cu diferente în cazul unui sistem SISO este, în forma generala, urmatoarea: (M6) A(q-1)y(t)=q-kB(q-1)u(t) unde:

A(q-1)=1+a1q-1+...+anaq-na B(q-1)=b0+b1q-1 +...+bnbq-nb

iar q-1 este operatorul de întârziere, q-1y(t)=y(t-1), k este timpul mort exprimat în numar de perioade de esantionare, polinoamele A(q-1) si B(q-1) fiind considerate prime între ele. Conditia necesara ca sistemul sa fie realizabil fizic este k≥0 (sa respecte principiul cauzalitatii), na si nb putând fi în orice relatie. Cum, în general, u(t) nu actioneaza direct asupra lui y(t) (transmisie instantanee), k ia valori strict pozitive. Din aceasta cauza, în mod curent vom considera polinomul B(q-1) de forma: B(q-1)=b1q-1+...+bnbq-nb , având termenul liber nul. Pentru ca sistemul sa fie stabil, polinomul A(q) trebuie sa aiba radacinile în interiorul cercului unitar (sau, echivalent qnaA(q-1) în exteriorul cercului unitar), iar daca sistemul are faza minima atunci polinomul B(q-1) are zerourile în afara cercului unitar. Modelul cu diferente este specificat daca se cunosc indicii de structura (na, nb), timpul mort (dat de numarul k de intervale de esantionare care întârzie actiunea intrarii) si conditiile initiale si este complet specificat daca se cunosc si parametrii cuprinsi în vectorul:

θ=[a1..ana , b0..bnb]T

Considerând modelul (M6), acesta poate avea forme particulare si anume: a) A(q-1)y(t)=q-ku(t) - model autoregresiv (AR); b) y(t)=q-kB(q-1)u(t) - model de medie alunecatoare (MA), forma generala fiind de fapt un model autoregresiv si de medie alunecatoare (ARMA). Denumirea de model autoregresiv provine din faptul ca y(t) este o combinatie în care intra valorile anterioare ale marimii de iesire y(t-1), y(t-2),..., iar cea de medie alunecatoare din faptul ca iesirea este o medie ponderata alunecatoare a intrarii la momente de timp anterioare. Considerând conditiile initiale nule si aplicând proprietatile transformatei z ecuatiei cu diferente (în cazul k=0) obtinem functia de transfer discreta:

(M7) ∑

∑

=

−

=

−∆

−

+== na

1j

jj

nb

0i

ii

1

za1

zb

)]t(u[Z)]t(y[Z

)z(G

În acest caz, secventa de ponderare poate fi interpretata ca fiind transformata z inversa a f.d.t. discrete h(t)=Z-1[G(z-1)], altfel spus h(t) se poate obtine din G(z-1) prin împartire infinita.

17

În cazul multivariabil A(q-1) si B(q-1) sunt polinoame matriceale de dimensiuni corespunzatoare, iar G(z-1) este o matrice de transfer discreta (ca în cazul continuu). Tinând seama de semnificatia operatorului de întârziere q-1 si explicitând ecuatia (M6) rezulta:

θϕ= )t()t(y T în care: ϕ(t)=[-y(t-1), ..., -y(t-na), u(t-1-k), ..., u(t-nb-k)]T

θ=[a1..ana,b1..bnb ]T . Vectorul ϕ(t) contine o parte din evolutia sistemului pâna la momentul

(t-1) inclusiv, pe baza careia se poate face predictia marimii de iesire la momentul t, evident cunoscând parametrii. În general un model de forma:

θϕ= )t()t(y T în care y(t) este o cantitate masurabila (iesirea din procesul tehnologic de exemplu), ϕ(t) este un vector n dimensional ale carui elemente sunt cunoscute, iar θ este un set de marimi necunoscute (parametri), este un model de regresie liniara. Elementele vectorului ϕ(t) sunt denumite variabile de regresie (sau regresori), iar y(t) se numeste variabila regresata. Variabila "t" înseamna timpul în cazurile noastre, dar nu în mod necesar în cazul general. Sunt utile câteva exemple de modele de regresie în general. Exemplul 1. Modelarea tendintei unui proces aleator y(t) poate fi fixata prin polinomul: θϕ=+++= )t(ta.....taa)t(y Tn

n10 unde: ϕ(t)=[t0 ,t1 ,...,tn]T si θ=[a0 ...an ]T.

care este un model de regresie. Exemplul 2. Modelarea raspunsului indicial al unui sistem liniar ca o combinatie de exponentiale:

θϕ=++= α−α− )t(eC....eCC)t(y Ttn

t10

n1 unde:

( ) Tn10

ttT ]C.....CC[ si ]e,.....,e,1[t n1 =θ=ϕ α−α− . Exemplul 3. Modelul (M2) conduce în domeniul timpului discret la suma de convolutie:

(M8) ( ) 0t)it(u)i(h)t(u)it(h)t(yt

0i0i>∀−=−= ∑∑

=

∞

=

în care h(t), t=0,1,... este secventa de ponderare. Pentru sisteme asimptotice stabile 0)t(hlim

t=

∞→, în consecinta, pentru astfel de sisteme, secventa de

ponderare poate fi trunchiata la un numar finit (N) de termeni. Notând θ= [h(o),h(1),..,h(N-1)]T si ϕ(t)=[u(t),...,u(t-N+1)]T, rezulta

y(t)=ϕT(t)θ, deci tot un model de regresie liniara. Observatie. Vectorul θ în cazul unui model de regresie poate reprezenta fie parametrii, ca în cazul modelului (M6), fie valori ale functiei

18

pondere discrete, ca în cazul modelului (M8). În numeroase probleme, semnalele aplicate la intrarea unui sistem constituie realizari ale unor procese aleatoare, asupra carora nu avem decât informatii cu privire la proprietatile statistice. În cazul unui sistem SISO stohastic, rezolvarea ecuatiei diferentiale stohastice înseamna, în principiu, determinarea repartitiei semnalului de iesire atunci când se cunoaste repartitia semnalului aleator de intrare si starea initiala. În cazul general problema este dificil de rezolvat, însa, în cazuri particulare (de exemplu când intrarea este proces stationar normal distribuit sau proces Wiener), solutionarea se simplifica considerabil. Un mod de abordare a unor astfel de ecuatii este transformarea ecuatiei stohastice într-un sistem de ecuatii deterministe în care necunoscutele sunt momentele generalizate ale marimii de iesire (ecuatia mediei, covariantei etc.). Este evident ca în cazul unui semnal de intrare de ordinul doi sunt suficiente numai doua astfel de ecuatii pentru completa caracterizare a iesirii [4], [5]. O altfel de abordare a modelarii unui sistem liniar stohastic, strâns legata de principiul cauzalitatii, este cea care se datoreaza lui Wiener, ce-i drept, valabila într-un caz particular când intrarea este un proces aleator stationar. Fie un sistem liniar caracterizat prin functia pondere h(t). În ipoteza stationaritatii marimii de intrare u(t) este valabila ecuatia:

(M9) ττ−τ= ∫∞

d)t(r)(h)t(r u0uy (vezi anexa 2.2)

în care ruy este functia de intercorelatie intrare-iesire, iar ru(t) functia de autocorelatie a intrarii (ecuatia Wiener-Hopf). Modelul (M9) este evident un model continuu neparametric, similar modelului de convolutie determinist (M2). În cazul sistemelor liniare cu timp discret, ecuatia Wiener-Hopf devine, prin discretizarea timpului:

)it(r)i(h)t(r u0i

uy −= ∑∞

=.

În domeniul complex, un sistem stohastic poate fi caracterizat prin intermediul densitatilor spectrale (interspectrale) ale marimilor de intrare-iesire (vezi anexa 2.1)

(M10) ( )( ) )(SjW)(S

)(SjW)(S

uuy

u2

y

ωω=ω

ωω=ω

în care Su(ω), Sy(ω) sunt densitatile spectrale ale intrarii si respectiv iesirii din sistem, Suy(ω) este densitatea interspectrala intrare-iesire si W(jω) este factorul de amplificare complex al sistemului, presupus liniar. Majoritatea proceselor tehnologice industriale sunt sisteme cu cel putin doua intrari, una de comanda si una perturbatoare (fig. 2.2). În principiu, perturbatia poate actiona oriunde în interiorul procesului, dar, daca sistemul este liniar, ea poate fi translata pe iesire (fig. 2.2.b). În cazul în care perturbatia z(t) (zgomotul) influenteaza putin marimea de iesire y(t) (raport zgomot/semnal nesemnificativ), aceasta poate fi ignorata în controlul procesului tehnologic, însa când influenta este puternica sau când

19

u(t)

z(t)

y(t)

PROCES TEHNOLOGIC

a)

+

+u(t)

z(t)

y(t)

PROCES TEHNOLOGIC

b)

+

+

Fig. 2.2

performantele impuse marimii de iesire sunt de nivel ridicat atunci trebuie luata în considerare si calea prin care se propaga perturbatia spre iesire, cu alte cuvinte este necesar si modelul matematic al caii de zgomot. În acest caz evolutia marimii de iesire poate fi determinata daca se cunosc modelele celor doua cai (de control si de zgomot), semnalul de intrare u(t) si caracteristicile statistice ale zgomotului z(t). Daca perturbatia este un proces aleator cu densitate spectrala rationala, în conformitate cu teorema factorizarii spectrale (vezi anexa 2.3), z(t) poate fi interpretat ca fiind iesirea unui filtru rational stabil si de faza minima la intrarea caruia se aplica zgomot alb e(t) (fig. 2.3).

Daca H(q-1) este functia de transfer discreta a acestui filtru, atunci z(t)=H(q-1)e(t), media si matricea de covarianta a zgomotului alb depinzând de parametrii functiei de transfer discrete H(q-1) (model de zgomot).

H(q–1)

e(t) z(t)

Fig. 2.3

În aceasta situatie, un model cu diferente posibil, în conformitate cu fig.2.2.b, este: (M11) y(t)=G(q-1 ,θ)u(t)+H(q-1,θ)e(t)

cov e(t)=Λ(θ)I Filtrele G(q-1,θ), H(q-1,θ), ca si matricea de covarianta a zgomotului alb sunt functii de vectorul parametrilor θ. Forme particulare ale G(q-1) si H(q-1) conduc la modele particulare. Forma cea mai generala, în conformitate cu fig.2.2.a, este:

M(12) 221

1

1

11 )]t(e[M),t(e

)q(D)q(C

)t(u)q(F)q(B

)t(y)q(A λ=+= −

−

−

−−

care este ilustrata în fig.2.4.

u(t)

e(t)

y(t)B(q-1)F(q-1)

C(q-1)D(q-1)

1

A(q-1)

+

+

Fig.2.4.

20

În acest model polinoamele A(⋅), B(⋅), C(⋅), D(⋅), F(⋅) sunt definite astfel:

nfnf

11

1

ndnd

11

1

ncnc

11

1

nbnb

22

11

1

nana

11

1

qf.....qf1)q(F

qd.....qd1)q(D

qc.....qc1)q(C

qb.....qbqb)q(B

qa.....qa1)q(A

−−−

−−−

−−−

−−−−

−−−

+++=

+++=

+++=

+++=

+++=

vectorul parametrilor fiind: [ ]T

nf1nd1nc1nb1na1 f....f,d....d,c....c,b....b,a....a=θ Comparând (M12) cu M(11) constatam ca:

)q(F)q(A)q(B

)q(G 11

11

−−

−− = si

)q(D)q(A)q(C

)q(H 11

11

−−

−− = .

Existenta polilor comuni (zerourile polinomului A(q-1)) arata faptul ca perturbatia actioneaza undeva în interiorul procesului tehnologic. Daca gradul na al polinomului A(q-1) este zero, atunci cele doua cai sunt complet separate, efectul lor manifestându-se direct asupra iesirii. Cazuri particulare: 1. nc=nd=nb=nf=0. În acest caz modelul: (M13) A(q-1)y(t)=e(t) θ=[a1 ...ana]T

este un model autoregresiv (AR). 2. na=nb=nf=nd=0 - model de medie alunecatoare (MA):

(M14) y(t)=C(q-1)e(t)

θ=[c1 ...cnc]T

3. nb=nf=nd=0 - model autoregresiv si de medie alunecatoare (ARMA):

(M15) A(q-1)y(t)=C(q-1)e(t) θ=[a1 ...ana,c1 ...cnc]T Daca A(q-1) contine factorul (1-q-1) modelul este denumit autoregresiv integrat si de mediei alunecatoare (ARIMA). Astfel de modele sunt utilizate în descrierea perturbatiilor nestationare. 4. nf=nc=nd=0 - model autoregresiv controlat (sau cu marimi exogene) - ARX: (M16) A(q-1)y(t)=B(q-1)u(t)+e(t) θ=[a1 ...ana,b1 ...bnb]T 5. nd=nf=0 - model autoregresiv si de medie alunecatoare cu marimi exogene (ARMAX): (M17) A(q-1)y(t)=B(q-1)u(t)+C(q-1)e(t) θ=[a1 ...ana,b1 ...bnb,c1 ...cnc]T 6. nf=nc=0 - model autoregresiv ARARX:

21

(M18) )t(e)q(D

1)t(u)q(B)t(y)q(A 1

11−

−− +=

θ=[a1 ...ana,b1 ...bnb,c1 ...cnc ]T

Denumirea ARARX se refera la faptul ca perturbatia este modelata ca un proces autoregresiv, iar dinamica sistemului este descrisa de un model

ARX; cu alte cuvinte, daca notam ( ) )t(e)q(D

1tv 1−= , modelul devine :

=

+=−

−−

AR) (model )t(e)t(v)q(D

ARX) (model )t(v)t(u)q(B)t(y)q(A1

11

Avantajul unui astfel de model va fi pus în evidenta în aplicarea metodei celor mai mici patrate generalizate. În cazul multivariabil polinoamele A(q-1), B(q-1), C(q-1), D(q-1) si F(q-1) sunt înlocuite cu polinoame matriceale de dimensiuni corespunzatoare. 2.3. Modele de stare Forma generala a ecuatiilor de stare pentru un sistem liniar continuu determinist multivariabil este urmatoarea:

(M19)

+=+=

)t(Du)t(Cx)t(y)t(Bu)t(Ax)t(x&

în care x(t) este vectorul variabilelor de stare (n/1), y(t) este vectorul iesirilor (ny/1), u(t) este vectorul intrarilor (nu/1), A este matricea sistemului (n/n), B este matricea de distributie (n/nu), C este matricea de iesire (ny/n), D este matricea intrare-iesire (ny/nu). Pentru sistemele care nu au transfer direct intrare-iesire, matricea D este nula, modelul fiind:

M(20)

=+=

)t(Cx)t(y)t(Bu)t(Ax)t(x&

Matricea de transfer se poate obtine, în conditii initiale nule, prin relatia: W(s)=C(sI-A)-1 B.

În cazul discret, modelul de stare devine:

(M21)

=+=+)t(Cx)t(y

)t(Bu)t(Ax)1t(x

iar functia de transfer discreta W(z)=C(zI-A)-1 B. Si într-un caz si în celalalt, matricea de transfer nu este afectata de o transformare liniara a variabilelor de stare, mai mult, ea reprezinta numai partea complet controlabila si complet observabila a sistemului, deci numai partea care poate fi determinata din datele intrare-iesire. Reciproc, pentru o aceeasi caracterizare intrare-iesire (aceeasi matrice de transfer) exista mai multe reprezentari de stare, care difera prin transformari liniare. Cum vectorul parametrilor este alcatuit din elementele matricelor A, B,

22

C rezulta neunicitatea reprezentarii de stare. Desigur, exista transformari care sa conduca la modele de stare cu numar minim de parametri (forme canonice) care sunt identificabile din date intrare-iesire (de exemplu forma companion). În cazul sistemelor stohastice liniar continue , forma generala a ecuatiilor de stare este:

(M22)

++=++=

)t(w)t(Du)t(Cx)t(y)t(v)t(Bu)t(Ax)t(x&

Fata de cazul determinist apar marimile v(t) si w(t) care sunt procese aleatoare independente având valorile medii nule si matricele de covarianta Rv si respectiv Rw . În cazul discret, modelul devine:

(M23)

++=++=+

)t(w)t(Du)t(Cx)t(y)t(v)t(Bu)t(Ax)1t(x

t=0,1,2,..

Ca si în cazul determinist, nu toti parametrii pot fi estimati din datele de intrare-iesire. Prin aducere la forme canonice poate fi redus numarul parametrilor matricelor A, B, C (D=φ în majoritatea cazurilor). Ramâne însa problema reducerii parametrilor ce caracterizeaza perturbatiile. Daca Rv>0 si v(t) si w(t) sunt procese aleatoare cu densitate spectrala rationala, atunci modelele (M22), (M23) pot fi transformate în:

(M24)

+=++=

)t(e)t(xC~

)t(y)t(Ke)t(uB

~)t(xA

~)t(x&

(M25)

+=++=+)t(e)t(xC~)t(y

)t(Ke)t(uB~)t(xA~)1t(x

care sunt numite reprezentari prin inovatii, deoarece e(t) sunt inovatiile marimii de iesire y(t), e(t) este partea nepredictibila, noua, a marimii de iesire care se adauga la partea deductibila prin cunoasterea starii x(t). Modelele (M22), (M23) sunt echivalente cu (M24), (M25) în virtutea teoremei de filtrare a lui Kalman însa reprezentarile (M24), (M25) nu sunt unice în sensul ca exista mai multe matrice K pentru care se obtine echivalenta. Unicitatea se poate obtine impunând restrictia ca matricea (A-KC) sa aiba toate valorile proprii în interiorul cercului unitar, ceea ce asigura stabilitatea filtrului Kalman. În acest caz matricea K poate fi interpretata ca amplificarea stationara a filtrului Kalman asociat modelului (M22).

2.4. Conceptul de identificabilitate Un sistem (S) poate fi descris, asa cum am aratat în paragraful anterior, în mai multe moduri, sau, altfel spus, cu ajutorul diferitelor clase de modele. Fie de exemplu modelul (M2) pentru un sistem liniar continuu si determinist:

.d)(u)t(h)t(yt

τττ−= ∫∞−

În legatura cu acesta se pot formula trei probleme:

23

1. Cunoscând semnalul de intrare u(t) si functia pondere sa se deduca marimea de iesire y(t), ceea ce înseamna de fapt rezolvarea integralei de convolutie. Astfel de situatii apar frecvent în analiza sistemelor. 2. Cunoscând semnalul de iesire si functia pondere sa se deduca semnalul de intrare u(t), care este problema reconstituirii intrarii. Astfel de probleme apar frecvent în comunicatii când semnalul receptionat y(t) nu coincide cu semnalul emis deoarece acesta din urma este deformat de mediul prin care se propaga. Cunoscând modelul de propagare prin mediul respectiv si semnalul receptionat se poate reconstitui semnalul emis (problema deconvolutiei semnalelor). 3. Cunoscând semnalele de intrare si iesire sa se deduca functia pondere. Aceasta este de fapt o problema de identificare care se poate formula indiferent de clasa de modele considerata. Desigur, aceasta ultima problema ne intereseaza în mod deosebit si ea impune inevitabil urmatoarele întrebari: - în ce conditii problema are solutie? - daca problema admite solutie, aceasta este sau nu unica? - în ce masura o solutie gasita (un model) reprezinta sistemul ale carui date de intrare-iesire le-am utilizat în identificare? Raspunsul la primele doua întrebari este strâns legat de clasa de modele aleasa si de proprietatea semnalului de intrare în sistem de a pune în evidenta caracteristicile dinamice ale unui sistem. O clasa de modele este de exemplu (M12), un model din aceasta clasa corespunzând unor indici de structura na, nb, nc, nd, nf precizati. Evident, o clasa de modele are o infinitate de modele, numai unele din ele fiind adecvate sistemului, daca astfel de modele pot fi obtinute. Alegerea clasei de modele este strâns legata de informatiile apriorice asupra sistemului si de scopul modelarii. Daca nu dispunem de informatii apriorice recurgem la ipoteze asupra sistemului pe baza carora alegem modelul, ipoteze care, evident, trebuie verificate. În afara de acesta în alegerea clasei de modele trebuie sa tinem seama si de urmatorii factori: - flexibilitatea modelului în descrierea diferitelor sisteme dinamice; - economicitatea modelului, care consta în capacitatea de a descrie dinamica sistemului, modelul continând un numar cât mai mic de parametri; - complexitatea algoritmilor de estimare a parametrilor modelului. Aceeasi metoda de estimare a parametrilor din datele de intrare-iesire conduce la algoritmi de complexitate diferita, în functie de clasa de modele aleasa. - proprietatile statistice ale estimatorilor parametrilor. Este clar ca nu orice date de intrare-iesire permit determinarea unui model dinamic al unui sistem. De exemplu, daca semnalul de intrare într-un sistem liniar stabil cu parametri constanti este constant, atunci si iesirea este constanta. În acest caz, din datele intrare-iesire nu putem deduce decât un punct de pe caracteristica statica, respectiv factorul de amplificare al sistemului. Pentru a pune în evidenta caracteristicile dinamice este necesar ca intrarea sa

24

aiba o anumita varianta. Capacitatea unui semnal de a pune în evidenta dinamica sistemului este legata de notiunea de persistenta a semnalului, care va fi discutata într-un alt capitol. Trebuie remarcat ca în multe cazuri marimile de intrare în sistemul (procesul tehnologic) în functionare normala nu îndeplinesc aceasta cerinta. În aceasta situatie pentru identificare este necesara aplicarea unor semnale exterioare de proba care au calitatile de persistenta necesare, bineînteles daca sistemul permite aceasta. În ceea ce priveste unicitatea solutiei si ea este legata atât de modelul ales cât si de sistemul de identificat asupra caruia avem sau nu informatii apriorice. Pentru a formaliza problema trebuie sa introducem ipoteze asupra sistemului adevarat, care este de fapt mecanismul generator al datelor de intrare-iesire. Sa presupunem, de exemplu, ca sistemul S este liniar, discret în timp, având ca perturbatie un proces aleator cu densitate spectrala rationala. Atunci el poate fi descris de ecuatia:

(S) ( ) ( )

λ=+=

∗

−∗−∗

I)t(eCovte)q(Htu)q(G)t(y

2

11

având θ* vectorul parametrilor adevarati (coeficientii functiilor de transfer G*(q-1) si H*(q-1)), iar λ*2 dispersia zgomotului alb e(t). Numarul si valorile parametrilor adevarati sunt necunoscute, ca si λ*2 de altfel. Cu aceasta ipoteza este rationala alegerea clasei de modele (M12):

(M) ( ) ( )

λ=+= −−

I)t(eCovte)q(Htu)q(G)t(y

2

11

cu vectorul θ al parametrilor si dispersia λ2 a zgomotului care trebuie determinate din datele de intrare-iesire printr-o anume metoda de estimare. Numarul parametrilor depinde de indicii de structura deci de gradele polinoamelor f.d.t. G(q-1) si H(q-1). Pentru o structura precizata, clasa de modele (M) contine o infinitate de modele, în functie de valorile parametrilor θ, astfel încât este posibil sau nu ca vectorul θ sa coincida cu valorile adevarate θ*. Daca definim multimea valorilor parametrilor modelului pentru o structura precizata astfel:

221111 ),q(H)q(H);q(G)q(G)M,S(D ∗−∗−−∗− λ≡λ≡≡θ=

ea reprezinta acei parametri pentru care structura precizata a modelului reprezinta perfect sistemul. Totusi, în functie de structura, putem avea urmatoarele situatii: 1. D(S,M) este vida. Aceasta înseamna ca pentru structura aleasa a modelului nu putem obtine concordanta perfecta între model si sistem. Se poate spune ca modelul contine prea putini parametri pentru a descrie adecvat sistemul. Un astfel de model se numeste subparametrizat. 2. D(S,M) contine un singur element. Este evident ca acesta este cazul ideal, elementul fiind chiar vectorul valorilor adevarate ale parametrilor.

25

3. D(S,M) contine mai multe elemente. Aceasta înseamna ca exista mai multe modele care dau o descriere perfecta a sistemului. Este cazul în care modelul este mai complicat decât sistemul, altfel spus contine mai multi parametri decât sistemul (model supraparametrizat). De remarcat ca în identificare pot fi luate în considerare toate cazurile posibile, nu numai cazul ideal, luarea unei decizii în acest sens fiind strâns legata de scopul identificarii. Astfel, daca scopul identificarii unui proces tehnologic este determinarea unui regulator PID care sa îmbunatateasca performantele sistemului, este suficient un model de ordinul doi, chiar daca procesul tehnologic, presupus liniar, este în realitate de ordin mai mare.

Exemplul 2.1. Presupunem sistemul (procesul tehnologic) descris de

ecuatiile: (S)

λ=+=

∗∗

∗−∗−∗−∗

I)t(eCov)t(e)q(C)t(u)q(B)t(y)q(A

2

111

∗

∗

∗

∗

∗

∗

−∗−∗−∗

−∗−∗−∗

−∗−∗−∗

+++=

++=

+++=

ncnc

11

1

nbnb

11

1

nana

11

1

qc....qc1)q(C

qb....qb)q(B

qa....qa1)q(A

polinoame presupuse prime între ele (nu au un factor polinomial comun). De asemenea, consideram clasa de modele:

(M)

λ=+= −−−

I)t(eCov)t(e)q(C)t(u)q(B)t(y)q(A

2

111

cu:

nc

nc1

11

nbnb

11

1

nana

11

1

qc....qc1)q(C

qb....qb)q(B

qa....qa1)q(A

−−−

−−−

−−−

+++=

++=

+++=

În acest caz multimea D(S,M) devine:

( )

λ=λ==θ= ∗−

−

−∗

−∗

−

−

−∗

−∗

;)q(A)q(C

)q(A)q(C

;)q(A)q(B

)q(A)q(B

M,SD 1

1

1

1

1

1

1

1

sau, echivalent:

( )

≡≡λ=λθ= −∗

−

−∗

−

−∗

−∗

)q(C)q(C

)q(B)q(B

)q(A)q(A

;M,SD 1

1

1

1

1

1

Daca presupunem na<na*, nb<nb*, nc<nc*, un rationament simplu conduce la contrazicerea faptului ca polinoamele A*, B*, C* ar fi prime între ele. Sirul de egalitati este posibil daca na≥na*, nb≥ nb* si nc≥ nc* sau, echivalent:

n*=min(na-na*, nb-nb*, nc-nc*)≥0. În acest caz este evident ca:

26

)q(L)q(C)q(C

)q(B)q(B

)q(A)q(A 1

1

1

1

1

1

1−

−∗

−

−∗

−

−∗

−

=≡≡

unde L(q)=1+l1q-1+...+lnq-n* este un polinom de grad n* cu coeficienti arbitrari. Sirul de egalitati este echivalent cu sistemul:

=

=

=

−−−

−−−

−−−

)q(L)q(C)q(C

)q(L)q(B)q(B

)q(L)q(A)q(A

11*1

11*1

11*1

ceea ce arata ca în acest caz polinoamele modelului sunt "proportionale" cu cele adevarate. Astfel daca n*>0, exista o infinitate de solutii ale problemei, obtinute pentru diferitele valori ale coeficientilor polinomului L(q-1). Daca n*=0, atunci L(q-1)=1 si problema are solutie unica. Conditia n*=0 arata ca cel putin unul din polinoamele A, B, C are acelasi grad ca polinomul corespunzator al sistemului. În concluzie, pentru un model ARMAX, daca structura este aleasa astfel încât: a) n*<0, atunci multimea D(S,M) este vida; b) n*=0, atunci multimea D(S,M) are un singur element; c) n*>0, atunci multimea D(S,M) are o infinitate de elemente. Consideratii similare se pot face si relativ la alte clase de modele parametrice. Despre neunicitatea solutiei în cazul modelelor de stare am discutat în paragraful anterior. Din cele de mai sus rezulta legatura dintre conceptul de identificabilitate si conceptele de sistem (S), model (M), conditiile experimentale (E) - care se refera de fapt la calitatea datelor de intrare-iesire din sistem - precum si de metoda de estimare a parametrilor (I) sau de solutionare propriu-zisa a identificarii pentru un model de structura data. Daca θ este vectorul parametrilor unui model ales si θ este valoarea acestui vector dedusa din datele de intrare-iesire concrete, este evident ca θ = θ (S,M,I,E,N), adica este functie de sistem, model, metoda de estimare, conditii experimentale si de N care reprezinta volumul datelor experimentale. Definitia 1. Se spune ca un sistem S este sistem identificabil si se noteaza SI(M,I,E) daca:

)M,S(D)N,E,I,M,S( .p.c→θ)

când N→∞ D(S,M) nefiind vida. Daca θ∈D(S,M), atunci el reprezinta acea valoare a parametrilor unui model care descrie exact sistemul. Rezulta din definitie ca un sistem este identificabil daca exista un estimator θ

) care sa convearga în probabilitate la o

valoare care da o descriere exacta a sistemului. Definitia 2. Un sistem S se numeste sigur identificabil (SSI) daca este identificabil oricare ar fi structura modelului M pentru care D(S,M) nu este vida.

27

Definitia 3. Un sistem S se numeste parametric identificabil SPI(M,E,I) daca este sigur identificabil, iar multimea D(S,M) contine un singur element. Importanta unuia sau altuia dintre conceptele enuntate anterior depinde de tipul de aplicatie avut în vedere. Astfel, daca scopul identificarii este proiectarea unui sistem de reglare atunci este suficient ca sistemul sa fie identificabil. Daca se doreste însa determinarea valorilor unor parametri (constante de material, de exemplu), atunci este necesar ca sistemul sa fie parametric identificabil. Bibliografie [1] Söderström T., Stoica P. - System Identification, Prentice Hall, 1989. [2] Tertisco M., Stoica P. - Identificarea si estimarea parametrilor sistemelor,

Ed. Academiei, 1980. [3] Eykhoff P. - Identificarea sistemelor, Editura tehnica, 1977. [4] Astrom J.K. - Introduction to Stochastic Control Theory, Academic Press,

1970. [5] Jazwinski A. - Stochastic Process and Filtering Theory, Academic Press,

1970. [6] Puscasu Gh., Stancu A. – Tehnici de identificare a sistemelor – Teorie si

aplicatii, Matrix Rom – Bucuresti 2001.

28

CAPITOLUL 3

Semnale de intrare

Semnalul de intrare, alaturi de modelul ales si de abordarea problemei de estimare, conditioneaza în mod esential rezultatele oricarui experiment de identificare. Proiectarea si analiza semnalelor de intrare s-au dezvoltat în paralel cu studiul algoritmilor de identificare. Primele proceduri de identificare se bazau pe o aparatura de calcul modesta, tehnicile numerice de prelucrare a datelor experimentale fiind aprioric respinse. În consecinta s-a cautat ca prin aplicarea unor semnale de intrare speciale (de proba) sa se obtina informatii, uneori direct utilizabile, despre proces. De regula, utilizarea unui semnal de proba conduce exclusiv la determinarea unui model neparametric pentru proces, ceea ce constituie un dezavantaj important, modelele neparametrice fiind greu de utilizat în proiectarea unui sistem de reglare. Totusi, de la modelul neparametric se poate face o trecere la unul parametric, desi aceasta schimbare de reprezentare poate amplifica erorile de determinare a modelului neparametric. Dezvoltarea tehnicii de calcul a facut posibila aplicarea unor metode de identificare a caror utilizare nu este conditionata de un tip special de semnal de proba, desi aceasta implica algoritmi relativ complicati. Semnalele de proba utilizate sunt fie deterministe fie aleatoare, fiecare din acestea având avantaje si dezavantaje. Semnalele deterministe reprezinta marimi a caror evolutie în timp este predictibila, întrucât la baza generarii lor stau legi deterministe. Precizia metodelor care folosesc semnale de proba deterministe este conditionata în mare masura de prezenta perturbatiilor care se suprapun peste raspunsul la semnalul de proba aplicat. Aceasta dificultate a condus la adoptarea tot mai frecventa a semnalelor de proba aleatoare si a metodelor de masurare si de prelucrare ale acestora. Principial metodele de identificare cu semnale aleatoare se bazeaza pe masurarea functiilor de corelatie sau a functiilor de densitate spectrala, care permit deducerea unui model al procesului. Prin tehnicile de corelatie se elimina efectele perturbatiilor, semnalele de proba nefiind corelate cu acestea. Semnalele aleatoare pot fi usor suprapuse peste marimile curente din functionarea normala a procesului, cu conditia ca media lor sa fie nula si dispersia suficient de mica pentru a nu deranja functionarea normala. Totusi, generarea semnalelor aleatoare de tipul zgomotului alb este dificila, preferându-se semnalele de tipul celor pseudoaleatoare binare care permit utilizarea avantajoasa a tehnicilor numerice. În cele ce urmeaza vom trece în revista modurile de descriere matematica ale semnalelor deterministe si aleatoare, insistând asupra acelora care sunt frecvent utilizate în diferitele tehnici de identificare.

3.1. Descrierea matematica a semnalelor deterministe

Baza modelarii si estimarii parametrilor consta în descrierea matematica a relatiilor dintre unele functii de timp (seturi de date), de intrare si de iesire din proces. La alegerea tipului de descriere care se va folosi pentru semnale trebuie

29

sa tinem seama de doua aspecte ale reprezentarii lor si anume: - expunerea atributelor purtatoare de informatii ale semnalelor; - procurarea mijloacelor pentru studierea proprietatilor de transfer ale proceselor. Semnalele care intervin în procedurile de identificare pot fi continue sau esantionate. Aceasta se refera la reprezentarea informatiei în functie de timp. În numeroase situatii esantionarea semnalelor este utila atunci când procesul de informare este intermitent sau când se foloseste o alocare de timp pentru un canal de informatie. Prin esantionare se genereaza, dintr-o functie de timp x(t), o secventa de valori esantionate care pot fi reprezentate ca vector:

f[t]=[x[1],x[2],...x[N]]T Problema aproximarii semnalelor intervine în situatii de o mare diversitate, multitudinea formularilor si metodelor de rezolvare asociate constituind o reflectare directa a acestei diversitati. În aplicatiile de calcul sunt cunoscute doar valorile esantionate corespunzatoare. Pentru a sintetiza informatia asupra semnalului esantionat si a o putea utiliza eficient în calcule, se impune aproximarea lui printr-un model (functie continua), ),t(f θ , care depinde în general de un numar de parametri ajustabili, cuprinsi în vectorul θ . Forma functiei ),t(f θ si valorile parametrilor θ trebuie determinate astfel încât semnalul discret f[t] sa fie aproximat optim într-un anumit sens. Alegerea formei concrete a modelului este o problema netriviala si ea trebuie sa aiba la baza o fundamentare riguroasa. Pentru a putea determina practic valorile optime ale parametrilor modelului trebuie definita o functionala care sa reflecte gradul în care modelul selectat aproximeaza semnalul esantionat f[t] pentru o alegere particulara a parametrilor. O masura sugestiva a abaterii modelului fata de semnalul esantionat este data de distanta dintre cele doua functii, )).,t(f),t(f(d θ Definitia 1. O functie reala f(t) definita pe [a,b] este de patrat in tegrabil pe [a,b] daca exista integrala:

dt)t(fba

2∫ .

Multimea functiilor de patrat integrabil se noteaza L2. Norma unei functii f(t)∈L2 pe intervalul [a,b] este, prin definitie:

∫∆

=b

a

2 dt)t(f)t(f .

Definitia 2. Daca f(t)∈L2 si g(t)∈L2 atunci integrala:

( ) dt)t(g)t(fg,fb

a∫∆

=

se numeste produs scalar sau produsul interior al functiilor f(t) si g(t). Definitia 2 poate fi generalizata prin includerea unei functii de ponderare reale continue nenegative, p(t), obtinând:

( ) dt)t(p)t(g)t(fg,f ba∫

∆=

Pe baza notiunii de produs scalar se poate defini o distanta între functiile

30

f(t) si g(t) , de forma:

( ) ( )∫ −=−−=−=∆

ba

2dt)t(g)t(fgf,gf)t(g)t(f))t(g),t(f(d Aproximarea pe baza acestei distante este numita aproximare în medie patratica si este utilizata în doua dintre cele mai importante metode de modelare a functiilor esantionate : interpolare si regresie. Daca valorile esantionate N,1i]i[x = sunt considerate exacte (neafectate de erori), este firesc sa se impuna anularea distantei functiilor f[t] si f(t,θ), adica:

0)),t(f],t[f(d =θ Aceasta revine la determinarea unui model, apartinând unei anumite clase, care în punctele esantionate sa ia aceleasi valori ca semnalul modelat:

[ ] N,1t],t[x,tf ==θ Un astfel de model poarta denumirea de functie de interpolare sau interpolant, iar procedeul se numeste interpolare. Daca argumentele pentru care

se evalueaza interpolantul se afla în afara intervalului N,1 procedeul se numeste extrapolare. Daca valorile esantionate provin din observatii, ele sunt în general afectate de erori de masura, imprecizia fiecarei valori fiind specificata, de obicei, prin deviatia standard asociata. În astfel de cazuri, modelul este cu atât mai bun cu cât sunt mai elaborate considerentele pe baza carora i s-a stabilit forma (cu cât modelul este mai putin empiric). Având în vedere imprecizia datelor, nu este de asteptat ca modelul sa interpoleze valorile esantionate (chiar daca acest lucru este teoretic posibil) si este deci firesc sa se impuna minimizarea distantei

)),t(f],t[f(d θ în raport cu valorile parametrilor si nu anularea ei riguroasa ca în cazul interpolarii, adica:

min)),t(f],t[f(d =θ Practic, aceasta revine la determinarea parametrilor θ ai modelului, apartinând unei anumite clase, care minimizeaza suma abaterilor patratice ale modelului fata de valorile masurate:

( ) ( )( ) dt,tf)t(xminargVminargˆ2b

a∫ θ−=θ=θθθ

(1)

Acest procedeu se numeste regresie sau ajustare prin metoda celor mai mici patrate. Functionala V(θ) se numeste functie de merit a procesului de ajustare. Cresterea fara justificare teoretica clara a numarului de parametri ai modelului în ideea descrierii cât mai exacte a datelor nu face modelul "mai bun" chiar daca reduce valoarea functiei de merit si poate conduce la aparitia unor fenomene numerice greu de controlat.

Aproximarea continua în sensul celor mai mici patrate În cazul regresiei liniare se pune problema ajustarii în raport cu setul de valori masurate a unui model care se prezinta ca o combinatie liniara a unor functii arbitrare de t:

( ) [ ]m10T

m

0iii a...aa;)t(Fa,tf =θ=θ ∑

=

(2)

31

Caracterul liniar al modelului se manifesta numai în raport cu cei m+1 coeficienti ai, care intervin ca parametri ai combinatiei liniare. Functiile Fi(t), numite si functii de baza, au forma fixa, în sensul ca nu depind de parametrii modelului, si pot fi neliniare în raport cu t. Ca exemple concrete de functii de baza se pot mentiona functiile i

i t)t(F = , care stau la baza regresiei polinomiale. Ca parametri optimi ai modelului sunt considerati acei parametri care minimizeaza functia de merit, conditiile de minim fiind exprimate de anularea derivatelor functiei V(θ) în raport cu parametrii ai:

( )

.0dt)t(F )t(Fa)t(x2a

a,...,aaVk

b

a

m

0iii

k

m10 =

−−=

∂∂

∫ ∑=

(3)

Rearanjând termenii se obtine asa-numitul sistem de ecuatii normale al problemei de ajustare multiliniara:

∑ ∫∫=

==m

0i

b

ak

b

akii m,0k,dt)t(F)t(xdt)t(F)t(Fa (4)

care are ca solutie parametrii optimi ai modelului. Observatii: 1. Metoda celor mai mici patrate poate fi aplicata în principiu pentru ajustarea oricarui model, dar conduce în general la sisteme de ecuatii neliniare pentru determinarea parametrilor modelului. În asemenea cazuri procedeul se numeste regresie neliniara, iar algoritmii de rezolvare corespunzatori prezinta un grad de complexitate relativ ridicat. Spre deosebire de cazul regresiei liniare, unde determinarea parametrilor modelului se efectueaza într-un singur pas prin rezolvarea unui sistem de ecuatii liniare, în cazul regresiei neliniare procedeul rafineaza iterativ parametrii modelului pornind de la un set de valori initiale. 2. Sistemul de ecuatii normale poate fi exprimat si cu ajutorul notiunii de produs scalar, definita anterior :

( ) ( ) ( ) ( )( ) ( ) ( ) ( )

( ) ( ) ( ) ( )

=+++

=+++

=+++

mmmm1m10m0

1m1m111010

0m0m101000

F,xF,Fa......F,FaF,Fa........................

F,xF,Fa......F,FaF,Fa

F,xF,Fa......F,FaF,Fa

(5)

3. Sistemul normal este simetric, produsele scalare fiind comutative, dar în general rau conditionat. De aceea se prefera aducerea acestuia la forme particulare prin utilizarea de functii ortogonale. Mai mult, utilizarea functiilor ortogonale permite obtinerea directa a solutiilor sistemului normal. Definitia 3. Un sir finit de functii de patrat integrabil pe [a,b],

( ) n,0ii t =ϕ , se numeste ortogonal pe [a,b] daca:

=>λ=ϕ≠

=ϕϕ=ϕϕ ∫ ji0ji0

dt)t()t(),(i

2

ij

b

a iji

Daca toti λi=1, atunci sistemul ( ) n,0ii t =ϕ se numeste sistem ortonormat.

32

Orice sistem ortogonal poate fi normat prin raportarea functiilor la norma corespunzatoare astfel încât sistemul

n,0iii )t()t(=

ϕϕ . este ortonormat.

Definitia 4. Un sistem de functii de patrat integrabil ( ) n,0ii t =ϕ este ortogonal pe [a,b] cu ponderea p(t) daca:

=>λ≠

=ϕϕ=ϕϕ ∫ ji0ji0

dt)t(p)t()t(),(i

j

b

a iji

Definitia 5. Dat fiind un sistem ortogonal de functii ( ) n,0ii t =ϕ si o

functie f(t)∈L2 pe [a,b], atunci numerele:

( )∫

∫ϕ

ϕ=

ϕ

ϕ=

ba

2i

ba i

2i

ii

dt)t(

dt)t()t(f

)t(

)t(),t(fC

se numesc coeficienti Fouriér ai functiei f(t) în raport cu sistemul ( ) n,0ii t =ϕ . Daca sistemul este ortonormat atunci coeficientii Fouriér sunt Ci=(f(t),ϕ i(t)). Daca un semnal oarecare x(t) este aproximat printr-o combinatie liniara finita de functii ortogonale, în sensul minimizarii erorii medii patratice

∑=

ϕ=θ≅m

0iii )t(C),t(f)t(x (6)

atunci, tinând cont de proprietatile functiilor ortogonale (Definitiile 3, 4), sistemul de ecuatii normale (5) devine un sistem diagonal:

.

( ) ( )( ) ( )

( ) ( )

ϕ=ϕϕ

ϕ=ϕϕ

ϕ=ϕϕ

mmmm

1111

0000

,x,C........................

,x,C

,x,C

(7)

având ca solutii coeficientii Fouriér ai functiei f(t) în raport cu sistemul ( ) n,0ii t =ϕ .

( )∫

∫ϕ

ϕ=

ϕ

ϕ=

ba

2i

ba i

2i

ii

dt)t(

dt)t()t(x

)t(

)t(),t(xC (8)

De observat ca valoarea lui iC nu depinde de m, deci de numarul functiilor ortonormate din setul utilizat. În consecinta, o îmbunatatire a aproximatiei prin numarul de functii nu modifica coeficientii determinati anterior. Evident ca si atunci când parametrii modelului sunt tocmai coeficientii Fouriér ai semnalului x(t) în raport cu sistemul ortogonal de functii, eroarea medie patratica de aproximare este minima. Eroarea medie patratica (1) poate fi exprimata si cu ajutorul produsului scalar utilizat:

33

( ) ( )( ) ( )

0))t(C,)t(C())t(C,x(2)x,x(

)f,f()f,x(2)x,x(fx,fxdt,tf)t(xVm

0iii

m

0iii

m

0iii

2b

a

>ϕϕ+ϕ−=

=+−=−−=θ−=θ

∑∑∑

∫

===

(9)

Tinând seama de proprietatile de ortonormalitate a functiilor ϕ i(t) si de definitia coeficientilor Ci , minimul erorii medii patratice este:

( ) 0Cdt)t(xC))t(,x(C2)x,x(Vm

0i

2i

b

a

2m

0i

2ii

m

0ii >−=+ϕ−=θ ∑∫∑∑

===

(10)

sau

∑∫=

≥m

0i

2i

b

a2 Cdt)t(x (Inegalitatea lui Bessel) (11)

Prin generalizare, daca aproximarea se face cu o serie de functii ortonormale

∑∞

=

ϕ=0i

ii )t(C)t(x (12)

eroarea medie patratica tinde la zero, si în consecinta:

∑∫∞

==

0i

2i

b

a2 Cdt)t(x (Egalitatea lui Parseval). (13)

Aproximarea discreta în sensul celor mai mici patrate Metodologia de aproximare prezentata nu poate fi utilizata decât atunci când se cunoaste expresia analitica a semnalului x(t). În aproximarea discreta în sensul celor mai mici patrate, însa, semnalul este cunoscut prin valorile esantionate. În aceste conditii, produsul scalar si norma se definesc:

( ) ∑=

∆=

N

1t]t[p]t[g]t[fg,f (14)

respectiv

∑=

∆=

N

1t

2 ]t[p]t[f)t(f (15)

Si în acest caz aproximarea discreta în sensul celor mai mici patrate exista si este unica, de forma:

( )

∑

∑

=

=

ϕ

ϕ=

ϕ

ϕ= N

1t

2i

N

1ti

2i

ii

]t[p]t[

]t[p]t[]t[x

)t(

)t(),t(xC (16)

Pornind de la un set independent de functii de baza ]t[F],....t[F],t[F m10 totdeauna se poate dezvolta un set de functii ortogonale ]t[],....t[],t[ m10 ϕϕϕ prin utilizarea algoritmului de ortogonalizare Gramm-Schmidt.

Forma generala a functiilor ortogonale este: ])t[h......]t[h]t[h(]t[F]t[ 00,i2i2i,i1i1i,iii ϕ++ϕ+ϕ−=ϕ −−−− (17)

34

Determinarea succesiva a scalarilor j,ih se face astfel încât fiecare

functie ]t[iϕ sa fie ortogonala pe ]t[],....t[],t[ 1i10 −ϕϕϕ . Pentru a stabili relatiile de calcul al coeficientilor ponderali j,ih , se înmulteste relatia (17) cu polinomul

]t[jϕ , se sumeaza si, tinând cont de conditia de ortogonalitate, se obtine:

1i,0j;]t[

]t[]t[Fh

N

1t

2j

N

1tji

j,i −=ϕ

ϕ−=

∑

∑

=

= (18)

În acest fel, daca se considera ]t[F]t[ 00 =ϕ , în baza relatiilor (17)-(18), se poate dezvolta, recurent, un set de functii ortogonale folosindu-se datele experimentale disponibile. Seturi uzuale de functii ortogonale utilizate în aproximarea semnalelor Dupa cum am vazut, notiunile de ortogonalitate si ortonormalitate pot fi extinse prin introducerea unei functii de ponderare. Aceasta ofera posibilitatea de a accentua într-un fel predeterminat contributiile la eroarea medie patratica. O familie de functii ortogonale, Qi(t), se defineste în mod unic în raport cu un interval de ortogonalitate [a,b] si o functie pondere. În acest fel, o functie f(t) poate fi dezvoltata într-o serie de functii ortogonale de forma:

∫

∫∑ ==

∞

=b

a

3i

b

ai

i0i

ii

dt)t(p)t(Q

dt)t(p)t(Q)t(fC;)t(QC)t(f (19)

Daca seria este rapid convergenta atunci functia se poate aproxima printr-o dezvoltare limitata:

;)t(QC)t(fm

0iii∑

=

≅ (20)

Analiza semnalului presupune exprimarea acestuia sub forma (20). Sunt cunoscute numeroase functii ce satisfac conditia de ortogonalitate, utilizabile în analiza semnalelor (Legendre, Laguerre, Hermite, Cebâsev etc). O astfel de analiza este denumita uneori analiza Fouriér, cu precizarea suplimentara a tipului de functii folosite. De exemplu analiza Fouriér-Legendre este de fapt o analiza polinomiala, efectuata cu ajutorul polinoamelor ortogonale Legendre. Functiile ortogonale satisfac un numar de relatii generale având aceeasi forma. Una din cele mai importante relatii din aceasta categorie este ecuatia diferentiala de ordin doi a carei solutie sunt functiile ortogonale : 0)t(Qh)t(Q)t(g)t(Q)t(g nn

)1(n1

)2(n2 =++ (21)

unde g2(t), g1(t) sunt independente de n iar hn este o constanta care depinde numai de n. În tabelul 3.1 sunt date seturi de functii ortogonale si functiile de ponderare corespunzatoare frecvent utilizate în aproximarea semnalelor.

35

Tabelul 3.1

Denumire

Interval Functia pondere

Expresie functie

g2(t)

g1(t)

hn

Legendre

-1≤t≤1

1 ( ) ( )n2

n

n

nn 1tdtd

2!n1

tP −=

2t1−

t2−

)1n(n +

Cebâsev

-1≤t≤1 2t1

1

−

( ) ( )tcosncostT 1

n−=

2t1 −

t−

2n

Laguerre

0≤t<∞

e-t ( ) ( )tn

n

nt

n etdtd

e!n

1tL −=

t

t1 −

n

Hermite

t ∈R

2te− ( ) 22 t

n

nt

n edtd

etH −= 1

t2−

n2

Alta relatie generala satisfacuta de functiile ortogonale, deosebit de importanta pentru evaluarea acestora în aplicatiile de calcul, este relatia de recurenta în raport cu ordinul n: ( ) )t(Qd)t(Qtcb)t(Qa 2nn1nnnnn −− −+= (22) Cunoscând expresiile (de obicei simple) ale functiilor Q0(t) si Q1(t), prin aplicarea succesiva a relatiei de recurenta (22) se obtine expresia analitica a functiei Qn(t). În tabelul 3.2. sunt prezentate valorile specifice ale coeficientilor relatiei de recurenta precum si expresiile asociate functiilor de ordin zero si unu. Ortonormalizarea seturilor de functii ortogonale se poate realiza cu ajutorul patratului normei, λn.

Tabelul 3.2 Denumire an bn cn dn Q1(t) Q0(t) λn

Legendre

n

0

1n2 −

1n −

t

1 1n2

2+

Cebâsev

1

0

2

1

t

1

0n, =π

0n,2

≠π

Laguerre n 1n2 − 1− 1n − t1 − 1 1 Hermite 1 0 2 )1n(2 − t2 1 !n2 nπ

Observatii: 1. Valorile unei functii ortogonale pentru argumentul t=ζ se poate determina cu ajutorul expresiei analitice. Totusi, datorita cresterii rapide a complexitatii expresiilor cu cresterea gradului, în cele mai multe situtii aceasta cale nu este recomandabila. Mult mai eficienta este, în schimb, propagarea valorilor numerice ale functiilor implicate cu ajutorul relatiilor de recurenta.

36

În acest caz, calculele presupun urmatorii pasi: - se evalueaza ( )ζ1Q si ( )ζ0Q

- pentru n,2i = se aplica relatia de recurenta

( )( ))(Qd)(Qcba1

)(Q 2ii1iiii

i ζ−ζζ+=ζ −−

2. Pentru analiza unui semnal definit pe intervalul [c,d] se poate utiliza un set de functii definite pe intervalul de ortogonalitate [a,b] reducând intervalul de ajustare la [a,b] printr-o schimbare liniara de variabila.

Analiza spectrala a semnalelor deterministe. Consideratii energetice. Dupa cum s-a vazut, semnalele deterministe cu caracter general pot fi descrise matematic prin dezvoltarea într-un set de functii ortogonale )t(),.....t(),t(),t( n210 ϕϕϕϕ . În acest fel, analiza unui semnal x(t), definit pe intervalul [a,b], consta în descompunerea acestuia într-o suma de semnale elementare de forma:

Nn ,)t(a)t(xn

0iii ∈ϕ= ∑

= (23)

Totalitatea semnalelor elementare, n,0ii )t( =ϕ , constituie spectrul semnalului x(t). Coeficientii ai reprezinta amplitudinile componentelor spectrale

)t(iϕ ; ei pot fi reprezentati ca în figura 3.1, obtinându-se astfel spectrul de amplitudini al semnalului.

0a

1a

2a

3a

4a

5a6a

Fourier iCoeficient

)t(x

ordin Fig.3.1

Analiza unui semnal se reduce la determinarea spectrului atunci când este dat semnalul x(t). Sinteza consta în deducerea semnalului x(t) atunci când este cunoscut spectrul sau. Din punct de vedere matematic, sinteza se reduce la efectuarea sumei din membrul drept al relatiei (23). În cadrul sistemelor liniare analiza spectrala a semnalelor permite simplificarea problemelor de calcul al raspunsului sistemelor la semnale de o forma oarecare, x(t), figura 3.2:

x(t) y(t)Sistem liniar

Fig.3.2

37

• se aleg functiile elementare f i(t) astfel încât determinarea raspunsului la semnalul aif i(t) sa se faca usor; • se echivaleaza raspunsul circuitului la semnalul x(t), prin sumarea raspunsurilor partiale, determinate separat, pentru fiecare componenta spectrala

)t(a iiϕ . Se obtine astfel spectrul raspunsului. Daca se doreste deducerea formei raspunsului y(t), se rezolva o problema de sinteza. Relatia (23) cuprinde, de fapt, doua modalitati de reprezentare a aceluiasi semnal; membrul stâng al relatiei exprima semnalul în domeniul timp, adica forma x(t) a acestuia, iar membrul drept conduce la reprezentarea spectrala a semnalului. O problema de mare importanta este aceea a modului în care amplitudinile depind de ordinul n. Atât în domeniul temporal cât si în domeniul spectral intervin aproximari. Într-adevar, reprezentarea temporala rezulta printr-un proces de modelare (idealizare, simplificare) a semnalului real; în domeniul spectral se neglijeaza, de regula, componentele cu amplitudini mic i. Chiar daca se accepta ca reprezentarea temporala este exacta si ca nu se fac neglijari în domeniul spectral, ramâne deschisa problema corectitudinii corespondentei dintre valorile pe care le capata cei doi termeni ai egalitatii (23), la un moment oarecare t. Se spune ca functiile ortogonale )t(iϕ constituie un sistem complet daca eroarea V tinde spre zero când n→∞. Pentru acest caz se obtine egalitatea Parseval:

∑∫∞

=

λ=0i

2ii

b

a

2 adt)t(x (24)

Daca semnalul x(t) este o tensiune sau un curent, marimea din primul membru al relatiei (24) reprezinta energia cedata de semnal unei rezistente de 1 Ω, în intervalul t∈[a,b]. Puterea mediata pe acelasi interval de timp este:

∑∫∞

=

λ−

=−

=0i

2ii

b

a

2 aab

1dt)t(x

ab1

P (25)

În general puterea semnalului se obtine printr-o sumare patratica a amplitudinilor componentelor spectrale, ponderate cu coeficientii iλ ; fiecare componenta contribuie cu o putere proportionala cu patratul amplitudinii sale. Spectrul semnalului are caracter discret. În concluzie, conform relatiei (25), puterea calculata în domeniul timp este proportionala cu cea calculata în domeniul frecventa, alegerea domeniului facându-se dupa criteriul simplitatii calculelor. Semnalele reale sunt caracterizate prin puteri finite (în caz contrar semnalul ar trebui generat de o sursa de putere infinita) ceea ce înseamna ca nici una dintre componentele spectrale nu poate sa aiba amplitudine infinita. Deoarece numarul de componente spectrale este infinit se deduce ca numai un numar finit de componente au amplitudini finite, restul amplitudinilor fiind nule.

38

Altfel, daca un numar infinit de componente ar avea amplitudini finite, nenule, puterea semnalului ar fi infinita. Rezulta ca foarte multe componente pot fi considerate ca neglijabile din punct de vedere energetic. Dupa neglijarea componentelor neimportante, se echivaleaza semnalul cu o suma finita de componente spectrale. Procedând astfel, se pierde ceva din exactitatea corespondentei dintre reprezentarile spectrala si temporala ale semnalului. Este greu sa se aprecieze aceasta pierdere într-un caz general.

Analiza Fourier a semnalelor continue periodice, de perioada T Dezvoltarile de tipul (23) exprima semnalul, exact sau aproximativ, într-un interval de timp precizat (intervalul de ortogonalitate). În afara acestui interval exista, în general, mari deosebiri între semnalul analizat si suma de functii prin care se face analiza. Daca însa semnalul este periodic, rezultat prin multiplicarea domeniului de ortogonalitate, T, (figura 3.3), aproximarea prin functii ortogonale se face cu o precizie suficient de mare.

T 2T-2T -T 0

x tT ( )

t

interv.ortogonalitate interv.ortogonalitate interv.ortogonalitate interv.ortogonalitate Fig.3.3

Dintre dezvoltarile polinomiale reprezentarea Fouriér este cea mai cunoscuta. Alegerea acestui sistem de functii ortogonale face posibila evidentierea în mod practic a liniilor spectrale armonice. Semnalul x(t) continuu pe [0,T], de perioada T, x t x t T( ) ( )= + , si satisfacând conditiile lui Dirichlet, se poate dezvolta în serie Fouriér, sub forma

( )T2

;tisinbticosaa)t(x 01i

0i0i0

π=ωω+ω+= ∑

+∞

=

(26)

unde setul de functii ortogonale este ,......t2sin,t2cos,tsin,tcos,1)t( 0000i ωωωω=ϕ (27) iar coeficientii Fouriér au valorile

∫ ∫∫ ω=ω==T

0

T

00i0i

T

00 .dt)tisin()t(x

T2

b,dt)ticos()t(xT2

a;dt)t(xT1

a (28)

În intervalul [0,T], asociat fundamentalei T20 π=ω , functiile sunt ortogonale, deci:

0dt)tncos()tmsin(T

000 =ωω∫

≠=

≠=ωω∫ 0nm,2T

0=n=n sau mm0dt)tnsin()tmsin(

T

000 (29)

39

≠=

≠=ωω∫

0nm2T0m=n= T

nm 0dt)tncos()tmcos(

T

000

Deoarece ,2T

,T i0 =λ=λ atunci prin particularizarea expresiei (16) se

obtin expresiile coeficientii Fouriér din relatia (28). Seria Fourier (26) poate fi pusa si sub forma cosinusoidala:

( )[ ]∑∞

=

ϕ+ω+=1i

i0i0 ticosca)t(x (30)

unde i

ii

2i

2ii a

btg ;bac −=ϕ+=

Termenul ( )i0i ticosc ϕ+ω din analiza armonica a functiei periodice x(t) exprima armonica de ordinul i având pulsatia 0i iω=ω .

c0

c1

c2

c3

c4

c5c6

ci

.......

ω 2ω 3ω 4ω 5ω iω

ω

0 Fig.3.4

Valorile c1, c2,.....c i,.... ale amplitudinilor semnalului periodic alcatuiesc spectrul de amplitudini. Figura 3.4 sugereaza faptul ca începând de la o anumita valoare a lui i, amplitudinile componentelor armonice, de pulsatie ωi =iω0 , sunt foarte mici. Aceasta proprietate a spectrului este justificata pe baza lemei Riemann, potrivit careia:

0dttsin)t(xlimdttcos)t(xlimb

a

b

a

=ω=ω ∫∫ ∞→ω∞→ω (31)

În concluzie, coeficientii ci capata valori nesemnificative când i devine suficient de mare. Intervalul în care se afla componentele neneglijabile reprezinta largimea de banda de frecventa a semnalului. Prin neglijarea componentelor spectrale din exteriorul benzii de frecventa a semnalului puterea semnalului nu este afectata semnificativ, fiind astfel acceptata echivalenta din punct de vedere energetic. În domeniul timp, semnalul periodic analizat x(t) este echivalat cu o suma de m componente armonice semnificative, seria infinita transformându-se într-o serie trunchiata:

40

[ ] [ ]∑∑=

∞

=

ω+ω+≅ω+ω+=m

1kkkkk0

1i0i0i0 tsinbtcosaatisinbticosaa)t(x (32)

Seria Fourier (26) poate fi exprimata, de asemenea, si sub forma complexa

[ ] [ ]∑∑∞

=

ω∞

−∞=

ω ==0p

tjppc

p

tjppc

00 ecec21

)t(x (33)

unde amplitudine complexa se determina cu relatia:

dte)t(xT2

jbaeccT

0

tjppp

jppc

0p ∫ ω−ϕ =−== (34)

Pentru un semnal periodic oarecare (care nu este par sau impar), coeficientii Fouriér ap si bp sunt diferiti de zero, asa încât spectrul acestui semnal contine atât linii spectrale reale cât si imaginare.

Analiza Fouriér a semnalelor continue neperiodice Transformarile integrale ale functiilor au început sa fie studiate în mod sistematic la începutul secolului XIX; ideea principala a fost aceea de a transforma unele operatii de analiza (integrare, derivare etc) în operatii algebrice (algebrizarea ecuatiilor integro-diferentiale). Calculul operational a cunoscut o dezvoltare deosebita atât în privinta fundamentarii sale teoretice cât si în largirea gamei sale de aplicatii. Ecuatiile fizicii matematice ale câtorva probleme de elasticitate, de teoria vibratiilor si teoria undelor, ca si unele probleme de control automat utilizeaza în mod curent diverse tipuri de transformari integrale si tehnici de calcul operational. În general, fiecare tip de transformare integrala este legat de o anumita clasa de functii, ceea ce aduce dificultati în respectarea rigorii matematice. Pe lânga proprietatile de calcul, transformarile utilizate au calitatea extrem de importanta de a putea fi inversate. Astfel, transformata Laplace stabileste o corespondenta între domeniul timp si planul complex, dupa cum transformata Fouriér realizeaza o corespondenta între domeniile timp si frecventa, iar inversarea face ca anumite probleme sa poata fi rezolvate în domeniul cel mai convenabil din punct de vedere matematic. S-au conceput si alte tipuri de transformari integrale (Mellin, Carson, Hilbert). Pentru semnalul x(t) transformata integrala este data de relatia:

∫+∞

∞−

λ=λ dt),t(f)t(x)(X (35)

în care functia nucleu f(t,λ) trebuie astfel aleasa încât sa existe o functie f-1(t,λ) care sa permita transformarea inversa [1], [2]:

∫+∞

∞−

− λλλ= d)t,(f)(X)t(x 1 (36)

Pentru transformata Laplace sunt valabile relatiile

st11st ej2

1)s,t(f),t(f;e)s,t(f),t(f

π==λ==λ −−−

unde s=σ+jω reprezinta o frecventa complexa.

41

Printr-o particularizare a transformatei Laplace, trecând de la frecventa complexa s=σ+jω la frecventa imaginara jω, se obtin relatiile de transformare Fouriér:

tj11tj e21

)j,t(f),t(f;e)j,t(f),t(f ω−−ω−

π=ω=λ=ω=λ

adica:

∫+∞

∞−

ω−=ω dte)t(x)j(X tj (37)

∫+∞

∞−

ω ωωπ

= de)j(X21

)t(x tj (38)

Din punct de vedere matematic transformata Fouriér, definita de relatia (37), pune numeroase probleme legate de existenta integralei între limite infinite. De aceea se accepta ca transformata Fouriér sa fie definita euristic printr-un proces de trecere la limita, semnalul neperiodic x(t) fiind considerat un caz particular al functiilor periodice cu perioada care tinde spre infinit:

∫−

ω−

∞→=ω

2T

2T

dte)t(xlim)j(X tj

T (39)

La limita, când T→∞, dezvoltarea devine valabila pentru toate valorile t∈(-∞,+∞), iar distanta dintre doua linii spectrale consecutive tinde catre zero (rezolutia ∆ω→0 ) si spectrul discontinuu (corespunzator functiilor periodice) se transforma în spectru continuu (corespunzator functiilor neperiodice). În acest fel se constata ca dupa cum un semnal continuu periodic oarecare se poate descompune în serie Fouriér si are un spectru de frecventa discret neperiodic (ω0, 2ω0 , 3ω0, ...) tot astfel si un semnal continuu neperiodic este echivalent cu transformata Fouriér inversa, relatia (38), si are un spectru de frecventa continuu neperiodic, continând în general toate frecventele posibile. În concluzie, în privinta dualitatii reprezentarii timp-frecventa a unui semnal continuu se disting doua cazuri: • un semnal continuu neperiodic în domeniul timpului are o reprezentare continua neperiodica în domeniul frecventelor. Legatura între domeniile de reprezentare este stabilita de transformatele Fouriér (37)-(38). În acest caz se poate vorbi despre componente spectrale numai în urma discretizarii spectrului continuu. • un semnal continuu periodic în domeniul timpului are o reprezentare discreta neperiodica în domeniul frecventelor. Legatura între domeniile de reprezentare este stabilita de seria complexa Fourier (33)-(34). Observatii: 1. Daca se efectueaza substitutia ω=2πf atunci relatiile (37)-(87) capata formulari mai practice:

( ) ∫+∞

∞−

π−= dte)t(xjfX ft2j (40)

42

∫+∞

∞−

π= dfe)jf(X)t(x ft2j (41)

2. Transformata Fouriér are o serie de proprietati de calcul remarcabile [3]. O importanta deosebita pentru analiza si sinteza semnalelor si sistemelor prezinta urmatoarele teoreme: a. Teorema deplasarii în domeniul timp )j(Xe)t(xF j ω=τ− ωτ− b. Teorema deplasarii în domeniul frecventa ( )0

tj jjX)t(xeF 0 ω+ω=ω− c. Teorema convolutiei în domeniul timp

Daca ∫∫∞

∞−

∞

∞−

τττ−=ττ−τ=⊗ d)(y)t(xd)t(y)(x)t(y)t(x

atunci )j(Y)j(X)t(y)t(xF ωω=⊗ d. Teorema convolutiei în domeniul frecventa

Daca ∫∫∞

∞−

∞

∞−

−ωπ

=−ωπ

=ω⊗ω dq)jq(Y)jqj(X21

dq)jqj(Y)jq(X21

)j(Y)j(X

atunci )t(y)t(x)j(Y)j(XF 1 =ω⊗ω− e. Teorema dualitatii timp-frecventa Daca )j(X)t(xF ω= atunci )j(x2)t(XF ω−π= Pe baza teoremei dualitatii se pot gasi dualele unor transformate Fouriér uzuale, ca de exemplu : ( ) )j(2t1F)j(1)t(F ω−πδ=→ω=δ Daca se tine cont si de teorema deplasarii în frecventa atunci spectrul de frecventa al semnalului periodic x(t), dezvoltat în seria Fouriér (33), poate fi exprimat sub forma:

[ ] ( )∑∑∞

−∞=

∞

−∞=

ω ω−ωδπ=

==ωn

0pcp

tjppc jpjcec

21

F)t(xF)j(X 0 (42)

Aceasta relatie, în care s-a folosit "functia δ periodica", evidentiaza suma tuturor liniilor spectrale din reprezentarea simetrica a spectrului, adica pentru frecvente variind în intervalul (-∞ ,+∞). Conditiile de existenta a transformatei Fouriér sunt satisfacute de semnale fizic realizabile. Deci, unui semnal fizic dat, x(t), i se poate asocia spectrul Fouriér X(jω) determinat analitic sau experimental.

Analiza Fourér a semnalelor discrete Studiul reprezentarilor digitate ale semnalelor a avut o dezvoltare impetuoasa în ultimul timp, prin obtinerea unor algoritmi puternici de calcul în analiza spectrala, bazati pe concepte din domeniul frecventa. Astfel, prin algoritmul de transformare Fouriér rapida (TRF) s-a obtinut un instrument extrem de util în prelucrarea semnalelor în timp sau în frecventa, cu o viteza

43

considerabila de calcul, cu o reducere substantiala a numarului de operatii si acest fapt explica de ce tehnicile de analiza Fouriér a semnalelor digitale au o aplicare larga în numeroase domenii ale tehnicii. În ultimul timp s-a obtinut o perfectionare a modalitatilor de prelucrare a semnalelor discrete, de estimare a parametrilor caracteristici ai lor, cu aplicatii dintre cele mai semnificative în teoria comunicatiilor, în acustica, radar, seismologie, recunoasterea formelor, biometrie etc. Transformata Z este un instrument util în studiul proceselor liniare invariante în timp, discretizate. Transformata Fouriér discreta sta la baza tuturor tehnicilor de prelucrare a semnalelor discrete, de transfer de date din domeniul timp în domeniul frecventa si invers. Daca în cazul semnalelor analogice transformata Fouriér este în special un instrument teoretic în schimb în cazul discret prevaleaza calculul efectiv al ei si nu întâmplator succesul analizei Fouriér se conjuga cu dezvoltarea extraordinara a tehnicii moderne de calcul. A. Transformata Fouriér în timp discret (TFTD) Dupa cum s-a mentionat, transformata integrala Fouriér realizeaza echivalenta între un semnal continuu si infinit în domeniul timpului si spectrul continuu si infinit în domeniul frecventei. Necesitatea cunoasterii întregii istorii a semnalului limiteaza aplicarea directa a transformatelor Fouriér la semnale tranzitorii de mica durata. Pentru un semnal discret neperiodic, x*(t), esantionat cu perioada T si modelat sub forma

∑∞

−∞=

−δ=n

* )nTt(T)t(x)t(x (43)

transformata Fouriér (Transformata Fouriér în timp discret - TFTD) va genera un spectru continuu periodic în domeniul frecventa

( )∑∞

−∞=

ω−ω=ωn

0* jnjX)j(X (44)

Relatia de mai sus caracterizeaza esantionarea în domeniul frecventelor si arata ca spectrul functiei esantionate se compune din suma spectrelor functiei continue, deplasate pe axa ω cu multipli ai frecventei de esantionare. Pentru astfel de semnale sunt valabile urmatoarele relatii:

( ) ∑+∞

−∞=

ω−=ωn

nTj* e)nT(xjX (45)

∫π

ω ωωπ

=T2

0

nTj* de)j(X21

)nT(x (46)

Daca însa, semnalul discret este si periodic atunci spectrul obtinut în domeniul frecventa va fi de asemenea discret si periodic. În acest caz trecerea în domeniul frecventa se poate realiza pentru o singura perioada a semnalului. B. Transformata Fouriér discreta (TFD) Transformata Fouriér în timp discret (TFTD) este tot un instrument teoretic de studiu, neputând sa fie implementata pe un sistem numeric de

44

prelucrare, datorita faptului ca este o functie continua iar variabila ω ia o infinitate de valori în intervalul de definitie (relatiile (45)-(46)). Mai mult, definitia ei este valabila pentru semnale cu suport infinit. Pentru a putea face un studiu în frecventa utilizând un sistem numeric de prelucrare este necesar sa discretizam variabila continua ω. Discretizând ω pe un interval în N puncte se obtine transformata Fouriér discreta în timp si frecventa, numita pe scurt transformata Fouriér discreta (TFD). Implicând lucru cu un numar finit de esantioane, atât în domeniul timpului cât si în cel al frecventei, transformata Fouriér discreta se preteaza la o evaluare directa prin metode numerice, prin utilizarea sistemelor numerice de calcul. Fiind calculabila, aceasta transformata reprezinta chintesenta prelucrarilor numerice ale semnalelor, permitând astfel relansarea teoriei moderne a prelucrarilor numerice de semnal. Fie semnalul discret periodic de perioada T, esantionat cu perioada de esantionare Te (figura 3.5), si descris în domeniul timp prin N esantioane într-o perioada.

T NT e=

x kT e( )

kT e t

Fig.3.5

Folosind metoda dreptunghiului în avans, integrala transformatei Fouriér directa

∫ω−=ω T

0tj dte)t(x)j(X (47)

se poate calcula pe cale numerica obtinându-se:

( ) ( ) 2/N,..1,0k;e)nT(xT)nT(xTFDjkX1N

0n

nTNT2

jk

eee0

ee ±±===ω ∑

−

=

π−

(48)

Pentru un semnal descris în domeniul timp prin N esantioane într-o perioada, în domeniul frecventa spectrul va contine de asemenea N esantioane într-o perioada. Dupa cum rezulta din relatia (48) transformata Fouriér discreta, corespunzatoare unei valori a frecventei (kω0), este un numar complex si prin urmare poate fi exprimata prin intermediul coordonatelor polare:

( ) ( ) ( )[ ] ( )[ ]( )[ ]( )[ ]0

0

0 jkXRejkXIm

arctg j

02

02)k(j

00 ejkXImjkXReejkXjkX ωω

ωϕ ω+ω=ω=ω (49) unde:

( )[ ] ( )[ ]

π

−=ω

π

=ω ∑∑−

=

−

=

nN2

ksin)nT(xTjkXIm;nN2

kcos)nT(xTjkXRe1N

0nee0

1N

0nee0

45

O observatie fundamentala care se poate deduce consta în faptul ca ( )X jkω0 este o functie periodica, indusa de exponentiala complexa, si ca daca se

continua evaluarea transformatei, pentru valori k mai mari decât N se va obtine aceeasi functie:

( )( ) ( )0

1N

0n

n2jnN

2j k

ee

1N

0n

nTNT2

)Nk(j

ee0 jkXee)nT(xTe)nT(xTNkjXe

e ω===ω+ ∑∑−

=

π−π

−−

=

π+−

(50)

În concluzie, când valoarea k depaseste domeniul de definitie, N, valoarea obtinuta este redundanta, fiind egala cu una obtinuta în cadrul domeniului. Daca semnalul prelucrat x(nT) este real intervalul de definitie pentru transformata Fouriér directa se poate restrânge la jumatate, numai N/2 esantioane fiind independente. Inversa transformatei Fouriér discreta se determina prin discretizarea relatiei:

∫π

ω ωωπ

=T2

0

tj de)j(X21

)t(x (51)

obtinându-se operatorul:

( ) ∑∑−

=

π−

=

π− ω=ω

πω=ω=

1N

0k

nTNT2

j k

0e

1N

0k

nTNT2

j k

00

01 e

ee

e e)jk(XNT

1e)jk(X2

)jk(XTFD)nT(x (52)

Cele N valori ale functiei ( )X jkω0 , din domeniul frecventa, permit reconstituirea completa a celor N valori ale semnalului x(kT) din domeniul timp. Exemplul 1. Fie x(t)=t2, t∈[0,2π] o functie periodica de perioada T=2π. Sa se faca analiza Fouriér a semnalului. Pulsatia fundamentalei are valoarea 1T20 =π=ω Conform relatiilor (28) coeficientii Fouriér sunt:

3

4dtt

21

a2

2

0

20

π=

π= ∫

π

2

2

0

2

0

2k k

4ktdtsint

k2

ktdtcost1

a =π

−=π

= ∫∫ππ

.k

4ktdtsint

k2

k41

ktdtsint1

b2

02

22

0

2k

π−=

−

π−

π=

π= ∫∫

ππ

Deci:

[ ].2,0tktsink

ktcosk1

43

4t

1k2

22 π∈

π

−+π

= ∑∞

=

Pentru dezvoltarea în forma cosinusoidala, relatia (29), se determina modulul si argumentul fiecarei componente armonice:

222k k1

k4

c π+= ; ϕk=kπ.

În final se obtine:

46

[ ].2,0t)t(kcosk1k1

43

4t

1k

222

22 π∈

π+π++

π= ∑

∞

=

Amplitudinea complexa, relatia (33), este de forma:

( ) 222

kjkkc k1

k4

1ecc k π+−== ϕ

seria având expresia:

[ ]π∈

π+

−+

π=

π+

−+

π= ∑ ∑

∞

=

∞

≠−∞=

2,0tk1k

)1(2

34

k1k

)1(4

34

t1k

0kk

222

k222

2

k22 .

Functia spectrala bilaterala este:

( ) ( ) ( )∑∞

≠−∞=

−ωδπ+−

π+δπ

=ω0k

k

22

2

k3

jkjk1k

)1(20

38

jX

iar functia spectrala unilaterala:

( ) ( ) ( )∑∞

=

−ωδπ+−

π+δπ

=ω1k

22

2

k3

jkjk1k

)1(40

38

jX .

Exemplul 2. Fie semnalul dreptunghiular periodic, de perioada T si de suprafata unitara (durata τ si amplitudine A=1/τ). La limita, când τ→0, acest semnal reprezinta functia δT periodica (tren de impulsuri Dirac la intervale T). Coeficientul Fouriér complex va fi:

( ) ( )

.2

kSi

T2sin

T2

2k

sinTk

4j2ee

Tk4

ejk

1T2

dtet1

T2

dtetxT2

c

2k

2k

0

0

2

2tjk

0

tjktjkkc

0

020jk

20jk

02

2

02T

2T

ωτ

==τω

τω=

−τω

=

=−ωτ

−=τ

==

τω

τω−

τ

τω−ω−

−

ω−

−

τωτω

τ

τ∫∫

&

Deci dezvoltarea în serie Fouriér va fi:

( ) .e2

kSi

T1

tx tjk0

k

0ω∞

−∞=

τω

= ∑

Deoarece, la limita, când τ→0, 12

kSilim 0

0=

τω

→τ se obtine semnalul δT

periodic :

( ) ( ).tkcosT2

T1

eT1

t1k

0k

tjkT

0 ∑∑∞

=

∞

−∞=

ω ω+==δ

Semnalul δT(t) nu este fizic realizabil. Într-adevar, amplitudinile

componentelor spectrale fiind T2Ck = independente de k, ∞→∑∞

=1k

2iC , deci puterea

semnalului este infinita, pentru generarea lui fiind necesar un generator de putere infinita. Functia Si(α) este data de obicei sub forma tabelata sau grafic.

47

Exemplul 3. Sa se faca analiza Fouriér-Legendre pentru semnalul periodic, de tip tren de impulsuri dreptunghiulare duble, definit pe o perioada prin expresia:

( )

∈=

−∈−=

)1,0(t,10t0

0,1t,1)t(x

Primele patru polinoame ortogonale Legendre au expresiile:

t23

t25

)t(P;21

t23

)t(P;t)t(P;1)t(P 33

2210 −=−===

Tinând cont de ortogonalitatea polinoamelor, coeficientii Fouriér se calculeaza cu relatia:

∫∫−−

+=

λ=

1

1i

1

1i

ii dt)t(P)t(x

21n2

dt)t(P)t(x1

C

obtinându-se 87

C;0C;23

C;0C 3210 ==−==

Semnalul se poate astfel aproxima cu relatia:

−+−≅ t

23

t25

87

t23

)t(x 3

Exemplul 4. Sa consideram impulsul Dirac δ(t) neperiodic, definit prin:

( ) ( ) .1dttlimdtt0

=δ=δ ∫∫ε

ε−→ε

∞

∞−

Transformata Fourier a acestei functii este F[δ(t)]=1 deci spectrul de amplitudine a impulsului este constant pe întreaga axa a frecventei. Exemplul 5. Consideram functia treapta unitara (Heaviside) definita astfel: u(t)=1 pentru t≥0 si u(t)=0 în rest. Transformata Fourier este F[u(t)]=1/jω, excluzând o vecinatate a originii deoarece u(t) nu este absolut integrabila. Pentru a determina functia spectrala (densitatea spectrala de amplitudine) în întreg domeniul frecventelor putem aproxima semnalul treapta:

( )[ ] [ ]( )

.0j1

0eFlimtuF t

0

≠ωω

=ωωπδ== α−

→α

În tabelul 3.3 sunt date câteva tipuri de semnale neperiodice folosite în identificare si spectrele lor de frecventa.

3.2. Descrierea matematica a semnalelor aleatoare.

În anexa 2.1 este tratata aceasta problema. În cazurile concrete de identificare un rol deosebit îl au semnalele care sunt procese stohastice stationare ergodice de ordin doi, a caror completa caracterizare în domeniul timpului este data de primele doua momente, respectiv de medie si matricea de covarianta, iar în domeniul frecventelor de densitatea spectrala. Pentru un astfel de proces u(t) media si functia de autocorelatie:

Tabelul 3.3 Denumirea semnalului

Reprezentarea functiei de timp

Exprimarea ca functie de timp

Transformata Fourier Spectrul de frecventa

Impulsul Dirac

x(t)

t0

( ) ( )

=∞≠

==000

tt

ttx δ ( ) 1=ωjX 1X(jω)

ω

Impuls dreptunghiular

x(t)

t0

A

τ

( )

τ>τ≤<

=t0

t0Atx ( ) 2

2

2sin ωτ

ωτ

ωτ

τω jeAjX −= 1 X(j ω )

ω

X *(j ω )

0,5X *(j ω ) = A τ

Impuls triunghiu-lar

x(t)

t0

A

τ/2 τ

( )

τ>

τ≤<ττ−τ

τ≤<τ

=

t,0

t,tA2

t0,t

tx 2

2A2

( ) 2

2

2

2sin2

ωτ

ωτ

ωττω je

AjX −

=

X(jω)

ω

X*(j ω)0,5 X*(j ω) = Aτ

1

2πτ τ

π4

Treapta ideala

x(t)

t0

A

( )

>≤

=0tA0t0

tx ( )ω

ωjA

jX =

X(j ω)

ωA

1

Treapta reala

x(t)

t0

A

τ

( )

τ≥τ<<

≤= τ

tAt0t

0t0

tx A ( ) 2

1sin2 2

2 ωτ

ωτ

ωωτ

ωτje

jA

jX −=

X(j ω )

ω2 4π πτ τ

49

( ) ( )( ) ]m)t(um)t(u[Mr)]t(u[Mm Tu −−τ+=τ=

∆∆

sunt suficiente deci pentru caracterizare. De notat ca si un semnal determinist poate fi la fel caracterizat.

Un alt mod de caracterizare a unui proces stohastic x(t) este prin exprimarea lui functie de un proces cunoscut, de regula zgomotul alb e(t). Exista mai multe astfel de posibilitati în cazul discret si anume:

)ARMA()mt(ec.....)1t(ec)t(e)nt(xa....)1t(xa)t(x)AR( )t(e)nt(xa....)1t(xa)t(x

)MA( )mt(ec.....)1t(ec)t(e)t(x

m1n1

n1

m1

−++−+=−++−+=−++−+

−++−+=

cu conditia ca polinomul caracteristic sa aiba radacinile în interiorul cercului unitar. De notat ca daca x(t) are densitate spectrala rationala atunci o asemenea modelare este întotdeauna posibila, conform teoremei de reprezentare (anexa 2.3). Daca generarea semnalelor deterministe nu ridica în principiu probleme deosebite, generarea semnalelor aleatoare cu caracteristici statistice prestabilite este delicata. Daca ne referim la reprezentarea unui semnal ca proces ARMA (MA, AR) atunci generarea lui se reduce la generarea zgomotului alb e(t) discret si filtrarea lui printr-un filtru cu f.d.t. determinata. Însa generarea zgomotului alb presupune un generator de putere infinita în cazul continuu, iar semnalul discret aproximeaza bine pe cel continuu doar când perioada de esantionare tinde la zero, deci este dificil de aplicat sistemelor continue. În schimb, zgomotul alb discret este deosebit de convenabil pentru modelarea discreta. Secventele de zgomot alb pot fi simplu generate utilizând echipamente numerice. Dintre procedurile frecvent utilizate cea mai simpla implica numai operatii liniare. O secventa bazata pe acest principiu cu un algoritm bine precizat este de fapt determinista si nu aleatoare (ea este denumita pseudoaleatoare). Totusi, daca functia de covarianta aproximeaza suficient de bine functia de covarianta a zgomotului alb discret, atunci secventa generata poate fi considerata o realizare a zgomotului alb. În figura 3.6 este prezentata schema de principiu a unui generator pseudoaleator liniar.

Generator de tact

Registru de deplasare

Sumatormod 2

an an-1 a2 a 1

xn xn-1 x2 x1

n n-1 2 1u(t)

Fig. 3.6

50

Functionarea registrului de deplasare cu reactie prin sumatorul modulo 2 este descrisa de ecuatiile de stare discrete:

==+

)t(Cx)t(u)2(mod)t(Ax)1t(x

în care Tn21 ]x,....,x,x[)t(x = este vectorul de stare ale carui elemente reprezinta

iesirile bistabilelor registrului de deplasare,

[ ]0,....,0,1C;

a..aaa1..000

0..010

A

n321

=

−−−−−

=

iar ai sunt 1 sau 0 dupa cum bistabilul i contribuie sau nu la reactie. Starea initiala a registrului trebuie sa fie diferita de zero. Secventa u(t) generata poate lua numai doua valori (0 si 1), de aceea se numeste semnal pseudoaleator binar (SPAB). Semnalul generat este periodic, perioada maxima fiind 2n-1 tacturi elementare generate de generatorul de tact (GT). Perioada maxima a lui u(t) se obtine numai pentru anumite reactii (de exemplu pentru n=5, numai a2 si a5 sunt 1 pentru a obtine SPAB de lungime maxima T=32∆, ∆ fiind perioada tactului elementar [4]). Daca se doreste un semnal SPAB centrat este suficient sa definim ( )tu~ :

]1)t(u2[a)t(u~ −= care poate lua valori între -a si a. Daca operatia de sumare modulo 2 se înlocuieste cu sumare modulo m, se pot obtine semnale pseudoaleatoare cu m nivele, care nu se pot genera prin hard dar pot fi usor generate soft, dispunând de un calculator numeric. Un semnal SPAB u(t) are o serie de proprietati deduse de Davies (1970) si anume: Proprietatea 1. Daca u(t) este SPAB de perioada maxima N=2n-1, atunci într-o perioada sunt continute (N+1)/2 = 2n-1 secvente elementare de 1 si (N-1)/2=2n-1-1 de 0. În timpul unei perioade vectorul de stare x(t) va lua toate valorile posibile, mai putin valoarea zero, pentru care registrul nu îsi schimba starea oricare ar fi reactia. Din cele 2n valori ale vectorului de stare posibile, generate, (2n-1) vor contine 1 pe ultima pozitie (ceea ce înseamna u(t)=1). Cum numarul de secvente elementare este 2n-1, rezulta ca numarul de stari zero va fi 2n-1-1. Proprietatea 2. Fie u(t) un SPAB de perioada N=2n-1. Atunci pentru k=1,2,..,N-1 exista l ]1N,1[ −∈ încât l)t(u)kt(u)t(u −=−⊕ , unde l depinde de k. Pentru demonstratie vezi [4]. Daca x si y sunt variabile binare, atunci 2/)]yx(yx[xy ⊕−+= , proprietate care se verifica direct cu ajutorul tabelului de adevar. Folosind aceste proprietati putem evalua media si matricea de covarianta ale unui SPAB de lungime maxima:

51

( ) ( )

−−τ+=τ

=

∑

∑

=

=N

1t

N

1t

m)t(u)m)t(u(N1

r

)t(uN1

m

Deoarece u(t) are numai valori 0 sau 1 iar cele de 1 sunt în numar de (N+1)/2 rezulta:

.N2

1N2

1NN1

)]t(u[Mm+=+==

Pentru evaluarea functiei de covarianta sa constatam ca:

( )

( )2

22

2N

1t

2N

1t

2N

1t

2

N41N

N21N

N21N

m1mmm

m)t(uN1

m)t(uN1

m)t(uN1

r(0)

−=

−+=−=−=

=−=−=−= ∑∑∑===

iar pentru τ=1,2,..., N-1, folosind proprietatile enuntate rezulta:

( )( )

( )[ ]

222

N

1t

2N

1t

2N

1t

N

1t

N41N

m2m

mml)t(uN21

m

m)t(u)t(u)t(u)t(uN21

m)t(u)t(uN1

m)t(um)t(uN1

)(r

+−=−−=−−τ+−=

=−

⊕τ+−+τ+=

=−τ+=−−τ+=τ

∑

∑

∑∑

=

=

==

Considerând un semnal centrat ]1)t(u2[a)t(y −= :

( )[ ] ( )[ ] ( ) 0Na

m21aatuaM2tyM ≅−=−−=−=

[ ] ( ) ( ) 22

22

2

222

y aNa

aN4

1Na40ra40r)t(yD ≅−=

−===

( ) ( )Na

Na

Na

N41N

a4ra4r2

2

22

222

y −≅−−≅+

−=τ=τ

Pentru N suficient de mare, functia de covarianta este:

( )

−=τ=τ

≅τ1N,...,2,1pentru

0pentru

0a

r2

y

ceea ce constituie o excelenta aproximare a functiei de corelatie a zgomotului alb discret.

3.3. Persistenta semnalelor

Sa consideram un sistem linia r stohastic descris prin modelul discret:

(M) ∑−

=−=

1N

0tuuy )kt(r)t(h)k(r

52

u(t) si y(t) , t=0,1,...,N-1 fiind semnalele de intrare si respectiv iesire din sistem, presupuse cunoscute, M[u(t)]=0 si h(t) functia pondere. Din datele de intrare-iesire putem determina functiile de corelatie:

1N,....,1,0)t(y)t(uN1

)(r

1N,....,1,0)t(u)t(uN1

)(r

1N

0tuy

1N

0tu

−=ττ+=τ

−=ττ+=τ

∑

∑−

=

−

=

Dorim sa evaluam functia pondere h(t) pentru t=0,1,...,N-1. În acest scop modelul (M) este explicitat pentru k=0,1,...,N-1, rezultând sistemul:

( ) ( )

( ) ( )

( )

( )

( )

( ).

1Nr

0r

1Nh

0h

0r1Nr

1Nr0r

uy

uy

uu

uu

−=

−

−

−MM

…MMM

…

Este clar ca, pentru rezolvarea acestui sistem în raport cu vectorul h, h=[h(0),..,h(N-1)]T, matricea sistemului trebuie sa fie nesingulara. Aceasta matrice însa depinde direct de semnalul de intrare u(t). Necesitatea existentei unei solutii pentru aceasta problema de identificare conduce la conceptul de semnal persistent. Definitia 6. Un semnal u(t) este semnal persistent de ordin n (SPn) daca:

1. ∑=∞→

=N

1tN)t(u

N1

lim)]t(u[M

2. n,0kpentru)kt(u)t(uN1

lim)k(rN

1tNu =+= ∑

=∞→

3. Matricea Toeplitz simetrica:

( )

( ) ( ) ( )( ) ( ) ( )

( ) ( )

−

−

−

=

0r1nr

2nr0r1r

1nr1r0r

nR

uu

uuu

uuu

u

………………

……

este pozitiv definita. Este evident ca primele doua conditii sunt îndeplinite de un semnal stationar ergodic în care mediile statistice coincid cu mediile de esantion, pentru esantioane suficient de mari. Matricea Ru este de fapt matrice de covarianta a semnalului de intrare, presupunând ca acesta are media nula, cum se întâmpla frecvent în practica. Observatie. O definitie alternativa a persistentei unui semnal data de Anderson (1982) este urmatoarea: Un semnal u(t) este SPn daca pentru toti t exista un întreg m astfel încât:

0,I)t()k(I 212

mt

tk

T1 >ρρρ>ϕϕ>ρ ∑

+

=

unde vectorul ϕ(t)=[u(t-1),.....,u(t-n)]T.

53

Pentru a vedea legatura cu definitia sa observam ca:

).t()t(N1

lim)n(R TN

1tNu ϕϕ= ∑

=∞→

Sa analizam câteva proprietati legate de persistenta semnalelor. Proprietatea 1. Un semnal u(t) este SPn daca densitatea sa spectrala Su(ω) este nenula în cel putin n frecvente diferite. Demonstratie: Consideram polinomul arbitrar G(q-1)=g0+g1q-1+..+gn-1q-(n-1) si y(t)=G(q-1)u(t). Sa observam ca daca Sy(ω)≡0 atunci si ry(t)≡0 (prin definitia

densitatii spectrale). Dar Sy(ω)≡|G(ejω)|2Su(ω)≡0 este satisfacuta daca si numai daca G(·) se anuleaza în n frecvente diferite deoarece Su(ω) este nenula în n frecvente diferite. Cum grad G(·) este (n-1) aceasta înseamna ca unica posibilitate este ca toti coeficientii lui G(·) cuprinsi în vectorul g=[g0.....gn-1]T sa fie nuli. În acest caz, deoarece ry(0)=0:

( ) [ ] 0g)n(RgguugM])t(u)q(G[M)t(r uTTT21

y ==== −

unde: ( ) ( ) T]1ntu,....,1tu[u −−−= si ]uu[M)n(R Tu =

este satisfacuta numai pentru g=0. Cum ecuatia este omogena si are solutie unica, rezulta Ru(n)>0, deci u(t) este SPn. Proprietatea 2. Daca u(t) este SPn atunci densitatea sa spectrala este nenula în cel putin n puncte. Demonstratie se face prin reducere la absurd. Presupunem ca u(t) este SPn si Su(ω) se anuleaza în (n-1) frecvente diferite. Reluând rationamentul de la demonstrarea proprietatii precedente rezulta ca daca G(·) are coeficientii g astfel încât radacinile sale sa corespunda tocmai frecventelor în care nu se anuleaza Su(ω),

egalitatea 0)(S)e(G u

2j ≡ωω este satisfacuta, iar ecuatia 0g)n(Rg uT = are si

solutie diferita de cea banala, deci Ru(n) este singulara si u(t) nu este SPn. Proprietatile 1 si 2 arata ca u(t) este SPn daca si numai daca Su(n) este nenul în n frecvente diferite. Proprietatea 3. Daca u(t) este un SPn si H(q-1) un filtru liniar asimptotic stabil fara zerouri pe cercul unitar, atunci semnalul y(t)=H(q-1)u(t) este de

asemenea SPn. Demonstratia este evidenta deoarece ).(S)e(H)(S u

2jy ω=ω ω

Proprietatea 4. Fie un sistem cu f.d.t. discreta: ( ),qg...qgg)q(G 1n

1n1

101 −−

−−− +++=

la intrarea caruia se aplica un semnal u(t) SPn. Daca media patratica a semnalului de iesire este nula atunci G(q-1)≡0. Demonstratie: Notând ( ) ( ) ( ) T]1ntu,..,1tu,tu[u +−−= , T

1n0 ]g,..,g[g −=

rezulta y(t)=gTu si 0g)n(Rgg]uu[Mg]guug[M)]t(y[M uTTTTT2 ====

Cum u(t) este SPn rezulta ca solutia unica este g=0. Definitiile si proprietatile de mai sus pot fi extinse si la cazul unor semnale multidimensionale.

54

Observatii. 1. Presupunem un semnal u(t) zgomot alb discret de medie nula M[u(t)]=0 si dispersie λ2. Deoarece functia de corelatie (covarianta) este:

≠τ=τλ

=τ0pentru00pentru

)(r2

u

matricea de covarianta este Ru(n)=λ2I care este totdeauna pozitiv definita. Astfel, un semnal zgomot alb stationar si ergodic este semnal persistent de orice ordin. 2. Semnalul treapta este semnal persistent de ordin 1 si nu mai mare. 3. Ordinul de persistenta al unui semnal SPAB centrat de lungime maxima N este N. Într-adevar, sa consideram vectorul h de dimensiune n≤N cu coeficienti arbitrari nenuli si forma patratica:

heeNa

INa

ahh

aN/a

N/aN/aN/aa

hh)n(Rh T22

2T

22

22

22

Tu

T

−

+=

−

−−−

=

……………………

…………

unde e=[1,1,...,1]T.

.Nnpentru0hhN

n1Na

hhNnahh

N1Naheeh

Nahh

N11ah)n(Rh

T2

T2

T2TT2

T2u

T

≤>−+=

=−

+=−

+=

4. În unele lucrari, în definitia persistentei unui semnal este considerata matricea de covarianta în locul celei de corelatie. Deoarece:

( )2uu )]t(u[M)n(R)n(C −=

rang Cu(n) ≥ rang Ru(n) -1. Aceasta face ca utilizând aceasta definitie ordinul de persistenta sa scada cu o unitate. Daca un semnal de tip zgomot alb nu este afectat, în schimb un semnal treapta este persistent de ordin zero în acest caz. Definitia 7. Considerând sistemul (S) asimptotic stabil:

(S) ∗

∗

∗

∗

−∗−∗−∗

−∗−∗−∗

−∗−∗

++=

+++=

=

nbnb

11

1

nana

11

1

11

qb.....qb)q(B

qa.....qa1)q(A

)t(u)q(B)t(y)q(A

si polinoamele A*(•) si B*(•) fiind prime între ele, el poate fi pus sub forma: ∗θϕ= )t()t(y T

unde: T)]nbt(u),...,1t(u),nat(y),....,1t(y[)t( ∗∗ −−−−−−=ϕ

.]b,...,b,a,...,a[ Tnb1na1∗∗∗∗∗

∗∗=θ Se numeste matrice asociata sistemului matricea:

∑=

ϕϕ=ϕϕ=N

1t

TT )t(~)t(~N1

)]t(~)t(~[MR~

55

în care: .)]nbt(u),....,1t(u),nat(y),....,1t(y[)t(~ T−−−−=ϕ

Proprietatea 5. Matricea R~ asociata sistemului are urmatoarele

proprietati: 1. Daca n*=min(na-na*,nb-nb*)≤0 si u(t)= n~SP atunci R

~ >0, unde: ( ).nbna,nbnamaxn~ ++= ∗∗

2. Daca n*>0 si u(t)= n~SP atunci R~ este singulara, spatiul nul al matricei

R~ fiind generat de vectorul x=[f1,....,fna,g1,....,gnb]T, definit prin relatiile:

)q(L)q(Bqg)q(G

)q(L)q(Aqf)q(F

111nb

1ii

1

111na

1ii

1

−−∗−

=

−

−−∗−

=

−

−==

==

∑

∑

unde L(q-1) este un polinom arbitrar de grad n*=min(na-na*,nb-nb*). Într-adevar, daca încercam sa determinam spatiul nul al matricei asociate sistemului din relatia 0xR

~xT = rezulta:

( ) ( )( )( ) 0)t(u)q(G)t(y)q(FM

]xtt~t~x[Mx)]t(~)t(~[MxxR~

x211

TTTTT

=

+=

=ϕϕ=ϕϕ=−− .

Notând cu )t(u)q(G)t(y)q(F)t( 11 −− +=ε , spatiul nul este generat de

relatia .0)0(r)]t([M 2 ==ε ε Deoarece 0)0(r =ε rezulta ca .k)(0)k(r ∀=ε În

consecinta, este valabila si relatia: ( ) 0])t()q(A[M21 =ε−∗ .

( )( )( )( ) .0)t(u)q(A)q(G)q(B)q(FMsau

0)t(u)q(G)t(y)q(F)q(AMsau

21111

2111

=

+

=

+

−∗−−∗−

−−−∗

Deoarece ( ) ,n~)q(A)q(G)q(B)q(Fgrad 1111 =+ −∗−−∗− si n~SP)t(u = , în

conformitate cu proprietatea 4, rezulta ca 0)q(A)q(G)q(B)q(F 1111 ≡+ −∗−−∗− sau, considerând F(q-1)≠0,

.)q(F)q(G

)q(A)q(B

1

1

1

1

−

−

−∗

−∗

−=

Daca n*=min(na-na*,nb-nb*)≤0 aceasta relatie reprezinta o contradictie, polinoamele A* si B* fiind prime între ele. Prin urmare, în acest caz matricea R~ nu poate fi singulara. Daca n*>0 exista un spatiu nul generat de vectorii x, deci R~ este singulara si, evident:

)q(L)q(A)q(F)q(L)q(B)q(G 111111 −−∗−−−∗− =−= L(q-1) de grad n* fiind un polinom arbitrar. Daca n*<0 si u(t) nu este SP de ordin n~ atunci nu se poate afirma nimic general despre matricea asociata sistemului.

56

Proprietatea 6. Sa consideram sistemul stohastic: ).t(e)q(H)t(u)q(B)t(y)q(A 111 −∗−∗−∗ +=

Matricea R~ asociata sistemului are urmatoarele proprietati: 1. Daca M[e2(t)]>0, atunci R

~ este nesingulara (>0) daca si numai daca u(t)=SPnb. 2. Daca M[e2(t)]=0, atunci proprietatile lui R

~ sunt cele aratate anterior. Într-adevar, daca x(t) este componenta iesirii datorata intrarii u(t) si v(t) este perturbatia, atunci:

).t(e)q(H)t(v)q(A

)t(u)q(B)t(y)q(A

)t(v)t(x)t(y

11

11

−∗−∗

−∗−∗

=

=

+=

zgomotul alb e(t) fiind semnal persistent de orice ordin si filtrul H*(q-1) fiind stabil, rezulta ca si v(t) este SP de orice ordin. Matricea asociata se poate descompune astfel:

( ) ( ) ( ) ( )[ ] ( ) ( )[ ] ),t(~)t(~0,..,0,natv,..,1tvnbtu,..,1tu,natx,..,1tx)t(~21

TT ϕ+ϕ=−−+−−−−=ϕ

21T22

T11

T2

T121

T

R~

R~

)]t(~)t(~[M)]t(~)t(~[M

)]t(~)t(~)][t(~)t(~[M)]t(~)t(~[MR~

+=ϕϕ+ϕϕ=

=ϕ+ϕϕ+ϕ=ϕϕ=

egalitatile fiind valabile în virtutea necolerarii intrarii cu perturbatia. Matricea

1R~ este nesingulara întrucât u(t) este SPnb, iar 2R

~ de asemenea, întrucât v(t)

este SP de orice ordin. În consecinta, R~ este nesingulara.

Daca M[e2(t)]=0, atunci 2R~ =0 si R

~ = 1R~ care este matricea asociata partii

deterministe a sistemului. În consecinta sunt valabile afirmatiile de la proprietatea 5. Afirmatia potrivit careia daca 1R

~ >0 si 2R~ >0 atunci 0R

~R~

R~

21 >+= este valabila în virtutea urmatoarei teoreme [5], care afirma ca, date fiind matricele:

0AAAA

A22

T12

1211 >

= si 0

000B

B 11 >

=

partitionate în acelasi mod, daca A22>0 si B11>0 atunci A+B>0. Bibliografie [1] Savescu M. , s.a., Metode de aproximare în analiza circuitelor electronice,

Editura Tehnica, Bucuresti, 1971 [2] Stanomir D., s.a., Metode matematice în teoria semnalelor, Editura Tehnica,

Bucuresti, 1980 [3] Savescu M. , s.a., Semnale, circuite si sisteme. Probleme, Editura Didactica

si Pedagogica, Bucuresti, 1981 [4] Söderstrom T, Stoica P., - System Identification, Prentice Hall, 1989. [5] Tertisco M., Stoica P., - Identificarea si estimarea parametrilor sistemelor,

Ed. Academiei, 1980.

65

CAPITOLUL 5

Metode neparametrice

Metodele de identificare prezentate în acest capitol se numesc neparametrice deoarece modelele rezultate sunt neparametrice (functii pondere, raspunsuri indiciale, caracteristici de frecventa). Astfel de modele sunt functii de timp sau de frecventa care nu sunt în mod necesar descrise printr-un numar finit de parametri. Determinarea acestor modele se face pe baza datelor de intrare-iesire din sistem, semnalul de intrare putând fi din functionarea normala (metode pasive) sau introdus în mod special (metode active).

5.1. Identificarea sistemelor liniare cu semnale de proba deterministe

Atunci când este posibil, aplicarea unor semnale de proba deterministe permite identificarea experimentala a unor procese industriale. Semnalele neperiodice se caracterizeaza prin usurinta generarii si aplicarii lor la intrarea procesului, precum si prin interpretarea directa a rezultatelor. Semnalele de proba periodice au avantajul ca permit discriminarea mai usoara a influentelor perturbatoare asupra semnalului util de la iesire. De asemenea, având valoare medie nula, semnalele periodice pot avea amplitudini relativ mari în comparatie cu cele neperiodice, ceea ce usureaza procesul de identificare. În ambele situatii semnalele de proba deterministe conduc la modele neparametrice (functie indiciala, functie pondere sau caracteristici de frecventa). Desi acestea din urma pot fi utilizate direct în proiectarea sistemului automat, majoritatea metodelor de sinteza se bazeaza pe modele parametrice, astfel încât identificarea cu semnale de proba este de regula asociata cu o schimbare de reprezentare de la modelul neparametric la unul parametric. Metodele de identificare cu semnale de proba sunt metode active care necesita parcurgerea urmatoarelor etape: - alegerea tipului si parametrilor semnalului de proba; - filtrarea perturbatiilor (identificarea cu semnale de proba fiind utilizata în modelarea partii deterministe a unui proces tehnologic) în urma careia se obtine un model neparametric reprezentativ; - deducerea unui model parametric care sa permita utilizarea rezultatelor experimentale în sinteza sistemului de reglare.

5.1.1. Identificarea cu semnale de proba neperiodice În ceea ce priveste alegerea semnalului neperiodic, acesta trebuie sa aiba spectrul de frecventa cât mai larg în raport cu banda de trecere a procesului tehnologic (sistemului) de identificat pentru a pune în evidenta toate modurile acestuia. Alegerea corecta este deci posibila când exista informatii apriorice care sa localizeze domeniul de frecventa. Daca nu dispunem de aceste informatii atunci sunt necesare încercari experimentale prealabile. Pentru precizia determinarii caracteristicilor dinamice prezinta importanta amplitudinea semnalului. Valorile maxime ale acestuia sunt limitate de prevederile

66

tehnologice (limitele domeniului de variatie admisibil ale intrarii sau iesirii din proces), precum si de domeniul de liniaritate al caracteristicii statice a procesului tehnologic, daca se doreste a se obtine un model liniarizat. Limitele inferioare sunt dictate de amplitudinea marimilor perturbatoare care se suprapun peste semnalul util de iesire. În literatura de specialitate se recomanda amplitudini ale semnalului de proba cuprinse între 5% si 15% din valoarea maxima pos ibila a marimii de intrare în procesul tehnologic, valori rezultate din practica identificarii experimentale. În cazurile în care valoarea medie patratica a perturbatiei aleatoare depaseste 15-20% din valoarea maxima a iesirii din proces, precizia identificarii scade considerabil, fiind necesare prelucrari suplimentare pentru extragerea informatiei utile. Uneori folosirea semnalelor de proba de tip treapta nu este recomandata deoarece poate produce cresteri prea mari ale marimii de iesire din proces, mai ales în cazurile când acesta contine elemente integratoare. În astfel de cazuri se recomanda semnale impuls. Daca se cunoaste raspunsul la un semnal impuls dreptunghiular (ca cel din fig.5.1), se poate deduce prin calcul raspunsul indicial, considerând impulsul dreptunghiular ca o suprapunere a doua semnale treapta de amplitudini contrare, decalate în timp cu un interval ∆.

u(t)

0

At

∆ Fig. 5.1

Marimea de iesire din sistemul astfel excitat este:

( ) )]t(y~)t(y~[Ae1sA

)s(WL)t(y s1 ∆−−=

−= ∆−−

unde )t(y~ este raspunsul indicial. Divizând timpul în intervale de aceeasi lungime ∆ (t=k∆, k=0,1,2,..), obtinem:

( ) ( ) ( )[ ]∆−+∆

∆=∆ 1ky~ky

ky~

care este o relatie recursiva ce permite calculul din aproape în aproape a raspunsului indicial. Rezolvând aceasta recurenta rezulta:

∑=

∆∆

=∆k

1n)k(y

1)k(y~

relatie care permite o determinare usoara a raspunsului indicial mai ales când datele din proces sunt culese discontinuu. În majoritatea situatiilor practice, procesele tehnologice nu pot fi izolate de actiunea perturbatiilor, astfel încât masuratorile asupra marimilor de iesire includ atât raspunsul la semnalul de proba cât si efectul perturbatiilor. Apare deci necesitatea filtrarii acestora. Daca la intrare se aplica un semnal treapta

67

unitara u(t), iar perturbatia este un proces aleator stationar de medie m=M[v(t)], atunci iesirea va fi )t(v)t(y~)t(y += , unde )t(y~ este raspunsul indicial. Prin medierea raspunsului rezulta M[y(t)]= )t(y~ +m . Daca sistemul pleaca din conditii initiale nule, )0(y~ =0 si în acest caz m=M[y(0)], ceea ce permite determinarea raspunsului indicial. Acest procedeu presupune ridicarea unui numar mare de raspunsuri si medierea lor, ceea ce conduce la cresterea efortului si a timpului de identificare. Atunci când datele sunt esantionate, filtrarea perturbatiei poate fi numerica, pe baza unei singure realizari. Perturbatiile de frecventa ridicata pot fi filtrate prin metoda mediei alunecatoare. Daca, de exemplu, raspunsul perturbat

este cunoscut în N+1 puncte, y(k∆) N,0k = , ∆ fiind intervalul de esantionare ales în conformitate cu teorema Shannon, raspunsul filtrat se obtine prin medierea datelor de iesire pe un interval de timp n∆ astfel încât, pentru n par si n<N:

( )∑=

++

=

+

n

0qqky

1n1

2n

ky~

Aceasta operatiune este echivalenta cu actiunea unui filtru cu caracteristica atenuare frecventa:

( )2

n2

nsinjW

∆ω∆ω=ω

care atenueaza puternic frecventele mai mari decât 2π/n∆ si, ca urmare, prin alegerea judicioasa a lui n se poate elimina perturbatia. Cu cât n∆ este mai mic, cu atât banda de trecere este mai mare, deci filtrarea este insuficienta, în schimb pentru valori n∆ mari pot aparea distorsiuni în raspunsul sistemului. Daca nu dispunem de informatii apriorice, se alege initial n=2 si apoi, daca filtrarea se dovedeste necorespunzatoare, se mareste n. Pentru a filtra perturbatiile de joasa frecventa se poate utiliza metoda diferentelor. În acest scop este necesar sa se efectueze N determinari cu semnale de proba (treapta, de exemplu), având amplitudini egale dar de semne diferite, aplicate succesiv (fig.5.2). Durata unei trepte trebuie sa fie mai mare decât timpul de stabilizare ts.

A

-A

T/2 T ............ NT/2 t

u(t)

Fig. 5.2 Presupunem y(t)= )t(y~ +v(t), în care )t(y~ este raspunsul indicial, iar v(t) este perturbatia lenta, care în intervalul de timp NT/2 poate fi aproximata

polinomial, ip

0ii ta)t(v ∑

== , cu p<N-1. Raspunsul )t(y~ fiind periodic, rezulta ca

68

)t(y~)1()2/kTt(y~ k−=+ . Aplicând diferenta de ordinul m>p datelor experimentale rezulta:

)t(y~)t(v)t(y~)t(y mmmm ∆=∆+∆=∆ ultima relatie fiind valabila în virtutea faptului ca diferenta de ordinul unu a unui polinom este tot un polinom, de grad mai mic cu o unitate, astfel încât ∆m v(t)=0 pentru m>p. Dar:

]2T)rm(t[y)1(C)t(y

....................................................)t(y)2Tt(y2)Tt(y)t(y

)t(y)2Tt(y)t(y

rm

0r

rm

m

2

−+−=∆

++−+=∆

−+=∆

∑=

Similar:

).t(y~2)1()t(y~)1(C]2T)rm(t[y~)1(C)t(y mmmm

0r

rm

rm

0r

rm

m −=−=−+−=∆ ∑∑==

Combinând relatiile de mai sus rezulta:

].2T)rm(t[y)1(C2)1(

1)t(y~ r

m

0r

rmmm −+−

−= ∑

=

Pentru a utiliza toate semiperioadele se alege m=N-1. Dând lui t valori în intervalul [0,ts], cu pas suficient de mic, se obtine sirul de valori care reprezinta raspunsul indicial. Relatia dedusa poate fi usor implementata pe calculator. Odata obtinut raspunsul experimental din care au fost înlaturate perturbatiile, sub forma unui vector de date, tabel sau grafic, este necesara deducerea unui model parametric care sa permita utilizarea rezultatelor în sinteza sistemului de reglare. Înainte de a trece în revista câteva din metodele de parametrizare, sa observam ca o serie de parametri pot fi simplu determinati din examinarea directa a datelor. Astfel, cunoscând amplitudinea semnalului treapta de intrare si valoarea stationara a iesirii putem determina factorul de amplificare al procesului. Prin raportarea datelor de iesire la valoarea stationara obtinem raspunsul normat, care va fi utilizat în continuare. De asemenea, timpul mort se poate determina ca fiind intervalul de timp masurat din momentul aplicarii semnalului de proba pâna când raspunsul depaseste un procent din valoarea stationara, ( ) ( ) ( )sm ty02,001,0Ty −≤ , în care Tm este timpul mort, iar ts timpul de stabilizare. Tinând seama de aceasta raspunsul sistemului se poate transla cu timpul mort, ceea ce simplifica calculele ulterioare de deducere a unui model parametric.

5.1.2. Identificarea cu semnale de proba periodice Folosirea semnalelor de proba periodice prezinta o serie de avantaje, mentionate la începutul acestui capitol, si o serie de dezavantaje legate de necesitatea unei aparaturi adecvate si de durata mare a experimentului. În cazul

69

sistemelor liniare ridicarea caracteristicilor de frecventa se face punct cu punct prin compararea directa a oscilatiilor de la intrarea si iesirea procesului, rezultând direct atenuarea si faza. Procedeul poate fi aplicat si pentru deducerea functiei de descriere a unui proces neliniar. Faza pregatitoare experimentului consta în studiul procesului în vederea stabilirii pulsatiei de taiere. Pentru ridicarea experimentala a caracteristicilor de frecventa cel mai simplu ar fi sa se aplice la intrare un semnal de amplitudine constanta si de pulsatie variabila în trepte. Acest procedeu îngreuneaza prelucrarea datelor în special în domeniul frecventelor medii si mari unde, de regula, atenuarea este mai mare. Se impune deci marirea amplitudinii semnalului de intrare pe masura cresterii frecventei, însotita de un control al amplitudinii oscilatiilor de la iesire pentru a nu depasi regimul normal de functionare. Prelucrarea datelor experimentale implica un volum mare de calcule în vederea extragerii informatiilor utile, mai ales în prezenta perturbatiilor. Cum, de regula, perturbatia este necorelata cu intrarea, efortul de eliminare a influentei acesteia poate fi diminuat aplicând o tehnica de corelatie. Dupa cum rezulta din fig.5.3, y(t)=x(t)+v(t), iar:

)t(r)t(r)t(r)t(r uxuvuxuy =+= deoarece ruv(t)=0, (∀) t. Daca u(t)=Ai sinωkt, atunci, în regim stationar:

( ) )tsin(jWA)tsin(A)t(x kkike ϕ−ωω=ϕ−ω= .

u(t) Procestehnologic

W(s)

x(t)

v(t)

y(t)++

Fig. 5.3

Calculând functia de intercorelatie intrare-iesire pentru o perioada T suficient de mare, rezulta:

( ) =ϕ−τ+ωωω=

=τ+=τ=τ

∫

∫

∞→

∞→

dt])t(sin[tsinjWAT1

lim

dt)t(y)t(uT1

lim)(r)(r

kkkT0

2i

T

T0Tuxuy

( )

( ) ( ) ( ) .0T

t2sinT4jWA

lim)cos(jW2

A

dt)]t2cos()[cos(jWAT1

lim

kkk

k2i

Tkk

2i

T0 kkkk

T0

2i

T

ϕ+τω+ωω

ω−ϕ−τωω=

=ϕ+τω+ω−ϕ−τωω=

∞→

∞→∫∫

De aici rezulta:

)cos()j(W2

A)(r kk

2i

uy ϕ−τωω=τ

care este o functie periodica de perioada Tk=2π/ωk, ωk fiind pulsatia semnalului aplicat la intrare. Aceeasi relatie se poate obtine daca intervalul de observare este

70

un numar întreg de perioade Tk, ceea ce simplifica evaluarea numerica a functiei de intercorelatie. Se observa ca:

)j(WRe2

Acos)j(W

2A

)0(r k

2i

k

2i

uy ω=ϕω=

( ) )j(WIm2

Asin)j(W

2A

4Tr k

2i

k

2i

kuy ω=ϕω= .

Din aceste relatii se pot calcula atenuarea si faza corespunzatoare pulsatiei ωk:

( )

=ωϕ

+=ω=ω

0r)4T(r

arctg)(

)4T(r)0(rA2

)j(W)(A

uy

kuyk

k2uy

2uy2

ikk

Aceste relatii stau la baza principiului de functionare al transferometrelor polare, aparate care permit evaluarea rapida a atenuarii si fazei. Schemele de principiu ale unor astfel de dispozitive sunt date în fig.5.4 si 5.5.

Generatorsemnal

sinusoidal

u(t) Proces

tehnologic

DefazorTk /4

v(t)

y(t) 2iA

2 ReW(j ωk)

2iA

2ImW(j ωk )

π

π

++

Fig. 5.4

Generatorsemnal

sinusoidal

u(t) Proces

tehnologic

v(t )

y(t)

Defazorπ

2iA

2ωkW(j ) cos( ωkτ−ϕ )variabil

++

Fig. 5.5

Corelatorul din fig.5.5 permite determinarea caracteristicilor de frecventa prin metoda compensarii fazei. Actionând asupra defazorului variabil pâna când obtinem maximul marimii de iesire din integrator, deducem atenuarea corespunzatoare pulsatiei ωk. Tot prin modificarea defazajului pâna la anularea marimii de iesire din integrator gasim faza ϕ(ωk)=ωkτ-π/2, τ0 fiind defazajul de anulare.

71

5.1.3 Deducerea functiei de transfer din raspunsul indicial Asa cum am vazut, deducerea unui model parametric din cel neparametric obtinut experimental este utila pentru analiza si sinteza ulterioara a sistemului. În cele ce urmeaza vom da câteva metode de deducere a functiei de transfer din raspunsul indicial (sau functia pondere) deoarece semnalele treapta si impuls sunt cele mai utilizate semnale de proba, mai ales atunci când este necesar un model al procesului tehnologic pentru acordarea empirica a unui regulator PID. a) Metoda comparatiei folosind atlase de functii normate. Este o metoda directa si relativ simpla de deducere a modelului parametric pentru un proces liniar daca avem la îndemâna atlase cu raspunsuri indiciale sau pondere calculate si reprezentate grafic pentru diferite tipuri de functii de transfer si combinatii de parametri. Comparatia se poate efectua prin suprapunerea curbei experimentale, normate în acelasi mod ca în atlas, peste curbele cuprinse în atlas. Se poate reduce astfel problema identificarii parametrice la cea a estimarii parametrilor. Daca din compararea functiei pondere experimentale normate cu cea din atlas rezulta ca procesul poate fi modelat printr-o anumita functie de transfer, determinarea poate fi realizata din conditia de suprapunere a maximelor. Daca exista si timp mort, acesta se evalueaza direct din conditia y(Tm)<0,01ymax si expresia functiei de transfer se multiplica cu e-sTm. În literatura de specialitate [3] sunt dezvoltate asemenea procedee pentru diverse structuri frecvent întâlnite în practica. b) Aproximarea prin modele cu functii de transfer simplificate. Din practica studierii dinamicii proceselor industriale s-a constatat ca foarte frecvent acestea pot fi reprezentate prin functii de transfer de forma:

1) ( ) msTesT1

KsW −

+=

2) ( )( )

msTn

esT1

KsW −

+=

3) ( ) ( )( )msT

21

esT1sT1

KsW −

++=

Pentru cazurile în care, pe baza informatiilor apriorice, se adopta aproximarea cu unul din modelele de mai sus, problema identificarii se reduce la estimarea parametrilor. Aceasta simplificare a permis dezvoltarea unor metode si procedee grafice [4], [5] relativ simple si rapide. Evaluarea parametrilor se face pe baza functiilor indiciale normate y*(t)=y(t)/y(ts), unde ts este timpul de stabilizare, ceea ce presupune cunoasterea amplificarii. Considerând modelul (1), functia indiciala normata prin care se aproximeaza cea experimentala y*(t) va fi:

)Tt(u]e1[)t(y mT

mTt

−−=−

72

t

y*(t)1

0,9

oTm (a)

A

B

Fig. 5.6

si este reprezentata în fig.5.6. Pe curba experimentala se marcheaza punctele A si B care corespund punctului de inflexiune si, respectiv, punctului de ordonata y*(t)=0.9. Punctele )y,t(A *

AA si )y,t(B *BB sunt folosite pentru determinarea

parametrilor T si Tm, impunând conditia de concordanta a celor doua curbe în aceste puncte. Observatie . Tm nu este un timp mort real ci unul de calcul, astfel încât aproximarea globala sa fie cât mai buna. Daca exista si un timp mort real, acesta se adauga la cel calculat.

Pentru t>Tm si TmTt

e1)t(y−

−= , folosind conditiile de trecere prin punctele A si B, rezulta:

)y1ln()y1ln()y1ln(t)y1ln(t

T)y1ln()y1ln(

ttT *

BA

*BAAB

m*BA

AB

−−−−−−

=−−−

−= ∗

∗

∗

Erorile cele mai mari apar în portiunea initiala, lipsa de precizie fiind justificata prin aceea ca, din totalitatea informatiilor din proces continute în functia indiciala, se utilizeaza numai cele referitoare la punctele A si B. Pentru modelele de tipul (2) si (3), metodele grafice preconizate de Strejc conduc la nomograme pe baza carora se pot aprecia parametrii modelelor. Metodele se bazeaza pe o serie de constructii grafice realizate pe baza raspunsului indicial normat experimental, din care rezulta marimi în functie de care sunt construite nomogramele [3]. Avantajul simplitatii metodei este umbrit de deficientele acesteia, care constau în precizia scazuta asigurata de constructia grafica si de faptul ca pentru determinarea parametrilor nu sunt utilizate în întregime informatiile continute în raspunsul indicial experimental. c) Aproximarea curbelor experimentale prin expresii de forma solutiilor unor ecuatii diferentiale liniare cu coeficienti constanti

Daca dispunem de reprezentarea functiei indiciale experimentale y(t), care nu are componente oscilatorii, atunci aproximarea analitica a acesteia se poate face printr-o expresie de forma:

∑=

α−−=n

1i

ti0

ieCC)t(y~

în care C0 este valoarea stabilizata a functiei indiciale, Ci sunt coeficienti reali, iar αi sunt exponenti reali pozitivi, ceea ce presupune ca functia de transfer are poli simpli si negativi.

73

Pentru ca ( )ty~ sa fie determinata este necesar sa cunoastem Ci , αi si n. Metoda propusa [3] este grafoanalitica de aproximari succesive. Ea consta în aproximarea curbei y(t) mai întâi prin solutia unei ecuatii de ordinul unu si, daca aceasta nu este corespunzatoare, prin solutia unei ecuatii de ordinul doi s.a.m.d. Metoda este justificata deoarece, în cazul radacinilor simple, reale si negative, exista o radacina preponderenta, cea mai apropiata de origine, restul dând componente care se amortizeaza rapid. Pasul 1. Fie y(t) raspunsul indicial experimental pe care îl aproximam cu:

( ) ( ) .cunoscutCtyCcueCCty~ 0s0t

1011 ==−= α−

Eroarea de aproximare va fi t101

1eCC)t(y)t(y~)t(y)t( α−+−=−=ε iar valorile optime ale coeficientilor se deduc din conditia ε1(t)=0 (∀)t. Solutia aproximativa a acestei probleme poate fi obtinuta pe cale grafica deoarece ecuatia:

t10

1eC)t(yC α−=− conduce la sistemul:

α−=−−=

tCln)t(yCln))t(yC(signsignC

110

01

Primul membru al ecuatiei a doua din sistem este de fapt o functie cunoscuta de datele experimentale, iar membrul al doilea este o dreapta prin trasarea careia rezulta valorile aproximative 1C si 1α . Cu aceste valori eroarea

devine: .eCC)t(y)t(ˆ tˆ101

1α−−−=ε Daca aceasta eroare este suficient de mica în tot domeniul [0,ts], atunci admitem prima aproximatie. În caz contrar recurgem la o a doua aproximare. Pasul 2. Consideram t

2tˆ

10221 eCeCC)t(y~ α−α− −−= , urmând sa determinam

coeficientii C2 si α2 din conditia:

0eC)t(ˆeCeCC)t(y)t( t221

t22

t1ˆ102 =+ε=++−=ε α−α−α−

Procedând ca la pasul 1, rezulta sistemul:

α−=εε−=

221

12

Cln)t(ˆln)t(ˆsignsignC

de unde prin aproximare rezulta 2C si 2α , )t(ˆ1ε fiind cunoscut de la pasul anterior.

Eroarea rezultata va fi ( ) ( ) tˆ212

2eCtˆtˆ α−+ε=ε . Procedeul poate fi continuat pâna când ].t,0[t)(0)t(ˆ sn ∈∀=ε Dezavantajul metodei este precizia scazuta datorita aproximarii coeficientilor Ci si αi la fiecare pas, dar oricum mai buna decât în metodele precedente, deoarece aici numarul de puncte y(t) poate fi foarte mare, deci informatia continuta în raspunsul indicial poate fi bine utilizata. Metoda are si un avantaj substantial si anume acela ca permite determinarea usoara a unei functii de transfer în forma factorizata.

Daca aproximarea de ordin n este:

74

tˆn

1ii0n

ieCC)t(y α−

=∑−=

corectitudinea determinarii constantelor poate fi verificata prin intermediul relatiilor relative la conditiile initiale. Daca:

0Cˆ.....CˆCˆ;0CCn

1ii

1ni

n

1ii

2i

n

1iii

n

1ii0 =α==α=α=− ∑∑∑∑

=

−

===

sunt verificate (evident cu aceeasi precizie cu care am obtinut 0)t(ˆn =ε ), ceea ce înseamna ca sistemul, plecând din conditii initiale nule, nu prezinta zerouri, functia de transfer corespunzatoare va fi:

( ).

ˆs

ˆC)s(W n

1ii

n

1iio

∏

∏

=

=

α+

α=

Daca relatiile precedente sunt satisfacute pâna la derivata de ordin q, atunci functia de transfer prezinta zerouri fiind de forma:

( ) .)ˆs(ˆ

)ˆs(ˆCsW n

1ii

qn

1ii

qn

1ii

n

1iio

∏∏

∏∏

=

−

=

−

==

α+β

β+α=

De fapt functia de transfer poate fi determinata din relatia )]t(yL[s)s(W n= . Metoda poate fi extinsa si la cazul în care raspunsul indicial contine componente oscilatorii [3]. d) Metode de optimizare parametrica Raspunsul indicial sau functia pondere experimentala pot fi obtinute relativ simplu, iar datele discretizate în conformitate cu teorema de esantionare. Daca adoptam pentru modelul parametric o functie de transfer de o anumita forma (cu o anumita structura), putem deduce coeficientii acesteia printr-o metoda de optimizare parametrica. Putem impune un model simplificat de forma:

)sT1)(sT1(K

)s(W)sT1(

K)s(W

sT1K

)s(W21

3221 ++=

+=

+=

vectorul parametrilor fiind θ=[K,T] în primele doua cazuri si θ=[K,T1,T2] în cel de al treilea, sau un model de forma generala:

∏

∏

∏

∏

=

=

=

=

+

+⋅⋅= n

1ii

m

1ii

m

1ii

n

1ii

)ps(

)zs(

z

pk)s(W

caz în care θ=[K,z1,z2,..zm,p1,p2,..,pn]T. Functia criteriu este eroarea medie

patratica de modelare: ∑∑=

∗

=−=ε=θ

N

1t

2N

1t

2 ))t(y)t(y()t()(V în care y*(t) este

raspunsul indicial experimental, iar y(t) este raspunsul indicial corespunzator

75

modelului adoptat. Valorile optime ale parametrilor θ vor fi cele care minimizeaza V(?). Pentru modelul în forma generala raspunsul y(t) este:

]e)pp(p

)pz(

z

p1[K)t(y tp

n

1iijj

m

1ijin

1jm

1ii

n

1ii

j−

=

=

=

=

= ⋅−

−⋅+⋅=

∑

∑∑

∑

∑

În toate cazurile functia criteriu este puternic neliniara în parametri, ceea ce presupune utilizarea unei tehnici de optimizare corespunzatoare (gradienti conjugati, Rosenbrock etc.), care presupun initializari corecte. În cazul modelului în forma generala numarul polilor si zerourilor trebuie fixat (deci precizata structura). Daca modificam structura astfel încât modelul sa fie din ce în ce mai complex, pastrând m<n, vom obtine un sir de modele M(θ1),M(θ2) ,...,M(θk) si un sir de minime ale functie i criteriu corespunzatoare V(θ1), V(θ2),...,V(θk) care au în general o evolutie descrescatoare. Procedura poate fi oprita când minimul functiei criteriu nu mai scade semnificativ.

5.1.4. Deducerea functiei de transfer din caracteristicile de frecventa determinate experimental

Metodele folosite sunt grafoanalitice sau de optimizare parametrica si necesita prelucrarea prealabila a caracteristicilor de frecventa în vederea extragerii partii care îndeplineste conditia de faza minima, dupa care aceasta se aproximeaza cu cea corespunzatoare unei functii de transfer cu structura cunoscuta, dar cu parametri necunoscuti. Elementele care nu îndeplinesc conditia de faza minima sunt, practic, cele care prezinta timp mort sau care au parametri distribuiti, în care caz functia de transfer contine factorul msTe− . Neunivocitatea între caracteristicile A(ω) si ϕ(ω) mai apare si atunci când functia de transfer prezinta poli de ordinul k în origine. În astfel de cazuri se recurge în primul rând la extragerea elementelor care introduc neunivocitati. Se considera astfel:

(M) rsT

n

1jj

m

1ii

rsT

u s1

e)s1(

)sT1(k

s1

e)s(W)s(W mm −

=

=−

∏

∏

τ+

+==

Timpul mort se poate aprecia din raspunsul indicial, ca si existenta polilor în origine de altfel. Ramân astfel de determinat caracteristicile Ti, τj si k care caracterizeaza partea univoca Wu(s) a functiei de transfer. a) Metoda bazata pe aproximarea caracteristicilor logaritmice de frecventa Aceasta permite si evidentierea polilor în origine si a timpului mort, precum si structura functiei de transfer. Se stie ca pentru o functie de transfer de forma (M), caracteristica logaritmica de frecventa este:

ω−π−ωτ−ω=ωϕ

τω+−ω++=ω

∑ ∑

∑ ∑

= =

= =m

1i

n

1jmji

m

1i

n

1j

2j

22i

2dB

T2

rarctgTarctg)(

)1lg(20)T1lg(20klg20)(A 21

21

76

Putem aproxima caracteristica ( )ω∗dBA dedusa experimental prin drepte

de panta standard 0 dB/dec, ±20 dB/dec, ±40 dB/dec s.a.m.d. Trasarea dreptelor se face astfel încât în punctele de intersectie caracteristica aproximativa sa nu difere de cea experimentala cu mai mult de 3 dB. Pulsatiile corespunzatoare punctelor de frângere ωi sunt inversele constantelor de timp. Un exemplu este prezentat în fig. 5.7. Functia de transfer corespunzatoare caracteristicii aproximative AdB(ω) este:

)sT1(sT11

sT11

k)s(W 321

+++

=

unde 332211 1T,1T,1T ω=ω=ω= corespund pulsatiilor de frângere iar 20lgk=80 corespunzând aproximarii de panta 0 dB/dec.

o

-20

20

40

60

800dB/dec

-20 dB/dec

-40 dB/dec

-20 dB/dec

ω1 ω ω2 3

10 -3 10 -2 10 -1 1

ω

A*dB

A*dB

Fig. 5.7

Caracteristica faza frecventa ϕ(ω) corespunzatoare acestei functii de transfer este folosita pentru verificarea corectitudinii deducerii functiei de transfer prin compararea cu ( )ωϕ∗ dedusa pe cale experimentala. Daca în prealabil nu a fost extras elementul cu timp mort Tm, atunci caracteristica experimentala va diferi de cea calculata cu -ωTm.. Daca diferenta nu creste proportional cu pulsatia înseamna ca aproximarea caracteristicii ( )ω∗

dBA nu a fost corect efectuata (erori mai mari de 3 dB în punctele de frângere). Având în vedere ca ( )ω∗

dBA si ϕ*(ω) nu pot fi determinate cu suficienta precizie în întreaga banda de frecventa, au fost elaborate metode de calcul al functiei de transfer numai pe baza caracteristicilor de frecventa, din zona frecventelor joase sau numai din zona frecventelor mari [5]. b) Metoda de optimizare parametrica Aceasta metoda, prezentata în [6], presupune cunoasterea caracteristicilor de frecventa experimentale )( ),(A k

*k

* ωϕω , k=0,1,2,...,p din care se pot determina:

)cos()(A)(H kkkre ωω=ω ∗∗ si ),(sin)(A)(H kkk*im ωϕω=ω ∗

deci factorul de amplificare complex experimental:

77

p,...,2,1,0k),(jH)(H)j(H k*imk

*rek

* =ω+ω=ω . Se considera un model cu structura precizata:

(M) ∑

∑

=

=

+== n

1j

jj

m

0i

ii

sb1

sa

)s(B)s(A

)s(H

caruia îi corespunde factorul de amplificare complex:

.p,....,2,1,0k;)j(B)j(A

)j(Hk

kk =

ωω=ω

Vectorul parametrilor este: [ ] .b,......,b,a,....,a,a Tn1m10=θ

O alegere naturala a functiei criteriu de forma: 2

kk*

k

p

0k2

k

p

0k

2

kk* )j(A)j(H)j(B

)j(B

1)j(H)j(H)(V ω−ωω

ω=ω−ω=θ ∑∑

==

care este puternic neliniara în parametri, conduce la necesitatea utilizarii unui algoritm de programare neliniara. Daca:

∑=

ω−ωω=θp

0k

2

kk*2

k )j(H)j(H)j(B)(V

criteriul devine patratic în parametri si problema de optimizare:

)(Vminargˆ θ=θθ

poate fi rezolvata analitic. Criteriul poate fi interpretat ca un criteriu al celor mai

mici patrate ponderate cu functia de ponderare 2k )j(B ω . Aceasta ponderare nu

este corespunzatoare în tot domeniul frecventelor (la frecvente mici functia de ponderare are valori mici si deci precizia de estimare este mica fiind afectat în special factorul de amplificare). Dificultatea este depasita daca se recurge la un algoritm iterativ, cu functia criteriu la pasul i de forma:

=ω

ω−ωω

ω=θ ∑

= −

1)j(B

)j(H)j(H)j(B

)j(B)(V

k0

p

0k

2

ki

k*

2

k1i

kiii

Întrucât criteriul ramâne patratic în ?i, (Bi-1(j? k) fiind cunoscut de la pasul anterior), vectorul parametrilor la iteratia i poate fi determinat analitic.

Deoarece 1)j(B/)j(B 2k1iki →ωω − cu cresterea lui i [7] ponderea se

pastreaza corespunzatoare în tot domeniul frecventelor. În acelasi articol se demonstreaza ca metoda iterativa este convergenta. La fiecare iteratie vectorul

)(Vminarg iii θ=θθ

este determinat rezolvând un sistem de ecuatii liniare.

Datorita initializarii 1)j(B k0 =ω , parametrii obtinuti la prima iteratie sunt cei determinati prin minimizarea criteriului celor mai mici patrate ponderate.

78

Ca si la deducerea functiei de transfer din raspunsul indicial, procedura se aplica pentru un set de structuri ale modelului (gradele polinoamelor A si B) din ce în ce mai complicate retinând acea structura pentru care se obtine o descrestere nesemnificativa a minimului functiei criteriu.

5.2. Identificarea sistemelor liniare cu semnale de proba aleatoare Utilizarea semnalelor de proba aleatoare introduce o serie de complicatii în ceea ce priveste interpretarea datelor experimentale. Stabilirea unei legaturi directe între rezultatele obtinute si caracteristicile dinamice ale procesului, sub una din formele care pot defini modelul matematic liniarizat, este posibila numai asigurând stationaritatea si ergodicitatea semnalului de proba. Totusi, avantajul principal de a elimina sau reduce influenta perturbatiilor le situeaza printre metodele cel mai frecvent utilizate. În plus, identificarea cu semnale de proba aleatoare se poate efectua, cu anumite restrictii, fara scoaterea din functiune a procesului tehnologic. Ca si celelalte procedee de identificare care utilizeaza semnale de proba, si în acest caz se obtin modele neparametrice (functie pondere, caracteristici de frecventa), ceea ce implica o schimbare ulterioara de reprezentare. 5.2.1. Principiul metodelor de identificare Pentru sistemele SISO, deducerea modelului matematic în domeniul timpului utilizeaza relatia Wiener-Hopf,

dt)t(r)t(h)(r u0uy −τ=τ ∫∞

care necesita cunoasterea functiilor de corelatie dintre datele experimentale. Din relatie se observa ca pentru un semnal de intrare u(t) de tip zgomot alb, pentru care functia de autocorelatie este impulsul Dirac, rezulta )(r)(h uy τ=τ . În acest caz functia pondere poate fi determinata prin calculul functiei de intercorelatiei din datele intrare-iesire. Daca semnalul de intrare este un proces aleator oarecare este necesara o metoda de rezolvare a ecuatiei integrale, necunoscuta fiind functia h(τ). În domeniul frecventelor identificarea se poate face cu ajutorul relatiilor care leaga densitatile spectrale ale intrarii si iesirii:

)(S)j(W)(S

)(S)j(W)(S

u2

y

uuy

ωω=ω

ωω=ω

Si aici se observa ca daca semnalul de intrare este zgomotul alb, care are densitatea spectrala constanta, functia densitate interspectrala reprezinta factorul de amplificare complex, iar densitatea spectrala a marimii de iesire, caracteristica atenuare frecventa. În cazul sistemelor stohastice liniare marimea de iesire este afectata de perturbatia v(t) (fig. 5.3). Presupunând ca intrarea u(t) si perturbatia v(t) sunt necorelate si, pentru simplitate, de medii nule 0)]t(v[M)]t(u[M == , atunci:

)t(vd)t(u)(h)t(y 0 +ττ−τ= ∫∞

În acest caz intercorelatia intrare-iesire devine:

79

( )

)(rd)(r)(h

)]t(v)t(u[Md)]t(u)t(u[M)(h

])t(vd)t(u)(h)t(u[M)]t(y)t(u[Mr

uvu0

0

0uy

τ+σσ−τσ=

=τ++σσ−τ+σ=

=τ++σσ−τ+σ=τ+=

∫

∫

∫

∞

∞

∞∆

ultima egalitate fiind valabila în ipoteza stationaritatii semnalelor de intrare si de perturbatie. Cum u(t) si v(t) sunt necorelate, ruv(τ)=0 (∀)τ, deci:

σσ−τσ=τ ∫∞ d)(r)(h)(r u0uy

iar în cazul discret (τ=k∆, σ=n∆, n=0,∞), ( )∆−∆∆=∆ ∑∞

=)nk(r)n(h)k(r u

0nuy .

De aici se observa avantajul metodei, care, cel putin în domeniul timpului nu este sensibila la influenta perturbatiilor exterioare. Cum se transforma relatiile în domeniul frecventelor în cazul sistemelor perturbate ? Pentru aceasta sa evaluam întâi functia de corelatie a iesirii:

).(rd)(r)(hd)(r)(hdd)(r)(h)(h

)])t(vd)t(u)(h)()t(vd)t(u)(h[(M)]t(y)t(y[M)(r

v0 uv0 vuu0 0

00y

τ+σσ+θσ+θθ−σθ+θσθ−σ+τθσ=

=τ++θθ−τ+θ+σσ−σ=τ+=τ

∫∫∫ ∫

∫∫∞∞∞ ∞

∞∞∆

Deoarece u(t) si v(t) sunt necorelate, relatia devine:

).(rdd)(r)(h)(h)(r vu0 0y τ+θσθ−σ+τθσ=τ ∫ ∫∞ ∞

Aplicând transformata Fouriér, rezulta:

).(Sddde)(r)(h)(h)](r[F)(S vj

uRyy 3ω+τθσθ−σ+τθσ=τ=ω ωτ−

∆

∫ +

Dupa schimbarea de variabile τ+σ-θ=α, σ=β, θ=γ rezulta:

)(S)(S)j(W)(S vu2

y ω+ωω=ω unde )].t(h[F)j(W =ω În mod asemanator, din relatia:

σσ−τσ=τ+=τ ∫∞

∆d)(r)(h)]t(y)t(u[M)(r u0uy

obtinem, prin aplicarea transformatei Fouriér: ).(S)j(W)(S uuy ωω=ω

Cele doua relatii arata ca, din autospectrele intrarii si iesirii, modulul factorului de amplificare complex se poate determina numai cu aproximatie datorita autospectrului semnalului perturbator, însa W(jω) poate fi determinat cu ajutorul densitatii interspectrale care nu este afectata de zgomot, deci:

)(j

u

uy e)j(W)j(S

)j(S)j(W ωϕω=

ω

ω=ω

Deoarece densitatea interspectrala este o functie complexa:

)(jB)(A)j(S uyuyuy ω−ω=ω

80

rezulta:

ωω

−=ωϕ

ω

ω=ω

.)(A

)(Barctg)(

)(S

)j(S)j(W

uy

uy

u

uy

Auy(ω) si Buy(ω) se mai numesc cospectru si, respectiv, cuadspectru sau spectru în cuadratura. Tinând seama de expresia modulului factorului de amplificare complex determinat prin interspectru, se poate defini asa-numitul spectru de coerenta (sau coerenta) care joaca rolul coeficientului de corelatie din domeniu l timpului:

)(S)(S)(S)(S

)j(S)(S)(S

)(S

)j(S)(S vy

yu

2uy

vu2u

uyy ω+ω

ωω

ω=ω+ω

ω

ω=ω

sau: )(S)](C1)[(S v2uyy ω=ω−ω în care am notat functia de coerenta:

)(S)(S

)j(S)(C

yu

2

uy2uy ωω

ω=ω

În acest caz, legatura între densitatile spectrale ale intrarii si iesirii devine:

).(S)j(W)(S)(C u2

y2uy ωω=ωω

Daca ( )ω∀=ω ,0)(C2uy si u(t) este semnalul persistent SPn (având

spectrul nenul în cel putin n puncte), rezulta ca )(0)j(W ω∀=ω , deci între intrare si iesire nu exista legatura, spectrul semnalului de iesire coincide cu cel al

zgomotului. Daca ( )ω∀=ω 1)(C2uy , atunci )(S)j(W)(S u

2y ωω=ω .

si deci spectrul iesirii se datoreaza în exclusivitate intrarii, sistemul nefiind de fapt perturbat. Functia de coerenta reprezinta deci o masura a dependentei între iesire si intrare la diferite frecvente ale semnalului de intrare. Sa consideram acum sistemul liniar în circuit închis cu structura din fig. 5.8. Este posibil sa determinam un model pentru procesul tehnologic chiar daca acesta este în functionare normala, în bucla închisa cu dispozitivul de automatizare, utilizând un semnal de proba x(t) aleator de medie nula M[x(t)]=0 (în acest fel influenta medie asupra iesirii este de asemenea nula în medie).

H1(s) H(s)u(t) +-

x(t)

++

xc(t)y(t)

Dispozitiv de automatizare Proces tehnologic Fig. 5.8

Evident, în acest caz intrarea u(t) si semnalul de proba x(t) sunt necorelate. Consideram H(s) functia de transfer si h(t)=L-1H(s) functia pondere a procesului tehnologic.

81

Aplicând teorema suprapunerii efectelor obtinem:

++

+=

++

+=

)s(X)s(H)s(H1

1)s(U

)s(H)s(H1)s(H

)s(X

)s(X)s(H)s(H1

)s(H)s(U

)s(H)s(H1)s(H)s(H

)s(Y

11

1c

11

1

iar în domeniul timpului:

θθ−θ+θθ−θ=

θθ−θ+θθ−θ=

∫ ∫∫ ∫

∞ ∞

∞ ∞

0 0 dcc

0 0 ba

d)t(x)(hd)t(u)(h)t(x

d)t(x)(hd)t(u)(h)t(y

în care ha(t), hb(t), hc(t) si hd(t) sunt functiile pondere corespunzatoare functiilor de transfer din relatiile precedente. Sa calculam functiile de intercorelatie rxy(τ) si ( )τ

cxxr :

]d)t(u)t(h)t(xd)t(u)t(h)t(x[M)]t(y)t(x[M)(r 0 0 baxy ∫ ∫∞ ∞ θθ−τ++θθ−τ+=τ+=τ

sau: ∫ ∫∞ ∞ θθ−τθ+θθ−τθ=τ 0 0 xbxuaxy d)(r)(hd)(r)(h)(r

Similar, .d)(r)(hd)(r)(h)(r 0 0 xdxucxx c ∫ ∫∞ ∞ θθ−τθ+θθ−τθ=τ

Cum x(t) si u(t) sunt necorelate, rezulta rxu(τ)=0 (∀)τ deci:

θθ−τθ=τ

θθ−τθ=τ

∫∫

∞

∞

0 xdxx

0 xbxy

d)(r)(h)(r

d)(r)(h)(r

c

.

Daca semnalul de proba x(t) este zgomot alb, atunci rx(t)=δ(t) si relatiile de mai sus devin:

τ=ττ=τ

)(r)(h)(r)(h

cxxd

xyb

Deoarece: )s(H)s(H1

1)s(H

)s(H)s(H1)s(H

11 +=

+

functiile pondere corespunzatoare sunt în relatia (Poncelet):

.d)(h)(h)(h 0 db θθ−τθ=τ ∫∞

De aici rezulta: ∫∞ θθ−τθ=τ 0 xxxy d)(r)(h)(r

c

relatie asemanatoare cu ecuatia Wiener-Hopf, care permite determinarea functiei pondere a procesului tehnologic pe baza masuratorilor functiilor de corelatie rxy(τ) si )(r

cxx τ .

În domeniul complex,

)(S)j(H)j(H1

1)j(S);(S

)j(H)j(H1)j(H

)j(S x1

xxx1

xy cω

ωω+=ωω

ωω+ω=ω

de unde rezulta prin raportare .)j(S)j(S)j(Hcxxxy ωω=ω

Daca x(t) nu este zgomot alb, functiile pondere hb(t) si hd(t) se pot obtine

82

numai prin rezolvarea ecuatiilor integrale corespunzatoare (deconvolutie). Din enuntarea principiala a acestor metode se poate observa ca aplicarea lor în conditii avantajoase este legata de: - adoptarea si generarea de semnale de proba cu caracteristici convenabile (apropiate de zgomotul alb); - obtinerea cu precizie ridicata a functiilor de corelatie sau densitate spectrala, în conditii acceptabile de procesul tehnologic; - rezolvarea cât mai usoara a ecuatiilor Wiener-Hopf pentru deducerea functiei pondere. Despre adaptarea si generarea semnalelor de proba am discutat în capitolele precedente. În ce priveste obtinerea functiilor de corelatie si densitate spectrala din datele intrare-iesire se ridica probleme legate de erorile de metoda si de masurare. Majoritatea acestora se datoreaza trunchierii datelor (considerarea unor esantioane de date de lungime finita T) si esantionarii.

5.2.2. Estimarea functiilor de corelatie

Dupa cum se stie, atât relatiile Wiener-Hopf cât si cele în domeniul frecventelor sunt valabile în ipoteza stationaritatii semnalului de intrare u(t). Daca acesta este ergodic, atunci media pe ansamblu poate fi înlocuita cu estimatorul pe baza unei singure realizari

∫= T0

Tu .dt)t(u

T1

m

Am aratat [anexa 2.1] ca acest estimator este absolut corect, dispersia lui tinzând catre zero când T→∞. În mod asemanator se pot introduce estimatorii pentru functiile de corelatie:

dt)t(y)t(uT1

)(r

dt)t(y)t(yT1

)(r

dt)t(u)t(uT1

)(r

T0

Tuy

T0

Ty

T0

Tu

τ+=τ

τ+=τ

τ+=τ

∫

∫

∫

Desigur, acesti estimatori sunt variabile aleatoare depinzând de esantion, iar calitatile lor depind de durata T a esantionului (realizarii). Sa analizam proprietatile lor care definesc de fapt precizia de aproximare, pentru semnale ergodice de medie nula:

.)(rdt)(rT1

]dt)t(u)t(uT1

[M)](r[M T0 uu

T0

Tu ∫∫ τ=τ=τ+=τ

∆

Similar, )(r)](r[M yTy τ=τ si )(r)](r[M uy

Tuy τ=τ , deci estimatorii functiei de

corelatie sunt nedeviati. Rezulta ca în calculul functiilor de corelatie se produce o eroare datorata trunchierii datelor la un interval de lungime finita. În realitate datele de intrare-

83

iesire sunt la rândul lor discretizate, adica:

T

T

)]N(y),....,2(y),1(y[)t(y

)]N(u),....,2(u),1(u[)t(u

=

=

intervalul de esantionare fiind ∆=1 pentru simplitate. Discretizarea introduce la rândul ei erori care se dovedesc a fi suficient de mici daca intervalul de esantionare este ales corespunzator. Calculul estimatorilor în acest caz se realizeaza prin discretizarea integralelor care îi definesc. Considerând T=N∆, t=n∆ si τ=k∆, rezulta (∆=1):

....2,1,0k)kn(y)n(uN1

)k(r

....2,1,0k)kn(u)n(uN1

)k(r

N

1n

Tuy

N

1n

Tu

=+=

=+=

∑

∑

=

=

Deoarece nu dispunem decât de N date, sumele trebuie restrânse astfel încât, pentru ∆=1, rezulta:

)kn(y)n(u

kN1

)k(r

)kn(u)n(ukN

1)k(r

kN

1n

Tuy

kN

1n

Tu

+−

=

+−

=

∑

∑−

=

−

= k=0,1,2,…

Se observa ca aproximarea este din ce în ce mai slaba pe masura cresterii lui k. Practic, o precizie acceptabila se poate obtine pentru k≤N/3.

5.2.3. Estimarea densitatilor spectrale

Prin definitie:

)](r[Fde )(r)(S uj

0 uu τ=ττ=ω ωτ−∞∆

∫

)](r[Fde )(r)(S uyj

0 uyuy τ=ττ=ω ωτ−∞∆

∫ . Pentru definirea unor estimatori ai densitatilor spectrale sa observam ca prin trunchiere se amplifica erorile, prin delimitarea intervalului de integrare si prin înlocuirea integranzilor prin estimatorii lor. Astfel estimatorii posibili ai densitatilor spectrale sunt:

.de )(r)(S

de )(r)(Sj

0Tuy

Tuy

j0

Tu

Tu

ττ=ω

ττ=ωωτ−∞

ωτ−∞

∫

∫

În acest caz:

.dtde)t(u)t(uT1

dedt)t(u)t(uT1

)(S jT0

T0

jT0

T0

Tu τ⋅τ+=τ⋅

τ+=ω ωτ−ωτ− ∫ ∫∫ ∫

Cu schimbarea de variabila t+τ=θ, t=ρ, rezulta:

)j(U)j(UT1

dde)(u)(uT1

)(S TT)(jT0

T0

Tu ω−ω=θρθρ=ω ρ−θω−∫ ∫

84

în care ρρ=ω ωρ−∫ de)(u)j(U jT0

T si, în final, 2TT

u )j(UT1

)(S ω=ω . Similar,

)j(Y)j(UT1

)(S TTTuy ω−ω=ω

UT(jω) si YT(jω) fiind deci transformatele Fouriér trunchiate ale semnalelor de intrare u(t) si respectiv iesire y(t). Acesti estimatori sunt asimptotic nedeviati. Într-adevar,

∫∫∫ ττ=ττ=ττ=ω ωτ−ωτ−ωτ− T0

ju

jT0

Tu

T0

jTu

Tu de)(rde )](r[M]de)(r[M)](S[M .

Se constata ca:

).(Sde)(r)](S[Mlim u0j

uTu

Tω=τω=ω ∫

∞ ωτ−

∞→

În mod asemanator rezulta ca ).(S)](S[Mlim uyTuy

Tω=ω

∞→ În ceea ce

priveste dispersiile acestor estimatori se poate arata ca acestia nu depind de lungimea tronsonului de date ci de parametri statistici ai semnalelor u(t) si y(t), ceea ce face ca estimatorii sa nu fie consistenti [8]. Totusi, influenta trunchierii poate fi considerabil micsorata prin folosirea asa-numitelor "ferestre de ponderare" si, daca dispunem de un algoritm bun de calcul al transformatei Fouriér a semnalelor, estimatorii pot deveni suficient de performanti. Daca u(t), t∈[0,∞), este un semnal oarecare si uT(t), t∈[0,T] este acelasi semnal trunchiat, observat doar în intervalul [0,T], acesta din urma este echivalent cu produsul dintre u(t) si o functie

( ) ∈

= rest în 0

]T,0[tpentru 1tf

numita poarta (fereastra temporala), dupa cum se observa si în fig. 5.9, deci:

)t(f)t(u)t(u T = .

În baza teoremei de convolutie în complex, rezulta ca:

)]t(f[F)]t(u[F)]t(u[F T ⊗=

Cu alte cuvinte, spectrul uT(t) difera de cel al semnalului real u(t) datorita convolutiei cu spectrul "ferestrei temporale" f(t). Daca însa F[f(t)] ar fi impulsul Dirac, atunci, evident:

)]t(u[F)]t(u[F T = . Înlocuind deci f(t) cu o alta functie, a carui spectru aproximeaza suficient de bine functia Dirac, obtinem un spectru UT(jω) "netezit", mai apropiat de spectrul real. Câteva astfel de functii sunt urmatoarele:

0

0

0

u(t)

t

t

f(t)

u T (t)

t

T

TFig. 5.9

85

1. Fereastra triunghiulara: ( ) [ ][ ]

∈+−−∈+

=ΛT,0tpentruTt10,TtpentruTt1

t

2. Fereastra Barlett: ( ) ∈−

= restîn0

]T,0[tpentruTt1tB

3. Fereastra Hamming generalizata:

( ) ( )

−∈π−α+α=

restîn 02T

,2T

tt2cos1tH T

m .

În cazul α=0,54, functia se numeste fereastra Hanning. 4. Fereastra Blackman:

−∈π+π+

=restîn0

]2/T,2/T[tpentruTt4cos08,0Tt2cos5,042,0)t(W

Desigur precizia estimatorilor depinde si de precizia de estimare a transformatei Fouriér din datele intrare-iesire care sunt de regula discretizate. Consideram u(t)=[u(0),u(∆),...,u((N-1)∆)]T. Prin definitie:

.udte)t(u)f2j(U)j(U ntnjf2

0nn

∆π−∞∆==π=ω ∫

Prin discretizare, t=k∆ k=0,1,2,...., rezulta: ∆π−∞

=∑ ∆∆== knjf2

0knn e)k(u)f(uu

unde ,2/1ff0 cn ∆=<< ceea ce înseamna ca frecventa maxima posibila în care se poate calcula transformata Fouriér corespunde perioadei 2∆, conform teoremei Shannon. Putem considera ]]2/N[,0[ncu N/nfn ∈∆= si în acest caz:

k

Nn

j2

0knn e)k(u)f(uu

π−∞

=∑ ∆∆== .

Efectul trunchierii consta în limitarea sumei, deci: k

Nn

j21N

0k

Tn e)k(uu

π−−

=∑ ∆∆=

si, dupa cum am aratat, acest efect poate fi micsorat folosind o functie de ponderare w(k∆) oarecare, deci:

kNn

j21N

0k

Tn e)k(u)k(wu

π−−

=∑ ∆∆∆=

Pentru reducerea si mai accentuata a efectului trunchierii, cea mai cunoscuta tehnica, din punct de vedere numeric, este urmatoarea: - pentru estimarea densitatii spectrale în M+1 puncte (frecvente distincte), cuprinse între 0 si fc=1/2∆, se împarte esantionul de date în k segmente de lungime 2M. Pentru fiecare segment se calculeaza estimatorul pe

86

baza a 2M date în (M+1) puncte si, în final, cei k estimatori se mediaza pentru fiecare frecventa. Se poate demonstra ca prin acest procedeu dispersia estimatorului densitatii spectrale se reduce de k ori. Efectul discretizarii datelor se manifesta prin suprapunerea în spectru a componentelor corespunzatoare frecventelor fn si fn+pN (p întreg). Într-adevar:

( ) ( ) ( ).fueekup

nn

uN

pNnufu n

jpk2kNn

j21N

0kpNn =∆∆=

∆+

∆=

∆+

= π−π−−

=+ ∑

deoarece p este întreg si e-2πjpk=1. Pentru a diminua acest fenomen (aliasing) esantionarea trebuie facuta cu frecventa suficient de mare (∆ mic) pentru ca în afara intervalului 0<f<fc sa ramâna cât mai putine componente ale spectrului. În forma data, transformata Fouriér discreta necesita un volum foarte mare de calcule pentru evaluarea ei în M puncte pe baza a N date, fiind necesare N2/2 operatii de multiplicare în complex pentru fiecare punct. Transformata Fouriér poate fi calculata numai prin Nlg2N operatii de multiplicare cu algoritmul rapid (TFR) propus de Danielson si Lanczos în 1942, cu variantele Cooley-Tukey. Diferenta de la N2 la Nlg2N este enorma, mai ales pentru valori mari ale lui N. Transformata Fouriér rapida se bazeaza pe descompunerea sumei care defineste TF discreta în doua componente, una corespunzatoare indicilor de sumare pari si alta celor impari (se recomanda N=2r).

( )( )

( ) .u eue)1i2(uee)i2(u

e)1i2(ue)i2(ue)k(u)f(u

in

Nnj2p

n

12N

0i

i2Nnj2

Nnj2i2

Nnj2

12N

0i

12N

0i

1i2Nnj2i2

Nnj2

12N

0i

kNnj21N

0kn

π−−

=

π−π−π−−

=

−

=

+π−π−−

=

π−−

=

+=∆+∆+∆∆=

=∆+∆+∆∆=∆∆=

∑∑

∑∑∑

în care pnu corespunde sumei în care u(k∆) este luat dupa indicii pari si i

nu celei în

care indicii sunt impari. Relatia poate fi folosita recursiv, deoarece la rândul lor pnu

si inu pot fi descompuse în componente de lungime N/4, ip

npin

ppn u,u,u si uii încât:

( ) .ueueueufu iin

Nn4

j2ipn

Nn3

j2pin

Nn2

j2ppnn

π−π−π−+++=

Daca N este putere întreaga a lui 2, procedura poate continua pâna când sumele se restrâng la un singur termen care este evident un element u(k) din sirul de date, deci, pastrând conventia de notatie, )k(uu ip....pipp

n = . Problema se pune de a gasi acel u(k∆) care corespunde elementului

ip....pippnu . Danielson si Lanczos au demonstrat ca daca se asociaza indicilor

superiori p si i respectiv valorile binare 0 si 1, atunci indicele superior al lui un , citit de la dreapta la stânga, privit ca numar binar, reprezinta valoarea lui k. În consecinta algoritmul foloseste drept coeficienti ai exponentialelor care apar datele u(k∆) asezate în alta ordine. De exemplu, presupunem 8 date:

87

Ordinea naturala u(0) u(1) u(2) u(3) u(4) u(5) u(6) u(7) k 000 001 010 011 100 101 110 111 kT 000 100 010 110 001 101 011 111

Ordinea TRF u(0) u(4) u(2) u(6) u(1) u(5) u(3) u(7)

5.2.4. Identificarea sistemelor liniare folosind marimile din functionarea normala

În cazurile în care procesul tehnologic nu poate fi întrerupt din functionarea normala sau nu accepta suprapunerea semnalelor de proba, este necesar sa se recurga la metode de identificare bazate pe datele de intrare-iesire masurate în functionarea normala a procesului. Caracterul aleator al marimilor de intrare si iesire din proces se datoreaza perturbatiilor în cazul sistemelor functionând în circuit închis si implica folosirea metodelor bazate pe functiile de corelatie sau de densitate spectrala. Aceste metode (pasive) presupun o atentie deosebita în prelucrarea datelor pentru a verifica conditiile de stationaritate a marimilor de intrare si iesire din sistem, precum si persistenta lor. Verificarea practica a stationaritatii se poate face în modul urmator: - se împarte durata T de observare a semnalului de intrare în M intervale de timp egale, care se esantioneaza cu un pas ∆. Pentru semnale rapid variabile intervalele pot fi adiacente, dar pentru cele lent variabile intervalele trebuie separate pentru a asigura necorelarea valorilor dintr-un interval în raport cu celelalte; - se calculeaza valorile medii si mediile patratice pe fiecare din aceste M intervale; - se cerceteaza variatiile sirurilor de valori medii si medii patratice. Daca aceste variatii sunt suficient de mici (sub o valoare prestabilita) putem admite stationaritatea semnalului. În cazul unor semnale nestationare se poate recurge la stationarizarea lor (eliminarea tendintei si a componentelor sezoniere). Alegerea perioadei de esantionare este dificila daca nu dispunem de informatii apriorice asupra spectrului de frecventa. O solutie posibila a problemei este alegerea perioadei ∆ în functie de viteza medie de variatie a semnalului, care, la rândul ei poate fi apreciata prin numarul mediu de intersectii ale curbei care reprezinta semnalul cu valoarea medie (altfel spus numarul mediu de schimbari de semn în semnalul centrat) [3]. Deducerea modelului procesului liniarizat se face tot pe baza relatiilor Wiener-Hopf în domeniul timp si a densitatilor spectrale în domeniul frecventelor. Deoarece în functionarea normala semnalul de intrare nu prezinta în general caracteristicile zgomotului alb, deducerea functiei pondere se face prin rezolvarea ecuatiei integrale în cazul continuu sau a sistemului:

.....2,1,0k)nk(r)n(h)k(r u0n

uy =−= ∑∞

=

în cazul unui sistem discret. Aceeasi problema se ridica oricând nu avem posibi-litatea de a aplica la intrare un semnal de proba de tip zgomot alb, si de

88

asemenea, în cazul identificarii în circuit închis cu semnal de proba când modelul rezulta prin rezolvarea ecuatiei:

.....2,1,0k)nk(r)n(h)k(rcxx

0nuy =−= ∑

∞

=

Dispunând de datele de intrare-iesire cuprinse în vectorii: u(t)=[u(1),...,u(N)]T si y(t)=[y(1),.....,y(N)]T

putem calcula functiile de corelatie cu aproximatiile amintite, deci vom dispune de vectorii:

Tuyuyuy

Tuuuu

)]m(r),...,0(r[r

)]m(r),...,1(r),0(r[r

=

= cu m≤N-3.

Se observa ca ecuatiile Wiener-Hopf vor fi inevitabil trunchiate. Dând lui k valori de la 0 la m, rezulta sistemul:

h)1m(R

)m(h

)1(h)0(h

)0(r)m(r

)1m(r)0(r)1(r

)m(r)1(r)0(r

r u

uu

uuu

uuu

uy +=

+−

−−

= MLL

LLLLLL

Matricea Ru(m+1) este matricea Toeplitz a semnalului de intrare, iar h este vectorul care contine valorile functiei pondere. Solutia h=Ru

-1ruy este posibila atunci când matricea Ru este nesingulara, deci când semnalul u(t) este SPm+1.

Bibliografie [1] Unhehanen H. - Ein graphisch analitisches Verfahren, Regelungstechnik

11/1963. [2] Werner G.W. - Ansvertung graphisch vor liegender Gewichtsfunctionen-

Messensteuern Regelungstechnik 9/1966. [3] Penescu C., Tertisco N., Identificarea experimentala a proceselor

industriale, Ed. Tehnica, 1970. [4] Strejc V., - Approximation Process for Aperiodic Transfer Characteristics -

Regelungstechnik 7, 1959. [5] Strejc V., The approximation of aperiodic transient responses - Messen, Stern,

Regel, 1960. [6] Tertisco M., Stoica P.- Determinarea f.d.t. din caracteristicile de frecventa.

Rev. Automatica si electronica Nr.3/1976. [7] Tertisco M., Stoica P.- Determinarea f.d.t. din caracteristicile de frecventa.

Rev. Automatica si electronica Nr.20/1976. [8] Stoica P, Tertisco M. - Modelarea si predictia seriilor de timp. Ed. Academica

1988.

89

CAPITOLUL 6

Estimatori de risc minim

6.1. Introducere Într-o problema concreta de identificare primul pas consta în alegerea clasei de modele în interiorul careia se cauta cea mai buna aproximatie a procesului tehnologic investigat. Daca tipul de model este de regresie sau parametric, ramâne de rezolvat problema esentiala a determinarii parametrilor acestuia. În principiu, aceasta problema poate fi rezolvata fie prin optimizare parametrica fie cu ajutorul teoriei estimatiei, dar, oricare ar fi modul de abordare, trebuie tinut seama de ipotezele care conditioneaza estimarea.

Presupunem sistemul (S) si un model (M) parametric reprezentate în figura 6.1 în care ( )∗−∗ θ,qG 1 este functia de transfer discreta a partii deterministe a sistemului, dependenta de parametrii θ*, G(q-1,θ) functia de transfer discreta a modelului partii deterministe dependenta de parametrii θ, iar v(t) este perturbatia.

G*(q-1,θ∗)

θ∗( )Proces tehnologic

ModelG(q -1,θ )

u(t)

v(t)

x(t) y(t)

ym(t) Model (M)

Sistem (S)

Fig. 6.1 Ipotezele care se fac asupra sistemului si modelului sunt urmatoarele: I1 - Sistemul este dinamic liniar, de ordin finit, asimptotic stabil, stohastic si liniar în parametri. I2 - Perturbatia este proces stohastic stationar de medie nula si matrice densitate spectrala rationala si nesingulara. I3 - Vectorul parametrilor θ* este unic. I4 - Exista un vector θ astfel încât G(q-1,θ)=G(q-1 ,θ*). I5 - Intrarea u(t) este semnal persistent de ordin suficient de mare. I6 - Intrarea u(t) si perturbatia v(t) sunt independente. Consecinte ale acestor ipoteze: 10 - Din prima ipoteza rezulta ca sistemul poate fi descris de ecuatia:

( ) ( ) ( ) ( )tvtu,qGty *1 +θ= −∗ unde G*(q-1,θ*) este functia de transfer discreta corespunzând unui sistem liniar stabil de ordin finit. 20 - Din ipoteza a doua rezulta ca: v(t)=H*(q-1)e(t)

90

unde e(t) este o secventa de zgomot alb de medie nula si matrice de covarianta λ*2I, iar H*(q-1) este functia de transfer discreta a unui filtru liniar stabil. În acest caz sistemul poate fi descris de ecuatia: (S) )t(e)q(H)t(u),q(G)t(y 11 −∗∗−∗ +θ= . 30 - Din primele doua ipoteze rezulta ca vectorul θ* poate fi extins cu parametrii modelului de zgomot H*(q-1) si dispersia λ*2 a secventei de zgomot alb. 40 - Ipoteza I4 conduce la concluzia ca este rational sa alegem un model (M) de aceeasi forma cu sistemul admis, adica:

(M)

ε=+θ=

−

−

)t()q(H)t(v)t(v)t(u),q(G)t(y

1

1m

unde ε(t) este o secventa de zgomot alb de medie nula si matrice de covarianta λ2I. Daca dorim o identificare completa, atât a partii deterministe cât si a partii stohastice a procesului tehnologic, vectorul parametrilor necunoscuti ai modelului trebuie evident extins cu parametrii functiei de transfer discrete H(q-1) si cu dispersia ?2 a

secventei de zgomot alb. Daca )q(A)q(B

)q(G 1

11

−∗

−∗−∗ = cu gradA*=na* si gradB*=nb*,

polinoamele A* si B* fiind prime între ele , având zerourile în afara cercului unitar (ceea ce asigura valabilitatea ipotezei I1), atunci în conformitate cu ipotezele I3 si I4 rezulta ca exista θ astfel încât:

),q(G)q(A

)q(B

)q(A

)q(B),q(G 1*

1

1

1

11 θ===θ −

−∗

−∗

−

−−

unde gradA(q-1)=na si gradB(q-1)=nb. Deoarece A* si B* sunt prime între ele, rezulta ca:

0)nbnb,nanamin(n ≥−−= ∗∗∆

∗ . Daca n*>0 atunci na>na* si nb>nb* (modelul este redundant), polinoamele A si B se simplifica, deci:

)q(L)q(B)q(B

)q(L)q(A)q(A111

111

−−∗−

−−∗−

=

=

unde L(q-1) este un polinom cu zerourile strict în afara cercului unitar. Evident, în acest caz θ nu este unic. Daca însa n*=0 atunci θ=θ* si este unic. Aceleasi consideratii pot fi facute si asupra partii stohastice a modelului. 50 - Ipotezele I5 si I6 sunt legate de conceptul de "conditii experimentale" introdus pentru a arata în ce conditii experimentale identificarea este corespunzatoare. Conceptul de sistem si ipotezele facute asupra lui sunt introduse pentru a realiza o descriere matematica a procesului tehnologic de identificat. O astfel de descriere este evident ideala. Totusi, în scopul analizelor asupra consistentei si preciziei estimatorilor parametrilor, necesare pentru dezvoltarea teoretica, aceasta descriere precum si ipotezele facute sunt absolut necesare pentru ca, de

91

fapt, se refera la mecanismul care genereaza datele de intrare-iesire. Problema de estimare poate fi formulata astfel: Dat fiind un model si precizata structura lui (na, nb) sa se determine parametrii lui cuprinsi în vectorul θ pe baza a N date asupra intrarii si iesirii, în conformitate cu un criteriu. Exista multe criterii posibile care permit estimarea parametrilor modelului. Acestea pot fi grupate în câteva categorii: - criterii functie de informatiile apriorice despre procesul tehnologic, care conduc la estimatori Bayes (de risc minim); - criterii functie de eroarea de modelare; - criterii functie de eroarea de predictie a iesirii din sistem. Între estimatorii generati pe baza acestor criterii exista, în situatii particulare, legaturi care uneori sunt evidente, alteori subtile. Exista si un alt mod de a rezolva problema estimarii si anume de a deduce estimatori cu calitati de consistenta si de precizie impuse. Din clasa acestor estimatori fac parte estimatorii de variabila instrumentala. În cele ce urmeaza vom analiza estimatorii de risc minim (Bayes). Problema estimarii parametrilor unui model poate fi privita ca un studiu al parametrilor si al dependentei parametrilor unei populatii statistice, daca sunt disponibile datele de intrare si iesire din procesul tehnologic.

Proces tehnologic

ModelInformatiiapriorice

u(t)

v(t)y(t)

( )

( )

+

+

θ

θ

∗

θ

Fig. 6.2

Daca ?*=[?1*,….,?m

*] reprezinta vectorul parametrilor procesului tehnologic si ?=[?1,….,?n] vectorul parametrilor modelului specificat (fig. 6.2), eroarea de modelare em(t,θ)=y(t)-ym(t,θ) ofera o oarecare masura a corespondentei dintre vectorii parametrilor θ* si θ. Vectorul θ* nefiind accesibil prin masuratori directe, nu poate fi cercetat decât statistic. Acest lucru este posibil numai daca dispunem de cunostinte apriorice despre densitatile de probabilitate. În literatura statistica s-au dezvoltat mai multe proceduri de estimare care difera în primul rând prin criteriile de definire a optimalitatii si prin folosirea cunostintelor disponibile apriori. Presupunem cunoscute datele de intrare-iesire sub forma discreta:

Y=[y(1),....,y(N)]T si U=[u(1),....,u(N)]T. Scopul teoriei estimatiei este de a determina θ pe baza esantioanelor Y si U. Se cauta deci o functie θ(U,Y), care sa fie o aproximatie cât mai buna a

92

vectorului θ*. Functia θ(Y,U) se numeste estimator, iar valoarea functiei pentru Y si U determinate se numeste estimatie. Cum Y este un esantion dintr-un proces aleator rezulta ca si θ(Y,U) este o variabila aleatoare. În consecinta, calitatea estimatorului va depinde de caracteristicile sale statistice, care sunt posibil de obtinut prin intermediul functiei densitate de probabilitate p(θ/Y,U). Aceasta functie este evident conditionata de datele de intrare-iesire si ofera tipul cel mai bun de cunoastere ce se poate deduce prin prelucrarea datelor statistice, dar si cel mai greu de utilizat practic, mai ales daca dimensiunea vectorului θ este mare. Din acest motiv în majoritatea cazurilor, în locul densitatii de probabilitate, se utilizeaza caracteristicile statistice cele mai semnificative: - media M[θ]; - deviatia θ-M[θ]; - covarianta covθ=M[(θ-M(θ))(θ-M(θ))T]. De remarcat ca daca functia densitate de probabilitate ar fi normala, atunci prin restrângerea la medie si covarianta nu se pierde nici o informatie întrucât repartitia normala este complet specificata de primele doua momente. Pentru alte repartitii însa acest lucru nu se întâmpla. În consecinta, este necesar de definit o serie de indicatori de calitate ai estimatorilor, pe baza acestor caracteristici statistice. Definitia 1. Daca pentru orice esantionare Y,U media M[θ(Y,U)]=θ*, atunci estimatorul θ se numeste estimator nedeviat. Daca aceasta conditie este satisfacuta numai pentru esantioane mari (N→∞), atunci estimatorul este asimptotic nedeviat. În general vor exista multi estimatori nedeviati pentru acelasi θ*. Pentru a alege dintre acestia, un criteriu natural este dispersia acestor estimatori ca masura a împrastierii lor fata de medie. Definitia 2. Un estimator nedeviat θ(Y,U) este eficient daca, oricare ar fi un alt estimator θ

~ nedeviat, ( ) ( ).~covcov θ≤θ Inegalitatea trebuie interpretata

în sensul ca matricea ( ) 0cov~

cov ≥θ−θ este nenegativ definita. Definitia 3. Un estimator θ(Y,U) este consistent daca:

0][PlimN

=ε>θ−θ ∗

∞→

oricare ar fi ε>0 si arbitrar de mic, adica θ converge în probabilitate la valoarea adevarata a parametrilor. Definitia 4. Un estimator θ(Y,U) se numeste suficient daca oricare ar fi alt estimator θ

~ , densitatea de probabilitate este ),/~

(p),/~

(p * θθ=θθθ deci nu depinde de ?*. Denumirea este justificata chiar de relatia de definitie si anume de faptul ca nici un estimator θ

~ nu aduce informatii suplimentare despre valoarea adevarata θ*, atunci când θ este dat. Cu alte cuvinte, estimatorul θ contine toata informatia despre θ* din esantioanele observate. Sunt necesare unele precizari în legatura cu eficienta unui estimator. Sa consideram densitatea de probabilitate a vectorului Y (iesirea din proces), p(Y/θ*,U),

93

care depinde evident de θ* si U. Functia: )U,/Y(pln)(L ∗∗ θ=θ se numeste functie de verosimilitate logaritmica. Definitia 5. Se numeste matrice de informatie si se noteaza cu J matricea:

∂θ

θ∂

∂θ

θ∂= ∗

∗

∗

∗ T)(L)(L

MJ

în care M[⋅] reprezinta media în raport cu distributia vectorului Y. Lema 1. Matricea de informatie satisface urmatoarea egalitate:

∂θ

θ∂−=

∂θ

θ∂

∂θ

θ∂= ∗

∗

∗

∗

∗

∗

2

2T)(L

M)(L)(L

MJ .

Demonstratie. Deoarece p(Y/θ*,U) este densitate de probabilitate, verifica egalitatea:

∫ =θ∗NR 1dY)U,/Y(p

sau, derivând în raport cu parametrul θ*,

0dY)U,/Y(p

NR=

∂θθ∂

∫ ∗

∗ .

Atunci media:

dY)U,/Y(p)(p

)U,/Y(p1

dY)U,/Y(p)(L)(L

M NN R*

R∗

∗

∗

∗∗

∗∆

∗

∗

θ∂θ

θ∂θ

=θ∂θ

θ∂=

∂θθ∂

∫∫

deci:

0)(L

Msau0dY)U,/Y(p)(L

NR =

∂θθ∂

=θ∂θ

θ∂∗

∗∗

∗

∗

∫

Derivând înca o data în raport cu θ* obtinem:

0dY)U,/Y(p)(L

)U,/Y(p)(L

NR

T

2

2

=

∂θ

θ∂∂θ

θ∂+θ

∂θθ∂

∫ ∗

∗

∗

∗∗

∗

∗

sau: 0dY)U,/Y(p)(L)(L

)U,/Y(p)(L

NR

T

2

2

=

θ

∂θ

θ∂

∂θ

θ∂+θ

∂θθ∂

∫∗

∗

∗

∗

∗∗

∗

∗

deci:

∂θ

θ∂

∂θ

θ∂−=

∂θ

θ∂∗

∗

∗

∗

∗

∗ T

2

2 )(L)(LM

)(LM .

Lema 2. Fie o matrice simetrica Q, partitionata astfel:

=

2221

1211

QQQQ

Q cu Q11 si Q22 matrice patratice.

94

Atunci: 1) Q>0 daca si numai daca

>−>

>−>

−− 0QQQQ0Q

sau0QQQQ

0Q

121

112122

11

211

221211

22

2) Q≥0 si Q22 >0 implica 0QQQQ 211

221211 ≥− − . Demonstratie. Consideram un vector x de dimensiunea lui Q pe care îl partitionam similar x=[x1,x2]T. Atunci forma patratica xTQx devine:

222T2212

T1111

T1

T xQxxQx2xQxQxx ++= . Sa evaluam extremul acestei functii patratice în raport cu x2.

0xQ2xQ2x

]Qxx[2221

T12

2

T

=+=∂

∂

de unde: 1T12

1222 xQQx −−= , iar .Q2

x]Qxx[

2222

T2

=∂

∂

Deoarece Q22>0, extremul va fi minim, iar .x]QQQQ[x]Qxxmin[ 112

1221211

T1

T −−= Prin ipoteza, minimul formei este pozitiv, de unde rezulta ca întreaga forma este pozitiva (Q>0) si reciproc. Partea a doua a lemei este evidenta deoarece daca Q si Q22 sunt pozitive atunci si minimul va fi pozitiv deci .0QQQQ T

121

221211 ≥− − Teorema 1. (Cramér-Rao) Fie θ un estimator nedeviat pentru θ*. Atunci matricea de covarianta a lui θ satisface inegalitatea:

1T J]))([(Mcov −∗∗ ≥θ−θθ−θ=θ unde J este matricea de informatie. Inegalitatea trebuie interpretata în sensul ca matricea [covθ-J-1] este nenegativ definita. Demonstratie. Consideram matricea pozitiv definita:

( ) 0L,L

M TT≥

θ−θ

θ−θ∗

∗θ

∗

θ

∗

unde ∗θL semnifica .

)(L∗

∗

∂θθ∂ În alta forma matricea este:

0]LL[M])(L[M

])(L[M]))([(MTT

TT

≥

θ−θθ−θθ−θθ−θ

∗∗∗

∗

θθ∗

θ

∗θ

∗∗

În aceasta matrice M[L?* L?*T]=J prin definitie. Sa examinam media

M[L?*(?-?*)T] în raport cu repartitia vectorului Y. Prin ipoteza avem:

∗∗ θ=θ⋅θ∫ NR dY)U,/Y(p

estimatorul θ fiind nedeviat. Derivând în raport cu θ* rezulta:

95

a) ∫∫ =θθ=θ⋅∂θ

θ ∗θ∗

∗

∗NN RTT

R.IdY)U,/Y(pLsauIdY

)U,/Y(p

Tinând seama ca M[L?*]=0 (vezi lema 1), ∫ =θ∗θ ∗NR 0dy)U,/Y(pL sau,

înmultind cu θ*T, rezulta: b) .0dy)U,/Y(pLNR∫ =θθ ∗∗

θ ∗

Prin scaderea relatiilor a) si b) rezulta: .I])(L[MsauIdy)U,/Y(p)(LNR

TT =θ−θ=θθ−θ∫ ∗θ

∗∗θ ∗∗

În acest caz matricea initiala devine:

.0JII]))([(M T

≥

θ−θθ−θ ∗∗

Aplicând rezultatul obtinut în lema 2, rezulta: .0J]))([(M 1T ≥−θ−θθ−θ −∗∗

Denumirea de matrice de informatie trebuie considerata în legatura cu inegalitatea Cramér-Rao. Daca matricea J este singulara rezulta ca parametrii θ* nu pot fi estimati din esantioanele observate. Cu alte cuvinte, esantionul Y (pentru U dat) nu contine nici o informatie asupra procesului, variatiile marimii de iesire datorându-se în exclusivitate perturbatiei. Daca matricea J are elementele de pe diagonala principala foarte mari în raport cu celelalte, rezulta ca estimatiile θ sunt putin dispersate în raport cu θ*, deci iesirea din proces contine informatii bogate despre parametrii adevarati ai procesului tehnologic. Daca exista un estimator θ astfel încât inegalitatea Cramér-Rao sa se transforme în egalitatea:

1T J]))([(M −∗∗ =θ−θθ−θ atunci estimatorul θ este un estimator eficient al lui θ*. Daca egalitatea este satisfacuta numai pentru esantioane mari (N→∞) atunci estimatorul este asimptotic eficient. Din definitia eficientei unui estimator si din legatura cu matricea de informatie rezulta ca un estimator eficient este de dispersie minima în clasa estimatorilor nedeviati. Obtinerea practica a estimatorilor este în functie de cantitatea de informatii apriorice disponibile. Informatiile aprior ice despre proces sunt bogate daca sunt disponibile urmatoarele functii: 1° - densitatea de probabilitate a zgomotului; utilizând aceasta functie, în virtutea ipotezei de liniaritate a procesului tehnologic, se poate deduce densitatea de probabilitate a iesirii p(Y/θ*,U). 2° - densitatea de probabilitate a vectorului parametrilor p(θ*); este cea mai severa cerinta, p(θ*) putând fi disponibila doar în urma aplicarii unui alt estimator, mai simplu. 3° - functia de cost C(θ,θ*), care exprima pierderea produsa considerând θ drept valoare a parametrilor când de fapt aceasta este θ*.

96

Estimatorii care necesita toate aceste informatii pentru a putea fi dedusi se numesc estimatori de risc minim (ERM). Alti estimatori sunt cazuri particulare ai acestora, obtinuti pe masura ce cantitatea de informatie apriorica scade. Prin definitie, estimatorul care minimizeaza riscul mediu aposteriori (dupa efectuarea experimentului) se numeste estimator de risc minim (ERM).

∗∗∗

θ

∗

θθθθθ=θθ=θ ∫ d)U,Y/(p),(Cminarg]U,Y/),(C[Mminargˆ

mR

unde m este dimensiunea vectorului θ. Cunoscând p(Y/θ*,U) si p(θ*) putem determina p(θ*/Y,U) cu ajutorul formulei Bayes:

)Y(p)(p)U,/Y(p

)U,Y/(p∗∗

∗ θθ=θ

unde ∗∗∗ θθθ= ∫ d)(p)U,/Y(p)Y(p mR (formula probabilitatii totale). În consecinta, având disponibile toate informatiile necesare - p(Y/θ*,U), p(θ*) si C(θ,θ*) - putem determina estimatorul de risc minim. Datorita utilizarii teoremei Bayes, estimatorii de risc minim se mai numesc si estimatori Bayes. Daca functia de cost C(θ,θ*) are forme particulare, atunci estimatorii de risc minim capata semnificatii fizice concrete.

Exemplul 1. Sa consideram functia de cost .),(C2∗∗ θ−θ−=θθ Atunci:

.d)U,Y/(p]U,Y/)(C[M mR

2 ∗∗∗∗ θθθ−θ=θ−θ ∫

Estimatia de risc minim rezulta din:

0d)U,Y/(p)(2]U,Y/)(C[M mR =θθθ−θ=θ−θ∂θ∂ ∗∗∗∗ ∫

sau: ∫∫ ∗∗∗∗∗ θθθ=θθθ mm RR d)U,Y/(pd)U,Y/(p

Deoarece 1d)U,Y/(pmR =θθ ∗∗∫ , rezulta solutia: ∗∗∗ θθθ=θ ∫ d)U,Y/(pˆmR care

reprezinta media distributiei conditionate.

Exemplul 2. Sa consideram functia de cost ∗∗ θ−θ−=θ−θ )(C . Atunci

estimatorul de risc minim este:

).(Vminargd)U,Y/(p minargˆmRRM θ=θθθ−θ=θ

θ

∗∗∗

θ∫

Din conditia: 0d)U,Y/(p)(sign)(V

mR =θθθ−θ=∂θ

θ∂ ∗∗∗∫

si cu notatia Tm21 ]ˆ,...,ˆ,ˆ[ˆ θθθ=θ , care reprezinta valoarea pentru care (θ-θ*) îsi

schimba semnul, rezulta: ∗∞

θ∗∞

θ∗θ

∞−∗θ

∞−θθ=θθ ∫∫∫∫ d)U,Y/(p....d)U,Y/(p....

m1

m1ˆˆ

ˆˆ

deci θ reprezinta mediana distributiei conditionate. Exemplul 3. Sa consideram C(θ-θ*)=-δ(θ-θ*). Aceasta functie de cost

97

semnifica faptul ca orice pierdere este posibila prin considerarea estimatorului în locul valorii adevarate. În acest caz:

θ=θ∗∗∗∗

∆θ−=θθθθδ−=θθ=θ ∫ *m )U,Y/(pd)U,Y/(p)-(]U,Y/)-(C[M)(V *

R

)U,Y/(pmaxarg)]U,Y/(p[minargˆRM θ=θ−=θ

θθ

astfel încât estimatorul reprezinta moda distributiei conditionate. Daca informatiile apriorice nu permit formularea unei functii de cost C(θ-θ*) adecvate, atunci este rational sa alegem estimatorul θ care maximizeaza densitatea de repartitie, p(θ*/Y,U), deoarece potrivit teoremei Bayes,

∫∗∗∗

∗∗∗

θθθθθ=θ

mR d)(p)U,/Y(p)(p)U,/Y(p

)U,Y/(p

aceasta densitate de probabilitate poate fi calculata din cunostintele apriorice. Daca informatiile apriorice sunt reduse numai la cunoasterea densitatii de probabilitate p(Y/θ*,U), un rationament simplu ne conduce la asa-numitul estimator de verosimilitate maxima (EVM). Necunoscând repartitia vectorului θ*, este natural sa consideram echiprobabile toate valorile pe care le poate lua acesta astfel încât procesul sa îndeplineasca ipotezele facute asupra lui. În consecinta, putem presupune θ* uniform distribuit, p(θ*)=constant, într-un interval θ*∈[a,b]. Neexistând informatii apriorice care sa permita formularea unei functii de pierdere corespunzatoare, este de asemenea normal sa consideram ca orice pierdere este posibila. În consecinta, putem alege C(θ,θ*)=-δ(θ-θ*). În conformitate cu exemplul 3, rezulta ca:

.)Y(p

)(p)U,/Y(pmaxarg)U,Y/(pmaxargˆ

θ=θ

∗∗

θθ=θ∗

θ ∗

∗

θθ=θ=θ

Întrucât p(θ*)=constant si p(Y) nu depinde de θ, rezulta: )U,/Y(pmaxarg)U,/Y(pmaxargˆ θ=θ=θ

θθ=θ∗

θ∗

deci θ este argumentul care maximizeaza functia de verosimilitate care se poate deduce cunoscând distributia zgomotului. În multe aplicatii este mai convenabil a se obtine estimatorul VMθ din maximizarea functiei de verosimilitate logaritmica:

( ) ( )U,/YplnmaxargLmaxargˆVM θ=θ=θ

θθ

Ecuatiile care dau solutia problemei de extremizare, ( ) ,0L =θ∇ se numesc ecuatii de verosimilitate. Estimatorul de verosimilitate maxima (EVM) a fost analizat pe larg în literatura de specialitate data fiind posibilitatea de deducere a unui estimator utilizând informatii apriorice sarace. El se bucura de o serie de proprietati cum ar fi: - normalitatea asimptotica; - nedeviere asimptotica; - eficienta asimptotica;

98

- consistenta; - invarianta ( θ este EVM pentru θ*, iar )ˆ(g θ este EVM pentru g(θ*)). Aceste proprietati vor fi analizate în cazuri particulare, în functie de distributia perturbatiei.

6.2. Estimatorul Markov

Acest estimator este un caz particular EVM în cazul în care perturbatia v(t) (vezi fig. 6.2) este normal distribuita de medie nula si matrice de covarianta R nesingulara, cunoscuta, aceasta fiind de fapt si singura informatie apriorica. Desigur, vom deduce un estimator considerând valabile ipotezele generale I1-I6. Consideram un model de regresie al procesului care contine valori ale secventei de ponderare:

(S) )t(v)it(u)i(h)t(ym

0i+−= ∑

=

∗

sau, în forma matriceala, dând lui t valori N,1nt += , VUY +θ= ∗ unde: TTT )]N(v),...,1m(v[V,)]m(h),....,0(h[,)]N(y),...,1m(y[Y +==θ+= ∗∗∗

iar ( ) ( )

( ) ( )

−

+=

mNuNu

1u1muU

LLLL

L

N fiind numarul de date, iar m numarul de puncte în care este cunoscuta functia pondere h*(t). Formularea problemei: Cunoscând datele I/E continute în matricea U si vectorul Y, sa se deduca un estimator VMθ pentru vectorul valorilor adevarate θ*. Deoarece distributia perturbatiei este cunoscuta, v∈N(0,R), densitatea de repartitie multid imensionala este:

( )VRV

2mN

2mN

1T21

eR2

1)v(p

−−−−

π= .

În virtutea liniaritatii dependentei Y=Uθ*+V rezulta ca Y∈N(M[Y],RY), unde RY este matricea de covarianta a vectorului Y, deci:

( )

[ ][ ] [ ][ ]YMY1YRTYMY

21

2

mN

y2mN

e

R2

1)U,/Y(p

−−−−

−−∗

π

=θ

unde M[Y]=M[Uθ*+V]=Uθ*+M[V]=Uθ* RY=M[(Y-M[Y])(Y-M[Y])T]=M[vvT]=R.

Deci: ( )

[ ] [ ]∗−∗ θ−θ−−−−

∗

π=θ UYRUY

2mN

2mN

1T21

eR2

1)U,/Y(p

Conditionarea repartitiei este evidenta din relatia dependentei liniare a

99

iesirii de perturbatie. Estimatorul de verosimilitate maxima va fi:

( )( ) ( )

( ) ( )θ−θ−=

=θ−θ−−π

=θ=θ

−

θ

−−θ

∗

θ θ=∗θ

UYRUY21

minarg

]UYRUY21

R2

1[lnmaxarg)U,/Y(plnmaxargˆ

1T

1T

2mNVM

Notând )UY(R)UY(21

)(V 1T θ−θ−=θ − , care este evident o forma

patratica cu matrice nesingulara, ecuatiile de verosimilitate sunt:

0YRUURU]UR)UY()UY(RU[21V 1T1T1T1T =−θ=θ−−θ−−=

∂θ∂ −−−−

unde am tinut seama de simetria matricei de covarianta. De aic i rezulta ca:

YRU)URU(ˆ 1T11TVM

−−−=θ este estimatorul care maximizeaza functia de verosimilitate, cu conditia ca:

,0URUV 1T2

2

>=∂θ∂ −

ceea ce asigura si inversabilitatea matricei 1TRU − U. Aceasta conditie depinde evident de matricea U, ceea ce presupune ca semnalul de intrare trebuie ales corespunzator pentru a fi îndeplinita. Proprietatile estimatorului Markov 1° - Estimatorul Markov este nedeviat

.VRU)URU()VU(RU)URU(YRU)URU(ˆ 1T11T1T11T1T11T −−−∗∗−−−−−− +θ=+θ==θ

Deoarece M[V]=0, rezulta imediat ca .]ˆ[M ∗θ=θ 2° - Estimatorul Markov este normal distribuit.

Într-adevar, daca notam ,RU)URU(A 1T11T −−−= atunci ,AVˆ +θ=θ ∗ care atesta dependenta liniara între estimator si perturbatie. În consecinta,

( ),R,Nˆθ

∗θ∈θ unde:

11T11T11T11TT

TTTTTˆ

)URU()URU(URRRU)URU(ARA

A]VV[AM]AAVV[M])ˆ)(ˆ[(MˆcovR−−−−−−−−

∗∗∆

θ

===

===θ−θθ−θ=θ=

deci: ))URU(,(Nˆ 11T −−∗θ∈θ 3° - Estimatorul Markov este eficient. Într-adevar, cu notatiile facute mai sus, matricea de informatie va fi:

URU]URU[M)(V

M)(L

MJ 1T1T2

2

2

2−−

∗

∗

∗

∗

==

∂θθ∂

=

∂θθ∂

−=

Se observa ca 1ˆ JˆcovR −θ =θ= , deci estimatorul θ este eficient.

100

4° - Estimatorul Markov este liniar.

Prin definitie, un estimator nedeviat oarecare θ~ este liniar daca ,BY

~=θ

adica depinde liniar de datele de iesire, B fiind o matrice dependenta de intrare satisfacând relatia BU=I. În cazul nostru AYˆ =θ , unde 1T11T RU)URU(A −−−= si evident este satisfacuta egalitatea AU=I. 5° - Estimatorul Markov este consistent. Într-adevar, deoarece AVˆ +θ=θ ∗ , V fiind perturbatia care, în ipotezele noastre, este un proces aleator stationar si ergodic, deci media lui V tinde la zero când N→∞ rezulta ca si ∗θ→θ o data cu cresterea esantionului. Observatie. Estimatorul Markov depinde esential de ipoteza normalitatii perturbatiei. Totusi, daca v(t) nu este normal distribuit dar este cunoscuta matricea sa de covarianta, un estimator de aceeasi forma cu estimatorul Markov are proprietati statistice asemanatoare. Teorema 2. Presupunem ca u(t) si v(t) sunt semnale independente si ca v(t) are o distributie arbitrara, de medie nula, M[v(t)]=0 si matrice de covarianta R nesingulara. Atunci estimatorul:

AYYRU)URU(ˆ 1T11T ==θ −−− în care matricele U si Y au aceeasi semnificatie ca în cazul estimatorului Markov este nedeviat, consistent de dispersie minima în clasa estimatorilor liniari nedeviati. Demonstratie. Pentru proprietatile 1° si 2° sunt valabile demonstratiile de la estimatorul Markov, unde nu a intervenit ipoteza normalitatii zgomotului. Fie θ

~ un estimator oarecare liniar si nedeviat deci pentru care BY~

=θ , cu BU=I, B fiind o matrice independenta de Y. Deoarece:

BVBVBU]VU[BBY~

+θ=+θ=+θ==θ ∗∗∗

rezulta media *]~

[M θ=θ si: TTTT BRB]BBvv[M]

~[M])

~)(

~[(M

~cov ==θ∆θ∆=θ−θθ−θ=θ ∗∗∗

unde ∗θ−θ=θ∆~~ este deviatia estimatorului θ

~ . Similar rezulta 11TTT )URU(]ˆˆ[MARAˆcov −−=θ∆θ∆==θ . Deoarece matricea

0])ˆ~)(ˆ~

[(M T >θ∆−θ∆θ∆−θ∆ este pozitiv definita, rezulta, prin explicitarea mediei:

.ARABRAARBBRB

)AB(R)AB()AB](VV[M)AB(

])AVBV)(AVBV[(M])ˆ~)(ˆ~

[(M

TTTT

TTTTT

TT

+−−=

=−−=−−=

=−−=θ∆−θ∆θ∆−θ∆

Tinând seama de notatia facuta pentru matricea A si de proprietatea de liniaritate a estimatorilor, rezulta: .0ˆcov

~cov >θ−θ

Cum θ~ este un estimator oarecare rezulta ca θ este cel mai bun în clasa

estimatorilor liniari nedeviati.

101

6.3 Estimatorul celor mai mici patrate Este un caz si mai particular al estimatorilor de verosimilitate maxima, aplicabil sistemelor liniare cu zgomot alb normal distribuit de medie nula si matrice de covarianta R=λ*2I deci când v(t)∈N(0,λ*2I), λ*2 fiind dispersia zgomotului alb. În aceasta situatie I)1(R 21 ∗− λ= , iar estimatorul va avea forma YU)UU(ˆ T1T

LS−=θ în

care U si Y au aceeasi semnificatie ca în cazul estimatorului Markov. Matricea de covarianta va fi:

1T2TLSLSLS )UU(])ˆ)(ˆ[(Mˆcov −∗∗∗ λ=θ−θθ−θ=θ .

Estimatorul celor mai mici patrate, fiind si un caz particular al estimatorului Markov, se bucura deci de aceleasi proprie tati. Daca v(t) este zgomot alb dar arbitrar distribuit, atunci un estimator de aceeasi forma este liniar optimal, adica de dispersie minima în clasa estimatorilor liniari nedeviati. Ca si în cazul EM, aceasta este o situatie aparte care se datoreaza modelului ales si anume secventa de ponderare. În multe aplicatii, chiar daca zgomotul este alb, nu se cunoaste dispersia lui λ*2. În acest caz, în afara vectorului θ* trebuie estimata si dispersia zgomotului. Deoarece:

])UY)(UY[(M]VV[MI TT2 ∗∗∆

∗ θ−θ−==λ

rezulta: )UY()UY(mN

1 T2 ∗∗∗ θ−θ−−

=λ .

Necunoscând θ* este natural sa estimam λ*2 înlocuind θ* cu estimatorul lui, deci un estimator pentru λ*2 va fi:

)ÛY()ÛY(mN

1ˆ T2 θ−θ−−

=λ .

Acest estimator însa este deviat, adica 22]ˆ[M ∗λ≠λ pentru esantioane mici. Se poate demonstra însa ca:

)ÛY()ÛY(1m2N

1ˆ T2 θ−θ−−−

=λ

este nedeviat, deci reprezinta mai bine dispersia zgomotului chiar daca volumul de date este mic. În deducerea estimatorilor Markov si al celor mai mici patrate sistemul poate fi considerat si multivariabil. Desigur, în acest caz efortul de calcul creste proportional cu dimensiunile sistemului desi estimatorii au aceeasi forma ca în cazul unidimensional. Bibliografie [1] Tertisco M., Stoica P. - Identificarea si estimarea parametrilor sistemelor. Ed.

Academiei 1980. [2] Söderstrom T., Stoica P. - System Identification - Prentice Hall - 1989. [3] Rao C.R. - Linear Statistical Inference and its Applications -John Wiley, New

York 1973.

102

CAPITOLUL 7

Identificarea prin metode parametrice directe

7.1. Metoda celor mai mici patrate Dintre toate metodele de estimare parametrica directa, metoda CMMP este desigur cea mai veche. Ea a fost utilizata pentru prima data de Gauss pentru determinarea din masuratorile perturbate a orbitelor planetelor. Metoda se utilizeaza pentru determinarea modelului partii deterministe a unui sistem perturbat folosind drept criteriu eroarea medie patratica de modelare (fig. 7.1).

( ) ∑=

θ=θN

1t

2mm ),t(e),t(eV

unde: ).,t(y)t(y),t(e mm θ−=θ

În cele ce urmeaza vom ilustra metoda pe modele liniare cu diferente, caz în care implementarea algoritmilor pe calculator este facila.

Sa consideram sistemul (SISO) descris de ecuatiile cu diferente:

∗

∗

∗

∗

−∗−∗−∗

−∗−∗−∗

−∗−∗

++=

+++=

+=

nbnb

11

1

nana

11

1

11

qb....qb)q(B

qa....qa1)q(A

)t(v)t(u)q(B)t(y)q(A

si presupunem ca îndeplineste ipotezele generale I1-I6. Cu notatiile:

T

Tnb1na1

)]nbt(u),....,1t(u),nat(y),....,1t(y[)t(

]b,.....,b,a,....,a[∗∗

∗∗∗∗∗

−−−−−−=ϕ

=θ ∗∗

sistemul poate fi pus sub forma: )t(v)t()t(y T +θϕ= ∗ (7.2)

Vectorul )t(ϕ este functie de datele de intrare si de iesire pâna la momentul t si reprezinta într-un fel "istoria" evolutiei procesului. Problema de identificare poate fi formulata astfel: fiind cunoscute datele de intrare/iesire din proces continute în vectorii:

[ ] [ ]TT )N(y),....,2(y),1(yY,)N(u),....,2(u),1(uU == sa se determine parametrii modelului:

(M) nb

nb1

11

nana

11

1

1m

1

qb....qb)q(B

qa....qa1)q(A

)t(u)q(B)t(y)q(A

−−−

−−−

−−

++=

+++=

=

(7.3)

astfel încât eroarea medie patratica de modelare sa fie minima.

u(t)G(q-1

Model

xx(t)

+y(t)

ym(t,

Proces tehnologic

θ)

θ, )

-1G(q ,θ)

Fig. 7.1

v(t)

+

-

*

em(t,θ)

G*(q-1,?*)

103

Explicitând functia criteriu obtinem:

( )

( ) .)t(u)q(B)t(y)q(A)q(A

1N1

)t(u)q(A)q(B

)t(yN1

),t(y)t(yN1

)(V

211N

1t12

N

1t

2

1

1N

1t

2m

−−

=−

=−

−

=

−=

=

−=θ−=θ

∑

∑∑

si dupa cum se observa este puternic neliniara în parametri. Pentru obtinerea solutiei:

)(Vminargˆ θ=θθ

trebuie utilizat un algoritm de gradient, cu toate inconvenientele lui. Daca însa vom folosi criteriul celor mai mici patrate ponderate:

( ) ( )[ ] ),t(e)q(A),t(yty)q(AN1

V 2m

1N

1t

2N

1t

2m

12 θ=θ−=θ −

==

− ∑∑

sau: ( ) [ ] ( )∑∑==

−− θϕ−=−=θN

1t

2TN

1t

211 )t()t(yN1

)t(u)q(B)t(y)q(AN1

V (7.4)

unde T)]nbt(u),....,1t(u),nat(y),...,1t(y[)t( −−−−−−=ϕ , criteriul devine patratic în parametri θ si problema poate fi rezolvata analitic. Solutia se obtine din relatiile:

( )( )

>ϕϕ=∂θ

θ∂=θ∇

=θϕ−ϕ−=∂θ

θ∂=θ∇

∑

∑

=

=

.0)t()t(N1

2)(V

)(V

0)t()t(y)t(N1

2)(V

)(V

TN

1t2

22

TN

1t

si este evident:

∑∑=

−

=ϕ

ϕϕ=θ

N

1t

1N

1t

TLS )t(y)t(

N1

)t()t(N1ˆ . (7.5)

Estimatorul LSθ este functie de datele masurate de intrare/iesire si exista daca matricea hessian este pozitiv definita. Cu notatia:

T)]N(),...,1([ ϕϕ=φ sau

ϕ

ϕ=φ

)N(

)1(

T

T

M

estimatorul poate fi pus într-o forma mai simpla

( ) YYN1

N1ˆ T1TT

1T

LS φφφ=φ

φφ=θ−

−

(7.6)

cu conditia φTφ >0. Observatii: 10. Criteriul V(?) poate fi privit ca un criteriu al erorii de predictie. Într-adevar:

)1t/t(y)nbt(ub.....)1t(ub)nat(ya....)2t(ya)1t(ya)t( nb1na21T −=−++−+−−−−−−−=θϕ

este predictor de pas (o functie de datele trecute ale intrarii si iesirii), iar:

104

),t(e)1t/t(y)t(y)t()t(y pT θ=−−=θϕ−

este tocmai eroare de predictie de pas, deci criteriul V(θ) este eroarea medie patratica de predictie de pas. Rezulta ca estimatorul LSθ poate fi privit ca estimator care minimizeaza eroarea de predictie de pas (MEP). 2°) Diferentele θϕ−=−=ε −− )t()t(y)t(u)q(B)t(y)q(A)t( T11 se numesc reziduali. Cu aceasta notatie, modelul (M) poate fi scris: (M) )t()t(u)q(B)t(y)q(A 11 ε+= −− (7.7) si estimatorul CMMP este argumentul care minimizeaza functia criteriu:

].[M)t(N1

)(V TN

1t

2 εε=ε=θ ∑=

(7.8)

Sa observam ca θϕ−+θϕ=ε ∗ )t()t(v)t()t( T . Vectorii implicati pot fi adusi la aceeasi dimensiune. De exemplu, daca n*=min(na-na*,nb-nb*)≥0, θ* poate fi extins la dimensiunea na+nb (vezi relatia 7.9):

]0,..,0,b,..,b,0,..,0,a,..,a[nb

nb1

na

na1 44 344 2144 344 21∗∗∗∗∗

∗∗=θ (7.9)

iar T)]nbt(u),....,1t(u),nat(y),.....,1t(y[)t( −−−−−−=ϕ

deci )t(dim)t(dim ϕ=ϕ si LSˆdimdim θ=θ∗ .

În general, reziduul reprezinta incertitudinea în comportarea modelului determinat în raport cu comportarea sistemului (procesului). Daca vom calcula reziduul optimal:

)t(v]ˆ)[t()t(ˆ LST +θ−θϕ=ε ∗ (7.10)

rezulta ca acesta depinde atât de calitatea estimatorului cât si de perturbatie, atunci când ∗θ→θLS

ˆ , )t(v)t(ˆ →ε .

7.1.1 Analiza estimatorului celor mai mici patrate Deducerea oricarui estimator este incompleta daca nu sunt precizate calitatile si nu este apreciata precizia lui. Analiza unui estimator are drept scop tocmai acest lucru. Presupunem n*≥0. Înlocuind în expresia estimatorului CMMP pe y(t) din relatia (7.2), deoarece iesirea este generata de sistem, rezulta:

∑∑=

∗−

=+θϕϕ

ϕϕ=θ

N

1t

T1N

1t

TLS )]t(v)t()[t()t()t(ˆ

Sa observam ca daca vectorul θ* este de dimensiune extinsa (rel. 7.7) atunci ( )tϕ poate fi înlocuit cu ϕ(t), si prin urmare:

∑∑=

−

=

∗ ϕ

ϕϕ+θ=θ

N

1t

1N

1t

TLS )t(v)t()t()t(ˆ (7.11)

Deoarece în ipotezele generale acceptate M[v(t)]=0, rezulta ca ∗θ=θ ]ˆ[M LS , deci estimatorul este nedeviat.

105

Teorema. Fie sistemul fara reactie (S). Daca sunt îndeplinite conditiile: 1 - u(t) si v(t) necorelate; 2 - u(t) este semnal persistent de ordin nb; 3 - v(t) este zgomot alb; 4 - n*=min(na-na*, nb-nb*)≥0 atunci estimatorul celor mai mici patrate este consistent. Demonstratie. LSθ este un estimator consistent al parametrilor adevarati θ*

daca ∗

∞→θ=θLS

Nˆlim (c.p 1). Analizând relatia (7.11) se observa ca LSθ este consistent

daca si numai daca:

)p.c(0)t(v)t(N1

)t()t(N1

limN

1t

1N

1t

T

N=

ϕ

ϕϕ ∑∑

=

−

=∞→

Sa analizam elementele implicate în aceasta limita.

[ ])nbt(u),...,1t(u),nat(y),...,1t(y

)nbt(u

)1t(u)nat(y

)1t(y

N1lim)t()t(

N1lim

N

1tN

N

1t

T

N−−−−−−

−

−−−

−−

=ϕϕ ∑∑=∞→=∞→

……

……

Elementele matricei sunt covariante de esantion. Datorita ipotezelor facute asupra sistemului si intrarii u(t), covariantele de esantion tind la cele teoretice, încât, dupa câteva calcule elementare rezulta:

nb

na

RR

...................RR

)t()t(N1

limR

nb na

uuy

yuyT

N

1tN

−

−=ϕϕ= ∑

=∞→MMM

(7.12)

în care Ru si Ry sunt matricele Toeplitz ale semnalelor de intrare si, respectiv, iesire, iar Ruy, matricele de intercorelatie intrare-iesire. Deoarece u(t) este SPnb rezulta ca Ru>0. În ipotezele generale facute asupra sistemului, daca la intrarea lui se aplica un semnal persistent atunci iesirea este de asemenea semnal persistent, deci si Ry>0. Matricea R fiind definita similara cu matricea asociata sistemului (vezi proprietatile sistemelor legate de persistenta semnalelor de intrare), un rationament asemanator cu cel din proprietatile 5 si 6 conduce la concluzia ca pentru n* ≥0 matricea este pozitiv definita. Acest lucru este de altfel necesar si pentru ca functia criteriu sa atinga un minim. Sa analizam acum limita:

−

−

=ϕ∑=

∞→

)nb(r............)1(r

)na(r...........)1(r

)t(v)t(N1

lim

vu

vu

vy

vy

N

1tN

.

Elementele acestei matrice sunt la limita corelatiile teoretice. În ipoteza

106

ca u(t) si v(t) sunt necorelate rezulta rvu(t) = 0, pentru t=1,2,...,nb. Deoarece: rvy(t)=rv(x+v)(t)=rvx(t)+rvv(t)=rv(t)

si cum v(t) este considerat zgomot alb, rezulta ca si rvy(t)=0 pentru t=1,2,...,na. În aceasta situatie:

0)t(v)t(N1

limN

1tN=ϕ∑

=∞→

si estimatia LSθ este consistenta în conditiile teoremei. Sunt necesare câteva comentarii la aceasta teorema. Conditia de persistenta impusa semnalului de intrare este de fapt o conditie de existenta a solutiei problemei de minimizare a functiei criteriu, întrucât în caz contrar nu se poate afirma nimic despre singularitatea matricei R. Faptul ca estimatorul LSθ este consistent numai daca v(t) este zgomot alb restrânge aplicabilitatea acestuia numai

la cazurile în care modelul de zgomot ,1)q(H 1 ≡− cazuri care sunt destul de rare.

Exista totusi situatii particulare în care estimatorul LSθ , care este un estimator al partii deterministe a sistemului, este consistent chiar daca zgomotul este corelat [4]. Analiza preciziei estimatorului poate fi facuta daca se cunoaste distributia sa. Analiza care urmeaza se bazeaza pe o varianta a teoremei limita centrale demonstrata de Ljung [3] si a unei teoreme demonstrate de Chung R. [6], teoreme pe care numai le vom enunta. Teorema (L. Ljung):Consideram vectorul:

VN1

)t(v)t(N1

)t(ZN1

X TN

1t

N

1tN φ=φ== ∑∑

==, unde Z(t) este un vector proces

stationar de medie nula si Z(t)=φ(t)v(t) în care φ(t) este o matrice, iar v(t) un vector. Elementele lui φ(t) si v(t) sunt procese stationare, posibil corelate, cu medii nule, generate de zgomot alb cu momente de ordin 4 finite. Elementele lui φ(t) pot contine si termeni deterministi. Atunci XN este asimptotic normal

distribuit, ( )P,0NX.dist

NN

∞→→ cu ]XX[MlimP T

NNN ∞→

= , presupunând ca aceasta

limita exista. Teorema (R. Chung). Fie XN o secventa de variabile aleatoare care converge în distributie la F(x), AN o secventa de matrice aleatoare care converge în probabilitate la A si bN o secventa de vectori aleatori care converge în probabilitate la b. Definim yN=ANXN+bN. Atunci yN converge în distributie la F(A-1(y-b)). În conditiile acestei teoreme, daca xN∈AsN(0,P), atunci yN=ANXN+bN converge în distributie la distributia normala N(b,APAT). Revenind la estimatorul celor mai mici patrate, considerând expresia 7.11 în forma:

∑∑=

−

=

∗ ϕ

ϕϕ=θ−θ

N

1t

1N

1t

TLS )t(e)t(

N1

)t()t(N1

)ˆ(N (7.13)

107

în care am înlocuit v(t) cu zgomot alb e(t) de medie nula si matrice de covarianta

,I)]t(e[M 22 λ= ceea ce asigura consistenta estimatorului. Se observa imediat ca

factorul: ∑=

ϕ=N

1tN )t(e)t(

N

1X se încadreaza în conditiile teoremei Ljung, deci

XN∈AsN(0,P) unde:

.)t(e)t(N1

)t(e)t(N1

Mlim]XX[MlimPT

N

1t

N

1tN

TNNN

ϕ

ϕ== ∑∑==∞→∞→

Tinând seama ca I)]t(e[M 22 ∗λ= si ca ,R)t()t(N1

limN

1t

T

N=ϕϕ∑

=∞→ (vezi

relatia 7.12), explicitând media din ultima egalitate, rezulta P=λ*2R. Notând 1N

1t

TN )t()t(

N1

R−

=

ϕϕ= ∑

relatia (7.13) devine: NNLS XR)ˆ(N =θ−θ ∗ si aplicând teorema Chung rezulta în final:

( )12*sLS R,0NA)ˆ(N −∗ λ∈θ−θ

Altfel spus:

φφλ=θ−θθ−θ=θ

θ=θ−

∗∗

N][

])ˆ)(ˆ[(Mˆcov

]ˆ[M1T2

TLSLSLS

*LS

(7.14)

în care φ=[ϕ(1),....,ϕ(N)]T. Pentru ca relatia sa fie complet specificata este necesara cunoasterea dispersiei λ*2 a zgomotului. Daca aceasta este cunoscuta aprioric, ceea ce se întâmpla rar în practica, atunci putem evalua un interval de încredere pentru vectorul parametrilor. De exemplu, la nivelul de încredere 0,95, avem:

1T2LS ][96,1ˆ −∗∗ φφλ≤θ−θ

1T2 )(ˆcov −∗ φφλ=θ . Când dispersia zgomotului nu este cunoscuta trebuie înlocuita cu un estimator al acesteia. Din faptul ca reziduul:

)t(e)ˆ)(t()t(ˆ LST +θ−θϕ=ε ∗

tinde la limita catre e(t), dispersia reziduului poate fi un estimator al dispersiei perturbatiei. Cum V(θ) poate fi interpretat ca în relatia (7.8) putem aprecia dispersia reziduului prin intermediul lui )ˆ(V θ . Rezulta ca un estimator pentru dispersia perturbatiei poate fi:

108

)ˆ(V)ˆY()ˆY(N1ˆ T2 θ=θφ−θφ−=λ (7.15)

Acest estimator este însa asimptotic deviat. Într-adevar, înlocuind θ din relatia (7.6) în (7.15), rezulta:

[ ] MYYY)(IYˆN TTT1TT2 =φφφφ−=λ − în care M este o matrice simetrica. Dar Y=φθ*+e (relatia 7.2 în forma vectoriala) si atunci:

MeeMeMeeMMe)e(M)e(ˆN TTTTTTTTTT2 =φθ++φθφθ+φθ=+φθφθ+=λ ∗∗∗∗∗∗

În aceasta egalitate am tinut seama ca 0))(I(M T1T =φφφφφ−=φ − . Media

( )( ) ( )[ ] ( ) 22T1T2T1T

2T1T2TTT2

)nbna(N)(N)(trtrI

)(ItrItrM]ee[trMM]trMee[M]Mee[M]ˆN[M∗∗−∗−

∗−∗

λ+−=λφφφφ−=λφφφφ−=

=λφφφφ−=λ====λ

În acest sir de egalitati am tinut seama de faptul ca trAB = trBA. Deci:

2*2

N)nbna(N

]ˆ[M λ+−=λ

de unde se observa devierea estimatorului. Este evident atunci ca estimatorul:

)ˆY()ˆY()nbna(N

1)ˆ(V

)nbna(NNˆ T2 θφ−θφ−

+−=θ

+−=λ

va fi nedeviat, având media egala cu λ*2.

7.1.2. Extensii ale estimatorului celor mai mici patrate

Când procesul tehnologic este afectat de perturbatia e(t) cu media diferita de zero, M[e(t)]=me, modelul sistemului devine: (S) )t(m)t()t(y e

T ε++θϕ= ∗ (7.16) în care ϕ(t), θ* au aceeasi semnificatie ca în (7.2), iar ε(t) este zgomot alb de medie nula. De remarcat ca media me a perturbatiei este de regula necunoscuta, perturbatia fiind de obicei inaccesibila masuratorilor. În aceasta situatie me trebuie estimata o data cu parametrii sistemului. Definind vectorii T

e ]m,[ ∗∗ θ=β si T]1,)t([)t( ϕ=ψ sistemul poate fi pus sub forma:

)t()t()t(y T ε+βΨ= ∗ (7.17) pentru care se poate aplica estimatorul CMMP, deci:

∑∑=

−

=ψ

ψψ=β

N

1t

1N

1t

TLS )t(y)t()t()t(ˆ (7.18)

unde: .]m,ˆ[m

ˆˆ T

eLSe

LSLS θ=

θ=β

109

Daca explicitam estimatorul, rezulta:

[ ]

ϕ

ϕ

ϕϕϕ=

=

ϕ

ϕ

ϕ=β

∑

∑

∑

∑∑

∑∑

=

=

−

=

==

=

−

=

N

1t

N

1t

1

N

1t

T

N

1t

N

1t

T

N

1t

1T

N

1tLS

)t(yN1

)t(y)t(N1

1)t(N1

)t(N1

)t()t(N1

)t(y1

)t(N1

1),t(1

)t(N1ˆ

sau

ϕ=

θ

ϕ

ϕϕϕ

∑

∑

∑

∑∑

=

=

=

==N

1t

N

1t

e

LSN

1t

T

N

1t

N

1t

T

)t(yN1

)t(y)t(N1

m

ˆ

1)t(N1

)t(N1

)t()t(N1

.

LSθ si em vor fi solutia sistemului de ecuatii:

=+θ⋅ϕ

ϕ=ϕ+θ⋅ϕϕ

∑ ∑

∑ ∑ ∑

= =

= = =N

1t

N

1teLS

T

N

1t

N

1t

N

1teLS

T

)t(yN1

mˆ)t(N1

)t(y)t(N1

m)t(N1ˆ)t()t(

N1

deci:

θϕ−=

ϕ−ϕ=θ

ϕ⋅ϕ−ϕϕ

∑ ∑

∑ ∑ ∑∑ ∑ ∑

= =

= = == = =N

1t

N

1tLS

Te

N

1t

N

1t

N

1tLS

N

1t

N

1t

N

1t

TT

ˆ)t(N1)t(y

N1m

)t(yN1

)t(N1

)t(y)t(N1ˆ)t(

N1

)t(N1

)t()t(N1

Daca notam valorile medii cu

∑∑==

ϕ=ϕ=N

1t

N

1t)t(

N1

)t()t(yN1

)t(y

si cu )t()t()t(~),t(y)t(y)t(y~ ϕ−ϕ=ϕ−= valorile centrate, atunci sistemul devine:

θϕ−=

ϕ=θ

ϕϕ ∑∑

==

LST

e

N

1tLS

N

1t

T

ˆ)t()t(ym

)t(y~)t(~N1ˆ)t(~)t(~

N1

sau ∑∑=

−

=ϕ

ϕϕ=θ

N

1t

1N

1t

TLS )t(y~)t(~

N1

)t(~)t(~N1ˆ (7.19)

Concluzia este ca putem determina LSθ cu relatia standard a estimatorului CMMP, aplicata însa datelor centrate, dupa care media perturbatiei se calculeaza cu relatia LS

Te

ˆ)t()t(ym θϕ−= , care este simpla si intuitiva. În cazul unui sistem multivariabil cu ny iesiri si nu intrari

(S) )t(e)t(u)q(B)t(y)q(A 11 += −∗−∗

110

nunyBdimqB.....qBI)q(B

nynyAdimqA.....qAI)q(A

inb

nb1

11

ina

na1

11

⋅=++++=

⋅=++++=∗∗

∗

∗

∗∗∗

−−−∗

−−−∗

parametrii sistemului sunt concentrati în matricea: T

nb1na1 ]B,....,B,A,....,A[ ∗∗∗∗∗∗∗=θ

de dimensiune ny/(na*ny+nb*nu). Notând: )]nbt(u),....,1t(u),nat(y),....,1t(y[)t( TTTTT ∗∗ −−−−−−=ϕ

de dimensiune 1/(na*ny+nb*nu), sistemul poate fi pus sub forma: )t(e)t()t(y T +ϕθ= .

cu observatia ca marimile care intervin în ecuatie sunt matrice si vectori. Un rationament asemanator ca în cazul SISO conduce la estimatorul:

)t(e)t(eminarg)(VminargˆN

1t

TLS ∑

=θθ=θ=θ

în care V(θ) este o matrice de dimensiune ny/ny. Vom spune ca θ minimizeaza matricea V(θ) daca matricea diferenta )ˆ(V)(V θ−θ este negativ definita pentru

orice θ. Daca o astfel de matrice θ exista, atunci ea minimizeaza orice functie scalara monoton descrescatoare de V(θ), cum ar fi de exemplu V1(θ)=trV(θ) adica urma matricei V(θ). Facând notatiile:

)t()t(R TN

1tϕϕ= ∑

= si )t(y)t( T

N

1t∑=

ϕ=Γ

matricea criteriu poate fi explicitata astfel:

ΓΓ−+Γ−θΓ−θ=

=ϕθ−ϕθ−=θ

−

=

−−

=

∑

∑

1TN

1t

T1T1

N

1t

TTT

R)t(y)t(y]R[R]R[

)]t()t(y)][t()t(y[)(V

Deoarece matricea R este nenegativ definita (o generalizare a cazului Markov) si deoarece termenul al doilea nu depinde de θ, rezulta ca minimul se obtine când:

∑∑=

−

=

− ϕ

ϕϕ=Γ=θ

N

1t

T1N

1t

T1LS )t(y)t()t()t(Rˆ (7.20)

presupunând ca inversa matricei R exista. Forma estimatorului este aceeasi ca si în cazul scalar însa dimensiunea matricei R este mare.

Evident, relatia (7.20) poate fi "decuplata". Daca θi este coloana i a

matricei ? si )t(y)t( i

N

1ti ∑

=ϕ=Γ atunci din (7.20) rezulta:

∑∑=

−

=

− ϕ

ϕϕ=Γ=θ

N

1ti

1N

1t

Ti

1i )t(y)t()t()t(Rˆ , i=1,...,ny

111

Este interesant de remarcat ca în estimarile celor ny sisteme SISO care compun sistemul multivariabil, matricea care trebuie inversata este aceeasi, ceea ce simplifica implementarea estimatorului CMMP în cazul multivariabil. În general, consistenta estimatorului CMMP este asigurata daca perturbatia este zgomot alb (necorelat), indiferent de distributia acestuia, precum si de persistenta semnalului de intrare. Daca distributia zgomotului alb este normala, atunci estimatorul CMMP coincide cu cel de verosimilitate maxima, asa cum vom arata ulterior. Daca zgomotul v(t) este corelat dar cu caracteristici statistice cunoscute, de exemplu M[v(t)]=0 si Rv=M[v2(t)]>0, atunci estimatorul CMMP devine estimator Markov, sau al celor mai mici patrate ponderate. Într-adevar, daca descriem sistemul (S) în forma completa:

Y=φθ*+V (7.21) în care V=[v(1),...,v(N)]T, celelalte marimi având semnificatia cunoscuta, matricea de covarianta a perturbatiei Rv=M[VVT]=CCT poate fi exprimata ca produs de matrice în care C este triunghiulara si nesingulara, Rv fiind pozitiv definita si simetrica. Înmultind la stânga cu C-1 în relatia (7.21) si notând Yc=C-1Y, φc=C-1φ si Vc=C-1V, rezulta:

ccc VY +θφ= . (7.22) În aceasta relatie noua perturbatie Vc are matricea de covarianta unitara:

ICCCCCRC]CVVC[M]VV[M T1T1T1v

1T1T1Tcc ==== −−−−−−

ceea ce înseamna ca noul zgomot este alb si se poate aplica estimatorul celor mai mici patrate:

YR]R[Y][ˆ 1v

Tc

11v

Tcc

Tc

1c

TcLS

−−−− φφφ=φφφ=θ (7.23) care este de fapt un estimator al celor mai mici patrate ponderate, cu matricea de ponderare 1

vR − . Acest estimator nu poate fi aplicat în practica deoarece presupune cunoasterea matricei de covarianta a zgomotului, ceea ce se întâmpla extrem de rar. Mai mult, chiar daca aceasta matrice ar fi cunoscuta, aplicarea estimatorului implica inversarea ei, ceea ce este dificil de realizat, Rv având dimensiunea N/N, N fiind numarul de date. Observatie. Metoda celor mai mici patrate poate fi ilustrata prin schema din figura 7.2. în care )t(u)q(B)t(y)q(A)t( 11 −− −=ε este eroarea de modelare generalizata. Se observa ca algoritmul CMMP conduce la minimizarea erorii medii patratice generalizate:

∑=θ

ε=θN

1t

2LS )t(minargˆ

7.2. Metoda celor mai mici patrate în doua etape Aceasta metoda este aplicabila în situatiile în care intereseaza si modelul de zgomot. Sa consideram sistemul (S):

(S) )t(e)q(C)t(u)q(B)t(y)q(A 111 −∗−∗−∗ +=

115

utilizata ca estimatie initiala pentru un algoritm mai puternic. 3° - Metoda CMMP în doua etape poate fi ilustrata în fig. 7.3.

PROCES

u(t)+

+z(t)

y(t)

R(q -1 )+ +

P(q -1 )

v(t)

ECMMP

+ -C(q -1 ) -1

ECMMP

(q -1)A B (q -1 ) C (q-1 )^

(t)

(t)

ε

ε

Fig.7.3

în care:

( ) )t(ˆ1)q(C)t(u)q(B)t(y)q(A)t()t(u)q(R)t(y)q(P)t(ˆ)t(u)q(R)t(y)q(P)t(v

111

11

11

ε−−−=ε−=ε−=

−−−

−−

−−

7.3 Metoda verosimilitatii maxime 7.3.1. Definirea EVM. Aceasta metoda a fost schitata în capitolul anterior si aplicata în cazul unui model de regresie. Ea poate fi aplicata si în cazul unui model parametric când se cunoaste repa rtitia zgomotului, permitând si estimarea parametrilor modelului de zgomot. Metoda se dovedeste a fi simplu de aplicat iar estimatorul parametrilor are proprietati statistice deosebite atunci când modelul de zgomot este de medie alunecatoare iar zgomotul alb e(t) este normal distribuit de medie nula si matrice de covarianta λ*2I. Sa consideram deci sistemul (S): (S) )t(e)q(C)t(u)q(B)t(y)q(A 111 −∗−∗−∗ +=

*nc**nc

1*1

1*

*nb**nb

1*1

1*

*na**na

1*1

1*

qc.....qc1)q(C

qb.....qb)q(B

qa.....qa1)q(A

−−−

−−−

−−−

+++=

++=

+++=

iar e(t)∈N(0, λ*2I).

116

Pentru acest sistem adoptam modelul: (M) )t()q(C)t(u)q(B)t(y)q(A 111 ε+= −−− cu A(q-1), B(q-1) si C(q-1) polinoame de aceeasi forma cu A*, B*, C* si gradele respectiv na, nb si nc, iar ε(t)∈N(0,λ2I) zgomot alb de medie nula si dispersie λ2. Presupunem de asemenea ca sunt îndeplinite ipotezele generale asupra sistemului si modelului si ca:

0)ncnc,nbnb,nanamin(n ≥−−−= ∗∗∗∗ . Parametrii necunoscuti sunt cuprinsi în vectorul:

[ ]Tnc1nb1na1 c,...,c,b,...,b,a,...,a=θ . Pentru ca modelul sa fie complet, în afara parametrilor θ este necesara fi estimata matricea de covarianta λ2I. Asa cum am vazut, estimatorul de verosimilitate maxima este:

( )λθ=λθλθ

,U,/Ypmaxargˆ,ˆ,

,

unde

][MI;)]N(),...,1([;)]N(u),...,1(u[U;)]N(y),...,1(y[Y T2TTT εε=λεε=ε== . Daca se introduce functia de verosimilitate logaritmica L(θ,λ)=lnp(Y/θ,U,λ),

( )λθ=λθλθ

,Lmaxargˆ,ˆ,

.

Desigur, pentru aplicarea estimatorului este necesara cunoasterea densitatii de repartitie conditionate p(Y/θ,λ,U). Sa explicitam ecuatia modelului (M) dând lui t valori de la 1 la N si considerând conditiile initiale nule. Notând cu A, B si C matricele:

=

=

=

1cc00

001c0001

C;

0bb0

000b0000

B;

1aa00

01aa001a0001

A

1nc

1

1nb

1

1na

12

1

LLLLLLL

LL

LLLLLLL

LL

LLLLLL

LLL

modelul devine, în forma matriceala: (M) AY=BU+Cε .

Se observa ca detA=detC=1, deci: Y=A-1BU+A-1Cε .

Datorita dependentei liniare între Y si ε , repartitia vectorului ε se transmite asupra lui Y. Ramâne de estimat media si matricea de covarianta a lui Y.

BUA][CMABUA]CABUA[M]Y[M 11111 −−−−− =ε+=ε+= datorita presupunerii ca ε(t) are media nula, iar

.)ACCAdet(Rdet

ACCAAC][CMA]])Y[MY])(Y[MY[(MR2T1T12

Y

T1T121TT1TY

λ=λ=

λ=εε=−−=−−

−−−−∆

Functia de verosimilitate este:

117

( )( )

[ ]( ) [ ]( )YMYRYMY

2

1Y

T21

2N e

2

1u,,/Yp −−− −

πλ=λθ

sau, deoarece:

( ) ( ) ( ) ( ) ( )

( )( )

( )∑=λ

ε−

−−−−−−

λπ=λθ

εελ

=ελε=−−

N

1t

222

1

2N

t

N

T2

11T1T12T11Y

T

e2

1u,,/Yp

1CAACCACA]Y[MYR]Y[MY

iar functia de verosimilitate logaritmica

).t(21

lnN2ln2N

),(LN

1t

22 ∑

=ε

λ−λ−π−=λθ

Parametrii necunoscuti intervin prin intermediul lui ε(t) din ecuatia modelului:

)t(u)q(C)q(B

)t(y)q(C)q(A

)t( 1

1

1

1

−

−

−

−

−=ε (7.31)

Valorile optime λθ ˆ,ˆ sunt:

ε

λ+λ+π=λθ=λθ ∑

=λθλθ

N

1t

22,,

)t(21

lnN2ln2N

minarg),(Lmaxargˆ,ˆ .

Problema minimizarii poate fi separata:

π+λ+θλ

=λ

θ=ε=θ

λ

θ=θ∑

2ln2N

lnN)ˆ(V1

minargˆ

)(Vminarg)t(21

minargˆ

2

N

1t

2

Estimatia 2λ poate fi dedusa analitic din:

02ln2N

lnN)ˆ(V1

dd

2 =

λ+λ+θλλ

de unde rezulta .N)ˆ(V2ˆ2 θ=λ În schimb, functia V(θ) este puternic neliniara în θ, valoarea optima putând fi obtinuta utilizând, de exemplu, algoritmul Newton-

Ralphson: ( ) ).(V)(Vˆ k1k2k1k θ∇θ∇−θ=θ−+

Pentru aplicarea acestui algoritm sunt necesare determinarea gradientului si matricei hessian în punctul curent si initializarea algoritmului. Ca orice procedura de programare neliniara, algoritmul N-R poate esua într-un minim local al functiei criteriu V(θ). În timpul cautarii, algoritmul de minimizare poate patrunde într-o regiune interzisa din spatiul parametrilor (de exemplu acolo unde polinoamele au zerouri în interiorul cercului unitar), fiind necesare rutine care sa testeze daca θk apartine sau nu domeniului admisibil. Aceste dificultati pot fi evitate atunci când initializarea algoritmului este facuta aproape de minimul global al functiei V(θ). O posibilitate simpla este

118

initializarea LS0 θ=θ , deci considerând C(q-1)=1. În acest caz, V(θ) fiind o

forma patratica în ai si bi, algoritmul N-R converge într-o singura iteratie, estimatorul care rezulta fiind de fapt estimatorul CMMP. Minimul astfel obtinut este considerat punct initial. O initializare mai buna se poate obtine utilizând metoda CMMP în doua etape pentru deducerea lui θ0. Observatia 1°. Pentru aplicarea algoritmului N-R este necesara determinarea componentelor gradientului si matricei hessian, adica:

ncnbna,1i,j),t(

),t(),t(),t()(V

ncnbna,1i),t(

),t(),t(21)(V

ji

2N

1t

N

1t ijji

2i

N

1t

N

1t

2

ii

++=∂θ∂θ

θε∂θε+∂θ

θ∂ε∂θ

θ∂ε=∂θ∂θ

θ∂

++=∂θ

θ∂εθε=

θε

∂θ∂=

∂θθ∂

∑∑

∑∑

==

==

Înlocuind ε(t,θ) prin relatia 7.31, rezulta ca este necesara rezolvarea urmatoarelor ecuatii cu diferente:

=θε−=∂

θ∂ε

=−=∂

θ∂ε

==∂

θ∂ε

−−

−−

−−

nc,1i),t(qc

),t()q(C

nb,1i)t(uqb

),t()q(C

na,1i)t(yqa

),t()q(C

i

i

1

i

i

1

i

i

1

=∂

θ∂ε−

∂

θ∂ε−=

∂∂

θε∂

==∂

θ∂ε−=

∂∂θε∂

==∂

θ∂ε−=

∂∂θε∂

−−−

−−

−−

nc,1j,ic

),t(q

c

),t(q

cc

),t()q(C

nc,1j,nb,1ib

),t(q

cb),t(

)q(C

nc,1j,na,1ia

),t(q

ca),t(

)q(C

i

j

j

i

ji

21

i

j

ji

21

i

j

ji

21

.

derivatele mixte fiind nule:

0bb

),t(ba

),t(aa

),t(

ji

2

ji

2

ji

2

=∂∂

θ∂ε=

∂∂θ∂ε

=∂∂

θ∂ε.

Numarul ecuatiilor ce trebuie rezolvate se reduce considerabil daca se stabilesc relatii de recurenta între diferitele derivate. Se poate astfel deduce cu usurinta ca:

1it

c)1it(

c),t(

b)1it(

b),t(

a)1it(

a),t(

1i

1i

1i

+>

∂+−∂ε=

∂θ∂ε

∂+−∂ε

=∂

θ∂ε∂

+−∂ε=∂

θ∂ε

119

2jit

cc)2jit(

cc),t(

cb)2jit(

cb),t(

ca)2jit(

ca),t(

11

2

ji

211

2

ji

211

2

ji

2

−+>

∂∂+−−ε∂=

∂∂θε∂

∂∂+−−ε∂=

∂∂θε∂

∂∂+−−ε∂

=∂∂

θε∂

În felul acesta determinarea completa a matricelor gradient si hessian implica rezolvarea a numai 6 ecuatii cu diferente, în care conditiile initiale pot fi considerate nule, si anume:

−ε−=∂

θ∂ε

−−=∂

θ∂ε

−=∂

θ∂ε

−

−

−

)1t(c

),t()q(C

)1t(ub

),t()q(C

)1t(ya

),t()q(C

1

1

1

1

1

1

si

∂−∂ε

−=∂

θε∂∂

−∂ε−=

∂∂θε∂

∂−∂ε

−=∂∂

θε∂

−

−

−

121

21

111

21

111

21

c)1t(

2c

),t()q(C

b)1t(

cb),t(

)q(C

a)1t(

ca),t(

)q(C

Utilizarea relatiilor de mai sus reduce considerabil timpul de calcul. Observatia 2°. Estimatorul de verosimilitate maxima poate fi utilizat si în cazul unui model general

( ) )t(e)q(H)t(u)q(Gty 11 −− +=

în care )q(B)q(A

)q(G 1

11

−

−− = si

)q(D)q(C

)q(H 1

11

−

−− = , polinoamele A(·), B(·), C(·), D(·)

având gradele na, nb, nc si respectiv nd. Acest model poate fi adus la forma: )t(e)q(S)t(u)q(R)t(y)q(P 111 −−− +=

unde: )q(D)q(B)q(R),q(D)q(A)q(P 111111 −−−−−− == si )q(C)q(A)q(S 111 −−− = pentru care se poate aplica estimatorul de verosimilitate maxima în maniera prezentata anterior, coeficientii polinoamelor A, B, C, D rezultând apoi prin rezolvarea sistemului care face legatura între acestia si coeficientii polinoamelor P(·), R(·) si S(·). Acest sistem este neliniar si în principiu, poate avea mai multe solutii, fiind necesara alegerea aceleia pentru care polinoamele P(·) si R(·), P(·) si S(·) au radacini comune. Observatia 3°. Reziduul ε(t) reprezinta eroarea de predictie de pas, ceea

ce înseamna ca estimatorul VM? este, în acelasi timp, si estimator care minimizeaza eroarea medie patratica de predictie (estimator MEP). Într-adevar, daca criteriul de optimalitate este eroarea medie patratica, atunci predictorul optimal de pas va fi:

( )( ) ])1t/t(y)t(y[Mminarg)1t/t(y 2

1t/ty−−=−

−

120

unde y(t/t-1) este un predictor de pas de eroare, necorelat cu e(t). Din ecuatia sistemului rezulta:

( ) )t(e)1t/t(y~)t(e)t(e]1)q(C[)t(u)q(B)t(y)]q(A1[ty 111 +−=+−++−= −∗−∗−∗ Termenul ( )1t/ty~ − depinde numai de valorile trecute ale marimilor de intrare, iesire si perturbatie, deci poate fi interpretat ca un predictor optimal de pas. Optimalitatea rezulta din faptul ca aceasta marime provine din ecuatia sistemului care genereaza datele de intrare/iesire. Ecuatia precedenta arata ca marimea de iesire masurata la momentul t difera de cea prezisa prin valoarea zgomotului alb la momentul t, acesta din urma fiind un proces aleator complet nepredictibil. Dispersia zgomotului alb poate fi folosita pentru aprecierea preciziei de predictie a marimii de iesire din sistem si, în cele ce urmeaza vom arata acest lucru. Eroarea medie patratica de predictie de pas este:

( )( )

( )[ ].)t(e)1t/t(y)t(e)1)q(C()t(u)q(B)t(y))q(A1(M2

)]t(e[M)1t/t(y)t(e)1)q(C()t(u)q(B)t(y))q(A1(M

)t(e)1t/t(y)t(e)1)q(C()t(u)q(B)t(y))q(A1(M

]))1t/t(y)t(y[(M

111

22111

2111

2

−−−++−+

++

−−−++−=

=

+−−−++−=

=−−

−∗−∗−∗

−∗−∗−∗

−∗−∗−∗

Ultimul termen din suma este nul deoarece e(t) nu este corelat cu u(t) si y(t/t-1), iar:

0)i(rC)]t(e)1)q(C[(Mnc

1iei

1 ==− ∑∗

=

−∗

.0)i(ra)i(ra)]t(e))t(y)q(A1[(Mna

1iei

na

1iyei

1 =−=−=− ∑∑∗∗

==

−∗

Rezulta ca minimul erorii medii patratice de predictie va fi λ*2=M[e2(t)], care se obtine pentru:

( ) ).t(e]1)q(C[)t(u)q(B)t(y)]q(A1[1t/ty 111 −++−=− −∗−∗−∗ Eroarea de predictie optimala va fi:

).t(e]1)q(C[)t(u)q(B)t(y)q(A)1t/t(y)t(y)t(ˆ 111p −−−=−−=ε −∗−∗−∗

Dar din ecuatiile modelului (M) rezulta: )t(]1)q(C[)t(u)q(B)t(y)q(A)t( 111 ε−−−=ε −−−

deci ε(t) poate fi considerat ca fiind eroarea de predictie de pas, optimul ei, în sensul erorii medii patratice minime, fiind obtinut pentru A=A*, B=B*, C=C*. Considerând modelul (M), vectorul θ rezulta din conditia ca eroarea medie patratica de predictie de pas sa coincida cu dispersia zgomotului alb:

( )]te[M)]ˆ,t([M 22 =θε În felul acesta se evita ipoteza cu privire la normalitatea zgomotului alb. Pentru aplicarea metodei MEP ar fi necesara cunoasterea numai a mediei M[e2(t)]. Cum aceasta nu este disponibila, ea poate fi înlocuita cu o estimatie a ei

121

obtinuta cu un model anterior. Acest lucru sugereaza de fapt o metoda iterativa care pleaca de la o estimare initiala a parametrilor si care se perfectioneaza prin iteratii succesive pâna la satisfacerea unui criteriu de convergenta impus. Estimatii initiale pentru MEP pot fi obtinute prin oricare din metodele anterioare, fiind preferate cele care furnizeaza estimatii initiale si pentru parametrii modelului de zgomot.

7.3.2. Analiza estimatorului de verosimilitate maxima Analiza preciziei presupune stabilirea distributiei estimatorului de verosimilitate maxima:

( ) ∑=θθ

θε=θ=θN

1t

2 ),t(21

minargVminargˆ .

Consideram dezvoltarea functiei criteriu în jurul valorii adevarate θ* a parametrilor:

......))((V)(21

)(V)(V)(V)(V 2TT +θ−θθ∇θ−θ+θ∇θ−θ+θ=θ ∗∗∗∗∗∗

si retinem numai aproximarea patratica. În punctul de minim global, gradientul functiei criteriu este nul, deci:

0)ˆ)((V)(V)ˆ(V 2 =θ−θθ∇+θ∇=θ∇ ∗∗∗

de unde rezulta: ( ) )(V)(Vˆ 12 ∗−∗∗ θ∇θ∇−=θ−θ

( ) )(VN1

)(VN1ˆN

12 ∗

−∗∗ θ∇

θ∇−=θ−θ (7.32)

Explicitând gradientul si matricea hessian:

θε∇θε+θε∇θε∇=θ∇

θε∇θε=θ∇

∑ ∑

∑

= =

=N

1t

N

1t

2T2

N

1t

),t(),t(),t(),t()(V

),t(),t()(V

sau, cu notatiile: ( ) ( ) ( ) ( )[ ]TN,....,1,,t,t ψψ=Ψθψ=θε∇

θε∇θε+θψθψ=θ∇

θεθψ=θ∇

∑ ∑

∑

= =

=N

1t

N

1t

2T2

N

1t

),t(),t(),t(),t()(V

),t(),t()(V

în punctul θ=θ* acestea devin:

θε∇θε+θψθψ=θ∇

θεθψ=θ∇

∑ ∑

∑

= =

∗∗∗∗∗

=

∗∗∗

N

1t

N

1t

2T2

N

1t

),t(),t(),t(),t()(V

),t(),t()(V

Sa observam însa ca ε(t,θ*) este eroarea de predictie optimala (vezi observatia 3°), deci ε(t,θ*)=e(t). Atunci:

125

Cum polinoamele A*(q-1), B*(q-1) si C*(q-1) sunt prime între ele si n*≥0, rezulta:

).q(L)q(C)q(C);q(L)q(B)q(B);q(L)q(A)q(A 111111111 −−∗−−−∗−−−∗− === Proprietatea arata ca pentru n*=0 sistemul este parametric identificabil. Daca n*>0 atunci estimatia nu este unica, totusi sistemul este sigur identificabil, ceea ce este echivalent cu faptul ca estimatorul este consistent.

7.4 Metoda minimizarii erorii de predictie de pas (MEP) 7.4.1. Definirea estimarii MEP. Metoda minimizarii erorii de predictie poate fi privita mult mai general. Consideram modelul ARMAX:

(M) )t()q(D)q(C

)t(u)q(B)t(y)q(A 1

111 ε+= −

−−−

cu polinoamele A(·), B(·), C(·), D(·) îndeplinind conditiile generale. Modelul poate fi scris sub forma:

).t()t(u)q(C

)q(B)q(D)t(y

)q(C)q(A)q(D

1)t(y 1

11

1

11

ε++

−= −

−−

−

−−

Deoarece polinoamele A, C si D sunt monice (a0=c0=d0=1) si b0=0, rezulta ca primii doi termeni depind exclusiv de valorile anterioare y(t-j), u(t-k), j,k≠0, ale marimilor de iesire si intrare. Deoarece ε(t) este reziduul, care nu este observabil si nu poate fi determinat din entitatile date sau presupuse cunoscute, daca polinoamele A, B, C, D ar fi cunoscute, atunci o predictie rezonabila a lui y(t), bazata pe modelul dat si pe informatiile disponibile pâna la momentul (t-1), este data de primii doi termeni, deci:

( ) ).t(u)q(C

)q(B)q(D)t(y

)q(C)q(A)q(D

11t/ty 1

11

1

11

−

−−

−

−−

+

−=−

Ca urmare, ε(t) poate fi interpretat ca eroare de predictie de pas ).1t/t(y)t(y)t( −−=ε

În cadrul metodelor MEP, parametrii necunoscuti ai modelului sunt determinati astfel încât sa minimizeze eroarea medie patratica de predictie de pas:

),t(minargˆN

1t

2 θε=θ ∑=θ

Predictia poate fi un scop în sine dar poate fi si o etapa necesara în conducerea unui proces. Deci:

[ ]2

N

1t

111

1

2N

1t1

11

1

11

)t(u)q(B)t(y)q(A)q(C)q(D

minarg

)t(u)q(C

)q(B)q(D)t(y

)q(C)q(A)q(D

1)t(yminargˆ

∑

∑

=

−−−

−

θ

=−

−−

−

−−

θ

−=

=

−

−−=θ

unde: [ ] .d...d,c...c,b...b,a...a Tnd1nc1nb1na1=θ

126

Dupa cum se observa, functia criteriu este puternic neliniara în parametrii θ ai modelului, ceea ce face ca estimatia MEP sa nu poata fi determinata analitic ci numai prin tehnici de optimizare, care au problemele lor specifice. Totusi, pentru structuri particulare, este posibila aplicarea unor algoritmi mai simpli de minimizare. O astfel de structura particulara este cea pentru care modelul de zgomot este autoregresiv (AR), caz în care metoda MEP este cunoscuta sub numele de metoda celor mai mici patrate generalizate.

7.4.2. Metoda celor mai mici patrate generalizate.

Consideram sistemul:

(S) )t(e)q(D

1)t(u)q(B)t(y)q(A 1

11−∗

−∗−∗ +=

si modelul:

(M) )t(e)q(D

1)t(u)q(B)t(y)q(A 1

11−

−− +=

ipotezele generale privind (S) si (M) fiind satisfacute, si e(t) zgomot alb de medie nula si dispersie λ*2. Parametrii necunoscuti sunt cuprinsi în vectorul:

[ ]Tnd1nb1na1 d.....d,b.....b,a.....a=θ .

În conformitate cu metoda MEP, rezulta:

)(Vminarg)t(minargˆN

1t

2 θ=ε=θθ=θ

∑

în care ( ) 2N

1t

111 ])t(u)q(B)t(y)q(A)q(D[)(V ∑=

−−− −=θ

criteriu care este puternic neliniar în parametri. Daca partitionam însa vectorul θ=[θ1,θ2]T, în care θ1=[a1... ana,b1.....bnb]T si θ2=[d1...dnd]T, constatam ca V(θ1,θ2) este o functie patratica daca fie θ1, fie θ2 sunt constanti. În consecinta, problema de optimizare poate fi rezolvata printr-o tehnica de relaxare, adica:

θθ=θ

θθ=θ

θ

−

θ

),ˆ(Vminargˆ

)ˆ,(Vminargˆ

2i1

i2

1i21

i1

2

1 i=1,2,..

cu 02θ dat pentru initializarea algoritmului. La fiecare iteratie a algoritmului de

relaxare se poate aplica estimatorul celor mai mici patrate. Astfel, daca =θ=θ −1i

22ˆ constant, deci D(q-1)= )q(D 11i −− este precizat,

atunci functia criteriu devine:

∑=

−−−−−−− −=θθN

1t

211i111i11i21 )]t(u)q(D)q(B)t(y)q(D)q(A[)ˆ,(V

127

sau, considerând valorile filtrate )t(y)q(D)t(y~ 11i −−= si ),t(u)q(D)t(u~ 11i −−=

[ ] [ ]∑ ∑= =

−−−− θϕ−=−=θθ

N

1t

N

1t

21

T1i

2111i21 )t()t(y~)t(u~)q(B)t(y~)q(A)ˆ,(V

în care am folosit notatia: ( ) ( ) ( ) ( ) T

1i ]nbtu~,...,1tu~,naty~,...,1ty~[)t( −−−−−−=ϕ − .

Estimatorul i1θ devine deci:

∑∑=

−

−

=−− ϕ

ϕϕ=θ

N

1t1i

1N

1t

T1i1i

i1 )t(y~)t()t()t(ˆ

Cu ajutorul lui putem determina entitatile: .N,...,2,1t),t(u)q(B)t(y)q(A)t(v 1i1i

i =−= −−

În acest caz functia criteriu ),ˆ(V 2i1 θθ devine:

[ ] [ ]∑∑==

− θω−==θθN

1t

22

Tii

N

1t

2i

12

i1 )t()t(v)t(v)q(D),ˆ(V

în care: .)]ndt(v),...,1t(v[)t( Tiii −−−−=ω Rezulta astfel:

.)t(v)t()t()t(ˆN

1t

ii

1N

1t

Tii

i2 ∑∑

=

−

=ω

ωω=θ

Procedura poate fi astfel continuata pâna la satisfacerea unui criteriu prestabilit. Teorema. Fie sistemul (S) si modelul (M), ipotezele generale asupra lor

fiind satisfacute. Daca u(t) este semnal persistent de ordin ]nabn,nbanmax[ ∗∗ ++ , atunci, în punctele de minim global ale functiei criteriu, sunt satisfacute relatiile:

)q(D)q(L)q(D

)q(L)q(B)q(B

)q(L)q(A)q(A

111

111

111

−∗−−

−−∗−

−−∗−

=

=

=

unde L(q-1) este un polinom arbitrar de grad:

].nddn,nbbn,naanmin[n ∗∗∗∗ −−−= Demonstratie: Estimatorul celor mai mici patrate generalizate fiind un estimator MEP, în punctul de minim global este satisfacuta relatia:

.)]t(e[M)]t([M)ˆ(V 222 ∗λ==ε=θ (7.33) Explicitând minimul functiei criteriu rezulta:

( )

( ) =

−

+=

=

−=ε=θ

−−−∗−∗−∗

−∗−−

−−−−

2

11111

111

211112

)t(u)q(D)q(B)q(D)q(A

)t(etu

)q(A)q(B

)q(D)q(AM

)t(u)q(D)q(B)t(y)q(D)q(AM)]t(ˆ[M)ˆ(V

128

=

+

−=

−∗−∗

−−−

−∗

−−∗−∗− 2

11

111

1

1111

)t(e)q(D)q(A

)q(D)q(A)t(u)q(D

)q(A

)q(B)q(A)q(B)q(AM

.)t(e)q(D)q(A

)q(D)q(A)t(u)q(D

)q(A

)q(B)q(A)q(B)q(AM2

)t(e)q(D)q(A

)q(D)q(AM)t(u)q(D

)q(A

)q(B)q(A)q(B)q(AM

11

111

1

1111

2

11

1121

1

1111

−+

+

+

−=

−∗−∗

−−−

−∗

−−∗−∗−

−∗−∗

−−−

−∗

−−∗−∗−

Ultimul termen din aceasta suma este nul deoarece u(t) si e(t) sunt presupuse a fi necorelate. Deoarece relatia (7.33) este îndeplinita atunci sunt îndeplinite relatiile:

( )

=

−

≡

−∗

−−−∗−∗−

−∗−∗

−−

0)t(u)q(A)q(D

)q(B)q(A)q(B)q(AM

1)q(D)q(A

)q(D)q(A

2

1

11111

11

11

(7.34)

Ca si în teorema precedenta, deoarece u(t) este semnal persistent rezulta

ca )t(u)q(A)q(D

)t(u~ 1

1

−∗

−

= este persistent de acelasi ordin. Notând:

( ) )t(u~)q(B)q(A)q(B)q(A)t(y~ 1111 −−∗−∗− −= ,

a doua conditie devine 0)]t(y~[M 2 = . Tinând seama de proprietatile sistemelor legate de persistenta semnalelor de intrare, rezulta ca daca:

)bnna,nbanmax(SP)t(u~ ++= ∗∗ - deci si u(t) - si 0)]t(y~[M 2 = , atunci:

.0)q(B)q(A)q(B)q(A 1111 ≡− −−∗−∗− În consecinta, conditiile de suficienta devin:

==

−−∗−∗−

−∗−∗−−

)q(B)q(A)q(B)q(A)q(D)q(A)q(D)q(A

1111

1111

sau, echivalent:

.)q(D)q(D

)q(B)q(B

)q(A)q(A

1

1

1

1

1

1

−

−∗

−∗

−

−∗

−

==

Cum polinoamele A*(q-1), B*(q-1), C*(q-1) sunt prime între ele, rezulta );q(L)q(A)q(A 11*1 −−− = )q(L)q(B)q(B 11*1 −−− = si )q(D)q(L)q(D 111 −∗−− = ,

gradul polinomului L(q-1) fiind n*. Când n*=0 sistemul va fi parametric identificabil, iar când n*>0 sistemul va fi sigur identificabil. Observatia 1. Proprietatea de mai sus este valabila în ipoteza ca θ corespunde unui punct de minim global al lui V(θ), unde:

129

)].t(e[M)t(e)q(D)q(A

)q(D)q(AM)t(u)q(D

)q(A

)q(B)q(A)q(B)q(AM)ˆ(V 2

2

11

1121

1

1111

=

+

−=θ

−∗−∗

−−−

−∗

−−∗−∗−

Daca introducem notatia: )]t(e[M)]t(u[M

S 2

2

= în care S este proportional cu

raportul semnal/zgomot, o analiza a punctelor de minim local ale lui ( )θV în functie de valorile lui S este dificila, însa se pot considera doua situatii limita: 1) S→∞ , când functia criteriu are numai minim global si proprietatile enuntate ramân valabile; 2) S→0, când )]t(u[M)]t(e[M 22 >> si criteriul devine:

≅θ −∗−∗

−−2

11

11

)t(u)q(D)q(A

)q(D)q(AM)ˆ(V

iar egalitatea M[ε 2(t)]=M[e2(t)] va fi satisfacuta pentru: ).q(D)q(A)q(D)q(A 1111 −∗−∗−− =

Se constata usor ca aceasta unica relatie este satisfacuta în cel putin doua puncte:

)]q(D)q(D);q(A)q(A[ 1111 −∗−−∗− == si )]q(A)q(D);q(D)q(A[ 1111 −∗−−∗− == si deci criteriul are cel putin doua puncte de minim. În consecinta, în unele aplicatii în functie de valoarea raportului S, va exista pericolul potential ca algoritmul de relaxare sa se termine într-un punct de minim local. Cu alte cuvinte, metoda celor mai mici patrate generalizata depinde esential de initializarea parametrilor. În general, este indicata folosirea unor puncte de start diferite si apoi alegerea, din minimele obtinute, a minimului global. Observatia 2. În general, nu se dispune de o estimatie initiala pentru

2θ . De aceea, în cele mai multe cazuri se considera 0ˆ 02 =θ , ceea ce înseamna ca

în primul pas estimatia 11θ va fi de fapt estimatia celor mai mici patrate.

7.4.3. Variante ale metodei CMMPG Varianta 1. Sa consideram modelul (M):

(M) )t()q(D

1)t(u)q(B)t(y)q(A 1

11 ε+= −−−

care satisface ipotezele generale, dar în care:

.)qd1()q(Dnd

1i

1i

1 ∏=

−− +=

În acest caz, vectorul parametrilor poate fi partitionat astfel: [ ] [ ]T

nd11T

nd1nb1na1 d,...,d,d,...,d,b,...,b,a,...,a θ==θ functia criteriu devenind V(θ1,d1,...,dnd). O prima varianta a metodei CMMPG utilizeaza pentru minimizarea functiei criteriu tot un algoritm de relaxare care are avantajul ca, la un pas oarecare, într-o prima etapa rezulta un estimator

130

CMMP pentru θ1, iar, într-o a doua etapa, estimatorul id care se obtine prin minimizarea unei functii de o singura variabila. Consideram initial d1=d2=......=dnd=0. Atunci:

Pas 1

θ=

θ=θθ

)0,...,0,d,ˆ(Vminargd

)0,...,0,(Vminargˆ

111

d1

111

1

1

Pas 2

θ=

θ=θθ

)0,..,0,d,d,ˆ(Vminargd

)0,...,0,d,(Vminargˆ

2121

d2

1121

2

1

Pas i

θ=

θ=θ

−

−θ

)0,..,0,d,d,..,d,d,ˆ(Vminargd

)0,..,0,d,..,d,d,(Vminargˆ

i1i21i1

di

1i211i1

i

1

În final, dupa nd pasi rezulta ∏=

−− +=nd

1i

1i

1 )qd1()q(D .

Sa observam ca nd nu trebuie precizat aprioric. El va fi egal cu numarul de iteratii dupa care este obtinuta convergenta algoritmului. Acest lucru conduce însa la un model de zgomot de ordin destul de mare, ceea ce nu deranjeaza întotdeauna. Ceea ce deranjeaza este faptul ca aceasta varianta a algoritmului nu este în general convergenta, adica pot exista sisteme pentru care algoritmul nu converge la valorile adevarate ale parametrilor. Acest lucru poate fi demonstrat prin contraexemple [4]. Desigur, algoritmul poate fi explicitat. Astfel daca:

( ) ( )2N

1t

nd

1i1

T1i

N

1t

21

T1N

1t

2111

))t()t(y)(qd1(

)])t()t(y)(q(D[])t(u)q(B)t(y)q(A)q(D[V

∑ ∏

∑∑

= =

−

=

−

=

−−−

θϕ−+=

=θϕ−=−=θ

la pasul 1 rezulta:

+=

θϕ−=θϕ−=θ

∑

∑

=

−

=θN

1t

21

11

d1

N

1t1

T1

21

T11

))t(v)qd1((minargd

ˆ)t()t(y)t(v;))t()t(y(minargˆ

1

1

iar la pasul 2:

( )

+=θϕ−++=

ϕ+=ϕ+=

θϕ−=θϕ−=θϕ−+=θ

∑ ∑

∑ ∑

= =

−−−

−−= =θ

−

θ

N

1t

N

1t

22

12

d

221

T11

12

d2

T11

T11

N

1t

N

1t

21

T2

21

T21

T11

21

.))t(v)qd1((minarg]ˆ)t()t(y)[qd1)(qd1(minargd

)t()qd1()t(~si)t(y)qd1()t(y~ care în

ˆ)t(~)t(y~)t(v;])t(~)t(y~[minarg)]ˆ)t()t(y)(qd1[(minargˆ

22

11

131

si procedura poate continua. Varianta 2. Fie modelul (M):

(M)

ε=+=

−

−−

)t()t(v)q(D)t(v)t(u)q(B)t(y)q(A

1

11

care este echivalent cu cel considerat în cazul general de aplicare a metodei celor mai mici patrate generalizate. Cu notatiile:

( ) ( ) ( ) ( )[ ]( ) ( )[ ]

[ ][ ]T

nd12

Tnb1na11

T

T

d,...,d

b,....,b,a,...,a

ndtv,...,1tv)t(

nbtu,...,1tu,naty,...,1ty)t(

=θ

=θ

−−−−=ω

−−−−−−=ϕ

acesta poate fi scris sub forma: )t()t()t()t(y 2T

1T ε+θω+θϕ= sau, în notatie

matriceala, dând lui t valori de la 1 la N:

[ ] ε+ψθ=ε+

θθ

Ωφ=ε+θΩ+φθ=2

121 ,Y

în care: [ ] .,,)]N(),....,1([,)]N(),....,1([)]N(),....,1([,)]N(y),....,1(y[Y

TTT

TT

Ωφ=Ψεε=εωω=Ωϕϕ=φ=

Pentru acest model se poate aplica estimatorul celor mai mici patrate, deci:

[ ] .ˆˆ

YY

Yˆ2

1T

T1

TT

TTT1T

θθ

=

Ωφ

ΩΩφΩΩφφφ

=ψψψ=θ−

−

Acest estimator rezolva global problema. Dificultatea obtinerii lui nu consta în inversarea matricei partitionate, ci în faptul ca valorile lui ω(t) nu sunt actual disponibile pentru calculul lui 1θ si 2θ . Si în acest caz dificultatea este depasita utilizând un algoritm de relaxare. Daca explicitam expresia estimatorului trebuie tinut seama de identitatea:

−−+=

−−−

−−−−−−

111

111111

DGEDFDE)GEFDI(E

HGFE (7.36)

în care matricele E si H sunt patratice, E este nesingulara, iar D=H-GE-1F este de asemenea nesingulara. În cazul nostru:

ΩΩ=Ωφφφφ−Ω=ΩφφφφΩ−ΩΩ= −− M])(I[)(D TT1TTT1TTT

în care T1T )(IM φφφφ−= − depinde numai de datele de intrare/iesire, nu si de perturbatia necunoscuta. Efectuând calculele rezulta:

ΥΩΩΩ=θθΩφφφ−Υφφφ=θ

−

−−

M)M(ˆˆ)()(ˆ

T1T2

2T1TT1T

1 (7.37)

132

Se observa ca primul termen din expresia estimatorului 1θ este de fapt

expresia estimatorului celor mai mici patrate Y)(ˆ T1TLS1 φφφ=θ − , iar 2θ este

estimator al CMMP ponderate cu matricea M. Daca notam cu T1T )( φφφ=Γ − rezulta:

( )

ΩΩΩ=θ

θΓΩ−θ=θ−

MYMˆ

ˆˆˆ

T1T2

2LS11 .

Relatiile de mai sus sugereaza urmatorul algoritm iterativ: Pas 1 a) Se calculeaza matricele Γ si M; b) Se calculeaza Yˆ

LS1 Γ=θ .

Pas 2 a) Se calculeaza ,ˆ)t()t(y)t(v LS1θϕ−= t=1,N b) Se calculeaza Ω.

Pas 3 a) Se calculeaza ( ) MYMˆ T1T2 ΩΩΩ=θ

−;

b) Se calculeaza cor2ˆ θ=θΓΩ ;

c) Se calculeaza .ˆˆˆˆ2LS1corLS11 θΓΩ−θ=θ−θ=θ

Pas 4 cu 1θ obtinut la pasul 3 ne reîntoarcem la pasul 2. Observatii:

1° Matricele Γ si M se calculeaza o singura data, depinzând de datele de intrare si iesire; 2° Procedura poate fi oprita prin stabilirea apriorica a unor criterii de convergenta; 3° Relatia 7.37 poate fi obtinuta si fara a folosi 7.36, din sistemul:

Ωφ

=

θθ

ΩΩφΩΩφφφ

YY

ˆˆ

T

T

2

1TT

TT

Varianta 3. Modelul (M) poate fi scris sub forma intermediara: (M) )t()t(u)q(G)t(y)q(F 11 ε+= −−

unde )q(A)q(D)q(F 111 −−− = si )q(B)q(D)q(G 111 −−− = , vectorul parametrilor

fiind în acest caz: .]g,...,g,f,...,f[p Tng1nf1=

Pentru acest model estimatorul celor mai mici patrate, care este consistent în acest caz, devine:

∑∑=

−

=ϕ

ϕϕ=

N

1t

1N

1t

T )t(y)t()t()t(p

unde: T)]ngt(u),...,1t(u),nft(y),...,1t(y[)t( −−−−−−=ϕ În felul acesta obtinem o estimatie consistenta a parametrilor modelului. Pentru determinarea parametrilor θ , deci a coeficientilor polinoamelor A(·), B(·) si D(q-1), problema se reduce fie la rezolvarea unui sistem neliniar de ecuatii algebrice

133

care leaga parametrii p de parametrii θ , fie la determinarea factorilor comuni ai

polinoamelor )q(F 1− si )q(G 1− . Prima cale ar necesita precizarea ordinelor polinoamelor A, B si D, de la un caz la altul sistemul având solutii diferite, eventual multiple. Al doilea caz, care este mai rational, ridica problema existentei factorilor

comuni între )q(F 1− si )q(G 1− în conditiile în care parametrii p sunt obtinuti cu anumita incertitudine datorita dependentei de esantionul de date. În aceasta situatie problema trebuie abordata statistic, bazându-ne pe faptul ca estimatorul p este consistent si normal distribuit, caz în care putem dispune de un interval de încredere. În [4] este abordata aceasta problema ajungând la necesitatea extremizarii unui alt criteriu, de data aceasta puternic neliniar în parametri.

7.5. Metode de variabila instrumentala 7.5.1. Esenta metodei de variabila instrumentala Asa cum am aratat, estimatorul celor mai mici patrate

∑∑=

−

=ϕ

ϕϕ=θ

N

1t

1N

1t

TLS )t(y)t(

N1

)t()t(N1ˆ

este consistent daca sunt îndeplinite conditiile:

=ϕ>ϕϕ=

0)]t(v)t([M0)]t()t([MR T

.

Daca prima conditie este asigurata, în general, prin persistenta semnalului de intrare, a doua conditie este îndeplinita numai daca v(t) este zgomot alb, ceea ce constituie o limitare serioasa a metodei. Variabilele instrumentale sunt introduse tocmai în ideea de a obtine un estimator similar celor mai mici patrate care sa fie consistent indiferent de natura perturbatiei. Metoda de variabila instrumentala se bazeaza pe estimatorul:

∑∑=

−

=

ϕ=θ

N

1t

1N

1t

TVI )t(y)t(z

N1

)t()t(zN1ˆ (7.38)

în care ϕ(t) are aceeasi semnificatie ca în cazul metodei CMMP, iar z(t) (dimz(t)=na+nb) este un vector oarecare ale carui componente, numite variabile instrumentale, trebuie alese în asa fel încât estimatorul sa fie consistent. Un calcul similar cu cel efectuat în cazul estimatorului celor mai mici patrate conduce la:

∑∑=

−

=

∗

ϕ+θ=θ

N

1t

1N

1t

TVI )t(y)t(z)t()t(z

N1ˆ

conditiile de consistenta fiind:

( )( )

=ϕ=

7.40 )]t(v)t(z[M039.7 0>)]t()t(z[MR T

Variabilele instrumentale pot fi corelate cu intrarile si iesirile dar nu sunt corelate cu perturbatiile. Cea mai obisnuita alegere a VI pentru a satisface cerintele (7.39) si (7.40) este alegerea intrarii întârziate (eventual filtrate). Cu cât

134

întârzierea este mai mare cu atât conditiile sunt mai bine satisfacute. Ca si în cazul estimatorului celor mai mici patrate si estimatorul de VI este insensibil la o transformare liniara, proprietate care poate fi utilizata atunci când construim vectori de variabila instrumentala. Într-adevar, daca în (7.38) înlocuim z(t) cu Tz(t), unde T este o matrice nθ/nθ de transformare nesingulara, estimatorul devine:

VI

N

1t

1N

1t

T

N

1t

11N

1t

TN

1t

1N

1t

TVI

ˆ)t(y)t(zN1

)t()t(zN1

)t(y)t(zN1

TT)t()t(zN1

)t(y)t(TzN1

)t()t(TzN1ˆT

θ=

ϕ=

=

ϕ=

ϕ=θ

∑∑

∑∑∑∑

=

−

=

=

−−

==

−

=

7.5.2. Alegerea variabilelor ins trumentale de baza Consideram o forma generala a vectorului de variabila instrumentala:

( ) ( ) ( ) ( )[ ]T-1 nbtu,...,1tu,nat,...,1t)(qK)t(z −−−η−−η−= (7.41) unde η(t) este obtinut prin filtrarea datelor de intrare:

)t(u)(qD)(qC

)t( 1-

-1

=η

ndnd

110

-1ncnc

110

-1 qd...qdd)(qDqc...qcc)(qC −−−− +++=+++= K(q-1) si K-1(q-1) sunt filtre asimptotic stabile, iar polinoamele C(q-1) si D(q-1) au zerourile în afara cercului unitar si sunt prime între ele. Este, evident, posibila o mare varietate de variabile instrumentale pentru cazuri particulare de forme ale filtrului K(q-1) si polinoamelor C(q-1) si D(q-1), pentru fiecare caz în parte urmând a determina parametrii astfel încât relatiile (7.39) si (7.40) sa fie îndeplinite. De exemplu, daca nc=nd=na, relatia (7. 41) devine:

( ) ( ) ( ) ( ) ( )[ ]

( ) ( ) ( ) ( )[ ] (7.42) nbnatu,....,2tu,1tu)q(D)q(KD,CS

nbtu)q(D,...,1tu)q(D,natu)q(C,...,1tu)q(C)q(D)q(K

tz

T1

1

T11111

1

−−−−−=

=−−−−−−=

−

−

−−−−−

−

unde S(-C,D) este matricea Sylvester asociata polinoamelor -C si D:

.......-c0 -c1 ....... -cna 0 0 0 -c0 -cna 0

-c0 -c1 ..... -cna0 0 ............. d 1

....... dna 0 001

1 d 1 ....... dna ..... 00 0 ....... 1 dna d 1

.....

nb

na

na+nb

S(-C,D)=

..................................................

..................................................

135

Se poate demonstra [2] ca daca polinoamele C si D au k zerouri comune, atunci rangS(-C,D)=na+nb-k. În cazul nostru, deoarece polinoamele sunt prime între ele, rezulta ca rangS(-C,D)=na+nb si deci matricea S este nesingulara si, în relatia (7.42), reprezinta o transformare liniara aplicata vectorului de variabila instrumentala, ceea ce nu afecteaza estimatorul. În consecinta vectorul z(t) poate fi:

( ) ( )[ ]T1

1

nbnatu,....,1tu)q(D)q(K

)t(z −−−= −

−

(7.43)

ceea ce înseamna ca de fapt polinomul C(q-1) nu afecteaza estimatorul. În particular, daca K(q-1)=D(q-1), gasim varianta:

( ) ( )[ ]Tnbnatu,....,1tu)t(z −−−= (7.44) analizata de Wanters în 1972. O alta varianta de alegere a vectorului de variabila instrumentala a fost propusa de Banon si Aquilar-Martin tot în 1972, definita prin:

( ) ( ) ( ) ( )[ ]Tnbtu,....,1tu,nakty,....,1kty)t(z −−−−−−−−= în care valorile iesirii sunt întârziate cu k intervale de esantionare, ceea ce slabeste corelatia cu perturbatia. Conditia a doua de consistenta este îndeplinita daca perturbatia v(t) este de medie alunecatoare de ordin ≤k. Daca sistemul este descris de ecuatia: (S) )t(v)t(u),q(G)t(y 1* +θ= ∗−

atunci )t(u),q(G)t(x 1* ∗− θ= este iesirea neafectata de zgomot (partea libera de zgomot) a procesului. Metoda de variabila instrumentala idealizata se bazeaza pe alegerea ( ) ( ) ( ) ( )[ ]Tnbtu,...,1tu,natx,...,1tx)t(~)t(z −−−−−−=ϕ= (7.45) O astfel de alegere asigura îndeplinirea ambelor conditii de consistenta în ipoteza unui semnal de intrare persistent. Într-adevar, daca notam:

( ) ( )[ ]T0.........0,natv,...,1tv)t(v~ −−−−= rezulta imediat ca )t(v~)t(~)t( +ϕ=ϕ si:

ϕ=ϕϕ=ϕ=

)]t(v)t(~[M0)]t(~)t(~[M)]t()t(z[MR TT

deoarece intrarea si perturbatia sunt presupuse a fi necorelate. Matricea R este simetrica si cel putin nenegativ definita si este pozitiv definita daca intrarea este semnal persistent. Aceasta varianta prezinta interes teoretic, nu si practic, deoarece ( )t~ϕ este necunoscut. Cunoasterea lui ( )t~ϕ ar însemna cunoasterea modelului partii deterministe a procesului, întrucât x(t) este intrarea filtrata de partea determinista. Cu toate acestea, se poate imagina un algoritm iterativ în care modelul adevarat, reprezentat prin parametrii θ*, necesar pentru determinarea variabilelor instrumentale idealizate, este înlocuit cu o aproximatie a acestuia. Fie )t(~)ˆ,t(z ϕ=θ , în care iesirile libere de zgomot x(t-k) sunt înlocuite prin

136

)kt(u)q(G 1 −− , cu )q(G 1− un estimator al lui G*(q-1) corespunzând vectorului

parametrilor θ . Algoritmul iterativ se bazeaza pe recurenta:

θ

ϕθ=θ ∑∑

=

−

=

+N

1t

k1N

1t

Tk1k )t(y)ˆ,t(zN1

)t()ˆ,t(zN1ˆ (7.46)

cu initializarea 0θ , care poate fi, de exemplu, estimatia celor mai mici patrate. Extensiile posibile provin prin folosirea unor date intrare-iesire filtrate, prin cresterea dimensiunilor vectorului z(t) de VI, astfel încât sa se obtina un sistem supradimensionat, sau prin aplicarea la o categorie de sisteme neliniare (de tip Hammerstein). Ratiunea acestor extensii consta în aceea ca, în general, conditiile de consistenta si precizie pot fi mai usor satisfacute. Sa consideram deci estimatorul VI extins:

φ

φ

φ=θ

∑∑

∑∑

=

−

=

−

−

=

−

=

−

N

1t

1TN

1t

T1

1N

1t

T1TN

1t

T1

)t(y)q(F)t(zQ)t()q(F)t(z*

*)t()q(F)t(zQ)t()q(F)t(zˆ

unde F(q-1) este un filtru ny/ny asimptotic stabil, iar Q o matrice de ponderare pozitiv definita. În consecinta, z(t) este o matrice nz/ny cu nz≥nθ. Este extinderea cea mai puternica atât prin introducerea filtrului, prin cresterea dimensiunii vectorului de VI, cât si prin aplicarea cazului MIMO. În cazul SISO:

ϕ

ϕ

ϕ=θ

∑∑

∑∑

=

−

=

−

−

=

−

=

−

N

1t

1TN

1t

T1

1N

1t

T1TN

1t

T1

)t(y)q(F)t(zQ)t()q(F)t(z*

*)t()q(F)t(zQ)t()q(F)t(zˆ

(7.47)

Cum y(t)=ϕT(t)θ*+v(t), rezulta, dupa câteva calcule:

( )

+θ=θ ∑

=

−−∗N

1t

1TN

1N

TN )t(v)q(F)t(z

N1

QRQRRˆ

unde:

.)t()q(F)t(zN1

RN

1t

T1N ∑

=

− ϕ=

Conditiile de consistenta devin:

=

>ϕ==−

−∆

∞→

0)]t(v)q(F)t(z[M

0)]t()q(F)t(z[MRRlim1

T1N

N .

Atunci când nz=nθ, adica z(t) si ϕ(t) au aceeasi dimensiune, expresiile se vor simplifica, nefiind necesara specificarea matricei de ponderare Q.

137

Estimatorul devine:

ϕ=θ ∑∑

=

−−

=

−N

1t

11N

1t

T1 )t(y)q(F)t(zN1

)t()q(F)t(zN1ˆ (7.48)

conditiile de consistenta ramânând aceleasi. Când nz=nθ matricea R este patratica. În cazul idealizat TT1 )]t(~)q(F[)t(z ϕ= − , unde F(q-1) este filtrul, deocamdata nespecificat, conditiile de consistenta devin:

ϕϕ=ϕϕ=

−−

−−

))]t(~)q(F())t(~)q(F[(M00> ))]t(~)q(F())t(~)q(F[(MR

T1TT1

T1TT1

.

A doua conditie este automat satisfacuta în ipoteza ca u(t) si v(t) sunt necorelate. Prima conditie este echivalenta cu )]t(~)t(~[M Tϕϕ nesingulara, în conformitate cu urmatoarea lema. Lema. Fie F(q-1) un filtru asimptotic stabil, F(q-1)≠0 neavând zerouri pe cercul unitar. Atunci matricele:

))]t(~)q(F())t(~)q(F[(MR T1TT1 ϕϕ= −− si )]t(~)t(~[MR~ Tϕϕ=

au acelasi spatiu nul ( )R~

(N)R(N ≡ ).

Demonstratie. Fie r un vector constant cu dim r=nθ si r)t(~)t(p Tϕ= .

Atunci: ]))t(p)q(F))(t(p)q(F[(trM))]t(p)q(F())t(p)q(F[(MRrr T111T1T −−−− == sau, trecând în complex:

du)e(F)e()e(trF21

Rrr jjpp

jT ωωππ−

ω φπ

= ∫

unde φpp(⋅) este matricea densitate spectrala a p(t). Avem urmatorul sir de relatii echivalente:

)R~

(Nr0rR~

r0r)]t(~)t(~[Mr0)]t(p)t(p[M

0)e(0)e(F)e()e(F0Rrr)R(NrTTTT

jpp

jjpp

jT

∈⇔=⇔=ϕϕ⇔=⇔

⇔≡φ⇔≡φ⇔=⇔∈ ωωωω

a doua echivalenta este adevarata deoarece trA=0 cu A pozitiv semidefinita implica A=0. A treia echivalenta rezulta din ipoteza ca F(q-1) nu are zerouri pe cercul unitar, deci ].,[pentru0)e(Fdet j ππ−∈ω∀≠ω

În aceste conditii, R este nesingulara daca si numai daca R~ este

nesingulara.

7.5.3. Distributia estimatorului de variabila instrumentala (VI)

Consideram varianta extinsa:

∑∑=

−−

=

−

ϕ=θ

N

1t

11N

1t

T1 )t(y)q(F)t(z)t()q(F)t(zˆ

unde y(t)=ϕT(t)θ*(t)+v(t) cu M[v(t)]=0, cov v(t)=Rv. Estimatorul poate fi scris sub forma:

identificarea sistemelor

Documents