curs modelare i

63
MODELARE MATEMATICĂ ÎN ACTIVITĂŢILE COMERCIALE BIBLIOGRAFIE 1. Introducere în econometrie – D. Jula, 2003. 2. Statistică şi econometrie – T. Andrei, 2003. 3. Econometrics – Franco Peracchi, 2000. 4. Econometric analysis (fifth edition) – 2003. 5. Modele şi metode econometrice – 2007. 6. Business Statistics- D. F. Groebner, P.W. Shannon, P.C. Fry, K.D. Smith, 2005. 7. Matematică pentru modelare economică vol. 2 – T. Dosescu, Ed. Universitară, sub tipar, 2014 8. BAZ D. Matematici pentru economişti. Teorie şi aplicaţii, Editura DOSESCU T. C. Cison, Bucureşti, 2003. BUTESCU V. BAZ S. SURSE DE DATE 1. www.insnn.ro 2. www.bnro.ro 3. www.insr.ro 4. Anuarul statistic 5. [email protected] 6. www.aw.com/stock_watson (Introduction to Econometrics, 2003, Stock J., Watson M., Ed. Addison Wesley, Boston) SUBIECTE DE EXAMEN

Upload: andpufuleti

Post on 01-May-2017

265 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Curs Modelare I

MODELARE MATEMATICĂ ÎN ACTIVITĂŢILE COMERCIALE

BIBLIOGRAFIE

1. Introducere în econometrie – D. Jula, 2003.

2. Statistică şi econometrie – T. Andrei, 2003.

3. Econometrics – Franco Peracchi, 2000.

4. Econometric analysis (fifth edition) – 2003.

5. Modele şi metode econometrice – 2007.

6. Business Statistics- D. F. Groebner, P.W. Shannon, P.C. Fry, K.D. Smith, 2005.

7. Matematică pentru modelare economică vol. 2 – T. Dosescu, Ed. Universitară, sub

tipar, 2014

8. BAZ D. Matematici pentru economişti. Teorie şi aplicaţii, Editura

DOSESCU T. C. Cison, Bucureşti, 2003. BUTESCU V. BAZ S.

SURSE DE DATE

1. www.insnn.ro

2. www.bnro.ro

3. www.insr.ro

4. Anuarul statistic

5. [email protected]

6. www.aw.com/stock_watson (Introduction to Econometrics, 2003, Stock J., Watson

M., Ed. Addison Wesley, Boston)

SUBIECTE DE EXAMEN

1. Proiect (cel mult nota 8)

2. Subiect de teorie (pt. notele 9 -10)

Page 2: Curs Modelare I

CURSUL 1

PREZENTARE GENERALĂ

Modelarea matematică în domeniul comerţului utilizează metodele şi modelele din

econometrie pe care o prezint în continuare.

Econometria este o disciplină care valorifică cunoştinţe şi metode furnizate de

discipline economice ( cum ar fi : economia politică, microeconomie, macroeconomie, teoria

firmei, etc.), discipline matematice ( cum ar fi: algebra liniară, analiza matematică, teoria

probabilităţilor, statistica matematică, simularea numerică, teoria măsurii, etc. ) şi

informatică, în vederea abordării complexe a problemelor ce apar în economia reală.

Denumirea de econometrie provine din combinarea cuvintelor greceşti oikonomia- economie

şi metron – măsură.

Econometria are ca obiectiv principal construirea unei categorii speciale de modele

economico-matematice, numite modele econometrice, ce modelează legăturile economice

care există în cadrul unui proces economic, între un grup de variabile predeterminate, numite

exogene sau independente şi un alt grup de variabile determinate, numite endogene sau

dependente şi care utilizează cel puţin o variabilă aleatoare şi|sau un proces stochastic.

Modelele econometrice astfel construite trebuie să modeleze cât mai adecvat fenomenele şi

procesele economice şi să permită, în urma testărilor şi analizei economice, luarea unor

decizii fundamentate ştiinţific.

Exemplu. În anul 1936, economistul american John Keynes ( 1883- 1946 ) a postulat

în lucrarea sa „The General Theory of Employment, Interest and Money” („Teoria generală a

folosirii mâinii de lucru, a dobânzii şi a banilor”, traducerea în limba română a apărut la

Editura Ştiinţifică, 1970), că între nivelul venitului şi cheltuielile de consum,

corespunzătoare venitului, există o legătură funcţională de tip determinist, având forma:

, unde este o funcţie, care poate fi şi liniară. Keynes a considerat în particular, o

formă liniară a modelului , unde coeficienţii îndeplinesc condiţiile: şi

, numite azi condiţiile lui Keynes. În abordarea econometrică a legăturii dintre cei doi

indicatori, se constată că acest model determinist al lui Keynes este inadecvat realităţii,

deoarece modelul nu captează influenţele cu caracter aleator sau stochastic, pe care o are

asupra consumului un şir de factori, cum ar fi : nivelul de educaţie, obiceiurile, condiţiile

economico-sociale ş.a. Din acest motiv, modelul lui Keynes trebuie completat cu cel puţin o

Page 3: Curs Modelare I

componentă aleatoare, notată prin e. Astfel modelul liniar poate avea forma: ,

dacă se ţine seama de factorul aleator în mod aditiv.

Deoarece fenomenele şi procesele economice nu se pot reproduce în laborator, pentru

a se efectua experienţe, modelele econometrice sunt criticabile, ca de altfel orice model, fiind

construite pe o bază de date lacunară, chiar săracă şi uneori subiectivă. Un remediu al acestei

situaţii îl constituie experienţele pe calculator ale modelelor econometrice, care utilizează

limbaje specializate, ca de exemplu GAUSS, EVIEWS, EXCEL.

Datele pe baza cărora se construiesc modelele econometrice se împart în două

categorii:

a) datele statistice, obţinute în urma înregistrării rezultatelor fenomenelor sau proceselor

economice, aşa cum au avut loc în realitate;

b) datele şi informaţiile apriori, care au un caracter subiectiv, fiind o cuantificare a

experienţei umane anterioare.

Prelucrarea şi utilizarea datelor statistice se face în cadrul teoriei selecţiei din Statistica

Matematică, iar utilizarea datelor şi informaţiilor apriori se face în cadrul bayesian, construit

pe baza teoremei lui Bayes din teoria probabilităţilor.

Structura cea mai generală a unui model econometric este:

1) grupul de ipoteze ( supoziţii ), cu caracter simplificator, teoria economică, şi

baza de date utilizată în construirea modelului economic;

2) modelul matematic al modelului economic, care este un obiect matematic ce

poate fi o ecuaţie sau un grup de ecuaţii, cu cel puţin o componentă aleatoare,

alcătuită din variabile aleatoare multidimensionale şi|sau procese stochastice.

Principalele tipuri de modele econometrice clasice sunt:

a) modele de regresie liniară;

b) modele econometrice cu ecuaţii (liniare) simultane;

c) serii de timp ( serii cronologice);

d) modele econometrice neliniare.

După construirea modelului econometric se trece la evaluarea performanţelor

modelului, utilizându-se metodele statisticii matematice, iar în final, pe baza modelului

validat, se construiesc predicţii privind evoluţia ulterioară a fenomenului sau procesului

economic modelat, specificându-se limitele probabiliste ale acestor predicţii.

Este posibil, ca pentru acelaşi fenomen sau proces economic să se construiască mai

multe modele econometrice diferite, efort care este justificat în măsura în care se sporeşte

Page 4: Curs Modelare I

gradul de adecvare al modelelor la realitatea modelată şi se obţin predicţii, care devin realitate

într-o proporţie din ce în ce mai mare.

MODEL, MODELARE, MODEL ECONOMETRIC

În ceea ce priveşte termenii de model şi modelare (comunicare prezentată la a XI-a

Conferinţă Internaţională de Cibernetică Economică, 22-24 Aprilie 2004), utilizăm

următoarele definiţii ale lui S. Marcus. Considerând un obiect sau un fenomen , supus

cercetării, se numeşte model al lui , un alt obiect , astfel încât:

1) există o analogie între şi , în sensul că îndeplineşte o funcţie iconică sau una

euristică în raport cu ;

2) obiectul poate fi investigat prin cel puţin o metodă care nu este compatibilă cu

natura lui , fapt care presupune o anumită eterogenitate a lui în raport cu ;

3) există cel puţin o metodă de tipul afirmat la 2), în raport cu care investigarea lui

conduce la concluzii nebanale;

4) concluziile relative la au o anumită relevanţă în raport cu ;

Se numeşte modelare procesul de construire a modelului, continuat cu studierea

modelului în vederea obţinerii de informaţii asupra obiectului sau procesului modelat.

Aceste definiţii oferă posibilitatea de a clasifica imensa varietate de modele. Astfel,

modelarea ( respectiv modelul ) poate fi:

1) materială ( material ), în cazul lui de natură materială, sau

2) ideală ( ideal ), în cazul contrar.

După natura analogiei dintre şi există o:

a) modelare similară, dacă analogia constă în natura fizică comună şi în identitatea

formelor geometrice, iar deosebirea constă în dimensiuni, în viteza proceselor etc.;

b) modelare analogică, dacă corespondenţa dintre şi se bazează pe aspecte

funcţionale şi nu materiale.

Dintre modelările analogice, una dintre cele mai fertile, având în vedere multiplele

aplicaţii, s-a dovedit a fi modelarea matematică, al cărei prim rezultat este un model

matematic. Un model ideal se numeşte matematic, dacă este un obiect matematic sau o

construcţie matematică. De regulă, obţinerea unui model matematic presupune, pe lângă o

formalizare utilizând limbajul matematic şi o exprimare cât mai fidelă a aspectelor funcţionale

ale obiectului sau procesului modelat, cu ajutorul gândirii matematice şi al rezultatelor

teoretice cunoscute. Printre instrumentele clasice utilizate în modelarea matematică se află:

axiomele, definiţiile, teoremele etc. Ca exemple de modele matematice se pot cita: geometria

Page 5: Curs Modelare I

euclidiană, structurile algebrice, câmpul de probabilitate, integrala Riemann, integrala

Lebesque, logica bivalentă etc.

O altă importantă categorie de modelări analogice este cea a modelării economice, al

cărei prim rezultat este un model economic. Un model ideal B se numeşte economic, dacă

este un obiect sau o construcţie obţinută pe baza unor ipoteze şi teorii economice, manevrate

de o gândire economică. Un exemplu de model economic îl reprezintă piaţa competitivă sau

piaţa perfectă.

Observaţii.

a. Este posibil ca rezultatele unei categorii de modelare să formeze obiectul unui alt tip

de modelare. În acest sens, se poate vorbi de o combinare a două sau mai multe tipuri de

modelare. În cadrul unei astfel de combinări, tipurile de modelare se influenţează reciproc.

b. Este justificată sau chiar recomandată o astfel de combinare a tipurilor de modelare,

atunci când, în final, se obţin noi rezultate semnificative faţă de cele obţinute prin categoriile

de modelare particulare ce sunt combinate.

Un exemplu important de combinare a două categorii de modelare îl constituie

combinarea modelării economice cu cea matematică care se numeşte modelare economico-

matematică.

Prin modelare economico-matematică a unui fenomen se înţelege o modelare

care cuprinde trei etape:

1) modelarea economică a lui , al cărui prim rezultat este un model economic .

În această etapă, o gândire economică utilizează teorii şi ipoteze economice cu caracter

simplificator spre a micşora complexitatea lui A , realizând modelul economic , astfel încât

să fie posibilă etapa 2;

2) modelarea matematică a lui , al cărui prim rezultat este un model matematic

al lui 'A . În această etapă, pe baza rezultatelor modelării economice, o gândire matematică

utilizează limbajul matematic, diverse instrumente şi teorii matematice spre a realiza modelul

matematic B al lui .

3) din investigarea modelului B şi din lanţul de analogii a lui cu şi a lui cu

se obţin informaţii noi asupra lui .

Rezultatul prim al modelării economico-matematice, , se numeşte model

economico-matematic.

Page 6: Curs Modelare I

Trebuie remarcat că de multe ori, etapa modelării economice nu este evidenţiată sau

pur şi simplu trece neobservată. Acest lucru poate favoriza eşecul unor modelări economico-

matematice.

Un gen special de modelare economico-matematică îl constituie modelarea

econometrică, al cărei prim rezultat este modelul econometric. Un model economico-

matematic se numeşte model econometric, dacă are cel puţin o componentă aleatoare.

Prin modelare econometrică se înţelege o modelare economico-matematică cu

următoarele caracteristici:

a. Etapa de modelare economică are ca obiect un micromediu economic, cum ar fi o

firmă, un segment de populaţie, un proces de producţie, sau un macromediu economic, cum

ar fi mediul economic al unei ţări sau grup de state, sau chiar economia mondială. Rezultatul

modelării economice este , modelul economic.

În această etapă, în cazul unui micromediu economic, adesea se apelează şi la diverse

ipoteze cu care se operează în prima etapă a modelării microeconomice pentru obţinerea lui

. De exemplu, se presupune că în mediul economic modelat acţionează legile globale care

acţionează într-o economie de piaţă, cum ar fi legea limitării resurselor, legea

randamentelor marginale descrescânde, legile cererii. De asemenea, mediul economic este

influenţat de comportamentul agenţilor economici, despre care se face ipoteza

comportamentului raţional [ 8 ] ?, de tipul competiţiei de piaţă, despre care ipoteza cea mai

convenabilă este cea a competiţiei perfecte, de existenţa echilibrului ( existence equilibrum )

care se traduce prin faptul că cererea este egală cu oferta, ambele evaluate la acelaşi preţ.

În cazul unui macromediu economic se apelează la diverse ipoteze cu care se operează

în prima etapă a modelării macroeconomice. De exemplu, ipotezele lui Keynes sau structura

contabilă a economiei unei ţări.

Observaţie. Dimensiunea mediului economic modelat poate să influenţeze amploarea

procesului de modelare şi instrumentele matematice utilizate în etapa modelării matematice,

dar nu esenţa sa. Astfel, în cazul unui macromediu se pot utiliza ca instrument matematic

sistemele Leontiev sau balanţa intrări-ieşiri ( input-ouput ), dar care nu sunt adecvate în cazul

unui micromediu.

b. Etapa de modelare matematică a lui ce produce modelul econometric are la

bază o gândire specifică, numită gândire econometrică, fiind rezultatul unui fenomen

sinergetic, ce se bazează pe gândirea economică, cu deosebire cea keynesiană şi dezvoltări

ale ei, pe gândirea statistică, în special cea a prelucrării şi a analizei datelor empirice,

precum şi a inferenţei statistico-matematice, pe gândirea probabilistă, în special cea a

Page 7: Curs Modelare I

proceselor stohastice, pe gândirea algoritmică şi cea informatică, care au permis, pe de o

parte, apariţia simulării numerice şi efectuarea de experienţe artificiale pe calculator, iar

pe de altă parte, o manevrare rapidă a unui volum de informaţie din ce în ce mai mare.

Gândirea econometrică consideră că variabilele economice, în realitate, au un caracter

aleator prin excelenţă, ceea ce implică în cadrul modelării econometrice considerarea lor ca

variabile aleatoare sau ca procese stochastice. De asemenea, datorită imposibilităţii luării în

calcul a tuturor factorilor care influenţează un proces economic, se consideră în cadrul unui

model econometric o variabilă - eroare aleatoare, unidimensională sau multidimensonală care

poate fi chiar un proces stohastic.

Ca urmare, modelul econometric are cel puţin o componentă aleatoare, al cărei rol

este acela de a compensa tratarea eronată a variabilelor economice ca fiind de natură

deterministă, precum şi de a ţine seama de erorile de măsurare sau cuantificare, de efectul

acelor variabile economice de care modelarea economică nu a reuşit să ţină seama şi de

influenţa unor factori total necunoscuţi, numiţi şocuri.

Valorile observate ale indicatorilor economici sunt generate de structura economică a

procesului modelat, ceea ce face ca, pe de o parte, acestea să conţină informaţii esenţiale

asupra procesului economic care le-a generat, iar pe de altă parte, să existe posibilităţi limitate

de a controla aceşti indicatori şi de a izola relaţiile dintre aceştia în vederea captării lor în

cadrul modelării econometrice. Printre ideile esenţiale ale gândirii econometrice, de care

trebuie să se ţină seama în modelarea econometrică, este cea care susţine feedback-ul ce

există între variabilele economice şi cea care consideră că efectele economice sunt rezultatul

unui sistem de relaţii, care în general, sunt stochastice, dinamice şi simultane. [J. Marshack,

1950 ]

Gândirea econometrică pare a fi o unealtă mai fină şi mai puternică, capabilă de a

opera asupra realităţii economice cu un grad sporit de precizie şi profunzime, să descifreze

informaţii, ascunse altor tipuri de gândire, pe care, graţie unor tehnici econometrice, să le

poată utiliza în captarea realităţii în cadrul modelelor econometrice.

O calitate esenţială a unui model econometric constă în posibilitatea de a

se efectua experienţe pe calculator utilizând acel model, suplinind astfel

incapacitatea de experimenta direct pe fenomenul-obiect .

MODELE CLASICE DE REGRESIE LINIARĂ

Page 8: Curs Modelare I

MODELUL I DE REGRESIE LINIARĂ

(Modelul liniar unifactorial)

Termenul de regresie a fost introdus de către statisticianul englez Francis Galton, într-

un memoriu scris în anul 1886, pentru a desemna legătura specială care există între înălţimea

taţilor şi înălţimea fiilor, ce exprimă tendinţa spre înălţimea medie.

În limba română, cuvântul ˝regresie˝ are şi semnificaţia de mişcare sau evoluţie în sens

contrar celui normal sau firesc.

În econometrie, termenul de regresie desemnează orice legătură sau dependenţă dintre

o variabilă dependentă şi una sau mai multe variabile independente, numite factori sau

regresori, dintre care cel puţin una este aleatoare. Regresia care exprimă o dependenţă liniară

se numeşte regresie liniară. Din această cauză modelele econometrice liniare sunt denumite

modele de regresie liniară.

Se consideră o populaţie statistică, a cărei caracteristică studiată este o variabilă

aleatoare teoretică X cu o repartiţie teoretică specificată, având media finită m şi dispersia

finită şi nenulă, astfel încât m şi sunt parametrii, eventual necunoscuţi.

Din această populaţie se extrage, la întâmplare, o selecţie repetată de

volum ; valorile de selecţie , , au o dublă interpretare: pe de o parte sunt

considerate drept valori numerice reale ale selecţiei, iar pe de altă parte sunt considerate drept

variabile aleatoare independente, având aceeaşi repartiţie cu cea a variabilei aleatoare X , ceea

ce implică:

şi .

Observaţie. Ipoteza că variabilele aleatoare de selecţie au aceeaşi

repartiţie cu X nu implică independenţa lor.

Modelul I de regresie liniară este rezultatul modelării econometrice a evoluţiei lui X şi

este construit pe baza selecţiei şi a următoarelor ipoteze explicite:

IPOTEZA 0. Fiecare valoare de selecţie este alcătuită din media sa m şi o

componentă aleatoare inobservabilă , , adică are loc:

(1) = , .

Consecinţe.

Page 9: Curs Modelare I

1) , ;

2) , ;

3) , .

Demonstraţie. 1) .

2)

3) .

IPOTEZA 1. sunt variabile aleatoare independente, identic

repartizate(i.i.d.).

Consecinţă. , .

Pentru a se obţine modelul I de regresie liniară se explicitează sistemul (1), astfel:

( 2 ) .

Se fac notaţiile:

şi este numit vectorul de selecţie;

;

şi este numit vectorul aleator al erorilor, care este

inobservabil.

Cu aceste notaţii sistemul (2) se scrie:

(3)

care reprezintă modelul I de regresie liniară.

___________________NOŢIUNI SUPLIMENTARE [ N.S.] _______________________

Vectori aleatori

Fie câmpul ( borelian ) de probabilitate şi fie n variabile aleatoare

.

Page 10: Curs Modelare I

Definiţie. Se numeşte vector aleator n-dimensional şi se notează prin X, sistemul

ordonat , unde şi

.

Definiţie. Fie vectorul aleator n-dimensional X = .

a) Se numeşte media lui X şi se notează prin vectorul coloană

de forma:

, dacă există finit,

.

b) Se numeşte matricea de covarianţă a lui X şi se notează prin

matricea pătratică de ordinul n:

= .

________________________________________________________________________

În modelul I de regresie liniară este un vector aleator n - dimensional şi depinde de

, rezultă că este un vector aleator n- dimensional.

Propoziţie. Au loc următoarele proprietăţi:

1)

2) ;

3) ;

4) .

Ex. Aplicatia 1 din Excel.

CURSUL II

MODELUL I I DE REGRESIE LINIARĂ

Page 11: Curs Modelare I

Prezentare generală

Se consideră o populaţie statistică, a cărei caracteristică cercetată este o variabilă aleatoare , cu o repartiţie teoretică specificată, având media finită şi dispersia finită şi nevidă ; şi sunt parametrii, eventual necunoscuţi.

Se presupune că valorile lui sunt influenţate liniar de un factor cunoscut, care este modelat de o variabilă vectorială nonaleatoare ( deterministă ), notată prin , unde

.În aceste condiţii, din această populaţie se extrage la întâmplare o selecţie repetată

de volum . Pentru a se modela econometric legătura dintre şi pe baza acestei selecţii, se

utilizează, pe lângă ipotezele 0 şi 1 de la modelul I şi ipoteza următoare:IPOTEZA 2. Influenţa liniară a variabilei vectoriale deterministe asupra lui se

traduce la nivelul valorilor de selecţie prin relaţia:

unde este numit parametrul de interceptare şi este numit parametrul de înclinare ( pantă ), ambii necunoscuţi.

În baza ipotezei 0 se poate scrie:

unde este componenta aleatoare inobservabilă, Observaţie. Consecinţele ipotezelor 0 şi 1, de la modelul I, rămân valabile, adică:

1) , ; 2) , ; 3) , .

În plus este adevărată şi proprietatea 4) .

Din relaţiile (1) şi (2) se obţine următorul sistem:

Se fac următoarele notaţii:

; , unde şi

; ; .

Cu aceste notaţii sistemul (3) se prelucrează astfel:

Rezultă că:

care este modelul II de regresie liniară, în care este vectorul aleator de selecţie sau

vectorul efectelor, este numit vectorul parametrilor locali şi este necunoscut, este numit

vectorul factor sau regresor sau vectorul variabilelor de control (comportament ) şi este

Page 12: Curs Modelare I

cunoscut, este numită matricea cadru şi este cunoscută, iar este vectorul aleator al

erorilor şi este necunoscut.

Observaţii. 1) este un vector observabil, pe când şi sunt vectori inobservabili.

2) este considerat variabila dependentă a modelului, iar matricea este considerată

variabila independentă, care determină pe

3) exprimă eroare modelului II, datorată faptului că modelul nu poate capta toate

influenţele care le suportă .

4) Acest model II, mai întâi va permite estimarea parametrilor necunoscuţi şi apoi,

elaborarea de predicţii asupra valorilor lui

Propoziţie. Fie modelul II de regresie liniară . Atunci au loc:

a) b)

Demonstraţie. a) .

b) .

Exemplu. În baza teoriei economice, legătura dintre venitul şi consumul unei familii

se poate modela econometric prin ecuaţia vectorială:

unde este vectorul consumului, este

matricea cadru cu şi este vectorul venitului;

; este vectorul aleator al erorilor.

Deoarece fiecare componentă a lui este alcătuită din două părţi:

a) combinaţia liniară , care exprimă dependenţa liniară a

consumului de venit, aşa cum a postulat şi J. Keynes,

b) eroarea inobservabilă , care reprezintă componenta aleatore a modelului,

şi se consideră satisfăcute ipotezele 0,1 şi 2, ecuaţia (*) este un exemplu de model II.

Comentariu. În ipoteza că şi , au repartiţii normale, rezultă că densitatea

de repartiţie condiţionată este normală cu media şi dispersia

, iar graficul ei este centrat faţă de dreapta reprezentată de medie şi are

forma:

Page 13: Curs Modelare I

Fig. 1

Estimarea parametrilor locali

Fie modelul II de regresie liniară şi se consideră următoarea:

Problemă. Să se estimeze vectorul parametrilor locali , în ipoteza că este

parametru cunoscut, determinându-se cel mai „bun” estimator (cea mai „bună” estimaţie) al

vectorului , notată prin , unde estimează pe , iar estimează pe .

Rezolvarea acestei probleme se face cu metoda celor mai mici pătrate ( M.M.P.).

Conform acestei metode, estimaţia a lui se determină din condiţia ca suma

pătratelor erorilor să fie minimă, adică:

Mai întâi, se prelucrează astfel:

Deoarece

,

rezultă:

Page 14: Curs Modelare I

_____________________[N.S.]______________________________________________

a) Reguli de derivare în raport cu un vector.

1) şi C nu depinde de ;

2) , unde şi , iar nu depinde de .

Caz particular. Dacă ( A simetrică ), atunci :

3) , unde , şi este o matrice simetrică , care nu depinde de

.

b) Matrice pozitiv definită.

Definiţie. Fie simetrică. este pozitiv definită, dacă 0, pentru

orice .

Proprietate. Dacă este pozitiv definită, atunci are loc:

şi 0.

Condiţia necesară pentru a determina minimul lui S este:

(*)

În continuare se va utiliza următoarea ipoteză:

IPOTEZA 3. are rangul 2.

Consecinţă. este o matrice pozitiv definită.

Demonstraţie. Deoarece , rezultă că cele două coloane ale lui sunt

liniar independente. Observăm că şi este o matrice simetrică. Fie vectorul

nenul şi considerăm produsul , fiind o sumă de pătrate. Dacă

produsul ar fi chiar 0, atunci ar trebuie ca , adică există o combinaţie liniară a

coloanelor lui egală cu vectorul nul şi deci coloanele lui sunt liniar dependente, ceea ce

contrazice concluzia de mai sus. Rezultă că şi este o matrice pozitiv

definită.

În acest caz se poate scrie:

Page 15: Curs Modelare I

, deoarece şi .

Prin urmare este soluţia ecuaţiei:

.

Deoarece există în baza consecinţei, rezultă că este dat de relaţia:

.

Deoarece

,

care este pozitiv definită, condiţia ( *) devine şi suficientă, în baza acestei consecinţe.

Prin urmare este soluţia optimă a problemei.

Proprietăţi statistice ale lui b

Ştim că este estimatorul (estimaţia) lui , obţinută cu

M.M.P. şi b = . Cu notaţia , rezultă că , adică

este o funcţie liniară de valorile de selecţie şi deci este un vector aleator bidimensional,

pentru care are sens media şi matricea de covarianţă.

Propoziţie. Sunt adevărate afirmaţile:

1) 2)

Demonstraţie.

1)

2) . Pe de altă parte:

-

. Înlocuind se obţine:

d

eoarece .

Consecinţă. este o estimaţie nedeplasată a lui .

Observaţie. .

..............................................................................................................................

Page 16: Curs Modelare I

CURSUL III

PREDICŢIA CU AJUTORUL MODELULUI II DE REGRESIE LINIARĂ

Se consideră modelul II de regresie liniară:,

valabil în ipotezele 0, 1 şi 2, unde este vectorul aleator de selecţie sau vectorul

efectelor, este matricea cadru cunoscută, cu

este vectorul variabilelor de control, este vectorul

parametrilor locali necunoscuţi, iar este vectorul aleator n-dimensional al erorilor cu

şi = .

Utilizând şi ipoteza 3, cu metoda celor mai mici pătrate s-a determinat estimaţia

a lui , în care este estimaţia lui , iar este estimaţia lui în sensul celor

mai mici pătrate.

Problemă. Să se construiască predicţii, pe baza modelului II de regresie liniară şi a

estimaţiei lui , privind efectul în viitor al factorului asupra variabilei aleatoare teoretice

, cunoscând efectul concretizat prin valorile de selecţie .

Dacă legătura dintre şi , stabilită de ipoteza 2 este exactă, atunci se pot

face predicţii asupra lui pentru o valoare dată a lui .

Astfel, fie o valoare „viitoare” a lui şi fie valoarea „viitoare” a lui ,

corespunzătoare lui . Atunci, conform ipotezei 2 are loc: , unde

este eroarea aleatoare inobservabilă „ viitoare ”, corespunzătoare lui .

DEFINIŢIE. Se numeşte ecuaţia de predicţie pentru valoarea viitoare ,

corespunzătoare lui , următoarea ecuaţie:

,

Page 17: Curs Modelare I

unde se numeşte predictorul lui , iar se numeşte eroarea de predicţie pentru

.

Observaţie. Formal, se poate scrie ecuaţia de predicţie pentru , corespunzătoare lui

, obţinându-se:

,

unde se numeşte predictorul lui , corespunzătoare lui .

PROPOZIŢIE. Eroarea de predicţie are următoarele proprietăţi statistice:

1. .

2. .

Demonstraţie. 1. = +

+ . Conform consecinţei ipotezei 0 are loc şi se poate scrie:

, ţinându-se

seama şi de faptul că

2. =

=

- = =

0202012102202

2021 ,cov2,cov2,cov2MbDbD bxbbbxx =

= , deoarece conform ipotezei 1, iar

0,cov,cov 0201 bb , deoarece şi sunt variabile aleatoare independente de ,

având în vedere faptul că este o eroare viitoare, pe când şi s-au determinat pe baza

unor informaţii din trecut.

Page 18: Curs Modelare I

Consecinţă. este o estimaţie nedeplasată a lui .

În acest fel s-a dat răspuns la problema pusă.

Se poate pune şi următoarea problemă.

Problemă. Să se stabilească legătura statistică între şi .

Mai întâi, se consideră media de selecţie şi se face următoarea prelucrare:

.

Termenul reprezintă abaterea lui faţă de media de selecţie, .

Termenul

i

not

ii YY se numeşte componenta eroare sau eroarea predictorului faţă

de . Termenul este numit componenta explicativă şi reprezintă abaterea

predictorului faţă de media de selecţie, .

Ridicând la pătrat relaţia (*) şi apoi însumând după indicele se obţine:

=

= ,

deoarece = 0, a cărei demonstraţie este laborioasă şi utilizează faptul că

în ecuaţia de predicţie , coeficienţii se determină cu metoda celor mai

mici pătrate.(W.H.Green-“ECONOMETRICS ANALYSIS”).

Relaţia = se poate împărţi cu

n

ii YY

1

20,

obţinându-se :

Page 19: Curs Modelare I

.

Se face notaţia: . Coeficientul se numeşte coeficientul de adecvare

( determinare ) şi exprimă gradul de adecvare al modelului II de regresie liniară faţă de legătura reală dintre şi . Adecvarea este dată de relaţia dintre şi , în sensul

unei „ bune” aproximări a lui prin ; dacă este apropiat de 1, atunci există o

strânsă legătură între şi , iar modelul II de regresie liniară este adecvat.

Formula lui se poate prelucra astfel : .

Se face notaţia: . este vectorul aleator n-dimensional al

erorilor predictorilor. Cu această notaţie formula lui capătă forma următoare:

,

adică gradul de adecvare depinde de ponderea momentului iniţial de ordinul doi al erorilor predictorilor, în dispersia de selecţie.

_______________________________ N.S. ____________________________________

Funcţii de producţie

Prin funcţie de producţie se înţelege expresia matematică (analitică) a legăturii dintre factorii de producţie, care se combină într-un proces de producţie şi rezultatele ce se obţin.

Fie cantitatea dintr-un produs, obţinută într-un anumit proces de producţie, prin utilizarea cantităţilor şi respectiv din factori de producţie. Atunci forma generală a funcţiei de producţie corespunzătoare acestui proces de producţie este :

.

În teoria generală a funcţiilor de producţie se lucrează cu următoarele trei ipoteze.

IPOTEZA de DIVIZIBILITATE. Un factor de producţie sau un bun (marfă) este divizibil, adică se pot considera în cantităţi oricât de mici.

Exemple: energia electrică, forţa fizică, făina, uleiul, banii, timpul, etc..

Page 20: Curs Modelare I

IPOTEZA de ADAPTABILITATE. Un factor de producţie este adaptabil, adică i se poate asocia o cantitate mai mică sau mai mare dintr-un alt factor.

Exemple. Pământul este un factor de producţie adaptabil, în sensul că pe o anumită suprafaţă dată pot lucra un număr mai mic sau mai mare de lucrători agricoli. Timpul, capitalul, munca sunt factori de producţie adaptabili.

IPOTEZA de SUBSTITUIRE. Un factor de producţie este substituibil, adică o cantitate din acest factor se poate înlocui cu o cantitate determinată dintr-un alt factor, fără ca volumul producţiei să se modifice.

Exemple. Pământul se poate substitui cu munca, timpul cu banii, munca cu banii.

Observaţie. Ipoteza de substituire poate funcţiona numai după ce sunt adevărate primele două ipoteze.

Se consideră funcţia de producţie , în care se admite că toţi factorii de producţie implicaţi verifică cele trei ipoteze. În aceste condiţii se pot defini următoarele noţiuni.

Se numeşte productivitatea medie (aparentă) a factorului de producţie şi se notează prin , următorul raport:

.

Se numeşte productivitatea marginală a factorului de producţie şi se notează prin , derivata parţială a funcţiei de producţie în raport cu , adică:

.

Asupra productivităţilor marginale se fac, de regulă, următoarele ipoteze:

, 0 şi ( ipoteza randamentelor descrescătoare ).

Se numeşte izocoantă totalitatea combinaţiilor factorilor de producţie care permit obţinerea aceluiaşi volum al producţiei.

Din punct de vedere geometric, izocoanta este locul geometric al tuturor punctelor de pe graficul funcţiei de producţie, care au aceeaşi valoare a coordonatei ce reprezintă volumul producţiei.

Funcţia de variabile reale este omogenă de gradul k, dacă îndeplineşte condiţia:

, .Fie funcţia de producţie . Se spune că randamentul de scară ( de

dimensiune) al procesului de producţie, modelat de această funcţie de producţie, este constant, dacă are gradul de omogenitate .În acest caz, de exemplu dublarea cantităţilor utilizate din cei factori, implică dublarea lui .

Dacă avem , atunci randamentul de scară este crescător, iar dacă avem , atunci randamentul de scară este descrescător.

Caz particular. Funcţia Cobb-DouglasÎn 1928, C.W.Cobb şi P.H.Douglas au construit următoarea funcţie de producţie:

,

Page 21: Curs Modelare I

unde primul factor de producţie reprezintă volumul capitalului, iar al doilea factor de producţie reprezintă cantitatea de muncă. Parametrii sunt strict pozitivi.

Productivităţile marginale ale celor doi factori de producţie sunt:

0 şi 0 .

Pentru un volum oarecare al producţiei se poate determina forma izocoantelor astfel:

.

Deoarece , rezultă că izocuantele sunt funcţii (curbe) strict

descrescătoare. Deoarece , izocuantele sunt funcţii (curbe) convexe.

Gradul de omogenitate al funcţiei se determină astfel:.

Atunci randamentul de scară depinde de suma .Astfel:1) Dacă >1, randamentul de scară este crescător;2) Dacă <1, randamentul de scară este descrescător;3) Dacă =1, randamentul de scară este constant; în acest caz se poate scrie

>0 şi funcţia de producţie capătă forma: , unde .

O estimaţie a lui

Estimarea parametrului cu metoda celor mai mici pătrate s-a făcut în ipoteza că parametrul este cunoscut.

În cele mai multe cazuri din realitatea economică, de exemplu în cazul estimării parametrilor din funcţia de consum sau de cerere, precum şi în cazul funcţiilor de producţie, parametrul de scală este necunoscut.

Dacă este necunoscut se pune problema estimării lui. Pentru aceasta se pleacă de la erorile aleatoare . Deşi acestea sunt inobservabile, totuşi se constată că au o legătură cu , ţinând seama că 2

iD , . Pe de altă parte, este calculabil şi pare a fi o

estimaţie naturală a lui , mai ales că , la fel cu .

Aceasta sugerează la a considera drept estimaţie a lui chiar dispersia erorilor predictorilor, notată prin a cărei formulă este:

sau .

Informaţii privind calităţile statistice ale lui sunt date de următoarea afirmaţie:PROPOZIŢIE. este o estimaţie deplasată a lui .Observaţii. 1. O estimaţie nedeplasată a lui , notată prin are următoare formă:

sau = .

Page 22: Curs Modelare I

2. În cazul necunoscut se poate da şi o estimaţie a matricei de covariaţă pentru , notată prin , care are următoarea formă:

= .........................................................................................................

CURS 4

MODELUL III DE REGRESIE LINIARĂ

Prezentarea generală a modelului III

Deoarece în practica economică o caracteristică a unei populaţii statistice poate fi

influenţată de mai mulţi factori simultan, apare ca necesară construirea unei generalizări

multidimensionale a modelului II de regresie liniară, care se va numi modelul III de regresie

liniară şi care este capabil să capteze informaţia conţinută în mai multe date statistice

referitoare la procesele economice modelate.

Exemple de astfel de factori sau variabile economice: producţia, preţul, capitalul, forţa de

muncă angajată, costul de producţie, etc..

O situaţie care exemplifică necesitatea construirii unui model de regresie liniară

multidimensional, apare atunci când se studiază consumul lunar pe cap de locuitor dintr-un

produs alimentar, notat prin P, în funcţie de preţul lunar al lui P, de preţul lunar al produselor

care pot să substituie sau să „ concureze” produsul P şi de veniturile lunare pe cap de locuitor.

Prin produse substituibile sau substitute se înţeleg acele produse ale căror coeficienţi de

elasticitate încrucişată sunt strict pozitivi.

Fie cererea din bunul şi să presupunem că ea este o funcţie de preţurile a bunuri

, care are forma generală .

Definiţie. Se numeşte elasticitatea încrucişată a cererii bunului în raport cu

bunul şi se notează prin , ponderea variaţiei relative a consumului din bunul , din

variaţia relativă a preţului bunului , adică:

.

Caz particular. Dacă , atunci , elasticitatea directă a cererii bunului .

Definiţie. Bunurile şi se numesc substituibile, dacă şi .

Exemple de produse substituibile sau concurente: stiloul este concurat de pix şi de

creion; uleiul este concurat de unt şi margarină, carnea de porc este concurată de cea de

Page 23: Curs Modelare I

pasăre, de peşte, de soia şi de cea de vacă, salamul este concurat de parizer, de cârnaţi şi de

ruladă, etc..

Dacă în acest studiu se decide ignorarea altor variabile economice, ce pot condiţiona

nivelul consumului lunar pe cap de locuitor, simplificând astfel realitatea economică pentru a

putea fi construit modelul de regresie, atunci este necesar să se stabilească dacă variabilele

explicative luate în considerare, condiţionează în realitate consumul lunar pe cap de locuitor

al produsului P şi în caz afirmativ, să se cuantifice efectul pe care îl are orice modificare a

nivelului fiecărei variabile explicative.

Rezolvarea acestor probleme necesită informaţii care ar putea fi obţinute construind

experimente, care, însă au nevoie de un nou cadru teoretic, ce va fi oferit de următoarea

generalizare multidimensională.

Se consideră o populaţie statistică, a cărei caracteristică studiată este o variabilă aleatoare teoretică , care este influenţată de factori cunoscuţi, care sunt variabile vectoriale, notate prin .

Din populaţia statistică se extrage, la întâmplare, o selecţie repetată , de

volum , referitoare la variabila aleatoare teoretică .

În aceste condiţii, se fac următoarele ipoteze, cu scopul de a construi un model mai general decât modelul II de regresie liniară.

IPOTEZA 0. Fiecare valoare de selecţie este alcătuită din media sa , numită componentă sistematică ( deterministă ) sau semnal şi o componentă aleatoare inobservabilă , numită eroare sau zgomot, .

În baza acestei ipoteze se poate scrie:, .

IPOTEZA 1. Influenţa variabilelor vectoriale , asupra lui este liniară şi este descrisă de relaţia următoare:

,

unde sunt numite variabile de control sau explicative, iar sunt numiţi parametrii locali şi care deşi sunt necunoscuţi, se presupun

constanţi în raport cu selecţia.Ţinându-se seama în relaţia (1) de ipoteza 1 se obţine:

.

Se fac următoarele notaţii: unde şi

, şi ,

cu ajutorul cărora sistemul (2) se scrie:

Page 24: Curs Modelare I

şi reprezintă modelul III de regresie liniară, în care: este vectorul aleator de selecţie sau vectorul efectelor, observabil şi ale cărui

componente au o densitate de repartiţie condiţionată de forma ;

este numită matricea cadru, este numit vectorul parametrilor locali şi este necunoscut, iar este vectorul aleator al erorilor inobservabile.

Observaţie. Vectorul diferă de la o selecţie la alta, pe când este aceeaşi indiferent de selecţia efectuată; aceasta este justificarea pentru denumirea de matrice cadru a lui şi pentru faptul că are o repartiţie condiţionată de .

Referitor la coloanele matricei se face următoarea ipoteză.

IPOTEZA 2. Coloanele matricei formează un sistem liniar

independent în şi .

Consecinţa 1. .Demonstraţie.Consecinţa 2. este o matrice nesingulară.Demonstraţie. Deoarece , rezultă că cele coloane ale lui sunt liniar

independente. Fie vectorul nenul şi considerăm produsul , fiind o sumă de pătrate. Dacă produsul ar fi chiar 0, atunci ar trebui ca , adică coloanele lui

sunt liniar dependente, ceea ce contrazice concluzia de mai sus. Rezultă că este o matrice simetrică pozitiv definită şi deci .

IPOTEZA 3. .

Comentariu. Conform ipotezei, matricea nu conţine nici o informaţie referitoare la media erorilor.

---------------[ N.S. ]------------------------------------------------------------------------------------Repartiţii condiţionate, medii condiţionate

Fie un câmp borelian de probabilitate şi vectorul aleator bidimensional , unde:

şi .

Atunci:

Au sens următoarele definiţii ale densităţilor de repartiţie condiţionate:

şi .

Cu ajutorul densităţilor de repartiţie condiţionată se pot defini mediile condiţionate, în felul următor:

şi .

Page 25: Curs Modelare I

Teorema mediei iterate. Este adevărată următoarea relaţie:,

unde este media unei funcţii de variabila aleatoare .Demonstraţie. Fie o funcţie şi funcţia compusă , care este o

variabilă aleatoare cu repartiţia:

.

Prin definiţie media lui se notează prin şi este dată de relaţia:

(*) .

Partea dreaptă a egalităţii, utilizând relaţia (*), devine:

.

Consecinţa 3. .Demonstraţie. Are loc:

.Consecinţa 4. .Demonstraţie. Are loc:

.IPOTEZA 4. .Comentariu. Această relaţie se poate explicita astfel:

.

Consecinţa 5. .Demonstraţie. Are loc:

.

Comentariu. În baza consecinţei 5, rezultă că . În acest caz se spune că erorile sunt homoscedastice. Deasemeni, deoarece pentru , erorile sunt necorelate. Uneori, erorile care sunt homoscedastice şi necorelate se numesc erori sferice.

Alături de cele 5 ipoteze se consideră frecvent şi următoarea ipoteză.

IPOTEZA 5. Matricea are toate elementele constante şi cunoscute.

În cele ce urmează se vor considera toate cele 6 ipoteze.

Exemple.

Page 26: Curs Modelare I

a) Se face un studiu pe o perioadă de 36 luni, privind consumul lunar pe cap de locuitor al unui produs P, în funcţie de preţul lunar al lui P, de preţul lunar al unui produs P1 concurent al lui P şi de veniturile lunare pe cap de locuitor.

Pentru a modela legătura dintre cei 3 indicatori statistici se fac următoarele notaţii:

unde şi ;

şi ,este vectorul consumului lunar;este matricea cadru cunoscută ale cărei coloane sunt: vectorul care conţine preţurile lunare ale lui P vectorul care conţine preţurile lunare ale lui P1vectorul care conţine veniturile lunare;

este vectorul parametrilor locali; este vectorul erorilor.

Cu aceste notaţii se obţine, presupunând că cele 5 ipoteze sunt adevărate, următorul model III de regresie liniară:

.

b) Se consideră dependenţa consumului mediu lunar de calorii de indicile preţurilor de consum şi de câştigul salarial mediu lunar net pe o perioadă de 24 luni.

Pentru a se modela această dependenţă se fac următoarele notaţii: unde şi

; şi ,

este vectorul consumului mediu lunar de calorii;este matricea cadru cunoscută ale cărei coloane sunt: vectorul care conţine indicele preţurile de consum vectorul care conţine câştigul salarial mediu lunar net;

este vectorul parametrilor locali; este vectorul erorilor.

Cu aceste notaţii se obţine, presupunând că cele 6 ipoteze sunt adevărate, următorul model III de regresie liniară:

.c) Un studiu econometric privind rata inflaţiei, consideră dependenţa acesteia

de deficitul bugetar, de masa monetară şi de venitul mediu trimestrial pe o periodă de 7 ani.Pentru a se modela această dependenţă se fac următoarele notaţii:

unde şi ;

şi , este vectorul ratei inflaţiei pe trimestre, este matricea cadru cunoscută ale cărei coloane sunt: este vectorul deficitului bugetar pe trimestre, este vectorul masei monetare pe trimestre,

Page 27: Curs Modelare I

este vectorul venitului mediu trimestrial, este vectorul parametrilor locali,

este vectorul erorilor.Presupunând cele 6 ipoteze îndeplinite în cazul acestui studiu econometric, cu aceste

notaţii se obţine următorul model:,

care este un exemplu de model III de regresie liniară.Considerarea vectorului erorilor în cadrul modelului este justificată de faptul

că, în acest studiu au fost ignoraţi şi alţi factori care influenţează rata inflaţiei, cum ar fi: politicile guvernamentale, fiscalitatea, nivelul importurilor, cursul de schimb al leului, etc..

O analiză critică a modelului III de regresie liniară

Modelul III de regresie liniară a fost construit pe baza celor 6 ipoteze, care

îngustează aplicabilitatea lui şi pun sub semnul întrebării relevanţa rezultatelor care se pot

obţine cu acest model. Aceasta justifică enunţarea următoarelor observaţii critice.

O1. Ipoteza 1 determină caracterul liniar al modelului în raport cu parametrii

necunoscuţi , deşi modelul poate să nu fie liniar în raport cu variabilele de control

. Astfel există şi cazuri în care legăturile dintre parametrii sunt neliniare,

ceea ce pune în discuţie adecvarea modelului III; totuşi, în anumite cazuri de neliniaritate se

poate vorbi de o liniaritate în logaritmi. Pentru a exemplifica, să presupunem că valorile de

selecţie sunt de forma:

.Deoarece se poate logaritma în baza e relaţia (*) şi se obţine:

.Utilizând notaţiile:

unde şi , şi ,

se obţine modelul econometric: , care este de tipul III.O2. Ipotezele 3 şi 4 referitoare la erorile aleatore, implică faptul că ele sunt

variabile aleatoare necorelate, cu aceeeaşi medie şi dispersie, ceea ce în realitatea economică

nu este întotdeauna adevărat.

O3. Ipoteza 5 postulează că matricea are toate elementele constante în

raport cu selecţiile repetate. Acest lucru ar fi sigur adevărat, numai în cazul experimentelor

de laborator, unde experimentatorul are controlul asupra variabilelor şi poate să observe în

mod repetat efectele depinzând de aceste variabile de control, care au o valoare fixată.

În general, într-o cercetare a unui fenomen economic, variabilele de control ale

ecuaţiilor modelului econometric, adesea sunt generate ca variabile dependente de alte ecuaţii

de natură stochastică şi astfel ele nu vor avea nici aceeaşi valoare, eventual fixată, pentru

Page 28: Curs Modelare I

selecţii repetate şi nici valorile pe care le doreşte cercetătorul; în acest caz vectorul este

condiţionat de variabilele de control, care sunt de natură stochastică , ceea ce face ca matricea

să nu fie constantă în raport cu selecţiile repetate.

O4. Modelul III de regresie liniară ar trebui să ţină seama de mulţimea tuturor

factorilor care influenţează în realitate caracteristica cercetată . În situaţiile economice reale,

rar sau niciodată, nu se ştie exact mulţimea tuturor factorilor şi ca urmare, anumiţi factori

relevanţi pot fi excluşi din model, iar factori străini să fie consideraţi în model.

O5. Despre valorile de selecţie , ce alcătuiesc vectorul , se

presupune implicit că nu sunt afectate de erori de măsurare; în realitate puţine legături

economice sunt ferite de „şocuri” aleatoare şi sunt neafectate de erori de măsurare.

O6. Despre valorile parametrilor locali se acceptă neexplicit

ipoteza că sunt constante, invariabile în timp şi nu depind de unitatea de măsură. În economie,

sistemele cu care se lucrează nu sunt întotdeauna staţionare, ceea ce face ca această ipoteză

să nu fie, uneori, în concordanţă cu realitatea economică.

O7. În general, modelele econometrice sunt construite pe baza unor ipoteze,

care simplifică realitatea economică ( afirmaţia este valabilă şi în cazul altor tipuri de

modele ). În particular, modelul III de regresie liniară poate, să nu fie suficient de adecvat faţă

de un proces economic modelat, deşi a fost construit pe baza datelor de selecţie, rezultate în

urma procesului economic şi nu ar fi surprinzător dacă modelul nu acoperă întreaga realitate

economică modelată.

În concluzie, această analiză critică are drept scop conştientizarea caracterului

simplificator al ipotezelor, care se află la baza construirii modelului III de regresie liniară,

necesitatea de a încerca şi de a realiza, în aplicaţii, concordanţa şi adecvarea modelului cu

realitatea economică modelată.

Trebuie subliniat (nu trebuie uitat) că slăbiciunile semnalate ale modelului III

pot avea consecinţe destul de grave, la nivelul performanţei modelului.

.............................................................................................................................. CURS 5

Estimarea parametrilor modelului III de regresie liniară

Fie modelul III de regresie liniară:.

Are loc următoare proprietate:PROPOZIŢIE. Demonstraţie. deoarece .

Page 29: Curs Modelare I

Observaţie. Deoarece şi , se poate spune că, în medie, modelul III de regresie liniară este corect.

Problemă. Să se estimeze parametrii necunoscuţi şi din modelul III de regresie liniară, pe baza vectorului de selecţie .

a) Estimarea vectorului În acest caz se va utiliza metoda celor mai mici pătrate (MMP). Conform metodei,

pentru a se determina estimaţia lui , mai întâi, se calculează , suma pătratelor erorilor, unde:

.Prelucrarea lui se face astfel:

,

sau

,deoarece .

___________________[N.S.] Optimizarea funcţiilor vectoriale ____________________

Fie o funcţie vectorială cu valori reale şi se consideră problema:(*) .

DEFINIŢIE. Vectorul este soluţie a problemei (*), dacă:1) satisface condiţia necesară:

;

2) satisface condiţia suficientă:

este o matrice pozitiv definită, şi atunci este un punct de minim, respectiv o matrice negativ definită, şi atunci este un punct de maxim, unde este hessianul lui , o matrice funcţională pătratică.

Reguli de calcul1) Dacă , nRax , , atunci :

Page 30: Curs Modelare I

;

2) Dacă , , atunci :

şi ;

3) Dacă , , atunci :

şi .

Caz particular. este matrice simetrică. Atunci formulele devin:

şi .

Fie soluţia optimă a problemei:.

Atunci verifică condiţia necesară:

,

adică:.

Deoarece este nesingulară, în baza consecinţei 2 de la ipoteza 2, rezultă că:.

Vectorul se numeşte estimatorul (estimaţia) în sensul celor mai mici pătrate al vectorului parametrilor locali .

Observaţii. 1) este un vector aleator, deoarece depinde de vectorul aleator ;2) este o funcţie liniară de . Într-adevăr, dacă se face notaţia:

se obţine .Câteva proprietăţi statistice ale lui sunt stabilite de următoarele afirmaţii.PROPOZIŢIE. este o estimaţie nedeplastă a lui .Demonstraţie. Are loc:

.Observaţii. 1) Dacă se fac selecţii repetate, atunci în medie reprezintă adevărata

valoare a lui .2) Pentru o anumită selecţie efectuată ( valoare a lui ) estimatorul poate avea o

valoare corespunzătoare, estimaţia lui , diferită de valoarea adevărată a lui , atât ca semn cât şi ca mărime.

Componenetele lui pot să difere de la o selecţie la alta, deoarece este un vector aleator şi atunci este util să se cunoască precizia estimării punctuale, evaluând împrăştierea faţă de medie a valorilor lui . Aceste informaţii sunt date de matricea de covarianţă a lui b, notată prin b .

PROPOZIŢIE. Are loc: .Demonstraţie. Are loc:

şi se poate scrie

Page 31: Curs Modelare I

=

= ,în baza consecinţei 5 de la ipoteza 4.

Observaţie. Deoarece este o matrice cunoscută, în baza ipotezei 5, rezultă că este o matrice cunoscută, iar dacă există o estimaţiea lui , atunci se poate construi

o estimaţie a lui b pentru b determinat pe baza unei selecţii.

Se consideră LN, clasa tuturor estimatorilor (estimaţiilor) liniari şi nedeplasaţi ai lui .

LN

Atunci o estimaţie oarecare din această clasă, notată prin , are forma , unde şi este o matrice care nu depinde de sau de alţi parametrii necunoscuţi; un

element particular al acestei clase este determinat specificând matricea B . De exemplu, b face parte din această clasă deoarece el este determinat de matricea , care este un caz particular de matrice . _______________________[N.S] Matrice pozitiv sau negativ semidefinită___________ DEFINIŢIE. Fie o matrice simetrică. se numeşte pozitiv (negativ) semidefinită, dacă :

.

PROPOZIŢIE. Fie . Atunci este o matrice pozitiv semidefinită.Demonstraţie. Deoarece , rezultă că este simetrică. Fie .

Atunci şi este o matrice pozitiv semidefinită.

În clasa LN estimatorul a lui are o calitate deosebită, pusă în evidenţă de următoarea teoremă.

Fie , şi doi estimaţii liniare şi nedeplasate ale lui , ale căror matrice de covarianţă sunt şi respectiv .

DEFINIŢIE. Estimaţia este mai „bună” decât estimaţia , dacă matricea este pozitiv semidefinită sau matricea este negativ semidefinită.

TEOREMA GAUSS-MARKOV. Estimţia este cea mai bună estimaţie din clasa LN a lui .

Demonstraţie. Fie cu .Ideea. Se demonstrează că matricea este pozitiv semidefinită.Mai întâi, se consideră matricea:

.

Rezultă că: şi =

.Pe de altă parte, este o estimaţie nedeplasată, dacă şi numai dacă . Atunci:

.

Page 32: Curs Modelare I

Prin urmare: . Atunci matricea de covarianţă a lui devine:

.Deoarece şi se obţine:

.

În concluzie , care este o matrice pozitiv semidefinită şi deci este cea mai bună estimaţie liniară şi nedeplasată.

b) Estimarea parametrului

Deoarece suma nu conţine pe , nu poate fi utilizată pentru estimarea lui .

În baza consecinţei 5 de la ipoteza 4 are loc . Atunci se

poate scrie: .

Se fac următoarele notaţii:

bXY şi .

PROPOZIŢIE. Are loc: .

Demonstraţie. .

Consecinţă.

Y este o estimaţie pentru YM , iar este o estimaţie a lui .

Într-adevăr, este o estimaţie a lui şi rezultă că este o estimaţie a lui , adică

Y este o estimaţie a lui YM , iar în baza propoziţiei de mai sus, rezultă că este o estimaţie nedeplasată a lui YM .

Pe de altă parte, deoarece

Y este o estimaţie a lui YM , rezultă că este o

estimaţie a lui , adică este o estimaţie a lui .

Din definiţia lui rezultă: sau .

DEFINIŢIE. Relaţia:

se numeşte ecuaţia de predicţie, corespunzătoare modelului III de regresie liniară.

Se pot face următoarele prelucrări:=

= YXXXXI TTn

1 .

Page 33: Curs Modelare I

Fie . Cu această notaţie se obţine:

B .

____________________[N.S.] Matrice idempotentă____________________________DEFINIŢIE. Matricea pătratică se numeşte idempotentă, dacă

.PROPRIETATE. Dacă este simetrică şi idempotentă, atunci are toate

valorile proprii egale cu zero sau cu 1.

PROPOZIŢIE. Matricea este simetrică şi idempotentă.Demonstraţie. Deoarece:

,rezultă că este simetrică.

Deoarece:-

- ,rezultă că este idempotentă.

Consecinţă. are toate valorile proprii egale cu zero sau cu 1.Pentru a estima parametrul se va utiliza funcţionala pătratică:

în locul lui . Pe de altă parte, se poate exprima în funcţie de , astfel:= ,

adică este o funcţională pătratică în componentele lui . Natura lui este pusă în evidenţă de următoarea afirmaţie.Observaţie. este o variabilă aleatoare unidimensională.

_________________[N.S.] Urma unei matrice __________________________________DEFINIŢIE. Se numeşte urma matricei şi se notează prin ,

numărul complex:

.

Caz particular. Dacă , atunci .PROPOZIŢIE. Sunt adevărate următoarele proprietăţi:1) .2) .Observaţie. Proprietatea 2 este adevărată şi în condiţii mai generale, în care cele 3

matrice nu sunt toate de acelaşi tip, dar există cele 3 produse.3) 4) .5) şi inversabilă, rezultă . 6) şi .PROPOZIŢIE. Sunt adevărate proprietăţile:

Page 34: Curs Modelare I

1) . 2) .

3) knS

2M .

Demonstraţie. 1) Rezultă din faptul că .

2) .

3)

= , deoarece şi sunt operatori liniari permutabili. Pe de altă parte, are loc:

= , în baza observaţiei de mai sus.

În concluzie: .

Se face notaţia: . Legătura dintre şi este stabilită de următoarea

afirmaţie.PROPOZIŢIE. .

Demonstraţie. .

Consecinţă.

2 este un estimator nedeplasat al lui 2 .

O altă formă a lui

2 este dată de următoarea afirmaţie.

PROPOZIŢIE. .

Demonstraţie. Se poate scrie:

= TTTT XXXXYY1

YXXXXI TTn

1

.

Cu ajutorul estimaţiei a lui se poate construi o estimaţie a matricei de covarianţă

, notată prin , de forma:

12

XX Tb ,

ale cărei elemente de pe diagonala principală sunt estimaţii ale dispersiilor elementelor lui , iar celelalte elemente sunt estimaţii ale covarianţelor dintre elementele vectorului .

....................................................................................................

CURS 6

EXPERIMENT ALEATOR UTILIZÂND MODELUL IIIDE REGRESIE LINIARĂ

Se consideră modelul III de regresie liniară, pentru a fi supus un experiment aleator pe

calculator, utilizând limbajul Gauss.

Page 35: Curs Modelare I

Fie ecauţia modelului III:

XmY ,

unde este vectorul de selecţie ( al observaţiilor sau efectelor ), vectorul

parametrilor locali este

, iar este vectorul aleator al erorilor inobservabile, cu

şi .

În acest caz, cel care face experimentul joacă rolul naturii şi prin urmare cunoaşte

vectorul parametrilor locali şi parametrul . Pe baza unei matrice cadru cunoscute şi

utilizând un generator de numere pseudoaleatoare se produc selecţii repetate, care formează

valorile lui .

Conform rezultatelor teoretice cunoscute, se determină estimatorul a lui , în

sensul celor mai mici pătrate, pentru ( fixat ) selecţii repetate şi pentru dat.

__________________[N.S.] Generatori de numere pseudoaleatoare _________________

DEFINIŢIE. Se numeşte şir de numere aleatoare un şir de variabile aleatoare independente, cu aceeaşi repartiţie, astfel încât termenii nu se repetă.

DEFINIŢIE. Se numeşte şir de numere pseudoaleatoare un şir de variabile aleatoare qusi-independente, cu aceaşi repartiţie, ai cărui termeni se repetă de la un rang suficient de mare.

DEFINIŢIE. Se numeşte generator de numere pseudoaleatoare, un procedeu aritmetic recurent de producere a unui şir , utilizând o relaţie de recurenţă de forma:

.Un exemplu de generator este generatorul congruenţial liniar, notat prin

McaX ,,,0 , care produce un şir NnnX de numere pseudoaleatoare, utilizând relaţia de recurenţă:

,unde 0X este numărul iniţial ( sămânţa-seed ) de la care porneşte generatorul, a este un factor de multiplicare, este numărul în raport cu care se calculează clasele de resturi, iar c este o constantă.

Observaţie. Dacă , atunci se obţine generatorul congruenţial liniar multiplicativ, iar dacă se obţine generatorul congruenţial mixt.

În Gauss există implementat un generator congruenţial liniar cu următorii parametrii:0X este valoarea ceasului sau este setat, utilizând comanda rndseed;

;;

.DEFINIŢIE. Se numeşte perioada şirului NnnX de numere pseudoaleatoare şi

se notează prin , numărul natural cu proprietatea:N nXX nn , .

Page 36: Curs Modelare I

Observaţie. Are loc: M .DEFINIŢIE. Şirul de numere pseudoaleatoare are perioada maximă,

dacă .Se pune problema construirii unui generator de şiruri pseudoaleatoare cu perioadă

maximă. Condiţii suficiente, pentru ca un generator congruenţial liniar să producă un şir cu perioada maximă, sunt date de următoarea afirmaţie.

TEOREMĂ. Generatorul produce un şir cu perioada maximă, dacă:1) ;2) este un multiplu de divizor prim al lui ,3) este divizibil cu 4, dacă este divizibil cu 4.

Utilizând un generator de numere pseudoaleatoare cu o repartiţie uniformă continuă pe

, având media 0 şi dispersia , se generează selecţii de volum asupra lui . Apoi,

se calculează vectorul , ce reprezintă partea sistematică şi se produc selecţii de volum

asupra lui , utilizând ecuaţia XmY .

În final, se compară valorile vectorului cu valorile lui .

Aplicaţie numerică.(ex1gr69) şi

are această formă:

O APLICAŢIE A MODELULUI III

DE REGRESIE LINIARĂ

Page 37: Curs Modelare I

Să se construiască modelul econometric al procesului de producţie al cărnii de pasăre,

desfăşurat într-un interval de 15 săptămâni, timp în care un pui ieşit din ou se transformă într-

un exemplar matur, apt pentru a fi comercializat.

În acest scop trebuie tabelată greutatea medie a unui lot de exemplare şi consumul

mediu corespunzător de nutreţuri în intervalul de 15 săptămâni.

Fie greutatea medie stabilită pentru un lot de exemplare la sfârşitul săptămânii şi fie consumul cumulat mediu de nutreţuri până la momentul .

Atunci funcţia de producţie care modelează acest proces de producţie, ignorând în

această fază erorile, are forma:

.

Pentru a se stabili forma analitică a funcţiei trebuie să se ţină seama de faptul că o

creştere cu o unitate a consumului de nutreţuri produce o creştere din ce în ce mai mică a

greutăţii unui pui. Această caracteristică a procesului de producţie exprimă o relaţie

crescătoare între şi , dar cu rata de creştere descrescătoare. Ca urmare, graficul lui

este o parte din graficul unei funcţii polinomiale de gradul 2, cu coeficientul dominant strict

negativ, ( 0 ), de forma:

Consum Xt2

Page 38: Curs Modelare I

Prin urmare funcţia are următoarea formă analitică:

,

unde 0 şi 0, deoarece productivitatea marginală este pozitivă şi descrescătoare.

În acest demers nu s-a ţinut seama, de toţi factorii care influenţează procesul de

producţie. Ca urmare trebuie ca în relaţia (*) să fie inclus şi un termen „ eroare”, notat prin ,

astfel că forma finală a lui este:

, .

Pentru a se construi modelul econometric se fac următoarele notaţii:

unde şi

, şi

.

Cu aceste notaţii, modelul econometric al procesului de producţie pentru carnea de

pasăre are forma:

XmY .

Acest model este liniar în parametrii locali , dar nu este liniar în variabila de

control .

Exemplu numeric. Se consideră procesul de producţie al cărnii de pasăre, care este

echivalat cu un experiment pe o durată de 15 săptămâni ce generează următoarele date:

Ytgreutate

consum X2t

Page 39: Curs Modelare I

a) Să se scrie modelul econometric adecvat procesului de producţie.

b) Să se estimeze parametrii modelului econometric.

c) Să se determine funcţia de producţie estimată.

d) Să se determine greutatea medie optimă de vânzare a unui exemplar matur.

Indicaţie. c) .

d) Se utilizează relaţia:

, unde este preţul unitar al nutreţului, iar este preţul de

vânzare al unui exemplar.

Predictibilitatea modelului III de regresie liniară

În cazul multor decizii privind probleme economice reale este justificat accentul

pus pe estimarea parametrilor modelului III de regresie liniară utilizat. Totuşi, există şi

cazuri în care se acordă o mare atenţie capacităţii de predictibilitate ( previziune ) a

modelului construit, privind vectorul efectelor , în funcţie de numărul diferit al

variabilelor de control ( explicative ) luate în considerare.

Pentru a aborda chestiunea predictibilităţii cu modelul III de regresie liniară se

consideră ecuaţia modelului:

XmY

Page 40: Curs Modelare I

şi se pune problema alegerii unei funcţii de predicţie, care să minimizeze pătratul erorilor de

predicţie.

În acest scop se fac următoarele notaţii:

este vectorul format cu valorile viitoare ale efectelor, care sunt considerate ca

fiind valorile unei selecţii viitoare de volum ;

este matricea cunoscută formată cu valorile viitoare ale variabilelor de

control;

Cu aceste notaţii, modelul III de regresie liniară corespunzător lui şi are forma:

,

unde este vectorul aleator al erorilor viitoare, cu media şi matricea de

covarianţă , independent de .

Deoarece este estimaţia în sensul celor mai mici pătrate a lui ,

funcţia de predictibilitate pentru este dată de următoarea relaţie:

,

unde este o estimaţie nedeplastă a lui , deoarece .

Această funcţie de predictibilitate are la bază următoarea ipoteză.

IPOTEZA S. Procesul de selecţie are aceleaşi caracteristici pentru şi pentru 0Y .

Presupunând adevărată această ipoteză are sens diferenţa , numită eroarea de

predicţie, care este un vector aleator şi are următoarea proprietate.

PROPOZIŢIE. 0

Y este o estimaţie nedeplasată a lui .

Demonstraţie. Se poate scrie:

. Rezultă

că: 00 YMYM

şi deci 0

Y este o estimaţie nedeplasată a lui .

Alte informaţii privind eroarea de predicţie sunt furnizate de matricea de covarianţă

, care se calculează astfel:

Page 41: Curs Modelare I

=

+ , deoarece şi sunt variabile aleatoare independente.

Interpretarea acestui rezultat este următoarea: abaterea erorii de predicţie de la media

sa are 2 componente; prima este datorată erorii care se face prin estimarea paremetrului şi

cea de a doua este datorată erorii .

? ....În unele situaţii interesează mai mult media vectorului 0Y , decât vectorul însuşi.

În acest caz, ştiind că şi 0

Y este o estimaţie nedeplasată a lui , se poate

calcula matricea de covarianţă a vectorului aleator , obţinându-se:

TT

mXmbmbmXmX 00000000

YXXXXMYYM

00

= , deoarece .

Rezultă că eroarea, care se face estimând prin 0

Y , depinde de alegerea matricei

, care conţine valorile viitoare ale variabilelor de control.

Influenţa creşterii numărului de parametrii

în cadrul modelului III de regresie liniară

În modelul I de regresie liniară se utilizează un singur parametru, în funcţie de care se

calculează media vectorului aleator , în timp ce în modelul III de regresie liniară se

utilizează parametrii, iar în matricea X sunt coloane, dintre care 1k coloane conţin

valorile variabilelor de control, ce se utilizează în calculul mediei lui .

Deoarece modelul III utilizează 1k parametrii în plus faţă de modelul I şi

corespunzător lor matricea X are în plus coloane, trebuie stabilită proporţia din totalul

Page 42: Curs Modelare I

variabilităţii lui , datorată considerării în plus a celor vectori coloană din X ,

corespunzători variabilelor de control.

Pentru aceasta se consideră ecuaţia de predicţie corespunzătoare modelului III de

regresie liniară, care utilizează estimaţia , în sensul celor mai mici pătrate, a lui şi are

forma:

,

unde şi , iar este o estimaţie a lui , care are drept componente erorile

neexplicate şi este numit vectorul erorilor neexplicate.

Relaţia (1) se poate scrie şi astfel:

,

unde reprezintă partea, din variabilitatea lui Y , explicată prin includerea variabilelor de

control în modelul III de regresie liniară.

O măsură a variabilităţii lui Y se obţine considerând suma pătratelor componentelor

lui Y , dată de produsul YY T şi care se prelucrează astfel:

.

Se ştie că B , unde Rn

TTn MXXXXIB

1not. Atunci are loc:

.

Utilizând aceste rezultate în produsul se obţine:

sau

.

În baza relaţiei (2), rezultă că suma pătratelor componentelor lui este alcătuită din

două părţi:

a) partea care depinde de variabilele de control;

b) partea care depinde de erorile neexplicate.

...............................................................................................................