serii de date si analize

Upload: mirela-elena

Post on 17-Feb-2018

218 views

Category:

Documents


0 download

TRANSCRIPT

  • 7/23/2019 serii de date si analize

    1/8

    3. SERIILE DE DATE I ANALIZA LOR

    3.1. Analiza primar a datelor i tipuri de erori

    Analizele i studiile hidrologice au la baz valorificarea unui fond de date meteo-hidrologice obinute prin efectuarea de msurtori i observaii de-a lungul unor perioade mailungi sau mai scurte de timp. n vederea obinerii unor rezultate ct mai pertinente, estenecesar ca difuzarea i utilizarea acestor date s fie precedate de o analiz primara calitiii fiabilitii lor.

    O etap iniial n constituirea seriilor de date o constituie convertirea informaiilorachiziionate prin diverse mi!loace, nregistrate i stocate sub diverite formate "diagrame, pehrtie sau digital# ntr-un format adecvat mrimilor hidrologice sau meteorologice ce urmeaza fi analizate.

    n continuare, analiza primar vizeaz verificarea "controlul# datelor n scopul stabiliriiverosimilitii lor i a omogeneitii lor spaiale i temporale. $ontrolul datelor permite

    identificarea unor posibile anomalii datorate erorilor care afecteaz calitatea lor.

    Erorilepot interveni n diferite momente ale achiziionrii datelor. n funcie deaceasta, ele pot fi clasificate n "%us& ' (aglaine, )**+#

    - erori de msur, datorate instrumentelor utilizate "reglare incorect, funcionaredefectuoas etc.#, manevrrii lor, amplasrii msurtorii, modificrii locului demsurare "de e. schimbarea poziiei mirei hidrometrice, a limnigrafului#

    - erori de lectur, datorate observatorului care efectueaz citirile- erori de transcriere a datelorpe diferite suporturi- erori aprute n urma prelucrrii primare a datelor "erori de interpretare, de

    calcul, de metodologie e. trasarea cheii limnimetrice#.

    /atorit erorilor care intervin, aloarea aderat a unei date nu este niciodatcunoscut. 0e dispune numai de aloarea sa o!"erat #m"urat$care, n funcie de erorilecare intervin, poate fi mai mult sau mai puin apropiat de valoara adevrat.

    1rorile care afecteaz datele meteo-hidrologice sunt de dou tipuri sistematice ialeatoare.

    Erorile "i"temati%e sunt datorate deficienelor de msurare, lectur, transmitere sauprelucrare primar a datelor. /atele afectate de asemenea erori sunt considerate inconsistente.

    Erorile aleatoaresau accidentale sunt ntotdeauna prezente, fiind imposibil de evitat.

    1le sunt datorate unor cauze, n general, necunoscute i afecteaz n mod diferit fiecaremsur. 0e supun, de regul, unei legi de repartiie normale i sunt necorelate. n vedereaminimizrii lor este recomandabil s se utilizeze tehnici de msurare ct mai performante.

    n condiiile n care datele meteo-hidrologice sunt supuse erorilor, pentru ca rezultateleanalizelor s fie ct mai corecte i relevante este indispensabil verificarea calitii lor. nacest scop se utilizeaz metode "tati"ti%e i &ra'i%ecare permit identificarea erorilor grosierei sistematice. 2nformaiile eronate descoperite vor fi corectate sau eliminate. /atele supuseverificrii primare vor fi validate i organizate sub diferite forme "arhive sau bnci de date#.1le pot fi difuzate n diferite publicaii "anuare# sau sub form de fiiere integrate unor bazede date informatice.

  • 7/23/2019 serii de date si analize

    2/8

    3.(. Tipuri de "erii

    $onstituirea seriilor de date care vor fi supuse analizei frecveniale este un proceslaborios care implic o selectare riguroas a datelor eistente, verificarea calitii lor,

    corectarea valorilor eronate, completarea valorilor lips.0eriile de date utilizate n analizele hidrologice sunt constituite din valori alediferitelor variabile hidrologice i meteorologice de interes, obinute prin msurtori ntr-o

    perioad de timp. Acestea reprezint "eriile %ronolo&i%e /e e. debitele lichide "medii,maime, minime lunare sau anuale#, volume de ap, precipitaii "orare, maime n +3 de ore#etc. n anumite situaii intereseaz studierea doar a unor evenimente hidrologice "cum suntviiturile# separate n cadrul seriilor cronologice, pentru analiza crora se creaz serii de valoricaracteristice specifice numai acestor evenimente. /e eemplu, n cazul analizei viiturilor,seria de date poate fi constituit din debitele de vrf ale fiecrei viituri separate n cadrulregimului hidrologic al rului prin diferite criterii "%e&lan ' %us&, )***#.

    0eriile de date utilizate n analiza frecvenial sunt de mai multe tipuri. /upcaracterul lor, pot fi %ontinue sau di"%rete. O serie este continu, atunci cnd valorile salesunt cunoscute pentru orice moment de timp. 1le se obin prin nregistrarea permanent afenomenului. /ei parametrii hidrologici constituie, n general, variabile continue, valorile lorsunt cunoscute prin msurare doar n anumite momente de timp "de eemplu, or, zi, lun,an#. n aceste condiii, seriile temporale devin discrete. 4rin nregistrarea lor cu dispozitive

    performante, la pai mici de timp "secund, minut# pot cpta caracter continuu.

    $nd se dispune de toate valorile unei variabile hidrologice caracteristiceevenimentelor independente, "eria "e %on"ider %omplet. 2ndependena evenimentelorsuccesive se verific cu a!utorul diferitelor tehnici statistice.

    ntruct analiza frecvenial se aplic cu precdere n studierea evenimentelor etreme"ce uneori pot include un numr foarte mare de valori#, pornind de la seriile complete seconstituie "erii ale e)tremelor anuale, ce cuprind numai valori anuale caracteristice"maim, minim#. 4entru o analiz statistic relevant este necesar ca seria s cuprindminim 56 de valori anuale.

    $nd o serie cronologic este prea scurt, n vederea eploatrii la maim ainformaiilor eistente, se apeleaz la seriile trunchiate sau 7umflate8.

    Seriile trun%*iatesunt constituite prin etragerea din seria complet a evenimentelorindependente etreme numai a valorilor ce depesc un prag ales arbitrar. 4entru alegerea

    pragului, n literatura de specialitate sunt propuse diverse tehnici "a se vedea %e&lan ' %us&,

    )***#. /e eemplu, dac la un post hidrometric se dispune de valori zilnice ale debitelor doarpentru o perioad de )6 ani, se procedeaz la valorificarea nu numai a debitelor maimeanuale, ci a tuturor celor ce depesc un anumit prag considerat.

    Seriile +um'late, sunt obinute prin etragerea din seria complet a datelordisponibile a celor mai mari 9 valori din fiecare perioad analizat "de obicei din fiecare an

    pentru care eist observaii zilnice sau la un pas mai mic de timp#.:tilizarea serilor trunchiate i 7umflate8 n analiza frecvenial necesit ns abordri

    speciale "cf. %e&lan ' %us&, )***#.

  • 7/23/2019 serii de date si analize

    3/8

    3.3. -eri'i%area "eriilor de date

    3.3.1. Noiuni generale$ontrolul statistic al datelor se realizeaz cu a!utorul tehnicilor specifice statisticii

    descriptive, ce const n aplicarea de teste grafice i numerice.Testele graficepermit o analiz vizual a diferitelor caracteristici ale seriilor de date.Testele numerice, cunoscute sub denumirea de teste de ipoteze, constau n verificarea

    unor ipoteze prealabile privind comportamentul statistic al datelor.

    Ipotezele de !azsupuse verificrii prin intermediul testelor statistice sunt "%us& '(aglaine, )**+#

    Datele re'le%t alorile aderate.Aceast ipotez nu este niciodat realizat n practic, ntruct datorit erorilor"sistematice sau aleatoare# valorile msurate nu reflect situaia real.

    Datele "unt %on"i"tente.

    $onsistena presupune c nici o modificare nu a afectat condiiile interne alesistemului n timpul perioadei de observaii "de eemplu, poziia mirei sau alimnigrafului, metodologia de observaii, observatorul etc.#.

    Seria de date e"te "taionar.

    0e consider c un fenomen hidrologic este staionar dac caracteristicile legiistatistice care l definete "medie, varian, momente de ordin superior# nu semodific n timp i n spaiu "n cazul variabilelor regionalizate# sub aciunea unor

    diferii factori.1emple de factori care pot determina non-staionaritatea datelor hidrologicedespduriri i mpduriri efectuate n bazine hidrografice, creterea coeficientuluide impermeabilitate datorit urbanizrii, lucrri hidrotehnice "lacuri de acumulare,derivaii .a.#.

    Datele "unt omo&ene.

    O serie de date este considerat omogen dac toate elementele care o alctuiescprovin din aceeai populaie staionar. ;eomogeneitatea datelor se remarc atuncicnd acestea provin din msurarea unui fenomen ale crui caracteristici evolueazn timpul perioadei de observaii sau cnd ele reflect dou sau mai multe fenomene

    diferite.n primul caz, neomogeneitatea este consecina caracterului nestaionar alfenomenului datorat unor modificri ale condiiilor sale de evoluie i msurare"modificri ale regimului scurgerii, ale profilului mirei#. ;eomogeneitatea cereflect fenomene diferite se remarc , de eemplu, n cazul seriilor de debite aleunui ru n aval de confluena cu aflueni ce au regim de scurgere diferit de cel alrului principal "datorit condiiilor de scurgere specifice subbazinelor lor#.

    Datele "unt independente.

    Aceast ipotez presupune c nu eist corelaii ntre valorile eantioanelor.

    /ara%terul aleator i "implu al "eriei de date.

  • 7/23/2019 serii de date si analize

    4/8

    1ste o ipotez fundamental pentru analiza statistic a seriilor de date. :n eantionde valori este considerat aleatordac toi indivizii "elementele# care l alctuiescau aceeai probabilitate de apariie "de a fi etrai#. 1antionul este "impluatuncicnd producerea unei valori nu influeneaz probabilitatea de apariie a celorlaltevalori din eantionul respectiv. O serie de date este aleatoare i simpl dac toate

    observaiile care o alctuiesc provin din aceeai populaie i sunt independententre ele./atele ce reflect fenomene naturale precum precipitaiile i debitele unui ruconstituie serii aleatoare, dar care pot fi sau nu simple. n timp ce valorile debiteloranuale sunt independente unele de altele, cele zilnice au o anumit dependencronologic "sunt auto-corelate#.

    Seria de date tre!uie " 'ie "u'i%ient de lun&

    Analizele frecveniale, pentru a conduce la rezultate ct mai relevante, trebuie sse bazeze pe eantioane suficient de lungi. O perioad de observaii mai mic de)< = +6 de ani poate conduce la erori importante ale estimrilor efectuate prin

    analiza statistic "n asemenea situaii se recomand utilizarea de serii trunchiatesau 7umflate8#.

    3.0. ANALIZA SERIILOR TE2ORALE. IDENTII/ARE TENDIN4ELOR

    3.0.1. Serii temporale. Noiuni &enerale

    0eriile temporale eprim evoluia n timp "># a unei variabile aleatoare "?# ? @ f">#. nfuncie de tipul variabilei, seriile temporale pot fi %ontinue "cnd valorile seriei suntcunoscute pentru orice moment de timp = t# i di"%ontinuesau di"%rete"cnd valorile serieisunt cunoscute numai la anumite momente de timp t), t+,t5, ..., tn# "erban, +66)#.

    ntruct timpul are caracter continuu, n analiza seriior temporale el este fragmentat nperioade echidistante ore, zile, luni, ani etc. 1l capt astfel un caracter discret.

    0eriile de timp pot fi staionare "aleatoare# i nestaionare "evolutive#. n %azul "eriilor"taionare, o valoare a seriei la momentul t i "&ti# nu depinde de valoarea anterioar "& ti-9#,eistnd astfel independen ntre timp i variabila considerat. 4arametrii statistici ai uneiserii staionare "media, variana, momentele de ordin superior# rmn constani n timp.

    Seriile ne"taionare se caracterizeaz prin modificarea n timp a a parametrilor sistatistici. n acest caz poate fi identificat o legtur mai mult sau mai puin intens ntrevariabila considerat i timp, datorat autocorelaiei temporale a valorilor seriei.

    Analiza seriilor de timp are drept scop identificarea i descrierea procesului caregenereaz evoluia variabilei considerate n vederea prognozrii evoluiei ei ulterioare. (a

    baza analizei seriilor de timp stau graficele n care pe abscis se reprezint timpul, iar peordonat variabila studiat. 0impla observaie vizual a unui asemenea grafic poate permiterecunoaterea tipului de serie. Astfel, n fig. ).). Apoate fi identificat o serie nestaionar, cutendin descendent, n timp ce n fig. ) B se poate identifica o serie ce vizula poate ficonsiderat staionar.n cazul n care graficul nu este foarte relevant, pentru a stabili dac

    seria este staionr sau nestaionar, se recomand aplicarea unui test de autocorelaie. :nastfel de test este testul lui ;eumann, prezentat n Anea ).). "$hadule, )**C#.

  • 7/23/2019 serii de date si analize

    5/8

    Fig. 1.1. A. Serie temporal nestaionar cu tendin descendent; B. Serie temporal

    staionar.

    0eriile temporale evolutive sunt supuse analizei pentru identificarea tipului de legturntre timp i variabila considerat, ceea ce permite prognozarea evoluiei seriei n viitor.

    0eriile temporale evolutive includ trei componente de baz- tendina ">#- componenta periodic sau ciclul "4#- componenta aleatoare sau stochastic "A#.n aceste condiii, se poate considera c o serie temporal D"t# este format din suma

    celor trei componente de baz D"t# @ >E4EA.Tendina indic modificarea n sens ascendent sau descendent a sensului de evoluie a

    seriei. /omponenta periodi% include oscilaii "cicluri# care se repet la intervale egale detimp, cu amplitudini regulate sau neregulate. /omponenta aleatoare eprim reziduul sauabaterile valorilor seriei fa de valorile teoretice corespunztoare tendinei. Analiza seriilorde timp presupune separarea celor trei componente i interpretarea lor.

    Analiza seriilor temporale este frecvent utilizat pentru cunoaterea comportamentuluin timp a variabilelor hidrologice i climatice "debite lichide i solide, nivelul apei,temperatura apei i a aerului, precipitaii, evaporaie etc.#. :n rol important n aceast analizl are scara temporal. /e eemplu, analiza seriilor de date anuale mascheaz ciclicitateaanotimpual.

    3.0.(. Tendina i analiza ei>endina eprim sensul general de evoluie a seriei de date n perioada de timp

    considerat. 1a este generat de neomogeneitatea i inconsistena seriilor de date, datorit

    unor modificri ce survin fie n modul de efectuare a observaiilor i msurtorilor, fie nfactorii care influeneaz desfurarea fenomenului analizat "dup cum s-a precizat ncapitolul privind seriile de date#. /e eemplu, scurgerea lichid i de aluviuni poate fiinfluenat de despduriri sau mpduriri, de amena!ri hidrotehnice, de etinderea arealelorurbanizate etc. $aracterul neomogen iFsau inconsistent al unei serii temporale poate fi stabilit

    prin metode grafice sau teste statistice "conform capitolului 7Gerificarea seriilor de date8#./intre metodele grafice este utilizat cea a curbelor integrale, iar ca teste statistice, testulHisher i testul 0tudent "a se vedea erban, +66)#.

    3.0.(.1. Tendin liniar i neliniarIraficul variaiei n timp a unui parametru permite identificarea vizual a tendinei

    generale, prezena de discontinuiti, salturi i schimbri brute. >endina poate fi eprimatprintr-o funcie liniar sau neliniar "polinomial# reprezentat, de asemenea, pe grafic.

    D"t#

    >

    %edia seriei

    >endina seriei A D"t#

    >

    %edia seriei

    5

  • 7/23/2019 serii de date si analize

    6/8

    Huncia liniar a unei tendine "># corespunde unei drepte de regresie, definit de ecuaia> @ at E b.

    Huncia neliniar este definit de polinoame de diferite grade cu ecuaia general deforma

    > @ a E bt E ct+E...,

    n ecuaiile menionate, t reprezint timpul, iar a, b, c sunt parametri ce se determin prinmetoda celor mai mici ptrate.

    Tendinei liniarei corespunde grafic dreapta de regresie. 4arametrii a i b care o definescsunt estimai prin metoda celor mai mici ptrate, cu a!utorul relaiilor "Iroupe $hadule,)**C#

    a @

    ( )( )

    ( )

    =

    =

    n

    i

    i

    i

    n

    i

    ti

    tt

    ttyy

    )

    +

    ) i

    b @ tay ,

    unde &ti@ valorile seriei temporale la momentul ti y @ media aritmetic a valorilorseriei temporale t @ "nE)#F+, n care n este efectivul seriei de date.

    un%iile neliniarepot fi transformate n funcii liniare prin logaritmare "a se vedeacapitolul 7$orelaii8#.

    $u a!utorul programelor computerizate "de eemplu 1cel# se pot trasa automat tendinelegenerale ale seriilor temporale, obinndu-se, de asemenea, ecuaiile acestora i coeficienii decorelaie "fig.).+.#.

    Fig. 1.2. Variaia temporal a debitelor medii anuale ale rului Prao!a la

    Poiana "apului #i tendina liniar

    n cazul funciilor polinomiale, analiza vizual a tendinei seriei de date, precum i analizacoeficienilor de corelaie permit identificarea celei mai potrivite funcii "fig. ).5.#. n general,a!ustarea seriei iniiale este din ce n ce mai bun pe msur ce gradul polinomului crete pnla un anumit nivel unde valoarea coeficientului de corelaie nu se mai mbuntete. Acestnivel corespunde polinomului de grad optim pentru a!ustarea seriei considerate "Jdoane icolab., )**K#. n graficul din fig. ).5., coeficentul de corelaie r pentru polinomul de gradul +

    este 6,+

  • 7/23/2019 serii de date si analize

    7/8

    Hig. ).5. Variaia temporal a debitelor medii anuale ale rului Prao!a laPoiana "apului #i repre$entarea tendinei polinomiale de gradul 2% & #i '.

    $unoscnd tendina ">t# se determin componenta rezidual " t( # a seriei de dateobservate "Dt# cu a!utorul relaiei "Jdoane i colab., )**K#

    t( @ Dt- >t.

    3.0.(.(. ediile mo!ile

    %ediile mobile sau glisante constituie o metod de stabilire i etragere a tendinei unei

    serii temporale. Jeprezentate grafic ele pun n eviden variaiile pe diferite intervale de timpale parametrului analizat i pot servi la stabilirea gradului polinomului care a!usteaz seria./e eemplu, pentru o serie de )6 valori anuale&), &+, &5, &3, &

  • 7/23/2019 serii de date si analize

    8/8

    informaie cu att mai mare cu ct perioada pentru care se calculeaz media este mai mare"fig. ).3.#.

    Hig. ).3. Variaia temporal a debitelor medii anuale ale rului Prao!a la Poiana"apului

    #i repre$entarea mediilor mobile pe ) ani #i pe 1* ani

    ANE6A 1. 1.

    >estul lui von ;eumann este un test de verificare a autocorelaiei, deci a staionaritiiunei serii temporale. /ac variabila este staionar, media ptratelor ecarturilor ntre valorilesuccesive ale seriei D>este apropiat de dublul varianei seriei D>.

    >estul presupune calcularea unei valori M cu a!utorul relaiei

    M @

    ( )

    ( )

    =

    =

    +

    n

    i

    ti

    n

    i

    titi

    yy

    yy

    )

    +

    )

    )

    +

    )

    +

    ,

    n care n @ efectivul seriei &ti@ valoarea seriei la momentul t y @ media seriei./ac M se ndeprteaz de ), seria nu este staionar. 0e poate verifica

    semnificativitatea ecartului +) astfel pentru n N +