variabile aleatoare

28
VARIABILE ALEATOARE. FUNCŢII DE REPARTIŢIE. INDICATORI STATISTICI 2-1 Notiuni de teoria probabilitatilor În teoria probabilitatilor, orice rezultat al unui experiment se numeste eveniment, sigur fiind evenimentul care se realizeaza cu certitudine la orice efectuare a experimentului. Evenimentul imposibil este cel care nu se realizeaza niciodata în cadrul unui experiment dat. Evenimentele ce apar ca rezultat al unor experimente le vom nota , , etc. Evenimentul complementar unui eveniment este acel eveniment care se realizeaza atunci si numai atunci când nu se realizeaza . Evenimentul care consta în realizarea simultana a evenimentelor , se noteaza cu (se citeste evenimentul si ). Probabilitatea unui eveniment este o masura a sanselor de realizare a acelui eveniment. Daca un eveniment se desfasoara astfel încât producerea oricarui eveniment legat de acesta are un numar finit de sanse egal-posibile, probabilitatea evenimentului este raportul dintre numarul rezultatelor favorabile producerii evenimentului si numarul tuturor rezultatelor posibile. Se considera exemplul cunoscut al urnei care contine bile de aceeasi marime, dintre care sunt albe si sunt negre. Probabilitatea de a extrage o bila alba sau neagra va fi , (2.1) respectiv . (2.2) Din relatia (2.1) se vede imediat ca probabilitatea unui eveniment este cu 535h79f prinsa între zero si unitate, adica . Evident, când în urna sunt numai bile negre, iar când în urna sunt numai bile albe etc. 2-1.1 Teorema probabilitatii totale Sa presupunem ca pentru producerea unui eveniment din cazuri posibile, egal probabile, sunt cazuri favorabile, adica . (2.3) De asemenea, pentru producerea evenimentului , pentru care avem cazuri favorabile, putem scrie

Upload: mircea-stefanovici

Post on 18-Aug-2015

268 views

Category:

Documents


3 download

TRANSCRIPT

VARIABILE ALEATOARE. FUNCII DE REPARTIIE. INDICATORI STATISTICI2-1Notiuni de teoria ro!a!i"itati"orn teoria probabilitatilor, orice rezultat al unui experiment se numeste eveniment, sigur fiind evenimentul care serealizeazacucertitudinelaoriceefectuareaexperimentului. Evenimentul imposibil estecel carenuserealizeazaniciodata n cadrul unui experiment dat.Evenimentele ce apar ca rezultat al unor experimente le vom nota, , etc.Evenimentul complementar unuieveniment este acel eveniment care se realizeaza atunci si numai atunci cnd nu se realizeaza.Evenimentul careconsta n realizarea simultana a evenimentelor, se noteaza cu (se citeste evenimentul si).Probabilitateaunui eveniment esteomasuraasanselor derealizareaacelui eveniment. Dacauneveniment sedesfasoara astfel nct producerea oricarui eveniment legat de acesta are un numar finit de sanse egalposibile,probabilitateaevenimentului esteraportul dintrenumarul rezultatelorfavorabileproducerii evenimentului si numarultuturor rezultatelor posibile.!e considera exemplul cunoscut al urnei care contine bile de aceeasi marime, dintre care sunt albe si suntnegre. Probabilitatea de a extrage o bila alba sau neagra va fi, (".#)respectiv. (".")Din relatia (".#) se vede imediat ca probabilitatea unui eveniment este cu $%$&'(f prinsa ntre zero si unitate, adica.Evident, cnd n urna sunt numai bile negre, iar cnd n urna sunt numai bile albe etc.2-1.1 Teore#a ro!a!i"itatii tota"e!apresupunemcapentruproducereaunui eveniment din cazuri posibile, egal probabile, sunt cazurifavorabile, adica. (".%)De asemenea, pentru producerea evenimentului, pentru care avem cazuri favorabile, putem scrie. (".))!e mai considera ca cele doua evenimente se exclud reciproc, adica cnd se produce, nu se produce.Probabilitatea ca n cele cazuri posibile sa se produca sau, va fi, (".$)relatie care reprezinta principiul probabilitatii totale, si anume*+nd un eveniment se poate realiza n mai multe moduri posibile care se exclud reciproc, probabilitatea producerii luieste egala cu suma probabilitatilor care corespund diferitelor moduri de producere.2-1.2 Teore#a ro!a!i"itatii $o#u%e!e considera cazul unui eveniment mai complex care rezulta din realizarea succesiva a doua evenimente dependente si. Pentru examinarea acestei situatii mai presupunem* n cazuri se produce att evenimenul ct si, n cazuri se produce evenimenul dar nu se produce, n cazuri se produce evenimenul dar nu se produce, n cazuri nu se produce nici nici.-ie numarul de cazuri total posibile.Pentru producerea evenimentelor si probabilitatea este si. ("..)Pentru a se produce, probabilitatea este, (".')deoarece are, cazuri favorabile, fiind acelasi.Dupa ce sa produs evenimentul, ramne sa examinam probabilitatea lui. Evident, acesta are numai cazurifavorabile. Deoarece producerea lui este conditionata de aceea a lui (numai acele cazuri vor fi favorabile cnd areloc), numarul cazurilor posibile pentru va fi. Prin urmare,. ("./)Pentru probabilitatea definita de ("./), se foloseste notatia ceea ce nseamna probabilitatea ca sa seproduca dupa ce sa produs (probabilitate conditionata).Din compararea relatiilor ("..), (".') si ("./) rezulta principiul probabilitatii compuse si, (".()carearataca* Dacaproducereaunui eveniment presupunerealizareaaltorevenimente si , atunci probabilitateaproducerii lui este egala cu produsul dintre probabilitatea producerii lui si probabilitatea lui, dupa ce sa produs.n conditiile de mai sus, numarul cazurilor posibile este limitat. De aceea, definitiile si probabilitatile de mai sus serefera la asa numita teorie a probabilitatilor discontinue, care se apropie de teoria probabilitatilor continue daca numarulcazurilor favorabile este destul de mare.Probabilitatea evenimentului se noteaza si este un numar cuprins ntre 0 si #, valoarea 0 corespunznd unuieveniment imposibil, iar # unui eveniment sigur.Daca masurarea unei marimi se efectueaza, n conditii identice, de un numar mare de ori, obtinnduse siruri devalori aleatorii, iar din acestea, valori se afla n intervalul, probabilitatea(".#0)este o caracteristica a intervalului si se numeste frecventa relativa a variabilei n intervalul considerat.2-2 Varia!i"e a"eatoare!e numeste variabila aleatoare o marime reala care, n raport cu rezultatul unui experiment, poate lua orice valoaredintro multime bine definita de valori reale (domeniul de definitie al variabilei).1ariabilele aleatoare se clasifica dupa multimea pe care sunt definite. 2stfel, se deosebesc variabile aleatoare de tipdiscret si de tip continuu.1ariabilelealeatoarediscretesunt definitepeomultimecel mult numarabiladeevenimente. 3umarul valorilorposibile ale unei variabile aleatoare discrete poate fi finit sau infinit.1ariabila aleatoare continua este definita pe o multime continua. 1ariabila aleatoare continua poate lua orice valoarentre doua numere. 3umarul valorilor posibile ale unei variabile aleatoare continua este infinit. 2-2.1 Fun$tia de reartitie-unctia de repartitie a variabilei aleatoarese noteaza cusi este definita ca probabilitatea evenimentului. (".##)Din punct de vedere probabilistic, functia de repartitie caracterizeaza complet o variabila aleatoare, indiferent dacaeste vorba de o variabila aleatoare discreta sau continua.-unctiaderepartitie(saufunctiacumulativaaprobabilitatilor) aunei variabilealeatoarediscreteestesumaprobabilitatilor de la stnga punctului de abscisa (-ig. ".#). (".#")!enumesterepartitieaunei variabilealeatoarelegeadeprobabilitatedupacareeaseproduce. 4epartitiauneivariabile aleatoare discrete se scrie sub forma sau,. (".#%)Fi&. 2.1. 4epartitia unei variabile discreteDaca este o variabila aleatoare continua, functia de repartitie se defineste astfel (-ig. ".")*. (".#))Fi&. 2.2. 4epartitia unei variabile continue-unctia de repartitie are urmatoarele proprietati*#. -unctia de repartitie este o functie monoton nedescrescatoare, daca, (".#$)". Pentru cea mai mica valoare posibila a variabilei aleatoare, functia de repartitie este egala cu zero, (".#.)%. Pentru cea mai mare valoare posibila a variabiei aleatoare, functia de repartitie este egala cu #, (".#')). -unctia de repartitie fiind o probabilitate, satisface dubla inegalitate, (".#/)$.Probabilitateacavariabilaaleatoare safiecuprinsantre si esteegalacudiferentadintrevalorile functiei de repartitie la extremitatile intervalului, adica cu cresterea functiei n intervalul considerat. (".#()-unctiade repartitiea unei variabile discrete esteo functie discontinua, nscara, admite salturi, salturiledelaotreapta la treapta curenta sunt egale cu, suma tuturor salturilor fiind egala cu # (-ig. ".%.a). a) b)Fi&. 2.'. -unctia de repartitie-unctiaderepartitieauneivariabilealeatoarecontinueeste, deasemeneaofunctiecontinua(-ig. ".%.b, ncarefunctia are drept asimptote dreptele si).2-2.2 Den%itatea de reartitie!e numeste densitate de repartitie (sau densitate de probabilitate) prima derivatadaca existaa functiei de repartitie.("."0)Densitatea de repartitie exista numai pentru variabile de tip continuu.Probabilitatea ca variabila aleatoare continua sa ia valoare n intervalul este egala cu integrala densitatiide repartitie pe intervalul , ("."#)adica evenimentul este imposibil, iar este sigur.2-2.' Oeratii $u (aria!i"e a"eatoare-ie si doua variabile aleatoare avnd repartitiile,si ,. ("."")Daca este o constanta reala, atunci este o variabila aleatoare avnd repartitia,. ("."%)!uma a doua variabile aleatoare si este o variabila aleatoare avnd repartitia,,, ("."))n care este probabilitatea realizarii simultane a evenimentelor si adica si Produsul a doua variabile aleatoare si este o variabila aleatoare avnd repartitia,, ("."$)n care si. (".".)Densitatea de repartitie are proprietatile*#. Densitatea de repartitie este nenegativa si aceasta rezulta din proprietatea functiei de repartitie de a finedescrescatoare,,". 5ntegrala densitatii de repartitie, n cadrul limitelor de variatie infinite, a variabilei aleatoare continue, este egala cuunitatea,. ("."')2-' Va"ori"e tii$e a"e (aria!i"ei a"eatoare6variabilaaleatoareestecaracterizataprinrepartitiasa. Dacarepartitiauneivariabilenuestecunoscuta, pentrucaracterizarea variabilei aleatoare se pot folosi anumite marimi numite valori tipice, asociate variabilei aleatoare.)ediaPrin definitie, valoarea medie (speranta matematica) a unei variabile aleatoare discretecu repartitia (".#%) esteegala cu suma produselor dintre valorile pe care le poate lua si probabilitatile corespunzatoare. ("."/)-ie ovariabilaaleatoaredetipcontinuusi densitateasaderepartitie. 7ediaunei variabilealeatoarecontinue este definita de relatia. ("."()Daca variabila aleatoare este definita pe intervalul, atunci valoarea medie este. (".%0))ediana!e numeste mediana a variabilei aleatoare, numarul care satisface ecuatia, (".%#)sau. (".%")4ezulta din ecuatia (".%") ca mediana este solutia ecuatiei. (".%%)Pentru o variabila aleatoare continua, mediana este data de ecuatia. (".%))Di%er%iaDispersia unei variabile aleatoare discrete reprezinta valoarea medie a patratului abaterii , (".%$)sau, (".%.)adica, diferenta dintre media patratului variabilei aleatoare si patratul mediei variabilei aleatoare.Dispersia unei variabile aleatoare continue este media patratului abaterii lui . (".%')A!aterea #edie atrati$a2baterea medie patratica a unei variabile aleatoare este radacina patrata a dispersiei acestei variabile aleatoare. (".%/)Dispersia si abaterea medie patratica sunt indicatorii cei mai utilizati pentru a caracteriza mprastierea valorilor uneivariabile aleatoare.)o#ente7omentul simplu(initial) deordinulkal unei variabilealeatoare discrete , calculat nraport cuorigineaabaterilor, care este zero, are expresia. (".%()7omentul simplu (initial) de ordinul # reprezinta media aritmetica. (".)0)-olosind momentele simple, dispersia se poate exprima dupa cum urmeaza*, (".)#)n care reprezinta momentul simplu de ordinul ".7omentul centratdeordinulkal unei variabilealeatoarediscrete , calculat nraport cumediaaritmeticaavariabilei aleatoare, este. (".)")7omentul centrat de ordinul # este zero, datorita proprietatii mediei aritmetice conform careia. (".)%)7omentul centrat de ordinul " n raport cu media aritmetica este dispersia. (".)))7omentul ordinar de ordinul k, calculat n raport cu o valoare arbitrara, este media variabilei aleatoare . (".)$)7omentul initial de ordinul al unei variabile aleatoare continue este. (".).)n particular, pentru se obtine valoarea medie a variabilei aleatoare continue . (".)')7omentul centrat de ordinul al unei variabile aleatoare continue este. (".)/)n particular, pentru rezulta dispersia variabilei aleatoare continue . (".)()7omentul ordinar (conventional) de ordinul este. (".$0)ntre momentele initiale si momentele centrate exista urmatoarele relatii*, (".$#), (".$"). (".$%)Coe*i$ientu" de $o(arianta+ovarianta a doua variabile aleatoare si reprezinta momentul centrat mixt al celor doua variabile. (".$))Dezvoltnd (".$)) se obtine formula ec&ivalenta de calcul. (".$$)!e numeste coeficient de covarianta raportul, (".$.)n care sunt elementele matricei de covarianta, iar sunt numitecorelatii.Daca variabilelesi sunt independente atunci , reciproca nefiind adevarata. Dacaexista, atunci. 5negalitatea este o consecinta a inegalitatii lui !c&8arz 9 :.2-'.1 Prorietati"e (a"ori"or tii$e a"e (aria!i"ei a"eatoareProrietati"e #ediei7edia unei variabile aleatoare are proprietatile*#. Daca este o constanta, atunci, (".$')". Daca este o variabila aleatoare si si doua constante, atunci valoarea medie a variabilei aleatoare este egala cu, (".$/)%.Daca si sunt doua variabile aleatoare independente avnd valorile medii si respectiv, , atuncivaloarea medie a variabilei aleatoare exista si este egala cu, (".$()). Daca si sunt doua variabile aleatoare independente pentru care exista valorile medii si respectiv ,atunci valoarea medie a variabilei aleatoare exista si este egala cu, ("..0)$. Daca esteovariabilaaleatoareacarei valoaremedie exista, atunci variabilaaleatoare senumeste abatere de la valoarea medie.Prorietati"e di%er%ieiDispersia unei variabile aleatoare are proprietatile*#. -ie o variabila aleatoare cu dispersia, atunci oricare ar fi numerele reale si, dispersia variabileialeatoare este, ("..#)". Daca si sunt douavariabilealeatoareindependenteavnddispersiile , respectiv , atuncipentru oricare doua constante,, dispersia variabilei este, ("..")%. Daca este o variabila aleatoare avnd dispersia si o constanta reala, atunci, ("..%)egalitatea avnd loc doar pentru,). Pentru orice variabila aleatoare are loc inegalitatea +ebsev 9 :+ arbitrar. ("..))2-, Fun$tii deri(ate!e numeste functie caracteristica a variabilei aleatoare, valoarea medie a unei noi variabile aleatoare, obtinute din, nlocuind argumentul prin, unde este unitatea imaginara, iarun parametru real. Daca variabila este distribuita discret atunci functia caracteristica este data de relatia, . ("..$)Daca variabila are distributie continua cu desinatea atunci functia caracteristica este. ("...)Daca repartitia variabilei este de tip continuu, densitatea sa de repartitie este data de relatia. ("..')-unctia de supravietuire sau de fiabilitate reprezinta probabilitatea ca o variabila aleatoaresa ia o valoare maimare dect . ("../)-unctia &azard sau rata cedarii a unei variabile este definita ca raportul dintre densitatea de repartitie si functia desupravietuire*, ("..(), (".'0)sau. (".'#)-unctia generatoare a unei variabile aleatoare care ia numai valori ntregi pozitive este definita de relatia,,. (".'")ntre funtia caracteristica si functia generatoare exista relatia. (".'%)-unctia caracteristica se utilizeaza pentru calculul mometelor factoriale, obisnuite si centrate de diferite ordine.2-- Indi$atori %tati%ti$i5ndicatorul statistic reprezinta expresia numerica a unei trasaturi observate pe o colectivitate definita n timp si spatiu.n functie de metoda obtinerii indicatorilor si de rolul ;ucat n cercetarea statistica, indicatorii pot fi mpartiti n douacategorii* (a) indicatori absoluti (primari), (b) indicatori derivati (secundari).5ndicatorii absoluti sunt rezultatul observarii si sistematizarii datelor, nconsecintaacestiareflectadimensiunea,marimea, amplitudinea fenomenului n unitati concrete, specifice, de masura.5ndicatorii derivati seobtinnprocesul decalcul statisticsi reflectantromanieraabstracta, aspectecalitative,evolutive ale colectivitatii cercetate. Dintre indicatorii derivati amintim* marimile relative si marimile medii, indicatoriivariatiei si ai asimetriei, indicii statistici, parametrii functiilor de regresie si a;ustare analitica etc.-unctiile indicatorilor statistici sunt* de masurare, de comparare, de sinteza, de estimare, de verificare a ipotezelorstatistice, de testare a semnificatiilor parametrilor statistici utilizati.6rice indicator statistic trebuie sa ndeplineasca doua conditii* (a) sa aiba un continut stiintific bine determinat, odefinitie sau o formula a sa, (b) sa indeplineasca conditia de compatibilitate.2--.1 Indi$atorii tendintei $entra"ePrincipali indicatori ai tendintei centrale sunt* (a) indicatorii medii de control* media aritmetica, media geometrica,media armonica etc, (b) indicatorii medii de pozitie* modul, mediana, cuartilele si decilele.)edia arit#eti$a7edia este expresia sintetizarii ntrun singur nivel reprezentativ a tot ce este esential, tipic si obiectiv n aparitia,manifestarea si dezvoltarea unei variabile (caracteristici) 9#:.-unctie de natura datelor nregistratesi denaturavariatiei, media poatefi* media aritmetica (simpla), mediaarmonica, media geometrica, media patratica, media cubica, media parabolica, media cronologica etc.7edia aritmetica simpla de sonda; (sau de selectie) a unui sir de valori,,.se calculeaza cu relatia.(".'))7edia aritmetica ponderata a unui sir de valori,,.se calculeaza cu relatia. (".'$)n care reprezinta frecventa sau numarul de aparitii al variabilei.7edia aritmetica ponderata este influentata att de nivelul caracteristicii ct si de nivelul frecventei.7ediaaritmeticaesteovaloareinternaaserieidincareafost calculata(trebuiesafiemai maredect valoareaminima si mai mica dect valoarea maxima),.Principiul pecare se bazeazamedia estecel al compensatiei abaterilor (2. 6 alta situatie posibila este ca seria sa fie bimodala sau trimodala. 2tunci va fi afisata numai prima valoare in ordinea aparitiei lor in cadrul seriei. 5n acest caz pentru determinarea tuturor valorilor modulului se poate face un tabel de frecventa. !e poate calcula si cu functia 76DE. Standard De(iationDeviatia standard sau 2baterea standard se poate calcula si cu !DDE1 sau pentru deviatia standard populationala !DDE1P. Sa#"e Varian$e1ariatia se poate calcula si cu 124 sau pentru variatia populationala 124P 6urto%i%Excesul sau Eoltirea masoara inaltimea aplatizarii sau boltirii unei distributii in comparatie cu o distributie normala. Excesul ) este zero pentru o serie de date avand o distributie normala, este pozitiv pentru o serie dedate avand trena mai inalta decat cea a unei distributii normale (cu mediasi variatia !") si estenegativ pentru o serie de date a carei trena este mai coborata decat cea a unei distributii normale. 5ncazul nostru valoarea 0,(( a boltirii indica o curba putin mai aplatizata decat curba normala. !epoate calcula si cu functia =F4D. S9e:ne%% 2simetria masoara abaterea de la aspectul simetric si directia asimetriei (pozitiva saunegativa) fata de curba normala. 2simetria este 0 pentru o serie de date avand o distributie normala, este negativa pentru o serie dedate asimetrica spre stanga (seria are mai multe valori mai mici), este pozitiva pentru o serie de dateasimetrica spre dreapta (seria are mai multe valori mai mari). 5n cazul nostru asimetria este 0,0",deci este putin deplasata la dreapta fata de curba normala. !e poate calcula si cu functia !=EG. Ran&e5ntervalul este diferenta 7aximul7inimul seriei de date. )ini#u#7inimul valoarea cea mai mica din serie. !e poate calcula si cu functia 753. )a0i#u#7aximul valoarea cea mai mare din serie. !e poate calcula si cu functia 72H Su#!uma sau Dotalul valorilor seriei. !e poate calcula si cu functia !F7. Count3umarul de observatii nI"0. !e poate calcula si cu functia +6F3D. 4uarti"e"e si er$enti"e"e sunt asemanatoare medianei. 2stfel, prima cvartila sau este o valoare avand proprietatea ca "$@ dintre datele seriei sunt mai mici sau egale cu ea, iar '$@ mai mari sau egale cu prima cvartila. 2 doua cvartila este reprezentata de mediana. 2 treia cvartila este o valoare avand proprietatea ca '$@ dintre datele seriei sunt mai mici sau egale cu ea iar "$@ mai mari sau egale cu a treia cvartila.Percentila de ordinul a este o valoar cu proprietatea ca o proportie egala cu a din date sunt mai mici sau egale, iar celelalte sunt mai mari. CV;STDEVP3AVERA2E+oeficientul de variatie * se pot utiliza urmatoarele reguli empirice pentru interpretare*daca +1 este sub #0@ atunci populatia poate fi considerata omogena,daca +1 este intre #0@"0@ atunci populatia poate fi considerata relativ omogena,daca +1 este intre "0@%0@ atunci populatia poate fi considerata relativ eterogena,daca +1 este peste %0@ atunci populatia poate fi considerata eterogena.