baze cerc experimentale

7
BCE curs 20 6.01.2010 (continuare) La limita curba obtinuta este continua si se numeste densitate de probabilitate. Ea ne ajuta la studiul parametrilor populatiei din care provine sondajul. Aceasta curba f(x) are 2 caracteristici fundamentale: ; ; Se poate determina cu ajutorul acestei functii, probabilitatea ca o valoare oarecare “x” sa fie cuprinsa intr-un interval. ; Se mai defineste functia de repartitie F(x), ca fiind probabilitatea ca variabilele aleatoare sa ia valori mai mici ca o valoare “x”. ; Tendinta naturala a rezultatelor unei masuratori este de concentrare in zona de mijloc si de rarefiere in zonele extreme. Pentru caracterizarea acestor tendinte se folosesc: - parametrii de tendinta (media aritmetica, mediana, valoarea centrala, modulul etc.); - parametrii de imprastiere (dispersia, abaterea mediei patratice, amplitudinea, etc). Parametrii de tendinta . Media aritmetica. ; – media aritmetica a populatiei. Valoarea centrala este media aritmetica a celei mai mari si celei mai mici valori considerate. ; 1

Upload: moisii-paul

Post on 16-Sep-2015

223 views

Category:

Documents


5 download

DESCRIPTION

curs

TRANSCRIPT

Bazele Cercetarii Experimentale

BCE curs 20

6.01.2010(continuare)

La limita curba obtinuta este continua si se numeste densitate de probabilitate. Ea ne ajuta la studiul parametrilor populatiei din care provine sondajul. Aceasta curba f(x) are 2 caracteristici fundamentale:;

;

Se poate determina cu ajutorul acestei functii, probabilitatea ca o valoare oarecare x sa fie cuprinsa intr-un interval.

;

Se mai defineste functia de repartitie F(x), ca fiind probabilitatea ca variabilele aleatoare sa ia valori mai mici ca o valoare x.

;

Tendinta naturala a rezultatelor unei masuratori este de concentrare in zona de mijloc si de rarefiere in zonele extreme. Pentru caracterizarea acestor tendinte se folosesc:

parametrii de tendinta (media aritmetica, mediana, valoarea centrala, modulul etc.);

parametrii de imprastiere (dispersia, abaterea mediei patratice, amplitudinea, etc).

Parametrii de tendinta. Media aritmetica.

;

media aritmetica a populatiei.

Valoarea centrala este media aritmetica a celei mai mari si celei mai mici valori considerate.

;

Mediana este valoarea termenului de ordin n+1/2 pentru siruri impare, sau media valorilor de ordin in cazul sirurilor pare.

Moda reprezinta valoarea variabilei careia ii corespunde cea mai mare frecventa.

Abaterea medie este media aritmetica a abaterilor fata de origine cu abaterile luate in valoare absoluta.

Parametrii de imprastiere

Dispersia este definita ca o masura a imprastierii rezultatelor in jurul valorii mediei aritmetice a acestora. Se noteaza cu . Mai folosita este formula si se demonstreaza ca aceasta operatie este un estimator mai bun al dispersiei.

Parametrii pentru dispersia populatiei sunt notati cu .

Abaterea medie patratica.. se noteaza cu .

Amplitudinea R este diferenta intre valoarea maxima si valoarea minima. .

Coeficientul de variatie .

Momentul central de ordin q. .

Nivelul de incredere al masurarii reprezinta probabilitatea cu care intervalul de incertitudine (u,u), asociat masurarii include valoarea adevarata a masurandului. Alegerea nivelului de incredere este o decizie a experimentatorului care tine seama de:

precizia necesara;

precizia aparatelor de masura;

numarul de experimentari economic necesar sau posibil etc.

In practica industriala nivelul de incredere este 95%. In cercetarile de nivel ridicat,

nivelul de incredere este standardizat si poate fi 99%; 99,5%; 99,73%; 99,99%.

Repartitia de probabilitatea a unei variabile aleatoare este functia care determina probabilitatea ca o variabila aleatoare sa ia o valoare data sau sa apartina unei multimi de valori. Cele mai folosite functii de probabilitate sunt:

repartitia normala se mai numeste si repartitia lui Gauss-Laplace.

Repartitia ;

Repartitia polinomiala;

Repartitia student t.

Repartitia Fisher F;

Repartitia Weibull;

Repartitia Poisson valabila pentru evenimente discrete;

Repartitia triunghiulara.

Repartitia normala .

Probleme de prelucrare a datelor experimentaleVerificarea ipotezelor statistice.

Deseori experimentele sunt organizate in scopul verificarii unei anumite ipoteze. De exemplu se formuleaza ipoteza ca un parametru oarecare Q=. Efectuand experimentul, obtinem mai multe valori pentru acest Q dupa o anumita distributie. Rezultatele obtinute ne permit sa tragem 2 concluzii posibile:1 diferentele sunt de natura aleatoare fiind determinate doar de factori intamplatori astfel ca valorile obtinute pentru Q au o medie aritmetica .

2 variatiile obtinute la experimentare conduc la concluzia: .

Ipoteza dupa care rezultatele prezinta o diferenta aleatoare nesemnificativa se numeste ipoteza diferentei nule si este notata cu . Cealalta ipoteza conforma careia rezultatele duc spre o valoare se numeste ipoteza alternanta si este notata cu .

Sa presupunem ca ipotezei ii corespunde functia densitate de probabilitate (x), iar ipotezei functia (x) .

Analiza rezultatelor experimentului este o problema de decizie de acceptare sau respingere a uneia din cele 2 ipoteze. Pentru astfel de decizie este nevoie de un criteriu. Un criteriu ideal trebuie sa asigure probabilitatea de 100% de acceptare a unei asemenea ipoteze cand aceasta este adevarata si o probabilitate de 0% cand ipoteza este falsa. Un astfel de criteriu nu poate fi insa obtinut. O solutie ar fi de a stabili valoarea limita aflata la intersectia celor 2 curbe. Si vom avea asa: x adevarata;

x>=> adevarata.

Acest criteriu nu ne scuteste insa de posibilitatea luarii unei decizii gresite. Astfel

exista posibilitatea ca ipoteza diferentei nule sa fie adevarata, iar prin aplicarea acestui criteriu ea sa fie respinsa. Eroarea care se comite se numeste eroarea de ordinul I si corespunde domeniului dat de .

Eroarea opusa de acceptare a ipotezei cand in realitate ea este falsa, este deasemenea posibila. Ea se numeste eroarea de ordinul II si corespunde domeniului dat de .

Valoarea 1- se numeste nivel de incredere, iar 1- puterea testului. Probleme se complica si mai mult atunci cand functiile si nu sunt cunoscute.

Alegerea criteriului de verificare a unei ipoteze statistice nu este intotdeauna o optiune simpla si implica un risc statistic. Pentru diminuarea acestui risc se apeleaza la studiul cu mai multe teste statistice.

Testul este un test care urmeaza o repartitie de tip . Se utilizeaza in cazurile:

test de egalitate intre dispersia unei populatii normale si o valoare specificata pornindu-se de la dispersia de pe un esantion sau mai multe din acea populatie. Comparatia dintre efectivele observate si cele teoretice corespunzatoare ale unei repartitii specificate aprioric. test de independenta si omogenitate;

Testul student este un test care urmeaza o repartitie student. Se utilizeaza:

ca test de egalitate intre media unei populatii normale si o valoare specificata pornindu-se de la un esantion prelevat din acea populatie.

ca test de egalitate a 2 populatii normale de aceeasi dispersie.Testul Fisher se noteaza cu F. Este testul la care statistica folosita urmeaza o

repartitie F. Se utilizeaza:

test de egalitate a 2 populatii normale pornindu-se de la dispersiile pe 2 esantioane;

teste ce intervin in analiza dispersiei.

Prelucrarea datelor experimentale presupune rezolvarea unor probleme importante

cum ar fi:

eliminarea erorilor aberante dintr-un grup de masuratori efectuate in conditii de repetabilitate Intr-un sir de rezultatea obtinute in urma unor masuratori in conditii de repetabilitate este posibil ca una sau cateva valori sa fie mult indepartate de media celorlalte. In aceste conditii se pune problema daca nu cumva aceste valori sunt afectate de erori grosolane. Oportunitatea eliminarii unor asemenea valori se realizeaza apeland la teste specifice cum ar fi: testul Chauvenet, testul Romanovski, testul Grubbs, testul student.

Testul Chauvenet in conformitate cu acest test, o valoare se elimina daca probabilitatea ei de aparitie este inferioara unui nivel P=1/2n (n numarul de masuratori). Din punct de vedere practic se procedeaza in felul urmator: pentru sirul valorilor n masurate, se calculeaza media aritmetica, si abaterea mediei patratice. Se calculeaza raportul si se compara cu valorile limita tabelat. Daca > din tabel, valoarea respectiva trebuie eliminata. In caz contrar nu sunt suficiente motive pentru eliminare. Dupa eliminarea unei valori se verifica dupa aceeasi metodologie oportunitatea eliminarii unei valori din cele n-1 valori ramase, s.a.m.d. pana cand toate valorile satisfac acest test. Decizia de eliminare a unei valori implica si un risc statistic. verficarea normalitatii repartitiei unui sir de date alegerea unui anumit model statistic are implicatii profunde asupra concluziilor ce se desprind prin studiul sirurilor de date. Matematic nu ofera o modalitate de determinare a unui anumit tip de model statistic. Din aceasta cauza, practic se verifica concordanta unui anumit model ales cu datele experimentale si pe aceasta baza acceptarea sau respingerea acestui model. Acceptarea unui anumit model nu exclude posibilitatea ca un alt model statistic neluat in calcul sa reprezinte mai bine sirul de valori masurate. In practica prelucrarii datelor experimentale se porneste in general de la ideea ca datele obtinute au o repartitie normala si se verifica daca aceasta ipoteza poate fi considerata valabila. Acest lucru se realizeaza cu ajutorul testelor de verificare a normalitatii repartitiei datelor. Numai daca aceste teste ne arata ca repartitia normala nu poate fi acceptata se realizeaza si alte tipuri de repartitii. Testele de verificare a repartiei sunt de 2 tipuri:

teste cantitative cel mai folosit este testul , testul Massey si testul Shapiro-Wilk;

teste calitative aici se calculeaza mediana medie aritmetica si modulul. Daca aceste diferente sunt mici, ipoteza normalitatii poate fi acceptata. Se calculeaza coeficientul de asimetrie care trebuie sa fie apropiat de 0. Se calculeaza elementele histogramei verificandu-se pe aceasta baza daca aceasta are un singur maxim. estimarea intervalelor de incredere;

compararea dispersiilor;

compararea mediilor aritmetice.PAGE 1

_1324380181.unknown

_1324824849.unknown

_1324825194.unknown

_1324825639.unknown

_1324825641.unknown

_1324825713.unknown

_1324825640.unknown

_1324825405.unknown

_1324825493.unknown

_1324825638.unknown

_1324825195.unknown

_1324825055.unknown

_1324825193.unknown

_1324825192.unknown

_1324824976.unknown

_1324825054.unknown

_1324824549.unknown

_1324824708.unknown

_1324824784.unknown

_1324824664.unknown

_1324824444.unknown

_1324824445.unknown

_1324380374.unknown

_1324273279.unknown

_1324274470.unknown

_1324274712.unknown

_1324379936.unknown

_1324380071.unknown

_1324379802.unknown

_1324275706.unknown

_1324274595.unknown

_1324274681.unknown

_1324274483.unknown

_1324274274.unknown

_1324274446.unknown

_1324274249.unknown

_1324274259.unknown

_1324274206.unknown

_1324272921.unknown

_1324273142.unknown

_1324273180.unknown

_1324271996.unknown

_1324272244.unknown

_1324272686.unknown

_1324271677.unknown

_1324271721.unknown