gruparea datelor În clase Şi determinarea frecvenţelor caracteristice (1)
DESCRIPTION
fiabilitate si terotehnicaTRANSCRIPT
LUCRAREA - 03Fiabilitate şi terotehnică
1
3. GRUPAREA DATELOR ÎN CLASE ŞI DETERMINAREAFRECVENŢELOR CARACTERISTICE
3.1. Noţiuni teoretice privind gruparea şirurilor de valori în clase
Indicatorii statistici nu oferă în totalitate informaţii privind evaluarea de fiabilitate. Determinărilebazate pe observaţii discrete, permit efectuarea unor asocieri, care nu alterează setul de valori sauinterpretarea rezultatelor. Determinarea unei normalităţi a distribuţiei valorilor, este necesară pentrua putea fi interpretate seturi mai mari de date. În acest scop, datele sunt condensate ordonat, în aşanumite clase de valori. caracteristic acestor clase este tendinţa tuturor valorilor din interiorul uneiclase, de a converge spre o valoare centrală din interiorul intervalului de clasă.
Există situaţii specifice în determinările statistice de fiabilitate, când redistribuirea valorilornu este în măsură să ofere rezultate concludente. De aceea tehnica de grupare în clase este de celemai multe ori utilizată pentru evaluarea normalităţii distribuţiei valorilor.
Ordonarea şi gruparea datelor, se face prin distribuirea acestora în clase de valori, carecuprind toate rezultatele observaţiei sau măsurătorilor efectuate, ce se încadrează într-un interval demărime impus.
Numărul k de clase în care se grupează valorile supuse unei prelucrări statistice, sedetermină funcţie de mărimea N a eşantionului. Relaţia recomandată pentru determinarea număruluide clase este:
)Nlg(332,31k (3.1)
Pentru un număr redus de date (sub 25 de valori), gruparea în clase este puţin semnificativă,suplimentul de informaţie obţinut fiind neconcludent.
Numărul de clase efectiv ke reprezintă partea întreagă a valorii k calculate.
În MathCAD există relaţia: floor(k) prin care se extrage partea întreagă dintr-un număr real.
În cazul în care setul de valori este relativ ridicat (>100), este recomandată pentrudeterminarea numărului de clase relaţia:
5
12
1 ))1N(75,0(4k (3.2)
Shapiro-Wald, recomandă în cazul eşantioanelor statistice de volum mare, relaţia:
4
Nk 2 (3.3)
Valori orientative ale numărului de clase, determinat funcţie de dimensiunea N a eşantionuluiprelucrat, pentru date de volum distinct, se prezintă în tabelul 1.
Alegerea uneia din cele trei valori recomandate pentru numărul claselor de grupare, se facefuncţie de dimensiunea N a eşantionului.
Uzual sunt agreate valorile k şi k1, valorile k2 fiind mai rar utilizate în determinările defiabilitate.
LUCRAREA - 03Fiabilitate şi terotehnică
2
Gruparea valorilor în clase de repartiţie necesită stabilirea unor intervale restrictive în caredatele din eşantion vor fi încadrate. Intervalele astfel determinate exprimă o tendinţă a valorilor de aconverge „local”, spre valoarea centrală a fiecărei clase.
Amplitudinea a (lungimea intervalului de clasă), ce caracterizează intervalul unei clase, sedetermină cu relaţia:
k
xxa minmax (3.4)
unde: xmax este valoarea cea mai mare din şirul de date; xmin - valoarea cea mai mică din şirul de date.Intervalul unei clase va fi deci mărginit de două valori: limita inferioară şi superioară, de forma:
all
;lljinf
jsup
1jsup
jinf
(3.5)
unde: j = 1 … k reprezintă ordinal clasei.Valoarea centrală j
cl a clasei de repartiţie de ordin j se determină cu relaţia:
2/all jinf
jc (3.6)
Se face specificarea că limita inferioară a primului interval este valoarea minimă din şir, iar limitasuperioară a ultimului interval este valoarea maximă din şirul ordonat de valori.Tendinţa privind modul de variaţie a unui fenomen analizat prin evaluări statistice este dată deindicatorul frecvenţă de repartiţie. Sunt două tipuri de frecvenţe care oferă informaţii distincteprivind comportarea şirului de date:
- frecvenţa de repartiţie a valorilor aleatorii;- frecvenţa cumulată de repartiţie a datelor.
Numărul nj de date conţinute într-o clasă, reprezintă frecvenţa de apariţie în clase a valorilor.
jj nf (3.7)
Pentru determinarea frecvenţei de repartiţie se va crea următorul algoritm:- se introduc noi variabile tip şir de forma:
u: = 1 .. k;j: = 1 .. k+1;
Valorile limită ale claselor vor fi date de relaţia:
a1jx:int minj
)x(int,hist:f
Cu această relaţie s-a determinat frecvenţa de apariţie în clase a datelor. Prin apelarea lareprezentarea grafică, se poate vizualiza modul de grupare a datelor în intervalele caracteristice.
LUCRAREA - 03Fiabilitate şi terotehnică
3
Raportul dintre numărul de date conţinut în clasă şi numărul total al datelor din eşantionreprezintă frecvenţa relativă. Se determină cu relaţia:
N
ff j
rj (3.8)
Frecvenţa cumulată reprezintă suma frecvenţelor absolute sau relative, a setului de date.
k
1irjcj ff (3.9)
Frecvenţa relativă, precum şi frecvenţa cumulată sunt întâlnite sub formă procentuală, exprimaremai aproape de domeniul statistic decât de cel al probabilităţilor.
Pentru determinarea frecvenţelor cumulate este necesară utilizarea declaraţiilor de şiranterioare, de iniţializare a şirului. Etapele de algoritm parcurse pentru obţinerea frecvenţelorcumulate sunt:
u1uu
11
fFcum:Fcum
;f:Fcum
Tabelul 3.1. Valori pentru numărul de clase,determinate funcţie de mărimea eşantionului
3.2. Cerinţele lucrării
1. Algoritmarea relaţiilor matematice propuse pentru efectuarea calculelor;2. Efectuarea grupării în clase pentru şirul de date, prelucrat de fiecare student în lucrarea anterioară;3. Determinarea frecvenţei relative procentual;4. Evaluarea diferenţelor înregistrate la calculul valorii k cu diferite relaţii date în lucrare şicompararea cu datele din tabelul 3.1;5. Trasarea graficelor de repartiţie pentru frecvenţele calculate;6. Completarea concluziilor rezultate din evaluarea statistică (din lucrarea precedentă), cu cele cedecurg în urma grupării în clase şi a tendinţei de variaţie, dată de frecvenţele calculate.
Mărimea eşantionuluiN<150
kN>150
k1
N>150(Shapiro-Wald)
k2
Nr. valori Nr. clase Nr. valori Nr. clase Nr. valori Nr. clase<23 5 - - <200 30
24-27 6 150 28 200 4048-76 7 200 31 250 50
77-150 8 250 34 300 60- 400 41 350 70- 500 45 450 90
LUCRAREA - 03Fiabilitate şi terotehnică
4
Comentarii ajutătoare© Pentru a crea un algoritm, este necesar ca relaţiile 3.5 şi 3.6 din lucrare să fie transpuse
astfel încât utilizând eficienţa indicelui de control a şirului de date, calculul valorilorsolicitate să se facă global.
© La trasarea grafică nu uitaţi să marcaţi ce reprezentaţi pe fiecare din axele de coordonate,cu unităţile de măsură aferente. Specific evaluărilor de statistică a frecvenţelor relative şicumulate sunt reprezentările de tip: „bar”, respectiv „step”.
În Anexa B.2, se prezintă o modalitate de rezolvare propusă a aplicaţiei în mediul MathCAD.
Anexa B. 2.Algoritmul MathCAD de rezolvare a aplicaţiei A. 2.2.
În cazul acestei aplicaţii, se pot utiliza funcţii predefinite ale mediului MathCAD, care vor scurtamult timpul de rezolvare a aplicaţiei.
Pasul Relaţia mathCAD Obs.Identificarea valoriiminime a şirului
xmin:vmin Cu x s-a notat şirul iniţial de date
Identificarea valoriimaxime a şirului xmax:vmax
Calculul numărului declase şi extragerea părţiiîntregi
nlog322.31floor:k
Instrucţiunea „floor” returnează valoarea întreagă a unuinumăr natural;În MathCAD, logaritmul zecimal este recunoscut cuinstrucţiunea „log”
Calculul amplitudineiintervalelor de clasă k
vv:d minmax
iniţiere variabilă tip şirpentru numărul de clase 1k1:q
k1:j
Constituie baza iteraţiei pentu gruparea celor n valori înk clase
Calculul limitelor şivalorii centrale pentrucele k clase
2
dinfl:lc
djv:supl
d1jv:infl
jj
minj
minj
Calculul grupării celor nvalori în clase
d1qinfl:int qq Iteraţia q permite identificarea şi a valorii primei clase,dar şi a clasei de ordin k
Identificarea grupăriicelor n valori în cele kclase de repartiţie
xint,hist:f Instrucţiunea hist are valoare de grupare în intervale aunui şir de valori
Calculul frecvenţeirelative n
f:fr
jj
Calculul frecvenţeicumulate
t1tt
11
ffcum:fcum.III
f:fcum.II
k2:t.I
Algoritmul este în 3 paşi:I. declararea unei noi variabile;II. declararea explicită a primei valori care în cazulfrecvenţei cumulate este identică cu frecvenţa absolutăIII. scrierea relaţiei care să cumuleze la valoareaprecedenta indicele curent de creştere
Calculul frecvenţeicumulate relative n
fcum:fcrel
jj
Reprezentări grafice şiafişare liste de valoricalculate
plotYXgraphinsert Se face referire la succesiunea alegerii opţiunilor dinbara de meniu