date modele

25
DATE STATISTICE MODELE STOCASTICE TESTE DE CONCORDANTA (goodness-of-t) fenomen aleator . & date statistice model stocastic & . test de concordanta Fenomene aleatoare prin natura lor; Exemple din biologie, medicina, - nante prin modul de colectare a datelor; Exemple din son- daje statistice (A) DATE STATISTICE 1. Valori calitative; Exemplu: intrebare cu raspunsuri posibile "f. nemul- tumit", "nemultumit", "indiferent", "multumit", "foarte multumit" n indivizi independenti, alesi in mod aleator dintr-o aceeasi categorie, raspund la intrebare > rasp=c("fnem","nem","ind","mul","fmul") > p=c(0.2,0.3,0.1,0.3,0.1) > x<-sample(rasp,50,replace=T,prob=p) > x "fmul" "ind" "mul" "mul" "nem" "nem" "fmul" "nem" "nem" "nem" "fnem" "fnem" "nem" "nem" "nem" "mul" "fnem" "fnem" "fnem" "nem" "fnem" "mul" "fnem" "fnem" "mul" "nem" "nem" "mul" "nem" "mul" "mul" "ind" "fmul" "mul" "fmul" "fnem" "nem" "nem" "fmul" "nem" "mul" "fnem" "mul" "nem" "nem" "fnem" "nem" "fnem" "ind" "nem" 1

Upload: ilie-marius

Post on 17-Dec-2015

301 views

Category:

Documents


0 download

TRANSCRIPT

  • DATE STATISTICE

    MODELE STOCASTICE

    TESTE DE CONCORDANTA (goodness-of-t)

    fenomen aleator. &

    date statistice model stocastic& .

    test de concordanta

    Fenomene aleatoare

    prin natura lor; Exemple din biologie, medicina, -nante prin modul de colectare a datelor; Exemple din son-daje statistice

    (A) DATE STATISTICE

    1. Valori calitative;Exemplu: intrebare cu raspunsuri posibile "f. nemul-

    tumit", "nemultumit", "indiferent", "multumit", "foartemultumit"n indivizi independenti, alesi in mod aleator dintr-o aceeasicategorie, raspund la intrebare

    > rasp=c("fnem","nem","ind","mul","fmul")> p=c(0.2,0.3,0.1,0.3,0.1)> x x"fmul" "ind" "mul" "mul" "nem" "nem" "fmul" "nem" "nem"

    "nem" "fnem" "fnem" "nem" "nem" "nem" "mul" "fnem" "fnem""fnem" "nem" "fnem" "mul" "fnem" "fnem" "mul" "nem" "nem""mul" "nem" "mul" "mul" "ind" "fmul" "mul" "fmul" "fnem" "nem""nem" "fmul" "nem" "mul" "fnem" "mul" "nem" "nem" "fnem""nem" "fnem" "ind" "nem"

    1

  • 2. Valori cantitative

    apartinand unei multimi cel mult numarabile de nu-mere reale apartinand lui R sau unui interval inclus in R

    Exemplu: nota obtinuta la un examen ( 0 = absent)n indivizi independenti, alesi in mod aleator dintr-o

    aceeasi categorie

    > nota=c(0:10)> p=c(0.05,0,0,0,0.3,0.2,0.15,0.1,0.05,0.1,0.05)> y y4 6 8 4 4 6 5 5 9 7 8 4 6 9 4 8 4 4 4 7 5 5 6 5 7

    Exemplu: tensiunea arteriala sistolican indivizi independenti, alesi in mod aleator dintr-o

    aceeasi categorie

    > z z11.4, 14.2, 14.9, 12.5, 12.8, 13.8, 10.7, 13.1, 15.1, 11.4,

    11.6, 15.5, 11.8, 12.9, 15.3, 13.7, 13.5, 11.8, 11.9, 12.9,13.3, 14.2, 14.5, 12.7, 12.4, 13.7, 10.9, 15.4, 14.1, 9.4,12.5, 11.7, 13.2, 14.9, 14.5, 13.5, 12.5, 13.8, 13.3, 12.8,10.5, 12.1, 13.5, 14.6, 10.7, 12.1, 10.9, 11.5, 11.7, 11.1

    Statistica descriptiva (pt datele statistice)

    1. Repartitia de frecvente

    valori distincte x "fnem" "nem" "ind" "mul" "fmul"frecvente 1250

    1950

    350

    1150

    550

    valori distincte y 0 1 2 3 4 5 6 7 8 9 10frecvente 0 0 0 0 825 525 425 325 325 225 0

    2

  • 2. Histograma

    interv val z [9,10) [10,11) [11,12) [12.13) [13,14) [14.15) [15,16]frecv cum 150

    550

    1050

    1150

    1150

    850

    450

    package:........graphics.........R Documentation

    Description: The generic function hist computes ahistogram of the given data values. If plot=TRUE,the resulting object of class "histogram"is plotted byplot.histogram, before it is returned.Usage: hist(x, ...)Arguments: x: a vector of values for which the his-

    togram is desired.

    3. Indicatori de pozitie (date cantitative)

    Datele (x1; :::; xn)Datele ordonate x(1) x(2) ::: x(n)Minim, maxim, cuartile

    x(1) = minixi

    x(n) = maxixi

    Q2 =Me =

    x(k+1); n = 2k + 1

    12

    x(k) + x(k+1)

    ; n = 2k

    Q1 = mediana pt. x(1) ::: MeQ3 = mediana pt. Me ::: x(n)

    Media (de selectie)

    x =1

    n

    nXi=1

    xi

    > x3, 4, 6, 5, 5, 7, 3, 5, 6, 4, 5, 7, 4, 3, 2, 4, 4, 5, 7, 5, 6, 4, 5, 2, 6,

    4, 8, 6, 7, 5, 7, 4, 4, 2, 3, 2, 0, 1, 4, 4, 3, 7, 5, 7, 4, 3, 7, 2, 5, 5, 7, 5,7, 7, 5, 4, 4, 7, 3, 8, 5, 6, 5, 6, 5, 6, 4, 5, 8, 2, 6, 4, 6, 5, 5, 5, 3, 5, 4,3, 7, 7, 2, 4, 5, 4, 6, 5, 3, 1, 5, 7, 4, 5, 3, 3, 10, 6, 7, 6> summary(x)Min........1st Qu...... Median....... Mean....... 3rd Qu......... Max.0.00 .......4.00 ...........5.00 .............4.81 ..........6.00 ...........10.00

    3

  • 4. Indicatori de variabilitate (date cantitative)

    Amplitudineaa = x(n) x(1)

    Dispersia de selectie, abaterea standard

    s2 =1

    n 1nXi=1

    (xi x)2

    s =ps2

    Functii din R

    > mean(x)[1] 4.81

    > var(x)[1] 3.165556

    > sd(x)[1] 1.779201

    5. Indicatori ai formei (date cantitative)

    Notam momentele de selectie centrate, de ordin 3 si 4cu

    m3 =1

    n

    nXi=1

    (xi x)3

    m4 =1

    n

    nXi=1

    (xi x)4

    Coecient de asimetrie (skewness)

    1 =m3q(s2)

    3

    Coecient de aplatizare (kurtosis)

    2 =m4

    (s2)2 3

    4

  • (B) MODELE STOCASTICE (variabile aleatoare)

    (;K; P) ; 2 v Rk; k 1;Spatiul starilor (al valorilor) (S;S)S = A R; A cel mult numarabila;.....(A;P (A))S = R; ::::: (R;B)Variabila aleatoare = functie masurabila X : ! S

    1. Repartitia lui X

    P X1 : S ! [0; 1]

    Variabila aleatoare cu repartitie discretaP X1

    (fxg) = p (x; ) 2 [0; 1] ; x 2 A

    P X1 =Xx2A

    p (x; ) fxgXx2A

    p (x; ) = 1

    Exemple:

    X Uf1; :::; rg; r 2 N; r 2; A = f1; 2; :::; rg (ex: numarul depuncte la aruncarea unui zar),

    P X1 =rX

    x=1

    1

    r fxg

    X B (1; ) ; 2 (0; 1) ; A = f0; 1g (ex: aparitia unui "succes"intr-o proba cu doua rezultate posibile),

    P X1 =1X

    x=0

    x (1 )1x fxg

    X B (r; ) ; 2 (0; 1) ; A = f0; 1; :::; rg (ex: numarul de "suc-cese" in r probe independente, cu cate doua rezultateposibile),

    P X1 =rX

    x=0

    Cxr x (1 )rx fxg

    5

  • X Po () ; 2 (0;1) ; A = N (ex: numarul de defectece pot identicate la piesele dintr-un lot de volummare),

    P X1 =1Xx=0

    x

    x!exp () fxg

    Variabila aleatoare cu repartitie continua si cu densi-tate de repartitie

    P X1(fxg) = 0; 8x 2 R

    P X1(B) =

    ZB

    f (x; ) dx;

    f (x; ) 0; 8x 2 RZR

    f (x; ) dx = 1

    Exemple:

    X U (0; ) ; 2 (0;1) ;

    f (x; ) =

    1 ; x 2 [0; ]0; x =2 [0; ]

    X Expo(); 2 (0;1) ;

    f (x; ) =

    1 exp

    x ; x 2 [0;1)0; x 2 (1; 0)

    X Gamma (; ) ; 2 (0;1) ; 2 (0;1) ;

    f (x;; ) =

    1() x1 exp

    x ; x 2 [0;1)0; x 2 (1; 0)

    X N ; 2 ; = ; 2 2 R (0;1) ;fx;; 2

    =

    1p22

    exp

    122

    (x )2; x 2 R

    6

  • densitatea N (0; 1)f (x) = 1p

    2exp

    12x2

    52.50-2.5-5

    0.3

    0.2

    0.1

    0

    x

    y

    x

    y

    2. Functia de repartitie a lui X

    F : R ! [0; 1]F (y) =

    P X1

    ((1; y)) = P (X < y)

    F (y) =Xx2Ax

  • 107.552.50

    1

    0.75

    0.5

    0.25

    0

    x

    y

    x

    y

    3. Cuantila de rang a lui X

    Fie 2 (0; 1) xat.Notam q 2 S cu proprietatea

    P (X < q) P (X q)

    Pentru modelele cu repartitie continua,

    P (X < q) = P (X q) =

    4. Medie, momente; dispersie

    M (X) =

    Z

    XdP =

    8

  • Exemple:

    X Uf1; :::; rg; r 2 N; r 2;

    M (X) =rX

    x=1

    x 1r=r + 1

    2

    D2 (X) =r2 112

    X B (1; ) ; 2 (0; 1) ;

    M (X) =1X

    x=0

    x x (1 )1x =

    D2 (X) = (1 )

    X B (r; ) ; 2 (0; 1) ;

    M (X) =rX

    x=0

    x Cxr x (1 )rx = r

    D2 (X) = r (1 )

    X Po () ; 2 (0;1) ;

    M (X) =1Xx=0

    x x

    x!exp () =

    D2 (X) =

    X U (0; ) ; 2 (0;1) ;

    M (X) =

    Z0

    x 1dx =

    2

    D2 (X) =2

    12

    X Expo(); 2 (0;1) ;

    M (X) =

    1Z0

    x 1exp

    x

    dx =

    D2 (X) = 2

    9

  • X Gamma (; ) ; 2 (0;1) ; 2 (0;1) ;

    M (X) =1

    () 1Z0

    x x1 expx

    dx =

    D2 (X) = 2

    X N ; 2 ; = ; 2 2 R (0;1) ;M (X) =

    1p22

    1Z1

    x exp 122

    (x )2dx =

    D2 (X) = 2

    5. Functie generatoare, functie caracteristica

    Fie P X1 =1Px=0

    p (x; ) fxg: Functia generatoare asociataeste

    GX : [1; 1] ! R

    GX (t) =1Xx=0

    p (x; ) tx

    Pentru variabile cu medie (dispersie) nita se vericarelatiile

    M (X) = G0X (1)

    D2 (X) = G00X (1) +G

    0X (1) (G0X (1))2

    Fie variabila aleatoare X; cu valori in R: Functia car-acteristica asociata este

    'X : R ! C'X (t) =M

    eitX

    Daca repartitia PX1 are densitatea de repartitie f (x; ) ;

    atunci'X (t) =

    ZR

    eitx f (x; ) dx

    Pentru variabile cu medie (dispersie) nita se vericarelatiile

    M (X) =1

    i '0X (0)

    D2 (X) = '00X (0) + ('0X (0))2

    10

  • 6. Transformata Laplace

    Fie variabila aleatoare X; cu valori in R+: TransformtaLaplace asociata este

    : R+ ! R+ () =M

    eX

    Daca repartitia P X1 pe (R+;B+) are densitatea de

    repartitie f (x; ) pentru x 0; atunci

    () =

    1Z0

    exf (x; ) dx

    11

  • (C) CONCORDANTA DINTREDATE STATISTICE / MODEL STOCASTIC

    Datele statistice sunt valori observate ale unor vari-abile aleatoare independente, identic repartizate, cu repar-titia data de un model stocastic.Analiza de statistica descriptiva ne permite sa alegem

    un model stocastic - drept sursa posibila a datelor sta-tistice.

    Consideram modelul stocastic reprezentat de variabilaaleatoare X cu repartitia PX1 complet specicata. Negli-jam indicele ; caci presupunem cunoscuta valoarea para-metrului. Fie modelul stocastic dat de variabila aleatoare X curepartitia P X1 si functia de repartitie F (y) :

    Fie "observatiile" X1; :::; Xn; care sunt variabile aleatoareindependente, identic repartizate, cu repartitia P X1

    Fie datele statistice (x1; :::; xn) = (X1; :::; Xn) (!)Problema: Putem conrma ipoteza ca datele statistice

    (x1; :::; xn) furnizate de un beneciar provin intr-adevar dinmodelul considerat?

    Vom compara functia de repartitie "teoretica" F (y) cuo functie construita din datele statistice (x1; :::; xn) :

    Spatiul de selectie ndimensional

    Fie modelul stocastic P X1 cu multimea valorilor luiX egala cu S = A (cel mult numarabila) sau cu S = R:Fie observatiile X1; :::; Xn v.a.i.i.r. (P X1):Spatiul de selectie ndimensional este campul de prob-

    abilitate construit pe multimea valorilor lui (X1; :::; Xn) : An; (P (A))n ;

    nOi=1

    P X1i!

    Rn;Bn;

    nOi=1

    P X1i!

    12

  • Functia de repartitie de selectie (empirica)

    Fie functia de repartitie complet specicata, F (y) ; pen-tru variabila aleatoare X : ! S:Fie observatiile X1; :::; Xn v.a.i.i.r. ca si X:

    DEFINITIE: Functia de repartitie de selectie

    Fn (; ) : R ! [0; 1]

    Fn (y; !) =1

    n card fi j i 2 f1; :::; ng; xi = Xi (!) < yg

    Observatie:Fn (y; !) =

    1

    nnXi=1

    IfXi

  • adicaIfXi
  • "Distanta" Kolmogorov dintre functia de repartitie deselectie si functia de repartitie a modelului

    Dn (!)=pnsupy2RjFn (y; !) F (y)j

    Pentru datele statistice (X1; :::; Xn) (!) = (x1; :::; xn) ; se poatecalcula valoareafDn = pn max

    1injFn (xi; !) F (xi)j

    TEOREMA LUI KOLMOGOROV

    Fie modelul probabilist dat de o variabila aleatoare X;cu functia de repartitie F (y) continua. Daca fXn; n 1geste un sir de variabile aleatoare independente, identicrepartizate ca si X pentru care notam fFn (y; !) ; n 1g sirulfunctiilor de repartitie de selectie atunci, pentru oricez 2 R; are loc convergenta

    limn!1P (Dn < z) = K (z) ;

    unde K (z) este functia de repartitie Kolmogorov,

    K (z)= 1 21Xj=1

    (1)j1 exp 2j2z2Pentru demonstratie:PARTHASARATHY, K., R., Probability measures on

    metric spaces, Academic Press, 1967.

    TESTUL LUI KOLMOGOROVDECONCORDANTA( R:.....ks.test for one sample)

    Fie datele statistice (x1; :::; xn) si e modelul stocasticdat de variabila aleatoare X cu functia de repartitie F (y)continua.Pentru 2 (0; 1) arbitrar xat, notam z1 cuantila de

    rang (1 ) a repartitiei Kolmogorov,K (z1) = 1

    15

  • Formulam ipoteza H :{variabilele aleatoare indepen-dente si identic repartizate X1; :::; Xn care au generat datelestatistice au functia de repartitie F (y)}

    Algoritm:

    Se ordoneaza datele statistice, x(1) x(2) ::: x(n) Se calculeaza F x(i) si Fn x(i); ! ; i = 1; :::; n Se calculeaza fDn = pn max

    1inFn x(i); ! F x(i)

    Regula de decizie: Daca fDn z1; decidem sa resp-ingem ipoteza H (nu avem concordanta intre modelsi datele statistice)

    Comentariu: Testul se bazeaza pe teorema lui Kol-mogorov (este un test asimptotic), deci n trebuie sa emare (n 100)======================

    16

  • APLICATIE: TESTAREA NORMALITATIIDATELOR

    Input : (x1; :::; xn) = (X1; :::; Xn) (!)

    H : f variabilele aleatoare independente X1; :::; Xn au repartitienormala g

    (a) Partea exploratorie

    > data c (x1; :::; xn)> mean(data)> var(data)> hist(data)

    qq - line (quantile - quantile line)

    X N ; 2 , X

    N(0; 1)

    FN(;2) (x) = , FN(0;1)x

    =

    z =1

    (x ) ; 2 (0; 1)

    > qqnorm(data)> qqline(data)

    (b) Test de concordanta

    Pentru a utiliza ks.test (for one sample) trebuie saspecicam valorile ; 2> ks.test(data)

    p value = 1KfDn

    p value 0:05 ! respingem ipoteza H (respingem normalitatea)Observatie: Exista o varianta a testului, testul Lil-

    liefors, in care programul isi alege singur valorile = mean(data)

    = sd(data)

    17

  • Alt test de concordanta este "Testul Chi Patrat", con-struit pentru modele stocastice P X1 avand functia derepartitie F (y) continua sau nu.

    AUXILIAR: Convergenta in repartitie

    Notam cu fn; n 1g si probabilitati pe (R;B) (reparti-tii)Notam cu fFn; n 1g si F functiile de repartitie core-

    spunzatoare,Fn (y) = n (1; y)F (y) = (1; y)

    Notam cu f'n; n 1g si ' functiile caracteristice core-spunzatoare,

    'n (t) =

    ZR

    eitxdn (x)

    ' (t) =

    ZR

    eitxd (x)

    Pentru cazul cand fn; n 1g si sunt probabilitati pe(R+;B+) ; notam cu f n; n 1g si transformatele Laplacecorespunzatoare,

    n () =

    Z(0;1)

    exdn (x)

    () =

    Z(0;1)

    exd (x)

    DEFINITIE (convergenta slaba, sau convergenta inrepartitie)

    n =) daca Z

    R

    hdn !n!1

    ZR

    hd

    pentru orice functie h continua si marginita, denita peR cu valori in R:

    18

  • TEOREMA 1O conditie necesara si sucienta ca n =) este ca

    Fn (y) !n!1 F (y) pentru orice y care este punct de continui-

    tate al lui F:

    TEOREMA 2 (PAUL LEVY)a) Daca n =) ; atunci 'n !

    n!1 ' uniform pe orice com-pact din R:b) Notam cu f'n; n 1g functiile caracteristice corespun-

    zatoare repartitiilor fn; n 1g: Daca 'n (t) !n!1 ' (t) pentru

    orice t si ' este continua in origine, atunci exista o repar-titie asa incat n =) ; iar ' este functia caracteristicapt :

    TEOREMA 3Fie fn; n 1g si probabilitati pe (R+;B+) :a) Daca n =) ; atunci n () !

    n!1 () pentru orice 0:b) Notam cu f n; n 1g transformatele Laplace core-

    spunzatoare repartitiilor fn; n 1g: Daca n () !n!1 ()

    pentru orice > 0 si lim!0

    () = 1; atunci exista o repartitie asa incat n =) ; iar este transformata Laplace pt :

    TEOREMA LIMITA CENTRALA (LINDEBERG -LEVY)Fie fXn; n 1g un sir de variabile aleatoare indepen-

    dente, identic repartizate, cu M (Xn) = 8n si D2 (Xn) = 2

  • Repartitia "CHI Patrat" cu d grade de libertate (d 2 N)

    X2 (d) , f (x) = 12d=2 d2xd=21 exp

    x2

    ; x 0

    '2(d) (t) = (1 2it)d=2

    2(d) () = (1 + 2)d=2

    Repartitia Multinomiala M (r; p1; :::; pd)

    DenitieX = (X1; :::; Xd)

    0 M (r; p1; :::; pd) daca

    P X1 =rX

    x1;:::;xd=0x1+:::+xd=r

    r!

    x1!:::xd!(p1)

    x1 ::: (pd)xd (x1;:::;xd)

    unde r 2 N; pi 2 [0; 1] pentru i = 1; :::; d siPd

    i=1 pi = 1

    Experiment: O urna cu bile de d culori, din care sefac r extrageri cu revenire. Vectorul aleator X = (X1; :::; Xd)inregistreaza numarul de bile de ecare culoare care aufost extrase.

    Bibliograe:Dumitrescu M, Florea D, Tudor C, Probleme de teoria

    probabilitatilor si statistica matematica, Editura Tehnica,1985======================

    20

  • TEOREMA LUI PEARSON

    Pentru r 2 N consideram urmatoarele variabile aleatoare:

    Yr = (Yr1; :::; Yrd)0 M (r; p1; :::; pd) ; cu pi 2 [0; 1] ;8i;

    dXi=1

    pi = 1

    X2r =dXj=1

    (Yrj rpj)2rpj

    Notam repartitia lui X2r cu Gr = P X2r1

    : Atunci

    Gr =)r!1

    2 (d 1)

    (spunem ca sirul fX2r ; r 1g converge in repartitie la o vari-abila repartizata CHI Patrat cu (d 1) grade de libertate).

    Demonstratie (prof. Ioan Cuculescu)

    In schema multinomiala ( d culori, r extrageri inde-pendente) apar r partitii independente, corespunzatoarecelor r extrageri,n

    A(k)j ; j = 1; :::; d

    o; k = 1; :::; r

    NotamYrj =

    rXk=1

    IA(k)j; j = 1; :::; d

    Zr =

    Yr1 rp1p

    rp1; :::;

    Yrd rpdprpd

    0Atunci

    X2r = kZrk2

    X2r () =Mexp

    kZrk2

    Vom arata ca

    X2r () !r!1 (1 + 2)(d1)=2

    Notamv = (v1; :::; vd)

    0

    t = (t1; :::; td)0

    21

  • exp kvk2

    =

    dYj=1

    expv2j

    Dar

    expv2j = 'N(0;2) (vj) = 1p

    4

    1Z1

    exp (ivjtj) exp 14t2j

    dtj

    Notand cu < v; t > produsul scalar, putem scrie

    exp kvk2

    =

    1

    (4)d=2

    1Z1

    :::

    1Z1

    exp (i < v; t >) exp 14ktk2

    dt1:::dtd

    Putem scrie

    X2r () =1

    (4)d=2

    1Z1

    :::

    1Z1

    M

    exp (i < Zr; t >) exp

    14ktk2

    dt1:::dtd

    =1

    (4)d=2

    1Z1

    :::

    1Z1

    M

    ' (1) exp

    14ktk2

    dt1:::dtd

    Identicam urmatorii vectori independenti, identic repar-tizati

    fk =

    1pp1IA(k)1; :::;

    1ppdIA(k)d

    0; k = 1; :::; r

    cuM (fk) =

    p1pp1; :::;

    pdppd

    0= (pp1; :::;

    ppd)

    0; k = 1; :::; r

    < Zr; t >=1pr(< f1; t > +:::+ < fr; t > rM (< f ; t >))

    DarM (< f ; t >) =< M (f) ; t >=

    dXj=1

    tjppj

    M (< f ; t >)2=M

    0@ dXj=1

    tjppjIA(k)j

    1A2 =M0@ dXj=1

    t2jpjIA(k)j

    1A = dXj=1

    t2j

    D2 (< f ; t >) =dXj=1

    t2j 0@ dXj=1

    tjppj

    1A2

    22

  • Consideram fu1; :::; udg o baza ortonormala a lui Rd; cuu1 =

    pp1; :::;

    ppd0:

    D2 (< f ; t >) = ktk2 < t;u1 >2=dXj=2

    < t;uj >2

    Pentru sirul de variabile aleatoare independente, iden-tic repartizate

    f< Zr; t >; r = 1; 2; :::g ;de medie 0;aplicam teorema limita centrala si teorema luiPaul Levy (pentru t = 1) :

    ' (1) !r!1 'N(0;D2()) (1) = exp0@1

    2

    dXj=2

    < t;uj >2

    1ARezulta

    X2r () !r!11

    (4)d=2

    1Z1

    :::

    1Z1

    exp

    0@12

    dXj=2

    < t;uj >2

    1Aexp 14ktk2

    dt1:::dtd

    Dar trecerea de la coordonatele ft1; :::; tdg la coordonatelefv1 =< t;u1 >; :::; vd =< t;ud >g este ortogonala, deci de deter-minant 1:

    limr!1 X2r () =

    1

    (4)d=2

    1Z1

    :::

    1Z1

    exp

    0@12

    dXj=2

    v2j

    1A exp0@ 1

    4

    dXj=1

    v2j

    1A dv1:::dvd =1

    (4)d=2

    0@ 1Z1

    exp

    v

    2

    4

    dv

    1A0@ 1Z1

    exp

    v2

    1

    4+1

    2

    dv

    1Ad1 =1

    (4)d=2 p

    p4 ()(d1)=2

    1

    4+1

    2

    (d1)=2=

    1

    (4)(d1)=2

    1

    4+1

    2

    (d1)=2= (1 + 2)

    (d1)=2

    Am demonstrat deci ca

    X2r () !r!1 (1 + 2)(d1)=2

    23

  • si cum (1 + 2)(d1)=2 este transformata Laplace corespun-zatoare repartitiei 2 (d 1) ; am obtinut c.t.d.

    Testul Chi Patrat pentru concordanta dintre modelulstocastic si datele statistice

    Fie datele statistice (x1; :::; xn). Din interpretarea lor,plus elementele de statistica descriptiva, alegem un posi-bil model stocastic din care ar proveni aceste date (cavalori ale unor observatii independente, identic reparti-zate).

    Notam P X1 modelul ales si cu S = X () spatiul star-ilor. Partitionam X () in d submultimi masurabile fA1; :::; Adg;Ai \Aj = pentru i 6= j;

    Sdi=1Ai = X () :

    Calculam

    pj = P (X 2 Aj) ; j = 1; :::; d; pj 2 [0; 1] 8j;dXj=1

    pj = 1

    Formulam ipoteza ca observatiile independente, iden-tic repartizate X1; :::; Xn care au produs datele statis-tice (x1; :::; xn) au repartitia P X1

    H : fX1; :::; Xn sunt identic repartizate ca si Xg

    Daca ipoteza H este adevarata, atunci functioneazateorema lui Pearson. Calculam

    nj = card fi j i = 1; :::; n; xi 2 Ajg =nXi=1

    IAj (xi) ; j = 1; :::; d

    dXj=1

    nj = n

    24

  • Calculam "distanta Pearson" dintre (p1; :::; pd) sin1n ; :::;

    ndn

    S2n =

    dXj=1

    n

    pj

    njn pj

    2=

    dXj=1

    (nj npj)2npj

    Fie 2 (0; 1) arbitrar xat valoarea acceptata a proba-bilitatii de eroare (respingerea ipotezei H cand aceastaeste adevarata).

    Fie hd1;1 cuantila de rang (1 ) a repartitiei 2 (d 1) :

    REGULA DE DECIZIE: Daca S2n hd1;1, deci-dem sa respingem ipoteza H

    Comentarii:

    - Testul se bazeaza pe teorema lui Pearson (este untest asimptotic), deci n trebuie sa e mare (n 100)- Recomandari pentru alegerea valorii d :

    d ' 1 + 3:322 log nd =

    hn3

    i- Recomandari pentru alegerea elementelor partitiei:

    Aj asa incat pj ' 1d; j = 1; ::; d

    - Pentru implementarea in R

    p value = F2(d1)S2n

    Daca p value 0:05; decidem sa respingem ipoteza H

    25