1734 2. puncte atipice 7318

Upload: mihaela-ene

Post on 26-Feb-2018

221 views

Category:

Documents


0 download

TRANSCRIPT

  • 7/25/2019 1734 2. Puncte Atipice 7318

    1/5

    Puncte atipice

    OUTLIERS

    Nicolae-Marius JULA, Universitatea Nicolae Titulescu, Bucuresti

  • 7/25/2019 1734 2. Puncte Atipice 7318

    2/5

    Introducere

    Un punct atipic este o observaie care pare s se abat semnificaalte observaiin sample. Identificarea punctelor atipice poteniaimportant din mai multe motive.

    Un punct atipic pot indica date incorecte. De exemplu, datele pocodificate incorect sau un experiment nu a fost efectuat corect. care se poate determina c un punct este de fapt atipic, atunci revaloare ar trebui eliminat din analiz (sau corectat dac este p

    n unele cazuri, poate s nu fie posibil s se determine dac un peste sau nu duntor analizei. Atipic poate fi din cauza variaiilorsau poate indica ceva interesant din punct de vedere tiinific. nnu se recomand s se tear pur i simplu observaia respectivacestea, n cazul n care datele conin puncte atipice semnificativrecomandat s se utilizeze tehnici statistice.

    Nicolae-Marius JULA, Universitatea Nicolae Titulescu, Bucuresti

  • 7/25/2019 1734 2. Puncte Atipice 7318

    3/5

    Puncte atipice - singular vs. multiple

    Anumite teste sunt construite pentru a determina prezena singur punct, altele por identifica multiple puncte

    Nu se recomand inter-schimbarea acestora

    Unele teste pentru puncte atipice multiple pot solicita indicnumrului de puncte

    Nicolae-Marius JULA, Universitatea Nicolae Titulescu, Bucuresti

  • 7/25/2019 1734 2. Puncte Atipice 7318

    4/5

    Indicatorul Z i Z modificat

    Scorul Z pentru o observaie este definit ca: =

    Unde i s reprezint media i abaterea standard

    Nu se recomand pentru eantioanele reduse

    Nicolae-Marius JULA, Universitatea Nicolae Titulescu, Bucuresti

  • 7/25/2019 1734 2. Puncte Atipice 7318

    5/5

    Z modificat

    = 0,6745()

    Unde MAD este abaterea absolut median i este mediana

    MAD = mediana( )

    Orice valoare peste 3.5 este considerat punct atipic.

    Nicolae-Marius JULA, Universitatea Nicolae Titulescu, Bucuresti