sisteme informatice de asistare a deciziei

Upload: spetcu2012

Post on 04-Apr-2018

231 views

Category:

Documents


1 download

TRANSCRIPT

  • 7/29/2019 sisteme informatice de asistare a deciziei

    1/44

    Ciclul de via al depozitelor de date

    Masa de informaii care se va stoca n depozit trebuieorganizat de aa manier nct s reflecte att datele

    importante ct i contextul lor

    Cerine:

    Datele operaionale sunt integrate n depozitprin utilizarea de convenii consistente n

    privina numelor, msurtorilor, atributelor i

    semanticii.

    Depozitul de date se proiecteaz innd contde cerineleexprese ale viitorilor utilizatori.

    Structura depozitului de date are n vedereidentificarea precis a datelor stocate iaccesul rapid la ele.

  • 7/29/2019 sisteme informatice de asistare a deciziei

    2/44

    Realizarea depozitelor de date

    Modelarea dimensional ofer suportul necesar pentru

    proiectarea structurii depozitului de date.

    Structura se implementeaz sub forma unei baze de date cares asigure att stocarea unui volum imens de date ct i accesulrapid la ele (baze de date client-server).

    Urmtoarea etap este popularea cu date a depozitului - .Aceast etap va fi reluat periodic pentru a aduga datele noi.

    n final, depozitul este dat n exploatare curent explorare analiz raportare.

    activiti asistate de instrumente software de la simple browserei generatoare de rapoarte la instrumente sofisticate de data mining.

  • 7/29/2019 sisteme informatice de asistare a deciziei

    3/44

    Exploatarea curent va evidenia noi cerine informaionale

    pentru asistarea deciziei, cerine care vor conduce laextinderea structurii depozitului,

    popularea cu date istorice a extensieiintegrarea noilor date n aplicaii de analiz.

    Procesul de dezvoltare a depozitelor de date este incremental iciclic pe tot parcursul vieii.

    Proiectare

    Populare Analiz

  • 7/29/2019 sisteme informatice de asistare a deciziei

    4/44

    Modelarea dimensional

    Principiul : obiectivul major al unui sistem

    decizional este analiza performanelor

    organizaiei.

    Indicatorii de performan vor fi analizai de-a lungul

    unor dimensiuni - axe de analiz .Acest tip de modelare este independent de tehnologiile ce vor fi

    utilizate.

  • 7/29/2019 sisteme informatice de asistare a deciziei

    5/44

    Modelarea dimensional

    tehnic de proiectare logic ce permite

    structurarea variabilelor, fiind folosit pentru

    vizualizarea modelelor de date sub forma unui set de

    variabile cheie pentru activitatea analizat (variabiledescrise n funcie de caracteristicile activitii

    respective)

    permite conceptualizarea i reprezentareaaspectelor cantitative, msurabile ale activitii n

    strns legtur cu contextul n care s-a

    desfurat activitatea respectiv.

  • 7/29/2019 sisteme informatice de asistare a deciziei

    6/44

    Modelarea dimensional

    Colecia de fapte un ansamblu de date

    corelate constnd din variabile i date de

    context.

    Faptele modeleaz subiectul de analiz. O fapt

    reprezintmsuraactivitiideterminat la intersecia

    tuturor informaiilorreferitoare la activitate.

    O tranzacie a activitii sau un eveniment

    Starea unui obiect

    Modificrile striiunui obiect

  • 7/29/2019 sisteme informatice de asistare a deciziei

    7/44

    Modelarea dimensional

    Dimensiunileparametrii activitii, decupajul

    din activitatea global care corespunde msurii

    criteriile de agregare.

    zi, lun, an, trimestru, sezon (interval de timp),locaie,zongeografic,client, furnizor, produs saugrup(clas, categorie)

    de clieni, furnizori, produse,angajat,structurorganizatoric

    Dimensiunea modeleaz o perspectiv de analiz; ea se

    compune din parametrii corespunznd informaiilor care

    fac s varieze msurileactivitii.

    Tot ca dimensiune se pot modela variante de msuri:

    valori reale, valori bugetate, valori estimate. Aceast

    dimensiune oarecum artificial se cheam scenariu

  • 7/29/2019 sisteme informatice de asistare a deciziei

    8/44

    Modelarea dimensionalCaracteristici

    Furnizeaz informaii descriptive despre fiecare

    variabil(msur, indicator)

    Conin n general date statistice. Atributeledimensionale nu se schimb aa de des ca faptele

    totui, pot apare modificri iar modelul dimensional

    trebuie spermit modificarea pentru a asigura coerena

    i corectitudinea datelor.Sunt eseniale pentru analiz. Un model dimensional ce

    ofer un numr mare de atribute dimensionale permite

    analize ct mai complexe i ct mai variate

  • 7/29/2019 sisteme informatice de asistare a deciziei

    9/44

    Modelarea dimensional

    Dimensiunile sunt identificate n bazele de datetranzacionale ca fiind cmpurile ce conin

    caracteristicile unei tranzacii, datele de identificare a

    tranzaciei respective, de obicei coduri-chei externe care

    fac legtura cu nomenclatoarele ce le expliciteaz.

    Dimensiunea se materializeaz prin setul de valori

    posibile care alctuiesc domeniul caracteristiciirespective, valorile se numesc membrii

    dimensiunii.

  • 7/29/2019 sisteme informatice de asistare a deciziei

    10/44

    Timp

    IDTimp

    Zi

    Lun

    Trimestru

    Semestru

    An

    Este mai fin

    Reprezentarea grafic la nivel conceptual a unei

    dimensiuni

  • 7/29/2019 sisteme informatice de asistare a deciziei

    11/44

    Modelarea dimensional

    Dimensiunile pot avea multiplii - grupe de valori aledimensiunii respective cu o caracteristic comun.

    IERARHII - structuri arborescente formate din

    dimensiuni i multiplii acestora.

    Membrii unei dimensiuni se pot aranja n una sau mai

    multe ierarhii .

    Ierarhia organizeaz parametrii unei dimensiuni dup

    o relaie de tip este mai fin n conformitate cu

    nivelul lor de detaliu.

  • 7/29/2019 sisteme informatice de asistare a deciziei

    12/44

    Ierarhii alternative ale dimensiunii TIMP

    Anul

    Sezonul

    Semestrul

    Trimestrul Sptmna

    Luna

    Data calendaristic

    Ziua

    IerarhiaAnotimp

    Ierarhia

    Calendar

    IerarhiaSapte_zile

  • 7/29/2019 sisteme informatice de asistare a deciziei

    13/44

    Ierarhiile alternative ale dimensiunii CLIENT

    Zona

    Statut

    Judet

    LocalitateCategorie

    Client

    Subctg

    Ierarhia

    Forma

    Juridica

    Ierarhia

    Clasificare

    Ierarhia

    Geografie

    all

  • 7/29/2019 sisteme informatice de asistare a deciziei

    14/44

    Modelarea dimensional

    Variabile (msuri) - aspectul cantitativ, comensurabil n

    uniti clasice de msur (kg.,buci, uniti monetare). O

    variabil este un atribut numeric al unui element dinbaza de fapte, un indicator sau o msur prin care se

    poate analizaperformanaactivitii modelate.

    Exemple

    volumul vnzrilor (cantitativ/valoric), volumulachiziiilor, costul transportului, volumul datoriilor, volumul

    creanelor, profitul, volumul taxelor i impozitelor.datele

    cantitative centralizate

  • 7/29/2019 sisteme informatice de asistare a deciziei

    15/44

    Modelarea dimensional

    Tabela de fapte

    ocup locul central n cadrul unui model dimensional i

    corespunde coleciei de fapte.

    regrupeaz toi indicatorii referitori la un subiect de

    analiz care partajeaz acelai ansamblu de dimensiuni

    i care nu pot fi dedui din ali indicatori.

  • 7/29/2019 sisteme informatice de asistare a deciziei

    16/44

    VnzriCantitate

    Valoare

    Tabela defapte

    Msuri ale activitii

    Reprezentarea grafic la nivel conceptual a unei

    tabele de fapte

  • 7/29/2019 sisteme informatice de asistare a deciziei

    17/44

    Modelarea dimensional

    GranularitateaFAPTELOR reprezint gradul dedetaliere a acestora - nivelul de detaliu necesar

    analizelor, care exprim numrul de membri ai uneidimensiuni.

    Se recomand ca tabela de fapte s menin granularitatea cea mai

    fin posibil.

    determin dimensiunile principale ale modelului

    determin volumul bazei de date

  • 7/29/2019 sisteme informatice de asistare a deciziei

    18/44

    Modelarea dimensional

    Gradul de imprastiere a datelor

    ex: masura: vanzaridimensiuni :client, produs, timp

    Indicatorul volumul vanzarilor va avea valori valide numai

    pentru o mica fractiune a produsului cartezian a

    dimensiunilor ( daca vanzarile reale se inregistreaza doar

    pentru 1% din combinatiile posibile clienti *produse*nr

    zile gradul de imprastiere este de 9,99%)

  • 7/29/2019 sisteme informatice de asistare a deciziei

    19/44

    Modelarea dimensional

    Un model tridimensional se poate vizualiza/reprezenta cu

    ajutorul unui cub.Un model multidimensional are ns mai multe dimensiuni

    un hypercub.

    Perspectivele multidimensionale asupra

    datelor sunt numite cuburi de date.

  • 7/29/2019 sisteme informatice de asistare a deciziei

    20/44

    Modelarea dimensional

    Modelul steao reprezentare intuitiv a cubului de date

    conineo tabel de fapte(coninutul cubului de

    date)

    un set de tabele dimensionale (dimensiunile

    activitii).

  • 7/29/2019 sisteme informatice de asistare a deciziei

    21/44

    Timp

    IDTimp

    ZiLun

    Trimestru

    Semestru

    An

    Vnzri

    Cantitate

    Valoare

    Magazin

    IDMagazin

    Denumire magazin

    Localitate

    Jude

    Regiune

    ara

    Produs

    IDProdus

    Denumire prod.Marc prod.

    Subcategorie prod

    Categorie prod

    Raion

  • 7/29/2019 sisteme informatice de asistare a deciziei

    22/44

    Modelarea dimensional

    Modelul fulg de zpado variant a schemei stea, rezultatul descompunerii

    uneia sau mai multor dimensiuni care au ierarhii(integrarea unor subdimensiuni sau a unor dimensiuni

    alternative).

    dimensiunile sunt normalizate - apariia unui numrmare de noi tabele poate compromiteperformanele de

    navigare complicnd lucrurile n termeni de lizibilitate

    i gestiune

  • 7/29/2019 sisteme informatice de asistare a deciziei

    23/44

    Timp

    IDTimp

    Zi

    LunTrimestru

    Semestru

    An

    Vnzri

    CantitateValoare

    Magazin

    IDMagazin

    Denumire magazin

    Produs

    IDProdus

    Denumire prod.

    Marc prod.Subcategorie prod

    Categorie prod

    Raion

    Adres

    IDLocalitate

    Jude

    Regiune

    ara

  • 7/29/2019 sisteme informatice de asistare a deciziei

    24/44

    Modelarea dimensional

    Galaxia (constelaia)

    o colecie de scheme stea care au atributedimensionale comune.

    Fuzionarea mai multor modele stea i/sau fulg de nea

    care utilizeaz dimensiuni comune.

  • 7/29/2019 sisteme informatice de asistare a deciziei

    25/44

    Serviciu

    IDServiciu

    Denumire serv.

    Subcategorie serv.

    Categorie serv.

    Vnzri serv

    Valoare serv.

    Magazin

    IDMagazin

    Denumire magazin

    Localitate

    Jude

    Regiune

    ara

    Timp

    IDTimp

    Zi

    Lun

    Trimestru

    Semestru

    An

    Vnzri prod.

    Cantitate

    Valoare prod.

    Produs

    IDProdusDenumire prod.

    Marc prod.

    Subcategorie prod

    Categorie prod

    Raion

  • 7/29/2019 sisteme informatice de asistare a deciziei

    26/44

    Modelarea logic

    Implementarea modelului dimensional n mediul

    relaional:

    fiecare fapt corespunde unei tabele, numit

    tabele de fapte

    fiecare dimensiune corespunde unei tabele,

    numit tabel de dimensiuni.

  • 7/29/2019 sisteme informatice de asistare a deciziei

    27/44

    Tabela de fapte

    CARACTERISTICI:

    Conine un numr foarte mare de tuplurimilioane- care reprezint produsul cartezian al

    dimensiunilor

    Dimensiunea ei crete dinamic, n funcie decantitatea de date ncrcate la fiecare ciclu de mprosptare a

    bazei de date, precum i n funcie de cantitatea de date istorice

    stocate n baza de date.

  • 7/29/2019 sisteme informatice de asistare a deciziei

    28/44

    Tabela de fapte

    Este tabela care reflect performanaactivitii analizate. Conine toate msurile

    importante.

    Cheia primar a tabelei este o cheie compusdin cheile primare ale tabelelor dimensionale

    Este normalizat i realizeaz o legturindirect ntre dimensiuni

  • 7/29/2019 sisteme informatice de asistare a deciziei

    29/44

    Modelul stea

    Tabela de fapte se leag de dimensiuni prin join-uri de

    egalitate.Fiecare atribut din cheia primar a tabelei de fapte

    reprezint cheia primar a unei dimensiuni

    Atributele care nu sunt chei pot fi agregate (tabelele

    de fapte conin doar atribute numerice)

    Tabelele sunt denormalizate

  • 7/29/2019 sisteme informatice de asistare a deciziei

    30/44

    Vnzri (IDProdus, IDMagazin, IDTimp,

    Cantitate, Valoare)Timp (IDTimp, Zi , Lun, Trimestru,

    Semestru, An)

    Magazin (IDMagazin, DenMagazin,Localitate, Jude Regiune, ar)

    Produs (IDProdus, Denumire prod., Marc

    prod., Subcategorie prod., Categorie prod.,

    Raion)

  • 7/29/2019 sisteme informatice de asistare a deciziei

    31/44

    Modelarea logic

    Paradigma obiect

    Fiecare tabel de fapt corespunde uneiclase, denumitclas de fapt;

    fiecare dimensiune corespunde unei clase,denumitclas de dimensiuni.

  • 7/29/2019 sisteme informatice de asistare a deciziei

    32/44

    Etapele generale ale procesului de

    proiectare a unui depozit de dateDelimitarea procesului economic ce va fi modelat.

    Stabilirea nivelului de granularitate.Alegerea dimensiunilor - criterii de agregare

    Alegerea msurilor

  • 7/29/2019 sisteme informatice de asistare a deciziei

    33/44

    Seciune din modelul relaional al unei aplicaii

    tranzacionale n domeniul bancar:

    Tranzaciile clienilor sunt operaii de tipul pli, ncasri, depunere sau

    ridicare de numerar din contul personal.Costul fiecrei tranzacii este comisionul bancar, diferit pentru fiecareoperaie i modificabil n timp.

    Tranzaciile sunt efectuate n mai multe filiale aflate n localiti diferite.

    CLIENT

    Client_id

    Nume_clientTip_client

    AdresaContTelefonData_deschidere

    TRANZACII

    Tranz_nb

    Data_tranzOperaie

    Client_idOperator_idSumaComision_id

    COSTURI

    TRANZACII

    Comision_id

    Denumire

    DescriereCostData_modif

  • 7/29/2019 sisteme informatice de asistare a deciziei

    34/44

    Modelare dimensional

    msura activitii:

    comisioanele asociate operaiilor

    dimensiuni:

    dat,operaie,

    filial,

    client

  • 7/29/2019 sisteme informatice de asistare a deciziei

    35/44

    Dimensiunea DimensiuneaTIMP OPERAIE

    TRANZACII

    DimensiuneaFILIALADimensiuneaCLIENT

    Schema stea a unui depozit de date

    Timp_idZiuaLunaTrimestruAn

    Operaie_idDenumire

    Timp_id

    Operaie_idFiliala_idClient_id

    SumComision

    Client_idNumeTip_client

    Filiala_idNumeOraZona

  • 7/29/2019 sisteme informatice de asistare a deciziei

    36/44

    TRANZACII

    CLIENT

    FILIALA

    Schema fulg de nea a unui depozit de datenomenclatoarele au subnomenclatoare sau nomenclatoare alternative

    Timp_id

    Ziua

    Luna

    Trimestru

    An

    Operaie_id

    Denumire

    Timp_idOperaie_id

    Filiala_id

    Client_idSumComision

    Client_id

    Nume

    Tip_client

    Localitatea

    Filiala_id

    Nume

    Ora

    Timp_id

    Ziua

    Sezon

    Oras

    Zona

    Tip client

    Ctg client

    Subctg client

  • 7/29/2019 sisteme informatice de asistare a deciziei

    37/44

    Dimensiunea DimensiuneaTIMP OPERAIE

    TRANZACIICLIENT

    DimensiuneaFILIALA

    DimensiuneaCLIENT

    PERSONAL

    Dimensiunea

    OPERATOR

    Schema constelaie a unui depozit de date

    Timp_idZiuaLunaTrimestruAn

    Operaie_idDenumire

    Timp_id

    Operaie_id

    Filiala_id

    Client_id

    SumComision

    Client_idNumeTip_client

    Filiala_id

    NumeOraZona

    Timp_id

    Filiala_id

    Operator_id

    Nr_tranzaciiComision_mediu

    Operator_id

    NumeData_incadrareSalariu

  • 7/29/2019 sisteme informatice de asistare a deciziei

    38/44

    Aspecte particulare ale proiectrii

    dimensionale

    Aditivitatea faptelor

    faptele sunt numericei n general aditive i valorificate de o

    manier continu(msurile sunt numerice i aditive pentru apermite rezumarea unui numr mare de nregistrri n cteva

    nregistrri).

    Fapte semi-aditive: fapte care pot fi adiionate doar dup

    anumite dimensiuni (stocuri, solduri de conturi, contorizarea unorindicatori)

    Fapte non-aditive: nu pot fi deloc adiionate (indicatoricalculai ca raport intre ali indicatori)

  • 7/29/2019 sisteme informatice de asistare a deciziei

    39/44

    Vnzri

    IDTimpIDProdus

    TotalCantitate

    TotalValoare

    NrClienti

    Marjabrut

    Timp

    IDTimp

    Zi

    Lun

    Trimestru

    Semestru

    An

    Produs

    IDProdus

    Denumire prod.

    Marc prod.

    Subcategorie prod

    Categorie prod

    Raion

    Marjabrut = Profitbrut / Costprodus

    Marjabruta este non aditiv deoarece aceasta se

    calculeaza ca ratie a sumelor si nu ca suma a raiilor.

  • 7/29/2019 sisteme informatice de asistare a deciziei

    40/44

    Vnzri

    IDTimp

    IDProdus

    TotalCantitate

    TotalValoare

    NrClienti

    Costprodus

    Timp

    IDTimp

    Zi

    Lun

    Trimestru

    Semestru

    An

    Produs

    IDProdus

    Denumire prod.

    Marc prod.

    Subcategorie prod

    Categorie prod

    Raion

    TotalCantitate, TotalValoare, NrClienti i Costprodus sunt

    perfect aditive.

    NrClieni este semi-aditiv.

  • 7/29/2019 sisteme informatice de asistare a deciziei

    41/44

    Aspecte particulare ale proiectrii

    dimensionaleTabelele de fapte fr fapte - pentru reprezentareaacelor procese ale activitii care dei nu prezint fapte

    msurabile sunt interesante pentru procesul de analiz, decitrebuie s fie cuprinse n depozitul de date

    Tabelele de urmrire a evenimentelorau ca scopcontorizarea evenimentelor rezultate din prezena simultan a

    mai multor dimensiuni n acelai loc i n acelai timp

  • 7/29/2019 sisteme informatice de asistare a deciziei

    42/44

    Participare

    IDTimpIDCurs

    IDProfesor

    IDStudent

    Ora/TimpIDTimp

    Curs

    IDCurs

    Profesor

    IDProfesor

    Student

    IDStudent

  • 7/29/2019 sisteme informatice de asistare a deciziei

    43/44

    Aspecte particulare ale proiectrii

    dimensionaleTabelele de acoperirespre deosebire de cele de urmrire aevenimentelor au ca scop de a pune n eviden ceea ce nu s-a

    ntmplat mai degrab dect ceea ce s-a ntmplat. Tabelelede acoperire in evidena tuturor instanierilor unor

    dimensiuni care la un moment dat sunt supuse unor stri,

    explicnd astfel componenta deacoperire din denumirea

    lor

    Un exemplu clasic este tabela de urmrire a produselor aflate

    n promoie. Prin comparaie cu tabela aferent activitii de

    vnzare se pot determina produsele aflate n promoie dar care

    nu au fost vndute

  • 7/29/2019 sisteme informatice de asistare a deciziei

    44/44

    Vnzri

    IDTimp

    IDProdus

    IDPromoTotalCantitate

    TotalValoare

    NrClienti

    Costprodus

    Dataultimachiz

    Timp

    IDTimp

    Produs

    IDProdus

    Promoie

    IDPromo

    Produse

    promo

    IDTimp

    IDProdus

    IDPromo

    existen