Rozdiel medzi tabuľkou faktov a tabuľkou rozmerov

Autor: Laura McKinney
Dátum Stvorenia: 1 Apríl 2021
Dátum Aktualizácie: 13 Smieť 2024
Anonim
VEDOMIE A OSOBNOSŤ. OD VOPRED MŔTVEHO K VEČNE ŽIVÉMU (slovenské titulky)
Video: VEDOMIE A OSOBNOSŤ. OD VOPRED MŔTVEHO K VEČNE ŽIVÉMU (slovenské titulky)

Obsah


Tabuľka faktov a tabuľka dimenzií sú základnými faktormi na vytvorenie a schéma, Záznam tabuľky faktov je kombináciou atribútov z tabuliek rôznych dimenzií. Tabuľka faktov pomáha používateľovi analyzovať obchodné dimenzie, ktoré mu pomáhajú pri rozhodovaní o zlepšení jeho podnikania. Na druhej strane tabuľky rozmerov pomáhajú tabuľke faktov zhromažďovať rozmery, podľa ktorých sa musia prijať opatrenia.

Bod, ktorý rozlišuje faktickú tabuľku a tabuľku rozmerov, je ten, že rozmerová tabuľka obsahuje atribúty, podľa ktorých sa prijímajú opatrenia tabuľka faktov, Existuje niekoľko ďalších faktorov, ktoré vytvárajú rozdiely medzi tabuľkou skutočností a tabuľkou dimenzií, aby sa zobrazili. Pozrime sa na tabuľku porovnania uvedenú nižšie.

  1. Porovnávacia tabuľka
  2. definícia
  3. figúra
  4. Kľúčové rozdiely
  5. záver

Porovnávacia tabuľka

Základ pre porovnanieTabuľka faktovTabuľka rozmerov
základnéTabuľka faktov obsahuje meranie pozdĺž atribútov tabuľky rozmerov. Tabuľka dimenzií obsahuje atribúty, podľa ktorých tabuľka faktov počíta metriku.
Atribút a záznamy Tabuľka faktov obsahuje menej atribútov a viac záznamov.Dimenzná tabuľka obsahuje viac atribútov a menej záznamov.
Veľkosť tabuľkyTabuľka faktov rastie vertikálne.Tabuľka dimenzií rastie vodorovne.
kľúč Tabuľka faktov obsahuje primárny kľúč, ktorý je zreťazením primárnych kľúčov všetkých rozmerových tabuliek. Každá tabuľka dimenzií obsahuje svoj primárny kľúč.
stvoreniaFaktickú tabuľku je možné vytvoriť iba po dokončení tabuliek dimenzií.Najskôr je potrebné vytvoriť tabuľky dimenzií.
schéma Schéma obsahuje menší počet faktických tabuliek.Schéma obsahuje väčší počet rozmerových tabuliek.
atribútyTabuľka faktov môže obsahovať údaje v číselnom aj uálovom formáte.Dimenzná tabuľka vždy obsahuje atribúty vo formáte UAL.


Definícia tabuľky faktov

Tabuľka faktov je tabuľka, ktorá obsahuje meranie pozdĺž atribútov rozmerových tabuliek. Môže obsahovať informácie na najnižšej možnej úrovni. Niektoré tabuľky faktov obsahujú iba súhrnné údaje, nazývané ako Agregovaná tabuľka faktov, Tabuľka faktov obsahuje takmer dátum pečiatky dát. Poďme diskutovať o charakteristikách tabuľky faktov.

Zreťazený kľúč
Tabuľka faktov obsahuje zreťazený kľúč, ktorý predstavuje zreťazenie primárnych kľúčov všetkých rozmerových tabuliek. Zreťazená tabuľka faktov musí jednoznačne identifikovať riadok v tabuľke faktov.

Zrno dát
Dátové zrno ukazuje, ako hlboko boli uložené merania v skutočnosti v tabuľke. Dátové zrno musí byť na najvyššej možnej úrovni.


Doplnkové opatrenia
Atribúty tabuľky faktov môžu byť plne aditívne alebo semi-prísada, Úplne aditívne opatrenia sú tie, ktoré sa dajú ľahko zhrnúť pre všetky dimenzie v skutočnosti. Napríklad Quantity_ordered je atribút, ktorý sa dá zhrnúť pre všetky dimenzie. Rovnako ako v prípade konkrétneho zákazníka, regiónu, dátumu, značky atď. Môžeme zobrať celkové množstvo. Tieto semikaditívne opatrenia sú tie, ktoré sa dajú zhrnúť podľa niektorých dimenzií tabuľky faktov, ale nie všetkých dimenzií. Podobne nemôže byť suma zostatku spočítaná v časovej dimenzii, pretože sa v priebehu času mení.

Riedke dáta
Niekedy môžeme vidieť záznamy v skutočnosti tabuľky, ktorá má atribúty s nulové opatrenia, Napríklad na dovolenke nemusí byť objednávka. Atribúty tohto dátumu teda budú mať nulové miery. Nemusíme ukladať opatrenia pre také druhy záznamov, pretože neposkytujú žiadne informácie.

Degenerované rozmery
V skutočnosti sa niekedy môžu vyskytnúť určité dimenzie v skutočnosti tabuľky, ktoré vôbec nie sú aditívne. Napríklad order_number, customer_id, nemôžete pridať tieto typy dimenzií. V takom prípade však musíte nájsť objednávku konkrétneho zákazníka v tomto mesiaci; potom budete potrebovať customer_id na prepojenie vášho vyhľadávania. Tieto typy, ak sa volajú atribúty alebo rozmery faktickej tabuľky Degenerovaná dimenzia.

Definícia rozmerovej tabuľky

Tabuľka dimenzií je kľúčovým komponentom pre schému Štart. Tabuľka dimenzií obsahuje atribúty, ktoré predstavujú rozmery, pozdĺž ktorých sa meranie vykonáva v skutočnosti. Ďalej sa budeme venovať niektorým charakteristikám tabuľky rozmerov.

Atribúty a kľúče
Každá tabuľka dimenzií musí mať a primárny kľúč ktoré jednoznačne identifikujú každý záznam tabuľky. Všeobecne sa uvádza, že tabuľka dimenzií obsahuje veľa atribútov. Preto sa zdá, že je široký t. j. keď vytvoríte tabuľku dimenzií, zistíte, že sa rozširuje vodorovne.

Hodnoty atribútov
Hodnoty atribútov v tabuľke rozmerov sú zriedka číselné, väčšinou sú hodnoty v atribútoch formát UAL, Napríklad názov produktu, značka, kategória, podkategória atď.

Vzťah medzi atribútmi
Často vidíte, že atribúty, s ktorými sa stretnete v rozmerovej tabuľke, priamo nesúvisia. Rovnako ako produkt Product_brand nemusí s balíkom_dáta robiť nič, stále však môžu existovať atribúty tabuľky dimenzií produktu.

normalizácie
Tabuľka rozmerov je nie mal byť normalizovali, Dôvodom je, že normalizácia tabuľky by vytvorila veľa sprostredkujúcich tabuliek. Keď dotaz vyberie atribút z tabuľky rozmerov a získa merania pozdĺž toho, čo pre tabuľku faktov, dotaz musí prejsť tie medzil'ahlé tabuľky, ktoré sa stanú neefektívnymi. Tabuľky rozmerov preto nie sú normalizované.

Vŕtanie nadol, vyhrnutie
Atribúty tabuľky dimenzií umožňujú získať podrobnosti buď prechodom z vyššej úrovne agregovaných atribútov na atribúty nižšej úrovne. Ak napríklad chcete nájsť celkový predaj v regióne, môžete prejsť podrobnejšie informácie o predaji podľa štátu, mesta alebo zipsu. Dokonca si môžete vyhľadať údaje o celkovom predaji najskôr podľa zip, potom podľa mesta a štátu.

Viac hierarchia
Tabuľka dimenzií často ponúka viac hierarchií. Napríklad máme tabuľku dimenzií produktu pre obchodný dom. Teraz máme dve oddelenia marketingové a účtovné oddelenie.

Marketingové oddelenie v určitej hierarchii prehĺbi medzi atribútmi tabuľky rozmerov produktu, aby získalo merania pre tabuľku faktov.

Na druhej strane bude účtovné oddelenie podrobnejšie analyzovať atribúty tabuľky rozmerov produktu v rôznych hierarchiách, aby získali merania pre tabuľku faktov.

Tabuľka dimenzií teda musí mať viac hierarchií alebo úroveň agregácie atribútov, aby umožnila používateľovi rozbaliť sa v ktorejkoľvek z viacerých hierarchií.

záznamy
Hoci tabuľka dimenzií obsahuje príliš veľa atribútov, má menej záznamov.

  1. Tabuľka faktov obsahuje meranie pozdĺž dimenzie / atribútov tabuľky rozmerov.
  2. Tabuľka faktov obsahuje viac záznamov a menej atribútov v porovnaní s tabuľkou dimenzií, zatiaľ čo tabuľka dimenzií obsahuje viac atribútov a menej záznamov.
  3. Veľkosť tabuľky faktickej tabuľky rastie vertikálne, zatiaľ čo veľkosť tabuľky rozmerovej tabuľky rastie horizontálne.
  4. Každá tabuľka rozmerov obsahuje primárny kľúč na identifikáciu každého záznamu v tabuľke, zatiaľ čo tabuľka faktov obsahuje zreťazený kľúč, ktorý je kombináciou všetkých primárnych kľúčov všetkých rozmerových tabuliek.
  5. Dimenzná tabuľka sa musí zaznamenať pred vytvorením faktickej tabuľky.
  6. Schéma obsahuje menej tabuliek faktov, ale viac tabuliek dimenzií.
  7. Atribúty v skutočnosti sú číselné aj uálne, ale atribúty tabuľky rozmerov majú iba atribúty ual.

záver:

Obidve sú rovnako dôležité pre vytvorenie schémy, ale tabuľka dimenzií sa musí zaznamenať pred tabuľkou faktov. Pretože nie je možné vytvoriť tabuľku faktov bez rozmerov.