Schéma hvězd a sněhové vločky v datovém skladu s příklady

Obsah:

Anonim

Co je vícerozměrné schéma?

Vícerozměrné schéma je speciálně navrženo pro modelování systémů datových skladů. Schémata jsou navržena tak, aby řešila jedinečné potřeby velmi velkých databází určených pro analytické účely (OLAP).

Typy schématu datového skladu:

Následuje 3 hlavní typy vícerozměrných schémat, z nichž každé má své jedinečné výhody.

  • Hvězdné schéma
  • Schéma sněhové vločky
  • Galaxy Schema

V tomto tutoriálu se dozvíte více o-

  • Co je to schéma hvězd?
  • Co je schéma sněhové vločky?
  • Hvězdné schéma vs Schéma sněhové vločky: Klíčové rozdíly
  • Co je schéma Galaxy?
  • Co je schéma hvězdokup?

Co je to schéma hvězd?

Hvězdné schéma v datovém skladu, ve kterém může mít střed hvězdy jednu tabulku faktů a řadu přidružených tabulek dimenzí. Je známé jako hvězdné schéma, protože jeho struktura připomíná hvězdu. Datový model Star Schema je nejjednodušší typ schématu Data Warehouse. To je také známé jako Star Join Schema a je optimalizováno pro dotazování velkých datových sad.

V následujícím příkladu schématu hvězd je tabulka faktů ve středu, která obsahuje klíče ke každé tabulce dimenzí, jako je Dealer_ID, ID modelu, Date_ID, Product_ID, Branch_ID a další atributy, jako jsou prodané jednotky a výnosy.

Příklad schématu hvězdného schématu

Charakteristika hvězdného schématu:

  • Každá dimenze ve hvězdném schématu je reprezentována jedinou jednorozměrnou tabulkou.
  • Tabulka dimenzí by měla obsahovat sadu atributů.
  • Tabulka dimenzí je připojena k tabulce faktů pomocí cizího klíče
  • Tabulka dimenzí není vzájemně spojena
  • Tabulka faktů by obsahovala klíč a míru
  • Hvězdné schéma je snadno pochopitelné a poskytuje optimální využití disku.
  • Tabulky dimenzí nejsou normalizovány. Například na výše uvedeném obrázku Country_ID nemá vyhledávací tabulku Country, jakou by měl návrh OLTP.
  • Schéma je široce podporováno nástroji BI

Co je schéma sněhové vločky?

Schéma sněhové vločky v datovém skladu je logické uspořádání tabulek ve vícerozměrné databázi, takže ER diagram připomíná tvar sněhové vločky. Schéma sněhové vločky je rozšířením hvězdného schématu a přidává další dimenze. Tabulky dimenzí jsou normalizovány, což rozděluje data do dalších tabulek.

V následujícím příkladu schématu sněhové vločky je Země dále normalizována na samostatnou tabulku.

Příklad schématu sněhové vločky

Charakteristika schématu sněhové vločky:

  • Hlavní výhodou schématu sněhové vločky je využití menšího místa na disku.
  • Do schématu je přidána snazší implementace dimenze
  • Kvůli několika tabulkám je výkon dotazů snížen
  • Primární výzvou, které budete čelit při používání schématu sněhové vločky, je to, že musíte provést více úsilí údržby kvůli více vyhledávacím tabulkám.

Hvězdné schéma vs Schéma sněhové vločky: Klíčové rozdíly

Následuje klíčový rozdíl mezi hvězdným schématem a schématem sněhové vločky:

Hvězdné schéma Schéma sněhové vločky
Hierarchie dimenzí jsou uloženy v dimenzionální tabulce. Hierarchie jsou rozděleny do samostatných tabulek.
Obsahuje tabulku faktů obklopenou tabulkami dimenzí. Jedna tabulka faktů obklopená tabulkou dimenzí, která je zase obklopena tabulkou dimenzí
Ve hvězdicovém schématu vytvoří pouze jedno spojení vztah mezi tabulkou faktů a libovolnými tabulkami dimenzí. Schéma sněhové vločky vyžaduje k načtení dat mnoho spojení.
Jednoduchý design DB. Velmi složitý design DB.
Denormalizovaná datová struktura a dotaz také běží rychleji. Normalizovaná datová struktura.
Vysoká úroveň redundance dat Redundance dat na velmi nízké úrovni
Tabulka jedné dimenze obsahuje agregovaná data. Rozdělení dat do různých dimenzí.
Zpracování krychle je rychlejší. Zpracování krychle může být pomalé kvůli složitému spojení.
Nabízí dotazy s vyšším výkonem pomocí optimalizace dotazů Star join. Tabulky mohou být spojeny s více rozměry. Schéma sněhové vločky je reprezentováno centralizovanou tabulkou faktů, která je nepravděpodobná v souvislosti s více dimenzemi.

Co je schéma Galaxy?

Galaxy Schema obsahuje dvě tabulky faktů Tento rozměr podíl tabulek mezi nimi. Nazývá se také Schéma souhvězdí faktů. Schéma je považováno za soubor hvězd, odtud název Galaxy Schema.

Příklad schématu Galaxy

Jak vidíte ve výše uvedeném příkladu, existují dvě tabulky faktů

  1. Příjmy
  2. Produkt.

Ve sdílených schématech Galaxy se dimenze nazývají Shodné rozměry.

Charakteristika schématu Galaxy:

  • Dimenze v tomto schématu jsou rozděleny do samostatných dimenzí na základě různých úrovní hierarchie.
  • Například pokud má zeměpis čtyři úrovně hierarchie, jako je region, země, stát a město, pak by schéma Galaxy mělo mít čtyři dimenze.
  • Navíc je možné vytvořit tento typ schématu rozdělením jednohvězdičkového schématu do více hvězdných schémat.
  • Dimenze jsou v tomto schématu velké, což je potřeba k sestavení na základě úrovní hierarchie.
  • Toto schéma je užitečné pro agregaci tabulek faktů pro lepší pochopení.

Co je schéma hvězdokup?

Schéma sněhové vločky obsahuje plně rozšířené hierarchie. To však může do schématu přidat složitost a vyžaduje další spojení. Na druhou stranu hvězdné schéma obsahuje plně sbalené hierarchie, což může vést k redundanci. Nejlepším řešením tedy může být rovnováha mezi těmito dvěma schématy, což je design hvězdokupového schématu.

Příklad hvězdokupového schématu

Překrývající se dimenze lze v hierarchiích najít jako vidlice. Vidlice se stane, když entita funguje jako nadřazená ve dvou různých dimenzionálních hierarchiích. Entity vidlice pak byly identifikovány jako klasifikace se vztahy jedna k mnoha.

Souhrn:

  • Vícerozměrné schéma je speciálně navrženo pro modelování systémů datových skladů
  • Hvězdné schéma je nejjednodušší typ schématu Data Warehouse. Je známé jako hvězdné schéma, protože jeho struktura připomíná hvězdu.
  • Schéma sněhové vločky je rozšířením hvězdného schématu a přidává další dimenze. Nazývá se sněhová vločka, protože její schéma připomíná sněhovou vločku.
  • Ve hvězdném schématu definuje vztah mezi tabulkou faktů a libovolnými tabulkami dimenzí pouze jedno spojení.
  • Hvězdné schéma obsahuje tabulku faktů obklopenou tabulkami dimenzí.
  • Schéma sněhové vločky je obklopeno tabulkou dimenzí, které jsou zase obklopeny tabulkou dimenzí
  • Schéma sněhové vločky vyžaduje k načtení dat mnoho spojení.
  • Schéma Galaxy obsahuje dvě tabulky faktů, které sdílejí tabulky dimenzí. Nazývá se také Schéma souhvězdí faktů.
  • Schéma hvězdokupy obsahuje atributy schématu Hvězda a Sněhová vločka.