Shema zvijezda i pahuljica u skladištu podataka s primjerima

Sadržaj:

Anonim

Što je višedimenzionalna shema?

Multidimenzionalna shema posebno je dizajnirana za modeliranje sustava skladišta podataka. Sheme su dizajnirane da odgovore na jedinstvene potrebe vrlo velikih baza podataka dizajniranih za analitičku svrhu (OLAP).

Vrste sheme skladišta podataka:

Slijede 3 glavne vrste višedimenzionalnih shema od kojih svaka ima svoje jedinstvene prednosti.

  • Shema zvijezda
  • Shema pahuljica
  • Shema galaksije

U ovom vodiču naučit ćete više o-

  • Što je shema zvijezda?
  • Što je shema pahuljica?
  • Shema zvijezda protiv sheme pahuljica: Ključne razlike
  • Što je Galaxy shema?
  • Što je shema zvjezdanih nakupina?

Što je shema zvijezda?

Shema zvijezda u skladištu podataka, u kojoj središte zvijezde može imati jednu tablicu činjenica i niz pridruženih tablica dimenzija. Poznata je kao shema zvijezda jer svojom strukturom podsjeća na zvijezdu. Podatkovni model Zvjezdane sheme najjednostavnija je vrsta sheme Skladišta podataka. Također je poznata kao Shema spajanja zvijezda i optimizirana je za postavljanje upita o velikim skupovima podataka.

U sljedećem primjeru Zvjezdane sheme tablica činjenica nalazi se u središtu koja sadrži ključeve svake tablice dimenzija kao što su ID trgovca, ID modela, Date_ID, Product_ID, Branch_ID i drugi atributi poput prodanih jedinica i prihoda.

Primjer dijagrama sheme zvijezda

Karakteristike sheme zvijezda:

  • Svaka dimenzija u shemi zvijezda predstavljena je jedinom jednodimenzionalnom tablicom.
  • Tablica dimenzija trebala bi sadržavati skup atributa.
  • Tablica dimenzija pridružuje se tablici činjenica pomoću stranog ključa
  • Tablica dimenzija nije međusobno spojena
  • Tablica činjenica sadržavala bi ključ i mjeru
  • Shemu Star lako je razumjeti i pruža optimalnu upotrebu diska.
  • Tablice dimenzija nisu normalizirane. Na primjer, na gornjoj slici, Country_ID nema tablicu pretraživanja Country kao što bi to imao OLTP dizajn.
  • Shemu široko podržavaju BI Tools

Što je shema pahuljica?

Shema pahuljica u skladištu podataka logičan je raspored tablica u višedimenzionalnoj bazi podataka tako da ER dijagram nalikuje obliku pahuljice. Shema pahuljica proširenje je sheme zvijezda i dodaje joj dodatne dimenzije. Tablice dimenzija su normalizirane što dijeli podatke u dodatne tablice.

U sljedećem primjeru sheme pahuljica, država se dalje normalizira u pojedinačnu tablicu.

Primjer sheme pahuljica

Karakteristike sheme pahuljica:

  • Glavna prednost sheme pahuljica koristi manji prostor na disku.
  • Shemi se dodaje jednostavnija implementacija dimenzije
  • Zbog više tablica izvedba upita je smanjena
  • Primarni izazov s kojim ćete se suočiti tijekom korištenja sheme pahuljica jest taj što trebate izvršiti više napora na održavanju zbog više tablica pretraživanja.

Shema zvijezda protiv sheme pahuljica: Ključne razlike

Slijedi ključna razlika između sheme zvijezda i sheme pahuljica:

Shema zvijezda Shema pahuljica
Hijerarhije dimenzija pohranjene su u dimenzijskoj tablici. Hijerarhije su podijeljene u zasebne tablice.
Sadrži tablicu činjenica okruženu tablicama dimenzija. Tabela činjenica okružena tablicom dimenzija koje su pak okružene tablicom dimenzija
U shemi zvijezda, samo jedno spajanje stvara odnos između tablice činjenica i bilo koje tablice dimenzija. Shema pahuljice zahtijeva mnoga udruživanja za dohvaćanje podataka.
Jednostavan DB dizajn. Vrlo složen DB dizajn.
Denormalizirana struktura podataka i upit također se brže izvode. Normalizirana struktura podataka.
Visoka razina suvišnosti podataka Veoma niska razina podataka
Tablica s jednom dimenzijom sadrži agregirane podatke. Podaci se dijele u različite dimenzijske tablice.
Obrada kocke je brža. Obrada kocke može biti spora zbog složenog spajanja.
Nudi upite s boljom izvedbom pomoću optimizacije upita za pridruživanje zvjezdicama. Tablice mogu biti povezane s više dimenzija. Shema Pahuljice predstavljena je centraliziranom tablicom činjenica koja je vjerojatno povezana s više dimenzija.

Što je shema galaksije?

Shema Galaxy sadrži dvije tablice činjenica koje međusobno dijele tablice dimenzija. Također se naziva Shema konstelacije činjenica. Shema se promatra kao zbirka zvijezda pa otuda i naziv Galaxy Schema.

Primjer sheme galaksije

Kao što možete vidjeti u gornjem primjeru, postoje dvije tablice činjenica

  1. Prihod
  2. Proizvod.

U Galaxy shemi dionice dimenzije se nazivaju Prilagođene dimenzije.

Karakteristike sheme galaksije:

  • Dimenzije u ovoj shemi odvojene su u zasebne dimenzije na temelju različitih razina hijerarhije.
  • Na primjer, ako geografija ima četiri razine hijerarhije poput regije, države, države i grada, tada bi shema Galaksije trebala imati četiri dimenzije.
  • Štoviše, moguće je izgraditi ovu vrstu sheme dijeljenjem sheme s jednom zvjezdicom na više shema zvijezda.
  • Dimenzije su velike u ovoj shemi koju je potrebno graditi na temelju razina hijerarhije.
  • Ova je shema korisna za agregiranje tablica činjenica radi boljeg razumijevanja.

Što je shema zvjezdanih nakupina?

Shema pahuljica sadrži potpuno proširene hijerarhije. Međutim, to shemi može dodati složenost i zahtijeva dodatna spajanja. S druge strane, zvjezdana shema sadrži potpuno urušene hijerarhije, što može dovesti do suvišnosti. Dakle, najbolje rješenje može biti ravnoteža između ove dvije sheme, a to je dizajn sheme zvjezdanih jata.

Primjer sheme zvjezdanih nakupina

Preklapajuće dimenzije mogu se naći kao rašlje u hijerarhijama. Vilica se događa kada entitet djeluje kao roditelj u dvije različite dimenzijske hijerarhije. Entiteti vilica tada su identificirani kao klasifikacija s odnosima jedan prema više.

Sažetak:

  • Multidimenzionalna shema posebno je dizajnirana za modeliranje sustava skladišta podataka
  • Shema zvijezda je najjednostavnija vrsta sheme skladišta podataka. Poznata je kao shema zvijezda jer svojom strukturom podsjeća na zvijezdu.
  • Shema pahuljica proširenje je sheme zvijezda i dodaje joj dodatne dimenzije. Zove se pahuljica jer njezin dijagram podsjeća na Pahuljicu.
  • U shemi zvijezda, samo jedno spajanje definira odnos između tablice činjenica i bilo koje tablice dimenzija.
  • Shema zvijezda sadrži tablicu činjenica okruženu tablicama dimenzija.
  • Shema pahuljica okružena je tablicom dimenzija, a ona je okružena tablicom dimenzija
  • Shema pahuljice zahtijeva mnoga udruživanja za dohvaćanje podataka.
  • Galaxy Shema sadrži dvije tablice činjenica koje dijele tablice dimenzija. Također se naziva Shema konstelacije činjenica.
  • Shema zvjezdanog jata sadrži atribute sheme zvijezda i pahuljica.