Różnica między schematem gwiazdy i płatków śniegu

Różnica między schematem gwiazdy i płatków śniegu

Hurtowni danych to system zaprojektowany do przechowywania i organizowania danych w centralnych repozytoriach, w tym danych z innych źródeł. Jest to podstawowa koncepcja inteligencji biznesowej w relacyjnych modelach bazy danych, która wykorzystuje techniki analityczne do integracji danych biznesowych z centralną bazą danych.

Istnieją dwa popularne modele architektoniczne stosowane w magazynie danych:

  • Schemat gwiazdy
  • Schemat płatka śniegu

Oba są powszechnymi wielowymiarowymi modelami baz danych używanych do zaspokojenia potrzeb dużych baz danych do celów analitycznych w rzeczywistych magazynach danych.

Prezentujemy obiektywne porównanie między nimi, aby lepiej zrozumieć, która jest lepsza od drugiego.

Co to jest schemat gwiazdy?

Jest to najczęstszy i powszechnie akceptowany model architektoniczny używany do opracowywania hurtowni danych i MART, w których dane są uporządkowane w faktach i wymiarach. Jest to najprostszy model architektoniczny, w którym jedna tabela faktów jest używana w odniesieniu do tabel wielu wymiarów, naśladując wzór gwiazdy.

Jak sama nazwa wskazuje, schemat przypomina gwiazdę z tabelą faktów w środku i promieniującymi z niej tabelami wielu wymiarów, tworząc wzór podobny do gwiazdy.

Jest również znany jako schemat połączenia gwiazdy i przechowuje wszystkie atrybuty wymiaru w jedną denormalizowaną tabelę faktów, aby szybko poruszać się po dużych wielowymiarowych zestawach danych, które odpowiadają za szybkie czasy reakcji zapytania.

Co to jest schemat płatków śniegu?

Jest to rozszerzenie schematu gwiazdy o dodatkowych funkcjonalnościach. W przeciwieństwie do schematu gwiazdy, tabele wymiarów w schemacie płatków śniegu są znormalizowane do wielu powiązanych tabel.

Model architektoniczny reprezentuje logiczny układ tabel w hierarchii relacji wiele do jednego, w której tabele wielu wymiarów są znormalizowane w tabele subwymiarowe, przypominające wzór podobny do śniegu, stąd nazwa.

Jest to bardziej złożona wersja schematu gwiazdy z większymi połączeniami między tabelami wymiarów, które stanowią powolny czas przetwarzania w celu pobrania danych, co oznacza powolne czasy reakcji zapytania. Minimalizuje redundancję danych, co z kolei poprawia wydajność zapytania.

Różnica między schematem gwiazdy i płatków śniegu

Architektura schematu gwiazd i płatków śniegu

W relacyjnych bazach danych schemat Star jest najprostszym modelem architektonicznym używanym do opracowywania hurtowni danych i wielowymiarowych MARTS. Jak sama nazwa wskazuje, model przypomina gwiazdę z punktami promieniującymi z centrum. Podobnie jak inne modele wymiarowe, składa się z danych w postaci faktów i wymiarów. Z drugiej strony schemat płatków śniegu jest bardziej złożonym modelem architektonicznym, który odnosi się do wielowymiarowej bazy danych z logicznym układem tabel w postaci płatka śniegu.

Tabela wymiarowa

Schemat płatków śniegu jest dość podobny do schematu gwiazdy, z wyjątkiem tego, że może mieć więcej niż jedno tabele wymiarów, które są dalej znormalizowane w wiele powiązanych tabel określanych jako tabele subwymiarowe. Reprezentuje wiele poziomów relacji, które rozgałęziają się na wzór płatka śniegu. Jednak schemat gwiazdy przechowuje wszystkie powiązane atrybuty wymiaru w jedną denormalizowaną tabelę wymiarów, co ułatwia zrozumienie i obsługa prostszych zapytań.

Model biznesowy schematu gwiazd i płatków śniegu

Tabela wymiarów nie może zawierać duplikatów wierszy w relacyjnych modelach bazy danych dla prostego faktu, że może powodować dwuznaczności w celu uzyskania. Każda tabela powinna mieć kolumnę lub kombinację kolumn zwanych klawiszem podstawowym, który jednoznacznie identyfikuje wszystkie rekordy tabeli. Klucz obcy to kolumna lub grupa kolumn, które zapewnia połączenie między dwiema tabelami. W schemacie gwiazd każda tabela wymiarów ma klucz podstawowy, który jest związany z kluczem obcego w tabeli faktów. Hierarchia biznesowa w schemacie płatków śniegu jest reprezentowana przez klucz podstawowy/relacje kluczowe między tabelami wymiarów.

Integralność danych w schemacie gwiazd i płatków śniegu

Kluczową różnicą między dwoma relacyjnymi modelami bazy danych jest normalizacja. Tabele wymiarów w schemacie gwiazd nie są znormalizowane, co oznacza, że ​​model biznesowy wykorzysta stosunkowo więcej miejsca do przechowywania tabel wymiarów, a więcej przestrzeni oznacza bardziej zbędne zapisy, które ostatecznie spowodowałyby niespójność. Z drugiej strony schemat płatków śniegu minimalizuje redundancję danych, ponieważ tabele wymiarów są znormalizowane, co uwzględnia znacznie mniejsze zapisy. Hierarchia biznesowa i jej wymiary są zachowane za pomocą referencyjnej integralności relacje można aktualizować niezależnie w magazynach danych.

Wydajność zapytania

Schemat gwiazdy ma mniej połączeń między tabelą wymiarów a tabelą faktów w porównaniu z schematem płatków śniegu, który ma wiele połączeń, które odpowiadają za mniejszą złożoność zapytania. Ponieważ wymiary w schemacie gwiazd są połączone przez centralną tabelę faktów, ma wyraźne ścieżki łączenia, które oznaczają szybkie czasy reakcji zapytania i szybki czas reakcji oznacza lepszą wydajność. Schemat płatków śniegu ma większą liczbę połączeń, więc dłuższe czasy reakcji zapytania, co powoduje bardziej złożone zapytania, co ostatecznie zagraża wydajności.

Star Schema vs. Schemat płatków śniegu: wykres porównawczy


Podsumowanie schematu płatków śniegu gwiazd

Oba są najczęstszymi i powszechnie przyjętymi modelami architektonicznymi używanymi do opracowywania magazynów bazy danych i Marts danych. Jednak każdy model biznesowy ma spory udział w zaletach i wadach. Chociaż schemat Star jest najprostszym modelem wielowymiarowym używanym do organizowania danych na fakty i wymiary, idealnie nadaje się do opracowywania MART danych, które obejmują mniej złożone relacje. Schemat płatków śniegu jest logiczną reprezentacją tabel w wielowymiarowej bazie danych, w której wymiary są przechowywane w tabelach subwymiarowych. Główną różnicą między nimi jest normalizacja. Tabele wymiarów w schemacie płatków śniegu są całkowicie znormalizowane w wielu tabelach wyszukiwania, podczas gdy w schemacie gwiazdy tabele wymiarów są denormalizowane w jedną centralną tabelę faktów.