Što je OLAP? Kocka, Operacije & Vrste u skladištu podataka

Sadržaj:

Anonim

Što je OLAP?

Internetska analitička obrada (OLAP) kategorija je softvera koji korisnicima omogućuje istodobnu analizu podataka iz više sustava baza podataka. To je tehnologija koja analitičarima omogućuje izdvajanje i prikaz poslovnih podataka s različitih gledišta.

Analitičari često trebaju grupirati, objediniti i pridružiti podatke. Te su operacije u relacijskim bazama podataka intenzivne. Pomoću OLAP-a podaci se mogu unaprijed izračunati i unaprijed agregirati, što čini analizu bržom.

OLAP baze podataka podijeljene su u jednu ili više kockica. Kocke su dizajnirane na takav način da izrada i pregled izvještaja postaju jednostavni. OLAP je skraćenica od Online Analytical Processing.

U ovom vodiču naučit ćete-

  • OLAP kocka
  • Osnovne analitičke operacije OLAP-a
  • Vrste OLAP sustava
  • ROLAP
  • MOLAP
  • Hibridni OLAP
  • Prednosti OLAP-a
  • Mane OLAP-a

OLAP kocka:

U osnovi OLAP koncepta je OLAP kocka. OLAP kocka je struktura podataka optimizirana za vrlo brzu analizu podataka.

Kocka OLAP sastoji se od numeričkih činjenica koje se nazivaju mjerama i koje su kategorizirane po dimenzijama. OLAP kocka se naziva i hiperkocka .

Operacije podataka i analiza obično se izvode pomoću jednostavne proračunske tablice, gdje su vrijednosti podataka poredane u formatu redaka i stupaca. Ovo je idealno za dvodimenzionalne podatke. Međutim, OLAP sadrži višedimenzionalne podatke, a podaci se obično dobivaju iz drugog i nepovezanog izvora. Korištenje proračunske tablice nije optimalna opcija. Kocka može pohraniti i analizirati višedimenzionalne podatke na logičan i uredan način.

Kako radi?

Skladište podataka izvlačilo bi informacije iz više izvora podataka i formata kao što su tekstualne datoteke, Excel list, multimedijske datoteke itd.

Izvađeni podaci se čiste i transformiraju. Podaci se učitavaju na OLAP poslužitelj (ili OLAP kocku) gdje se podaci unaprijed izračunavaju za daljnju analizu.

Osnovne analitičke operacije OLAP-a

Četiri vrste analitičkih operacija u OLAP-u su:

  1. Zamotavanje
  2. Bušiti u dubinu
  3. Narežite na kockice
  4. Zakretanje (zakretanje)

1) Sažimanje:

Zbirka je također poznata kao "konsolidacija" ili "agregacija". Operacija namotavanja može se izvesti na 2 načina

  1. Smanjivanje dimenzija
  2. Penjanje hijerarhije koncepta. Hijerarhija koncepta je sustav grupiranja stvari na temelju njihovog redoslijeda ili razine.

Razmotrite sljedeći dijagram

  • U ovom primjeru, gradovi New jersey i Lost Angles i ušli u zemlju SAD
  • Broj prodaje New Jerseya i Los Angelesa iznosi 440, odnosno 1560. Postaju 2000 nakon roll-upa
  • U ovom procesu agregacije, podaci se hijerarhija lokacija pomiče prema gore od grada do zemlje.
  • U postupku savijanja potrebno je ukloniti barem jednu ili više dimenzija. U ovom se primjeru uklanja dimenzija Quater.

2) Izbušivanje

U detaljnim detaljima podaci su fragmentirani na manje dijelove. Suprotno je procesu skupnog postupka. To se može učiniti putem

  • Pomicanje prema hijerarhiji koncepta
  • Povećavanje dimenzije

Razmotrite gornji dijagram

  • Kvartal Q1 raščlanjen je na mjesece siječanj, veljaču i ožujak. Odgovarajuće prodaje također su registri.
  • U ovom se primjeru dodaju dimenzijski mjeseci.

3) Kriška:

Ovdje se odabire jedna dimenzija i stvara se nova podkocka.

Sljedeći dijagram objašnjava kako je izvedena operacija rezanja:

  • Vrijeme dimenzije odrezano je s Q1 kao filtrom.
  • Sveukupno se stvara nova kocka.

Kocke:

Ova je operacija slična kriški. Razlika u kockama je u tome što odaberete 2 ili više dimenzija koje rezultiraju stvaranjem podkocke.

4) Pivot

U Pivotu rotirate osi podataka kako biste pružili zamjenski prikaz podataka.

U sljedećem primjeru, osovina se temelji na vrstama predmeta.

Vrste OLAP sustava

OLAP-ova hijerarhijska struktura

Vrsta OLAP-a Obrazloženje
Relacijski OLAP (ROLAP): ROLAP je prošireni RDBMS zajedno s višedimenzionalnim mapiranjem podataka za obavljanje standardne relacijske operacije.
Višedimenzionalni OLAP (MOLAP) MOLAP implementira operaciju u višedimenzionalnim podacima.
Hibridna mrežna analitička obrada (HOLAP) U pristupu HOLAP, agregirani ukupni iznosi pohranjuju se u višedimenzionalnu bazu podataka, dok se detaljni podaci pohranjuju u relacijsku bazu podataka. Ovo nudi i podatkovnu učinkovitost ROLAP modela i performanse MOLAP modela.
OLAP za radnu površinu (DOLAP) U OLAP-u za radnu površinu korisnik preuzima dio podataka iz baze podataka lokalno ili sa svoje radne površine i analizira ih. DOLAP je relativno jeftiniji za primjenu, jer nudi vrlo malo funkcionalnosti u usporedbi s drugim OLAP sustavima.
Web OLAP (WOLAP) Web OLAP koji je OLAP sustav dostupan putem web preglednika. WOLAP je troslojna arhitektura. Sastoji se od tri komponente: klijenta, posredničkog softvera i poslužitelja baze podataka.
Mobilni OLAP: Mobilni OLAP pomaže korisnicima da pristupe i analiziraju OLAP podatke pomoću svojih mobilnih uređaja
Prostorni OLAP: SOLAP je stvoren za olakšavanje upravljanja prostornim i neprostornim podacima u Geografskom informacijskom sustavu (GIS)

ROLAP

ROLAP radi s podacima koji postoje u relacijskoj bazi podataka. Činjenice i tablice dimenzija pohranjuju se kao relacijske tablice. Također omogućuje višedimenzionalnu analizu podataka i OLAP je najbrže rastući.

Prednosti ROLAP modela:

  • Visoka učinkovitost podataka. Nudi visoku učinkovitost podataka jer su izvedba upita i jezik pristupa optimizirani posebno za višedimenzionalnu analizu podataka.
  • Skalabilnost. Ova vrsta OLAP sustava nudi skalabilnost za upravljanje velikim količinama podataka, čak i kad se podaci neprestano povećavaju.

Nedostaci ROLAP modela:

  • Potražnja za višim resursima: ROLAP treba visoku iskorištenost radne snage, softvera i hardverskih resursa.
  • Ukupna ograničenja podataka. Alati ROLAP koriste SQL za sve izračune agregatnih podataka. Međutim, ne postoje ograničena ograničenja za rukovanje proračunima.
  • Spora izvedba upita. Izvedba upita u ovom modelu je spora u usporedbi s MOLAP-om

MOLAP

MOLAP koristi višedimenzionalne mehanizme za pohranu temeljene na nizu za prikaz višedimenzionalnih prikaza podataka. U osnovi koriste OLAP kocku.

Ovdje saznajte više o OLAP-u

Hibridni OLAP

Hibridni OLAP mješavina je i ROLAP-a i MOLAP-a. Nudi brzo izračunavanje MOLAP-a i veću skalabilnost ROLAP-a. HOLAP koristi dvije baze podataka.

  1. Agregirani ili izračunati podaci pohranjuju se u višedimenzionalnu OLAP kocku
  2. Detaljne informacije pohranjuju se u relacijsku bazu podataka.

Prednosti hibridnog OLAP-a:

  • Ovakav OLAP pomaže uštedjeti prostor na disku, a također ostaje kompaktan što pomaže u izbjegavanju problema vezanih uz brzinu i praktičnost pristupa.
  • Hibridni HOLAP koristi tehnologiju kockica koja omogućuje brže performanse za sve vrste podataka.
  • ROLAP se trenutno ažuriraju, a korisnici HOLAP-a imaju pristup ovim trenutačno ažuriranim podacima u stvarnom vremenu. MOLAP donosi čišćenje i pretvaranje podataka, čime se poboljšava relevantnost podataka. Ovo donosi najbolje iz oba svijeta.

Nedostaci hibridnog OLAP-a:

  • Veća razina složenosti : Glavni nedostatak HOLAP sustava je taj što podržava i ROLAP i MOLAP alate i programe. Stoga je vrlo komplicirano.
  • Potencijalna preklapanja : Veće su šanse za preklapanje, posebno u njihovim funkcionalnostima.

Prednosti OLAP-a

  • OLAP je platforma za sve vrste poslovanja, uključujući planiranje, izradu proračuna, izvještavanje i analizu.
  • Podaci i izračuni su dosljedni u OLAP kocki. To je presudna korist.
  • Brzo izradite i analizirajte scenarije "Što ako"
  • Jednostavno pretražujte OLAP bazu podataka za široke ili specifične pojmove.
  • OLAP pruža gradivne blokove za alate za poslovno modeliranje, alate za rudarenje podataka i alate za izvještavanje o izvedbi.
  • Omogućuje korisnicima da rade kockice i kockice podataka svih različitih dimenzija, mjera i filtara.
  • Dobar je za analizu vremenskih serija.
  • Pronalaženje nekih klastera i odstupanja lako je uz OLAP.
  • To je moćan vizualni mrežni analitički procesni sustav koji omogućuje brže vrijeme odziva

Mane OLAP-a

  • OLAP zahtijeva organiziranje podataka u shemu zvijezde ili pahuljice. Te su sheme složene za implementaciju i upravljanje
  • Ne možete imati velik broj dimenzija u jednoj OLAP kocki
  • Transakcijskim podacima nije moguće pristupiti OLAP sustavom.
  • Svaka izmjena u OLAP kocki treba potpuno ažuriranje kocke. Ovo je dugotrajan proces

Sažetak:

  • OLAP je tehnologija koja analitičarima omogućuje izdvajanje i prikaz poslovnih podataka s različitih gledišta.
  • U osnovi OLAP koncepta je OLAP kocka.
  • Različite poslovne aplikacije i druge podatkovne operacije zahtijevaju upotrebu OLAP kocke.
  • U OLAP-u postoji pet primarnih analitičkih operacija 1) Zbiranje 2) Smanjivanje 3) Rez 4) Kockice i 5) Pivot
  • Tri vrste široko korištenih OLAP sustava su MOLAP, ROLAP i Hybrid OLAP.
  • Desktop OLAP, Web OLAP i Mobile OLAP neke su druge vrste OLAP sustava.