Top 30 pitanja o intervjuu za Hbase & Odgovori

Anonim

Preuzmite PDF

Slijede često postavljana pitanja u intervjuima za svježe i iskusne programere HBase.

1) Objasnite što je Hbase?

Hbase je sustav upravljanja bazama podataka orijentiran na stupce koji se izvodi na vrhu HDFS-a (Hadoop Distribute File System). Hbase nije relacijska pohrana podataka i ne podržava strukturirani jezik upita poput SQL-a.

U Hbaseu glavni čvor regulira poslužitelje klastera i regije za pohranu dijelova tablica i upravlja radom na podacima.

2) Objasnite zašto koristiti Hbase?

  • Sustav za pohranu velikog kapaciteta
  • Distribuirani dizajn za ugostiteljstvo velikih stolova
  • Trgovine orijentirane na stupce
  • Horizontalno skalabilno
  • Visoke performanse i dostupnost
  • Osnovni cilj Hbasea su milijuni stupaca, tisuće verzija i milijarde redaka
  • Za razliku od HDFS (Hadoop Distribute File System), on podržava slučajne CRUD operacije u stvarnom vremenu

3) Spomenite koje su ključne komponente Hbasea?

  • Čuvar zoološkog vrta : Obavlja koordinacijski posao između klijenta i Hbase Maser
  • Hbase Master: Hbase Master nadzire regionalni poslužitelj
  • RegionServer: RegionServer nadgleda regiju
  • Regija: Sadrži u memoriji memorije podataka (MemStore) i Hfile.
  • Kataloške tablice: Kataloške tablice sastoje se od ROOT-a i META-e

4) Objasnite od čega se sastoji Hbase?

  • Hbase se sastoji od niza tablica
  • I svaka tablica sadrži retke i stupce poput tradicionalne baze podataka
  • Svaka tablica mora sadržavati element definiran kao Primarni ključ
  • Stupac Hbase označava atribut objekta

5) Spomenite koliko operativnih naredbi ima Hbase?

Operativno zapovijedanje u Hbases ima oko pet vrsta

  • Dobiti
  • Staviti
  • Izbrisati
  • Skenirati
  • Prirast

6) Objasnite što su WAL i Hlog u Hbaseu?

WAL (Write Ahead Log) sličan je MySQL BIN zapisu; bilježi sve promjene koje se događaju u podacima. To je standardna datoteka sljedova tvrtke Hadoop i ona pohranjuje HLogkey-jeve. Ti se ključevi sastoje od sekvencijalnog broja kao i od stvarnih podataka i koriste se za ponovnu reprodukciju još uvijek nepodržanih podataka nakon rušenja poslužitelja. Dakle, u gotovini od neuspjeha poslužitelja WAL djeluje kao spas i vraća izgubljene podatke.

7) Kada biste trebali koristiti Hbase?

  • Veličina podataka je ogromna: kada imate na raspolaganju tone i milijune zapisa
  • Kompletni redizajn: Kada premještate RDBMS na Hbase, smatrate to cjelovitim redizajnom, a ne pukom promjenom priključaka
  • Naredbe bez SQL-a: Imate nekoliko značajki poput transakcija; unutarnji spojevi, upisani stupci itd.
  • Ulaganje u infrastrukturu: Morate imati dovoljno klastera da bi Hbase bio stvarno koristan

8) Što su u Hbase obitelji kolona?

Obitelji stupaca čine osnovnu jedinicu fizičke pohrane u Hbaseu na koju se primjenjuju značajke poput kompresije.

9) Objasnite što je ključ retka?

Ključ reda definira aplikacija. Kako je kombinirani ključ unaprijed fiksirao ključ retka, on omogućuje aplikaciji da definira željeni redoslijed sortiranja. Također omogućuje logično grupiranje ćelija i osigurava da su sve stanice s istim ključem redoslijeda smještene na istom poslužitelju.

10) Objasniti brisanje u Hbaseu? Spomenite koje su tri vrste nadgrobnih biljega u Hbaseu?

Kada izbrišete ćeliju u Hbaseu, podaci se zapravo ne brišu, već se postavlja nadgrobni spomenik, čineći izbrisane stanice nevidljivima. Izbrisani Hbase zapravo se uklanjaju tijekom zbijanja.

Postoje tri vrste nadgrobnih biljega:

  • Oznaka za brisanje verzije: Za brisanje označava jednu verziju stupca
  • Oznaka za brisanje stupca: Za brisanje označava sve verzije stupca
  • Oznaka obiteljskog brisanja: za brisanje označava sve stupce za obitelj stupaca

11) Objasnite kako Hbase zapravo briše redak?

U Hbaseu, što god da napišete, pohranit će se iz RAM-a na disk, ta pisanja na disk su nepromjenjiva zbijanja zabrana. Tijekom postupka brisanja u Hbaseu, glavni postupak zbijanja briše oznaku, dok manja zbijanja ne. U uobičajenom brisanju rezultira oznakom za brisanje nadgrobnih spomenika - ovi podaci o brisanju koje predstavljaju uklanjaju se tijekom zbijanja.

Također, ako izbrišete podatke i dodate više podataka, ali s ranijom vremenskom oznakom od vremenske oznake nadgrobnog spomenika, daljnji Dobivači mogu biti maskirani oznakom za brisanje / nadgrobni spomenik i stoga ćete umetnutu vrijednost primiti tek nakon velikog zbijanja.

12) Objasnite što se događa ako promijenite veličinu bloka obitelji stupaca u već zauzetoj bazi podataka?

Kada promijenite veličinu bloka obitelji stupaca, novi podaci zauzimaju novu veličinu bloka, dok stari podaci ostaju unutar stare veličine bloka. Tijekom sabijanja podataka stari podaci poprimit će novu veličinu bloka. Nove datoteke dok se ispiru imaju novu veličinu bloka, dok će se postojeći podaci i dalje ispravno čitati. Svi podaci trebali bi se transformirati u novu veličinu bloka, nakon sljedećeg većeg sabijanja.

13) Spomenite razliku između Hbase i Relacijske baze podataka?

Hbase Relacijska baza podataka
  • Bez sheme
  • To je spremište podataka orijentirano na stupac
  • Koristi se za pohranu denormaliziranih podataka
  • Sadrži rijetko popunjene tablice
  • Automatizirano particioniranje vrši se u Hbaseu
  • To je baza podataka temeljena na shemi
  • To je spremište podataka orijentirano na redove
  • Koristi se za pohranu normaliziranih podataka
  • Sadrži tanke tablice
  • Ne postoji takva odredba niti ugrađena podrška za particioniranje

14) Što je klasa HBaseFsck?

Postoji naziv alata koji se zove back dostupan je u HBaseu, a implementira ga klasa HBaseFsck. Nudi nekoliko prekidača naredbenog retka koji utječu na njegovo ponašanje.

15) Koje su glavne ključne strukture HBase?

Ključ reda i ključ stupca dvije su najvažnije ključne strukture koje se koriste u HBaseu

16) Razgovarajte o tome kako možete koristiti filtre u Apache HBase

Filteri u ljusci HBase. Uveden je u Apache HBase 0.92 koji vam pomaže u provođenju filtriranja na strani poslužitelja za pristup HBaseu preko HBase ljuske ili štedljivosti.

17) Sintaksna struktura podrške za HBase poput SQL-a da ili ne?

Ne, nažalost, SQL podrška za HBase trenutno nije dostupna. Međutim, upotrebom Apache Phoenixa možemo podatke iz HBasea dohvatiti putem SQL upita.

18) Što znači sabijanje u HBase?

U vrijeme velikih dolaznih upisa nemoguće je postići optimalne performanse ako imate jednu datoteku po trgovini. HBase vam pomaže kombinirati sve ove HFilove kako biste smanjili broj sjemena diska za svako čitanje. Taj je postupak poznat kao zbijanje u HBase.

19) Kako ćete implementirati pridruživanja u HBaseu?

HBase, ne podržava spajanje izravno, ali koristi MapReduce zadatke, upiti za pridruživanje mogu se implementirati dohvaćanjem podataka uz pomoć različitih tablica HBase.

20) Objasnite JMX u vezi s HBSE

Proširenja za upravljanje Javaom ili JMX je izvozni status Java aplikacija njihov je standard.

21) Kakva je korist od MasterServera?

Master sever vam pomaže dodijeliti regiju i regionalnom poslužitelju. Također vam pomaže u rješavanju uravnoteženja tereta koji koristimo MasterServer.

22) Definirajte pojam štedljivosti

Apache Thrift napisan je na jeziku C ++. Pruža kompajlere shema za razne programske jezike kao što su C ++, Perl, PHP, Python, Ruby i drugi.

23) Zašto koristiti klasu HColumnDescriptor?

Pojedinosti o obitelji stupaca, poput postavki kompresije, Broj verzija, pohranjuju se u. HColumnDescriptor.

24) Što je stanica u HBaseu?

Stanica u HBase najmanja je jedinica Hbase tablice. Pomaže vam zadržavanje dijela podataka u obliku korice {redak, stupac, verzija}

25) Što je Bloom filter?

HBase podržava Bloom Filter pomaže vam poboljšati ukupnu propusnost klastera. HBase Bloom Filter prostorno je učinkovit mehanizam za ispitivanje uključuje li HFile određene ćelije reda ili stupca.

26) Recite mi o vrstama HBase operacija?

Ans. Dvije su vrste HBase operacija:

  • Pročitajte operaciju
  • Napišite operaciju

27) Koja je korist od HBase HMaster?

Glavne odgovornosti majstora su:

  1. Koordiniranje regionalnih poslužitelja
  2. Administratorske funkcije

28) Koju tehniku ​​možete koristiti u HBaseu za izravni pristup HFileu bez pomoći HBase?

Da bismo izravno pristupili HFileu bez upotrebe HBase, koristimo metodu HFile.main ().

29) Može li se poslužitelj regije nalaziti na svim DataNodes-ima?

Da, Regijski poslužitelji rade na istim poslužiteljima kao DataNodes

30) Nazovite filtar koji prihvaća veličinu stranice kao parametar u HBaseu

Filtar pod nazivom PageFilter prihvaća veličinu stranice kao parametar.

Ovaj je dokument sastavljen s trenutnim alatima za pretvorbu HTML-a.