Top 30 dotazů na rozhovor s Hbase & Odpovědi

Anonim

Stáhnout PDF

Níže jsou uvedeny často kladené otázky v rozhovorech pro nováčky i zkušené vývojáře HBase.

1) Vysvětlete, co je Hbase?

Hbase je sloupově orientovaný systém pro správu databází, který běží nad HDFS (Hadoop Distribute File System). Hbase není úložiště relačních dat a nepodporuje jazyk strukturovaných dotazů, jako je SQL.

V Hbase reguluje hlavní uzel servery klastru a oblasti tak, aby ukládaly části tabulek, a pracuje s daty.

2) Vysvětlete, proč používat Hbase?

  • Vysokokapacitní úložný systém
  • Distribuovaný design pro zásobování velkých stolů
  • Sloupově orientované obchody
  • Horizontálně škálovatelné
  • Vysoký výkon a dostupnost
  • Základním cílem Hbase jsou miliony sloupců, tisíce verzí a miliardy řádků
  • Na rozdíl od HDFS (Hadoop Distribute File System) podporuje náhodné operace CRUD v reálném čase

3) Uveďte, jaké jsou klíčové komponenty Hbase?

  • Zookeeper: Provádí koordinační práci mezi klientem a Hbase Maserem
  • Hbase Master: Hbase Master sleduje Region Server
  • RegionServer: RegionServer monitoruje Region
  • Region: Obsahuje v úložišti dat paměti (MemStore) a Hfile.
  • Katalogové tabulky: Katalogové tabulky se skládají z ROOT a META

4) Vysvětlete, z čeho se skládá Hbase?

  • Hbase se skládá ze sady tabulek
  • A každá tabulka obsahuje řádky a sloupce jako tradiční databáze
  • Každá tabulka musí obsahovat prvek definovaný jako primární klíč
  • Sloupec Hbase označuje atribut objektu

5) Uveďte, kolik provozních příkazů v Hbase?

Provozní příkaz v Hbase je asi pět typů

  • Dostat
  • Dát
  • Vymazat
  • Skenovat
  • Přírůstek

6) Vysvětlete, co je WAL a Hlog v Hbase?

WAL (Write Ahead Log) je podobný protokolu MySQL BIN; zaznamenává všechny změny, ke kterým dochází v datech. Jedná se o standardní sekvenční soubor Hadoop a ukládá HLogkey. Tyto klíče se skládají ze sekvenčního čísla i skutečných dat a používají se k přehrávání dosud nepřetrvávajících dat po havárii serveru. Takže v hotovosti za selhání serveru pracuje WAL jako záchranná linka a načítá ztracená data.

7) Kdy byste měli používat Hbase?

  • Velikost dat je obrovská: Když máte k dispozici tuny a miliony záznamů
  • Complete Redesign: When you are moving RDBMS to Hbase, you Považovat to za kompletní re-design pak pouhá změna portů
  • Příkazy bez SQL: Máte několik funkcí, jako jsou transakce; vnitřní spojení, zadané sloupce atd.
  • Investice do infrastruktury: Abyste mohli Hbase být opravdu užiteční, musíte mít dostatek clusteru

8) Co je v Hbase co do skupin sloupců?

Skupiny sloupců tvoří základní jednotku fyzického úložiště v Hbase, na které jsou aplikovány funkce jako komprese.

9) Vysvětlete, co je klíč řádku?

Klíč řádku je definován aplikací. Jelikož je kombinovaný klíč předem fixován řádkovým klíčem, umožňuje aplikaci definovat požadované pořadí řazení. Umožňuje také logické seskupení buněk a ujistěte se, že všechny buňky se stejným řádkovým klíčem jsou umístěny společně na stejném serveru.

10) Vysvětlete deleci v Hbase? Uveďte, jaké jsou tři typy značek náhrobků v Hbase?

Když odstraníte buňku v Hbase, data se ve skutečnosti neodstraní, ale nastaví se značka náhrobku, čímž odstraněné buňky budou neviditelné. Odstranění Hbase je ve skutečnosti odstraněno během zhutňování.

Existují tři typy značek náhrobků:

  • Značka odstranění verze: Pro odstranění označí jednu verzi sloupce
  • Značka pro odstranění sloupce: Pro odstranění označí všechny verze sloupce
  • Značka pro mazání rodiny: Pro smazání označí celý sloupec pro rodinu sloupců

11) Vysvětlete, jak vlastně Hbase odstraní řádek?

V Hbase bude vše, co napíšete, uloženo z RAM na disk, tyto zápisy na disk jsou neměnným blokovacím zhutněním. Během procesu mazání v Hbase značka značného procesu zhutnění odstraní, zatímco menší zhutnění nikoli. Při normálním mazání má za následek odstranění značky náhrobku - tato data mazání, která představují, jsou odstraněna během zhutňování.

Také pokud odstraníte data a přidáte více dat, ale s dřívějším časovým razítkem než časovým razítkem náhrobku, další Gets může být maskován značkou delete / tombstone, a proto nedostanete vloženou hodnotu až po hlavním zhutnění.

12) Vysvětlete, co se stane, když změníte velikost bloku rodiny sloupců v již obsazené databázi?

Když změníte velikost bloku rodiny sloupců, nová data zabírají novou velikost bloku, zatímco stará data zůstávají ve staré velikosti bloku. Během zhutňování dat budou stará data mít novou velikost bloku. Nové soubory, jakmile jsou vyprázdněny, mají novou velikost bloku, zatímco stávající data budou i nadále správně čtena. Všechna data by měla být po dalším velkém zhutnění transformována na novou velikost bloku.

13) Uveďte rozdíl mezi Hbase a relační databází?

Hbase Relační databáze
  • Je to bez schémat
  • Jedná se o datové úložiště orientované na sloupce
  • Používá se k ukládání normalizovaných dat
  • Obsahuje řídce osídlené tabulky
  • Automatické dělení se děje v Hbase
  • Je to databáze založená na schématu
  • Je to řádkově orientované úložiště dat
  • Používá se k ukládání normalizovaných dat
  • Obsahuje tenké tabulky
  • Neexistuje žádné takové ustanovení ani integrovaná podpora pro dělení na oddíly

14) Co je třída HBaseFsck?

V nástroji HBase je k dispozici název nástroje s názvem zpět, který je implementován třídou HBaseFsck. Nabízí několik přepínačů příkazového řádku, které ovlivňují jeho chování.

15) Jaké jsou hlavní klíčové struktury HBase?

Klíč řádku a klíč sloupce jsou dvě nejdůležitější klíčové struktury, které se v HBase používají

16) Diskutujte o tom, jak můžete použít filtry v Apache HBase

Filtry v prostředí HBase. Byl představen v Apache HBase 0.92, který vám pomůže provádět filtrování na straně serveru pro přístup k HBase přes prostředí HBase nebo šetrnost.

17) HBase podporuje strukturu syntaxe jako SQL ano nebo ne?

Ne, bohužel momentálně není k dispozici podpora SQL pro HBase. Pomocí Apache Phoenix však můžeme načítat data z HBase prostřednictvím dotazů SQL.

18) Jaký je význam zhutnění v HBase?

V době těžkých příchozích zápisů je nemožné dosáhnout optimálního výkonu tím, že budete mít v jednom úložišti jeden soubor. HBase vám pomůže kombinovat všechny tyto soubory HF, abyste snížili počet semen disku pro každé čtení. Tento proces se nazývá zhutnění v HBase.

19) Jak budete implementovat spojení v HBase?

HBase, nepodporuje spojení přímo, ale používá MapReduce úlohy, dotazy na spojení lze implementovat načtením dat pomocí různých tabulek HBase.

20) Vysvětlete JMX týkající se HBSE

Java Management Extensions nebo JMX je stav exportu aplikací Java je pro ně standardem.

21) Jaké je použití MasterServeru?

Master sever vám také pomůže přiřadit region k regionálnímu serveru. Pomůže vám také zvládnout vyrovnávání zatížení, které používáme MasterServer.

22) Definujte termínovou šetrnost

Apache Thrift je napsán v C ++. Poskytuje překladače schémat pro různé programovací jazyky, jako je C ++, Perl, PHP, Python, Ruby a další.

23) Proč používat třídu HColumnDescriptor?

Podrobnosti týkající se rodiny sloupců, jako je nastavení komprese, počet verzí, jsou uloženy v HColumnDescriptor.

24) Co je to buňka v HBase?

Buňka v HBase je nejmenší jednotka tabulky Hbase. Pomůže vám uchovávat část dat ve formě n-tice {řádek, sloupec, verze}

25) Co je Bloomův filtr?

HBase podporuje Bloom Filter vám pomůže zlepšit celkovou propustnost klastru. Filtr HBase Bloom je prostorově efektivní mechanismus k testování, zda soubor HFile obsahuje určitou buňku řádku nebo řádku.

26) Povězte mi o typech operací HBase?

Ans. Dva typy operací HBase jsou:

  • Přečíst operaci
  • Zápis operace

27) Jaké je použití HBase HMaster?

Hlavní povinnosti velitele jsou:

  1. Koordinace regionálních serverů
  2. Funkce správce

28) Jakou techniku ​​můžete použít v HBase pro přímý přístup k HFile bez pomoci HBase?

Pro přímý přístup k HFile bez použití HBase používáme metodu HFile.main ().

29) Může být server regionu umístěn na všech DataNodes?

Ano, regionální servery běží na stejných serverech jako DataNodes

30) Pojmenujte filtr, který přijímá velikost stránky jako parametr v HBase

Filtr s názvem PageFilter přijímá velikost stránky jako parametr.

Tento dokument byl vytvořen pomocí nástrojů pro okamžitý převod HTML.