Vytvoření úlu, změna & Drop tabulka

Obsah:

Anonim

V tomto výukovém programu lze sledovat operace s tabulkami, jako je vytváření, úpravy a vypouštění tabulek v Hive.

Na níže uvedeném snímku obrazovky vytváříme tabulku se sloupci a měníme název tabulky.

1. Vytvoření tabulky guru_sample se dvěma názvy sloupců, například „empid“ a „empname“

2. Zobrazení tabulek v databázi guru99

3. Guru_sample zobrazování pod tabulkami

4. Změna tabulky „guru_sample“ jako „guru_sampleNew“

5. Opět při spuštění příkazu „show“ se zobrazí nový název Guru_sampleNew

Dropping table guru_sampleNew:

Typy tabulek a jejich použití:

Přichází k tabulkám , je to jako způsob, který vytváříme v tradičních relačních databázích. Na tabulkách lze provádět funkce, jako je filtrování, spojení.

Hive se zabývá dvěma typy struktur tabulek, jako jsou interní a externí tabulky, v závislosti na načtení a návrhu schématu v Hive.

Interní tabulky

  • Interní tabulka je v podstatě úzce spjata. V tomto typu tabulky nejprve musíme vytvořit tabulku a načíst data.
  • Můžeme to nazvat jako data ve schématu .
  • Upuštěním této tabulky budou odstraněna data i schéma.
  • Uložené umístění této tabulky bude na / user / hive / warehouse.

Kdy zvolit interní tabulku:

  • Pokud je zpracování dat k dispozici v místním systému souborů
  • Pokud chceme, aby Hive spravoval kompletní životní cyklus dat včetně mazání

Ukázkový fragment kódu pro interní tabulku

1. Vytvoření interní tabulky

 Hive>CREATE TABLE guruhive_internaltable (id INT,Name STRING);Row format delimitedFields terminated by '\t';

2. Vložte data do interní tabulky

 Hive>LOAD DATA INPATH '/user/guru99hive/data.txt' INTO table guruhive_internaltable;

3. Zobrazte obsah tabulky

 Hive>select * from guruhive_internaltable;

4. Chcete-li zrušit vnitřní stůl

 Hive>DROP TABLE guruhive_internaltable;

Pokud jste zahodili tabulku guruhive_internaltable, včetně jejích metadat a jejích dat budou z Úlu odstraněny.

Na následujícím snímku obrazovky můžeme sledovat výstup

Ve výše uvedeném kódu a ze snímku obrazovky provádíme následující věci,

  • Vytvořte interní tabulku
  • Načtěte data do interní tabulky
  • Zobrazit obsah tabulky
  • Chcete-li zrušit vnitřní stůl

Externí tabulky

  • Externí stůl je v přírodě volně spojený. Data budou k dispozici v HDFS. Tabulka se bude vytvářet na datech HDFS.
  • Jinak můžeme říci, jako by to bylo vytvoření schématu na datech .
  • V době přetažení tabulky upustí pouze schéma, data budou stále k dispozici v HDFS jako dříve.
  • Externí tabulky poskytují možnost vytvořit více schémat pro data uložená v HDFS místo mazání dat pokaždé, když se schéma aktualizuje

Kdy zvolit externí tabulku:

  • Pokud je zpracování dat dostupné v HDFS
  • Užitečné, když se soubory používají mimo Hive

Ukázkový fragment kódu pro externí tabulku

1. Vytvořte externí tabulku

Hive>CREATE EXTERNAL TABLE guruhive_external(id INT,Name STRING)Row format delimitedFields terminated by '\t'LOCATION '/user/guru99hive/guruhive_external;

2. Pokud v době vytváření tabulky neurčujeme umístění, můžeme data načíst ručně

 Hive>LOAD DATA INPATH '/user/guru99hive/data.txt' INTO TABLE guruhive_external;

3. Zobrazte obsah tabulky

 Hive>select * from guruhive_external;

4. Chcete-li zrušit vnitřní stůl

 Hive>DROP TABLE guruhive_external;

Z následujícího snímku obrazovky můžeme sledovat výstup

Ve výše uvedeném kódu provádíme následující věci

  • Vytvořte externí tabulku
  • Načtěte data do externí tabulky
  • Zobrazit obsah tabulky
  • Zrušení externí tabulky

Rozdíl mezi interními vs externími tabulkami

Vlastnosti Vnitřní Externí
Schéma Údaje o schématu Schéma na datech
Umístění skladu / usr / úl / sklad Umístění HDFS
Dostupnost dat V místním systému souborů V rámci HDFS