V tomto výukovém programu lze sledovat operace s tabulkami, jako je vytváření, úpravy a vypouštění tabulek v Hive.
Na níže uvedeném snímku obrazovky vytváříme tabulku se sloupci a měníme název tabulky.
1. Vytvoření tabulky guru_sample se dvěma názvy sloupců, například „empid“ a „empname“
2. Zobrazení tabulek v databázi guru99
3. Guru_sample zobrazování pod tabulkami
4. Změna tabulky „guru_sample“ jako „guru_sampleNew“
5. Opět při spuštění příkazu „show“ se zobrazí nový název Guru_sampleNew
Dropping table guru_sampleNew:
Typy tabulek a jejich použití:
Přichází k tabulkám , je to jako způsob, který vytváříme v tradičních relačních databázích. Na tabulkách lze provádět funkce, jako je filtrování, spojení.
Hive se zabývá dvěma typy struktur tabulek, jako jsou interní a externí tabulky, v závislosti na načtení a návrhu schématu v Hive.
Interní tabulky
- Interní tabulka je v podstatě úzce spjata. V tomto typu tabulky nejprve musíme vytvořit tabulku a načíst data.
- Můžeme to nazvat jako data ve schématu .
- Upuštěním této tabulky budou odstraněna data i schéma.
- Uložené umístění této tabulky bude na / user / hive / warehouse.
Kdy zvolit interní tabulku:
- Pokud je zpracování dat k dispozici v místním systému souborů
- Pokud chceme, aby Hive spravoval kompletní životní cyklus dat včetně mazání
Ukázkový fragment kódu pro interní tabulku
1. Vytvoření interní tabulky
Hive>CREATE TABLE guruhive_internaltable (id INT,Name STRING);Row format delimitedFields terminated by '\t';
2. Vložte data do interní tabulky
Hive>LOAD DATA INPATH '/user/guru99hive/data.txt' INTO table guruhive_internaltable;
3. Zobrazte obsah tabulky
Hive>select * from guruhive_internaltable;
4. Chcete-li zrušit vnitřní stůl
Hive>DROP TABLE guruhive_internaltable;
Pokud jste zahodili tabulku guruhive_internaltable, včetně jejích metadat a jejích dat budou z Úlu odstraněny.
Na následujícím snímku obrazovky můžeme sledovat výstup
Ve výše uvedeném kódu a ze snímku obrazovky provádíme následující věci,
- Vytvořte interní tabulku
- Načtěte data do interní tabulky
- Zobrazit obsah tabulky
- Chcete-li zrušit vnitřní stůl
Externí tabulky
- Externí stůl je v přírodě volně spojený. Data budou k dispozici v HDFS. Tabulka se bude vytvářet na datech HDFS.
- Jinak můžeme říci, jako by to bylo vytvoření schématu na datech .
- V době přetažení tabulky upustí pouze schéma, data budou stále k dispozici v HDFS jako dříve.
- Externí tabulky poskytují možnost vytvořit více schémat pro data uložená v HDFS místo mazání dat pokaždé, když se schéma aktualizuje
Kdy zvolit externí tabulku:
- Pokud je zpracování dat dostupné v HDFS
- Užitečné, když se soubory používají mimo Hive
Ukázkový fragment kódu pro externí tabulku
1. Vytvořte externí tabulku
Hive>CREATE EXTERNAL TABLE guruhive_external(id INT,Name STRING)Row format delimitedFields terminated by '\t'LOCATION '/user/guru99hive/guruhive_external;
2. Pokud v době vytváření tabulky neurčujeme umístění, můžeme data načíst ručně
Hive>LOAD DATA INPATH '/user/guru99hive/data.txt' INTO TABLE guruhive_external;
3. Zobrazte obsah tabulky
Hive>select * from guruhive_external;
4. Chcete-li zrušit vnitřní stůl
Hive>DROP TABLE guruhive_external;
Z následujícího snímku obrazovky můžeme sledovat výstup
Ve výše uvedeném kódu provádíme následující věci
- Vytvořte externí tabulku
- Načtěte data do externí tabulky
- Zobrazit obsah tabulky
- Zrušení externí tabulky
Rozdíl mezi interními vs externími tabulkami
Vlastnosti | Vnitřní | Externí |
---|---|---|
Schéma | Údaje o schématu | Schéma na datech |
Umístění skladu | / usr / úl / sklad | Umístění HDFS |
Dostupnost dat | V místním systému souborů | V rámci HDFS |