Top 50 dotazů na rozhovor s Teradata & Odpovědi

Anonim

Stáhnout PDF

1) Jak definujete Teradata? Uveďte některé z jejich hlavních charakteristik.

Teradata je v podstatě RDMS, který se používá k pohonu společností Datamart, Datawarehouse, OLAP, OLTP a DSS. Některé z hlavních charakteristik Teradata jsou uvedeny níže.

  • Je schopen provozu jak na jednom uzlu, tak i na více uzlech.
  • V systému je zabudován paralelismus.
  • Velmi kompatibilní s normami ANSI.
  • Má sklon chovat se stejně jako server.
  • Jedná se o otevřený systém, který se v zásadě provádí pro UNIX MR-RAS, Suse Linux ETC, WIN2K atd.

2) Jaké jsou nově vyvinuté funkce Teradata?

Některé z nově vyvinutých funkcí Teradata jsou: -

  • Automatizovaná časová analýza
  • Rozšíření možností komprese, které umožňuje flexibilní kompresi dat přibližně 20krát více dat než předchozí verze.
  • Inovace spojené se zákazníkem, jako je hledisko tetradata.

3) Zvýrazněte několik důležitých komponent Teradata.

Některé z důležitých komponent Teradata jsou: -

  • Bynet
  • Procesor přístupového modulu (AMP)
  • Analýza motoru (PE)
  • Virtuální disk (vDisk)
  • Virtuální úložný systém (VSS)

4) Uveďte postup, kterým můžeme spouštět úlohy Teradata v prostředí UNIX.

Jediné, co musíte udělat, je provést spuštění v systému UNIX způsobem, jak je uvedeno níže.

$ Sh> BTEQ <[Cesta skriptu]> [Cesta logického souboru]

nebo

$ Sh> BTEQ <[cesta skriptu] TEE [cesta souboru protokolu]

5) Jak v Teradata generujeme sekvenci?

V Teradata generujeme sekvenci pomocí sloupce identity

6) Jak je během doby zobrazení vytvořena sekvence Teradata?

Jediné, co musíte udělat, je použít CSUM.

7) Na stůl je kladeno určité zatížení a to také každou hodinu. Ráno je provoz relativně nízký a v noci velmi vysoký. Podle této situace, který je nejvhodnější nástroj a jak má být tento nástroj načten?

Nejvhodnějším nástrojem zde musí být Tpump. Využitím zmenšování nebo zvětšování velikosti paketu lze provoz snadno zvládnout.

8) Pokud selže program Fast Load Script a budete mít k dispozici pouze tabulky chyb, jak se restartuje?

V tomto případě existují v zásadě dva způsoby restartování.

  • Spuštění starého souboru - Ujistěte se, že zcela nezrušíte chybové tabulky. Místo toho zkuste opravit chyby, které jsou ve skriptu nebo souboru, a poté proveďte znovu.
  • Spuštění nového souboru - V tomto procesu je skript spuštěn jednoduše pomocí příkazů načtení konce a začátku. To pomůže při odebrání zámku, který byl vložen do cílové tabulky, a může také odebrat daný záznam z tabulky rychlého protokolu. Jakmile to uděláte, můžete celý skript znovu spustit.

9) Uveďte několik nástrojů ETL, které spadají pod Teradata.

Některé z nástrojů ETL, které se běžně používají v Teradata, jsou DataStage, Informatica, SSIS atd.

10) Zvýrazněte několik výhod, které mají nástroje ETL oproti TD.

Některé z výhod, které mají nástroje ETL oproti TD, jsou: -

  • Lze provozovat více heterogenních cílů i zdrojů.
  • Proces ladění je díky nástrojům ETL mnohem jednodušší díky plnohodnotné podpoře grafického uživatelského rozhraní.
  • Komponenty nástrojů ETL lze snadno znovu použít a ve výsledku, pokud dojde k aktualizaci hlavního serveru, budou automaticky aktualizovány všechny odpovídající aplikace připojené k serveru.
  • Otočení a otočení lze snadno provést pomocí nástrojů ETL.

11) Jaký je význam ukládání do mezipaměti v Teradata?

Ukládání do mezipaměti je považováno za další výhodu používání Teradata, protože pracuje primárně se zdrojem, který zůstává ve stejném pořadí, tj. Se často nemění. Někdy je mezipaměť obvykle sdílena mezi aplikacemi.

12) Jak můžeme zkontrolovat verzi Teradata, kterou aktuálně používáme?

Stačí zadat příkaz .HOW VERSION.

13) Uveďte oprávněný důvod, proč Multi-load podporuje NUSI místo USI.

Řádek podtabulky indexu se stane ve stejném zesilovači stejným způsobem jako datový řádek v NUSI. Každý zesilovač je tedy provozován samostatně a paralelně.

14) Jak se po spuštění restartuje klientský systém MLOAD?

Skript musí být odeslán ručně, aby mohl snadno načíst data z kontrolního bodu, který přijde jako poslední.

15) Jak se po spuštění restartuje server MLOAD Teradata?

Proces se v zásadě provádí od posledního známého kontrolního bodu a po provedení dat po provedení skriptu MLOAD se server restartuje.

16) Co se rozumí uzlem?

Uzel je v zásadě označován jako sortiment součástí hardwaru a softwaru. Server se obvykle označuje jako uzel.

17) Řekněme, že existuje soubor, který se skládá ze 100 záznamů, z nichž musíme přeskočit prvních a posledních 20 záznamů. Co bude fragment kódu?

K provedení tohoto úkolu musíme použít BTEQ Utility. Ve skriptu bude použito přeskočení 20, stejně jako opakování 60.

18) Vysvětlete PDE.

PDE v zásadě znamená Parallel Data Extension. PDE v zásadě představuje vrstvu rozhraní softwaru přítomného nad operačním systémem a dává databázi šanci pracovat v paralelním prostředí.

19) Co je to TPD?

TPD v zásadě znamená Trusted Parallel Database a v zásadě funguje pod PDE. Teradata je databáze, která primárně pracuje pod PDE. To je důvod, proč se Teradata obvykle označuje jako důvěryhodná paralelní nebo čistě paralelní databáze.

20) Co se rozumí ovladačem kanálu?

Ovladač kanálu je software, který funguje jako médium komunikace mezi PE a všemi aplikacemi, které běží na kanálech připojených ke klientům.

21) Co je míněno bránou Teradata?

Stejně jako ovladač kanálu funguje Teradata Gateway jako médium komunikace mezi Parse Engine a aplikacemi, které jsou připojeny k síťovým klientům. Každému uzlu je přiřazena pouze jedna brána.

22) Co se rozumí virtuálním diskem?

Virtual Disk je v podstatě kompilace celé řady válců, které jsou fyzickými disky. Někdy se označuje jako diskové pole.

23) Vysvětlete význam Amp?

Amp v podstatě znamená Access Module Processor a shodou okolností je to procesor, který pracuje prakticky a v zásadě se používá ke správě jedné části databáze. Tuto konkrétní část databáze nemůže sdílet žádný jiný zesilovač. Tato forma architektury se tedy běžně označuje jako architektura bez sdílení.

24) Co obsahuje Amp a jaké jsou všechny operace, které provádí?

Amp se v zásadě skládá ze subsystému správce databází a je schopen provádět níže uvedené operace.

  • Provádění DML
  • Provádění DDL
  • Implementace agregací a připojení.
  • Uvolnění a použití zámků atd.

25) Co se rozumí analýzou motoru?

PE je shodou okolností laskavý Vproc. Jeho primární funkcí je přijímat požadavky SQL a doručovat odpovědi v SQL. Skládá se z široké škály softwarových komponent, které se používají k rozdělení SQL do různých kroků a následnému odeslání těchto kroků na stránky AMP.

26) Co myslíte analýzou?

Analýza je proces zabývající se analýzou symbolů řetězce, které jsou buď v počítačovém jazyce, nebo v přirozeném jazyce.

27) Jaké jsou funkce analyzátoru?

Analyzátor: -

  • Zkontroluje sémantické chyby
  • Zkontroluje syntaktické chyby
  • Zkontroluje existenci objektu

28) Co se rozumí dispečerem?

Dispečer vezme celou kolekci požadavků a poté je uloží do fronty. Po celou dobu procesu se udržuje stejná fronta, aby bylo možné doručit více sad odpovědí.

29) Kolik relací MAX dokáže PE zvládnout v určitou dobu?

PE zvládne celkem 120 relací v určitém okamžiku.

30) Vysvětlete BYNET.

BYNET v zásadě slouží jako prostředek komunikace mezi komponentami. Je primárně zodpovědný za odesílání zpráv a je také zodpovědný za provádění slučování a třídění.

31) Co se rozumí klikou?

O Clique je v zásadě známo, že je to uzel, který je sdílen mezi běžnými diskovými jednotkami. Přítomnost Clique je nesmírně důležitá, protože pomáhá předcházet poruchám uzlů.

32) Co se stane, když uzel utrpí pád?

Kdykoli dojde k poklesu úrovně výkonu uzlu, všechny odpovídající Vprocs okamžitě migrují na nový uzel z uzlu selhání, aby získala všechna data zpět z běžných jednotek.

33) Seznam všech forem ZÁMKŮ, které jsou k dispozici v Teradata.

V zásadě existují čtyři typy ZÁMKŮ, které spadají pod Teradata. Tyto jsou: -

  • Číst zámek
  • Zámek přístupu
  • Exkluzivní zámek
  • Zapsat zámek

34) Jaká je konkrétně určená úroveň, na které se LOCK pravděpodobně použije v Teradata?

  • Úroveň tabulky - Všechny řádky, které jsou uvnitř tabulky, budou jistě uzamčeny.
  • Uzamčení úrovně databáze - všechny objekty, které jsou uvnitř databáze, budou uzamčeny.
  • Lock Hash Level Lock - Budou uzamčeny pouze ty řádky, které odpovídají konkrétnímu řádku.

35) Jaké je skóre v primárním indexu aktivně zapojených stránek AMP?

Pouze jeden AMP je aktivně zapojen do primárního indexu.

36) Jaký je význam příkazu UPSERT v Teradata?

UPSERT v zásadě znamená Update Else Insert. Tato možnost je k dispozici pouze v Teradata.

37) Zvýrazněte výhody PPI (Partition Primary Index).

PPI se v zásadě používá pro účely ukládání dat na základě rozsahu nebo kategorie. Pokud jde o rozsahové dotazy, není potřeba využití skenování celé tabulky, protože se okamžitě přesune na následující oddíl, čímž přeskočí všechny ostatní oddíly.

38) Uveďte velikosti SMALLINT, BYTEINT a INTEGER.

SMALLINT - 2 bajty - 16 kousnutí -> -32768 až 32767

BYTEINT - 1 bajt - 8 bitů -> -128 až 127

INTEGER - 4 bajty - 32 bitů -> -2 147 483 648 až 2 147 483 647

39) Co se rozumí plánem nejméně nákladů?

Plán nejnižších nákladů se v zásadě provádí za kratší dobu po nejkratší cestě.

40) Zvýrazněte body rozdílů mezi databází a uživatelem v Teradata.

  • Databáze je v zásadě pasivní, zatímco uživatel je aktivní.
  • Databáze primárně ukládá všechny objekty databáze, zatímco uživatel může ukládat jakýkoli objekt, ať už jde o makro, tabulku, pohled atd.
  • Databáze nemá heslo, zatímco uživatel musí zadat heslo.

41) Zvýrazněte rozdíly mezi primárním klíčem a primárním indexem.

  • Primární index je zcela povinný, zatímco primární klíč je volitelný.
  • Primární index má limit 64 tabulek / sloupců, zatímco primární klíč nemá žádné omezení.
  • Primární index umožňuje duplikáty a nuly, zatímco primární klíč ne.
  • Primární index je fyzický mechanismus, zatímco primární klíč je čistě logický mechanismus.

42) Vysvětlete, jak se využívá prostor pro zařazování.

Spool space v Teradata se v zásadě používá pro spouštění dotazů. Z celkového prostoru, který je k dispozici v Teradata, je 20% prostoru v zásadě přiděleno prostoru pro zařazování.

43) Zdůrazněte potřebu ladění výkonu.

Ladění výkonu v Teradata se v zásadě provádí k identifikaci všech úzkých míst a jejich následnému vyřešení.

44) Komentujte, zda je problémové místo chybou nebo ne.

Z technického hlediska není úzké místo formou chyby, ale rozhodně způsobuje určité zpoždění systému.

45) Jak lze identifikovat úzká místa?

V zásadě existují čtyři způsoby, jak identifikovat úzké místo. Tyto jsou: -

  • Vizuální vysvětlení teradata
  • Vysvětlete modifikátor požadavku
  • Manažer Teradata
  • Monitorování výkonu

46) Co se rozumí plánem s nejvyššími náklady?

Podle plánu nejvyšších nákladů je doba potřebná k provedení procesu delší a trvá nejdelší dostupnou cestou.

47) Zvýrazněte všechny režimy, které jsou k dispozici v části Úroveň spolehlivosti.

Nízký, Ne, Vysoký a Připojit se jsou čtyři režimy, které jsou k dispozici pod úrovní důvěryhodnosti.

48) Pojmenujte pět fází, které spadají pod MultiLoad Utility.

Předběžná fáze, DML fáze, fáze získávání dat, aplikační fáze a koncová fáze.

49) Zvýrazněte omezení TPUMP Utility.

Omezení nástroje TPUMP jsou následující: -

  • Nemůžeme použít příkaz SELECT.
  • Datové soubory nelze zřetězit.
  • Agregační a exponenciální operátory nejsou podporovány.
  • Aritmetické funkce nelze podporovat.

50) Jak se v BTEQ nastavují parametry relačního režimu?

.set transakce relace BTET -> režim transakcí Teradata

.set transakce relace ANSI -> režim ANSI

Tyto příkazy budou fungovat, pouze pokud budou zadány před přihlášením k relaci.