SAP HANA Architecture, LandScape, Sizing: Complete Tutorial

Obsah:

Anonim

Databáze SAP HANA je platforma pro správu dat zaměřenou na hlavní paměť. Databáze SAP HANA běží na serveru SUSE Linux Enterprises Server a staví na jazyce C ++.

Databázi SAP HANA lze distribuovat na více počítačů.

Výhody SAP HANA jsou uvedeny níže -

  • SAP HANA je užitečná, protože je velmi rychlá díky všem datům načteným do paměti a bez nutnosti načítat data z disku.
  • SAP HANA lze použít pro účely OLAP (online analytické) a OLTP (online transakce) v jedné databázi.

Databáze SAP HANA se skládá ze sady strojů pro zpracování v paměti. Výpočtový stroj je hlavním modulem pro zpracování v paměti v SAP HANA. Funguje s dalším procesorem, jako je relační databázový stroj (modul řádků a sloupců), OLAP engine atd.

Relační databázová tabulka se nachází v úložišti sloupců nebo řádků.

Existují dva typy úložiště pro tabulku SAP HANA.

  1. Úložiště typu řádků (pro tabulku řádků).
  2. Úložiště typu sloupce (pro sloupcovou tabulku).

Textová data a grafová data jsou umístěna v textovém stroji a grafickém stroji. V databázi SAP HANA existuje několik dalších modulů. Data se mohou v těchto enginech ukládat, pokud je k dispozici dostatek místa.

V tomto výukovém programu se naučíte

  • Architektura SAP HANA
  • SAP HANA na šířku
  • Dimenzování SAP HANA

Architektura SAP HANA

Data jsou komprimována různými kompresními technikami (např. Kódování slovníku, kódování délky běhu, řídké kódování, klastrové kódování, nepřímé kódování) v úložišti sloupců SAP HANA.

Když je v SAP HANA dosaženo limitu hlavní paměti, budou z hlavní paměti uvolněny celé databázové objekty (tabulka, pohled atd.), Které nebudou použity, a uloženy na disk.

Tyto názvy objektů jsou definovány sémantikou aplikace a v případě potřeby znovu načteny do hlavní paměti z disku. Za normálních okolností databáze SAP HANA spravuje vykládku a načítání dat automaticky.

Uživatel však může načíst a uvolnit data z jednotlivé tabulky ručně výběrem tabulky ve studiu SAP HANA v příslušném schématu - kliknutím pravým tlačítkem a výběrem možnosti „Vyložit / Načíst“.

Server SAP HANA se skládá z

  1. Indexový server
  2. Preprocesorový server
  3. Jmenný server
  4. Statistický server
  5. Motor XS

  1. Indexový server SAP HANA

    Hlavní server databáze SAP HANA jsou indexové servery. Podrobnosti o každém serveru jsou uvedeny níže -

  • Je to hlavní databázová součást SAP HANA
  • Obsahuje skutečné datové sklady a motor pro zpracování dat.
  • Indexový server zpracovává příchozí příkazy SQL nebo MDX.

Níže je architektura indexového serveru.

Přehled indexového serveru SAP HANA

  • Správce relací a transakcí: Součást relace spravuje relace a připojení pro databázi SAP HANA. Souřadnice správce transakcí a kontrola transakcí.
  • Procesor SQL a MDX: Složka procesoru SQL vyhledává data a odesílá je do vyhledávače, tj. SQL / SQL Script / R / Calc Engine. Procesor MDX zadává dotazy a manipuluje s vícerozměrnými daty (např. Analytické zobrazení v SAP HANA).
  • Stroj SQL / SQL Script / R / Calc: Tato komponenta provádí převod skriptu SQL / SQL a výpočetních dat ve výpočetním modelu.
  • Repository: Repository keep the versioning of SAP HANA metadata object eg (Attribute view, Analytic View, Stored procedure).
  • Vrstva perzistence: Tato vrstva využívá vestavěnou funkci „Zotavení po katastrofě“ databáze SAP HANA. Záloha se do ní ukládá jako body uložení v datovém svazku.
    1. Preprocesorový server

    Tento server se používá při analýze textu a při použití funkce vyhledávání extrahuje data z textu.

    1. Jmenný server

    Tento server obsahuje všechny informace o prostředí systému. V distribuovaném serveru obsahuje jmenný server informace o každé spuštěné komponentě a umístění dat na serveru. Tento server obsahuje informace o serveru, na kterém existují data.

    1. Statistický server

    Statistický server je zodpovědný za sběr dat souvisejících se stavem, alokací / spotřebou prostředků a výkonem systému SAP HANA.

    1. XS Server

    XS Server obsahuje XS Engine. Umožňuje externím aplikacím a vývojářům používat databázi SAP HANA prostřednictvím klienta XS Engine. Externí klientská aplikace může pomocí protokolu HTTP přenášet data pomocí modulu XS pro server HTTP.

    SAP HANA na šířku

    „HANA“ znamená vysoce výkonné analytické zařízení je kombinací hardwarové a softwarové platformy.

    • Kvůli změnám v architektuře počítače je výkonnější počítač dostupný z hlediska CPU, RAM a pevného disku.
    • SAP HANA je řešení pro zúžení výkonu, ve kterém jsou všechna data uložena v hlavní paměti a není třeba často přenášet data z diskových I / O do hlavní paměti.

    Níže jsou uvedeny inovace SAP HANA v oblasti hardwaru / softwaru.

    V SAP HANA existují dva typy relačních datových úložišť: úložiště řádků a úložiště sloupců.

    Řádek

    • Je to stejné jako u tradiční databáze, např. (Oracle, SQL Server). Jediným rozdílem je, že všechna data jsou uložena v oblasti úložiště řádků v paměti SAP HANA, na rozdíl od tradiční databáze, kde jsou data uložena na pevném disku.

    Sloupový obchod

    • Úložiště sloupců je součástí databáze SAP HANA a spravuje data sloupcově v paměti SAP HANA. Sloupcové tabulky jsou uloženy v oblasti úložiště sloupců. Úložiště sloupců poskytuje dobrý výkon pro operace zápisu a zároveň optimalizuje operaci čtení.

    Výkon operace čtení a zápisu optimalizovaný s méně než dvěma datovými strukturami.

    Hlavní úložiště

    Hlavní úložiště obsahuje hlavní část dat. V hlavním úložišti se na kompresi dat používá vhodná metoda komprese dat (slovníkové kódování, klastrové kódování, řídké kódování, kódování délky běhu atd.) Za účelem úspory paměti a zrychlení vyhledávání.

    • V hlavním úložišti budou operace zápisu na komprimovaná data nákladné, takže operace zápisu přímo nezmění komprimovaná data v hlavním úložišti. Místo toho jsou všechny změny zapsány do samostatné oblasti ve sloupcovém úložišti známém jako „Delta Storage“.
    • Úložiště Delta je optimalizováno pro operaci zápisu a používá normální kompresi. Operace zápisu nejsou povoleny na hlavním úložišti, ale jsou povoleny na úložišti delta. Operace čtení jsou povoleny v obou úložištích.

    Můžeme ručně načíst data do hlavní paměti volbou „Načíst do paměti“ a Vyložit data z hlavní paměti pomocí možnosti „Načíst z paměti“, jak je uvedeno níže.

    Úložiště Delta

    Úložiště Delta se používá pro operaci zápisu a používá základní kompresi. Všechny nepotvrzené úpravy v datech tabulky sloupců uložených v úložišti delta.

    Když chceme tyto změny přesunout do hlavního úložiště, použijte „operaci sloučení delta“ ze studia SAP HANA, jak je uvedeno níže -

    • Účelem operace sloučení delta je přesunout změny, které se shromažďují v úložišti delta, do hlavního úložiště.
    • Po provedení operace Delta Merge na tabulce sloupců mízy se obsah hlavního úložiště uloží na disk a přepočítá se komprese.

    Proces přesunu dat z Delta do hlavního úložiště během sloučení delta

    Existuje vyrovnávací paměť (L1-Delta), která je řádkovým úložištěm. Takže v SAP HANA funguje tabulka sloupců jako úložiště řádků kvůli L1-delta.

    1. Uživatel spustí v tabulce dotaz na aktualizaci / vložení (fyzickým operátorem jsou příkazy SQL.).
    2. Data nejdříve přejděte na L1. Když L1 posune data dále (L1 - nepotvrzená data)
    3. Poté data přejdou do vyrovnávací paměti L2-delta, která je orientována na sloupec. (L2 - potvrzené údaje)
    4. Když je proces L2-delta dokončen, data přejdou do hlavního úložiště.

    Sloupcové úložiště je tedy optimalizované pro zápis a optimalizované pro čtení díky L1-Delta a hlavnímu úložišti. L1-Delta obsahuje všechna nepotvrzená data. Potvrzená data se přesouvají do hlavního obchodu prostřednictvím L2-Delta. Z hlavního úložiště se data dostávají do vrstvy perzistence (šipka označující zde je fyzický operátor, který odesílá příkaz SQL v úložišti sloupců). Po zpracování příkazu SQL v úložišti sloupců přejdou data do vrstvy perzistence.

    Např. Níže je tabulka založená na řádcích

    Data tabulky jsou uložena na disku v lineárním formátu, takže níže je uvedeno, jak jsou data uložena na disku pro tabulku řádků a sloupců -

    V paměti SAP HANA je tato tabulka uložena v úložišti řádků na disku jako formát -

    Adresa paměti

    A ve sloupci jsou data uložena na disk jako -

    Adresa paměti

    Data jsou ukládána sloupcově v lineárním formátu na disk. Data lze komprimovat kompresní technikou.

    Obchod Column má tedy výhodu v ukládání paměti.

    Dimenzování SAP HANA

    Dimenzování je termín, který se používá k určení hardwarových požadavků pro systém SAP HANA, jako je RAM, pevný disk a CPU atd.

    Hlavní důležitou dimenzovací komponentou je paměť a druhou důležitou dimenzovací komponentou je CPU. Třetí hlavní komponentou je disk, ale velikost je zcela závislá na paměti a CPU.

    V implementaci SAP HANA je jedním z důležitých úkolů určit správnou velikost serveru podle obchodních požadavků.

    SAP HANA DB se liší velikostí u normálního DBMS, pokud jde o -

    • Požadavek na hlavní paměť pro SAP HANA (velikost paměti je určena daty metadat a transakcí v SAP HANA)
    • Požadavek CPU na SAP HANA (Předpověď CPU je odhadována není přesná).
    • Požadavek na místo na disku pro SAP HANA (počítá se pro perzistenci dat a pro protokolování dat)

    CPU aplikačního serveru a paměť aplikačního serveru zůstávají nezměněny.

    Pro výpočet velikosti poskytla společnost SAP různé pokyny a metodu pro výpočet správné velikosti.

    Můžeme použít níže uvedenou metodu -

    1. Dimenzování pomocí sestavy ABAP.
    2. Dimenzování pomocí DB Script.
    3. Velikost pomocí nástroje Quicksizer.

    Pomocí nástroje Quicksizer se požadavek zobrazí v níže uvedeném formátu -