Mapování je kolekce zdrojových a cílových objektů propojených pomocí sady transformací. Tyto transformace se skládají ze sady pravidel, která definují tok dat a způsob načítání dat do cílů.
Mapování se skládá z následující sady objektů
- Definice zdroje - Definice zdroje definuje strukturu a charakteristiku zdroje, jeho podkladové datové typy, typ zdroje dat atd.
- Transformace - Transformační objekty definují způsob transformace zdrojových dat a během procesu lze použít různé funkce
- Definice cíle - Definice cíle definuje konečný cíl, kam budou data načtena.
- Odkazy - Odkazy propojují definici zdroje s různými transformacemi a cílovými tabulkami. Definuje, jak data proudí ze zdroje do cíle a transformace.
V tomto výukovém programu se naučíte
- Proč potřebujete Mapování?
- Součásti mapování
- Co je to fázové mapování?
- Jak vytvořit mapování
- Mapování parametrů a proměnných
- Jak vytvořit parametr mapování
- Jak vytvořit proměnnou mapování
Proč potřebujete Mapování?
Mapování je objekt v Informatice, pomocí kterého můžete definovat, jak se zdrojová data upravují, než dosáhnou cílového nebo cílového objektu. Stejně jako pokud máte ve zdrojovém systému jméno zaměstnance jako „Bill Clinton“ a v cílovém systému je požadavek mít jméno zaměstnance ve formátu „Clinton Bill“, lze takové operace navrhnout na úrovni mapování. V základních pojmech je to, co děláte se zdrojovými daty, definováno na úrovni mapování.
Mapování je základní objekt Informatica, pomocí kterého můžeme definovat podrobnosti transformace dat a charakteristiky zdrojového / cílového objektu. Mapování nám pomáhá definovat transformaci dat na úrovni jednotlivých sloupců pro každý řádek. Dokonce i v jednom mapování můžete zpracovat více zdrojů a cílů.
Součásti mapování
Základní součásti mapování jsou
- Zdrojové tabulky
- Mapování parametrů a proměnných
- Zaměřte objekty
- Mapování transformací
Mapování tvoří různé objekty. Mapování se může skládat ze zdrojů, cílů, mapovacích parametrů a proměnných, mapových sad, různých transformací a uživatelsky definovaných funkcí .
- Zdroj mapování : Zdroje mapování jsou objekty, ze kterých načítáte zdrojová data. Může to být databázová tabulka, plochý soubor, zdroj XML nebo zdroj souboru COBOL
- Cíl mapování: Cíl mapování je náš cílový objekt, kde se načítají konečná zpracovaná data. Cíl mapování může být relační tabulka databáze, plochý soubor nebo soubor XML. Zdroje a cíle jsou v každém mapování povinné, jejich typ se může lišit
- Mapování parametrů a proměnných : Mapování parametrů a proměnných vám pomůže vytvořit dočasné objekty proměnných, které vám pomohou definovat a uložit dočasné hodnoty při zpracování mapování dat. Parametry a proměnné mapování jsou volitelné datové typy definované uživatelem, které lze vytvořit pro mapování a lze je odkazovat a aktualizovat pro konkrétní požadavek. V této části se dozvíme více o mapování parametrů a proměnných
- Mapplety : Jsou to objekty, které se skládají ze sady transformace, zdroje nebo cílů. Mapplety se obecně vytvářejí k opětovnému použití stávajících funkcí sady transformací. Lze jej použít v libovolném počtu mapování.
Co je to fázové mapování?
Mapování fází je mapování, ve kterém vytváříme repliku zdrojové tabulky. Například v produkčním systému, pokud máte tabulku „zaměstnanec“, můžete ve schématu ETL vytvořit identickou tabulku „employee_stage“.
Mít tabulku místního pódia nabízí různé výhody, například výpadek výroby, neovlivní váš systém ETL, protože místo odkazu na produkční tabulku „zaměstnanec“ máte vlastní tabulku „employee_stage“. V produkčním systému mohou existovat další operace a procesy, které ovlivňují výkon. Když však máte pracovní tabulku replik, budou k ní přistupovat pouze procesy ETL. To nabízí výkonnostní výhody.
V mapování fází,
- Zdrojové a cílové tabulky mají identické struktury
- Data v cílové tabulce jsou replikou dat zdrojové tabulky nebo
- Data ve fázi (cílová) tabulka jsou podmnožinou zdrojových dat.
Například pokud vaše zdrojová tabulka obsahuje podrobnosti o zaměstnancích deptno 10, 20, 30 a 40. Pracovní tabulkou může být tabulka, která má pouze záznamy zaměstnanců o deptno 10 a 30.
Účelem vytváření fázových tabulek v datovém skladu je zefektivnit proces transformace dat načítáním pouze těch dat, která jsou pro nás relevantní, a také minimalizovat závislost ETL / Data Warehouse od operačního systému v reálném čase.
Jak vytvořit mapování
V tomto cvičení vytvoříme mapování fází, ve kterém bude zdrojem „emp table“ a cílem bude „emptgt“.
Konvence pojmenování - před názvy mapování je předpona „m_“ následovaná názvy zdrojové a cílové tabulky oddělenými znakem podtržítka.
Příklad - pokud načítáte tabulku emp_target z tabulky emp, pak název mapování může být 'm_emp_emp_target'.
Krok 1 - Spuštění návrháře mapování
- Otevřete nástroj Informatica Designer
- Kliknutím na ikonu Mapping Designer spustíte Mapping Designer
Krok 2 - V Mapping Designer
- Klikněte na nabídku Mapování
- Vyberte možnost Vytvořit
Krok 3 - Zadejte název mapování jako „m_emp_emp_target“ a vyberte tlačítko OK.
Mapování bude vytvořeno a uvedeno ve složce mapování.
Mapování musí mít alespoň zdroj a cíl , do mapování přidáte zdroje a cíle.
Krok 4 - V tomto kroku budeme,
- Vyberte zdrojovou tabulku "emp" ve složce sources.
- Přetáhněte tabulku „emp“ do návrháře mapování.
V návrháři mapování se zobrazí importovaná zdrojová tabulka.
Poznámka - Když importujete jakoukoli relační (databázovou) tabulku do mapování, vytvoří se také další objekt typu kvalifikátoru zdroje. Tato transformace kvalifikátoru zdroje je nezbytná a pomáhá integrační službě Informatica identifikovat tabulku zdrojové databáze a její vlastnosti. Kdykoli importujete zdrojovou tabulku, vytvoří se také transformace zdrojového kvalifikátoru. Objekt mapování zdroje byste nikdy neměli mazat.
Krok 5 - V tomto kroku budeme,
- Ve složce Cíle vyberte zdrojovou tabulku „emp_target“.
- Přetáhněte tabulku „emp_target“ do návrháře mapování
V návrháři mapování bude importována a zobrazena „cílová tabulka“.
Chcete-li spravovat zobrazovací prostor, můžete tyto objekty v mapování ikonovat.
Krok 6 - Klikněte pravým tlačítkem kamkoli do prázdného pracovního prostoru návrháře mapování a vyberte možnost - Uspořádat vše ikonické.
Po výběru možnosti „Uspořádat vše ikonické“ bude pracovní prostor vypadat takto.
Krok 7 - V Informatica navrhujeme s tokem zleva doprava. Zdrojové tabulky by tedy měly být na levé straně a cílové tabulky na pravé straně. Chcete-li uspořádat tabulky v našem pracovním prostoru, vyberte tabulku „emp_target“ a poté ji přetáhněte na pravou stranu tabulky emp.
Po tomto přeskupení bude pracovní prostor vypadat takto.
Poznámka - Pravidelně používejte klávesovou zkratku "ctrl + s" k uložení změn do úložiště.
Krok 8 - Nyní máte v mapování zdrojové a cílové tabulky, ale mapování ještě není dokončeno. K dokončení mapování by měly být zdrojové a cílové tabulky propojeny.
Propojit zdroj a cíle
Dvojitým kliknutím na tabulku SQ_EMP a tabulku EMP_TARGET změníte jejich pohled z ikonického na grafický.
Krok 9 - Klikněte pravým tlačítkem na pracovní prostor návrháře mapování a vyberte možnost „Autolink“ podle názvu.
Krok 10 - Propojení zdroje s cílovou tabulkou
- Vyberte sloupce zdrojové tabulky.
- Přetáhněte sloupce do cílové tabulky.
Zdrojové a cílové tabulky budou propojeny a propojovací šipky se objeví od zdroje k cílové tabulce.
Poznámka - Zde jste propojili všechny zdrojové sloupce s příslušným sloupcem cílové tabulky. To znamená, že pro každý načtený zdrojový záznam budou načteny všechny sloupce cíle. Pokud chcete vyloučit načítání konkrétního sloupce, klikněte na odkaz na tento sloupec a stiskněte klávesu Delete na klávesnici. Odkaz bude odstraněn a cílový sloupec se nenačte.
Krok 11 - Pomocí zkratky „ctrl + s“ uložte změny do svého mapování. Na výstupním okně můžete vidět zprávu o ověření / analýze mapování. Potvrzuje, že vaše mapování je platné. Vedle názvu mapování ve stromu složky mapování bude také dočasná zelená značka označující, že mapování proběhlo úspěšně.
V mapováních může existovat požadavek, kde potřebujeme předat proměnnou do mapování, nebo může existovat scénář, kde musíme vypočítat dočasné proměnné a dále je nutné je uložit pro další běh relace mapování. Pro tyto účely vytváříme mapovací parametry a proměnné.
Mapování parametrů a proměnných
Jako každý programovací jazyk má Informatica svůj vlastní způsob definování parametrů a proměnných. Ale na rozdíl od jiných programovacích jazyků není Informatica jazyk založený na kódu. Chcete-li vytvořit parametry a proměnné v Informatice, musíte postupovat podle předdefinované syntaxe a navigace.
Rozdíl mezi parametry a proměnnými -
Parametry mapování |
Mapování proměnných |
Parametry mapování jsou ty datové typy, jejichž hodnota jednou přiřazená zůstává konstantní po celou dobu mapování. Stejně jako pokud jste vytvořili mapovací parametr deptno = 20, pak bude hodnota 20 konstantní pro celý běh mapování. Parametr, na který bude odkazován, vždy vrátí hodnotu 20 pro danou instanci běhu mapování. U nové instance mapování lze hodnotu parametru předefinovat. |
Proměnné mapování jsou objekty, na které lze během celého procesu mapování odkazovat (pro přístup k jejich hodnotám) a jejich hodnoty lze znovu přiřadit. Například v mapování lze použít mapovací proměnnou total_salary a její hodnotu lze aktualizovat na základě platů. |
Parametry a proměnné mapování jsou specifické pouze pro mapování. Nelze na ně odkazovat v jiném mapování.
Jak vytvořit parametr mapování
Když vytvoříte parametr mapování, služba Integration během provádění mapování hledá přidělenou hodnotu. Tyto hodnoty lze přiřadit následujícím místům.
- Soubor vnitřních parametrů
- Při přiřazování proměnných před relací
- Počáteční hodnota v úložišti
- Výchozí hodnota přiřazená během vytváření proměnné
Krok 1 - Vytvoření parametru mapování - V návrháři mapování,
- Vyberte nabídku mapování
- Vyberte nabídku parametrů a proměnných
Krok 2 - Na další obrazovce
- Klikněte na nabídku Přidat novou proměnnou
- Z rozevíracího seznamu vyberte typ jako parametr
- Zadejte název parametru jako $$ Deptno
- Zadejte počáteční hodnotu 10
- Vyberte tlačítko OK
Nyní jste vytvořili mapovací parametr deptno s původně přiřazenou hodnotou 10 a na tento parametr lze odkazovat uvnitř mapování.
Jak vytvořit proměnnou mapování
Krok 1 - V návrháři mapování
- Vyberte nabídku mapování
- Vyberte nabídku parametrů a proměnných
Krok 2 - Na další obrazovce
- Klikněte na nabídku Přidat novou proměnnou
- Z rozevíracího seznamu vyberte typ jako proměnnou
- Zadejte název proměnné jako $$ TotalSalary
- Vyberte DataType jako desítkové
- Zadejte počáteční hodnotu 0
- Vyberte tlačítko OK
Tím se vytvoří proměnná mapování.
Poznámka - názvy parametrů a proměnných mapování vždy začínají $$.
souhrn
Mapování je v Informatice důležité pro shodu zdrojových dat s cílem podle požadavků projektu. Diskutovali jsme o fázových mapováních a konceptu mapování proměnných a parametrů.