Normalizer je aktivní transformace, která se používá k převodu jednoho řádku na více řádků a naopak. Jedná se o chytrý způsob, jak lépe reprezentovat svá data.
Pokud jsou v jednom řádku opakující se data ve více sloupcích, lze je rozdělit do více řádků. Někdy máme data ve více sloupcích. Například
Jméno studenta | Skóre třídy 9 | Skóre třídy 10 | Skóre třídy 11 | Skóre třídy 12 |
Student 1 | 50 | 60 | 65 | 80 |
Student 2 | 70 | 64 | 83 | 77 |
V tomto případě se sloupec skóre třídy opakuje ve čtyřech sloupcích. Pomocí normalizátoru je můžeme rozdělit do následující datové sady.
Jméno studenta | Třída | Skóre |
Student 1 | 9 | 50 |
Student 1 | 10 | 60 |
Student 1 | 11 | 65 |
Student 1 | 12 | 80 |
Student 2 | 9 | 70 |
Student 2 | 10 | 64 |
Student 2 | 11 | 83 |
Student 2 | 12 | 77 |
Krok 1 - Vytvořte zdrojovou tabulku „sales_source“ a cílovou tabulku „sales_target“ pomocí skriptu a importujte je do Informatica
Stáhněte si výše uvedený soubor Sales_Source.txt
Krok 2 - Vytvořte mapování se zdrojem „sales_source“ a cílovou tabulkou „sales_target“
Krok 3 - Z nabídky transformace vytvořte novou transformaci
- Jako transformaci vyberte normalizátor
- Zadejte název, „nrm_sales“
- Vyberte možnost vytvoření
Krok 4 - Transformace bude vytvořena, vyberte možnost hotovo
Krok 5 - Poklepejte na transformaci normalizátoru
- Vyberte kartu normalizátoru
- Kliknutím na ikonu vytvoříte dva sloupce
- Zadejte názvy sloupců
- Nastavte počet výskytů na 4 pro prodej a 0 pro název obchodu
- Vyberte tlačítko OK
Při transformaci budou generovány sloupce. Když nastavíme počet výskytů na 4, uvidíte sloupec 4 počet prodejů.
Krok 6 - Pak v mapování
- Propojte čtyři sloupce kvalifikátoru zdroje čtyř čtvrtletí se sloupci normalizátoru.
- Propojte sloupec s názvem obchodu se sloupcem normalizátoru
- Propojte sloupce store_name a sales z normalizátoru na cílovou tabulku
- Propojte sloupec GK_sales z normalizátoru s cílovou tabulkou
Uložte mapování a spusťte jej po vytvoření relace a pracovního postupu. Pro každé čtvrtletí prodeje obchodu bude transformací normalizátoru vytvořen samostatný řádek.
Výstup našeho mapování bude vypadat jako -
Jméno obchodu | Čtvrťák | Odbyt |
DELHI | 1 | 150 |
DELHI | 2 | 240 |
DELHI | 3 | 455 |
DELHI | 4 | 100 |
MUMBAI | 1 | 100 |
MUMBAI | 2 | 500 |
MUMBAI | 3 | 350 |
MUMBAI | 4 | 340 |
Zdrojová data měla opakující se sloupce, konkrétně QUARTER1, QUARTER2, QUARTER3 a QUARTER4. S pomocí normalizátoru jsme přeskupili data tak, aby se vešla do jednoho sloupce ČTVRTLETÍ a pro jeden zdrojový záznam jsou v cíli vytvořeny čtyři záznamy.
Tímto způsobem můžete normalizovat data a vytvořit více záznamů pro jeden zdroj dat.