Tento kurz pokrývá většinu obsahu kurzů DataFlux: Data Management Studio: Základy a DataFlux:Data Management Studio:Pokročilé metody. V kurzu představíme a podrobně se budeme věnovat DataFlux Data Management Studiu, včetně témat jako jsou např. průzkum a profiling dat, datové joby pro řízení kvality dat, monitoring dat, použití jazyku DataFlux Expression Engine, vlastní metriky, makro proměnné a proces joby.
Přínos pro účastníka
V kurzu se naučíte:
- vytvářet a kontrolovat explorace dat
- vytvářet a kontrolovat data profily
- vytvářet datové joby pro zlepšení dat
- monitorovat data
- pracovat s DataFlux Expression Engine Language
- vytvářet a používat vlastní metriky
- definovat a používat makro proměnné
- vytvářet proces joby
Obsah kurzu
Úvod do metodiky DataFlux
- úvod do architektury DataFlux Data Management platformy
- cíle kurzu
DataFlux Data Management Studio: Začínáme
- úvod do architektury
- datová spojení
PLAN fáze DataFlux metodologie
- tvorba data collections
- návrh data explorací
- tvorba datových profilů
- návrh datově-standardizačních schémat
ACT fáze DataFlux metodologie
- úvod do datových jobů
- práce s joby na datovou kvalitu: standardizace, identifikační analýza, right-fielding, parsování, casing
- práce s joby na entity resolution: match kódy, klustrování, surviving record identifikační nódy
MONITOR fáze DataFlux metodologie
- business pravidla a Business Rules Manager
- použití business pravidel a alertů v profilaci dat
- použití business pravidel v datových jobech
- vytvoření datových jobů s monitorovacími úkoly
DataFlux Expression Engine Language (EEL)
- úvod do EEL
- datová profilace s EEL
- IF/ELSE statement
- RETURN statement
Vlastní metriky a makra
- definování a práce s vlastními metrikami
- definování a práce s vlastními makry
Proces joby
- úvod do proces jobů
- použití proměnných
- podmíněné zpracování, work tabulky a události
Tipy, triky a další témata
- zpracování dat v data jobu
- optimalizace jobů
- tipy pro tvorbu a testování jobů
- tipy pro převod na produkci