Správa dat je široký a nejednoznačný pojem. Globální společenství pro správu dat (DAMA International) ji definuje jako „vývoj architektur, politik, praktik a postupů pro řízení životního cyklu dat“. Ale když se řekne „správa dat“, co se tím vlastně myslí? Navrhujeme pět možností:
- Správa cloudových dat – proces integrace dat z ekosystému cloudových aplikací organizace. Hlavním rozdílem cloudové správy dat je, že veškeré ukládání, příjem a zpracování dat probíhá na cloudovém úložném médiu.
- ETL a integrace dat – načítání dat z datových zdrojů do datového skladu, jejich transformace, sumarizace a agregace do formátu vhodného pro hloubkovou analýzu.
- Správa kmenových dat – metoda správy kritických organizačních dat: zákazníků, účtů a stran jmenovaných v obchodních transakcích, a to standardizovaným způsobem, který zabraňuje redundanci v rámci celé organizace.
- Správa referenčních dat – definuje přípustné hodnoty, které mohou být použity jinými datovými poli, jako jsou poštovní směrovací čísla, seznamy zemí, regionů a měst nebo sériová čísla výrobků. Referenční data mohou být domácí nebo externě poskytovaná.
- Analýza a vizualizace dat – zpracovává vybraná data z velkých datových zdrojů a datových skladů, provádí pokročilou analýzu dat a umožňuje analytikům a datovým vědcům krájet, řezat a prezentovat vizualizace a ovládací panely.
Při dnešním obrovském množství dat jsou pro dosažení osvědčených postupů správy dat nezbytné vysoce kvalitní nástroje. Organizace používají k řízení a automatizaci procesu správy dat nástroje pro správu dat ze všech pěti výše uvedených kategorií:
- Nástroje pro správu dat v cloudu – tyto nástroje, vytvořené v cloudu, pro cloud, se připojují k různým zdrojům dat a integrují je prostřednictvím rozhraní API, webových háčků nebo přímého připojení k databázi.
- Nástroje ETL – pomáhají organizacím načítat data z různých zdrojů, definovat komplexní automatizované transformace dat, testovat datové potrubí a průběžně načítat data do cílové databáze nebo datového skladu.
- Nástroje pro transformaci dat – pomáhají s transformací surových dat na čistá, agregovaná a analyzovatelná data při jejich přechodu z jednotlivých zdrojů dat do analytického skladu – nebo v rámci analytického skladu, v místě analýzy.
- Nástroje pro správu kmenových dat (Master Data Management, MDM) – pomáhají vizualizovat složité soubory kmenových dat v rámci organizace a usnadňují správu dat odborníky na danou problematiku, kteří dohlížejí na tvorbu a údržbu referenčních dat.
- Nástroje pro správu referenčních dat (RDM) – často jsou poskytovány jako součást sad MDM, definují obchodní procesy kolem referenčních dat a pomáhají zainteresovaným stranám naplňovat referenční data a spravovat je v čase.
- Nástroje pro vizualizaci a analýzu dat – pomáhají organizacím zkoumat, analyzovat a vizualizovat velké soubory dat a vytvářet přehledy a řídicí panely pro získávání poznatků a vedení obchodních rozhodnutí.
Níže se věnujeme několika skvělým nástrojům z každé z těchto kategorií, abychom vám pomohli pochopit jednotlivé kategorie a zároveň se přiblížili k výběru nejlepšího nástroje pro správu dat podle vašich potřeb.
Se zlevněním úložišť a šířky pásma je k dispozici stále více off-premise řešení pro ukládání a správu dat. Společnosti s velkým množstvím dat, která je třeba ukládat, procházet a analyzovat, nyní běžně ukládají a spravují svá data výhradně v cloudu. Tento pracovní postup byl umožněn rozšířením cloudových nástrojů pro správu dat v posledních 5-10 letech. Ačkoli v této oblasti dosud vedli především giganti jako Amazon a Google, mnoho menších společností nyní nabízí nástroje pro zákazníky s potřebami dat všech velikostí. Níže naleznete seznam potenciálních možností správy dat v cloudu.
- Panoply
- Amazon Web Services
- Microsoft Azure
- Google Cloud
- Nejlepší nástroje ETL a integrace dat
- Informatica Powercenter
- Stitch Data
- Fivetran
- Microsoft SQL Server SSIS
- Azure Data Factory
- Talend
- Alooma
- Nejlepší nástroje pro transformaci dat
- DBT
- Airflow
- Luigi
- Nejlepší nástroje pro správu hlavních dat
- Profisee
- SAP NetWeaver
- Semarchy xDM
- Tibco MDM
- Ataccama ONE
- Stibo STEP
- Nejlepší nástroje pro správu referenčních dat
- Magnitude
- Informatica MDM Reference 360
- Reltio Cloud
- Nejlepší analytické a vizualizační nástroje
- Chartio
- Looker BI
- Metabase
- Microsoft Power BI
- Mode Analytics
- K automatizované správě dat
Panoply
Panoply nabízí cloudový automatizovaný datový sklad, který usnadňuje integraci a správu všech dat vaší organizace. Klíčové funkce:
- Velký výběr nativních datových konektorů umožňuje snadné, přijímání dat jedním kliknutím
- Automatické přijímání a předzpracování dat uvolňuje zdroje IT
- Intuitivní řídicí panel zbavuje správu dat a sestavování rozpočtu dohadů
- Automatické škálování a údržba databází s více uzly pro nízkouúdržbu datových skladů
- In-browser SQL editor pro analýzu dat a dotazování
- Propojení s běžnými sadami pro vizualizaci a analýzu dat, jako je Tableau, Looker, Chartio
Panoply cena: $325/měsíc
Amazon Web Services
Amazon Web Services nabízí stále se rozšiřující sadu nástrojů, které lze sestavit do efektivního balíku pro správu dat v cloudu. Mezi klíčové služby patří např:
- Amazon S3 pro dočasné a/nebo přechodné úložiště
- Amazon Glacier pro dlouhodobé zálohování a ukládání
- AWS Glue pro vytváření katalogů dat za účelem jejich kategorizace, vyhledávání a dotazování v datech
- Amazon Athena pro analýzu dat na bázi SQL
- Amazon Redshift pro datové sklady
- Amazon Quicksight pro tvorbu dashboardů a vizualizaci dat
- Každá služba je zprovozněna a účtována zvlášť, takže náklady závisí na míře využití
AWS Cena:
Microsoft Azure
Platforma Azure společnosti Microsoft nabízí řadu různých způsobů, jak nastavit cloudový systém správy dat, a také analytické nástroje, které lze použít pro data uložená v Azure. Stejně jako AWS umožňuje Azure více stylů databází/datových skladů s velkou sadou nástrojů pro jejich správu. Mezi klíčové služby patří např:
- Standardní databáze SQL a servery SQL založené na virtuálních počítačích
- Úložiště lobů
- Možnosti ukládání tabulek ve stylu NoSQL
- Soukromá cloudová nasazení
- Azure Data Explorer (ADX) -. nedávno přidaná služba, která umožňuje analýzu velmi rozsáhlých proudových dat v reálném čase bez nutnosti předzpracování
- Snadná integrace se službou Panoply pro služby ELT/ETL
Cena služby Azure: variabilní, závisí na implementaci
Google Cloud
Platforma Google Cloud nabízí stejně jako Amazon širokou sadu nástrojů pro správu dat v cloudu a také správce pracovních postupů, který lze použít k propojení různých komponent. Klíčové součásti služby Google Cloud:
- BigQuery pro tabulkové ukládání dat
- Cloud BigTable pro ukládání dat ve stylu databáze NoSQL
- Cloud Pub/Sub a Cloud Data Transfer pro příjem dat; Google Cloud lze také propojit s řadou dalších zdrojů dat
- Analytika BigQuery pro dotazy ve stylu SQL
- ML Engine pro pokročilejší analýzy využívající strojové učení a umělou inteligenci
- Data Studio pro analýzu založenou na grafickém uživatelském rozhraní a tvorbu ovládacích panelů
- Cloud Datalab pro datovou vědu založenou na kódu
- Propojení s běžnými nástroji BI, jako je Tableau, Looker atd.
Cena cloudu Google: proměnlivá, závisí na implementaci
Nejlepší nástroje ETL a integrace dat
Ucelený seznam nástrojů EL najdete v našem seznamu nejlepších nástrojů ETL.
Informatica Powercenter
Informatica Powercenter je on-premise nástroj ETL s následujícími klíčovými funkcemi:
- Bezproblémové propojení a integrace se všemi typy datových zdrojů pomocí hotových konektorů.
- Automatická validace dat – automatický audit a validace přesouvaných nebo transformovaných dat bez použití skriptů.
- Pokročilé transformace dat – podporuje nerelační data, dokáže analyzovat data XML, JSON, PDF, Microsoft Office a IoT.
- Správa založená na metadatech – poskytuje grafické zobrazení datových toků, dopadu a linie.
Cena platformy Informatica PowerCenter: 2 000 Kč/měsíc za nejzákladnější tarif
Stitch Data
Stitch Data je cloudová platforma ETL s následujícími klíčovými funkcemi:
- Předem integrovaná s desítkami zdrojů dat v cloudu i mimo něj, přesouvá data do Amazon Redshift, S3, BigQuery, Panoply, PostgreSQL a dalších.
- Snadné plánování replikace dat.
- Zpracování chyb a upozornění s automatickým řešením, pokud je to možné.
- Rámec API a JSON, který umožňuje programově odesílat data do datového skladu.
- Spravovaná cloudová služba s automatickým škálováním a SLA podnikové úrovně.
Cena služby Stitch: 100 – 1 000 USD/měsíc podle velikosti dat
Fivetran
Fivetran je plně spravovaný datový kanál s webovým rozhraním, který integruje data ze služeb SaaS a databází do jednoho datového skladu. Klíčové funkce:
-
Zajišťuje přímou integraci a odesílá data přes přímé zabezpečené připojení pomocí sofistikované vrstvy mezipaměti.
-
Vrstva ukládání do mezipaměti pomáhá přesouvat data z jednoho místa na druhé, aniž by se kdy ukládala kopie na aplikačním serveru.
-
Fetran neukládá žádný datový limit.
-
Může být použit k centralizaci podnikových dat a integraci všech zdrojů pro stanovení klíčových ukazatelů výkonnosti (KPI) v celé organizaci.
Cena služby Fivetran: Blendo
3. Blendo
Blendo je další cloudová služba ETL a integrace dat s následujícími klíčovými funkcemi:
- Samostatná služba – několika kliknutími se připojí k mnoha zdrojům dat, přesune data do Amazon Redshift, Panoply, PostgreSQL, MS SQL Server a dalších.
- Historická data – načítá a synchronizuje historická data z cloudových služeb.
- Plánované načítání – načítá data pravidelně nebo ve zvolené frekvenci z různých zdrojů dat.
- Optimalizace datových schémat – automatizovaný sběr, detekce a příprava dat pomocí optimálního relačního schématu.
Cena produktu Blendo:
Microsoft SQL Server SSIS
Microsoft nabízí SSIS, grafické rozhraní pro správu ETL pomocí MS SQL Server. Mezi klíčové funkce patří např:
- Snadno použitelné rozhraní umožňuje uživatelům nasazovat integrovaná řešení datových skladů, aniž by se museli zabývat psaním velkého množství – nebo vůbec nějakého – kódu.
- Grafické rozhraní umožňuje snadné přetahování ETL pro více typů dat a cílů skladu, včetně jiných než MS DB.
- Skvělé řešení pro tým s různou úrovní technických dovedností, protože je stejně efektivní jak pro ETL ninji, tak pro typy „ukaž a klikni“.
Cena SSIS: 931 USD – 15 000 USD
Azure Data Factory
Kromě SQL Server SSIS, on-premise řešení ETL společnosti Microsoft, nabízí společnost také Azure Data Factory (ADF), nástroj ETL pro svou cloudovou platformu Azure. Klíčové funkce ADF:
- Procesy ETL v ADF jsou vytvořeny v grafickém rozhraní, což umožňuje použití s malým množstvím kódu.
- Široká škála datových konektorů pro snadné načítání dat – kupodivu s výjimkou podpory načítání souborů Microsoft Excel.
- Plná podpora pro načítání dat do datových skladů Azure
Cena Azure Data Factory: 1 dolar za 1 000 spuštění měsíčně
Talend
Softwarové produkty pro integraci dat s otevřeným zdrojovým kódem Talend poskytují software pro integraci, čištění, maskování a profilování dat. Mezi klíčové vlastnosti nabídky Talend patří:
- GUI, které umožňuje spravovat velké množství zdrojových systémů pomocí standardních konektorů.
- Funkce MDM (Master Data Management)
- Jediný, konzistentní a přesný pohled na klíčová podniková data.
Cena Talendu: 1 170 USD/uživatele měsíčně nebo 12 000 USD ročně
Alooma
Alooma nabízí platformu pro integraci dat v podnikovém měřítku s integrovanými skvělými nástroji ETL. Některé klíčové vlastnosti nabídky společnosti Alooma:
- Silný důraz na rychlou konstrukci potrubí, sledování kvality dat a zpracování chyb.
- Ochrana před ztrátou nebo poškozením dat v potenciálně chybovém procesu ETL.
- Flexibilita zásahů a psaní vlastních skriptů pro monitorování, čištění a přesouvání dat podle potřeby.
- Navrženo pro provoz v podnikovém měřítku.
Cena Alooma: 1 000 – 15 000 USD/měsíc
Nejlepší nástroje pro transformaci dat
Dataform je plně spravovaná platforma pro transformaci dat založená na SQL a určená pro správu procesů ve vašem cloudovém datovém skladu. Klíčové vlastnosti:
- Pište pracovní postupy SQL v týmu ve společném IDE. Vestavěná správa verzí a integrace s Githubem.
- Pište testy kvality dat a nastavte výstrahy v případě jejich selhání, abyste zajistili, že vaše data budou vždy spolehlivá.
- Vytvořte centralizované úložiště pro definice dat v celé firmě, dokumentujte data a objevujte datové sady v katalogu dat.
- Spouštějte plány, abyste zajistili, že vaše data budou vždy aktuální.
Cena aplikace Dataform:: Od 550 USD/měsíc (k dispozici jsou startovací slevy)
DBT
DBT (Data Build Tool) je nástroj pro transformaci dat založený na SQL, který umožňuje nastavit modulární transformační toky z příkazového řádku. Klíčové funkce nástroje DBT, který byl vytvořen s ohledem na zefektivnění datových analytických a inženýrských pracovních postupů, zahrnují:
- Nástroj založený na SQL
- Snadné pracovní postupy pro sestavení modulárních transformačních a datových modelovacích toků
- Automatická správa kvality dat s robustním systémem testování
- Zjednodušené nasazení analytického kódu pomocí prostředí, správy balíčků a kontinuální integrace
- Snadná dokumentace dat s automaticky generovanými DAG a snadnou anotací a katalogizací dat
- Snímkování dat pro lepší analýzu historických dat
DBT cena: $0 pro bezplatnou úroveň, $100/měsíc pro základní, s nabídkami pro větší podnikové nasazení
Airflow
Původně vyvinutý ve společnosti Airbnb, Airflow je nový populární open source nástroj pro datovou infrastrukturu. Sám sice neprovádí žádné zpracování dat, ale Airflow vám pomůže plánovat, organizovat a monitorovat procesy ETL pomocí jazyka Python. Klíčové funkce:
- Directed Acyclic Graphs (DAG) umožňuje svému plánovači rozložit úlohy mezi řadu pracovníků, aniž byste museli definovat přesné vztahy rodič-dítě mezi datovými toky
- Praktické webové uživatelské rozhraní pro správu a úpravy vašich DAG
- Pěkná sada nástrojů, která usnadňuje provádění „operací DAG“ z příkazového řádku.
- Vysoce rozšiřitelný a škálovatelný
Cena Airflow: zdarma a open source
Luigi
Luigi je open source balíček pro Python vyvinutý společností Spotify. Je navržen tak, aby usnadnil správu dlouhotrvajících dávkových procesů, takže zvládne i úlohy, které dalece přesahují rámec ETL – ale ETL zvládá také docela dobře. Klíčové funkce:
- Kódová základna Pythonu usnadňuje vytváření efektivních datových potrubí, zejména těch, která se zabývají dlouhotrvajícími dávkovými procesy
- Snadné řešení závislostí
- Webové rozhraní, které uživateli umožňuje vizualizovat úlohy pro správu pracovních postupů
- Koncepčně podobné GNU Make, ale není určen pouze pro Hadoop
- Atomické operace se souborovým systémem zajišťují, že vaše pipeline nikdy nespadnou s částečnými daty
Cena Luigi:
Nejlepší nástroje pro správu hlavních dat
Dell Boomi’s Master Data Hub má následující klíčové funkce:
- Definuje modely prostřednictvím vizuálního prostředí s nízkým kódem.
- Zavádí datové modely a identifikuje, které zdrojové systémy s nimi interagují.
- Zaznamenává systémové záznamy do konsolidovaného úložiště, automaticky slučuje podobné záznamy.
- Umožňuje správu dat – upozorňuje týmy na řešení duplicit a problémů se zadáváním dat.
- Spravuje data pomocí obousměrných procesních toků v reálném čase napříč jednotlivými silami.
Cena centra hlavních dat Dell Boomi: 100 000 – 300 000 dolarů
Profisee
Správa hlavních dat společnosti Profisee má následující klíčové funkce:
- Správa a řízení – umožňuje „správcům dat“ v rámci organizace spravovat hlavní data se zpětnou vazbou od analytiků.
- Správa zlatých záznamů – standardizuje, čistí a porovnává zdrojová data bez kódování.
- Správa událostí – zjišťuje změny dat, distribuuje události do odběratelských systémů.
- Integrátor – sdružuje kmenová data pro globální podniky s obousměrnou integrací v reálném čase.
- Podnikový pracovní postup – prosazuje obchodní procesy napříč organizací, umožňuje správcům řídit výkonnost „data steward“.
- SDK – umožňuje integraci vlastních aplikací.
Cena pro investory: 10 USD.30 EUR/hodinu
SAP NetWeaver
SAP NetWeaver MDM, součást vývojové platformy NetWeaver, má následující klíčové funkce:
- Automaticky extrahuje kmenová data ze všech hlavních aplikací SAP.
- Načítá kmenová data z jiných zdrojů.
- Integruje data pomocí obchodního obsahu, jako jsou struktury úložišť, validační pravidla, příchozí a odchozí mapování.
- Distribuuje kmenová data k cílům.
- Umožňuje programovou integraci dat prostřednictvím rozhraní API a webových služeb.
Cena SAP NetWeaver: Na vyžádání
Semarchy xDM
Semarchy je na scéně MDM relativním nováčkem, který byl uveden na trh v roce 2011. Sídlí ve Francii a založil ji tým bývalých zaměstnanců společnosti Sunopsis. xDM, jejich hlavní produkt MDM, má následující funkce:
- Nezávislé na systému Hadoop.
- Optimalizované pro Oracle.
- Aktualizace a změny jsou sledovány a šířeny pomocí metadat, což umožňuje iterativní, „evoluční“ správu dat.
- Vybaven je postupným uživatelským rozhraním, které lze přizpůsobit konkrétním obchodním rolím (tj. analytikům, provozním pracovníkům atd.).
Cena systému xDM z března: Dostupné na vyžádání
Tibco MDM
Tibco se trvale umisťuje v žebříčcích nejlepších nástrojů MDM. Mezi klíčové vlastnosti patří:
- Pružnost a škálovatelnost pro multidoménové aplikace
- Nezávislá, distribuovaná vrstva hlavních dat.
- Přizpůsobitelné vizuální rozhraní bez kódování, které lze vytvořit tak, aby vyhovovalo různým podnikovým rolím.
- Vysoká podpora verzování dat.
- Podpora webových služeb SOAP.
Tibco MDM cena:
Ataccama ONE
Ataccama nabízí ONE, vysoce automatizovaný nástroj pro správu dat, který lze provozovat on-premise, v cloudu nebo v hybridním nastavení. Mezi klíčové funkce patří:
- Kurátorství, čištění a klasifikace dat na základě strojového učení
- Automatické vyhledávání metadat.
- Automatická konfigurace projektu.
- Doménová agnosticita, ale dodává se s předkonfigurovanými pravidly MDM pro typické domény, jako je zákazník, kontakt a produkt.
- Konektory pro širokou škálu typů dat a zdrojů.
- Připraveno na GDPR.
- Úplná historie auditu dat s podrobným záznamem použitých obchodních pravidel a transformací.
Cena Ataccama ONE:
Stibo STEP
Stibo se může pochlubit tím, že je pravděpodobně nejstarší společností na seznamu, protože byla založena v 18. století jako tiskárna. Odnož společnosti zabývající se správou dat je mladším přírůstkem a STEP, její hlavní nabízený nástroj pro správu dat, má následující klíčové vlastnosti:
- Uživatelské rozhraní STEP Workbench.
- Holistická multidoménová platforma MDM.
- Vysoká úroveň automatizace.
- Automatizovaný překlad dat a jazyků pro nadnárodní operace.
- Automatizovaná kontrola a schvalování digitálních prostředků.
- Správa kmenových dat na vysoké úrovni.
Stibo STEP cena: K dispozici na vyžádání
Nejlepší nástroje pro správu referenčních dat
Řešení referenčních dat společnosti Collibra má tyto klíčové funkce:
- Automatizuje pracovní postupy pro vytváření nových kódů a sad kódů.
- Dodává kódy a sady kódů uživatelům přívětivým způsobem.
- Provádí přesné mapování dat pro odstranění překážek v přístupu k datům.
- Srovnává data z různých částí organizace.
Cena společnosti Collibra:
Magnitude
Správa referenčních dat Magnitude má následující klíčové vlastnosti:
- Modelování více oblastí – podporuje obchodní struktury od seznamů kódů až po vícecestné, samoreferenční hierarchie.
- Automatizace – poskytuje automatizaci, správu a kontrolu nad objekty referenčních dat a procesy načítání.
- Mapování – poskytuje globální mapování na lokální, externí na interní a specifické na obecné bez narušení stávajících prvků.
- Řízení – poskytuje přizpůsobitelný pracovní postup pro řízení obchodních procesů souvisejících s referenčními daty, přičemž bezpečnostní kontroly založené na modelu umožňují uživatelům prohlížet, přidávat nebo aktualizovat.
- Časová odchylka – umožňuje uživatelům měnit modely, subjekty, atributy a asociace a načítat jakoukoli předchozí verzi objektu.
Cena správy referenčních dat: Dostupné na vyžádání
Informatica MDM Reference 360
Informatica MDM Reference 360 má následující klíčové vlastnosti:
- Plně cloudová – lepší výkon a škálovatelnost.
- Konečná platforma – zabudovaná integrace dat, kvalita dat, správa procesů.
- Samoobsluha – správa hlavních dat a pracovních postupů vytvořená pro podnikové uživatele bez technického zázemí.
- Slučování a párování – slučuje a křížově propojuje data z nových typů a zdrojů.
Informatica MDM Reference 360 cena:
Reltio Cloud
Reltio vyrábí Reltio Cloud, nástroj pro správu hlavních dat založený na grafech, který zahrnuje nástroje pro správu referenčních dat. Reltio je postaveno na grafových databázích, což mu poskytuje maximální flexibilitu jak při škálování datových úložišť, tak při definování jasných vztahů mezi daty v úložišti. Další klíčové funkce:
- Snadná integrace se stávajícími nástroji MDM a/nebo jinými zdroji dat.
- Uživatelsky přívětivé rozhraní.
- Vždy dostupná cloudová platforma umožňuje aktualizace bez prostojů.
Cena služby Reltio Cloud:
Nejlepší analytické a vizualizační nástroje
Tableau je platforma BI dostupná v cloudu i jako software ke stažení s následujícími klíčovými funkcemi:
- Snadno se připojuje ke zdrojům dat.
- Umožňuje snadný přístup k vizualizacím pro týmy, partnery a klienty.
- Umožňuje neomezené zkoumání dat pomocí interaktivních řídicích panelů.
- Vytváří „dashboard starters“, akční řídicí panely nastavené během několika minut s daty z populárních webových aplikací.
- Automatické vytváření interaktivních map.
Cena produktu Tableau: 35-70 USD za uživatele měsíčně.
Chartio
Chartio je cloudová platforma pro BI a vizualizaci s následujícími klíčovými funkcemi:
- Interaktivní režim – přetahujte data a vytvářejte, filtrujte a sdílejte dashboardy.
- SQL režim – komunikujte s databázemi v SQL a přímo získávejte poznatky.
- Vrstvení dat – přidávejte k datům postupné transformační kroky pro transformaci výsledků dotazů.
- Vizualizace a grafy – okamžitá vizualizace dat; Chartio doporučí nejvhodnější graf.
- Spojování dat a drill downs – kombinujte různorodé zdroje dat za běhu a získejte užitečné informace, aniž byste museli zkoumat surová data.
Cena Chartio: 249 USD/měsíc za týmovou licenci.
Looker BI
Looker je další cloudová analytická a vizualizační platforma s následujícími klíčovými funkcemi:
- Definujte jednou metriky pomocí LookML, jednoduchého jazyka Lookeru pro modelování dat, a Looker napíše dotazy SQL, které zodpoví jakoukoli otázku týkající se těchto metrik.
- Zkrášlete data pomocí přehledných panelů, které umožňují uživatelům pronikat do nich a zkoumat je.
- Připojte se přímo k databázím, bez nutnosti stahování výpisů nebo softwaru.
- Otevřete přístup k řídicím panelům a sestavám všem, nejen analytikům nebo datovým vědcům.
Cena Lookeru: 3 000 až 5 000 dolarů měsíčně pro 10 uživatelů.
Metabase
Metabase nabízí uživatelsky přívětivé, open source rozhraní pro připojení a analýzu vašich dat. Jako nástroj pro vizualizaci dat nabízí:
- Stovky nativních datových konektorů.
- Snadné nastavení a přístup pro celý váš tým.
- Velkou škálu různých možností vizualizace dat na výběr.
- Vkládání s bílým označením (prémiová úroveň vkládání a vyšší).
- Audit a správa oprávnění k datům (podniková úroveň a vyšší).
Cena databáze: Metabase je zdarma a má otevřený zdrojový kód, takže její bezplatná úroveň nabízí řadu funkcí, které budou vyhovovat většině uživatelů. Podnikové plány se mohou pohybovat v rozmezí počátečních cen 3 000 až 10 000 USD/rok.
Microsoft Power BI
Power BI, nabídka společnosti Microsoft v oblasti podnikové analytiky, je navržena tak, aby byla užitečná jak pro podnikové analytiky, tak pro datové vědce. Hlavní funkce:
- Jednoduché rozhraní drag-and-drop, které je navrženo tak, aby bylo známé uživatelům aplikace MS Excel.
- Power BI je platforma bez kódu a nabízí desktopové i webové klienty.
- Knihovna předpřipravených konektorů
- Výkon má tendenci zaostávat u velmi velkých datových souborů – řešení pro velká data hledejte jinde
Cena Microsoft Power BI: 9,99 USD za uživatele měsíčně nebo zdarma pro základní verzi.
Mode Analytics
Mode Analytics nabízí webovou sadu pro analýzu dat určenou datovým vědcům a analytikům se zaměřením na spolupráci a sdílení. Některé z klíčových funkcí Mode:
- Navrženo tak, aby bylo obzvláště snadné připojit zdroje dat k jejich vestavěnému editoru SQL a vizualizační platformě.
- Mode dokáže výsledky vašich dotazů SQL směrovat přímo do datového rámce R nebo Pandas v poznámkovém bloku nativním pro Mode.
- Sdílejte data, analýzu a výsledný panel, to vše prostřednictvím aplikace Mode.
- Mode je dobrou volbou pro tým datových vědců, kteří chtějí mít možnost snadněji spolupracovat.
Cena služby Mode Analytics: k dispozici na vyžádání.
K automatizované správě dat
Probrali jsme pět způsobů uvažování o nástrojích pro správu dat – správu referenčních dat, správu hlavních dat (MDM), ETL a analýzu velkých dat – a několik skvělých nástrojů v každé kategorii.
S přesunem datové infrastruktury do cloudu se stále více datového zásobníku stává spravovaným a plně integrovaným. Řízení obchodních procesů kolem strukturovaných dat ve velkých organizacích nelze ničím nahradit. Cloudové platformy však mohou pomoci s velkou částí strategie správy dat – od zpracování a přípravy surových dat až po jejich příjem, načítání, transformaci, optimalizaci a vizualizaci – automaticky v jediném systému.