Zarządzanie danymi to szerokie i niejednoznaczne pojęcie. Global Data Management Community (DAMA International) definiuje je jako „rozwój architektur, polityk, praktyk i procedur w celu zarządzania cyklem życia danych”. Ale kiedy ludzie mówią „zarządzanie danymi”, co tak naprawdę mają na myśli? Proponujemy pięć możliwości:
- Zarządzanie danymi w chmurze – proces integrowania danych z ekosystemu aplikacji chmurowych organizacji. Głównym wyróżnikiem zarządzania danymi w chmurze jest to, że całe przechowywanie, pobieranie i przetwarzanie danych odbywa się na nośniku w chmurze.
- ETL i integracja danych – ładowanie danych ze źródeł danych do hurtowni danych, przekształcanie, podsumowywanie i agregowanie ich do formatu nadającego się do wysokiej, pogłębionej analizy.
- Zarządzanie danymi głównymi – metoda zarządzania krytycznymi danymi organizacyjnymi: klientami, kontami i stronami wymienianymi w transakcjach biznesowych, w ustandaryzowany sposób, który zapobiega redundancji w całej organizacji.
- Zarządzanie danymi referencyjnymi – definiuje dopuszczalne wartości, które mogą być wykorzystywane przez inne pola danych, takie jak kody pocztowe, listy krajów, regionów i miast lub numery seryjne produktów. Dane referencyjne mogą być własne lub dostarczane z zewnątrz.
- Analityka danych i wizualizacja – przetwarzanie wybranych danych ze źródeł big data i hurtowni danych, wykonywanie zaawansowanej analityki danych oraz umożliwienie analitykom i naukowcom zajmującym się danymi krojenia w plasterki, kostki i prezentowania wizualizacji i pulpitów nawigacyjnych.
Przy dzisiejszych ogromnych ilościach danych wysokiej jakości narzędzia są niezbędne do osiągnięcia najlepszych praktyk zarządzania danymi. Organizacje używają narzędzi do zarządzania danymi ze wszystkich pięciu powyższych kategorii, aby zarządzać i automatyzować proces zarządzania danymi:
- Narzędzia do zarządzania danymi w chmurze – zbudowane w chmurze, dla chmury, te narzędzia łączą się i integrują wiele źródeł danych poprzez API, webhooks lub bezpośrednie połączenia z bazą danych.
- Narzędzia ETL – pomagają organizacjom ładować dane z wielu źródeł, definiować złożone, zautomatyzowane transformacje danych, testować potok danych i ładować dane w sposób ciągły do docelowej bazy danych lub hurtowni danych.
- Narzędzia do transformacji danych – pomagają w przekształcaniu surowych danych w czyste, zagregowane, nadające się do analizy dane, gdy przechodzą one z poszczególnych źródeł danych do hurtowni analitycznej – lub wewnątrz hurtowni analitycznej, w punkcie analizy.
- Narzędzia do zarządzania danymi podstawowymi (Master Data Management, MDM) – pomagają wizualizować złożone zbiory danych podstawowych w całej organizacji i ułatwiają zarządzanie danymi przez ekspertów merytorycznych, którzy nadzorują tworzenie i utrzymywanie danych referencyjnych.
- Narzędzia do zarządzania danymi referencyjnymi (RDM) – często dostarczane jako część pakietów MDM, definiują procesy biznesowe wokół danych referencyjnych oraz pomagają zainteresowanym stronom uzupełniać dane referencyjne i zarządzać nimi w czasie.
- Narzędzia do wizualizacji i analizy danych – pomagają organizacjom badać, analizować i wizualizować duże zbiory danych, a także generować raporty i pulpity nawigacyjne w celu wydobycia spostrzeżeń i kierowania decyzjami biznesowymi.
Poniżej omawiamy kilka świetnych narzędzi z każdej z tych kategorii, zarówno w celu ułatwienia zrozumienia każdej z nich, jak i zbliżenia się do wyboru najlepszego narzędzia do zarządzania danymi dla swoich potrzeb.
Jak pamięć masowa i przepustowość stały się tańsze, coraz więcej rozwiązań off-premise dla hurtowni danych i zarządzania stały się dostępne. Firmy z dużą ilością danych do przechowywania, przesiewania i analizowania teraz rutynowo przechowywać i zarządzać swoimi danymi w całości w chmurze. Taki przepływ pracy stał się możliwy dzięki rozpowszechnieniu narzędzi do zarządzania danymi w chmurze w ciągu ostatnich 5-10 lat. Chociaż do tej pory pole to było prowadzone głównie przez gigantów takich jak Amazon i Google, wiele mniejszych firm oferuje obecnie narzędzia dla klientów z potrzebami danych wszystkich rozmiarów. Poniżej znajduje się lista potencjalnych opcji do zarządzania danymi w chmurze.
- Panoply
- Amazon Web Services
- Microsoft Azure
- Google Cloud
- Najlepsze narzędzia ETL i integracji danych
- Informatica Powercenter
- Stitch Data
- Fivetran
- Microsoft SQL Server SSIS
- Azure Data Factory
- Talend
- Alooma
- Najlepsze narzędzia do transformacji danych
- DBT
- Airflow
- Luigi
- Najlepsze narzędzia Master Data Management
- Profisee
- SAP NetWeaver
- Semarchy xDM
- Tibco MDM
- Ataccama ONE
- Stibo STEP
- Najlepsze narzędzia do zarządzania danymi referencyjnymi
- Magnitude
- Informatica MDM Reference 360
- Reltio Cloud
- Najlepsze narzędzia do analityki i wizualizacji
- Chartio
- Looker BI
- Metabase
- Microsoft Power BI
- Mode Analytics
- W kierunku zautomatyzowanego zarządzania danymi
Panoply
Panoply oferuje natywną dla chmury zautomatyzowaną hurtownię danych, która ułatwia integrację i zarządzanie wszystkimi danymi organizacji. Kluczowe cechy:
- Duży wybór natywnych konektorów danych pozwala na łatwe, jedno kliknięcie
- Automatyczne pobieranie i wstępne przetwarzanie danych uwalnia zasoby IT
- Intuicyjny pulpit menedżerski eliminuje zgadywanie związane z zarządzaniem danymi i budżetowaniem
- Automatyczne skalowanie i utrzymanie wielowęzłowych baz danych dla hurtowni danych o niskim
- Wewnętrzny edytor SQL w przeglądarce do analizy danych i zapytań
- Połączenia z popularnymi pakietami do wizualizacji i analizy danych, takimi jak Tableau, Looker, Chartio
Cena Panoply: $325/miesiąc
Amazon Web Services
Amazon Web Services oferuje stale rozszerzający się zestaw narzędzi, które można połączyć w efektywny stos zarządzania danymi w chmurze. Kluczowe usługi obejmują:
- Amazon S3 do tymczasowego i/lub pośredniego przechowywania
- Amazon Glacier do długoterminowego tworzenia kopii zapasowych i przechowywania
- AWS Glue do budowania katalogów danych w celu kategoryzowania,
- Amazon Athena do analizy danych opartej na SQL
- Amazon Redshift do hurtowni danych
- Amazon Quicksight do tworzenia pulpitów nawigacyjnych i wizualizacji danych
- Każda usługa jest uruchamiana i rozliczana osobno, więc koszty zależą od zakresu wykorzystania
AWS Cena: zmienna, zależna od wdrożenia
Microsoft Azure
Platforma Azure firmy Microsoft zapewnia wiele różnych sposobów konfigurowania systemu zarządzania danymi w chmurze, a także narzędzia analityczne, których można używać na danych przechowywanych w chmurze. Podobnie jak AWS, Azure pozwala na wiele stylów baz danych / hurtowni danych z doskonałym zestawem narzędzi do zarządzania nimi. Kluczowe usługi obejmują:
- Standardowe bazy danych SQL i serwery SQL oparte na maszynach wirtualnych
- Blob storage
- Opcje przechowywania tabel w stylu NoSQL
- Wdrożenia w chmurze prywatnej
- Azure Data Explorer (ADX) -… niedawno dodana usługa, która umożliwia analizę w czasie rzeczywistym bardzo dużych danych strumieniowych bez konieczności wstępnego przetwarzania
- Łatwa integracja z Panoply dla usług ELT/ETL
Cena Azure: zmienna, zależna od wdrożenia
Google Cloud
Podobnie jak Amazon, platforma Google Cloud oferuje szeroki zestaw narzędzi do zarządzania danymi w chmurze, a także menedżera przepływu pracy, którego można użyć do powiązania ze sobą różnych komponentów. Kluczowe komponenty Google Cloud:
- BigQuery do przechowywania danych tabelarycznych
- Cloud BigTable do przechowywania danych w stylu bazy NoSQL
- Cloud Pub/Sub i Cloud Data Transfer do pobierania danych; Google Cloud może również łączyć się z wieloma innymi źródłami danych
- BigQuery analytics do zapytań w stylu SQL
- ML Engine do bardziej zaawansowanych analiz z wykorzystaniem uczenia maszynowego i AI
- Data Studio do analizy opartej na GUI i budowy pulpitów nawigacyjnych
- Cloud Datalab do nauki o danych opartej na kodzie
- Połączenia z popularnymi narzędziami BI, takimi jak Tableau, Looker itp.
Cena chmury Google: zmienna, zależna od wdrożenia
Najlepsze narzędzia ETL i integracji danych
Dla wyczerpującej listy narzędzi EL sprawdź naszą listę najlepszych narzędzi ETL.
Informatica Powercenter
Informatica Powercenter to narzędzie ETL typu on-premise z następującymi kluczowymi funkcjami:
- Bezproblemowa łączność i integracja ze wszystkimi typami źródeł danych za pomocą złączy out-of-the-box.
- Automatyczna walidacja danych – bezskryptowy, zautomatyzowany audyt i walidacja przenoszonych lub przekształcanych danych.
- Zaawansowane transformacje danych – obsługuje dane nierelacyjne, potrafi parsować dane XML, JSON, PDF, Microsoft Office i IoT.
- Zarządzanie oparte na metadanych – zapewnia graficzne widoki przepływów danych, wpływu i przebiegu linii.
Informatica PowerCenter cena: $2,000/miesiąc za najbardziej podstawowy plan
Stitch Data
Stitch Data to oparta na chmurze platforma ETL z następującymi kluczowymi funkcjami:
- Preintegracja z dziesiątkami źródeł danych w chmurze i poza nią, przenosi dane do Amazon Redshift, S3, BigQuery, Panoply, PostgreSQL i innych.
- Łatwe planowanie replikacji danych.
- Obsługa błędów i ostrzeganie z automatycznym rozwiązywaniem, gdy jest to możliwe.
- API i JSON framework, pozwalające na programowe przekazywanie danych do hurtowni danych.
- Zarządzana usługa w chmurze z automatycznym skalowaniem i umowami SLA klasy korporacyjnej.
Cena Stitch: $100 – $1,000/miesiąc w oparciu o rozmiar danych
Fivetran
Fivetran to w pełni zarządzany potok danych z interfejsem internetowym, który integruje dane z usług SaaS i baz danych w jedną hurtownię danych. Kluczowe cechy:
-
Zapewnia bezpośrednią integrację i przesyła dane przez bezpośrednie bezpieczne połączenie z wykorzystaniem zaawansowanej warstwy buforowania.
-
Warstwa buforowania pomaga przenosić dane z jednego punktu do drugiego bez konieczności przechowywania kopii na serwerze aplikacji.
-
Fivetran nie narzuca żadnego limitu danych.
-
Może być użyty do centralizacji danych firmy i integracji wszystkich źródeł w celu określenia kluczowych wskaźników wydajności (KPI) w całej organizacji.
Cena Fivetran: Dostępne na żądanie
3. Blendo
Blendo to kolejna oparta na chmurze usługa ETL i integracji danych, posiadająca następujące kluczowe cechy:
- Samodzielna obsługa – łączy się z wieloma źródłami danych za pomocą kilku kliknięć, przenosi dane do Amazon Redshift, Panoply, PostgreSQL, MS SQL Server i innych.
- Dane historyczne – ładuje i synchronizuje dane historyczne z usług w chmurze.
- Zaplanowane ładowanie – ładuj dane okresowo lub z wybraną częstotliwością z różnych źródeł danych.
- Optymalizacja schematu danych – zautomatyzowane zbieranie, wykrywanie i przygotowywanie danych przy użyciu optymalnego schematu relacyjnego.
Cena Blendo: Dostępne na życzenie
Microsoft SQL Server SSIS
Microsoft oferuje SSIS, graficzny interfejs do zarządzania ETL przy użyciu MS SQL Server. Kluczowe cechy obejmują:
- Łatwy w użyciu interfejs pozwala użytkownikom wdrażać zintegrowane rozwiązania hurtowni danych bez konieczności angażowania się w pisanie dużo–lub w ogóle–kodu.
- Graficzny interfejs pozwala na łatwe przeciąganie i upuszczanie ETL dla wielu typów danych i miejsc docelowych hurtowni, w tym dla baz danych innych niż MS DB.
- Doskonałe rozwiązanie dla zespołu o różnych poziomach umiejętności technicznych, ponieważ jest równie skuteczne dla ninja ETL, jak i dla użytkowników typu „wskaż i kliknij”.
Cena SSIS: $931 – $15,000
Azure Data Factory
Oprócz SQL Server SSIS, rozwiązania ETL on-premise Microsoftu, firma oferuje również Azure Data Factory (ADF), narzędzie ETL dla swojej chmurowej platformy Azure. Kluczowe cechy ADF:
- Tropy ETL w ADF są budowane w interfejsie graficznym, co pozwala na korzystanie z nich w trybie low-code.
- Duża różnorodność konektorów danych dla łatwego wprowadzania danych – z wyjątkiem, co dziwne, wsparcia dla ładowania plików Microsoft Excel.
- Pełne wsparcie dla ładowania danych do hurtowni danych Azure
Cena Azure Data Factory: 1 USD za 1000 uruchomień miesięcznie
Talend
Talend
Otwarte oprogramowanie do integracji danych dostarcza oprogramowanie do integracji, oczyszczania, maskowania i profilowania danych. Kluczowe cechy oferty Talend obejmują:
- GUI, które umożliwia zarządzanie dużą liczbą systemów źródłowych przy użyciu standardowych konektorów.
- Funkcjonalność Master Data Management (MDM)
- Pojedynczy, spójny i dokładny widok kluczowych danych przedsiębiorstwa.
Cena Talend: $1,170/użytkownika miesięcznie lub $12,000 rocznie
Alooma
Alooma oferuje platformę integracji danych na skalę przedsiębiorstwa z wbudowanymi świetnymi narzędziami ETL. Niektóre kluczowe cechy oferty Alooma:
- Silny nacisk na szybką budowę rurociągów, monitorowanie jakości danych i obsługę błędów.
- Zabezpieczenie przed utratą lub uszkodzeniem danych w potencjalnie podatnym na błędy procesie ETL.
- Elastyczność interwencji i pisania własnych skryptów do monitorowania, czyszczenia i przenoszenia danych w razie potrzeby.
- Zaprojektowane dla operacji na skalę przedsiębiorstwa.
Cena Allooma: $1,000 – $15,000/miesiąc
Najlepsze narzędzia do transformacji danych
Dataform to oparta na SQL, w pełni zarządzana platforma transformacji danych do zarządzania procesami w hurtowni danych w chmurze. Kluczowe cechy:
- Pisz przepływy pracy SQL jako zespół w IDE do współpracy. Wbudowana kontrola wersji i integracja z Github.
- Pisz testy jakości danych i ustaw alerty, jeśli się nie powiodą, aby zapewnić, że Twoje dane są zawsze niezawodne.
- Stwórz scentralizowane repozytorium definicji danych w całej firmie, dokumentuj swoje dane i odkrywaj zbiory danych w katalogu danych.
- Uruchamiaj harmonogramy, aby zapewnić, że Twoje dane są zawsze aktualne.
Cena Dataform:: Od $550/miesiąc (dostępne zniżki na rozpoczęcie działalności)
DBT
DBT (Data Build Tool) to oparte na SQL narzędzie do transformacji danych, które umożliwia konfigurowanie modułowych przepływów transformacji z wiersza poleceń. Narzędzie DBT, zbudowane z myślą o usprawnieniu przepływu pracy w zakresie analizy danych i inżynierii, zawiera następujące kluczowe funkcje:
- Narzędzie oparte na bazie danychSQL
- Łatwe przepływy pracy do budowania modułowych przepływów transformacji i modelowania danych
- Automatyczne zarządzanie jakością danych z solidnym systemem testowania
- Skuteczne wdrażanie kodu analityki z wykorzystaniem środowisk, zarządzanie pakietami i ciągłą integrację
- Łatwa dokumentacja danych z automatycznie generowanymi DAG i łatwą adnotacją i katalogowaniem danych
- Zrzut danych dla lepszej analizy danych historycznych
DBT cena: $0 za darmowy tier, $100/mo za podstawowy, z wycenami dostępnymi dla większych wdrożeń korporacyjnych
Airflow
Oryginalnie opracowany w Airbnb, Airflow jest popularnym nowym narzędziem infrastruktury danych open source. Choć sam nie zajmuje się przetwarzaniem danych, Airflow może pomóc w planowaniu, organizowaniu i monitorowaniu procesów ETL przy użyciu Pythona. Kluczowe cechy:
- Directed Acyclic Graphs (DAGs) pozwalają jego harmonogramowi rozłożyć Twoje zadania na szereg pracowników bez konieczności precyzyjnego definiowania relacji rodzic-dziecko pomiędzy przepływami danych
- Handy web-based UI for managing and editing your DAGs
- Nice zestaw narzędzi, który ułatwia wykonywanie „operacji DAG” z wiersza poleceń.
- Wysoko rozszerzalny i skalowalny
Cena Airflow: darmowy i open source
Luigi
Luigi to pakiet open source Pythona opracowany przez Spotify. Został zaprojektowany, aby ułatwić zarządzanie długo trwającymi procesami wsadowymi, więc może obsługiwać zadania, które wykraczają daleko poza zakres ETL – ale robi też ETL całkiem dobrze. Kluczowe cechy:
- Baza kodowa Pythona ułatwia budowanie wydajnych rurociągów danych, zwłaszcza takich, które dotyczą długo trwających procesów wsadowych
- Łatwe rozwiązywanie zależności
- Interfejs WWW, który pozwala użytkownikowi wizualizować zadania do zarządzania przepływem pracy
- Koncepcyjnie podobny do GNU Make, ale nie jest tylko dla Hadoop
- Atomowe operacje na systemie plików zapewniają, że Twoje potoki nigdy nie zawiodą z częściowymi danymi
Cena Luigi: Free and open source
Najlepsze narzędzia Master Data Management
Dell Boomi’s Master Data Hub ma następujące kluczowe cechy:
- Definiuje modele poprzez low-code, wizualne doświadczenie.
- Wdraża modele danych i identyfikuje, które systemy źródłowe wchodzą z nimi w interakcję.
- Obsługuje rekordy systemowe w skonsolidowanym repozytorium, automatycznie łączy podobne rekordy.
- Umożliwia zarządzanie danymi – alarmuje zespoły w celu rozwiązania problemów związanych z duplikatami i wprowadzaniem danych.
- Zarządza danymi dzięki dwukierunkowym przepływom procesów w czasie rzeczywistym przez silosy.
Dell Boomi Master Data Hub cena: 100 000 USD – 300 000 USD
Profisee
Profisee’s Master Data Management ma następujące kluczowe cechy:
- Stewardship and governance – umożliwia „stewardom danych” w organizacji zarządzanie danymi głównymi dzięki informacjom zwrotnym z analityki.
- Zarządzanie złotym rekordem – standaryzuje, czyści i dopasowuje dane źródłowe bez kodowania.
- Zarządzanie zdarzeniami – wykrywa zmiany danych, dystrybuuje zdarzenia do systemów subskrybujących.
- Integrator – federuje dane główne dla globalnych przedsiębiorstw, z dwukierunkową integracją w czasie rzeczywistym.
- Enterprise workflow – wymusza procesy biznesowe w różnych organizacjach, pozwala administratorom zarządzać wydajnością stewardów danych.
- SDK – umożliwia integrację niestandardowych aplikacji.
Cena dla eksperta: $10.30/h
SAP NetWeaver
SAP NetWeaver MDM, składnik platformy rozwojowej NetWeaver, ma następujące kluczowe cechy:
- Automatycznie wyodrębnia dane główne ze wszystkich głównych aplikacji SAP.
- Wczytuje dane główne z innych źródeł.
- Integruje dane przy użyciu zawartości biznesowej, takiej jak struktury repozytorium, reguły walidacji, mapowania przychodzące i wychodzące.
- Dystrybuuje dane główne do obiektów docelowych.
- Umożliwia programową integrację danych za pomocą interfejsów API i usług sieciowych.
Ceny SAP NetWeaver: Dostępne na żądanie
Semarchy xDM
Semarchy to względny nowicjusz na scenie MDM, który pojawił się na rynku w 2011 roku. Firma ma siedzibę we Francji i została założona przez zespół byłych pracowników Sunopsis. xDM, ich główny produkt MDM, ma następujące cechy:
- Non-Hadoop dependent.
- Optimized for Oracle.
- Uaktualnienia i zmiany są śledzone i propagowane przy użyciu metadanych, co pozwala na iteracyjne, „ewolucyjne” zarządzanie danymi.
- Posiada interfejs użytkownika krok po kroku, który można dostosować do określonych ról biznesowych (tj. analityków, operacji itp.).
Cena Semarch xDM: Dostępne na żądanie
Tibco MDM
Tibco jest stałym bywalcem rankingów najlepszych narzędzi MDM. Kluczowe cechy obejmują:
- Elastyczność i skalowalność dla aplikacji wielodomenowych.
- Niezależna, rozproszona warstwa danych głównych.
- Dostosowywalny interfejs wizualny bez kodu, który można zbudować w celu dostosowania do różnych ról biznesowych.
- Wysoko oceniana obsługa wersjonowania danych.
- Obsługa usług sieci WebSOAP.
Cena Tibco MDM: Dostępne na żądanie
Ataccama ONE
Ataccama oferuje ONE, wysoce zautomatyzowane narzędzie do zarządzania danymi, które można uruchomić w siedzibie firmy, w chmurze lub w konfiguracji hybrydowej. Kluczowe funkcje obejmują:
- Oparta na uczeniu maszynowym kuratyzacja, czyszczenie i klasyfikacja danych.
- Automatyzowane odkrywanie metadanych.
- Automatyczna konfiguracja projektu.
- Domain agnostic, ale jest wstępnie skonfigurowany z wbudowanymi regułami dla MDM dla typowych domen, takich jak klient, kontakt i produkt.
- Konektory dla szerokiego zakresu typów danych i źródeł.
- GDPR ready.
- Pełna historia audytu danych ze szczegółowym dziennikiem zastosowanych reguł biznesowych i transformacji.
Cena Ataccama ONE: Dostępne na żądanie
Stibo STEP
Stibo ma ten zaszczyt, że jest prawdopodobnie najstarszą firmą na liście, założoną w XVIII wieku jako firma drukarska. Ramię firmy zajmujące się zarządzaniem danymi jest młodszym dodatkiem, a STEP, jej główne narzędzie do zarządzania danymi, ma następujące kluczowe cechy:
- STEP Workbench UI.
- Holistyczna, wielodomenowa platforma MDM.
- Wysoki poziom automatyzacji.
- Automatyzowane tłumaczenie danych i języków dla operacji wielonarodowych.
- Automatyzowany przegląd i zatwierdzanie zasobów cyfrowych.
- Zarządzanie danymi podstawowymi na poziomie przedsiębiorstwa.
Cena Stibo STEP: Dostępne na żądanie
Najlepsze narzędzia do zarządzania danymi referencyjnymi
Rozwiązanie Reference Data firmy Collibra ma następujące kluczowe cechy:
- Automatyzuje przepływy pracy w celu tworzenia nowych kodów i zestawów kodów.
- Dostarcza użytkownikom kody i zestawy kodów w przyjazny sposób.
- Wykonuje dokładne mapowanie danych w celu wyeliminowania barier w dostępie do danych.
- Porównuje dane z różnych części organizacji.
Cena Collibra: Dostępna na żądanie
Magnitude
Magnitude’s Reference Data Management posiada następujące kluczowe cechy:
- Multi-domain modeling – obsługuje struktury biznesowe od list kodowych do wielościeżkowych, samoodnoszących się hierarchii.
- Automatyzacja – zapewnia automatyzację, zarządzanie i kontrolę nad obiektami danych referencyjnych i procesami ładowania.
- Mapowanie – zapewnia mapowanie globalne na lokalne, zewnętrzne na wewnętrzne i specyficzne na ogólne bez zakłóceń w istniejących elementach.
- Governance – zapewnia konfigurowalny przepływ pracy w celu kontrolowania procesów biznesowych związanych z danymi referencyjnymi, z opartymi na modelach kontrolami bezpieczeństwa umożliwiającymi użytkownikom przeglądanie, dodawanie lub aktualizowanie.
- Wariant czasowy – umożliwia użytkownikom zmianę modeli, tematów, atrybutów i asocjacji oraz pobieranie dowolnej poprzedniej wersji obiektu.
Cena zarządzania danymi referencyjnymi firmy Magnitude: Dostępne na żądanie
Informatica MDM Reference 360
Informatica’s MDM Reference 360 posiada następujące kluczowe cechy:
- W pełni oparte na chmurze – zwiększona wydajność i skalowalność.
- Platforma end-to-end – wbudowana integracja danych, jakość danych, zarządzanie procesami.
- Self service – Master Data Management i przepływy pracy zbudowane dla użytkowników biznesowych bez zaplecza technicznego.
- Match and merge – łączy i krzyżuje dane z nowych typów i źródeł.
Informatica MDM Reference 360 cena: Dostępne na żądanie
Reltio Cloud
Reltio tworzy Reltio Cloud, oparte na grafach narzędzie do zarządzania danymi podstawowymi, które zawiera narzędzia do zarządzania danymi referencyjnymi. Reltio jest zbudowany na grafowych bazach danych, co zapewnia mu maksymalną elastyczność, zarówno w skalowaniu magazynów danych, jak i w definiowaniu jasnych relacji między danymi w repozytorium. Inne kluczowe cechy:
- Łatwa integracja z istniejącymi narzędziami MDM i/lub innymi źródłami danych.
- Przyjazny interfejs użytkownika.
- Stale dostępna platforma w chmurze umożliwia aktualizacje bez przestojów.
Cena Reltio Cloud: Dostępna na żądanie
Najlepsze narzędzia do analityki i wizualizacji
Tableau to platforma BI dostępna zarówno w chmurze, jak i jako oprogramowanie do pobrania, posiadająca następujące kluczowe cechy:
- Łatwe łączenie się ze źródłami danych.
- Umożliwia łatwy dostęp do wizualizacji dla zespołów, partnerów i klientów.
- Umożliwia nieograniczoną eksplorację danych za pomocą interaktywnych pulpitów.
- Tworzy „startery pulpitów”, pulpity do działań skonfigurowane w ciągu kilku minut z danymi z popularnych aplikacji internetowych.
- Automatycznie tworzy interaktywne mapy.
Cena Tableau: $35-$70 za użytkownika miesięcznie.
Chartio
Chartio to oparta na chmurze platforma BI i wizualizacji posiadająca następujące kluczowe funkcje:
- Tryb interaktywny – przeciągaj i upuszczaj dane, aby tworzyć, filtrować i udostępniać pulpity nawigacyjne.
- TrybSQL – komunikuj się z bazami danych w języku SQL, aby bezpośrednio wydobywać spostrzeżenia.
- Warstwy danych – dodawaj kolejne kroki transformacji do danych, aby przekształcać wyniki zapytań.
- Wizualizacje i wykresy – natychmiast wizualizuj dane; Chartio rekomenduje najbardziej odpowiedni wykres.
- Data blending i drill downs – łącz rozbieżne źródła danych w locie i uzyskuj użyteczne spostrzeżenia bez eksploracji surowych danych.
Cena Chartio: $249/miesiąc za licencję zespołową.
Looker BI
Looker to kolejna oparta na chmurze platforma analityczna i wizualizacyjna, posiadająca następujące kluczowe cechy:
- Zdefiniuj metryki raz za pomocą LookML, prostego języka modelowania danych Lookera, a Looker napisze zapytania SQL, aby odpowiedzieć na każde pytanie dotyczące tych metryk.
- Uczyń dane pięknymi dzięki łatwym do odczytania pulpitom nawigacyjnym, które pozwalają użytkownikom drążyć i eksplorować dane.
- Połącz się bezpośrednio z bazami danych, bez żadnych ekstraktów lub oprogramowania do pobrania.
- Otwórz dostęp do pulpitów i raportów dla każdego, nie tylko dla analityków i naukowców.
Cena Bookera: $3,000 – $5,000 miesięcznie dla 10 użytkowników.
Metabase
Metabase oferuje przyjazny dla użytkownika interfejs open source do łączenia i analizowania danych. Jako narzędzie do wizualizacji danych, oferuje:
- Setki natywnych konektorów danych.
- Łatwą konfigurację i dostęp dla całego Twojego zespołu.
- Dużą gamę różnych opcji wizualizacji danych do wyboru.
- White labeled embedding (premium embedding tier and up).
- Audyt i zarządzanie uprawnieniami do danych (poziom enterprise i wyższy).
Cena Metabase: Metabase jest darmowy i open source, więc jego darmowa warstwa oferuje szereg funkcji, które będą odpowiednie dla większości użytkowników. Plany Enterprise mogą mieć ceny początkowe od $3,000 do $10,000/rok.
Microsoft Power BI
Power BI, oferta Microsoftu w zakresie analityki biznesowej, została zaprojektowana tak, aby była przydatna zarówno dla analityków biznesowych, jak i naukowców zajmujących się danymi. Główne cechy:
- Prosty interfejs typu „przeciągnij i upuść”, który został zaprojektowany tak, aby był znany użytkownikom MS Excel.
- Power BI jest platformą bezkodową i oferuje zarówno klientów desktopowych, jak i webowych.
- Biblioteka wstępnie zbudowanych konektorów
- Wydajność ma tendencję do opóźnień na bardzo dużych zbiorach danych – szukaj gdzie indziej rozwiązań big data
Cena Microsoft Power BI: $9.99 za użytkownika miesięcznie lub bezpłatnie za wersję podstawową.
Mode Analytics
Mode Analytics oferuje oparty na sieci Web pakiet do analizy danych skierowany do naukowców i analityków, z naciskiem na współpracę i udostępnianie. Niektóre z kluczowych funkcji Mode’a:
- Zaprojektowane tak, aby szczególnie łatwo było podłączyć Twoje źródła danych do ich wbudowanego edytora SQL i platformy wizualizacji.
- Mode może przesyłać wyniki zapytań SQL bezpośrednio do ramki danych R lub Pandas w notatniku Mode-native.
- Dziel się danymi, analizą i wynikowym dashboardem za pośrednictwem Mode.
- Mode jest dobrym wyborem dla zespołu naukowców zajmujących się danymi, którzy chcą mieć możliwość łatwiejszej współpracy.
Cena Mode Analytics: dostępna na żądanie.
W kierunku zautomatyzowanego zarządzania danymi
Objęliśmy pięć sposobów myślenia o narzędziach do zarządzania danymi – zarządzanie danymi referencyjnymi, zarządzanie danymi głównymi (MDM), ETL i analitykę dużych danych – oraz kilka świetnych narzędzi w każdej kategorii.
W miarę jak infrastruktura danych przenosi się do chmury, coraz więcej stosu danych staje się zarządzanych i w pełni zintegrowanych. Nie da się zastąpić zarządzania procesami biznesowymi wokół ustrukturyzowanych danych w dużych organizacjach. Ale platformy oparte na chmurze mogą pomóc w znacznej części strategii zarządzania danymi – od obróbki i przygotowania surowych danych, do pobierania danych, ładowania, transformacji, optymalizacji i wizualizacji – automatycznie w jednym systemie.