Datenmanagement ist ein weit gefasster und mehrdeutiger Begriff. Die Global Data Management Community (DAMA International) definiert es als „die Entwicklung von Architekturen, Richtlinien, Praktiken und Verfahren zur Verwaltung des Lebenszyklus von Daten“. Aber was ist wirklich gemeint, wenn man von „Datenmanagement“ spricht? Wir schlagen fünf Möglichkeiten vor:
- Cloud-Datenmanagement – der Prozess der Integration von Daten aus dem Ökosystem von Cloud-Anwendungen eines Unternehmens. Das Hauptunterscheidungsmerkmal des Cloud-Datenmanagements besteht darin, dass die gesamte Datenspeicherung, -aufnahme und -verarbeitung in einem Cloud-basierten Speichermedium stattfindet.
- ETL und Datenintegration – Laden von Daten aus Datenquellen in ein Data Warehouse, Transformieren, Zusammenfassen und Aggregieren in ein Format, das für tiefgreifende Analysen geeignet ist.
- Stammdatenverwaltung – eine Methode zur Verwaltung kritischer Unternehmensdaten: Kunden, Konten und Parteien, die in Geschäftstransaktionen genannt werden, in einer standardisierten Weise, die Redundanz im gesamten Unternehmen verhindert.
- Referenzdatenverwaltung – definiert zulässige Werte, die von anderen Datenfeldern verwendet werden können, wie Postleitzahlen, Listen von Ländern, Regionen und Städten oder Produktseriennummern. Referenzdaten können selbst erstellt oder extern bereitgestellt werden.
- Datenanalyse und -visualisierung – Verarbeitung ausgewählter Daten aus Big-Data-Quellen und Data-Warehouses, Durchführung fortgeschrittener Datenanalysen und Ermöglichung von Analysten und Datenwissenschaftlern, Visualisierungen und Dashboards zu schneiden, zu würfeln und zu präsentieren.
Bei den heutigen riesigen Datenmengen sind qualitativ hochwertige Tools unerlässlich, um Best Practices für das Datenmanagement zu erreichen. Unternehmen verwenden Datenmanagement-Tools aus allen fünf oben genannten Kategorien, um den Datenmanagementprozess zu verwalten und zu automatisieren:
- Cloud-Datenmanagement-Tools – in der Cloud, für die Cloud entwickelt, stellen diese Tools über APIs, Webhooks oder direkte Datenbankverbindungen eine Verbindung zu mehreren Datenquellen her und integrieren diese.
- ETL-Tools – unterstützen Unternehmen beim Laden von Daten aus mehreren Quellen, bei der Definition komplexer, automatisierter Datenumwandlungen, beim Testen der Datenpipeline und beim kontinuierlichen Laden von Daten in eine Zieldatenbank oder ein Data Warehouse.
- Datentransformations-Tools – helfen bei der Umwandlung von Rohdaten in saubere, aggregierte, analysierbare Daten auf dem Weg von einzelnen Datenquellen zu einem Analyse-Warehouse – oder innerhalb des Analyse-Warehouses am Ort der Analyse.
- Stammdatenmanagement-Tools (MDM) – helfen bei der Visualisierung komplexer Stammdatensätze im gesamten Unternehmen und erleichtern die Datenverwaltung durch Fachleute, die die Erstellung und Pflege von Referenzdaten überwachen.
- Tools für das Referenzdatenmanagement (RDM) – werden oft als Teil von MDM-Suites bereitgestellt, definieren Geschäftsprozesse rund um Referenzdaten und unterstützen die Beteiligten bei der Befüllung von Referenzdaten und deren Verwaltung im Laufe der Zeit.
- Datenvisualisierungs- und Datenanalysetools – helfen Unternehmen bei der Erkundung, Analyse und Visualisierung großer Datensätze und bei der Erstellung von Berichten und Dashboards, um Erkenntnisse zu gewinnen und Geschäftsentscheidungen zu treffen.
Nachfolgend stellen wir Ihnen einige großartige Tools aus jeder dieser Kategorien vor, damit Sie die einzelnen Kategorien besser verstehen und das beste Datenmanagement-Tool für Ihre Anforderungen auswählen können.
Da Speicherplatz und Bandbreite billiger geworden sind, werden immer mehr externe Lösungen für Data Warehousing und Management angeboten. Unternehmen, die große Datenmengen speichern, sichten und analysieren müssen, speichern und verwalten ihre Daten inzwischen routinemäßig vollständig in der Cloud. Dieser Arbeitsablauf wurde durch die Verbreitung von Cloud-Datenmanagement-Tools in den letzten 5-10 Jahren ermöglicht. Während die Branche bisher vor allem von Giganten wie Amazon und Google angeführt wurde, bieten nun auch viele kleinere Unternehmen Tools für Kunden mit Datenbedarf jeder Größe an. Im Folgenden finden Sie eine Liste möglicher Optionen für das Cloud-Datenmanagement.
- Panoply
- Amazon Web Services
- Microsoft Azure
- Google Cloud
- Beste ETL- und Datenintegrations-Tools
- Informatica Powercenter
- Stitch Data
- Fivetran
- Microsoft SQL Server SSIS
- Azure Data Factory
- Talend
- Alooma
- Beste Datenumwandlungstools
- DBT
- Airflow
- Luigi
- Beste Stammdatenmanagement-Tools
- Profisee
- SAP NetWeaver
- Semarchy xDM
- Tibco MDM
- Ataccama ONE
- Stibo STEP
- Bestes Referenzdatenmanagement-Tool
- Magnitude
- Informatica MDM Reference 360
- Reltio Cloud
- Beste Analyse- und Visualisierungstools
- Chartio
- Looker BI
- Metabase
- Microsoft Power BI
- Mode Analytics
- Auf dem Weg zum automatisierten Datenmanagement
Panoply
Panoply bietet ein Cloud-natives automatisiertes Data Warehouse, das die Integration und Verwaltung aller Daten Ihres Unternehmens erleichtert. Hauptmerkmale:
- Die große Auswahl an nativen Datenkonnektoren ermöglicht eine einfache, Datenaufnahme mit einem Klick
- Automatisierte Datenaufnahme und -vorverarbeitung setzt IT-Ressourcen frei
- Intuitives Management-Dashboard macht Datenmanagement und Budgetierung zum Kinderspiel
- Automatisierte Skalierung und Wartung von Datenbanken mit mehreren Knoten für
- In-Browser-SQL-Editor für die Datenanalyse und -abfrage
- Verbindungen zu gängigen Datenvisualisierungs- und Analyseprogrammen wie Tableau, Looker, Chartio
Panoply Preis: $325/Monat
Amazon Web Services
Amazon Web Services bietet eine ständig wachsende Palette von Tools, die zu einem effektiven Cloud-Datenmanagement-Stack zusammengestellt werden können. Zu den wichtigsten Diensten gehören:
- Amazon S3 für temporäre und/oder Zwischenspeicherung
- Amazon Glacier für langfristige Sicherung und Speicherung
- AWS Glue für den Aufbau von Datenkatalogen zur Kategorisierung, Suche und Abfrage Ihrer Daten
- Amazon Athena für SQL-basierte Datenanalysen
- Amazon Redshift für Data Warehousing
- Amazon Quicksight für die Erstellung von Dashboards und die Datenvisualisierung
- Jeder Service wird separat aufgesetzt und abgerechnet, so dass die Kosten vom Umfang der Nutzung abhängen
AWS Preis: Variabel, abhängig von der Implementierung
Microsoft Azure
Die Azure-Plattform von Microsoft bietet verschiedene Möglichkeiten, ein Cloud-basiertes Datenverwaltungssystem einzurichten, sowie Analysetools, die für Ihre in Azure gespeicherten Daten verwendet werden können. Wie AWS ermöglicht Azure mehrere Datenbank-/Data-Warehouse-Varianten mit einer Vielzahl von Tools für deren Verwaltung. Zu den wichtigsten Diensten gehören:
- Standard-SQL-Datenbanken und VM-basierte SQL-Server
- Blob-Speicher
- Tabellenspeicheroptionen im NoSQL-Stil
- Private Cloud-Bereitstellungen
- Azure Data Explorer (ADX) – ein kürzlich hinzugefügter Dienst, der die Echtzeitanalyse sehr großer Streaming-Daten ohne Vorverarbeitung ermöglicht
- Einfache Integration mit Panoply für ELT/ETL-Dienste
Azure-Preis: Variabel, abhängig von der Implementierung
Google Cloud
Wie Amazon bietet auch die Cloud-Plattform von Google eine breite Palette von Tools für das Cloud-basierte Datenmanagement sowie einen Workflow-Manager, mit dem die verschiedenen Komponenten miteinander verbunden werden können. Schlüsselkomponenten der Google Cloud:
- BigQuery für die Speicherung tabellarischer Daten
- Cloud BigTable für die Speicherung im Stil einer NoSQL-Datenbank
- Cloud Pub/Sub und Cloud Data Transfer für die Datenaufnahme; Google Cloud kann auch mit einer Vielzahl anderer Datenquellen verbunden werden
- BigQuery Analytics für SQL-ähnliche Abfragen
- ML Engine für fortgeschrittene Analysen unter Verwendung von maschinellem Lernen und KI
- Data Studio für GUI-basierte Analysen und die Erstellung von Dashboards
- Cloud Datalab für codebasierte Data Science
- Verbindungen zu gängigen BI-Tools wie Tableau, Looker usw.
Google Cloud Preis: variabel, abhängig von der Implementierung
Beste ETL- und Datenintegrations-Tools
Für eine umfassende Liste von EL-Tools schauen Sie sich unsere Liste der Top ETL-Tools an.
Informatica Powercenter
Informatica Powercenter ist ein On-Premise-ETL-Tool mit den folgenden Hauptmerkmalen:
- Nahtlose Konnektivität und Integration mit allen Arten von Datenquellen durch sofort einsatzbereite Konnektoren.
- Automatisierte Datenvalidierung – skriptfreie automatisierte Prüfung und Validierung der verschobenen oder umgewandelten Daten.
- Erweiterte Datentransformationen – unterstützt nicht-relationale Daten und ist in der Lage, XML-, JSON-, PDF-, Microsoft Office- und IoT-Daten zu parsen.
- Metadatengesteuertes Management – bietet grafische Ansichten von Datenflüssen, Auswirkungen und Abstammung.
Informatica PowerCenter Preis: $2.000/Monat für den einfachsten Plan
Stitch Data
Stitch Data ist eine Cloud-basierte ETL-Plattform mit folgenden Hauptfunktionen:
- Vorintegriert mit Dutzenden von Datenquellen in und außerhalb der Cloud, bewegt Daten in Amazon Redshift, S3, BigQuery, Panoply, PostgreSQL und mehr.
- Einfache Zeitplanung für die Datenreplikation.
- Fehlerbehandlung und Alarmierung mit automatischer Lösung, wenn möglich.
- API- und JSON-Framework, mit dem Sie Daten programmatisch in ein Data Warehouse übertragen können.
- Verwalteter Cloud-Service mit automatischer Skalierung und SLAs auf Unternehmensniveau.
Stitch-Preis: $100 – $1.000/Monat, je nach Datengröße
Fivetran
Fivetran ist eine vollständig verwaltete Datenpipeline mit einer Webschnittstelle, die Daten aus SaaS-Diensten und Datenbanken in ein einziges Data Warehouse integriert. Hauptmerkmale:
-
Bietet eine direkte Integration und sendet Daten über eine direkte sichere Verbindung unter Verwendung einer ausgeklügelten Caching-Schicht.
-
Die Caching-Schicht hilft, Daten von einem Punkt zum anderen zu verschieben, ohne jemals eine Kopie auf dem Anwendungsserver zu speichern.
-
Fivetran legt keine Datenbegrenzung fest.
-
Kann verwendet werden, um die Daten eines Unternehmens zu zentralisieren und alle Quellen zu integrieren, um Key Performance Indicators (KPIs) im gesamten Unternehmen zu ermitteln.
Fivetran Preis: Erhältlich auf Anfrage
3. Blendo
Blendo ist ein weiterer Cloud-basierter ETL- und Datenintegrationsdienst mit den folgenden Hauptmerkmalen:
- Selbstbedienung – verbindet sich mit wenigen Klicks mit zahlreichen Datenquellen und verschiebt Daten zu Amazon Redshift, Panoply, PostgreSQL, MS SQL Server und mehr.
- Historische Daten – lädt und synchronisiert historische Daten aus Cloud-Diensten.
- Geplantes Laden – lädt Daten periodisch oder in ausgewählten Abständen aus verschiedenen Datenquellen.
- Optimierung des Datenschemas – automatisierte Erfassung, Erkennung und Aufbereitung von Daten unter Verwendung eines optimalen relationalen Schemas.
Preis: Erhältlich auf Anfrage
Microsoft SQL Server SSIS
Microsoft bietet SSIS, eine grafische Schnittstelle für die Verwaltung von ETL mit MS SQL Server. Key features include:
- Die einfach zu bedienende Schnittstelle ermöglicht es Anwendern, integrierte Data-Warehousing-Lösungen bereitzustellen, ohne viel – oder gar keinen – Code schreiben zu müssen.
- Die grafische Oberfläche ermöglicht ein einfaches Drag-and-Drop-ETL für mehrere Datentypen und Warehouse-Ziele, einschließlich Nicht-MS-DBs.
- Gute Lösung für ein Team mit unterschiedlichen technischen Fähigkeiten, da sie für ETL-Ninjas und Point-and-Click-Typen gleichermaßen effektiv ist.
SSIS Preis: $931 – $15.000
Azure Data Factory
Zusätzlich zu SQL Server SSIS, Microsofts On-Premise-ETL-Lösung, bietet das Unternehmen auch Azure Data Factory (ADF) an, ein ETL-Tool für seine Cloud-basierte Azure-Plattform. Hauptmerkmale von ADF:
- ETL-Pipelines in ADF werden in einer grafischen Oberfläche erstellt, was eine Low-Code-Nutzung ermöglicht.
- Eine Vielzahl von Datenkonnektoren für eine einfache Dateneingabe – mit Ausnahme der Unterstützung für das Laden von Microsoft Excel-Dateien, die seltsamerweise fehlt.
- Vollständige Unterstützung für das Laden von Daten in Azure Data Warehouses
Azure Data Factory Preis: 1 $ für 1.000 Läufe pro Monat
Talend
Talend Open-Source-Softwareprodukte für die Datenintegration bieten Software zur Integration, Bereinigung, Maskierung und Profilierung von Daten. Zu den wichtigsten Merkmalen der Talend-Angebote gehören:
- GUI, die die Verwaltung einer großen Anzahl von Quellsystemen über Standardkonnektoren ermöglicht.
- Master Data Management (MDM)-Funktionalität
- Eine einzige, konsistente und genaue Ansicht der wichtigsten Unternehmensdaten
Preis für Talend: $1.170/Benutzer monatlich oder $12.000 jährlich
Alooma
Alooma bietet eine unternehmensweite Datenintegrationsplattform mit integrierten ETL-Tools. Einige Hauptmerkmale der Alooma-Angebote:
- Schwerpunkt auf schnellem Aufbau von Pipelines, Überwachung der Datenqualität und Fehlerbehandlung.
- Schutz vor Datenverlust oder -beschädigung in einem potenziell fehleranfälligen ETL-Prozess.
- Flexibilität, um einzugreifen und eigene Skripte zu schreiben, um Ihre Daten nach Bedarf zu überwachen, zu bereinigen und zu verschieben.
- Gestaltet für den Betrieb im Unternehmensmaßstab.
Alooma Preis: $1.000 – $15.000/Monat
Beste Datenumwandlungstools
Dataform ist eine SQL-basierte, vollständig verwaltete Datenumwandlungsplattform zur Verwaltung von Prozessen in Ihrem Cloud Data Warehouse. Hauptmerkmale:
- Schreiben Sie SQL-Workflows im Team in einer kollaborativen IDE. Integrierte Versionskontrolle und Integration mit Github.
- Schreiben Sie Datenqualitätstests und setzen Sie Warnungen, wenn diese fehlschlagen, um sicherzustellen, dass Ihre Daten immer zuverlässig sind.
- Erstellen Sie ein zentrales Repository für Datendefinitionen in Ihrem Unternehmen, dokumentieren Sie Ihre Daten und entdecken Sie Datensätze in einem Datenkatalog.
- Führen Sie Zeitpläne aus, um sicherzustellen, dass Ihre Daten immer auf dem neuesten Stand sind.
Preis für Dataform:: ab 550 $/Monat (Startup-Rabatte verfügbar)
DBT
DBT (Data Build Tool) ist ein SQL-basiertes Datenumwandlungstool, mit dem Sie modulare Umwandlungsabläufe über die Befehlszeile einrichten können. DBT wurde mit Blick auf die Rationalisierung von Datenanalysen und technischen Arbeitsabläufen entwickelt und verfügt über folgende Hauptfunktionen:
- SQL-basiertes Tool
- Einfache Workflows für den Aufbau modularer Transformations- und Datenmodellierungsabläufe
- Automatisiertes Datenqualitätsmanagement mit einem robusten Testsystem
- Streamlined analytics code deployment using environments, Paketmanagement und kontinuierliche Integration
- Einfache Datendokumentation mit automatisch generierten DAGs und einfacher Datenkommentierung und -katalogisierung
- Daten-Snapshotting für bessere historische Datenanalysen
DBT-Preis: $0 für die kostenlose Version, $100/mo für die Basisversion, mit Angeboten für größere Unternehmensimplementierungen
Airflow
Ursprünglich bei Airbnb entwickelt, ist Airflow ein beliebtes neues Open-Source-Dateninfrastruktur-Tool. Während es selbst keine Datenverarbeitung durchführt, kann Airflow Ihnen helfen, ETL-Prozesse mit Python zu planen, zu organisieren und zu überwachen. Hauptmerkmale:
- Gerichtete azyklische Graphen (DAGs) ermöglichen es dem Planer, Ihre Aufgaben auf eine Reihe von Arbeitern zu verteilen, ohne dass Sie genaue Eltern-Kind-Beziehungen zwischen Datenflüssen definieren müssen
- Handliche webbasierte Benutzeroberfläche zum Verwalten und Bearbeiten Ihrer DAGs
- Ein schöner Satz von Werkzeugen, der es einfach macht, „DAG-Operationen“ über die Befehlszeile durchzuführen.
- Hochgradig erweiterbar und skalierbar
Airflow-Preis: kostenlos und quelloffen
Luigi
Luigi ist ein quelloffenes Python-Paket, das von Spotify entwickelt wurde. Es wurde entwickelt, um die Verwaltung lang laufender Batch-Prozesse zu vereinfachen, so dass es Aufgaben bewältigen kann, die weit über den Rahmen von ETL hinausgehen – aber es macht ETL auch ziemlich gut. Hauptmerkmale:
- Die Python-Codebasis macht es einfach, effiziente Datenpipelines zu erstellen, insbesondere solche, die sich mit lang laufenden Batch-Prozessen befassen
- Einfache Auflösung von Abhängigkeiten
- Web-Interface, das es dem Benutzer ermöglicht, Aufgaben für das Workflow-Management zu visualisieren
- Konzeptionell ähnlich wie GNU Make, aber nicht nur für Hadoop
- Atomische Dateisystemoperationen sorgen dafür, dass Ihre Pipelines nie mit unvollständigen Daten abstürzen
Luigi-Preis: Kostenlos und quelloffen
Beste Stammdatenmanagement-Tools
Dell Boomis Master Data Hub verfügt über die folgenden Hauptfunktionen:
- Definiert Modelle über eine visuelle Low-Code-Erfahrung.
- Einsatz von Datenmodellen und Identifizierung der Quellsysteme, die mit ihnen interagieren.
- Einbinden von Systemdatensätzen in ein konsolidiertes Repository, automatisches Zusammenführen ähnlicher Datensätze.
- Ermöglicht Data Stewarding – warnt Teams, um Duplikate und Dateneingabeprobleme zu lösen.
- Verwaltet Daten mit bidirektionalen Prozessflüssen in Echtzeit über Silos hinweg.
Dell Boomi Master Data Hub Preis: $100.000 – $300.000
Profisee
Profisee’s Master Data Management hat die folgenden Schlüsselfunktionen:
- Stewardship und Governance – ermöglicht „Datenverwaltern“ innerhalb der Organisation die Verwaltung von Stammdaten mit Feedback aus Analysen.
- Golden Record Management – standardisiert, bereinigt und gleicht Quelldaten ohne Kodierung ab.
- Ereignisverwaltung – erkennt Datenänderungen, verteilt Ereignisse an teilnehmende Systeme.
- Integrator – föderiert Stammdaten für globale Unternehmen, mit bidirektionaler Echtzeit-Integration.
- Enterprise Workflow – setzt Geschäftsprozesse organisationsübergreifend durch, lässt Administratoren die Leistung der Datenverwalter verwalten.
- SDK – ermöglicht die Integration benutzerdefinierter Anwendungen.
Profisee-Preis: $10.30/Stunde
SAP NetWeaver
SAP NetWeaver MDM, eine Komponente der NetWeaver-Entwicklungsplattform, hat die folgenden Hauptfunktionen:
- Automatische Extraktion von Stammdaten aus allen wichtigen SAP-Anwendungen.
- Lädt Stammdaten aus anderen Quellen.
- Integriert Daten mit Hilfe von Business Content wie Repository-Strukturen, Validierungsregeln, Inbound- und Outbound-Mappings.
- Verteilt Stammdaten an Ziele.
- Ermöglicht programmatische Datenintegration über APIs und Webservices.
SAP NetWeaver Preise: Auf Anfrage erhältlich
Semarchy xDM
Semarchy ist ein relativer Neuling in der MDM-Szene und wurde 2011 gegründet. Das Unternehmen mit Sitz in Frankreich wurde von einem Team ehemaliger Sunopsis-Mitarbeiter gegründet. xDM, ihr Haupt-MDM-Produkt, verfügt über die folgenden Funktionen:
- Nicht von Hadoop abhängig.
- Optimiert für Oracle.
- Aktualisierungen und Änderungen werden mithilfe von Metadaten nachverfolgt und weitergegeben, was eine iterative, „evolutionäre“ Datenverwaltung ermöglicht.
- Mit einer schrittweisen Benutzeroberfläche, die an bestimmte Geschäftsrollen angepasst werden kann (z. B. Analysten, Betrieb usw.).
Semarch xDM Preis: Erhältlich auf Anfrage
Tibco MDM
Tibco ist immer wieder in den Rankings der besten MDM-Tools vertreten. Key features include:
- Flexibilität und Skalierbarkeit für Multidomain-Anwendungen.
- Independente, verteilte Stammdatenschicht.
- Anpassbare visuelle No-Code-Oberfläche, die für verschiedene Geschäftsrollen entwickelt werden kann.
- Hochgradige Unterstützung der Datenversionierung.
- SOAP Web Services Unterstützung.
Tibco MDM Preis: Erhältlich auf Anfrage
Ataccama ONE
Ataccama bietet mit ONE ein hochautomatisiertes Datenmanagement-Tool, das vor Ort, in der Cloud oder in einem hybriden Setup betrieben werden kann. Key features include:
- Maschinenlernbasierte Datenkuration, -bereinigung und -klassifizierung.
- Automatisierte Metadatenerkennung.
- Automatische Projektkonfiguration.
- Domänenunabhängig, aber vorkonfiguriert mit vorgefertigten Regeln für MDM für typische Domänen wie Kunde, Kontakt und Produkt.
- Konnektoren für eine breite Palette von Datentypen und -quellen.
- GDPR-fähig.
- Vollständige Datenprüfungshistorie mit detailliertem Protokoll der angewandten Geschäftsregeln und Transformationen.
Ataccama ONE Preis: Erhältlich auf Anfrage
Stibo STEP
Stibo ist wahrscheinlich das älteste Unternehmen auf dieser Liste, da es im 18. Jahrhundert als Druckerei gegründet wurde. Jahrhundert als Druckerei gegründet wurde. Der Datenverwaltungszweig des Unternehmens ist jüngeren Datums, und STEP, sein Hauptangebot an Datenverwaltungswerkzeugen, hat die folgenden Hauptmerkmale:
- STEP Workbench UI.
- Ganzheitliche Multidomain-MDM-Plattform.
- Hohes Maß an Automatisierung.
- Automatisierte Daten- und Sprachübersetzung für multinationale Operationen.
- Automatisierte Überprüfung und Genehmigung von digitalen Assets.
- Stammdatenmanagement auf Unternehmensebene.
Stibo STEP Preis: Erhältlich auf Anfrage
Bestes Referenzdatenmanagement-Tool
Die Referenzdatenlösung von Collibra verfügt über die folgenden Hauptfunktionen:
- Automatisierte Workflows zur Erstellung neuer Codes und Codesätze.
- Bereitstellung von Codes und Codesätzen auf benutzerfreundliche Art und Weise.
- Präzise Datenzuordnung zur Beseitigung von Hindernissen beim Datenzugriff.
- Vergleich von Daten aus verschiedenen Teilen der Organisation.
Collibra-Preis: Erhältlich auf Anfrage
Magnitude
Das Referenzdatenmanagement von Magnitude verfügt über die folgenden Hauptmerkmale:
- Multi-Domain-Modellierung – unterstützt Geschäftsstrukturen von Codelisten bis hin zu mehrpfadigen, selbstreferenzierenden Hierarchien.
- Automatisierung – bietet Automatisierung, Steuerung und Kontrolle über Referenzdatenobjekte und Ladeprozesse.
- Mapping – bietet globales bis lokales, externes bis internes und spezifisches bis allgemeines Mapping ohne Unterbrechung der bestehenden Elemente.
- Governance – bietet einen anpassbaren Workflow zur Steuerung von Geschäftsprozessen im Zusammenhang mit Referenzdaten, mit modellbasierten Sicherheitskontrollen, die es den Benutzern ermöglichen, diese einzusehen, hinzuzufügen oder zu aktualisieren.
- Zeitvarianz – ermöglicht es den Benutzern, Modelle, Subjekte, Attribute und Assoziationen zu ändern und jede frühere Version des Objekts abzurufen.
Magnitude Reference Data Management Preis: Erhältlich auf Anfrage.
Informatica MDM Reference 360
Informatica’s MDM Reference 360 hat die folgenden Hauptmerkmale:
- Vollständig Cloud-basiert – verbesserte Leistung und Skalierbarkeit.
- End-to-End-Plattform – eingebettete Datenintegration, Datenqualität, Prozessmanagement.
- Selbstbedienung – Master Data Management und Workflows für Geschäftsanwender ohne technischen Hintergrund.
- Match und Merge – führt Daten aus neuen Typen und Quellen zusammen und stellt Querverweise her.
Informatica MDM Reference 360 Preis: Erhältlich auf Anfrage
Reltio Cloud
Reltio stellt mit Reltio Cloud ein graphenbasiertes Stammdatenmanagement-Tool zur Verfügung, das auch Tools zur Verwaltung von Referenzdaten enthält. Reltio baut auf Graphdatenbanken auf, um maximale Flexibilität zu erreichen, sowohl bei der Skalierung von Datenspeichern als auch bei der Definition klarer Beziehungen zwischen den Daten in Ihrem Repository. Weitere wichtige Funktionen:
- Einfache Integration mit bestehenden MDM-Tools und/oder anderen Datenquellen.
- Benutzerfreundliche Schnittstelle.
- Immer verfügbare Cloud-Plattform ermöglicht Upgrades ohne Ausfallzeiten.
Reltio Cloud Preis: Auf Anfrage erhältlich
Beste Analyse- und Visualisierungstools
Tableau ist eine BI-Plattform, die sowohl in der Cloud als auch als herunterladbare Software verfügbar ist und folgende Hauptmerkmale aufweist:
- Einfache Verbindung mit Datenquellen.
- Ermöglicht einfachen Zugriff auf Visualisierungen für Teams, Partner und Kunden.
- Ermöglicht unbegrenzte Datenexploration mit interaktiven Dashboards.
- Erstellt „Dashboard-Starter“, umsetzbare Dashboards, die in wenigen Minuten mit Daten aus beliebten Webanwendungen eingerichtet werden.
- Erstellt automatisch interaktive Karten.
Tableau Preis: $35-$70 pro Benutzer pro Monat.
Chartio
Chartio ist eine Cloud-basierte BI- und Visualisierungsplattform mit den folgenden Hauptfunktionen:
- Interaktiver Modus – Ziehen und Ablegen von Daten, um Dashboards zu erstellen, zu filtern und zu teilen.
- SQL-Modus – kommunizieren Sie mit Datenbanken in SQL, um direkt Erkenntnisse zu extrahieren.
- Datenschichtung – fügen Sie sukzessive Transformationsschritte zu Daten hinzu, um Abfrageergebnisse zu transformieren.
- Visualisierungen und Diagramme – visualisieren Sie Daten sofort; Chartio empfiehlt das am besten geeignete Diagramm.
- Data Blending und Drill Downs – kombinieren Sie unterschiedliche Datenquellen im Handumdrehen und erhalten Sie verwertbare Erkenntnisse, ohne Rohdaten zu untersuchen.
Chartio Preis: $249/Monat für eine Teamlizenz.
Looker BI
Looker ist eine weitere Cloud-basierte Analyse- und Visualisierungsplattform mit den folgenden Hauptfunktionen:
- Definieren Sie einmalig Metriken mit LookML, der einfachen Datenmodellierungssprache von Looker, und Looker schreibt SQL-Abfragen, um alle Fragen zu diesen Metriken zu beantworten.
- Machen Sie Daten mit übersichtlichen Dashboards schön, die es den Benutzern ermöglichen, Drill-Ins durchzuführen und zu erkunden.
- Verbinden Sie sich direkt mit Datenbanken, ohne Extrakte oder Software herunterzuladen.
- Öffnen Sie den Zugang zu Dashboards und Berichten für jedermann, nicht nur für Analysten oder Datenwissenschaftler.
Preis für Looker: $3.000 – $5.000 pro Monat für 10 Benutzer.
Metabase
Metabase bietet eine benutzerfreundliche, quelloffene Schnittstelle zur Verbindung und Analyse Ihrer Daten. Als Datenvisualisierungstool bietet es:
- Hunderte von nativen Datenkonnektoren.
- Einfache Einrichtung und Zugriff für Ihr gesamtes Team.
- Große Auswahl an verschiedenen Datenvisualisierungsoptionen.
- Einbettung mit weißer Beschriftung (ab Premium-Einbettungsebene).
- Prüfung und Verwaltung von Datenberechtigungen (ab Unternehmensstufe).
Preis der Datenbank: Metabase ist kostenlos und quelloffen, daher bietet die kostenlose Version eine Reihe von Funktionen, die für die meisten Benutzer geeignet sind. Die Preise für Enterprise-Pläne reichen von 3.000 bis 10.000 $/Jahr.
Microsoft Power BI
Power BI, Microsofts Angebot im Bereich der Geschäftsanalyse, ist für Geschäftsanalysten und Datenwissenschaftler gleichermaßen nützlich. Hauptmerkmale:
- Einfache Drag-and-Drop-Oberfläche, die so gestaltet ist, dass sie Benutzern von MS Excel vertraut ist.
- Power BI ist eine no-code Plattform und bietet sowohl Desktop- als auch Webclients.
- Bibliothek vorgefertigter Konnektoren
- Performance neigt dazu, bei sehr großen Datensätzen zu schwächeln – suchen Sie nach anderen Big-Data-Lösungen
Microsoft Power BI Preis: 9,99 $ pro Benutzer und Monat oder kostenlos für die Basisversion.
Mode Analytics
Mode Analytics bietet eine webbasierte Datenanalyse-Suite, die sich an Datenwissenschaftler und -analysten richtet, wobei der Schwerpunkt auf Zusammenarbeit und gemeinsamer Nutzung liegt. Einige der wichtigsten Funktionen von Mode:
- Der integrierte SQL-Editor und die Visualisierungsplattform sollen die Anbindung von Datenquellen besonders einfach machen.
- Mode kann die Ergebnisse Ihrer SQL-Abfragen direkt in einen R- oder Pandas-Dataframe in einem Mode-nativen Notizbuch leiten.
- Daten, Analysen und das daraus resultierende Dashboard können über Mode geteilt werden.
- Mode ist eine gute Wahl für ein Team von Datenwissenschaftlern, die einfacher zusammenarbeiten möchten.
Mode Analytics Preis: auf Anfrage erhältlich.
Auf dem Weg zum automatisierten Datenmanagement
Wir haben uns mit fünf Arten von Datenmanagement-Tools beschäftigt – Referenzdatenmanagement, Stammdatenmanagement (MDM), ETL und Big Data Analytics – und einige großartige Tools in jeder Kategorie vorgestellt.
Wenn sich die Dateninfrastruktur in die Cloud verlagert, wird ein größerer Teil des Datenstapels verwaltet und vollständig integriert. Es gibt keinen Ersatz für die Verwaltung von Geschäftsprozessen rund um strukturierte Daten in großen Unternehmen. Aber Cloud-basierte Plattformen können bei einem Großteil der Datenmanagement-Strategie helfen – von der Behandlung und Vorbereitung von Rohdaten bis hin zur Datenaufnahme, dem Laden, der Transformation, der Optimierung und der Visualisierung – automatisch in einem einzigen System.