28 Outils de gestion des données & 5 façons de penser la gestion des données

La gestion des données est un concept large et ambigu. La communauté mondiale de la gestion des données (DAMA International) la définit comme « le développement d’architectures, de politiques, de pratiques et de procédures pour gérer le cycle de vie des données ». Mais lorsque les gens disent « gestion des données », que veulent-ils vraiment dire ? Nous suggérons cinq possibilités:

  1. Gestion des données en nuage – le processus d’intégration des données provenant de l’écosystème d’applications en nuage d’une organisation. La principale distinction de la gestion des données en nuage est que tout le stockage, la prise et le traitement des données ont lieu sur un support de stockage en nuage.
  2. ETL et intégration des données – chargement des données à partir de sources de données dans un entrepôt de données, transformation, résumé et agrégation dans un format adapté à une analyse approfondie.
  3. Gestion des données de référence – méthode de gestion des données organisationnelles critiques : clients, comptes et parties nommées dans les transactions commerciales, d’une manière normalisée qui empêche la redondance dans l’ensemble de l’organisation.
  4. Gestion des données de référence – définit les valeurs autorisées qui peuvent être utilisées par d’autres champs de données, comme les codes postaux, les listes de pays, de régions et de villes, ou les numéros de série des produits. Les données de référence peuvent être produites en interne ou fournies en externe.
  5. Analyse et visualisation des données – traitement de données sélectionnées à partir de sources de données volumineuses et d’entrepôts de données, réalisation d’analyses de données avancées et possibilité pour les analystes et les scientifiques des données de découper, de découper et de présenter des visualisations et des tableaux de bord.

Avec les quantités massives de données actuelles, des outils de haute qualité sont essentiels pour atteindre les meilleures pratiques de gestion des données. Les organisations utilisent des outils de gestion des données des cinq catégories ci-dessus, pour gérer et automatiser le processus de gestion des données :

  1. Outils de gestion des données en nuage – construits sur le nuage, pour le nuage, ces outils se connectent et intègrent de multiples sources de données via des API, des webhooks ou des connexions directes aux bases de données.
  2. Outils ETL – aident les organisations à charger des données provenant de sources multiples, à définir des transformations complexes et automatisées des données, à tester le pipeline de données et à charger les données en continu dans une base de données cible ou un entrepôt de données.
  3. Outils de transformation des données – aident à la transformation des données brutes en données propres, agrégées et analysables lorsqu’elles passent des sources de données individuelles à un entrepôt d’analyse – ou au sein de l’entrepôt d’analyse, au point d’analyse.
  4. Les outils de gestion des données de référence (MDM) – aident à visualiser des ensembles complexes de données de référence dans toute l’organisation, et facilitent la gérance des données par les experts en la matière, qui supervisent la création et la maintenance des données de référence.
  5. Outils de gestion des données de référence (RDM) – souvent fournis dans le cadre de suites MDM, définissent les processus métier autour des données de référence, et aident les parties prenantes à alimenter les données de référence et à les gérer dans le temps.
  6. Outils de visualisation et d’analyse des données – aident les organisations à explorer, analyser et visualiser des ensembles de données volumineux, et à générer des rapports et des tableaux de bord pour extraire des informations et guider les décisions commerciales.

Ci-après, nous couvrons plusieurs grands outils de chacune de ces catégories, à la fois pour vous aider à comprendre chaque catégorie et pour vous rapprocher de la sélection du meilleur outil de gestion des données pour vos besoins.

A mesure que le stockage et la bande passante sont devenus moins chers, de plus en plus de solutions hors site pour le stockage et la gestion des données sont devenues disponibles. Les entreprises ayant de grandes quantités de données à stocker, à passer au crible et à analyser stockent et gèrent désormais couramment leurs données entièrement dans le cloud. Ce flux de travail a été rendu possible par la prolifération des outils de gestion des données dans le nuage au cours des 5 à 10 dernières années. Si, jusqu’à présent, ce sont surtout des géants comme Amazon et Google qui ont mené le bal, de nombreuses entreprises plus petites proposent désormais des outils pour les clients ayant des besoins en données de toutes tailles. Voir ci-dessous pour une liste d’options potentielles pour la gestion des données en nuage.

Panoply

Panoply propose un entrepôt de données automatisé natif du cloud qui facilite l’intégration et la gestion de toutes les données de votre organisation. Principales fonctionnalités :

  • La grande sélection de connecteurs de données natifs permet une facile, ingestion de données en un clic
  • L’ingestion de données et le prétraitement automatisés libèrent les ressources informatiques
  • Un tableau de bord de gestion intuitif rend la gestion des données et la budgétisation moins aléatoire
  • Mise à l’échelle et maintenance automatisées des bases de données multi-nœuds pour un entreposage de données à faiblemaintenance
  • Éditeur SQL dans le navigateur pour l’analyse et l’interrogation des données
  • Connexions aux suites courantes de visualisation et d’analyse des données telles que Tableau, Looker, Chartio

Prix de Panoply : 325 $/mois

Amazon Web Services

Amazon Web Services offre un ensemble toujours plus vaste d’outils qui peuvent être rassemblés dans une pile de gestion des données en nuage efficace. Les principaux services comprennent :

  • Amazon S3 pour le stockage temporaire et/ou intermédiaire
  • Amazon Glacier pour la sauvegarde et le stockage à long terme
  • AWS Glue pour construire des catalogues de données afin de catégoriser, rechercher et interroger vos données
  • Amazon Athena pour l’analyse de données basée sur SQL
  • Amazon Redshift pour l’entreposage de données
  • Amazon Quicksight pour la construction de tableaux de bord et la visualisation de données
  • Chaque service est filé et facturé séparément, les coûts dépendent donc de l’étendue de l’utilisation

AWS Price : variable, dépendant de la mise en œuvre

Microsoft Azure

La plateforme Azure de Microsoft fournit un certain nombre de façons différentes de mettre en place un système de gestion des données basé sur le cloud, ainsi que des outils d’analyse qui peuvent être utilisés sur vos données stockées sur Azure. Comme AWS, Azure permet plusieurs styles de bases de données/entrepôts de données avec un grand ensemble d’outils pour les gérer. Les principaux services comprennent :

  • Bases de données SQL standard et serveurs SQL basés sur VM
  • Stockage de blocs
  • Options de stockage de tables de style NoSQL
  • Déploiements de clouds privés
  • Azure Data Explorer (ADX) -. un service récemment ajouté qui permet l’analyse en temps réel de très grandes données en continu sans nécessiter de prétraitement
  • Intégration facile avec Panoply pour les services ELT/ETL

Prix d’Azure : variable, dépendant de la mise en œuvre

Google Cloud

Comme Amazon, la plateforme Cloud de Google offre un large éventail d’outils pour la gestion des données dans le cloud, ainsi qu’un gestionnaire de flux de travail qui peut être utilisé pour lier les différents composants entre eux. Principaux composants de Google Cloud :

  • BigQuery pour le stockage de données tabulaires
  • Cloud BigTable pour le stockage de type base de données NoSQL
  • Cloud Pub/Sub et Cloud Data Transfer pour l’admission des données ; Google Cloud peut également se connecter à une variété d’autres sources de données
  • BigQuery analytics pour les requêtes de style SQL
  • ML Engine pour des analyses plus avancées utilisant l’apprentissage automatique et l’IA
  • Data Studio pour l’analyse basée sur une interface graphique et la construction de tableaux de bord
  • Cloud Datalab pour la science des données basée sur le code
  • Connexions aux outils de BI courants comme Tableau, Looker, etc.

Prix du cloud Google : variable, dépendant de la mise en œuvre

Meilleurs outils d’ETL et d’intégration de données

Pour la liste complète des outils d’EL, consultez notre liste des meilleurs outils d’ETL.

Informatica Powercenter

Informatica Powercenter est un outil ETL sur site avec les caractéristiques clés suivantes :

  • Connectivité et intégration transparentes avec tous les types de sources de données à l’aide de connecteurs prêts à l’emploi.
  • Validation automatisée des données – audit et validation automatisés sans script des données déplacées ou transformées.
  • Transformations avancées des données – prend en charge les données non relationnelles, capable d’analyser les données XML, JSON, PDF, Microsoft Office et IoT.
  • Gestion axée sur les métadonnées – fournit des vues graphiques des flux de données, de l’impact et du lignage.

Prix d’Informatica PowerCenter : 2000 $/mois pour le plan le plus basique

Stitch Data

Stitch Data est une plateforme ETL basée sur le cloud avec les fonctionnalités clés suivantes :

  • Pré-intégrée avec des dizaines de sources de données sur et hors cloud, déplace les données dans Amazon Redshift, S3, BigQuery, Panoply, PostgreSQL, et plus encore.
  • Planification facile de la réplication des données.
  • Gestion des erreurs et alertes avec résolution automatisée lorsque cela est possible.
  • Cadre API et JSON, vous permettant de pousser les données dans un entrepôt de données de manière programmatique.
  • Service cloud géré avec une mise à l’échelle automatique et des SLA de niveau entreprise.

Prix de Point : 100 à 1000 $/mois en fonction de la taille des données

Fivetran

Fivetran est un pipeline de données entièrement géré avec une interface Web qui intègre les données des services SaaS et des bases de données dans un seul entrepôt de données. Principales caractéristiques :

  • Fournit une intégration directe et envoie les données sur une connexion directe sécurisée en utilisant une couche de cache sophistiquée.

  • La couche de mise en cache permet de déplacer les données d’un point à un autre sans jamais en stocker une copie sur le serveur d’application.

  • Fivetran n’impose aucune limite de données.

  • Peut être utilisé pour centraliser les données d’une entreprise et intégrer toutes les sources pour déterminer les indicateurs clés de performance (ICP) dans toute une organisation.

Prix de Fivetran : Disponible sur demande

3. Blendo

Blendo est un autre service d’ETL et d’intégration de données basé sur le cloud, avec les principales caractéristiques suivantes :

  • Self service – se connecte à de nombreuses sources de données en quelques clics, déplace les données vers Amazon Redshift, Panoply, PostgreSQL, MS SQL Server, et plus encore.
  • Données historiques – charge et synchronise les données historiques à partir de services cloud.
  • Chargement programmé – charge les données périodiquement ou à des fréquences sélectionnées à partir de différentes sources de données.
  • Optimisation du schéma de données – collecte, détection et préparation automatisées des données à l’aide d’un schéma relationnel optimal.

Prix de Blendo : Disponible sur demande

Microsoft SQL Server SSIS

Microsoft propose SSIS, une interface graphique permettant de gérer l’ETL à l’aide de MS SQL Server. Les principales fonctionnalités comprennent :

  • Une interface facile à utiliser permet aux utilisateurs de déployer des solutions intégrées d’entreposage de données sans avoir à s’impliquer dans l’écriture de beaucoup – ou de tout – code.
  • L’interface graphique permet un ETL facile par glisser-déposer pour plusieurs types de données et de destinations d’entrepôt, y compris les BD non-MS.
  • Solution idéale pour une équipe avec un mélange de niveaux de compétences techniques, car elle est aussi efficace pour les ninjas de l’ETL que pour les types de pointer-cliquer.

Prix de SSIS : 931 $ – 15 000 $

Azure Data Factory

En plus de SQL Server SSIS, la solution ETL sur site de Microsoft, la société propose également Azure Data Factory (ADF), un outil ETL pour sa plateforme Azure basée sur le cloud. Principales caractéristiques d’ADF :

  • Les pipelines ETL dans ADF sont construits dans une interface graphique, permettant une utilisation low-code.
  • Grande variété de connecteurs de données pour une ingestion facile des données – sauf, étrangement, le support pour le chargement des fichiers Microsoft Excel.
  • Prise en charge complète du chargement de données dans les entrepôts de données Azure

Prix d’Azure Data Factory : 1 $ pour 1 000 exécutions par mois

Talend

Les produits logiciels d’intégration de données open source de Talend fournissent des logiciels pour intégrer, nettoyer, masquer et profiler les données. Les principales caractéristiques des offres de Talend comprennent :

  • GUI qui permet de gérer un grand nombre de systèmes sources à l’aide de connecteurs standard.
  • Fonctionnalité de gestion des données maîtresses (MDM)
  • Vue unique, cohérente et précise des données clés de l’entreprise.

Prix de Talend : 1 170 $/utilisateur par mois ou 12 000 $ par an

Alooma

Alooma offre une plateforme d’intégration de données à l’échelle de l’entreprise avec de grands outils ETL intégrés. Quelques caractéristiques clés des offres d’Alooma :

  • Forte concentration sur la construction rapide de pipeline, le contrôle de la qualité des données et le traitement des erreurs.
  • Protection contre la perte ou la corruption des données dans un processus ETL potentiellement sujet aux erreurs.
  • Flexibilité d’intervention et d’écriture de vos propres scripts pour surveiller, nettoyer et déplacer vos données selon les besoins.
  • Conçu pour les opérations à l’échelle de l’entreprise.

Prix d’Aloma : 1 000 $ – 15 000 $/mois

Meilleurs outils de transformation de données

Dataform est une plateforme de transformation de données basée sur SQL et entièrement gérée pour gérer les processus dans votre entrepôt de données en nuage. Principales caractéristiques :

  • Écrivez des flux de travail SQL en équipe dans un IDE collaboratif. Contrôle de version intégré et intégration avec Github.
  • Écrivez des tests de qualité des données et définissez des alertes en cas d’échec pour vous assurer que vos données sont toujours fiables.
  • Créez un référentiel centralisé pour les définitions de données à travers votre entreprise, documentez vos données et découvrez des ensembles de données dans un catalogue de données.
  • Exécutez des planifications pour vous assurer que vos données sont toujours à jour.

Prix de Dataform : : A partir de 550 $/mois (remises de démarrage disponibles)

DBT

DBT (Data Build Tool) est un outil de transformation de données basé sur SQL qui vous permet de configurer des flux de transformation modulaires à partir de la ligne de commande. Construit dans le but de rationaliser les flux d’analyse de données et d’ingénierie, les principales fonctionnalités de DBT comprennent :

  • Outil basé sur SQL
  • Flux de travail faciles pour la création de flux de transformation modulaire et de modélisation des données
  • Gestion automatisée de la qualité des données avec un système de test robuste
  • Déploiement simplifié du code d’analyse à l’aide d’environnements, la gestion des paquets et l’intégration continue
  • Documentation facile des données avec des DAG générés automatiquement et l’annotation et le catalogage faciles des données
  • Capture d’instantanés de données pour une meilleure analyse des données historiques

Prix deDBT : 0 $ pour le volet gratuit, 100 $/mois pour le volet de base, avec des devis disponibles pour les déploiements de grandes entreprises

Airflow

Développé à l’origine chez Airbnb, Airflow est un nouvel outil d’infrastructure de données open source populaire. Bien qu’il ne fasse aucun traitement de données lui-même, Airflow peut vous aider à planifier, organiser et surveiller les processus ETL en utilisant python. Caractéristiques principales :

  • Les graphes acycliques dirigés (DAG) permettent à son planificateur de répartir vos tâches sur un ensemble de travailleurs sans vous obliger à définir des relations parent-enfant précises entre les flux de données
  • Une interface utilisateur web pratique pour gérer et modifier vos DAG
  • Un ensemble d’outils agréable qui facilite la « chirurgie des DAG » à partir de la ligne de commande.
  • Hautement extensible et évolutif

Prix d’Airflow : gratuit et open source

Luigi

Luigi est un package Python open source développé par Spotify. Il est conçu pour faciliter la gestion des processus batch à long terme, de sorte qu’il peut gérer des tâches qui vont bien au-delà de la portée de l’ETL – mais il fait l’ETL assez bien, aussi. Caractéristiques principales :

  • La base de code Python facilite la construction de pipelines de données efficaces, en particulier ceux qui traitent des processus batch à longue exécution
  • Résolution facile des dépendances
  • Interface Web qui permet à l’utilisateur de visualiser les tâches pour la gestion du flux de travail
  • Conceptuellement similaire à GNU Make, mais n’est pas seulement pour Hadoop
  • Les opérations de système de fichiers atomiques garantissent que vos pipelines ne se planteront jamais avec des données partielles

Prix de Luigi : Gratuit et open source

Meilleurs outils de gestion des données de référence

Le Master Data Hub de Dell Boomi présente les principales caractéristiques suivantes :

  • Définit les modèles via un low-code, une expérience visuelle.
  • Déploie les modèles de données et identifie les systèmes sources qui interagissent avec eux.
  • Ensemble les enregistrements du système dans un référentiel consolidé, fusionne automatiquement les enregistrements similaires.
  • Autorise le stewarding des données – alerte les équipes pour résoudre les doublons et les problèmes de saisie de données.
  • Gouverne les données avec des flux de processus bidirectionnels en temps réel à travers les silos.

Prix du Master Data Hub de Dell Boomi : 100 000 $ – 300 000 $

Profisee

La gestion des données de référence de Profisee présente les caractéristiques clés suivantes :

  • Gérance et gouvernance – permet aux « intendants de données » au sein de l’organisation de gérer les données de référence avec les commentaires des analyses.
  • Gestion des enregistrements d’or – standardise, nettoie et fait correspondre les données sources sans codage.
  • Gestion des événements – détecte les changements de données, distribue les événements aux systèmes abonnés.
  • Intégrateur – fédère les données de base pour les entreprises mondiales, avec une intégration bidirectionnelle en temps réel.
  • Flux de travail d’entreprise – applique les processus d’affaires à travers l’organisation, permet aux administrateurs de gérer les performances des responsables des données.
  • SDK – permet l’intégration d’applications personnalisées.

Prix du profane : 10 $.30 $/heure

SAP NetWeaver

SAP NetWeaver MDM, un composant de la plate-forme de développement NetWeaver, présente les principales caractéristiques suivantes :

  • Extrait automatiquement les données de base de toutes les principales applications SAP.
  • Charge les données de base d’autres sources.
  • Intègre les données en utilisant le contenu métier comme les structures de référentiel, les règles de validation, les mappings entrants et sortants.
  • Distribue les données de base aux cibles.
  • Permet l’intégration programmatique des données via les API et les services web.

Prix SAP NetWeaver : Disponible sur demande

Semarchy xDM

Semarchy est un relativement nouveau venu sur la scène MDM, ayant été lancé en 2011. Basée en France, elle a été fondée par une équipe d’anciens employés de Sunopsis. xDM, leur principal produit MDM, présente les caractéristiques suivantes :

  • Non dépendant de Hadoop.
  • Optimisé pour Oracle.
  • Les mises à jour et les modifications sont suivies et propagées à l’aide de métadonnées, ce qui permet une gestion itérative et « évolutive » des données.
  • Comportent une interface utilisateur étape par étape qui peut être personnalisée pour des rôles commerciaux spécifiques (c’est-à-dire les analystes, les opérations, etc.).

Prix de Semarch xDM : Disponible sur demande

Tibco MDM

Tibco est une place pérenne dans les classements des meilleurs outils MDM. Les principales caractéristiques comprennent :

  • Flexibilité et évolutivité pour les applications multidomaines.
  • Couche de données de base indépendante et distribuée.
  • Interface visuelle no-code personnalisable qui peut être construite pour s’adapter à divers rôles commerciaux.
  • Prise en charge du versionnage des données à haute valeur ajoutée.
  • Support des services Web SOAP.

Prix du MDM de Tibco : Disponible sur demande

Ataccama ONE

Ataccama propose ONE, un outil de gestion des données hautement automatisé qui peut être exécuté sur site, dans le cloud ou dans une configuration hybride. Les principales fonctionnalités comprennent :

  • Curage, nettoyage et classification des données basés sur l’apprentissage machine.
  • Découverte automatisée de métadonnées.
  • Configuration automatisée des projets.
  • Domaine agnostique, mais livré préconfiguré avec des règles préconstruites pour le MDM pour des domaines typiques tels que le client, le contact et le produit.
  • Connecteurs pour une large gamme de types de données et de sources.
  • Prêt pour le GDPR.
  • Historique complet d’audit des données avec un journal détaillé des règles commerciales et des transformations appliquées.

Prix d’Ataccama ONE : Disponible sur demande

Stibo STEP

Stibo a la particularité d’être probablement la plus ancienne entreprise de la liste, ayant été fondée au 18ème siècle en tant que société d’impression. La branche de gestion de données de la société est un ajout plus jeune, et STEP, son offre principale d’outils de gestion de données, a les caractéristiques clés suivantes:

  • STEP Workbench UI.
  • Plate-forme MDM multidomaine holistique.
  • Haut niveau d’automatisation.
  • Traduction automatisée des données et des langues pour les opérations multinationales.
  • Examen et approbation automatisés des actifs numériques.
  • Gestion des données de base au niveau de l’entreprise.

Prix de Stibo STEP : Disponible sur demande

Meilleurs outils de gestion des données de référence

La solution de données de référence de Collibra présente les caractéristiques clés suivantes :

  • Automatise les flux de travail pour créer de nouveaux codes et ensembles de codes.
  • Fournit des codes et des ensembles de codes aux utilisateurs de manière conviviale.
  • Réalise un mappage précis des données pour éliminer les obstacles à l’accès aux données.
  • Compose les données provenant de différentes parties de l’organisation.

Prix de Collibra : Disponible sur demande

Magnitude

La gestion des données de référence de Magnitude présente les caractéristiques clés suivantes :

  • Modélisation multi-domaines – prend en charge les structures d’entreprise, des listes de codes aux hiérarchies multi-trajets et auto-référencées.
  • Automatisation – fournit l’automatisation, la gouvernance et le contrôle des objets de données de référence et des processus de chargement.
  • Mappage – fournit un mappage global à local, externe à interne et spécifique à général sans perturbation des éléments existants.
  • Gouvernance – fournit un flux de travail personnalisable pour contrôler les processus métier liés aux données de référence, avec des contrôles de sécurité basés sur le modèle permettant aux utilisateurs de visualiser, d’ajouter ou de mettre à jour.
  • Variance temporelle – permet aux utilisateurs de modifier les modèles, les sujets, les attributs et les associations et de récupérer toute version antérieure de l’objet.

Prix de la gestion des données de référence Magnitude : Disponible sur demande

Informatica MDM Reference 360

Le MDM Reference 360 d’Informatica présente les caractéristiques clés suivantes :

  • Finalement basé sur le cloud – performances et évolutivité améliorées.
  • Plate-forme de bout en bout – intégration de données embarquée, qualité des données, gestion des processus.
  • Service autonome – Gestion des données de référence et workflows construits pour les utilisateurs professionnels sans connaissances techniques.
  • Match et fusion – fusionne et croise les données provenant de nouveaux types et sources.

Prix d’Informatica MDM Reference 360 : Disponible sur demande

Reltio Cloud

Reltio fabrique Reltio Cloud, un outil de gestion des données de référence basé sur des graphes qui comprend des outils de gestion des données de référence. Reltio est construit sur des bases de données graphiques pour lui donner un maximum de flexibilité, à la fois dans la mise à l’échelle des magasins de données et dans la définition de relations claires entre les données de votre référentiel. Autres caractéristiques clés :

  • Intégration facile avec les outils MDM existants et/ou d’autres sources de données.
  • Interface conviviale pour les utilisateurs.
  • Une plateforme cloud toujours disponible permet des mises à niveau sans temps d’arrêt.

Prix de Reltio Cloud : Disponible sur demande

Meilleurs outils d’analyse et de visualisation

Tableau est une plateforme de BI disponible à la fois sur le cloud et en tant que logiciel téléchargeable, avec les caractéristiques clés suivantes :

  • Facilement connectée aux sources de données.
  • Permet un accès facile aux visualisations pour les équipes, les partenaires et les clients.
  • permet une exploration illimitée des données avec des tableaux de bord interactifs.
  • Crée des « dashboard starters », des tableaux de bord exploitables configurés en quelques minutes avec des données provenant d’applications web populaires.
  • Crée automatiquement des cartes interactives.

Prix de Tableau : 35 à 70 dollars par utilisateur et par mois.

Chartio

Chartio est une plateforme de BI et de visualisation basée sur le cloud avec les principales fonctionnalités suivantes :

  • Mode interactif – faites glisser et déposez des données pour créer, filtrer et partager des tableaux de bord.
  • Mode SQL – communiquez avec les bases de données en SQL pour extraire directement des insights.
  • Couche de données – ajoutez des étapes de transformation successives aux données pour transformer les résultats des requêtes.
  • Visualisations et graphiques – visualisez instantanément les données ; Chartio recommande le graphique le plus approprié.
  • Mélange de données et forage – combinez des sources de données disparates à la volée et obtenez des insights exploitables sans explorer les données brutes.

Prix de Chartio : 249 $/mois pour une licence d’équipe.

Looker BI

Looker est une autre plateforme d’analyse et de visualisation basée sur le cloud, avec les fonctionnalités clés suivantes :

  • Définissez les métriques une fois en utilisant LookML, le langage de modélisation de données simple de Looker, et Looker écrit des requêtes SQL pour répondre à n’importe quelle question sur ces métriques.
  • Rendre les données belles avec des tableaux de bord faciles à lire qui permettent aux utilisateurs de forer et d’explorer.
  • Connectez directement aux bases de données, sans extraits ou logiciels à télécharger.
  • Ouvrez l’accès aux tableaux de bord et aux rapports à tout le monde, pas seulement aux analystes ou aux scientifiques des données.

Prix de Looker : 3 000 $ – 5 000 $ par mois pour 10 utilisateurs.

Metabase

Metabase offre une interface conviviale et open source pour connecter et analyser vos données. En tant qu’outil de visualisation de données, il offre :

  • Des centaines de connecteurs de données natifs.
  • Une configuration et un accès faciles pour toute votre équipe.
  • Un large éventail d’options de visualisation de données différentes à choisir.
  • Intégration en marque blanche (niveau d’intégration premium et plus).
  • Audit et gestion des autorisations de données (niveau entreprise et plus).

Prix de Metabase : Metabase est gratuit et open source, donc son volet gratuit offre une gamme de fonctionnalités qui conviendront à la plupart des utilisateurs. Les plans d’entreprise peuvent aller de 3 000 à 10 000 $/an comme prix de départ.

Microsoft Power BI

Power BI, l’offre de Microsoft dans l’espace d’analyse commerciale, est conçue pour être utile aux analystes commerciaux et aux scientifiques des données. Principales caractéristiques :

  • Interface simple de type glisser-déposer qui est conçue pour être familière aux utilisateurs de MS Excel.
  • Power BI est une plateforme sans code, et offre des clients de bureau et web.
  • Bibliothèque de connecteurs préconstruits
  • La performance a tendance à traîner sur de très grands ensembles de données – regardez ailleurs pour les solutions de big data

Prix de Microsoft Power BI : 9,99 $ par utilisateur et par mois, ou gratuit pour la version de base.

Mode Analytics

Mode Analytics offre une suite d’analyse de données basée sur le Web destinée aux scientifiques et aux analystes de données, avec un accent sur la collaboration et le partage. Quelques-unes des principales caractéristiques de Mode :

  • Conçu pour rendre particulièrement facile la connexion de vos sources de données à leur éditeur SQL intégré et à leur plateforme de visualisation.
  • Mode peut canaliser les résultats de vos requêtes SQL directement dans un cadre de données R ou Pandas dans un notebook natif de Mode.
  • Partagez les données, l’analyse et le tableau de bord résultant tout au long de Mode.
  • Mode est un bon choix pour une équipe de scientifiques de données qui veulent être en mesure de collaborer plus facilement.

Prix de Mode Analytics : disponible sur demande.

Vers une gestion automatisée des données

Nous avons couvert cinq façons de penser aux outils de gestion des données – gestion des données de référence, gestion des données de référence (MDM), ETL et analyse des big data – et quelques excellents outils dans chaque catégorie.

A mesure que l’infrastructure de données se déplace vers le cloud, une plus grande partie de la pile de données devient gérée et entièrement intégrée. Rien ne remplace la gestion des processus métier autour des données structurées dans les grandes organisations. Mais les plateformes basées sur le cloud peuvent aider à une grande partie de la stratégie de gestion des données – du traitement et de la préparation des données brutes, à l’ingestion, au chargement, à la transformation, à l’optimisation et à la visualisation des données – automatiquement dans un seul système.