28 Strumenti di gestione dei dati & 5 modi di pensare alla gestione dei dati

La gestione dei dati è un concetto ampio e ambiguo. La Global Data Management Community (DAMA International) lo definisce come “lo sviluppo di architetture, politiche, pratiche e procedure per gestire il ciclo di vita dei dati”. Ma quando la gente dice “gestione dei dati”, cosa intende veramente? Suggeriamo cinque possibilità:

  1. Gestione dei dati cloud – il processo di integrazione dei dati dall’ecosistema di applicazioni cloud di un’organizzazione. La principale distinzione della gestione dei dati nel cloud è che tutta l’archiviazione, l’assunzione e l’elaborazione dei dati avviene in un mezzo di archiviazione basato sul cloud.
  2. ETL e integrazione dei dati – caricare i dati da fonti di dati in un data warehouse, trasformandoli, riassumendoli e aggregandoli in un formato adatto ad analisi di alto livello.
  3. Gestione dei dati master – un metodo per gestire i dati organizzativi critici: clienti, conti e parti nominate nelle transazioni commerciali, in un modo standardizzato che previene la ridondanza in tutta l’organizzazione.
  4. Gestione dei dati di riferimento – definisce i valori ammissibili che possono essere utilizzati da altri campi di dati, come codici postali, elenchi di paesi, regioni e città, o numeri di serie dei prodotti. I dati di riferimento possono essere creati in casa o forniti dall’esterno.
  5. Analisi dei dati e visualizzazione – elaborazione di dati selezionati da grandi fonti di dati e magazzini di dati, esecuzione di analisi avanzate dei dati e possibilità per analisti e scienziati dei dati di affettare, tagliare e presentare visualizzazioni e dashboard.

Con le enormi quantità di dati di oggi, gli strumenti di alta qualità sono essenziali per raggiungere le migliori pratiche di gestione dei dati. Le organizzazioni utilizzano strumenti di gestione dei dati di tutte e cinque le categorie precedenti, per gestire e automatizzare il processo di gestione dei dati:

  1. Strumenti di gestione dei dati cloud – costruiti sul cloud, per il cloud, questi strumenti si collegano e integrano più fonti di dati tramite API, webhooks, o connessioni dirette ai database.
  2. Strumenti ETL – aiutano le organizzazioni a caricare i dati da più fonti, a definire trasformazioni complesse e automatizzate dei dati, a testare la pipeline di dati e a caricare continuamente i dati in un database di destinazione o in un data warehouse.
  3. Strumenti di trasformazione dei dati – aiutano a trasformare i dati grezzi in dati puliti, aggregati e analizzabili mentre si spostano dalle singole fonti di dati a un magazzino di analisi – o all’interno del magazzino di analisi, nel punto di analisi.
  4. Strumenti per la gestione dei dati master (MDM) – aiutano a visualizzare insiemi complessi di dati master in tutta l’organizzazione e facilitano la gestione dei dati da parte di esperti in materia, che supervisionano la creazione e la manutenzione dei dati di riferimento.
  5. Strumenti di gestione dei dati di riferimento (RDM) – spesso forniti come parte delle suite MDM, definiscono i processi di business intorno ai dati di riferimento e aiutano le parti interessate a popolare i dati di riferimento e a gestirli nel tempo.
  6. Strumenti di visualizzazione e analisi dei dati – aiutano le organizzazioni a esplorare, analizzare e visualizzare grandi insiemi di dati, e a generare report e cruscotti per estrarre intuizioni e guidare le decisioni aziendali.

Di seguito copriamo diversi ottimi strumenti di ciascuna di queste categorie, sia per aiutarvi a capire ogni categoria che per avvicinarvi a scegliere il miglior strumento di gestione dei dati per le vostre esigenze.

Come lo storage e la larghezza di banda sono diventati più economici, sono diventate disponibili sempre più soluzioni off-premise per il data warehousing e la gestione. Le aziende con grandi quantità di dati da archiviare, vagliare e analizzare ora abitualmente archiviano e gestiscono i loro dati interamente nel cloud. Questo flusso di lavoro è stato reso possibile dalla proliferazione di strumenti di gestione dei dati nel cloud negli ultimi 5-10 anni. Mentre il campo è stato guidato principalmente da giganti come Amazon e Google finora, molte aziende più piccole ora offrono strumenti per i clienti con esigenze di dati di tutte le dimensioni. Vedi sotto per una lista di potenziali opzioni per la gestione dei dati nel cloud.

Panoply

Panoply offre un data warehouse automatizzato cloud-native che rende facile integrare e gestire tutti i dati della vostra organizzazione. Caratteristiche principali:

  • Grande selezione di connettori di dati nativi permette una facile, un clic per l’ingestione dei dati
  • L’ingestione e la pre-elaborazione automatizzata dei dati libera le risorse IT
  • Il cruscotto di gestione intuitivo elimina la congettura della gestione dei dati e del budget
  • Scalamento e manutenzione automatizzati dei database a più nodi per unmanutenzione del data warehousing
  • Editore SQL in-browser per l’analisi e l’interrogazione dei dati
  • Collegamenti alle comuni suite di visualizzazione e analisi dei dati come Tableau, Looker, Chartio

Prezzo di Panoply: $325/mese

Amazon Web Services

Amazon Web Services offre una serie sempre crescente di strumenti che possono essere messi insieme in un efficace stack di gestione dei dati cloud. I servizi chiave includono:

  • Amazon S3 per lo stoccaggio temporaneo e/o intermedio
  • Amazon Glacier per il backup e lo stoccaggio a lungo termine
  • AWS Glue per costruire cataloghi di dati per categorizzare,
  • Amazon Athena per l’analisi dei dati basata su SQL
  • Amazon Redshift per il data warehousing
  • Amazon Quicksight per la costruzione di dashboard e la visualizzazione dei dati
  • Ogni servizio viene avviato e fatturato separatamente, quindi i costi dipendono dal grado di utilizzo

Prezzo di AWS: variabile, dipende dall’implementazione

Microsoft Azure

La piattaforma Azure di Microsoft fornisce una serie di modi diversi per impostare un sistema di gestione dei dati basato sul cloud, nonché strumenti di analisi che possono essere utilizzati sui dati memorizzati in Azure. Come AWS, Azure permette più stili di database/data warehouse con una grande serie di strumenti per gestirli. I servizi chiave includono:

  • Database SQL standard e server SQL basati su VM
  • Blob storage
  • Opzioni di archiviazione delle tabelle in stile NoSQL
  • Impianti di cloud privato
  • Azure Data Explorer (ADX) – un servizio aggiunto di recente che permette l’analisi in tempo reale di dati in streaming molto grandi senza bisogno di pre-elaborazione
  • Facile integrazione con Panoply per servizi ELT/ETL

Prezzo Azure: variabile, dipende dall’implementazione

Google Cloud

Come Amazon, la piattaforma Cloud di Google offre un ampio set di strumenti per la gestione dei dati basati sul cloud, così come un gestore del flusso di lavoro che può essere utilizzato per legare insieme i diversi componenti. Componenti chiave di Google Cloud:

  • BigQuery per l’archiviazione dei dati tabulari
  • Cloud BigTable per l’archiviazione in stile database NoSQL
  • Cloud Pub/Sub e Cloud Data Transfer per l’assunzione dei dati; Google Cloud può anche connettersi con una varietà di altre fonti di dati
  • Analisi BigQuery per query in stile SQL
  • MotoreML per analisi più avanzate utilizzando l’apprendimento automatico e AI
  • Data Studio per analisi basate su GUI e costruzione di dashboard
  • Cloud Datalab per scienza dei dati basata sul codice
  • Collegamenti a comuni strumenti di BI come Tableau, Looker, ecc.

Prezzo Google cloud: variabile, dipende dall’implementazione

Migliori strumenti ETL e di integrazione dati

Per la lista completa degli strumenti EL controlla la nostra lista dei migliori strumenti ETL.

Informatica Powercenter

Informatica Powercenter è uno strumento ETL on-premise con le seguenti caratteristiche chiave:

  • Connettività e integrazione senza soluzione di continuità con tutti i tipi di fonti di dati utilizzando connettori out-of-the-box.
  • Convalida automatizzata dei dati – controllo e convalida automatica senza script dei dati spostati o trasformati.
  • Trasformazioni avanzate dei dati – supporta dati non relazionali, in grado di analizzare dati XML, JSON, PDF, Microsoft Office e IoT.
  • Gestione guidata dai metadati – fornisce visualizzazioni grafiche dei flussi di dati, dell’impatto e del lineage.

Prezzo di Informatica PowerCenter: $2.000/mese per il piano di base

Stitch Data

Stitch Data è una piattaforma ETL basata sul cloud con le seguenti caratteristiche chiave:

  • Pre-integrata con decine di fonti di dati dentro e fuori il cloud, sposta i dati in Amazon Redshift, S3, BigQuery, Panoply, PostgreSQL e altro.
  • Facile programmazione per la replica dei dati.
  • Gestione degli errori e avvisi con risoluzione automatica quando possibile.
  • API e framework JSON, che ti permettono di spingere i dati in un data warehouse programmaticamente.
  • Servizio cloud gestito con scaling automatico e SLA di livello enterprise.

Prezzo di Stitch: $100 – $1.000/mese in base alle dimensioni dei dati

Fivetran

Fivetran è una pipeline di dati completamente gestita con un’interfaccia web che integra i dati da servizi SaaS e database in un unico data warehouse. Caratteristiche principali:

  • Fornisce un’integrazione diretta e invia i dati su una connessione diretta e sicura usando un sofisticato strato di caching.

  • Lo strato di caching aiuta a spostare i dati da un punto all’altro senza mai memorizzare una copia sul server dell’applicazione.

  • Fivetran non impone alcun limite di dati.

  • Può essere usato per centralizzare i dati di un’azienda e integrare tutte le fonti per determinare i Key Performance Indicators (KPI) di un’intera organizzazione.

Prezzo diFivetran: Disponibile su richiesta

3. Blendo

Blendo è un altro servizio di ETL e integrazione dati basato sul cloud, con le seguenti caratteristiche chiave:

  • Self service – si connette a numerose fonti di dati con pochi clic, sposta i dati su Amazon Redshift, Panoply, PostgreSQL, MS SQL Server, e altro.
  • Dati storici – carica e sincronizza i dati storici dai servizi cloud.
  • Carico programmato – carica i dati periodicamente o a frequenze selezionate da diverse fonti di dati.
  • Ottimizzazione dello schema dei dati – raccolta automatica, rilevamento e preparazione dei dati utilizzando uno schema relazionale ottimale.

Prezzo blendo: Disponibile su richiesta

Microsoft SQL Server SSIS

Microsoft offre SSIS, un’interfaccia grafica per gestire ETL usando MS SQL Server. Le caratteristiche principali includono:

  • L’interfaccia facile da usare permette agli utenti di implementare soluzioni integrate di data warehousing senza dover scrivere molto o nessun codice.
  • L’interfaccia grafica permette un facile drag-and-drop ETL per più tipi di dati e destinazioni di magazzino, compresi i DB non MS.
  • Soluzione ideale per un team con un mix di livelli di abilità tecnica, poiché è ugualmente efficace per i ninja dell’ETL e i tipi point-and-click.

Prezzo SSIS: $931 – $15.000

Azure Data Factory

Oltre a SQL Server SSIS, la soluzione ETL on-premise di Microsoft, l’azienda offre anche Azure Data Factory (ADF), uno strumento ETL per la loro piattaforma Azure basata su cloud. Caratteristiche principali di ADF:

  • Le pipeline ETL in ADF sono costruite in un’interfaccia grafica, permettendo un uso a basso codice.
  • Ampia varietà di connettori di dati per una facile ingestione di dati – eccetto, stranamente, il supporto per il caricamento di file Microsoft Excel.
  • Supporto completo per il caricamento di dati in magazzini di dati Azure

Prezzo di Azure Data Factory: 1$ per 1.000 esecuzioni al mese

Talend

I prodotti software open source di integrazione dati di Talend forniscono software per integrare, pulire, mascherare e profilare i dati. Le caratteristiche principali delle offerte Talend includono:

  • GUI che permette di gestire un gran numero di sistemi sorgente usando connettori standard.
  • Funzionalità Master Data Management (MDM)
  • Visione unica, coerente e accurata dei dati aziendali chiave.

Prezzo di Talend: $1.170/utente mensile o $12.000 annuale

Alooma

Alooma offre una piattaforma di integrazione dati su scala aziendale con grandi strumenti ETL incorporati. Alcune caratteristiche chiave delle offerte Alooma:

  • Forte attenzione alla costruzione rapida di pipeline, al monitoraggio della qualità dei dati e alla gestione degli errori.
  • Protezione contro la perdita o la corruzione dei dati in un processo ETL potenzialmente soggetto a errori.
  • Flessibilità di intervenire e scrivere i propri script per monitorare, pulire e spostare i dati secondo necessità.
  • Progettato per operazioni su scala aziendale.

Prezzo di Alooma: $1.000 – $15.000/mese

Migliori strumenti di trasformazione dei dati

Dataform è una piattaforma di trasformazione dei dati basata su SQL e completamente gestita per la gestione dei processi nel vostro data warehouse cloud. Caratteristiche principali:

  • Scrivi flussi di lavoro SQL come una squadra in un IDE collaborativo. Controllo di versione integrato e integrazione con Github.
  • Scrivi test di qualità dei dati e imposta avvisi se falliscono per garantire che i tuoi dati siano sempre affidabili.
  • Crea un repository centralizzato per le definizioni dei dati nella tua azienda, documenta i tuoi dati e scopri i dataset in un catalogo dati.
  • Esegui le pianificazioni per garantire che i tuoi dati siano sempre aggiornati.

Prezzo di Dataform:: Da $550/mese (sconti iniziali disponibili)

DBT

DBT (Data Build Tool) è uno strumento di trasformazione dati basato su SQL che ti permette di impostare flussi di trasformazione modulari dalla riga di comando. Costruito con un occhio all’ottimizzazione dell’analisi dei dati e dei flussi di lavoro di ingegneria, le caratteristiche chiave di DBT includono:

  • Strumento basato su SQL
  • Flussi di lavoro semplici per costruire flussi modulari di trasformazione e modellazione dei dati
  • Gestione automatizzata della qualità dei dati con un robusto sistema di test
  • Distribuzione semplificata del codice analitico utilizzando ambienti, gestione dei pacchetti e integrazione continua
  • Documentazione dei dati semplificata con DAG generati automaticamente e facile annotazione e catalogazione dei dati
  • Data snapshotting per una migliore analisi storica dei dati

Prezzo diDBT: $0 per il tier gratuito, $100/mo per quello di base, con preventivi disponibili per grandi distribuzioni aziendali

Airflow

Originariamente sviluppato da Airbnb, Airflow è un nuovo popolare strumento open source di infrastruttura dati. Mentre non fa alcuna elaborazione dei dati, Airflow può aiutarvi a pianificare, organizzare e monitorare i processi ETL usando python. Caratteristiche principali:

  • I Directed Acyclic Graphs (DAGs) permettono al suo scheduler di distribuire i vostri compiti su una serie di lavoratori senza che voi dobbiate definire precise relazioni padre-figlio tra i flussi di dati
  • Facile interfaccia utente basata sul web per gestire e modificare i vostri DAGs
  • Bella serie di strumenti che rende facile eseguire la “chirurgia DAG” dalla riga di comando.
  • Altamente estensibile e scalabile

Prezzo di Airflow: libero e open source

Luigi

Luigi è un pacchetto Python open source sviluppato da Spotify. È progettato per rendere più facile la gestione di processi batch di lunga durata, quindi può gestire compiti che vanno ben oltre lo scopo di ETL – ma fa anche ETL abbastanza bene. Caratteristiche principali:

  • La codebase Python rende facile costruire pipeline di dati efficienti, specialmente quelle che hanno a che fare con processi batch di lunga durata
  • Facile risoluzione delle dipendenze
  • Interfaccia web che permette all’utente di visualizzare i compiti per la gestione del flusso di lavoro
  • Concettualmente simile a GNU Make, ma non è solo per Hadoop
  • Le operazioni di file system atomiche assicurano che le vostre pipeline non si bloccheranno mai con dati parziali

Prezzo Luigi: Gratuito e open source

Migliori strumenti di Master Data Management

Il Master Data Hub di Dell Boomi ha le seguenti caratteristiche chiave:

  • Definisce i modelli attraverso un’esperienza visiva a basso codice.
  • Esplora i modelli di dati e identifica quali sistemi di origine interagiscono con essi.
  • Inserisce i record di sistema in un repository consolidato, fonde automaticamente i record simili.
  • Abilita il data stewarding – allerta i team per risolvere i duplicati e i problemi di inserimento dati.
  • Gestisce i dati con flussi di processo bidirezionali in tempo reale attraverso i silos.

Dell Boomi Master Data Hub prezzo: $100.000 – $300.000

Profisee

Profisee’s Master Data Management ha le seguenti caratteristiche chiave:

  • Stewardship e governance – permette ai “data steward” all’interno dell’organizzazione di gestire i dati master con feedback da analisi.
  • Gestione dei record d’oro – standardizza, pulisce e abbina i dati di origine senza codifica.
  • Gestione degli eventi – rileva i cambiamenti dei dati, distribuisce gli eventi ai sistemi sottoscrittori.
  • Integratore – federa i dati master per le imprese globali, con integrazione bidirezionale in tempo reale.
  • Flusso di lavoro aziendale – fa rispettare i processi aziendali attraverso l’organizzazione, consente agli amministratori di gestire le prestazioni degli steward dei dati.
  • SDK – consente l’integrazione di applicazioni personalizzate.

Prezzo per i profitti: $10.30/ora

SAP NetWeaver

SAP NetWeaver MDM, un componente della piattaforma di sviluppo NetWeaver, ha le seguenti caratteristiche chiave:

  • Estrae automaticamente i dati master da tutte le principali applicazioni SAP.
  • Carica i dati master da altre fonti.
  • Integra i dati usando contenuti aziendali come strutture di repository, regole di convalida, mappature in entrata e in uscita.
  • Distribuisce i dati master agli obiettivi.
  • Integrazione programmatica dei dati tramite API e servizi web.

Prezzi SAP NetWeaver: Disponibile su richiesta

Semarchy xDM

Semarchy è un nuovo arrivato sulla scena MDM, essendo stato lanciato nel 2011. Con sede in Francia, è stata fondata da un team di ex dipendenti Sunopsis. xDM, il loro principale prodotto MDM, ha le seguenti caratteristiche:

  • Non-Hadoop dipendente.
  • Ottimizzato per Oracle.
  • Gli aggiornamenti e i cambiamenti sono tracciati e propagati usando i metadati, permettendo una gestione iterativa ed “evolutiva” dei dati.
  • Caratterizza un’interfaccia utente passo dopo passo che può essere personalizzata per specifici ruoli aziendali (cioè analisti, operazioni, ecc.).

Prezzo xDM di marzo: Disponibile su richiesta

Tibco MDM

Tibco è un piazzato perenne nelle classifiche dei migliori strumenti MDM. Le caratteristiche principali includono:

  • Flessibilità e scalabilità per applicazioni multidominio.
  • Strato di dati master indipendente e distribuito.
  • Interfaccia visiva no-code personalizzabile che può essere costruita per soddisfare vari ruoli aziendali.
  • Supporto per il versioning dei dati di alta qualità.
  • Supporto ai servizi WebSOAP.

Prezzo MDM Tibco: Disponibile su richiesta

Ataccama ONE

Ataccama offre ONE, uno strumento di gestione dei dati altamente automatizzato che può essere eseguito on-premise, nel cloud o in una configurazione ibrida. Le caratteristiche principali includono:

  • Cura, pulizia e classificazione dei dati basata sul machine learning.
  • Ricerca automatizzata dei metadati.
  • Configurazione automatica del progetto.
  • Agnostico al dominio, ma preconfigurato con regole pre-costruite per MDM per domini tipici come cliente, contatto e prodotto.
  • Connettori per una vasta gamma di tipi di dati e fonti.
  • Pronto per il GDPR.
  • Storia completa di audit dei dati con registro dettagliato delle regole di business applicate e delle trasformazioni.

Prezzo di Ataccama ONE: Disponibile su richiesta

Stibo STEP

Stibo ha la particolarità di essere probabilmente l’azienda più antica della lista, essendo stata fondata nel XVIII secolo come azienda di stampa. Il ramo di gestione dei dati dell’azienda è più giovane, e STEP, la sua principale offerta di strumenti di gestione dei dati, ha le seguenti caratteristiche chiave:

  • STEP Workbench UI.
  • Piattaforma MDM multidominio olistica.
  • Alto livello di automazione.
  • Traduzione automatizzata di dati e lingue per operazioni multinazionali.
  • Rassegna e approvazione automatizzata delle risorse digitali.
  • Gestione dei dati master a livello aziendale.

Prezzo Stibo STEP: Disponibile su richiesta

Migliori strumenti di gestione dei dati di riferimento

La soluzione Reference Data di Collibra ha le seguenti caratteristiche chiave:

  • Automatizza i flussi di lavoro per creare nuovi codici e set di codici.
  • Consegna codici e set di codici agli utenti in modo amichevole.
  • Esegue un’accurata mappatura dei dati per eliminare le barriere all’accesso ai dati.
  • Compara i dati provenienti da diverse parti dell’organizzazione.

Prezzoollibra: Disponibile su richiesta

Magnitude

Magnitude’s Reference Data Management ha le seguenti caratteristiche chiave:

  • Modellazione multi-dominio – supporta strutture aziendali da liste di codici a gerarchie multi-path e auto-riferimento.
  • Automazione – fornisce automazione, governance e controllo sugli oggetti dei dati di riferimento e sui processi di caricamento.
  • Mappatura – fornisce una mappatura da globale a locale, da esterna a interna e da specifica a generale senza interruzione degli elementi esistenti.
  • Governance – fornisce un flusso di lavoro personalizzabile per controllare i processi aziendali relativi ai dati di riferimento, con controlli di sicurezza basati sul modello che consentono agli utenti di visualizzare, aggiungere o aggiornare.
  • Variazione temporale – consente agli utenti di modificare modelli, soggetti, attributi e associazioni e di recuperare qualsiasi versione precedente dell’oggetto.

Prezzo di gestione dei dati di riferimento: Disponibile su richiesta

Informatica MDM Reference 360

Informatica MDM Reference 360 ha le seguenti caratteristiche chiave:

  • Pienamente basato sul cloud – migliori prestazioni e scalabilità.
  • Piattaforma end-to-end – integrazione dei dati incorporata, qualità dei dati, gestione dei processi.
  • Self service – Master Data Management e flussi di lavoro costruiti per gli utenti aziendali senza background tecnico.
  • Match e merge – fonde e incrocia i dati da nuovi tipi e fonti.

Prezzo di Informatica MDM Reference 360: Disponibile su richiesta

Reltio Cloud

Reltio produce Reltio Cloud, uno strumento di gestione dei dati master basato su grafici che include strumenti di gestione dei dati di riferimento. Reltio è costruito su database a grafo per dare la massima flessibilità, sia nel ridimensionamento degli archivi di dati che nella definizione di chiare relazioni tra i dati nel vostro repository. Altre caratteristiche chiave:

  • Facile integrazione con strumenti MDM esistenti e/o altre fonti di dati.
  • Interfaccia facile da usare.
  • La piattaforma cloud sempre disponibile rende possibili aggiornamenti senza tempi morti.

Prezzo di Reltio Cloud: Disponibile su richiesta

Migliori strumenti di analisi e visualizzazione

Tableau è una piattaforma di BI disponibile sia sul cloud che come software scaricabile, con le seguenti caratteristiche chiave:

  • Si collega facilmente alle fonti di dati.
  • Consente un facile accesso alle visualizzazioni per team, partner e clienti.
  • Consente un’esplorazione illimitata dei dati con dashboard interattivi.
  • Crea “dashboard starter”, dashboard attivabili impostati in pochi minuti con dati provenienti da applicazioni web popolari.
  • Crea automaticamente mappe interattive.

Prezzo di Tableau: $35-$70 per utente al mese.

Chartio

Chartio è una piattaforma di BI e visualizzazione basata su cloud con le seguenti caratteristiche chiave:

  • Modalità interattiva – trascina i dati per creare, filtrare e condividere dashboard.
  • Modalità SQL – comunica con i database in SQL per estrarre direttamente approfondimenti.
  • Data layering – aggiunge fasi di trasformazione successive ai dati per trasformare i risultati delle query.
  • Visualizzazioni e grafici – visualizza istantaneamente i dati; Chartio raccomanda il grafico più appropriato.
  • Data blending e drill downs – combina diverse fonti di dati al volo e ottieni intuizioni utili senza esplorare i dati grezzi.

Prezzo di Chartio: $249/mese per una licenza di squadra.

Looker BI

Looker è un’altra piattaforma di analisi e visualizzazione basata sul cloud, con le seguenti caratteristiche chiave:

  • Definire le metriche una volta usando LookML, il semplice linguaggio di modellazione dei dati di Looker, e Looker scrive query SQL per rispondere a qualsiasi domanda su quelle metriche.
  • Rendere i dati belli con dashboard facili da leggere che permettono agli utenti di approfondire ed esplorare.
  • Connettiti direttamente ai database, senza estratti o software da scaricare.
  • Apri l’accesso a dashboard e report a tutti, non solo agli analisti o agli scienziati dei dati.

Prezzo di Looker: $3.000 – $5.000 al mese per 10 utenti.

Metabase

Metabase offre un’interfaccia user-friendly e open source per collegare e analizzare i dati. Come strumento di visualizzazione dei dati, offre:

  • Centinaia di connettori di dati nativi.
  • Configurazione e accesso facili per tutto il tuo team.
  • Grande gamma di diverse opzioni di visualizzazione dei dati tra cui scegliere.
  • Bianco etichettato embedding (livello di embedding premium e superiore).
  • Gestione delle autorizzazioni dei dati e audit (livello enterprise e superiore).

Prezzo di Metabase: Metabase è gratuito e open source, quindi il suo tier gratuito offre una serie di caratteristiche che saranno adatte alla maggior parte degli utenti. I piani aziendali possono variare da $3.000 a $10.000/anno di prezzi iniziali.

Microsoft Power BI

Power BI, l’offerta di Microsoft nello spazio dell’analisi aziendale, è progettata per essere utile agli analisti di business e agli scienziati di dati. Caratteristiche principali:

  • Semplice interfaccia drag-and-drop che è progettata per essere familiare agli utenti di MS Excel.
  • Power BI è una piattaforma no-code, e offre sia client desktop che web.
  • Biblioteca di connettori pre-costruiti
  • Le prestazioni tendono a ritardare su insiemi di dati molto grandi – guarda altrove per soluzioni di big data

Prezzo di Microsoft Power BI: $9.99 per utente al mese, o gratis per la versione base.

Mode Analytics

Mode Analytics offre una suite di analisi dei dati basata sul web rivolta a scienziati e analisti di dati, con un focus sulla collaborazione e condivisione. Alcune delle caratteristiche principali di Mode:

  • Progettato per rendere particolarmente facile la connessione delle fonti di dati al loro editor SQL integrato e alla piattaforma di visualizzazione.
  • Mode può convogliare i risultati delle tue query SQL direttamente in un dataframe R o Pandas in un notebook nativo di Mode.
  • Condividi i dati, l’analisi e il dashboard risultante attraverso Mode.
  • Mode è una buona scelta per un team di scienziati di dati che vogliono essere in grado di collaborare più facilmente.

Prezzo di Mode Analytics: disponibile su richiesta.

Verso la gestione automatizzata dei dati

Abbiamo trattato cinque modi di pensare agli strumenti di gestione dei dati – Reference Data Management, Master Data Management (MDM), ETL e big data analytics – e alcuni ottimi strumenti in ogni categoria.

Come l’infrastruttura dei dati si sposta nel cloud, più dello stack dei dati viene gestito e completamente integrato. Non c’è nessun sostituto per la gestione dei processi di business intorno ai dati strutturati nelle grandi organizzazioni. Ma le piattaforme basate sul cloud possono aiutare con gran parte della strategia di gestione dei dati – dal trattamento e dalla preparazione dei dati grezzi, all’ingestione dei dati, al caricamento, alla trasformazione, all’ottimizzazione e alla visualizzazione – automaticamente in un unico sistema.