28 Instrumente de management al datelor și 5 moduri de a gândi despre managementul datelor

Managementul datelor este un concept larg și ambiguu. Comunitatea Global Data Management Community (DAMA International) îl definește ca fiind „dezvoltarea de arhitecturi, politici, practici și proceduri pentru a gestiona ciclul de viață al datelor”. Dar când oamenii spun „gestionarea datelor”, la ce se referă cu adevărat? Sugerăm cinci posibilități:

  1. Managementul datelor în cloud – procesul de integrare a datelor din ecosistemul de aplicații în cloud al unei organizații. Principala distincție a gestionării datelor în cloud este că toate stocarea, preluarea și procesarea datelor au loc într-un mediu de stocare bazat pe cloud.
  2. ETL și integrarea datelor – încărcarea datelor din surse de date într-un depozit de date, transformarea, rezumarea și agregarea acestora într-un format adecvat pentru o analiză de mare profunzime.
  3. Managementul datelor de bază – o metodă de gestionare a datelor organizaționale critice: clienți, conturi și părți numite în tranzacțiile comerciale, într-un mod standardizat care previne redundanța în întreaga organizație.
  4. Managementul datelor de referință – definește valorile admise care pot fi utilizate de alte câmpuri de date, cum ar fi codurile poștale, listele de țări, regiuni și orașe sau numerele de serie ale produselor. Datele de referință pot fi generate acasă sau furnizate din exterior.
  5. Analiză și vizualizare a datelor – procesarea datelor selectate din surse de date mari și depozite de date, efectuarea de analize avansate de date și permite analiștilor și oamenilor de știință de date să taie, să taie în cuburi și să prezinte vizualizări și tablouri de bord.

Cu cantitățile masive de date de astăzi, instrumentele de înaltă calitate sunt esențiale pentru a realiza cele mai bune practici de gestionare a datelor. Organizațiile utilizează instrumente de gestionare a datelor din toate cele cinci categorii de mai sus, pentru a gestiona și automatiza procesul de gestionare a datelor:

  1. Instrumente de gestionare a datelor în cloud – construite în cloud, pentru cloud, aceste instrumente se conectează și integrează mai multe surse de date prin API-uri, webhooks sau conexiuni directe la baze de date.
  2. Instrumente ETL – ajută organizațiile să încarce date din mai multe surse, să definească transformări complexe și automatizate ale datelor, să testeze conducta de date și să încarce datele în mod continuu într-o bază de date țintă sau într-un depozit de date.
  3. Instrumente de transformare a datelor – ajută la transformarea datelor brute în date curate, agregate și analizabile, pe măsură ce acestea se deplasează de la sursele de date individuale către un depozit de analiză – sau în cadrul depozitului de analiză, la punctul de analiză.
  4. Instrumente de gestionare a datelor principale (MDM) – ajută la vizualizarea seturilor complexe de date principale în întreaga organizație și facilitează administrarea datelor de către experții în domeniu, care supraveghează crearea și întreținerea datelor de referință.
  5. Instrumente de gestionare a datelor de referință (RDM) – adesea furnizate ca parte a suitelor MDM, definesc procesele de afaceri în jurul datelor de referință și ajută părțile interesate să populeze datele de referință și să le gestioneze în timp.
  6. Instrumente de vizualizare a datelor și de analiză a datelor – ajută organizațiile să exploreze, să analizeze și să vizualizeze seturi mari de date și să genereze rapoarte și tablouri de bord pentru a extrage informații și a ghida deciziile de afaceri.

În cele ce urmează, acoperim câteva instrumente excelente din fiecare dintre aceste categorii, atât pentru a vă ajuta să înțelegeți fiecare categorie, cât și pentru a vă apropia de selectarea celui mai bun instrument de gestionare a datelor pentru nevoile dumneavoastră.

Pe măsură ce stocarea și lățimea de bandă au devenit mai ieftine, au devenit disponibile din ce în ce mai multe soluții off-premise pentru depozitarea și gestionarea datelor. Companiile cu cantități mari de date pe care trebuie să le stocheze, să le cerceteze și să le analizeze stochează și își gestionează acum în mod obișnuit datele în întregime în cloud. Acest flux de lucru a fost posibil datorită proliferării instrumentelor de gestionare a datelor în cloud în ultimii 5-10 ani. Deși până acum domeniul a fost condus în principal de giganți precum Amazon și Google, multe companii mai mici oferă acum instrumente pentru clienții cu nevoi de date de toate dimensiunile. Vedeți mai jos o listă de opțiuni potențiale pentru gestionarea datelor în cloud.

Panoply

Panoply oferă un depozit de date automatizat nativ în cloud care facilitează integrarea și gestionarea tuturor datelor organizației dumneavoastră. Caracteristici cheie:

  • O selecție largă de conectori nativi de date permite o utilizare ușoară, ingestie de date cu un singur clic
  • Ingestia și preprocesarea automată a datelor eliberează resursele IT
  • Panou de bord intuitiv de gestionare elimină presupunerile legate de gestionarea și bugetarea datelor
  • Ecartarea și întreținerea automată a bazelor de date cu mai multe noduri pentru un nivel scăzut deîntreținere redusă a depozitelor de date
  • Editor SQL în browser pentru analiza și interogarea datelor
  • Conexiuni cu suite comune de vizualizare și analiză a datelor, cum ar fi Tableau, Looker, Chartio

Prețul panoplie: 325 dolari/lună

Amazon Web Services

Amazon Web Services oferă un set în continuă expansiune de instrumente care pot fi reunite într-o stivă eficientă de gestionare a datelor în cloud. Serviciile cheie includ:

  • Amazon S3 pentru stocare temporară și/sau intermediară
  • Amazon Glacier pentru backup și stocare pe termen lung
  • Amazon Glue pentru crearea de cataloage de date pentru a clasifica, căutați și interogați datele
  • Amazon Athena pentru analize de date bazate pe SQL
  • Amazon Redshift pentru depozitarea datelor
  • Amazon Quicksight pentru construirea de tablouri de bord și vizualizarea datelor
  • Care serviciu este pornit și facturat separat, astfel încât costurile depind de gradul de utilizare

AWS Preț: variabil, în funcție de implementare

Microsoft Azure

Platforma Azure a Microsoft oferă o serie de modalități diferite de a configura un sistem de gestionare a datelor bazat pe cloud, precum și instrumente de analiză care pot fi utilizate pe datele stocate în Azure. La fel ca AWS, Azure permite mai multe stiluri de baze de date/depozit de date, cu un set excelent de instrumente pentru gestionarea acestora. Serviciile cheie includ:

  • Baze de date SQL standard și servere SQL bazate pe VM
  • Stocare de bule
  • Opțiuni de stocare a tabelelor de tip NoSQL
  • Dezvoltări în cloud privat
  • Azure Data Explorer (ADX) – un serviciu adăugat recent care permite analiza în timp real a fluxurilor de date foarte mari fără a fi nevoie de preprocesare
  • Integrare ușoară cu Panoply pentru servicii ELT/ETL

Preț Azure: variabil, în funcție de implementare

Google Cloud

Ca și Amazon, platforma Google Cloud oferă un set larg de instrumente pentru gestionarea datelor bazate pe cloud, precum și un manager de fluxuri de lucru care poate fi utilizat pentru a lega diferitele componente între ele. Componentele cheie ale Google Cloud:

  • BigQuery pentru stocarea datelor tabelare
  • Cloud BigTable pentru stocarea de tip bază de date NoSQL
  • Cloud Pub/Sub și Cloud Data Transfer pentru preluarea datelor; Google Cloud se poate conecta, de asemenea, cu o varietate de alte surse de date
  • BigQuery analytics pentru interogări în stil SQL
  • ML Engine pentru analize mai avansate care utilizează învățarea automată și inteligența artificială
  • Data Studio pentru analiza bazată pe GUI și construirea de tablouri de bord
  • Cloud Datalab pentru știința datelor bazată pe cod
  • Conexiuni cu instrumente BI obișnuite, cum ar fi Tableau, Looker, etc.

Prețul Google cloud: variabil, în funcție de implementare

Cele mai bune instrumente ETL și de integrare a datelor

Pentru o listă completă de instrumente EL, consultați lista noastră de instrumente ETL de top.

Informatica Powercenter

Informatica Powercenter este un instrument ETL on-premise cu următoarele caracteristici cheie:

  • Conectivitate și integrare fără probleme cu toate tipurile de surse de date folosind conectori gata de utilizare.
  • Validare automată a datelor – audit și validare automată, fără scripturi, a datelor mutate sau transformate.
  • Transformări avansate de date – suportă date non-relaționale, capabil să analizeze date XML, JSON, PDF, Microsoft Office și IoT.
  • Gestiune bazată pe metadate – oferă vizualizări grafice ale fluxurilor de date, ale impactului și ale filierei.

Informatica PowerCenter preț: 2.000 $/lună pentru cel mai de bază plan

Stitch Data

Stitch Data este o platformă ETL bazată pe cloud cu următoarele caracteristici cheie:

  • Preintegrată cu zeci de surse de date în cloud și în afara acestuia, mută datele în Amazon Redshift, S3, BigQuery, Panoply, PostgreSQL și altele.
  • Programare ușoară pentru replicarea datelor.
  • Gestionarea erorilor și alertarea cu rezolvare automată atunci când este posibil.
  • CADRUAPI și JSON, permițându-vă să împingeți datele într-un depozit de date în mod programatic.
  • Serviciu cloud gestionat cu scalare automată și SLA de nivel enterprise.

Preț pentru Stitch: 100 – 1.000 $/lună, în funcție de dimensiunea datelor

Fivetran

Fivetran este o conductă de date complet gestionată cu o interfață web care integrează datele din serviciile SaaS și bazele de date într-un singur depozit de date. Caracteristici cheie:

  • Aprovizionează integrarea directă și trimite datele printr-o conexiune directă securizată folosind un strat sofisticat de caching.

  • Stratul de cache ajută la mutarea datelor dintr-un punct în altul fără a stoca vreodată o copie pe serverul de aplicații.

  • Fivetran nu impune nicio limită de date.

  • Poate fi folosit pentru a centraliza datele unei companii și pentru a integra toate sursele pentru a determina indicatorii cheie de performanță (KPI) în întreaga organizație.

Prețivetran: Disponibil la cerere

3. Blendo

Blendo este un alt serviciu ETL și de integrare a datelor bazat pe cloud, cu următoarele caracteristici cheie:

  • Serviciu propriu – se conectează la numeroase surse de date cu câteva clicuri, mută datele către Amazon Redshift, Panoply, PostgreSQL, MS SQL Server și multe altele.
  • Date istorice – încarcă și sincronizează datele istorice din serviciile cloud.
  • Încărcare programată – încarcă date periodic sau la frecvențe selectate din diferite surse de date.
  • Optimizarea schemei de date – colectarea, detectarea și pregătirea automată a datelor folosind schema relațională optimă.

Prețul Blendo: Disponibil la cerere

Microsoft SQL Server SSIS

Microsoft oferă SSIS, o interfață grafică pentru gestionarea ETL folosind MS SQL Server. Principalele caracteristici includ:

  • Interfața ușor de utilizat permite utilizatorilor să implementeze soluții integrate de stocare de date fără a fi nevoiți să se implice în scrierea de mult – sau chiar deloc – cod.
  • Interfața grafică permite un ETL ușor de „drag-and-drop” pentru mai multe tipuri de date și destinații de depozit, inclusiv baze de date non-MS.
  • Soluție excelentă pentru o echipă cu un amestec de niveluri de abilități tehnice, deoarece este la fel de eficientă și pentru ninja ETL și pentru cei de tip „point-and-click”.

Preț SSIS: 931 $ – 15.000 $

Azure Data Factory

În plus față de SQL Server SSIS, soluția ETL on-premise a Microsoft, compania oferă, de asemenea, Azure Data Factory (ADF), un instrument ETL pentru platforma lor Azure bazată pe cloud. Principalele caracteristici ale ADF:

  • Pietalele ETL din ADF sunt construite într-o interfață grafică, permițând o utilizare low-code.
  • Varietate largă de conectori de date pentru o ingestie ușoară a datelor – cu excepția, în mod ciudat, a suportului pentru încărcarea fișierelor Microsoft Excel.
  • Suport complet pentru încărcarea datelor în depozitele de date Azure

Prețul Azure Data Factory: 1 dolar pentru 1.000 de execuții pe lună

Talend

Produsele software open source de integrare a datelor Talend oferă software pentru integrarea, curățarea, mascarea și profilarea datelor. Principalele caracteristici ale ofertelor Talend includ:

  • GUI care permite gestionarea unui număr mare de sisteme sursă utilizând conectori standard.
  • Funcționalitatea Master Data Management (MDM)
  • Vizualizare unică, coerentă și precisă a datelor cheie ale întreprinderii.

Prețul Talend: 1.170 $/utilizator lunar sau 12.000 $ anual

Alooma

Alooma oferă o platformă de integrare a datelor la scară enterprise cu instrumente ETL excelente încorporate. Câteva caracteristici cheie ale ofertelor Alooma:

  • Concentrare puternică pe construirea rapidă a conductelor, monitorizarea calității datelor și gestionarea erorilor.
  • Protecție împotriva pierderii sau coruperii datelor într-un proces ETL potențial predispus la erori.
  • Flexibilitatea de a interveni și de a scrie propriile scripturi pentru a monitoriza, curăța și muta datele în funcție de necesități.
  • Conceput pentru operațiuni la scară de întreprindere.

Preț Alooma: 1.000 – 15.000 $/lună

Cele mai bune instrumente de transformare a datelor

Dataform este o platformă de transformare a datelor bazată pe SQL, complet gestionată, pentru gestionarea proceselor din depozitul dvs. de date în cloud. Caracteristici cheie:

  • Scrieți fluxuri de lucru SQL în echipă într-un IDE colaborativ. Control al versiunilor încorporat și integrare cu Github.
  • Scrieți teste de calitate a datelor și setați alerte în cazul în care acestea eșuează pentru a vă asigura că datele dvs. sunt întotdeauna fiabile.
  • Creați un depozit centralizat pentru definițiile de date în întreaga companie, documentați-vă datele și descoperiți seturi de date într-un catalog de date.
  • Executați planificări pentru a vă asigura că datele dvs. sunt întotdeauna actualizate.

PrețulDataform:: De la 550 $/lună (sunt disponibile reduceri pentru început)

DBT

DBT (Data Build Tool) este un instrument de transformare a datelor bazat pe SQL care vă permite să configurați fluxuri modulare de transformare din linia de comandă. Construit cu scopul de a simplifica fluxurile de lucru în domeniul analizei datelor și al ingineriei, principalele caracteristici ale DBT includ:

  • Un instrument bazat pe SQL
  • Fluxuri de lucru ușoare pentru crearea de fluxuri modulare de transformare și modelare a datelor
  • Management automatizat al calității datelor cu un sistem robust de testare
  • Dezvoltare simplificată a codului analitic folosind medii, gestionare a pachetelor și integrare continuă
  • Documentare ușoară a datelor cu DAG-uri autogenerate și adnotare și catalogare ușoară a datelor
  • Instantanee de date pentru o mai bună analiză istorică a datelor

PrețDBT: 0 $ pentru nivelul gratuit, 100 $/lună pentru nivelul de bază, cu oferte de preț disponibile pentru implementări în întreprinderi mai mari

Airflow

Dezvoltat inițial la Airbnb, Airflow este un nou instrument popular de infrastructură de date open source. Deși nu face ea însăși procesarea datelor, Airflow vă poate ajuta să programați, să organizați și să monitorizați procesele ETL folosind python. Caracteristici cheie:

  • Grafurile aciclice dirijate (DAG) permit planificatorului său să vă repartizeze sarcinile pe o serie de lucrători fără a vă cere să definiți relații precise părinte-copil între fluxurile de date
  • Interfață web facilă pentru gestionarea și editarea DAG-urilor
  • Set frumos de instrumente care facilitează efectuarea de „operații DAG” din linia de comandă.
  • Mult extensibil și scalabil

Prețul Airflow: gratuit și cu sursă deschisă

Luigi

Luigi este un pachet Python cu sursă deschisă dezvoltat de Spotify. Este conceput pentru a face mai ușoară gestionarea proceselor de loturi de lungă durată, astfel încât poate gestiona sarcini care depășesc cu mult domeniul de aplicare al ETL – dar face și ETL destul de bine. Caracteristici cheie:

  • Baza de cod Python facilitează construirea de conducte de date eficiente, în special a celor care se ocupă de procese batch de lungă durată
  • Rezolvare ușoară a dependențelor
  • Interfață web care permite utilizatorului să vizualizeze sarcinile pentru gestionarea fluxului de lucru
  • Conceptual similar cu GNU Make, dar nu este doar pentru Hadoop
  • Operațiile atomice ale sistemului de fișiere asigură faptul că pipeline-urile dvs. nu se vor bloca niciodată cu date parțiale

Prețul lui Luigi: Gratuit și open source

Cele mai bune instrumente de gestionare a datelor principale

Dell Boomi’s Master Data Hub are următoarele caracteristici cheie:

  • Define modelele prin intermediul unei experiențe vizuale, low-code.
  • Deplasează modelele de date și identifică ce sisteme sursă interacționează cu acestea.
  • Înregistrează înregistrările de sistem într-un depozit consolidat, fuzionează automat înregistrările similare.
  • Permite administrarea datelor – alertează echipele pentru a rezolva dublurile și problemele de introducere a datelor.
  • Guvernează datele cu fluxuri de procese bidirecționale în timp real între silozuri.

Preț Dell Boomi Master Data Hub: 100.000 $ – 300.000 $

Profisee

Profisee’s Master Data Management are următoarele caracteristici cheie:

  • Stewardship și guvernanță – permite „administratorilor de date” din cadrul organizației să gestioneze datele de bază cu feedback din partea analiticilor.
  • Gestiunea înregistrărilor de aur – standardizează, curăță și potrivește datele sursă fără codificare.
  • Gestionarea evenimentelor – detectează schimbările de date, distribuie evenimentele către sistemele abonate.
  • Integrator – federalizează datele de bază pentru întreprinderi globale, cu integrare bidirecțională în timp real.
  • Fluxul de lucru al întreprinderii – aplică procesele de afaceri la nivelul întregii organizații, permite administratorilor să gestioneze performanța administratorilor de date.
  • SDK – permite integrarea aplicațiilor personalizate.

Preț de specialitate: 10 dolari.30/oră

SAP NetWeaver

SAP NetWeaver MDM, o componentă a platformei de dezvoltare NetWeaver, are următoarele caracteristici cheie:

  • Extrage automat datele de bază din toate aplicațiile SAP majore.
  • Încarcă datele de bază din alte surse.
  • integrează datele folosind conținut de afaceri, cum ar fi structuri de depozit, reguli de validare, corespondențe de intrare și de ieșire.
  • Distribuie datele de bază către ținte.
  • Permite integrarea programatică a datelor prin API-uri și servicii web.

Prețul SAP NetWeaver: Disponibil la cerere

Semarchy xDM

Semarchy este relativ nou pe scena MDM, fiind lansat în 2011. Cu sediul în Franța, a fost fondată de o echipă de foști angajați ai Sunopsis. xDM, principalul lor produs MDM, are următoarele caracteristici:

  • Nu depinde de Hadoop.
  • Optimizat pentru Oracle.
  • Actualizările și modificările sunt urmărite și propagate cu ajutorul metadatelor, permițând o gestionare iterativă, „evolutivă” a datelor.
  • Are o interfață de utilizator pas cu pas care poate fi personalizată pentru roluri de afaceri specifice (de exemplu, analiști, operațiuni etc.).

Prețul pentru Semarch xDM: Disponibil la cerere

Tibco MDM

Tibco se află mereu pe locul întâi în clasamentul celor mai bune instrumente MDM. Caracteristicile cheie includ:

  • Flexibilitate și scalabilitate pentru aplicațiile multidomeniu.
  • Strat de date principale independent și distribuit.
  • Interfață vizuală personalizabilă fără cod care poate fi construită pentru a se potrivi diferitelor roluri de afaceri.
  • Suport foarte bine cotat pentru versiunea datelor.
  • Suport pentru servicii web SOAP.

Tibco MDM preț: Disponibil la cerere

Ataccama ONE

Ataccama oferă ONE, un instrument de gestionare a datelor extrem de automatizat, care poate fi rulat la fața locului, în cloud sau într-o configurație hibridă. Caracteristicile cheie includ:

  • Curatarea, curățarea și clasificarea datelor pe bază de învățare mecanică.
  • Descoperirea automată a metadatelor.
  • Configurarea automatizată a proiectelor.
  • Domain agnostic, dar vine pre-configurat cu reguli pre-construite pentru MDM pentru domenii tipice, cum ar fi client, contact și produs.
  • Conectori pentru o gamă largă de tipuri și surse de date.
  • GDPR ready.
  • Historic complet de audit al datelor cu jurnal detaliat al regulilor de afaceri și al transformărilor aplicate.

Preț de ATTACAMA ONE: Disponibil la cerere

Stibo STEP

Stibo are distincția de a fi probabil cea mai veche companie de pe listă, fiind fondată în secolul al XVIII-lea ca o companie tipografică. Ramura de gestionare a datelor a companiei este o adăugire mai tânără, iar STEP, principala sa ofertă de instrumente de gestionare a datelor, are următoarele caracteristici cheie:

  • STEP Workbench UI.
  • Platforma MDM multidomeniu holistică.
  • Nivel ridicat de automatizare.
  • Traducerea automatizată a datelor și a limbilor pentru operațiuni multinaționale.
  • Revizuirea și aprobarea automatizată a activelor digitale.
  • Gestionarea datelor de bază la nivel de întreprindere.

Prețul Stibo STEP: Disponibil la cerere

Cele mai bune instrumente de gestionare a datelor de referință

Soluția de date de referință a companiei Collibra are următoarele caracteristici cheie:

  • Automatizează fluxurile de lucru pentru a crea noi coduri și seturi de coduri.
  • Furnizează coduri și seturi de coduri către utilizatori într-un mod prietenos.
  • Realizează o cartografiere precisă a datelor pentru a elimina barierele în calea accesului la date.
  • Compara date din diferite părți ale organizației.

Prețul Collibra: Disponibil la cerere

Magnitude

Magnitude’s Reference Data Management are următoarele caracteristici cheie:

  • Modelare multidomeniu – suportă structuri de afaceri de la liste de coduri până la ierarhii cu mai multe căi de acces, cu auto-referințe.
  • Automatizare – oferă automatizare, guvernanță și control asupra obiectelor de date de referință și a proceselor de încărcare.
  • Corectare – oferă o corelare de la global la local, de la extern la intern și de la specific la general, fără a perturba elementele existente.
  • Guvernanță – oferă un flux de lucru personalizabil pentru a controla procesele de afaceri legate de datele de referință, cu controale de securitate bazate pe model care permit utilizatorilor să vizualizeze, să adauge sau să actualizeze.
  • Variație temporală – permite utilizatorilor să modifice modelele, subiecții, atributele și asociațiile și să recupereze orice versiune anterioară a obiectului.

Magnitude Reference Data Management price: Disponibil la cerere

Informatica MDM Reference 360

Informatica MDM Reference 360 are următoarele caracteristici cheie:

  • Complet bazat pe cloud – performanță și scalabilitate îmbunătățite.
  • Platforma end-to-end – integrare de date încorporată, calitate a datelor, managementul proceselor.
  • Autoservire – Master Data Management și fluxuri de lucru construite pentru utilizatorii de afaceri fără cunoștințe tehnice.
  • Match and merge – fuzionează și face referințe încrucișate de date din noi tipuri și surse.

Informatica MDM Reference 360 preț: Disponibil la cerere

Reltio Cloud

Reltio produce Reltio Cloud, un instrument de gestionare a datelor principale bazat pe grafice care include instrumente de gestionare a datelor de referință. Reltio este construit pe baze de date grafice pentru a-i oferi flexibilitate maximă, atât în ceea ce privește scalarea depozitelor de date, cât și în ceea ce privește definirea unor relații clare între datele din depozitul dumneavoastră. Alte caracteristici cheie:

  • Integrare ușoară cu instrumentele MDM existente și/sau cu alte surse de date.
  • Interfață ușor de utilizat.
  • Platforma cloud mereu disponibilă face posibile actualizări fără timp de nefuncționare.

Prețul Reltio Cloud: Disponibil la cerere

Cele mai bune instrumente de analiză și vizualizare

Tableau este o platformă BI disponibilă atât în cloud, cât și ca software descărcabil, cu următoarele caracteristici cheie:

  • Se conectează ușor la sursele de date.
  • Permite accesul ușor la vizualizări pentru echipe, parteneri și clienți.
  • Permite explorarea nelimitată a datelor cu tablouri de bord interactive.
  • Creează „dashboard starters”, tablouri de bord acționabile configurate în câteva minute cu date din aplicații web populare.
  • Creează hărți interactive în mod automat.

Prețul Tableau: 35-$70 pe utilizator pe lună.

Chartio

Chartio este o platformă BI și de vizualizare bazată pe cloud cu următoarele caracteristici cheie:

  • Modul interactiv – glisați și plasați datele pentru a crea, filtra și partaja tablouri de bord.
  • Modul SQL – comunicați cu bazele de date în SQL pentru a extrage direct informații.
  • Stratificarea datelor – adăugați pași succesivi de transformare la date pentru a transforma rezultatele interogării.
  • Vizualizări și grafice – vizualizați instantaneu datele; Chartio recomandă graficul cel mai potrivit.
  • Mixarea datelor și drill downs – combinați din mers surse de date disparate și obțineți informații utile pentru acțiune fără a explora datele brute.

Prețul Chartio: 249 $/lună pentru o licență de echipă.

Looker BI

Looker este o altă platformă de analiză și vizualizare bazată pe cloud, cu următoarele caracteristici cheie:

  • Definiți metricile o singură dată folosind LookML, limbajul simplu de modelare a datelor de la Looker, iar Looker scrie interogări SQL pentru a răspunde la orice întrebare cu privire la acele metrici.
  • Făceți datele frumoase cu tablouri de bord ușor de citit care permit utilizatorilor să facă drill in și să exploreze.
  • Conectați-vă direct la bazele de date, fără extracte sau software de descărcat.
  • Deschideți accesul la tablouri de bord și rapoarte pentru toată lumea, nu doar pentru analiști sau cercetători de date.

Prețul Looker: 3.000 – 5.000 de dolari pe lună pentru 10 utilizatori.

Metabase

Metabase oferă o interfață prietenoasă, open source, pentru conectarea și analizarea datelor dumneavoastră. Ca instrument de vizualizare a datelor, acesta oferă:

  • Sute de conectori nativi de date.
  • Configurare și acces ușor pentru întreaga dvs. echipă.
  • Ofertă largă de opțiuni diferite de vizualizare a datelor din care puteți alege.
  • Încorporare cu etichetă albă (nivel de încorporare premium și mai sus).
  • Auditul și gestionarea permisiunilor de date (nivel enterprise și peste).

Prețul bazei de date: Metabase este gratuit și open source, astfel încât nivelul său gratuit oferă o serie de caracteristici care vor fi potrivite pentru majoritatea utilizatorilor. Planurile enterprise pot avea prețuri de pornire cuprinse între 3.000 și 10.000 de dolari/an.

Microsoft Power BI

Power BI, oferta Microsoft în domeniul analizei de afaceri, este concepută pentru a fi utilă atât pentru analiștii de afaceri, cât și pentru cercetătorii de date. Principalele caracteristici:

  • Interfață simplă de tip drag-and-drop care este concepută pentru a fi familiară utilizatorilor de MS Excel.
  • Power BI este o platformă fără cod și oferă atât clienți desktop cât și web.
  • Biblioteca de conectori pre-construiți
  • Performanța tinde să întârzie pe seturi de date foarte mari – căutați în altă parte pentru soluții de date mari

Prețul Microsoft Power BI: 9,99 dolari pe utilizator pe lună, sau gratuit pentru versiunea de bază.

Mode Analytics

Mode Analytics oferă o suită de analiză a datelor bazată pe web, destinată oamenilor de știință și analiștilor de date, cu accent pe colaborare și partajare. Câteva dintre caracteristicile cheie ale Mode:

  • Conceput pentru a face deosebit de ușoară conectarea surselor de date la editorul SQL încorporat și la platforma lor de vizualizare.
  • Mode poate canaliza rezultatele interogărilor SQL direct într-un cadru de date R sau Pandas într-un notebook nativ Mode.
  • Părtășiți datele, analiza și tabloul de bord rezultat, totul prin Mode.
  • Mode este o alegere bună pentru o echipă de cercetători de date care doresc să poată colabora mai ușor.

Prețul Mode Analytics: disponibil la cerere.

Cu privire la gestionarea automatizată a datelor

Am acoperit cinci moduri de a gândi instrumentele de gestionare a datelor – gestionarea datelor de referință, gestionarea datelor principale (MDM), ETL și analiza datelor mari – și câteva instrumente excelente din fiecare categorie.

Pe măsură ce infrastructura de date se mută în cloud, o mai mare parte din stiva de date devine gestionată și complet integrată. Nu există un înlocuitor pentru gestionarea proceselor de afaceri în jurul datelor structurate în organizațiile mari. Dar platformele bazate pe cloud pot ajuta cu o mare parte din strategia de gestionare a datelor – de la tratarea și pregătirea datelor brute, la ingerarea, încărcarea, transformarea, optimizarea și vizualizarea datelor – în mod automat într-un singur sistem.