Data management is een breed en ambigu begrip. De Global Data Management Community (DAMA International) definieert het als “de ontwikkeling van architecturen, beleidslijnen, praktijken en procedures om de levenscyclus van gegevens te beheren”. Maar als mensen “gegevensbeheer” zeggen, wat bedoelen zij dan werkelijk? Wij stellen vijf mogelijkheden voor:
- Cloud data management – het proces van het integreren van gegevens uit het ecosysteem van cloud-applicaties van een organisatie. Het belangrijkste onderscheid van cloud data management is dat alle opslag, inname en verwerking van gegevens plaatsvindt in een cloud-gebaseerd opslagmedium.
- ETL en data-integratie – het laden van gegevens uit gegevensbronnen in een datawarehouse, het transformeren, samenvatten en aggregeren ervan in een formaat dat geschikt is voor diepgaande analyse.
- Master data management – een methode voor het beheer van kritische organisatorische gegevens: klanten, accounts en partijen die in zakelijke transacties worden genoemd, op een gestandaardiseerde manier die redundantie in de hele organisatie voorkomt.
- Reference data management – definieert toelaatbare waarden die door andere gegevensvelden kunnen worden gebruikt, zoals postcodes, lijsten van landen, regio’s en steden, of productserienummers. Referentiegegevens kunnen intern of extern worden aangeleverd.
- Gegevensanalyse en -visualisatie – verwerking van geselecteerde gegevens uit grote gegevensbronnen en gegevensopslagplaatsen, uitvoering van geavanceerde gegevensanalyses, en analisten en gegevenswetenschappers in staat stellen om visualisaties en dashboards te slicen, te dice-en en te presenteren.
Met de enorme hoeveelheden gegevens van tegenwoordig zijn hoogwaardige tools essentieel voor het bereiken van best practices op het gebied van gegevensbeheer. Organisaties gebruiken datamanagementtools uit alle vijf bovenstaande categorieën om het datamanagementproces te beheren en te automatiseren:
- Cloud Data Management tools – gebouwd in de cloud, voor de cloud, deze tools maken verbinding met en integreren meerdere gegevensbronnen via API’s, webhooks, of directe databaseverbindingen.
- ETL-tools – helpen organisaties bij het laden van gegevens uit meerdere bronnen, het definiëren van complexe, geautomatiseerde transformaties van de gegevens, het testen van de datapijplijn en het continu laden van gegevens naar een doeldatabase of datawarehouse.
- Data Transformation-tools – helpen bij de transformatie van ruwe gegevens in schone, geaggregeerde, analyseerbare gegevens wanneer deze van afzonderlijke gegevensbronnen naar een analysewarehouse worden verplaatst – of binnen het analysewarehouse, op het punt van analyse.
- Master Data Management (MDM)-tools – helpen bij het visualiseren van complexe sets van stamgegevens in de hele organisatie, en vergemakkelijken het beheer van gegevens door experts op dit gebied, die toezien op het creëren en onderhouden van referentiegegevens.
- Reference Data Management (RDM) tools – vaak geleverd als onderdeel van MDM-suites, definiëren bedrijfsprocessen rond referentiedata, en helpen stakeholders bij het vullen van referentiedata en het beheer ervan in de tijd.
- Tools voor datavisualisatie en -analyse – helpen organisaties bij het verkennen, analyseren en visualiseren van grote datasets, en genereren rapporten en dashboards om inzichten te verkrijgen en zakelijke beslissingen te sturen.
Hieronder behandelen we een aantal geweldige tools uit elk van deze categorieën, zowel om u te helpen elke categorie te begrijpen als om u dichter bij de selectie van de beste datamanagementtool voor uw behoeften te brengen.
Naarmate opslag en bandbreedte goedkoper zijn geworden, zijn er steeds meer off-premise oplossingen voor datawarehousing en -beheer beschikbaar gekomen. Bedrijven met grote hoeveelheden gegevens die moeten worden opgeslagen, doorzocht en geanalyseerd, slaan hun gegevens nu routinematig volledig in de cloud op en beheren deze. Deze workflow is mogelijk geworden door de proliferatie van cloud data management tools in de afgelopen 5-10 jaar. Hoewel het veld tot nu toe vooral werd geleid door reuzen als Amazon en Google, bieden veel kleinere bedrijven nu tools voor klanten met databehoeften van elke omvang. Zie hieronder voor een lijst van potentiële opties voor cloud-gegevensbeheer.
- Panoply
- Amazon Web Services
- Microsoft Azure
- Google Cloud
- Beste ETL en Data Integratie Tools
- Informatica Powercenter
- Stitch Data
- Fivetran
- Microsoft SQL Server SSIS
- Azure Data Factory
- Talend
- Alooma
- Beste Data Transformation Tools
- DBT
- Airflow
- Luigi
- Beste Master Data Management tools
- Profisee
- SAP NetWeaver
- Semarchy xDM
- Tibco MDM
- Ataccama ONE
- Stibo STEP
- Beste Reference Data Management tools
- Magnitude
- Informatica MDM Reference 360
- Reltio Cloud
- Beste analyse- en visualisatietools
- Chartio
- Looker BI
- Metabase
- Microsoft Power BI
- Mode Analytics
- Naar geautomatiseerd gegevensbeheer
Panoply
Panoply biedt een cloud-native geautomatiseerd datawarehouse dat het eenvoudig maakt om alle gegevens van uw organisatie te integreren en te beheren. Belangrijkste kenmerken:
- Grote selectie van native data connectors zorgt voor een gemakkelijke, one-click data ingestion
- Geautomatiseerde data ingestion en preprocessing maakt IT-resources vrij
- Intuïtief management dashboard maakt data management en budgettering overbodig
- Geautomatiseerde schaalbaarheid en onderhoud van multi-node databases voor data warehousing met lage
- In-browser SQL-editor voor gegevensanalyse en query’s
- Connecties met gangbare suites voor gegevensvisualisatie en -analyse, zoals Tableau, Looker, Chartio
Panoply prijs: $325/maand
Amazon Web Services
Amazon Web Services biedt een zich steeds uitbreidende set tools die kunnen worden samengevoegd tot een effectieve cloud data management stack. De belangrijkste diensten omvatten:
- Amazon S3 voor tijdelijke en/of tussentijdse opslag
- Amazon Glacier voor back-up en opslag op lange termijn
- AWS Glue voor het bouwen van datacatalogi om te categoriseren, doorzoeken en bevragen van uw gegevens
- Amazon Athena voor SQL-gebaseerde data-analyse
- Amazon Redshift voor datawarehousing
- Amazon Quicksight voor dashboardbouw en datavisualisatie
- Elke dienst wordt afzonderlijk aangestuurd en gefactureerd, dus de kosten zijn afhankelijk van de mate van gebruik
AWS Prijs: variabel, afhankelijk van implementatie
Microsoft Azure
Microsoft’s Azure-platform biedt een aantal verschillende manieren om een cloudgebaseerd gegevensbeheersysteem op te zetten, evenals analysetools die kunnen worden gebruikt op uw in Azure opgeslagen gegevens. Net als AWS, maakt Azure meerdere database/datawarehouse stijlen mogelijk met een geweldige set tools om ze te beheren. De belangrijkste diensten zijn:
- Standaard SQL-databases en VM-gebaseerde SQL-servers
- Blob storage
- NoSQL-stijl tabelopslagopties
- Private cloud implementaties
- Azure Data Explorer (ADX) -. een recent toegevoegde dienst die real-time analyse van zeer grote streaming data mogelijk maakt zonder de noodzaak van voorbewerking
- Eenvoudige integratie met Panoply voor ELT/ETL-diensten
Azure prijs: variabel, afhankelijk van implementatie
Google Cloud
Google’s Cloud-platform biedt net als Amazon een brede set tools voor cloudgebaseerd gegevensbeheer, evenals een workflowmanager die kan worden gebruikt om de verschillende componenten aan elkaar te knopen. Belangrijkste Google Cloud-componenten:
- BigQuery voor de opslag van gegevens in tabelvorm
- Cloud BigTable voor opslag in NoSQL-databasestijl
- Cloud Pub/Sub en Cloud Data Transfer voor de inname van gegevens; Google Cloud kan ook verbinding maken met een verscheidenheid aan andere gegevensbronnen
- BigQuery analytics voor SQL-stijl queries
- ML Engine voor meer geavanceerde analyses met behulp van machine learning en AI
- Data Studio voor GUI-gebaseerde analyse en dashboardconstructie
- Cloud Datalab voor code-gebaseerde data science
- Connecties met gangbare BI-tools zoals Tableau, Looker, enz.
Google cloud prijs: variabel, afhankelijk van implementatie
Beste ETL en Data Integratie Tools
Voor de uitgebreide lijst van EL tools kijk op onze lijst van top ETL tools.
Informatica Powercenter
Informatica Powercenter is een on-premise ETL-tool met de volgende hoofdkenmerken:
- Naadloze connectiviteit en integratie met alle soorten gegevensbronnen met behulp van out-of-the-box connectors.
- Geautomatiseerde gegevensvalidatie – scriptvrije geautomatiseerde controle en validatie van verplaatste of getransformeerde gegevens.
- Geavanceerde gegevenstransformaties – ondersteunt niet-relationele gegevens, in staat om XML, JSON, PDF, Microsoft Office en IoT-gegevens te parseren.
- Metagegevensgestuurd beheer – biedt grafische weergaven van gegevensstromen, impact en lineage.
Informatica PowerCenter prijs: $ 2.000/maand voor het meest basale plan
Stitch Data
Stitch Data is een cloud-gebaseerd ETL-platform met de volgende hoofdkenmerken:
- Voorgeïntegreerd met tientallen gegevensbronnen in en buiten de cloud, verplaatst gegevens naar Amazon Redshift, S3, BigQuery, Panoply, PostgreSQL, en meer.
- Eenvoudige planning voor datareplicatie.
- Foutafhandeling en alarmering met geautomatiseerde oplossing waar mogelijk.
- API- en JSON-framework, waarmee u gegevens programmatisch naar een datawarehouse kunt pushen.
- Beheerde cloudservice met automatische schaalbaarheid en SLA’s op bedrijfsniveau.
Stitch prijs: $100 – $1.000/maand, afhankelijk van de datagrootte
Fivetran
Fivetran is een volledig beheerde datapijplijn met een webinterface die gegevens van SaaS-diensten en databases integreert in één datawarehouse. Belangrijkste kenmerken:
-
Zorgt voor directe integratie en verzendt gegevens via een directe beveiligde verbinding met behulp van een geavanceerde cachinglaag.
-
Cachinglaag helpt bij het verplaatsen van gegevens van het ene punt naar het andere zonder ooit een kopie op de applicatieserver op te slaan.
-
Fivetran legt geen datalimiet op.
-
Kan worden gebruikt om de gegevens van een bedrijf te centraliseren en alle bronnen te integreren om Key Performance Indicators (KPI’s) voor een hele organisatie te bepalen.
Fivetran-prijs: Beschikbaar op aanvraag
3. Blendo
Blendo is een andere cloud-gebaseerde ETL- en data-integratiedienst, met de volgende hoofdkenmerken:
- Zelfbedieningsdienst – maakt met een paar klikken verbinding met talloze gegevensbronnen, verplaatst gegevens naar Amazon Redshift, Panoply, PostgreSQL, MS SQL Server, en meer.
- Historische gegevens – laadt en synchroniseert historische gegevens uit cloudservices.
- Gepland laden – laad gegevens periodiek of met geselecteerde frequenties uit verschillende gegevensbronnen.
- Optimalisatie van dataschema’s – geautomatiseerde verzameling, detectie en voorbereiding van gegevens met behulp van optimale relationele schema’s.
Blendo prijs: Beschikbaar op aanvraag
Microsoft SQL Server SSIS
Microsoft biedt SSIS, een grafische interface voor het beheer van ETL met behulp van MS SQL Server. De belangrijkste kenmerken zijn:
- Makkelijk te gebruiken interface stelt gebruikers in staat geïntegreerde data warehousing oplossingen te implementeren zonder zich bezig te hoeven houden met het schrijven van veel – of enige – code.
- De grafische interface maakt eenvoudige drag-and-drop ETL mogelijk voor meerdere gegevenstypen en magazijnbestemmingen, inclusief niet-MS DB’s.
- Goede oplossing voor een team met een mix van technische vaardigheidsniveaus, omdat het even effectief is voor ETL ninjas als voor point-and-click types.
SSIS-prijs: $ 931 – $ 15.000
Azure Data Factory
Naast SQL Server SSIS, Microsofts on-premise ETL-oplossing, biedt het bedrijf ook Azure Data Factory (ADF), een ETL-tool voor hun cloudgebaseerde Azure-platform. Belangrijkste kenmerken van ADF:
- ETL-pipelines in ADF worden gebouwd in een grafische interface, waardoor low-code gebruik mogelijk is.
- Grote verscheidenheid aan gegevensconnectors voor eenvoudige gegevensinvoer – met uitzondering, vreemd genoeg, van ondersteuning voor het laden van Microsoft Excel-bestanden.
- Volledige ondersteuning voor het laden van gegevens in Azure data warehouses
Azure Data Factory prijs: $ 1 voor 1.000 runs per maand
Talend
Talend open source data integratie software producten bieden software voor het integreren, opschonen, maskeren en profileren van gegevens. De belangrijkste kenmerken van Talend zijn:
- GUI die het beheer van een groot aantal bronsystemen mogelijk maakt met behulp van standaard connectoren.
- Master Data Management (MDM) functionaliteit
- Een consistente en nauwkeurige weergave van belangrijke bedrijfsgegevens.
Talend prijs: $1.170/gebruiker per maand of $12.000 per jaar
Alooma
Alooma biedt een data-integratieplatform op bedrijfsschaal met geweldige ingebouwde ETL-tools. Enkele belangrijke kenmerken van Alooma-aanbiedingen:
- Grote focus op snelle pijplijnconstructie, datakwaliteitsmonitoring en foutafhandeling.
- Bescherming tegen verlies of corruptie van gegevens in een potentieel foutgevoelig ETL-proces.
- Flexibiliteit om in te grijpen en uw eigen scripts te schrijven om uw gegevens te bewaken, op te schonen en te verplaatsen als dat nodig is.
- Ontworpen voor operaties op bedrijfsschaal.
Alooma prijs: $1,000 – $15,000/maand
Beste Data Transformation Tools
Dataform is een SQL-gebaseerd, volledig beheerd data transformatie platform voor het beheren van processen in uw cloud data warehouse. Belangrijkste kenmerken:
- Schrijf SQL workflows als een team in een collaboratieve IDE. Ingebouwd versiebeheer en integratie met Github.
- Schrijf datakwaliteitstests en stel waarschuwingen in als ze falen om ervoor te zorgen dat uw gegevens altijd betrouwbaar zijn.
- Maak een gecentraliseerde opslagplaats voor gegevensdefinities in uw hele bedrijf, documenteer uw gegevens en ontdek datasets in een gegevenscatalogus.
- Run schema’s om ervoor te zorgen dat uw gegevens altijd up-to-date zijn.
Dataform prijs:: Vanaf $550/maand (startup kortingen beschikbaar)
DBT
DBT (Data Build Tool) is een op SQL gebaseerde datatransformatie-tool waarmee u modulaire transformatie-flows vanaf de opdrachtregel kunt opzetten. Gebouwd met het oog op het stroomlijnen van data-analyse en engineering workflows, DBT’s belangrijkste functies omvatten:
- SQL-gebaseerde tool
- Eenvoudige workflows voor het bouwen van modulaire transformatie- en datamodelleringsflows
- Geautomatiseerd datakwaliteitsbeheer met een robuust testsysteem
- Gestroomlijnde implementatie van analytics code met behulp van omgevingen, package management en continuous integration
- Eenvoudige datadocumentatie met automatisch gegenereerde DAG’s en eenvoudige data annotatie en catalogisering
- Data snapshotting voor betere historische data analyse
DBT prijs: $0 voor gratis tier, $100/mo voor basic, met offertes beschikbaar voor grotere enterprise deployments
Airflow
Orspronkelijk ontwikkeld bij Airbnb, Airflow is een populaire nieuwe open source data infrastructuur tool. Hoewel het zelf geen dataverwerking doet, kan Airflow je helpen ETL processen te plannen, organiseren en monitoren met python. Belangrijkste kenmerken:
- Directed Acyclic Graphs (DAGs) staan de planner toe om je taken te verdelen over een reeks werkers zonder dat je precieze ouder-kind relaties tussen datastromen hoeft te definiëren
- Handige web-gebaseerde UI voor het beheren en bewerken van je DAGs
- Mooie set van tools die het gemakkelijk maakt om “DAG-chirurgie” uit te voeren vanaf de commandoregel.
- Hoog uitbreidbaar en schaalbaar
Airflow prijs: gratis en open source
Luigi
Luigi is een open source Python pakket ontwikkeld door Spotify. Het is ontworpen om het beheer van langlopende batch processen eenvoudiger te maken, dus het kan taken aan die ver buiten het bereik van ETL gaan – maar het doet ETL ook behoorlijk goed. Belangrijkste kenmerken:
- Python codebase maakt het makkelijk om efficiënte data pipelines te bouwen, vooral diegene die te maken hebben met langlopende batch processen
- Easy dependency resolution
- Web interface waarmee de gebruiker taken kan visualiseren voor workflow management
- Conceptueel vergelijkbaar met GNU Make, maar is niet alleen voor Hadoop
- Atomische bestandssysteem operaties zorgen ervoor dat uw pijplijnen nooit zullen crashen met gedeeltelijke data
Luigi prijs: Gratis en open source
Beste Master Data Management tools
Dell Boomi’s Master Data Hub heeft de volgende hoofdkenmerken:
- Definieert modellen via low-code, visuele ervaring.
- Ploceert datamodellen en identificeert welke bronsystemen ermee interageren.
- Onderbrengt systeemrecords in een geconsolideerde repository, voegt automatisch vergelijkbare records samen.
- Maakt data stewarding mogelijk – waarschuwt teams om duplicaten en problemen met gegevensinvoer op te lossen.
- Governs data met real-time bidirectionele processtromen over silo’s heen.
Dell Boomi Master Data Hub prijs: $ 100.000 – $ 300.000
Profisee
Profisee’s Master Data Management heeft de volgende hoofdkenmerken:
- Stewardship and governance – stelt “data stewards” binnen de organisatie in staat om masterdata te beheren met feedback van analytics.
- Golden record management – standaardiseert, schoont en matcht brondata zonder codering.
- Event management – detecteert dataveranderingen, distribueert events naar subscribing systems.
- Integrator – federeert master data voor wereldwijde ondernemingen, met real-time bi-directionele integratie.
- Enterprise workflow – dwingt organisatie-overstijgende bedrijfsprocessen af, laat beheerders de prestaties van data stewards beheren.
- SDK – maakt integratie van maatwerk applicaties mogelijk.
Profisee prijs: $10.30/uur
SAP NetWeaver
SAP NetWeaver MDM, een component van het NetWeaver ontwikkelplatform, heeft de volgende key features:
- Haalt automatisch stamgegevens uit alle belangrijke SAP applicaties.
- Laadt stamgegevens uit andere bronnen.
- Integreert gegevens met behulp van bedrijfsinhoud, zoals repository-structuren, validatieregels, inkomende en uitgaande mappings.
- Distribueert stamgegevens naar targets.
- Maakt programmatische gegevensintegratie via API’s en webservices mogelijk.
Prijsstelling voor SAP NetWeaver:
Semarchy xDM
Semarchy is een relatieve nieuwkomer in de MDM-wereld, aangezien het in 2011 werd gelanceerd. Het werd opgericht door een team van voormalige Sunopsis-werknemers. xDM, hun belangrijkste MDM-product, heeft de volgende kenmerken:
- Non-Hadoop afhankelijk.
- Optimized voor Oracle.
- Updates en wijzigingen worden bijgehouden en doorgegeven met behulp van metadata, waardoor iteratief, “evolutionair” gegevensbeheer mogelijk wordt.
- Een stapsgewijze gebruikersinterface die kan worden aangepast aan specifieke bedrijfsrollen (d.w.z. analisten, operations, enz.).
Semarch xDM prijs:
Tibco MDM
Tibco is een meerjarige plaatser in de top MDM-tool ranglijsten. Belangrijkste kenmerken zijn:
- Flexibiliteit en schaalbaarheid voor multidomein applicaties.
- Onafhankelijke, gedistribueerde master data laag.
- Aanpasbare no-code visuele interface die kan worden gebouwd om aan verschillende bedrijfsrollen te voldoen.
- Hooggewaardeerde ondersteuning voor versiebeheer van gegevens.
- SOAP Web services ondersteuning.
Tibco MDM prijs: Beschikbaar op aanvraag
Ataccama ONE
Ataccama biedt ONE, een sterk geautomatiseerde datamanagement tool die on-premise, in de cloud, of in een hybride setup kan worden uitgevoerd. De belangrijkste kenmerken zijn:
- Machine learning-gebaseerde data curatie, opschoning en classificatie.
- Geautomatiseerde metadata discovery.
- Geautomatiseerde projectconfiguratie.
- Domain agnostic, maar wordt geleverd met vooraf geconfigureerde regels voor MDM voor typische domeinen zoals klant, contact en product.
- Connectoren voor een breed scala aan gegevenstypen en -bronnen.
- GDPR-ready.
- Volledige gegevensauditgeschiedenis met gedetailleerd logboek van toegepaste bedrijfsregels en transformaties.
Ataccama ONE prijs: Beschikbaar op aanvraag
Stibo STEP
Stibo heeft de eer waarschijnlijk het oudste bedrijf op de lijst te zijn, omdat het in de 18e eeuw is opgericht als drukkerij. De data management tak van het bedrijf is een jongere aanwinst, en STEP, het belangrijkste data management tool aanbod, heeft de volgende hoofdkenmerken:
- STEP Workbench UI.
- Holistisch multidomein MDM-platform.
- Hoge mate van automatisering.
- Geautomatiseerde data- en taalvertaling voor multinationale operaties.
- Geautomatiseerde review en goedkeuring van digitale assets.
- Interprise-level master data management.
Stibo STEP prijs: Beschikbaar op aanvraag
Beste Reference Data Management tools
Collibra’s Reference Data oplossing heeft de volgende belangrijkste kenmerken:
- Automatiseert workflows om nieuwe codes en code sets te creëren.
- levert codes en codesets op een vriendelijke manier aan gebruikers.
- Presteert nauwkeurige datamapping om barrières voor de toegang tot gegevens weg te nemen.
- Vergelijkt gegevens uit verschillende delen van de organisatie.
Collibra-prijs: Beschikbaar op aanvraag
Magnitude
Magnitude’s Reference Data Management heeft de volgende belangrijkste kenmerken:
- Multi-domein modellering – ondersteunt bedrijfsstructuren van codelijsten tot multi-path, zelfverwijzende hiërarchieën.
- Automatisering – biedt automatisering, governance en controle over referentiegegevensobjecten en laadprocessen.
- Mapping – biedt globale naar lokale, externe naar interne, en specifieke naar algemene mapping zonder verstoring van bestaande elementen.
- Governance – biedt een aanpasbare workflow om bedrijfsprocessen met betrekking tot referentiedata te regelen, met modelgebaseerde beveiligingscontroles waarmee gebruikers kunnen bekijken, toevoegen of bijwerken.
- Tijdvariantie – stelt gebruikers in staat modellen, onderwerpen, attributen en associaties te wijzigen en elke eerdere versie van het object op te halen.
Magnitude Reference Data Management prijs: Beschikbaar op aanvraag
Informatica MDM Reference 360
Informatica’s MDM Reference 360 heeft de volgende belangrijkste kenmerken:
- Volledig cloud-gebaseerd – verbeterde prestaties en schaalbaarheid.
- End-to-end platform – ingebedde data-integratie, datakwaliteit, procesmanagement.
- Self service – Master Data Management en workflows gebouwd voor zakelijke gebruikers zonder technische achtergrond.
- Match en merge – voegt samen en cross-references data van nieuwe types en bronnen.
Informatica MDM Reference 360 prijs: Beschikbaar op aanvraag
Reltio Cloud
Reltio maakt Reltio Cloud, een grafiekgebaseerde masterdatamanagementtool die tools voor het beheer van referentiedata bevat. Reltio is gebouwd op grafische databases om het maximale flexibiliteit te geven, zowel in het schalen van data stores als in het definiëren van duidelijke relaties tussen de data in uw repository. Andere belangrijke kenmerken:
- Eenvoudige integratie met bestaande MDM-tools en/of andere gegevensbronnen.
- Gebruiksvriendelijke interface.
- Altijd beschikbaar cloud-platform maakt upgrades zonder downtime mogelijk.
Reltio Cloud prijs: Beschikbaar op aanvraag
Beste analyse- en visualisatietools
Tableau is een BI-platform dat zowel in de cloud als als downloadbare software beschikbaar is, met de volgende hoofdkenmerken:
- Maakt eenvoudig verbinding met gegevensbronnen.
- Maakt eenvoudig visualisaties toegankelijk voor teams, partners en klanten.
- Maakt onbeperkte gegevensverkenning mogelijk met interactieve dashboards.
- Maakt “dashboard starters”, bruikbare dashboards die in enkele minuten zijn opgezet met gegevens uit populaire webapplicaties.
- Maakt automatisch interactieve kaarten.
Tableau-prijs: $ 35-$ 70 per gebruiker per maand.
Chartio
Chartio is een cloud-gebaseerd BI- en visualisatieplatform met de volgende hoofdkenmerken:
- Interactieve modus – sleep gegevens om dashboards te maken, te filteren en te delen.
- SQL-modus – communiceer met databases in SQL om direct inzichten te extraheren.
- Data layering – voeg opeenvolgende transformatiestappen toe aan gegevens om query-resultaten te transformeren.
- Visualisaties en grafieken – visualiseer gegevens onmiddellijk; Chartio beveelt de meest geschikte grafiek aan.
- Data blending en drill downs – combineer on the fly ongelijksoortige gegevensbronnen en verkrijg bruikbare inzichten zonder ruwe gegevens te onderzoeken.
Chartio prijs: $249/maand voor een teamlicentie.
Looker BI
Looker is een ander cloud-gebaseerd analyse- en visualisatieplatform, met de volgende hoofdkenmerken:
- Definieer metrics eenmalig met behulp van LookML, Looker’s eenvoudige data modelleertaal, en Looker schrijft SQL queries om elke vraag over die metrics te beantwoorden.
- Maak data mooi met eenvoudig te lezen dashboards die gebruikers in staat stellen om in te boren en te verkennen.
- Rechstreeks verbinding maken met databases, zonder extracten of software te downloaden.
- Toegang tot dashboards en rapporten voor iedereen, niet alleen analisten of datawetenschappers.
Looker prijs: $ 3.000 – $ 5.000 per maand voor 10 gebruikers.
Metabase
Metabase biedt een gebruikersvriendelijke, open source interface voor het verbinden en analyseren van uw gegevens. Als een data visualisatie tool, biedt het:
- Honderden native data connectors.
- Eenvoudige setup en toegang voor uw hele team.
- Grote keuze uit verschillende data visualisatie opties.
- Witgelabelde embedding (premium embedding tier en hoger).
- Auditing en data permission management (enterprise tier en hoger).
Prijs Metabase: Metabase is gratis en open source, dus de gratis tier biedt een scala aan functies die geschikt zal zijn voor de meeste gebruikers. Enterprise-plannen kunnen variëren van $ 3.000 – $ 10.000/jaar startprijzen.
Microsoft Power BI
Power BI, Microsoft’s aanbod in de business analytics ruimte, is ontworpen om nuttig te zijn voor bedrijfsanalisten en data wetenschappers gelijk. Belangrijkste kenmerken:
- Eenvoudige drag-and-drop interface die is ontworpen om bekend te zijn bij gebruikers van MS Excel.
- Power BI is een no-code-platform, en biedt zowel desktop- als webclients.
- Bibliotheek met vooraf gebouwde connectoren
- Prestaties hebben de neiging achter te blijven bij zeer grote gegevensverzamelingen – zoek elders naar big data-oplossingen
Microsoft Power BI-prijs: $ 9,99 per gebruiker per maand, of gratis voor de basisversie.
Mode Analytics
Mode Analytics biedt een webgebaseerde suite voor gegevensanalyse, gericht op gegevenswetenschappers en analisten, met de nadruk op samenwerking en delen. Enkele van de belangrijkste kenmerken van Mode:
- Ontworpen om het bijzonder gemakkelijk te maken om uw gegevensbronnen te verbinden met hun ingebouwde SQL-editor en visualisatieplatform.
- Mode kan de resultaten van uw SQL-query’s rechtstreeks naar een R- of Pandas-dataframe in een Mode-native notebook leiden.
- Deel de gegevens, de analyse en het resulterende dashboard allemaal via Mode.
- Mode is een goede keuze voor een team van datawetenschappers die eenvoudiger willen kunnen samenwerken.
Mode Analytics prijs: beschikbaar op aanvraag.
Naar geautomatiseerd gegevensbeheer
We hebben vijf manieren behandeld om na te denken over gegevensbeheertools – Reference Data Management, Master Data Management (MDM), ETL en big data analytics – en een paar geweldige tools in elke categorie.
Naarmate de data-infrastructuur zich naar de cloud verplaatst, wordt een groter deel van de datastack beheerd en volledig geïntegreerd. Er is geen vervanging voor het beheer van bedrijfsprocessen rond gestructureerde gegevens in grote organisaties. Maar cloud-platforms kunnen een groot deel van de strategie voor gegevensbeheer – van de behandeling en voorbereiding van ruwe gegevens tot de opname, het laden, de transformatie, de optimalisatie en de visualisatie van gegevens – automatisch in één systeem verzorgen.