28 værktøjer til datastyring og 5 måder at tænke om datastyring på

Datastyring er et bredt og tvetydigt begreb. Det globale datamanagementfællesskab (DAMA International) definerer det som “udvikling af arkitekturer, politikker, praksis og procedurer til forvaltning af datas livscyklus”. Men når folk siger “dataforvaltning”, hvad mener de så egentlig? Vi foreslår fem muligheder:

  1. Cloud data management – processen med at integrere data fra en organisations økosystem af cloud-applikationer. Hovedforskellen ved cloud data management er, at al lagring, indtagelse og behandling af data foregår i et cloud-baseret lagringsmedie.
  2. ETL og dataintegration – indlæsning af data fra datakilder til et datawarehouse, transformation, opsummering og aggregering af dem til et format, der er egnet til høj dybdegående analyse.
  3. Master data management – en metode til forvaltning af kritiske organisatoriske data: kunder, konti og parter, der er nævnt i forretningstransaktioner, på en standardiseret måde, der forhindrer redundans på tværs af organisationen.
  4. Reference data management – definerer tilladte værdier, der kan anvendes af andre datafelter, f.eks. postnumre, lister over lande, regioner og byer eller produktserienumre. Referencedata kan være hjemmelavede eller eksternt tilvejebragte.
  5. Dataanalyse og visualisering – behandling af udvalgte data fra store datakilder og datawarehouses, udførelse af avancerede dataanalyser og mulighed for analytikere og datavidenskabsfolk til at skære og præsentere visualiseringer og dashboards.

Med nutidens enorme datamængder er værktøjer af høj kvalitet afgørende for at opnå bedste praksis for dataadministration. Organisationer bruger datahåndteringsværktøjer fra alle fem ovennævnte kategorier til at styre og automatisere datahåndteringsprocessen:

  1. Cloud Data Management-værktøjer – disse værktøjer, der er bygget i skyen til skyen, opretter forbindelse til og integrerer flere datakilder via API’er, webhooks eller direkte databaseforbindelser.
  2. ETL-værktøjer – hjælper organisationer med at indlæse data fra flere kilder, definere komplekse, automatiserede transformationer af data, teste datapipelinen og indlæse data løbende til en måldatabase eller et datawarehouse.
  3. Datatransformationsværktøjer – hjælper med transformationen af rådata til rene, aggregerede, analyserbare data, når de bevæger sig fra individuelle datakilder til et analyselager – eller i analyselageret, på analysetidspunktet.
  4. Master Data Management (MDM)-værktøjer – hjælper med at visualisere komplekse sæt af stamdata på tværs af organisationen og letter dataforvaltningen af fageksperter, der fører tilsyn med oprettelse og vedligeholdelse af referencedata.
  5. Reference Data Management (RDM)-værktøjer – leveres ofte som en del af MDM-suites, definerer forretningsprocesser omkring referencedata og hjælper interessenterne med at udfylde referencedata og forvalte dem over tid.
  6. Værktøjer til datavisualisering og dataanalyse – hjælper organisationer med at udforske, analysere og visualisere store datasæt og generere rapporter og dashboards for at uddrage indsigt og vejlede forretningsbeslutninger.

Nedenfor dækker vi flere gode værktøjer fra hver af disse kategorier, både for at hjælpe dig med at forstå hver kategori og for at komme tættere på at vælge det bedste datahåndteringsværktøj til dine behov.

I takt med at lagerplads og båndbredde er blevet billigere, er der kommet flere og flere off-premise-løsninger til datawarehousing og -håndtering til rådighed. Virksomheder med store datamængder, der skal lagres, gennemgås og analyseres, lagrer og administrerer nu rutinemæssigt deres data helt i skyen. Denne arbejdsgang er blevet muliggjort af udbredelsen af datahåndteringsværktøjer i skyen i de seneste 5-10 år. Selv om området hidtil primært har været ledet af giganter som Amazon og Google, tilbyder mange mindre virksomheder nu værktøjer til kunder med databehov i alle størrelser. Nedenfor finder du en liste over potentielle muligheder for datahåndtering i skyen.

Panoply

Panoply tilbyder et cloud-nativt automatiseret datawarehouse, der gør det nemt at integrere og administrere alle din virksomheds data. Nøglefunktioner:

  • Stort udvalg af native datakonnektorer giver mulighed for nem, one-click dataindsamling
  • Automatisk dataindsamling og forbehandling frigør it-ressourcer
  • Intuitivt management dashboard tager gætteriet ud af data management og budgettering
  • Automatisk skalering og vedligeholdelse af multi node databaser for lav-vedligeholdelse af datawarehousing
  • In-browser SQL-editor til dataanalyse og forespørgsler
  • Koblinger til almindelige datavisualiserings- og analysepakker som Tableau, Looker, Chartio

Panoply pris: Pris: 325 $/måned

Amazon Web Services

Amazon Web Services tilbyder et stadigt voksende sæt værktøjer, der kan sættes sammen til en effektiv cloud data management stack. De vigtigste tjenester omfatter:

  • Amazon S3 til midlertidig og/eller mellemliggende lagring
  • Amazon Glacier til langsigtet backup og lagring
  • AWS Glue til opbygning af datakataloger til kategorisering, søge og forespørge dine data
  • Amazon Athena til SQL-baserede dataanalyser
  • Amazon Redshift til datawarehousing
  • Amazon Quicksight til opbygning af dashboards og datavisualisering
  • Hver tjeneste spunnes op og faktureres separat, så omkostningerne afhænger af omfanget af udnyttelsen

AWS Pris: Variabel, afhængig af implementering

Microsoft Azure

Microsofts Azure-platform giver en række forskellige måder at opsætte et cloud-baseret datastyringssystem på, samt analyseværktøjer, der kan bruges på dine Azure-lagrede data. Ligesom AWS giver Azure mulighed for flere forskellige database/data warehouse-stilarter med et stort sæt værktøjer til at administrere dem. De vigtigste tjenester omfatter:

  • Standard SQL-databaser og VM-baserede SQL-servere
  • Blob storage
  • NoSQL-style table storage options
  • Private cloud-implementeringer
  • Azure Data Explorer (ADX) – en nyligt tilføjet tjeneste, der giver mulighed for realtidsanalyse af meget store streamingdata uden behov for forbehandling
  • En nem integration med Panoply til ELT/ETL-tjenester

Azure-pris: Google Cloud

Google Cloud-platform tilbyder ligesom Amazon et bredt sæt værktøjer til cloud-baseret datahåndtering samt en workflow-manager, der kan bruges til at binde de forskellige komponenter sammen. Vigtigste Google Cloud-komponenter:

  • BigQuery til opbevaring af tabulære data
  • Cloud BigTable til opbevaring i NoSQL-databasestil
  • Cloud Pub/Sub og Cloud Data Transfer til dataindsamling; Google Cloud kan også oprette forbindelse til en række andre datakilder
  • BigQuery analytics til SQL-lignende forespørgsler
  • ML Engine til mere avancerede analyser ved hjælp af maskinlæring og AI
  • Data Studio til GUI-baseret analyse og konstruktion af dashboards
  • Cloud Datalab til kodebaseret datavidenskab
  • Koblinger til almindelige BI-værktøjer som Tableau, Looker osv.

Google cloud pris: variabel, afhængig af implementering

Bedste ETL- og dataintegrationsværktøjer

For den omfattende liste over EL-værktøjer se vores liste over de bedste ETL-værktøjer.

Informatica Powercenter

Informatica Powercenter er et on-premise ETL-værktøj med følgende nøglefunktioner:

  • Sømløs forbindelse og integration med alle typer datakilder ved hjælp af out-of-the-box-konnektorer.
  • Automatiseret datavalidering – scriptfri automatiseret revision og validering af data, der flyttes eller transformeres.
  • Advancerede datatransformationer – understøtter ikke-relationelle data, kan analysere XML, JSON, PDF, Microsoft Office- og IoT-data.
  • Metadatadrevet styring – giver grafiske visninger af datastrømme, påvirkning og afstamning.

Informatica PowerCenter pris: 2.000 dollars/måned for det mest grundlæggende abonnement

Stitch Data

Stitch Data er en cloud-baseret ETL-platform med følgende nøglefunktioner:

  • Pre-integreret med snesevis af datakilder i og uden for skyen, flytter data til Amazon Redshift, S3, BigQuery, Panoply, PostgreSQL med mere.
  • Nem planlægning af datareplikering.
  • Fejlehåndtering og varsling med automatiseret løsning, når det er muligt.
  • API- og JSON-ramme, så du kan skubbe data ind i et datawarehouse programmatisk.
  • Gestyret cloud-tjeneste med automatisk skalering og SLA’er i virksomhedskvalitet.

Stitch-pris: $100 – $1.000/måned baseret på datastørrelse

Fivetran

Fivetran er en fuldt administreret datapipeline med en webgrænseflade, der integrerer data fra SaaS-tjenester og databaser i et enkelt datawarehouse. Nøglefunktioner:

  • Giver direkte integration og sender data over en direkte sikker forbindelse ved hjælp af et sofistikeret caching-lag.

  • Caching-laget hjælper med at flytte data fra et punkt til et andet uden nogensinde at lagre en kopi på applikationsserveren.

  • Fivetran pålægger ikke nogen datalimitering.

  • Kan bruges til at centralisere en virksomheds data og integrere alle kilder for at bestemme Key Performance Indicators (KPIs) på tværs af en hel organisation.

Fivetran pris:

3. Blendo

Blendo er en anden cloudbaseret ETL- og dataintegrationstjeneste med følgende nøglefunktioner:

  • Selvbetjening – opretter forbindelse til mange datakilder med få klik, flytter data til Amazon Redshift, Panoply, PostgreSQL, MS SQL Server og meget mere.
  • Historiske data – indlæser og synkroniserer historiske data fra cloud-tjenester.
  • Skemalagt indlæsning – indlæser data periodisk eller med udvalgte frekvenser fra forskellige datakilder.
  • Dataskemaoptimering – automatiseret indsamling, registrering og klargøring af data ved hjælp af optimalt relationelt skema.

Blendo pris: Tilgængelig efter anmodning

Microsoft SQL Server SSIS

Microsoft tilbyder SSIS, en grafisk grænseflade til styring af ETL ved hjælp af MS SQL Server. De vigtigste funktioner omfatter:

  • En brugervenlig grænseflade giver brugerne mulighed for at implementere integrerede datawarehousing-løsninger uden at skulle beskæftige sig med at skrive meget – eller slet ingen – kode.
  • Grafisk grænseflade giver mulighed for nem drag-and-drop ETL for flere datatyper og warehouse-destinationer, herunder ikke-MS DB’er.
  • God løsning til et team med en blanding af tekniske færdighedsniveauer, da den er lige så effektiv for ETL-ninjaer som for point-and-click-typer.

SSIS pris: $931 – $15.000

Azure Data Factory

Ud over SQL Server SSIS, Microsofts ETL-løsning on-premise, tilbyder virksomheden også Azure Data Factory (ADF), et ETL-værktøj til deres cloud-baserede Azure-platform. De vigtigste funktioner i ADF:

  • ETL-pipelines i ADF er opbygget i en grafisk grænseflade, hvilket giver mulighed for low-code-brug.
  • Vid vifte af datakonnektorer til nem indlæsning af data – bortset fra, mærkeligt nok, understøttelse af indlæsning af Microsoft Excel-filer.
  • Fuld understøttelse af indlæsning af data i Azure-datawarehouses

Azure Data Factory-pris: 1 dollar for 1.000 kørsler pr. måned

Talend

Talend open source softwareprodukter til dataintegration leverer software til at integrere, rense, maskere og profilere data. De vigtigste funktioner i Talend-produkterne omfatter:

  • GUI, der gør det muligt at administrere et stort antal kildesystemer ved hjælp af standardkonnektorer.
  • Master Data Management (MDM)-funktionalitet
  • En enkelt, konsistent og præcis visning af vigtige virksomhedsdata.

Talend-pris: 1.170 USD/bruger pr. måned eller 12.000 USD pr. år

Alooma

Alooma tilbyder en dataintegrationsplatform i virksomhedsskala med gode ETL-værktøjer indbygget. Nogle af de vigtigste funktioner i Alooma-tilbuddene:

  • Stærk fokus på hurtig opbygning af pipelines, overvågning af datakvalitet og fejlhåndtering.
  • Beskyttelse mod tab eller korruption af data i en potentielt fejlbehæftet ETL-proces.
  • Fleksibilitet til at gribe ind og skrive dine egne scripts til at overvåge, rense og flytte dine data efter behov.
  • Designet til drift i virksomhedsskala.

Alooma-pris: 1.000 – 15.000 USD/måned

Bedste datatransformationsværktøjer

Dataform er en SQL-baseret, fuldt administreret datatransformationsplatform til styring af processer i dit cloud-datawarehouse. Nøglefunktioner:

  • Skriv SQL-arbejdsgange som et team i et samarbejdsorienteret IDE. Indbygget versionsstyring og integration med Github.
  • Skriv datakvalitetstest og indstil advarsler, hvis de fejler, for at sikre, at dine data altid er pålidelige.
  • Opret et centraliseret arkiv for datadefinitioner på tværs af din virksomhed, dokumenter dine data og find datasæt i et datakatalog.
  • Kør skemaer for at sikre, at dine data altid er opdaterede.

Dataform-pris:: Fra 550 USD/måned (opstartsrabatter tilgængelige)

DBT

DBT (Data Build Tool) er et SQL-baseret datatransformationsværktøj, der giver dig mulighed for at opsætte modulære transformationsstrømme fra kommandolinjen. DBT er bygget med henblik på at strømline dataanalyser og tekniske arbejdsgange, og DBT’s vigtigste funktioner omfatter bl.a:

  • SQL-baseret værktøj
  • Nemme arbejdsgange til opbygning af modulære transformations- og datamodelleringsstrømme
  • Automatiseret datakvalitetsstyring med et robust testsystem
  • Streamlined analytics code deployment using environments, pakkehåndtering og kontinuerlig integration
  • Nemt datadokumentation med automatisk genererede DAG’er og nem dataannotation og katalogisering
  • Data snapshotting for bedre historisk dataanalyse

DBT pris: $0 for gratis niveau, $100/mo for grundlæggende, med tilbud til rådighed for større virksomhedsimplementeringer

Airflow

Airflow er oprindeligt udviklet hos Airbnb og er et populært nyt open source datainfrastrukturværktøj. Selv om det ikke selv foretager nogen databehandling, kan Airflow hjælpe dig med at planlægge, organisere og overvåge ETL-processer ved hjælp af python. Nøglefunktioner:

  • Directed Acyclic Graphs (DAGs) gør det muligt for dets scheduler at sprede dine opgaver over en række arbejdere uden at du behøver at definere præcise forældre-barn-relationer mellem datastrømme
  • Smart webbaseret brugergrænseflade til administration og redigering af dine DAGs
  • Nice sæt værktøjer, der gør det nemt at udføre “DAG-kirurgi” fra kommandolinjen.
  • Høj grad af udvidelighed og skalerbarhed

Airflow-pris: gratis og open source

Luigi

Luigi er en open source Python-pakke udviklet af Spotify. Den er designet til at gøre administrationen af langvarige batchprocesser lettere, så den kan håndtere opgaver, der går langt ud over ETL’s omfang – men den gør også ETL ret godt. Nøglefunktioner:

  • Python-kodebase gør det nemt at opbygge effektive datapipelines, især dem, der beskæftiger sig med langvarige batchprocesser
  • Let opløsning af afhængigheder
  • Webgrænseflade, der giver brugeren mulighed for at visualisere opgaver til styring af arbejdsgange
  • Konceptuelt set ligner det GNU Make, men er ikke kun til Hadoop
  • Atomiske filsystemoperationer sikrer, at dine pipelines aldrig vil gå ned med delvise data

Luigi pris: De bedste Master Data Management-værktøjer

Dell Boomis Master Data Hub har følgende nøglefunktioner:

  • Definer modeller via lav kode, visuel oplevelse.
  • Deployerer datamodeller og identificerer, hvilke kildesystemer der interagerer med dem.
  • Indfører systemregistreringer i et konsolideret repository, samler automatisk lignende registreringer.
  • Muliggør data stewarding – advarer teams om at løse dubletter og problemer med dataindtastning.
  • Governes data med bidirektionelle processtrømme i realtid på tværs af siloer.

Dell Boomi Master Data Hub pris: $100.000 – $300.000

Profisee

Profisee’s Master Data Management har følgende nøglefunktioner:

  • Stewardship og governance – gør det muligt for “data stewards” i organisationen at administrere master data med feedback fra analytics.
  • Golden record management – standardiserer, renser og matcher kildedata uden kodning.
  • Event management – registrerer dataændringer, distribuerer begivenheder til abonnerende systemer.
  • Integrator – federerer masterdata for globale virksomheder med bi-direktionel integration i realtid.
  • Enterprise workflow – håndhæver forretningsprocesser på tværs af organisationer, lader administratorer administrere data steward performance.
  • SDK – muliggør integration af brugerdefinerede applikationer.

Pris: $10.30/time

SAP NetWeaver

SAP NetWeaver MDM, der er en del af NetWeaver-udviklingsplatformen, har følgende nøglefunktioner:

  • Automatisk udtræk af stamdata fra alle større SAP-applikationer.
  • Lader stamdata fra andre kilder.
  • Integrerer data ved hjælp af forretningsindhold som f.eks. repository-strukturer, valideringsregler, indgående og udgående mappinger.
  • Distribuerer masterdata til mål.
  • Muliggør programmatisk dataintegration via API’er og webservices.

SAP NetWeaver-prisfastsættelse:

Semarchy xDM

Semarchy er en relativ nybegynder på MDM-scenen, idet den blev lanceret i 2011. Virksomheden er baseret i Frankrig og blev grundlagt af et team af tidligere Sunopsis-medarbejdere. xDM, deres vigtigste MDM-produkt, har følgende funktioner:

  • Nej Hadoop-afhængig.
  • Optimeret til Oracle.
  • Opdateringer og ændringer spores og udbredes ved hjælp af metadata, hvilket giver mulighed for iterativ, “evolutionær” datahåndtering.
  • Funktioner med en trinvis brugergrænseflade, der kan tilpasses til specifikke forretningsroller (dvs. analytikere, drift osv.).

Semarch xDM pris: Pris: Kan fås efter anmodning

Tibco MDM

Tibco er en evig placering i top MDM-værktøjsranglisterne. Nøglefunktioner omfatter:

  • Fleksibilitet og skalerbarhed til multidomæneapplikationer.
  • Uafhængigt, distribueret masterdatalag.
  • Anpasselig visuel grænseflade uden kode, der kan bygges, så den passer til forskellige forretningsroller.
  • Højklassificeret understøttelse af dataversionering.
  • SOAP-webtjenester understøttes.

Tibco MDM-pris: Tilgængelig efter anmodning

Ataccama ONE

Ataccama tilbyder ONE, et højt automatiseret datastyringsværktøj, der kan køres on-premise, i skyen eller i en hybrid opsætning. De vigtigste funktioner omfatter:

  • Machine learning-baseret datakuratering, rensning og klassificering.
  • Automatiseret metadataopdagelse.
  • Automatiseret projektkonfiguration.
  • Domæne agnostisk, men leveres forudkonfigureret med præfabrikerede regler for MDM for typiske domæner såsom kunde, kontakt og produkt.
  • Konnektorer til en bred vifte af datatyper og -kilder.
  • GDPR ready.
  • Fuld datarevisionshistorik med detaljeret logbog over anvendte forretningsregler og transformationer.

Ataccama ONE pris: Tilgængelig efter anmodning

Stibo STEP

Stibo har den ære at være den nok ældste virksomhed på listen, idet den blev grundlagt i det 18. århundrede som et trykkeri. Selskabets datastyringsdel er en yngre tilføjelse, og STEP, dets vigtigste datastyringsværktøj, har følgende nøglefunktioner:

  • STEP Workbench UI.
  • Holistisk multidomain MDM-platform.
  • Høj grad af automatisering.
  • Automatiseret data- og sprogoversættelse til multinationale operationer.
  • Automatiseret gennemgang og godkendelse af digitale aktiver.
  • Håndtering af masterdata på virksomhedsniveau.

Stibo STEP-pris: Tilgængelig efter anmodning

Bedste værktøjer til styring af referencedata

Collibra’s referencedata-løsning har følgende nøglefunktioner:

  • Automatiserer arbejdsgange til oprettelse af nye koder og kodesæt.
  • Leverer koder og kodesæt til brugerne på en venlig måde.
  • Udfører præcis datakortlægning for at fjerne barrierer for dataadgang.
  • Sammenligner data fra forskellige dele af organisationen.

Collibra pris:

Magnitude

Magnitude’s Reference Data Management har følgende nøglefunktioner:

  • Multi-domænemodellering – understøtter forretningsstrukturer fra kodelister til multi-path, selvrefererende hierarkier.
  • Automatisering – giver automatisering, styring og kontrol over referencedataobjekter og indlæsningsprocesser.
  • Mapping – giver global til lokal, ekstern til intern og specifik til generel mapping uden afbrydelse af eksisterende elementer.
  • Governance – giver en tilpasselig workflow til at styre forretningsprocesser relateret til referencedata, med modelbaserede sikkerhedskontroller, der giver brugerne mulighed for at se, tilføje eller opdatere.
  • Tidsvarians – giver brugerne mulighed for at ændre modeller, emner, attributter og associationer og hente enhver tidligere version af objektet.

Magnitude Reference Data Management price:

Informatica MDM Reference 360

Informaticas MDM Reference 360 har følgende nøglefunktioner:

  • Fuldt cloud-baseret – forbedret ydeevne og skalerbarhed.
  • End-to-end-platform – indlejret dataintegration, datakvalitet, processtyring.
  • Selvbetjening – Master Data Management og workflows bygget til forretningsbrugere uden teknisk baggrund.
  • Match and merge – sammenlægning og krydsreferencer af data fra nye typer og kilder.

Informatica MDM Reference 360 pris: Reltio Cloud

Reltio laver Reltio Cloud, et grafbaseret masterdatahåndteringsværktøj, der omfatter værktøjer til håndtering af referencedata. Reltio er bygget på grafdatabaser for at give det maksimal fleksibilitet, både med hensyn til at skalere datalagre og til at definere klare relationer mellem dataene i dit arkiv. Andre vigtige funktioner:

  • En nem integration med eksisterende MDM-værktøjer og/eller andre datakilder.
  • Brugervenlig grænseflade.
  • Altid tilgængelig cloud-platform gør nul-downtime-opgraderinger mulige.

Reltio Cloud pris:

Bedste analyse- og visualiseringsværktøjer

Tableau er en BI-platform, der er tilgængelig både i skyen og som software, der kan downloades, og som har følgende nøglefunktioner:

  • Har nem forbindelse til datakilder.
  • Giver nem adgang til visualiseringer for teams, partnere og kunder.
  • Giver mulighed for ubegrænset dataudforskning med interaktive dashboards.
  • Opret “dashboard starters”, handlingsorienterede dashboards, der kan opsættes på få minutter med data fra populære webapplikationer.
  • Opret interaktive kort automatisk.

Tableau-pris: 35-70 dollars pr. bruger pr. måned.

Chartio

Chartio er en cloud-baseret BI- og visualiseringsplatform med følgende nøglefunktioner:

  • Interaktiv tilstand – træk og slip data for at oprette, filtrere og dele dashboards.
  • SQL-tilstand – kommunikér med databaser i SQL for direkte at udtrække indsigt.
  • Data layering – tilføj successive transformationstrin til data for at transformere forespørgselsresultater.
  • Visualiseringer og diagrammer – visualiser data med det samme; Chartio anbefaler det mest passende diagram.
  • Datamixning og drill downs – kombiner forskellige datakilder i farten og få brugbar indsigt uden at udforske rådata.

Chartio pris: 249 USD/måned for en teamlicens.

Looker BI

Looker er en anden cloud-baseret analyse- og visualiseringsplatform med følgende nøglefunktioner:

  • Definér målinger én gang ved hjælp af LookML, Looker’s simple datamodelleringssprog, og Looker skriver SQL-forespørgsler for at besvare ethvert spørgsmål om disse målinger.
  • Gør data smukke med letlæselige dashboards, der giver brugerne mulighed for at bore ind og udforske.
  • Opnå direkte forbindelse til databaser uden udtræk eller software, der skal downloades.
  • Opnå adgang til dashboards og rapporter for alle, ikke kun analytikere eller dataloger.

Looker-pris: 3.000 – 5.000 dollars om måneden for 10 brugere.

Metabase

Metabase tilbyder en brugervenlig, open source-grænseflade til at forbinde og analysere dine data. Som et datavisualiseringsværktøj tilbyder det:

  • Hundredvis af native datakonnektorer.
  • En nem opsætning og adgang for hele dit team.
  • En stor vifte af forskellige datavisualiseringsmuligheder at vælge imellem.
  • White labeled embedding (premium embedding tier og opefter).
  • Auditering og forvaltning af datatilladelser (enterprise-niveau og derover).

Metabasepris: Metabase er gratis og open source, så dets gratis niveau tilbyder en række funktioner, der vil være passende for de fleste brugere. Enterprise-planer kan variere fra 3.000 – 10.000 dollars/årlige startpriser.

Microsoft Power BI

Power BI, Microsofts tilbud inden for virksomhedsanalyse, er designet til at være nyttigt for både forretningsanalytikere og dataloger. Hovedfunktioner:

  • En simpel træk-og-slip-grænseflade, der er designet til at være velkendt for brugere af MS Excel.
  • Power BI er en platform uden kode og tilbyder både desktop- og webklienter.
  • Bibliotek med præfabrikerede konnektorer
  • Performance har tendens til at halter på meget store datasæt – se andre steder efter big data-løsninger

Microsoft Power BI pris: 9,99 USD pr. bruger pr. måned, eller gratis for basisversionen.

Mode Analytics

Mode Analytics tilbyder en webbaseret dataanalysepakke rettet mod dataloger og analytikere med fokus på samarbejde og deling. Nogle af Modes vigtigste funktioner:

  • Designet til at gøre det særligt nemt at forbinde dine datakilder til deres indbyggede SQL-editor og visualiseringsplatform.
  • Mode kan lede resultaterne af dine SQL-forespørgsler direkte ind i et R- eller Pandas-dataframe i en Mode-nativ notesbog.
  • Del data, analyser og det resulterende dashboard alt sammen via Mode.
  • Mode er et godt valg for et team af dataloger, der ønsker at kunne samarbejde nemmere.

Mode Analytics pris: fås efter anmodning.

Ved automatiseret datahåndtering

Vi dækkede fem måder at tænke på datahåndteringsværktøjer på – referencedatahåndtering, masterdatahåndtering (MDM), ETL og big data-analyse – og et par gode værktøjer i hver kategori.

I takt med at datainfrastrukturen flyttes til skyen, bliver en større del af datastacken administreret og fuldt integreret. Der er ingen erstatning for at styre forretningsprocesser omkring strukturerede data i store organisationer. Men cloud-baserede platforme kan hjælpe med en stor del af datastyringsstrategien – fra behandling og forberedelse af rådata til dataindsamling, indlæsning, indlæsning, transformation, optimering og visualisering – automatisk i et enkelt system.