Datahantering är ett brett och tvetydigt begrepp. Global Data Management Community (DAMA International) definierar det som ”utveckling av arkitekturer, strategier, metoder och förfaranden för att hantera datalivscykeln”. Men när folk säger ”datahantering”, vad menar de då egentligen? Vi föreslår fem möjligheter:
- Molndatahantering – processen att integrera data från en organisations ekosystem av molntillämpningar. Den viktigaste skillnaden mellan datahantering i molnet är att all lagring, intagning och bearbetning av data sker i ett molnbaserat lagringsmedium.
- ETL och dataintegration – laddning av data från datakällor till ett datalager, omvandling, sammanfattning och aggregering av dem till ett format som lämpar sig för en djupgående analys.
- Hantering av masterdata – en metod för att hantera kritiska organisationsdata: kunder, konton och parter som namnges i affärstransaktioner, på ett standardiserat sätt som förhindrar redundans i hela organisationen.
- Hantering av referensdata – definierar tillåtna värden som kan användas av andra datafält, t.ex. postnummer, listor över länder, regioner och städer, eller produktserienummer. Referensdata kan vara egenutvecklade eller tillhandahållas externt.
- Dataanalys och visualisering – bearbetar utvalda data från stora datakällor och datalager, utför avancerad dataanalys och gör det möjligt för analytiker och datavetare att skära, tärna och presentera visualiseringar och instrumentpaneler.
Med dagens enorma datamängder är högkvalitativa verktyg viktiga för att uppnå bästa praxis för datahantering. Organisationer använder datahanteringsverktyg från alla fem kategorierna ovan för att hantera och automatisera datahanteringsprocessen:
- Molnverktyg för datahantering – byggda i molnet, för molnet, dessa verktyg ansluter till och integrerar flera datakällor via API:er, webhooks eller direkta databasanslutningar.
- ETL-verktyg – hjälper organisationer att ladda in data från flera källor, definiera komplexa, automatiserade omvandlingar av data, testa datapipelinen och ladda data kontinuerligt till en måldatabas eller ett datalager.
- Verktyg för datatransformation – hjälper till att omvandla rådata till rena, aggregerade, analyserbara data när de flyttas från enskilda datakällor till ett analyslager – eller inom analyslagret, vid analystillfället.
- Verktyg för hantering av masterdata (MDM) – hjälper till att visualisera komplexa uppsättningar masterdata i hela organisationen och underlättar dataförvaltning av ämnesexperter, som övervakar skapandet och underhållet av referensdata.
- Verktyg för referensdatahantering (RDM) – tillhandahålls ofta som en del av MDM-sviter, definierar affärsprocesser kring referensdata och hjälper intressenterna att fylla referensdata och hantera dem över tiden.
- Verktyg för datavisualisering och dataanalys – hjälper organisationer att utforska, analysera och visualisera stora datamängder och generera rapporter och instrumentpaneler för att utvinna insikter och vägleda affärsbeslut.
Nedan tar vi upp flera bra verktyg från var och en av de här kategorierna, både för att hjälpa dig att förstå varje kategori och för att närma dig valet av det bästa datahanteringsverktyget för dina behov.
I takt med att lagring och bandbredd har blivit billigare har fler och fler off-premise-lösningar för datalagring och datahantering blivit tillgängliga. Företag med stora datamängder som ska lagras, genomlyssnas och analyseras lagrar och hanterar nu rutinmässigt sina data helt och hållet i molnet. Detta arbetsflöde har möjliggjorts genom att verktyg för datahantering i molnet har blivit allt vanligare under de senaste 5-10 åren. Även om fältet hittills främst har letts av jättar som Amazon och Google, erbjuder många mindre företag nu verktyg för kunder med databehov av alla storlekar. Nedan finns en lista över potentiella alternativ för molndatahantering.
- Panoply
- Amazon Web Services
- Microsoft Azure
- Bästa ETL- och dataintegrationsverktyg
- Informatica Powercenter
- Stitch Data
- Fivetran
- Microsoft SQL Server SSIS
- Azure Data Factory
- Talend
- Alooma
- Bästa dataomvandlingsverktyg
- DBT
- Airflow
- Luigi
- Bästa verktyg för hantering av masterdata
- Profisee
- SAP NetWeaver
- Semarchy xDM
- Tibco MDM
- Ataccama ONE
- Stibo STEP
- Bästa verktyg för hantering av referensdata
- Magnitude
- Informatica MDM Reference 360
- Bästa analys- och visualiseringsverktyg
- Chartio
- Looker BI
- Metabase
- Microsoft Power BI
- Mode Analytics
- Till automatiserad datahantering
Panoply
Panoply erbjuder ett molnbaserat automatiserat datalager som gör det enkelt att integrera och hantera alla organisationens data. Viktiga funktioner:
- Stort urval av infödda datakopplingar gör det enkelt att, en-klicks datainsamling
- Automatisk datainsamling och förbehandling frigör IT-resurser
- Intuitiv instrumentpanel tar bort gissningar från datahantering och budgetering
- Automatiserad skalning och underhåll av databaser med flera noder för låga kostnader.underhåll av datalager
- SQL-redigerare i webbläsaren för dataanalys och sökning
- Kopplingar till vanliga datavisualiserings- och analyssviter som Tableau, Looker, Chartio
Panoply pris: Pris: 325 dollar/månad
Amazon Web Services
Amazon Web Services erbjuder en ständigt växande uppsättning verktyg som kan sättas samman till en effektiv datahanteringsstack i molnet. Viktiga tjänster är bland annat:
- Amazon S3 för tillfällig och/eller mellanlagring
- Amazon Glacier för långsiktig säkerhetskopiering och lagring
- AWS Glue för att bygga datakataloger för att kategorisera, sökning och sökning av data
- Amazon Athena för SQL-baserad dataanalys
- Amazon Redshift för datalager
- Amazon Quicksight för konstruktion av instrumentpaneler och datavisualisering
- Varje tjänst startas och debiteras separat, så kostnaderna beror på hur mycket den används
AWS Pris: Variabel, beroende på implementering
Microsoft Azure
Microsofts Azure-plattform erbjuder ett antal olika sätt att konfigurera ett molnbaserat datahanteringssystem, samt analysverktyg som kan användas på dina Azure-lagrade data. Liksom AWS tillåter Azure flera olika typer av databaser/datalager med en stor uppsättning verktyg för att hantera dem. Viktiga tjänster är bland annat:
- Standard SQL-databaser och VM-baserade SQL-servrar
- Bloblagring
- NoSQL-liknande tabelllagringsalternativ
- Privata molnimplementeringar
- Azure Data Explorer (ADX). en nyligen tillagd tjänst som möjliggör realtidsanalys av mycket stora strömmande data utan behov av förbehandling
- Enklare integration med Panoply för ELT/ETL-tjänster
Azure-pris: Google Cloud
Likt Amazon erbjuder Googles Cloud-plattform en bred uppsättning verktyg för molnbaserad datahantering samt en arbetsflödeshanterare som kan användas för att binda samman de olika komponenterna. Viktiga komponenter i Google Cloud:
- BigQuery för lagring av tabelldata
- Cloud BigTable för lagring av NoSQL-databasliknande data
- Cloud Pub/Sub och Cloud Data Transfer för dataintag; Google Cloud kan också anslutas till en mängd andra datakällor
- BigQuery analytics för SQL-liknande frågor
- ML Engine för mer avancerade analyser med maskininlärning och artificiell intelligens
- Data Studio för GUI-baserad analys och konstruktion av instrumentpaneler
- Cloud Datalab för kodbaserad datavetenskap
- Kopplingar till vanliga BI-verktyg som Tableau, Looker, etc.
Google cloud pris: varierande, beroende på implementering
Bästa ETL- och dataintegrationsverktyg
För en omfattande lista över EL-verktyg kolla in vår lista över bästa ETL-verktyg.
Informatica Powercenter
Informatica Powercenter är ett ETL-verktyg på plats med följande huvudfunktioner:
- Sömlös anslutning och integration med alla typer av datakällor med hjälp av färdiga anslutningar.
- Automatiserad datavalidering – skriptfri automatiserad granskning och validering av data som flyttas eller transformeras.
- Avancerade datatransformationer – stödjer icke-relationella data, kan analysera XML-, JSON-, PDF-, Microsoft Office- och IoT-data.
- Metadatadriven hantering – ger grafiska vyer av dataflöden, inverkan och härkomst.
Informatica PowerCenter pris: 2 000 dollar/månad för den mest grundläggande planen
Stitch Data
Stitch Data är en molnbaserad ETL-plattform med följande nyckelfunktioner:
- Förhandsintegrerat med dussintals datakällor i och utanför molnet, flyttar data till Amazon Redshift, S3, BigQuery, Panoply, PostgreSQL med mera.
- Enklare schemaläggning för datareplikering.
- Felhantering och varning med automatisk lösning när det är möjligt.
- API och JSON-ramverk, så att du kan trycka data till ett datalager programmatiskt.
- Hanterad molntjänst med automatisk skalning och SLA:er i företagsklass.
Stitch pris: 100 dollar – 1 000 dollar/månad baserat på datastorlek
Fivetran
Fivetran är en fullt hanterad datapipeline med ett webbgränssnitt som integrerar data från SaaS-tjänster och databaser i ett enda datalager. Viktiga funktioner:
-
Gör direkt integration och skickar data över en direkt säker anslutning med hjälp av ett sofistikerat cachinglager.
-
Cachningslagret hjälper till att flytta data från en punkt till en annan utan att någonsin lagra en kopia på applikationsservern.
-
Fivetran inför ingen datagräns.
-
Kan användas för att centralisera ett företags data och integrera alla källor för att fastställa nyckeltal (Key Performance Indicators, KPIs) i en hel organisation.
Fivetran pris: Blendo
3. Blendo
Blendo är en annan molnbaserad ETL- och dataintegrationstjänst med följande huvudfunktioner:
- Självbetjäning – ansluter till många datakällor med några få klick, flyttar data till Amazon Redshift, Panoply, PostgreSQL, MS SQL Server med mera.
- Historiska data – laddar och synkroniserar historiska data från molntjänster.
- Planerad laddning – laddar data periodiskt eller vid valda frekvenser från olika datakällor.
- Optimering av dataskema – automatiserad insamling, detektering och förberedelse av data med hjälp av optimalt relationsschema.
Blendo pris: Tillgänglig på begäran
Microsoft SQL Server SSIS
Microsoft erbjuder SSIS, ett grafiskt gränssnitt för hantering av ETL med hjälp av MS SQL Server. Viktiga funktioner är bland annat:
- Med ett lättanvänt gränssnitt kan användare distribuera integrerade datalagringslösningar utan att behöva skriva mycket – eller någon – kod.
- Grafiskt gränssnitt gör det möjligt att enkelt dra-och-släppa ETL för flera datatyper och lagerdestinationer, inklusive icke-MS DBs.
- Genial lösning för ett team med en blandning av tekniska färdighetsnivåer, eftersom den är lika effektiv för ETL ninjor som för peka-och-klicka-typer.
SSIS-pris: 931 dollar – 15 000 dollar
Azure Data Factory
Förutom SQL Server SSIS, Microsofts ETL-lösning på plats, erbjuder företaget även Azure Data Factory (ADF), ett ETL-verktyg för deras molnbaserade Azure-plattform. Viktiga funktioner i ADF:
- ETL-pipelines i ADF byggs i ett grafiskt gränssnitt, vilket gör det möjligt att använda låg kod.
- Vidare utbud av datakopplingar för enkel datainmatning – förutom, märkligt nog, stöd för att ladda Microsoft Excel-filer.
- Fullt stöd för laddning av data till Azure datalager
Azure Data Factory pris: 1 dollar för 1 000 körningar per månad
Talend
Talend open source programvara för dataintegration tillhandahåller programvara för att integrera, rensa, maskera och profilera data. Viktiga funktioner i Talends erbjudanden är bland annat följande:
- GUI som gör det möjligt att hantera ett stort antal källsystem med hjälp av standardkontakter.
- Master Data Management (MDM)-funktionalitet
- En enda, konsekvent och korrekt vy av viktiga företagsdata.
Talend-pris: 1 170 dollar/användare per månad eller 12 000 dollar per år
Alooma
Alooma erbjuder en plattform för dataintegration i stor skala med bra ETL-verktyg inbyggda. Några viktiga funktioner i Aloomas erbjudanden:
- Stort fokus på snabb konstruktion av pipelines, övervakning av datakvalitet och felhantering.
- Skydd mot förlust eller korruption av data i en potentiellt felbenägen ETL-process.
- Flexibilitet att ingripa och skriva egna skript för att övervaka, rensa och flytta data vid behov.
- Designad för verksamhet i företagsskala.
Alooma-pris: 1 000 – 15 000 dollar/månad
Bästa dataomvandlingsverktyg
Dataform är en SQL-baserad, helt hanterad dataomvandlingsplattform för hantering av processer i ditt datalager i molnet. Huvudfunktioner:
- Skriv SQL-arbetsflöden som ett team i ett IDE för samarbete. Inbyggd versionskontroll och integration med Github.
- Skriv datakvalitetstester och ställ in varningar om de misslyckas för att se till att dina data alltid är tillförlitliga.
- Skapa ett centraliserat arkiv för datadefinitioner i hela företaget, dokumentera dina data och upptäck dataset i en datakatalog.
- Kör scheman för att se till att dina data alltid är uppdaterade.
Dataforms pris:: Från 550 dollar/månad (startrabatter tillgängliga)
DBT
DBT (Data Build Tool) är ett SQL-baserat datatransformationsverktyg som gör det möjligt för dig att konfigurera modulära transformationsflöden från kommandoraden. DBT har byggts med sikte på att effektivisera dataanalyser och tekniska arbetsflöden och har bland annat följande nyckelfunktioner:
- SQL-baserat verktyg
- Enkla arbetsflöden för att bygga modulära transformations- och datamodelleringsflöden
- Automatiserad hantering av datakvalitet med ett robust testsystem
- Streamlined analytics code deployment using environments, pakethantering och kontinuerlig integration
- Enklare datadokumentation med automatiskt genererade DAGs och enkel annotering och katalogisering av data
- Snapshotting av data för bättre historisk dataanalys
DBT-pris: Det finns offerter för större företagsinstallationer
Airflow
Airflow, som ursprungligen utvecklades av Airbnb, är ett populärt nytt datainfrastrukturverktyg med öppen källkod. Även om det inte gör någon databehandling själv kan Airflow hjälpa dig att schemalägga, organisera och övervaka ETL-processer med hjälp av python. Viktiga funktioner:
- Directed Acyclic Graphs (DAGs) gör det möjligt för dess schemaläggare att sprida dina uppgifter över en rad arbetare utan att du behöver definiera exakta förälder-barn-relationer mellan dataflöden
- Snygg webbaserat användargränssnitt för hantering och redigering av dina DAGs
- Vänlig uppsättning verktyg som gör det enkelt att utföra ”DAG-kirurgi” från kommandoraden.
- Hög utbyggbarhet och skalbarhet
Airflow pris: gratis och öppen källkod
Luigi
Luigi är ett Python-paket med öppen källkod som utvecklats av Spotify. Det är utformat för att underlätta hanteringen av långvariga batchprocesser, så det kan hantera uppgifter som går långt utanför ETL:s räckvidd – men det gör ETL ganska bra också. Viktiga funktioner:
- Python-kodbasen gör det enkelt att bygga effektiva datapipelines, särskilt sådana som hanterar långkörande batchprocesser
- Lätt att lösa beroenden
- Webbänksgränssnitt som gör det möjligt för användaren att visualisera uppgifter för hantering av arbetsflöden
- Liknande koncept för GNU Make, men är inte bara för Hadoop
- Atomiska filsystemoperationer säkerställer att dina pipelines aldrig kraschar med partiella data
Luigi pris: Det är gratis och öppen källkod
Bästa verktyg för hantering av masterdata
Dell Boomis Master Data Hub har följande nyckelfunktioner:
- Definierar modeller med hjälp av låg kod, visuell upplevelse.
- Deployerar datamodeller och identifierar vilka källsystem som interagerar med dem.
- Inför systemposter i ett konsoliderat arkiv, slår automatiskt samman liknande poster.
- Möjliggör data stewarding – varnar team för att lösa dubbletter och problem med datainmatning.
- Gör data med dubbelriktade processflöden i realtid över silos.
Dell Boomi Master Data Hub pris: 100 000 dollar – 300 000 dollar
Profisee
Profisee’s Master Data Management har följande nyckelfunktioner:
- Stewardship och styrning – gör det möjligt för ”datastewardsen” inom organisationen att hantera masterdata med feedback från analyser.
- Golden record management – standardiserar, rensar och matchar källdata utan kodning.
- Hantering av händelser – upptäcker dataförändringar, distribuerar händelser till prenumerationssystem.
- Integrator – federerar masterdata för globala företag, med bi-direktionell integration i realtid.
- Entreprenörsarbetsflöde – upprätthåller affärsprocesser över organisationsgränserna, låter administratörer hantera data steward-prestationer.
- SDK – möjliggör integrering av anpassade tillämpningar.
Pris för proffstyckare: $10.30/timme
SAP NetWeaver
SAP NetWeaver MDM, en komponent i utvecklingsplattformen NetWeaver, har följande nyckelfunktioner:
- Automatiskt extraherar masterdata från alla större SAP-applikationer.
- Laddar masterdata från andra källor.
- Integrerar data med hjälp av affärsinnehåll som arkivstrukturer, valideringsregler, inkommande och utgående mappningar.
- Distribuerar masterdata till mål.
- Möjliggör programmatisk dataintegration via API:er och webbtjänster.
SAP NetWeaver-priser: Tillgänglig på begäran
Semarchy xDM
Semarchy är en relativt nykomling på MDM-scenen och lanserades 2011. Företaget är baserat i Frankrike och grundades av ett team av tidigare Sunopsis-anställda. xDM, deras huvudsakliga MDM-produkt, har följande funktioner:
- Inte Hadoop-beroende.
- Optimerad för Oracle.
- Uppdateringar och ändringar spåras och sprids med hjälp av metadata, vilket möjliggör iterativ, ”evolutionär” datahantering.
- Har ett steg-för-steg-användargränssnitt som kan anpassas till specifika affärsroller (t.ex. analytiker, drift, etc.).
Semarch xDM pris: Tillgänglig på begäran
Tibco MDM
Tibco är en ständig placerare i topprankningar av MDM-verktyg. Viktiga funktioner är bland annat:
- Flexibilitet och skalbarhet för tillämpningar med flera områden.
- Oberoende, distribuerat masterdatalager.
- Anpassningsbart visuellt gränssnitt utan kod som kan byggas för att passa olika affärsroller.
- Högklassigt stöd för versionering av data.
- Stöd för SOAP-webbtjänster.
Tibco MDM pris: Tillgänglig på begäran
Ataccama ONE
Ataccama erbjuder ONE, ett högautomatiserat datahanteringsverktyg som kan köras på plats, i molnet eller i en hybriduppsättning. Viktiga funktioner är bland annat:
- Maskininlärningsbaserad datakurering, rensning och klassificering.
- Automatiserad upptäckt av metadata.
- Automatiserad projektkonfiguration.
- Domänoberoende, men levereras förkonfigurerad med förbyggda regler för MDM för typiska domäner som kund, kontakt och produkt.
- Kopplingar för ett stort antal datatyper och datakällor.
- GDPR ready.
- Full datarevisionshistorik med detaljerad logg över tillämpade affärsregler och omvandlingar.
Ataccama ONE-pris: Tillgänglig på begäran
Stibo STEP
Stibo har den utmärkelsen att troligen vara det äldsta företaget på listan, eftersom det grundades på 1700-talet som ett tryckeri. Företagets datahanteringsgren är ett yngre tillskott, och STEP, dess huvudsakliga datahanteringsverktyg, har följande huvudfunktioner:
- STEP Workbench UI.
- Holistisk MDM-plattform för flera områden.
- Hög grad av automatisering.
- Automatiserad data- och språköversättning för multinationell verksamhet.
- Automatiserad granskning och godkännande av digitala tillgångar.
- Hantering av masterdata på avancerad nivå.
Stibo STEP-pris: Tillgänglig på begäran
Bästa verktyg för hantering av referensdata
Collibras referensdatalösning har följande nyckelfunktioner:
- Automatiserar arbetsflöden för att skapa nya koder och koduppsättningar.
- Lämnar koder och koduppsättningar till användare på ett användarvänligt sätt.
- Gör noggrann datamappning för att eliminera hinder för dataåtkomst.
- Genomför data från olika delar av organisationen.
Collibra pris: Tillgänglig på begäran
Magnitude
Magnitude Reference Data Management har följande nyckelfunktioner:
- Modellering inom flera områden – stöder affärsstrukturer från kodlistor till hierarkier med flera sökvägar och självreferenser.
- Automation – ger automatisering, styrning och kontroll över referensdataobjekt och laddningsprocesser.
- Mappning – ger global till lokal, extern till intern och specifik till generell mappning utan att befintliga element störs.
- Governance – ger ett anpassningsbart arbetsflöde för att styra affärsprocesser relaterade till referensdata, med modellbaserade säkerhetskontroller som gör det möjligt för användare att visa, lägga till eller uppdatera.
- Tidsvarians – gör det möjligt för användare att ändra modeller, ämnen, attribut och associationer och hämta alla tidigare versioner av objektet.
Magnitude Reference Data Management pris: För att kunna hantera datahantering i en större skala, måste man ha en ny plattform som är helt molnbaserad – förbättrad prestanda och skalbarhet.
Informatica MDM Reference 360
Informaticas MDM Reference 360 har följande nyckelfunktioner:
- Helt molnbaserad – förbättrad prestanda och skalbarhet.
- End-to-end-plattform – inbäddad dataintegration, datakvalitet, processhantering.
- Självbetjäning – Master Data Management och arbetsflöden byggda för affärsanvändare utan teknisk bakgrund.
- Match and merge – sammanfogar och korsrefererar data från nya typer och källor.
Informatica MDM Reference 360 pris: Reltio Cloud
Reltio tillverkar Reltio Cloud, ett grafbaserat verktyg för hantering av masterdata som innehåller verktyg för hantering av referensdata. Reltio är byggt på grafdatabaser för att ge maximal flexibilitet, både när det gäller att skala datalagren och att definiera tydliga relationer mellan data i ditt arkiv. Andra viktiga funktioner:
- Enklare integration med befintliga MDM-verktyg och/eller andra datakällor.
- Användarvänligt gränssnitt.
- Molnplattform som alltid är tillgänglig gör uppgraderingar utan nedtid möjliga.
Reltio Cloud pris: Pris: Finns på begäran
Bästa analys- och visualiseringsverktyg
Tableau är en BI-plattform som finns både i molnet och som nedladdningsbar programvara, med följande nyckelfunktioner:
- Lätt att koppla upp sig mot datakällor.
- Gör det möjligt för team, samarbetspartners och kunder att enkelt få tillgång till visualiseringar.
- Möjliggör obegränsad datautforskning med interaktiva instrumentpaneler.
- Skapar ”dashboard starters”, uppföljningsbara instrumentpaneler som konfigureras på några minuter med data från populära webbapplikationer.
- Skapar interaktiva kartor automatiskt.
Tableau-pris: 35-70 dollar per användare och månad.
Chartio
Chartio är en molnbaserad BI- och visualiseringsplattform med följande nyckelfunktioner:
- Interaktivt läge – dra och släpp data för att skapa, filtrera och dela instrumentpaneler.
- SQL-läge – kommunicera med databaser i SQL för att direkt utvinna insikter.
- Dataskiktning – lägg till på varandra följande omvandlingssteg till data för att omvandla frågeresultat.
- Visualiseringar och diagram – visualisera data direkt; Chartio rekommenderar det lämpligaste diagrammet.
- Datamixning och borrningar – kombinera olika datakällor i farten och få användbara insikter utan att utforska rådata.
Priset för Chartio: 249 dollar/månad för en laglicens.
Looker BI
Looker är en annan molnbaserad analys- och visualiseringsplattform med följande nyckelfunktioner:
- Definiera mätvärden en gång med LookML, Lookers enkla datamodelleringsspråk, och Looker skriver SQL-förfrågningar för att besvara alla frågor om dessa mätvärden.
- Gör data vackert med lättlästa instrumentpaneler som gör att användarna kan borra in och utforska.
- Ansluta direkt till databaser, utan extrakt eller programvara att ladda ner.
- Öppen tillgång till instrumentpaneler och rapporter för alla, inte bara analytiker eller datavetare.
Priset för Looker: 3 000 – 5 000 dollar per månad för 10 användare.
Metabase
Metabase erbjuder ett användarvänligt gränssnitt med öppen källkod för att koppla ihop och analysera dina data. Som ett verktyg för datavisualisering erbjuder det:
- Hundratals inbyggda datakopplingar.
- Enkla inställningar och åtkomst för hela teamet.
- En stor mängd olika datavisualiseringsalternativ att välja mellan.
- Vitmärkt inbäddning (premium inbäddningsnivå och uppåt).
- Auditering och hantering av datatillstånd (företagsnivå och högre).
Pris för databasen: Metabase är gratis och öppen källkod, så dess gratisnivå erbjuder en rad funktioner som passar de flesta användare. Företagsplaner kan variera från 3 000 till 10 000 dollar/år som utgångspris.
Microsoft Power BI
Power BI, Microsofts erbjudande inom affärsanalysområdet, är utformat för att vara användbart för både affärsanalytiker och datavetare. Huvudfunktioner:
- Enkla drag-and-drop-gränssnitt som är utformat för att vara bekant för användare av MS Excel.
- Power BI är en plattform utan kod och erbjuder både skrivbords- och webbklienter.
- Bibliotek med förbyggda anslutningar
- Prestationen tenderar att släpa efter på mycket stora datamängder – leta någon annanstans efter lösningar för stora datamängder
Priset för Microsoft Power BI: 9,99 dollar per användare och månad, eller gratis för grundversionen.
Mode Analytics
Mode Analytics erbjuder en webbaserad svit för dataanalys som är riktad till datavetare och analytiker och som har fokus på samarbete och delning. Några av Modes viktigaste funktioner:
- Designat för att göra det särskilt enkelt att ansluta dina datakällor till deras inbyggda SQL-redigerare och visualiseringsplattform.
- Mode kan leda resultaten av dina SQL-förfrågningar direkt till ett R- eller Pandas-dataframe i en Mode-nativ anteckningsbok.
- Dela data, analysen och den resulterande instrumentpanelen helt via Mode.
- Mode är ett bra val för ett team av datavetare som vill kunna samarbeta lättare.
Mode Analytics pris: tillgängligt på begäran.
Till automatiserad datahantering
Vi tog upp fem sätt att tänka på datahanteringsverktyg – referensdatahantering, masterdatahantering (MDM), ETL och analys av stora data – och några bra verktyg i varje kategori.
I takt med att datainfrastrukturen flyttas till molnet blir mer av datastapeln hanterad och fullt integrerad. Det finns ingen ersättning för att hantera affärsprocesser kring strukturerade data i stora organisationer. Men molnbaserade plattformar kan hjälpa till med en stor del av datahanteringsstrategin – från behandling och förberedelse av rådata, till dataintag, laddning, omvandling, optimering och visualisering – automatiskt i ett enda system.