28 tiedonhallintatyökalua & 5 tapaa ajatella tiedonhallintaa

Tiedonhallinta on laaja ja moniselitteinen käsite. Global Data Management Community (DAMA International) määrittelee sen seuraavasti: ”arkkitehtuurien, politiikkojen, käytäntöjen ja menettelyjen kehittäminen tiedon elinkaaren hallitsemiseksi”. Mutta kun ihmiset sanovat ”tiedonhallinta”, mitä he todella tarkoittavat? Ehdotamme viittä vaihtoehtoa:

  1. Pilvidatan hallinta – prosessi, jossa integroidaan organisaation pilvisovellusten ekosysteemistä peräisin oleva data. Pilvipohjaisen tiedonhallinnan tärkein ero on se, että kaikki tietojen varastointi, saanti ja käsittely tapahtuu pilvipohjaisessa tallennusvälineessä.
  2. ETL ja tietojen integrointi – tietojen lataaminen tietolähteistä tietovarastoon, niiden muuntaminen, tiivistäminen ja yhdistäminen muotoon, joka soveltuu syvälliseen analyysiin.
  3. Masterdatan hallinta – menetelmä, jolla hallitaan organisaation kriittisiä tietoja: asiakkaita, tilejä ja liiketoimintatapahtumissa nimettyjä osapuolia standardoidulla tavalla, joka estää redundanssin koko organisaatiossa.
  4. Viitetiedon hallinta – määrittelee sallitut arvot, joita muut tietokentät voivat käyttää, kuten postinumerot, luettelot maista, alueista ja kaupungeista tai tuotteiden sarjanumerot. Viitetiedot voivat olla itse tuotettuja tai ulkoisesti tarjottuja.
  5. Data-analytiikka ja visualisointi – valittujen tietojen käsittely suurista tietolähteistä ja tietovarastoista, edistyneen data-analytiikan suorittaminen sekä se, että analyytikot ja data-asiantuntijat voivat viipaloida, kuutioida ja esittää visualisointeja ja mittaritauluja.

Nykyaikaisen valtavan suuren tietomäärän vuoksi laadukkaat työkalut ovat välttämättömiä, kun halutaan saavuttaa datanhallinnan parhaat käytännöt. Organisaatiot käyttävät tiedonhallintatyökaluja kaikista edellä mainituista viidestä kategoriasta tiedonhallintaprosessin hallintaan ja automatisointiin:

  1. Pilvipohjaiset tiedonhallintatyökalut – pilvipalveluun pilvipalvelua varten rakennetut työkalut muodostavat yhteyden useisiin tietolähteisiin ja integroivat ne API:n, webhookien tai suorien tietokantayhteyksien kautta.
  2. ETL-työkalut – auttavat organisaatioita lataamaan dataa useista lähteistä, määrittelemään monimutkaisia, automatisoituja datan muunnoksia, testaamaan dataputkea ja lataamaan dataa jatkuvasti kohdetietokantaan tai tietovarastoon.
  3. Datanmuodostustyökalut – auttavat käsittelemättömän datan muuntamisessa puhtaaksi, aggregoiduksi ja analysoitavaksi dataksi sen siirtyessä yksittäisistä tietolähteistä analyyttiseen tietovarastoon – tai analyyttisen tietovaraston sisällä analyysipisteessä.
  4. Master Data Management (MDM) -työkalut – auttavat visualisoimaan monimutkaisia masterdatakokonaisuuksia koko organisaatiossa ja helpottavat tietojen hallintaa asiantuntijoiden toimesta, jotka valvovat viitetietojen luomista ja ylläpitoa.
  5. Reference Data Management (RDM) -työkalut – tarjotaan usein osana MDM-paketteja, määrittelevät liiketoimintaprosesseja viitetietojen ympärille ja auttavat sidosryhmiä lisäämään viitetietoja ja hallitsemaan niitä ajan mittaan.
  6. Tietojen visualisointi- ja data-analytiikkatyökalut – auttavat organisaatioita tutkimaan, analysoimaan ja visualisoimaan suuria tietokokonaisuuksia sekä tuottamaan raportteja ja mittaritauluja, joiden avulla voidaan poimia oivalluksia ja ohjata liiketoimintapäätöksiä.

Alhaalla käsittelemme useita loistavia työkaluja kustakin näistä kategorioista sekä auttaaksemme sinua ymmärtämään kutakin kategoriaa että siirtyäksesi lähemmäs tarpeisiisi soveltuvan parhaimman datanhallintatyökalun valintaa.

Tallennustilan ja kaistanleveyden halventuessa on tullut saataville yhä useampia off-premise-ratkaisuja tietovarastointiin ja -hallintaan. Yritykset, joilla on suuria määriä tallennettavaa, seulottavaa ja analysoitavaa dataa, tallentavat ja hallinnoivat dataa nykyään rutiininomaisesti kokonaan pilvipalvelussa. Tämän työnkulun on mahdollistanut pilvipohjaisten tiedonhallintatyökalujen yleistyminen viimeisten 5-10 vuoden aikana. Vaikka alaa ovat toistaiseksi johtaneet pääasiassa Amazonin ja Googlen kaltaiset jättiläiset, monet pienemmät yritykset tarjoavat nyt työkaluja asiakkaille, joilla on kaikenkokoisia tietotarpeita. Alla on luettelo mahdollisista pilvipohjaisen tiedonhallinnan vaihtoehdoista.

Panoply

Panoply tarjoaa pilvipohjaista automatisoitua tietovarastoa, jonka avulla on helppo integroida ja hallita kaikkea organisaatiosi dataa. Tärkeimmät ominaisuudet:

  • Laaja valikoima natiiveja dataliittimiä mahdollistaa helpon, yhdellä napsautuksella tapahtuvan datan syöttämisen
  • Automaattinen datan syöttäminen ja esikäsittely vapauttaa IT-resursseja
  • Intuitiivinen hallinta-kojelauta poistaa arvailut datan hallinnasta ja budjetoinnista
  • Monisolmuisten tietokantojen automatisoitu skaalautuminen ja ylläpito matalien-ylläpitoon
  • Selaimessa oleva SQL-editori tietojen analysointiin ja kyselyihin
  • Yhteydet yleisiin tietojen visualisointi- ja analysointisovelluksiin, kuten Tableau, Looker, Chartio

Panoplyn hinta: 325 dollaria/kk

Amazon Web Services

Amazon Web Services tarjoaa jatkuvasti laajenevan joukon työkaluja, jotka voidaan koota tehokkaaksi pilvitiedonhallintapinoksi. Keskeisiä palveluita ovat mm:

  • Amazon S3 väliaikaiseen ja/tai välitallennukseen
  • Amazon Glacier pitkäaikaiseen varmuuskopiointiin ja tallentamiseen
  • AWS Glue datakatalogien rakentamiseen luokittelua varten, hakuun ja kyselyihin
  • Amazon Athena SQL-pohjaiseen data-analytiikkaan
  • Amazon Redshift tietovarastointiin
  • Amazon Quicksight kojelautojen rakentamiseen ja datan visualisointiin
  • Jokaista palvelua pyöritetään ja laskutetaan erikseen, joten kustannukset riippuvat käytön laajuudesta

AWS Hinta:

Microsoft Azure

Microsoftin Azure-alusta tarjoaa useita eri tapoja perustaa pilvipohjainen tiedonhallintajärjestelmä sekä analytiikkatyökaluja, joita voidaan käyttää Azureen tallennettuihin tietoihin. AWS:n tapaan Azure mahdollistaa useita tietokanta-/tietovarastotyylejä, ja niiden hallintaan on hyvät työkalut. Keskeisiä palveluita ovat mm:

  • Tyypilliset SQL-tietokannat ja VM-pohjaiset SQL-palvelimet
  • Blob-tallennus
  • NoSQL-tyyliset taulukkotallennusvaihtoehdot
  • Privaatit pilvi-käyttöönotot
  • Azure Data Explorer (ADX) – hiljattain lisätty palvelu, joka mahdollistaa hyvin suurten suoratoistodatan reaaliaikaisen analysoinnin ilman esikäsittelyä
  • helppo integrointi Panoplyn kanssa ELT/ETL-palveluita varten

Azure-hinta: Googlen Cloud

Googlen Cloud-alusta tarjoaa Amazonin tavoin laajan valikoiman työkaluja pilvipohjaiseen tiedonhallintaan sekä työnkulunhallintaohjelman, jonka avulla eri komponentit voidaan sitoa yhteen. Tärkeimmät Google Cloud -komponentit:

  • BigQuery taulukkomuotoisen datan tallentamiseen
  • Cloud BigTable NoSQL-tietokantatyyliseen tallentamiseen
  • Cloud Pub/Sub ja Cloud Data Transfer datan saantiin; Google Cloud voi myös muodostaa yhteyden erilaisiin muihin tietolähteisiin
  • BigQuery-analytiikka SQL-tyylisiin kyselyihin
  • ML Engine edistyneempiin analyyseihin, joissa käytetään koneoppimista ja tekoälyä
  • Data Studio graafiseen käyttöliittymään perustuvaan analyysiin ja kojelautojen rakentamiseen
  • Cloud Datalab koodiin perustuvaan tietotekniikan tutkimukseen
  • Kytkennät yleisimpiin BI-työkaluihin, kuten Tableauhun, Lookeriin jne.

Googlen pilvipalvelun hinta: vaihteleva, riippuu toteutuksesta

Parhaat ETL- ja dataintegraatiotyökalut

Kattavaan luetteloon EL-työkaluista pääset tutustumalla listaan parhaista ETL-työkaluista.

Informatica Powercenter

Informatica Powercenter on on-premise ETL-työkalu, jolla on seuraavat keskeiset ominaisuudet:

  • Saumaton liitettävyys ja integrointi kaikentyyppisiin tietolähteisiin valmiiden liittimien avulla.
  • Automaattinen tietojen validointi – siirrettyjen tai muunnettujen tietojen skriptivapaa automaattinen tarkastus ja validointi.
  • Edistyneet tietomuunnokset – tukee ei-relationaalista dataa, pystyy jäsentämään XML-, JSON-, PDF-, Microsoft Office- ja IoT-tiedot.
  • Metadata-ohjautuva hallinta – tarjoaa graafisia näkymiä tietovirroista, niiden vaikutuksesta ja linjauksesta.

Informatica PowerCenterin hinta: 2000 dollaria/kk peruspaketti

Stitch Data

Stitch Data on pilvipohjainen ETL-alusta, jolla on seuraavat pääominaisuudet:

  • Esi-integroitu kymmeniin tietolähteisiin pilvipalvelussa ja pilvipalvelun ulkopuolelta, siirtää dataa Amazon Redshiftiin, S3:iin, BigQueryyn, Panoplyyn, PostgreSQL:iin jne.
  • Helppo aikataulutus tietojen replikointia varten.
  • Virheiden käsittely ja hälytykset automaattisella ratkaisulla mahdollisuuksien mukaan.
  • API- ja JSON-kehys, jonka avulla voit työntää tietoja tietovarastoon ohjelmallisesti.
  • Hallittu pilvipalvelu, jossa on automaattinen skaalautuminen ja yritystason SLA:t.

Stitchin hinta: 100 – 1000 dollaria/kk datan koon mukaan

Fivetran

Fivetran on täysin hallittu dataputki, jossa on web-käyttöliittymä, joka integroi SaaS-palveluista ja tietokannoista tulevan datan yhteen tietovarastoon. Tärkeimmät ominaisuudet:

  • Tarjoaa suoran integroinnin ja lähettää tiedot suoran suojatun yhteyden kautta käyttäen kehittynyttä välimuistikerrosta.

  • Välimuistituskerros auttaa siirtämään tietoja pisteestä toiseen tallentamatta kopiota sovelluspalvelimelle.

  • Fivetran ei aseta mitään datarajoja.

  • Voidaan käyttää yrityksen tietojen keskittämiseen ja kaikkien lähteiden integroimiseen koko organisaation keskeisten suorituskykyindikaattoreiden (KPI) määrittämiseksi.

Fivetranin hinta: Saatavilla pyynnöstä

3. Blendo

Blendo on toinen pilvipohjainen ETL- ja dataintegraatiopalvelu, jonka keskeiset ominaisuudet ovat seuraavat:

  • Itsepalvelu – yhdistää lukuisiin tietolähteisiin muutamalla napsautuksella, siirtää dataa Amazon Redshiftiin, Panoplyyn, PostgreSQL:ään, MS SQL Serveriin jne.
  • Historiallinen data – lataa ja synkronoi historiatietoja pilvipalveluista.
  • Tahdistettu lataus – lataa dataa säännöllisesti tai valituin väliajoin eri tietolähteistä.
  • Datakaavion optimointi – automaattinen datan kerääminen, havaitseminen ja valmistelu optimaalista relaatiokaaviota käyttäen.

Blendon hinta: Saatavilla pyynnöstä

Microsoft SQL Server SSIS

Microsoft tarjoaa SSIS:n, graafisen käyttöliittymän ETL:n hallintaan MS SQL Serverillä. Tärkeimpiä ominaisuuksia ovat mm:

  • Helppokäyttöisen käyttöliittymän avulla käyttäjät voivat ottaa käyttöön integroituja tietovarastoratkaisuja ilman, että heidän tarvitsee ryhtyä kirjoittamaan paljon – tai lainkaan – koodia.
  • Graafinen käyttöliittymä mahdollistaa helpon vedä ja pudota ETL:n useille tietotyypeille ja tietovarastokohteille, mukaan lukien muut kuin MS DB:t.
  • Hyvä ratkaisu tiimille, jossa on erilaisia teknisiä taitotasoja, sillä se on yhtä tehokas niin ETL-ninjoille kuin osoita-ja-klikkaa -tyypeillekin.

SSIS-hinta: 931 dollaria – 15 000 dollaria

Azure Data Factory

Microsoftin on-premise-ETL-ratkaisun SQL Server SSIS:n lisäksi yhtiö tarjoaa myös Azure Data Factoryn (ADF), ETL-työkalun pilvipohjaiselle Azure-alustalleen. ADF:n tärkeimmät ominaisuudet:

  • ETL-putket ADF:ssä rakennetaan graafiseen käyttöliittymään, mikä mahdollistaa vähäkoodisen käytön.
  • Laaja valikoima dataliittimiä helppoon datan sisäänsyöttöön – lukuun ottamatta oudosti tukea Microsoft Excel-tiedostojen lataamiseen.
  • Täysi tuki tietojen lataamiseen Azure-tietovarastoihin

Azure Data Factoryn hinta: 1 dollari 1 000 ajosta kuukaudessa

Talend

Talendin avoimen lähdekoodin dataintegraatio-ohjelmistotuotteet tarjoavat ohjelmistoja, joilla voidaan integroida, puhdistaa, peittää ja profiloida tietoja. Talend-tarjonnan keskeisiä ominaisuuksia ovat mm:

  • GUI, joka mahdollistaa suuren määrän lähdejärjestelmien hallinnan standardiliittimien avulla.
  • Master Data Management (MDM) -toiminnallisuus
  • Yhtenäinen, johdonmukainen ja tarkka näkymä yrityksen tärkeimmistä tiedoista.

Talendin hinta: 1170 dollaria/käyttäjä kuukausittain tai 12 000 dollaria vuodessa

Alooma

Alooma tarjoaa yrityskohtaisen datanintegraatioalustan, jossa on sisäänrakennettuna loistavat ETLtyökalut. Joitakin Alooma-tarjonnan keskeisiä ominaisuuksia:

  • Painotetaan voimakkaasti nopeaa putken rakentamista, tiedon laadun seurantaa ja virheiden käsittelyä.
  • Suojaus tietojen katoamiselta tai turmeltumiselta potentiaalisesti virhealttiissa ETL-prosessissa.
  • Mahdollisuus puuttua ja kirjoittaa omia skriptejä, joilla voit valvoa, puhdistaa ja siirtää tietoja tarpeen mukaan.
  • Suunniteltu yritystason toimintoja varten.

Alooman hinta: 1 000 – 15 000 dollaria/kk

Parhaat datanmuodostustyökalut

Dataform on SQL-pohjainen, täysin hallinnoitu datanmuodostusalusta, jolla voit hallita prosesseja pilvipohjaisessa tietovarastossasi. Tärkeimmät ominaisuudet:

  • Kirjoita SQL-työnkulkuja tiiminä yhteisessä IDE:ssä. Sisäänrakennettu versionhallinta ja integrointi Githubiin.
  • Kirjoita tietojen laatutestejä ja aseta hälytyksiä, jos ne epäonnistuvat, varmistaaksesi, että tietosi ovat aina luotettavia.
  • Luo keskitetty tietovarasto tietomäärityksille koko yrityksessäsi, dokumentoi tietojasi ja löydä tietokokonaisuuksia datakatalogista.
  • Ajoita aikatauluja varmistaaksesi, että tietosi ovat aina ajan tasalla.

Dataformin hinta:: Alkaen 550 dollaria/kk (aloitusalennuksia saatavilla)

DBT

DBT (Data Build Tool) on SQL-pohjainen datanmuodostustyökalu, jonka avulla voit määrittää modulaarisia muunnosvirtoja komentoriviltä. DBT:n tärkeimpiä ominaisuuksia ovat data-analytiikan ja insinöörityön työnkulkujen virtaviivaistamista silmällä pitäen rakennetun DBT:n tärkeimmät ominaisuudet:

  • SQL-pohjainen työkalu
  • Helppoja työnkulkuja modulaaristen muunnos- ja tietomallinnusvirtojen rakentamiseen
  • Automaattinen datan laadunhallinta vankalla testausjärjestelmällä
  • Virtaviivaistettu analytiikkakoodin käyttöönotto ympäristöjen avulla, pakettien hallintaa ja jatkuvaa integrointia
  • Helppoa datan dokumentointia automaattisesti luoduilla DAG:illa ja helpolla datan merkinnöinnillä ja luetteloinnilla
  • Datan tilannekuvien ottamista historiallisen datan parempaan analyysiin

DBT hinta:

Airflow

Alun perin Airbnb:ssä kehitetty Airflow on suosittu uusi avoimen lähdekoodin datainfrastruktuurityökalu. Vaikka se ei tee itse mitään tietojenkäsittelyä, Airflow voi auttaa sinua aikatauluttamaan, organisoimaan ja valvomaan ETL-prosesseja pythonilla. Tärkeimmät ominaisuudet:

  • Suunnattujen asyklisten graafien (Directed Acyclic Graphs, DAG) avulla sen aikatauluttaja voi jakaa tehtävät useille työntekijöille ilman, että sinun tarvitsee määritellä tarkat vanhempi-lapsisuhteet tietovirtojen välille
  • Helppo web-pohjainen käyttöliittymä DAG:ien hallintaan ja muokkaamiseen
  • Kiva joukko työkaluja, joiden avulla on helppo tehdä ”DAG-operaatioita” komentoriviltä.
  • Hyvin laajennettavissa ja skaalautuva

Airflow-hinta: ilmainen ja avoin lähdekoodi

Luigi

Luigi on Spotifyn kehittämä avoimen lähdekoodin Python-paketti. Se on suunniteltu helpottamaan pitkäkestoisten eräprosessien hallintaa, joten se pystyy hoitamaan tehtäviä, jotka menevät kauas ETL:n ulkopuolelle – mutta se tekee myös ETL:ää melko hyvin. Tärkeimmät ominaisuudet:

  • Python-koodipohja helpottaa tehokkaiden dataputkistojen rakentamista, erityisesti sellaisten, jotka käsittelevät pitkäkestoisia eräprosesseja
  • Helppo riippuvuuksien ratkaiseminen
  • Web-käyttöliittymä, jonka avulla käyttäjä voi havainnollistaa tehtäviä työnkulun hallintaa varten
  • Konseptuaalisesti samanlainen kuin GNU Make, mutta ei ole vain Hadoopille
  • Atomiset tiedostojärjestelmäoperaatiot varmistavat, että putkistosi eivät koskaan kaadu osittaisen datan kanssa

Luigi hinta: Ilmainen ja avoin lähdekoodi

Parhaat Master Data Management -työkalut

Dell Boomi’s Master Data Hubissa on seuraavat keskeiset ominaisuudet:

  • Mallien määrittely matalan koodin, visuaalisen kokemuksen avulla.
  • Tietomallien käyttöönotto ja sen tunnistaminen, mitkä lähdejärjestelmät ovat vuorovaikutuksessa niiden kanssa.
  • Järjestelmien tietueiden sisällyttäminen konsolidoituun arkistoon, samankaltaisten tietueiden automaattinen yhdistäminen.
  • Mahdollistaa datan hallinnan (data stewarding) – hälyttää tiimejä ratkaisemaan päällekkäisyyksiä ja tietojen syöttöongelmia.
  • Hallitsee tietoja reaaliaikaisilla kaksisuuntaisilla prosessivirroilla siilojen yli.

Dell Boomi Master Data Hubin hinta: 100 000 – 300 000 dollaria

Profisee

Profisee’s Master Data Management sisältää seuraavat keskeiset ominaisuudet:

  • Stewardship and governance – mahdollistaa organisaation sisällä oleville ”datan stewardeille” masterdatan hallinnan analytiikan palautteen avulla.
  • Golden Record Management – standardoi, puhdistaa ja vastaa lähdetietoja ilman koodausta.
  • Tapahtumien hallinta – havaitsee tietomuutokset, jakaa tapahtumat tilaajajärjestelmiin.
  • Integraattori – liittää masterdataa globaaleihin yrityksiin reaaliaikaisella kaksisuuntaisella integraatiolla.
  • Yritystyönkulku – toimeenpanee liiketoimintaprosesseja organisaatiorajat ylittäen, ylläpitäjät hallitsevat datanhoitajien suorituskykyä.
  • SDK – mahdollistaa räätälöityjen sovellusten integroinnin.

Profisee-hinta: 10 dollaria.30 / tunti

SAP NetWeaver

SAP NetWeaver MDM, joka on osa NetWeaver-kehitysalustaa, sisältää seuraavat pääominaisuudet:

  • Oraa master-tiedot automaattisesti kaikista tärkeimmistä SAP-sovelluksista.
  • Lataa master-tiedot muista lähteistä.
  • Integroi tiedot käyttämällä liiketoimintasisältöä, kuten arkistorakenteita, validointisääntöjä, saapuvia ja lähteviä yhdistelmiä.
  • Jakaa master-dataa kohteisiin.
  • Mahdollistaa ohjelmallisen dataintegraation API:iden ja web-palveluiden kautta.

SAP NetWeaver -hinnoittelu: Saatavilla pyynnöstä

Semarchy xDM

Semarchy on suhteellisen uusi tulokas MDM-alalla, sillä se lanseerattiin vuonna 2011. Se sijaitsee Ranskassa, ja sen perustivat entiset Sunopsiksen työntekijät. xDM, heidän tärkein MDM-tuotteensa, sisältää seuraavat ominaisuudet:

  • Ei ole Hadoop-riippuvainen.
  • Optimoitu Oraclea varten.
  • Päivityksiä ja muutoksia seurataan ja levitetään metatietojen avulla, mikä mahdollistaa iteratiivisen, ”evolutiivisen” tiedonhallinnan.
  • Ominaisuutena on vaiheittainen käyttöliittymä, joka voidaan räätälöidä tietyille liiketoimintarooleille (esim. analyytikot, operaatiot jne.).

Semarch xDM hinta: Saatavilla pyynnöstä

Tibco MDM

Tibco on monivuotinen sijoitus MDM-työkalujen top-rankingissa. Tärkeimpiä ominaisuuksia ovat mm:

  • Joustavuus ja skaalautuvuus monialueisiin sovelluksiin.
  • Riippumaton, hajautettu master data layer.
  • Räätälöitävissä oleva kooditon visuaalinen käyttöliittymä, joka voidaan rakentaa erilaisiin liiketoimintarooleihin sopivaksi.
  • Korkealuokkainen tiedon versiointituki.
  • SOAP-verkkopalvelutuki.

Tibco MDM hinta: Saatavilla pyynnöstä

Ataccama ONE

Ataccama tarjoaa ONE:n, pitkälle automatisoidun tiedonhallintatyökalun, jota voidaan käyttää paikan päällä, pilvessä tai hybridiasetuksena. Keskeisiä ominaisuuksia ovat mm:

  • Koneoppimiseen perustuva datan kuratointi, puhdistus ja luokittelu.
  • Automaattinen metatietojen löytäminen.
  • Automaattinen projektin konfigurointi.
  • Toimialueista riippumaton, mutta mukana toimitetaan valmiiksi konfiguroituina valmiita sääntöjä MDM:ää varten tyypillisille toimialueille, kuten asiakas, yhteyshenkilö ja tuote.
  • Liittimet monenlaisia tietotyyppejä ja -lähteitä varten.
  • GDPR-valmis.
  • Täydellinen tietojen tarkastushistoria, jossa on yksityiskohtainen loki sovelletuista liiketoimintasäännöistä ja muunnoksista.

Ataccama ONE hinta: Saatavilla pyynnöstä

Stibo STEP

Stibolla on se kunnia, että se on luultavasti listan vanhin yritys, sillä se on perustettu 1700-luvulla painotaloksi. Yrityksen tiedonhallintahaara on nuorempi lisäys, ja STEP, sen tärkein tiedonhallintatyökalutarjonta, sisältää seuraavat keskeiset ominaisuudet:

  • STEP Workbench UI.
  • Holistinen monialueen MDM-alusta.
  • Korkea automaatiotaso.
  • Automaattinen tietojen ja kielten kääntäminen monikansallisia toimintoja varten.
  • Digitaalisten resurssien automaattinen tarkastelu ja hyväksyntä.
  • Yritystason masterdatan hallinta.

Stibo STEP hinta: Saatavilla pyynnöstä

Parhaat viitetietojen hallintatyökalut

Collibran viitetietoratkaisussa on seuraavat keskeiset ominaisuudet:

  • Automaattiset työnkulut uusien koodien ja koodisarjojen luomiseen.
  • Toimittaa koodit ja koodisarjat käyttäjille käyttäjäystävällisellä tavalla.
  • Toteuttaa tarkat tietojen kartoitukset tietojen saatavuuden esteiden poistamiseksi.
  • Vertailee tietoja organisaation eri osista.

Collibran hinta: Saatavilla pyynnöstä

Magnitude

Magnituden viitetiedonhallinnassa on seuraavat keskeiset ominaisuudet:

  • Multi-domain-mallinnus – tukee liiketoimintarakenteita koodiluetteloista monipolkuisiin, itseviittaaviin hierarkioihin.
  • Automaatio – tarjoaa viitetieto-objektien ja latausprosessien automatisoinnin, hallinnan ja valvonnan.
  • Kartoitus – tarjoaa globaalin ja paikallisen, ulkoisen ja sisäisen sekä spesifisen ja yleisen kartoituksen ilman, että olemassa olevat elementit häiriintyvät.
  • Hallinta – tarjoaa räätälöitävissä olevan työnkulun viitetietoihin liittyvien liiketoimintaprosessien hallintaan ja mallipohjaiset suojausvalvonnat, joiden avulla käyttäjät voivat tarkastella, lisätä tai päivittää.
  • Aikavaihtelu – antaa käyttäjille mahdollisuuden muuttaa malleja, aiheita, attribuutteja ja assosiaatioita sekä hakea minkä tahansa aikaisemman version objekteista.

Viitetiedonhallintahinta: Saatavilla pyynnöstä

Informatica MDM Reference 360

Informatica MDM Reference 360:llä on seuraavat keskeiset ominaisuudet:

  • Täysin pilvipohjainen – parannettu suorituskyky ja skaalautuvuus.
  • Kokonaisvaltainen alusta – sulautettu tietojen integrointi, tietojen laatu, prosessien hallinta.
  • Itsepalvelu – Master Data Management ja työnkulut rakennettu liiketoimintakäyttäjille, joilla ei ole teknistä taustaa.
  • Match and merge – yhdistää ja ristiinvertailee tietoja uudentyyppisistä ja -lähteistä.

Informatica MDM Reference 360 hinta: Saatavana pyydettäessä

Reltio Cloud

Reltio valmistaa Reltio Cloudia, graafipohjaista masterdatan hallintatyökalua, joka sisältää viitetiedon hallintatyökalut. Reltio on rakennettu graafitietokantojen varaan, mikä antaa sille maksimaalisen joustavuuden sekä tietovarastojen skaalautumisessa että selkeiden suhteiden määrittelemisessä arkistossasi olevien tietojen välille. Muita keskeisiä ominaisuuksia:

  • Helppo integrointi olemassa oleviin MDM-työkaluihin ja/tai muihin tietolähteisiin.
  • Käyttäjäystävällinen käyttöliittymä.
  • Aina käytettävissä oleva pilvialusta mahdollistaa päivitykset ilman seisokkiaikaa.

Reltio Cloudin hinta: Saatavilla pyynnöstä

Parhaat analytiikka- ja visualisointityökalut

Tableau on BI-alusta, joka on saatavana sekä pilvipalveluna että ladattavana ohjelmistona, ja sillä on seuraavat keskeiset ominaisuudet:

  • Liittyy helposti tietolähteisiin.
  • Mahdollistaa visualisointien helpon käyttömahdollisuuden tiimeille, yhteistyökumppaneille ja asiakkaille.
  • Mahdollistaa rajoittamattoman tietojen tutkimisen interaktiivisilla kojelaudoilla.
  • Luo ”dashboard starters”, toimintakelpoisia kojelautoja, jotka asetetaan muutamassa minuutissa suosittujen verkkosovellusten tiedoista.
  • Luo interaktiivisia karttoja automaattisesti.

Tableaun hinta: 35-70 dollaria käyttäjältä kuukaudessa.

Chartio

Chartio on pilvipohjainen BI- ja visualisointialusta, jolla on seuraavat keskeiset ominaisuudet:

  • Interaktiivinen tila – vedä ja pudota dataa luodaksesi, suodattaaksesi ja jakaaksesi dashboardeja.
  • SQL-tila – kommunikoi tietokantojen kanssa SQL:llä poimiaksesi oivalluksia suoraan.
  • Datan kerroksistaminen – lisää peräkkäisiä muunnosvaiheita dataan muuttaaksesi kyselyn tuloksia.
  • Visualisoinnit ja kaaviot – visualisoi tiedot välittömästi; Chartio suosittelee sopivinta kaaviota.
  • Datan sekoittaminen ja porautuminen – yhdistele hajanaisia tietolähteitä lennossa ja hanki käyttökelpoisia oivalluksia tutkimatta raakadataa.

Chartion hinta: 249 dollaria/kk tiimilisenssi.

Looker BI

Looker on toinen pilvipohjainen analytiikka- ja visualisointialusta, jonka keskeiset ominaisuudet ovat seuraavat:

  • Määrittele mittarit kerran LookML:llä, Lookerin yksinkertaisella datan mallinnuskielellä, ja Looker kirjoittaa SQL-kyselyitä, joilla voit vastata mihin tahansa näihin mittareihin liittyvään kysymykseen.
  • Tee tiedosta kaunista helposti luettavilla dashboardeilla, jotka antavat käyttäjille mahdollisuuden porautua sisällepäin ja tehdä tutkimusta.
  • Kytke suoraan tietokantoihin, eikä sinun tarvitse ladata otteita tai ohjelmistoja.
  • Vapauta dashboardien ja raporttien käyttömahdollisuus kaikille, ei vain analyytikoille tai data-asiantuntijoille.

Lookerin hinta: 3 000 – 5 000 dollaria kuukaudessa 10 käyttäjälle.

Metabase

Metabase tarjoaa käyttäjäystävällisen avoimen lähdekoodin käyttöliittymän datasi yhdistämiseen ja analysointiin. Datan visualisointityökaluna se tarjoaa:

  • Satoja natiiveja dataliittimiä.
  • Helppo asennus ja käyttömahdollisuus koko tiimillesi.
  • Laaja valikoima erilaisia datan visualisointivaihtoehtoja valittavaksi.
  • Valkomerkityt upotukset (premium-luokan upotustaso ja siitä ylöspäin).
  • Auditointi ja tietojen käyttöoikeuksien hallinta (yritystaso ja siitä ylöspäin).

Tietokannan hinta: Metabase on ilmainen ja avoimen lähdekoodin järjestelmä, joten sen ilmainen taso tarjoaa valikoiman ominaisuuksia, jotka sopivat useimmille käyttäjille. Yrityspaketit voivat vaihdella 3 000 – 10 000 dollarin vuotuisista lähtöhinnoista.

Microsoft Power BI

Microsoft Power BI, Microsoftin tarjonta liiketoiminta-analytiikan alalla, on suunniteltu hyödylliseksi niin liiketoiminta-analyytikoille kuin datatutkijoillekin. Tärkeimmät ominaisuudet:

  • Yksinkertainen vedä ja pudota -käyttöliittymä, joka on suunniteltu tutuksi MS Excelin käyttäjille.
  • Power BI on kooditon alusta, ja se tarjoaa sekä työpöytä- että web-asiakkaita.
  • Kirjasto valmiiksi rakennettuja liittimiä
  • Suorituskyky on taipuvainen jäämään jälkeen hyvin suurissa tietokokonaisuuksissa – etsi muualta big data -ratkaisuja

Microsoft Power BI:n hinta: 9,99 dollaria käyttäjää kohti kuukaudessa tai ilmainen perusversio.

Mode Analytics

Mode Analytics tarjoaa web-pohjaisen data-analytiikkapaketin, joka on suunnattu data-analyytikoille ja -tiedemiehille, ja siinä on panostettu erityisesti yhteistoiminnallisuuteen. Joitakin Moden tärkeimpiä ominaisuuksia:

  • Suunniteltu niin, että tietolähteiden liittäminen niiden sisäänrakennettuun SQL-editoriin ja visualisointialustaan on erityisen helppoa.
  • Mode voi putkittaa SQL-kyselyidesi tulokset suoraan R- tai Pandas-tietokehykseen Mode-natiivissa muistikirjassa.
  • Jaa tiedot, analyysi ja tuloksena oleva kojelauta kaikki Moden kautta.
  • Mode on hyvä valinta datatieteilijöiden tiimille, joka haluaa tehdä yhteistyötä helpommin.

Mode Analyticsin hinta: saatavana pyynnöstä.

Automaattiseen tiedonhallintaan

Käsittelimme viittä tapaa ajatella tiedonhallintatyökaluja – Reference Data Management, Master Data Management (MDM), ETL ja big data -analytiikka – ja muutamia loistavia työkaluja kussakin kategoriassa.

Kun datainfrastruktuuri siirtyy pilveen, yhä useampi osa datapinosta muuttuu hallituksi ja täysin integroiduksi. Strukturoituun dataan liittyvien liiketoimintaprosessien hallintaa ei voi korvata suurissa organisaatioissa. Pilvipohjaiset alustat voivat kuitenkin auttaa suuressa osassa datanhallintastrategiaa – raakadatan käsittelystä ja valmistelusta datan tallentamiseen, lataamiseen, muuntamiseen, optimointiin ja visualisointiin – automaattisesti yhdessä järjestelmässä.