Gestão de Dados é um conceito amplo e ambíguo. A Global Data Management Community (DAMA International) define-o como “o desenvolvimento de arquitecturas, políticas, práticas e procedimentos para gerir o ciclo de vida dos dados”. Mas quando as pessoas dizem “gerenciamento de dados”, o que elas realmente querem dizer? Sugerimos cinco possibilidades:
- Cloud data management – o processo de integração de dados do ecossistema de aplicações em nuvem de uma organização. A principal distinção do gerenciamento de dados em nuvem é que todo o armazenamento, a entrada e o processamento de dados ocorre em um meio de armazenamento baseado em nuvem.
- ETL e integração de dados – carregamento de dados de fontes de dados em um data warehouse, transformando-os, resumindo-os e agregando-os em um formato adequado para uma análise altamente profunda.
- Gerenciamento de dados mestre – um método para gerenciar dados organizacionais críticos: clientes, contas e partes mencionadas nas transações comerciais, de uma forma padronizada que evita redundância em toda a organização.
- Gerenciamento de dados de referência – define valores permitidos que podem ser usados por outros campos de dados, tais como códigos postais, listas de países, regiões e cidades, ou números de série de produtos. Os dados de referência podem ser fornecidos internamente ou externamente.
- Análise e visualização de dados – processa dados selecionados de grandes fontes de dados e armazéns de dados, executando análises avançadas de dados e permitindo que analistas e cientistas de dados fatiem, façam dados e apresentem visualizações e dashboards.
Com as quantidades massivas de dados de hoje em dia, ferramentas de alta qualidade são essenciais para alcançar as melhores práticas de gerenciamento de dados. As organizações usam ferramentas de gerenciamento de dados das cinco categorias acima, para gerenciar e automatizar o processo de gerenciamento de dados:
- Ferramentas de gerenciamento de dados na nuvem – construídas na nuvem, para a nuvem, essas ferramentas se conectam e integram várias fontes de dados através de API’s, webhooks ou conexões diretas de banco de dados.
- Ferramentas ETL – ajudam as organizações a carregar dados de múltiplas fontes, definir transformações complexas e automatizadas dos dados, testar o pipeline de dados e carregar dados continuamente para um banco de dados ou data warehouse de destino.
- Ferramentas de transformação de dados – ajudam na transformação de dados brutos em dados limpos, agregados e analisáveis à medida que eles se movem de fontes de dados individuais para um warehouse analítico – ou dentro do warehouse analítico, no ponto de análise.
- Ferramentas de gerenciamento de dados mestre (MDM) – ajudam a visualizar conjuntos complexos de dados mestre em toda a organização, e facilitam a administração de dados por especialistas no assunto, que supervisionam a criação e manutenção de dados de referência.
- Ferramentas de Gerenciamento de Dados de Referência (RDM) – frequentemente fornecidas como parte de conjuntos MDM, definem processos de negócios em torno dos dados de referência e ajudam as partes interessadas a preencher os dados de referência e gerenciá-los ao longo do tempo.
- Ferramentas de visualização e análise de dados – ajudam as organizações a explorar, analisar e visualizar grandes conjuntos de dados, e gerar relatórios e dashboards para extrair insights e orientar decisões de negócios.
Below nós cobrimos várias grandes ferramentas de cada uma dessas categorias, tanto para ajudá-lo a entender cada categoria e para se aproximar da seleção da melhor ferramenta de gerenciamento de dados para suas necessidades.
As soluções de armazenamento e largura de banda se tornaram mais baratas, cada vez mais soluções fora do local para armazenamento e gerenciamento de dados se tornaram disponíveis. As empresas com grandes quantidades de dados para armazenar, peneirar e analisar agora rotineiramente armazenam e gerenciam seus dados inteiramente na nuvem. Esse fluxo de trabalho tem sido possível graças à proliferação de ferramentas de gerenciamento de dados na nuvem nos últimos 5-10 anos. Embora o campo tenha sido liderado principalmente por gigantes como Amazon e Google até agora, muitas empresas menores agora oferecem ferramentas para clientes com necessidades de dados de todos os tamanhos. Veja abaixo uma lista de opções potenciais para o gerenciamento de dados na nuvem.
- Panoply
- Amazon Web Services
- Microsoft Azure
- Google Cloud
- Melhor ETL e Ferramentas de Integração de Dados
- Informatica Powercenter
- Dados de pontos
- Fivetran
- Microsoft SQL Server SSIS
- Azure Data Factory
- Talend
- Alooma
- Melhores ferramentas de transformação de dados
- DBT
- Airflow
- Luigi
- Best Master Data Management tools
- Profisee
- SAP NetWeaver
- Semarchy xDM
- Tibco MDM
- Ataccama ONE
- Stibo STEP
- Melhores ferramentas de gerenciamento de dados de referência
- Magnitude
- Informatica MDM Reference 360
- Reltio Cloud
- Melhores ferramentas de análise e visualização
- Chartio
- Looker BI
- Metabase
- Microsoft Power BI
- Mode Analytics
- Towards gestão automatizada de dados
Panoply
Panoply oferece um armazém de dados automatizado nativo da nuvem que facilita a integração e o gerenciamento de todos os dados da sua organização. Principais características:
- Uma grande selecção de conectores de dados nativos permite uma fácil integração e gestão de todos os dados da sua organização, ingestão de dados com um clique
- Automatização da ingestão de dados e pré-processamento liberta recursos de TI
- Dashboard de gestão intuitiva retira o trabalho de adivinhação da gestão de dados e orçamentação
- Automatização da escala e manutenção de bases de dados de múltiplos nós para baixomanutenção de data warehousing
- Editor SQL no navegador para análise e consulta de dados
- Conexões com suítes comuns de visualização e análise de dados, como Tableau, Looker, Chartio
Panoply price: $325/mês
Amazon Web Services
Amazon Web Services oferece um conjunto de ferramentas em constante expansão que podem ser colocadas em uma pilha eficaz de gerenciamento de dados na nuvem. Os principais serviços incluem:
- Amazon S3 para armazenamento temporário e/ou intermediário
- Amazon Glaciar para backup e armazenamento de longo prazo
- AWS Cola para construção de catálogos de dados para categorizar, pesquisa e consulta seus dados
- Amazon Athena para análise de dados baseada em SQL
- Amazon Redshift para armazenamento de dados
- Amazon Quicksight para construção de painel e visualização de dados
- Cada serviço é fiado e faturado separadamente, assim os custos dependem do grau de utilização
AWS Price: variável, dependente da implementação
Microsoft Azure
A plataforma Azure da Microsoft fornece uma série de maneiras diferentes de configurar um sistema de gerenciamento de dados baseado em nuvem, bem como ferramentas analíticas que podem ser usadas em seus dados armazenados no Azure. Tal como AWS, o Azure permite vários estilos de bases de dados/armazém de dados com um excelente conjunto de ferramentas para a sua gestão. Os principais serviços incluem:
- Bancos de dados SQL padrão e servidores SQL baseados em VM
- Armazenamento de blocos
- Opções de armazenamento de tabelas estilo NoSQL
- Desdobramentos de nuvem privada
- Azure Data Explorer (ADX) – um serviço recentemente adicionado que permite a análise em tempo real de dados de streaming muito grandes sem a necessidade de pré-processamento
- Fácil integração com a Panoply para serviços ELT/ETL
Preço de azure: variável, dependendo da implementação
Google Cloud
Tal como a Amazon, a plataforma Cloud do Google oferece um vasto conjunto de ferramentas para a gestão de dados baseados na nuvem, bem como um gestor de workflow que pode ser utilizado para unir os diferentes componentes. Os principais componentes do Google Cloud:
- BigQuery para armazenamento de dados tabulares
- Cloud BigTable para armazenamento no estilo banco de dados NoSQL
- Cloud Pub/Sub e Cloud Data Transfer para entrada de dados; Google Cloud também pode se conectar com uma variedade de outras fontes de dados
- Análise de BigQuery para consultas ao estilo SQL
- MecanismoML para análises mais avançadas usando aprendizado de máquina e IA
- Estúdio de dados para análise baseada em GUI e construção de painel de controle
- Cloud Datalab para ciência de dados baseada em código
- Conexões com ferramentas de BI comuns como Tableau, Looker, etc.
>
Preço do Google Cloud: variável, dependente da implementação
Melhor ETL e Ferramentas de Integração de Dados
Para a lista completa de ferramentas EL, consulte a nossa lista de ferramentas ETL de topo.
Informatica Powercenter
Informatica Powercenter é uma ferramenta ETL local com as seguintes características chave:
- Conectividade e integração sem falhas com todos os tipos de fontes de dados usando conectores out-of-the-box.
- Validação automatizada de dados – auditoria e validação automatizada sem script de dados movidos ou transformados.
- Transformações avançadas de dados – suporta dados não-relacionais, capazes de analisar dados XML, JSON, PDF, Microsoft Office e IoT.
- Gestão orientada por metadados – fornece vistas gráficas de fluxos de dados, impacto e linhagem.
Preço do PowerCenter Informatica: $2,000/mês para o plano mais básico
Dados de pontos
Dados de pontos é uma plataforma ETL baseada em nuvem com as seguintes características-chave:
- Pré-integrado com dezenas de fontes de dados dentro e fora da nuvem, move dados para o Amazon Redshift, S3, BigQuery, Panoply, PostgreSQL, e muito mais.
- Easy scheduling for data replication.
- Error handling and alerting with automated resolution when possible.
- EstruturaAPI e JSON, permitindo que você empurre os dados para um data warehouse programmaticamente.
- Serviço de nuvem gerenciado com escalonamento automático e SLAs de nível empresarial.
Preço dos pontos: $100 – $1,000/mês com base no tamanho dos dados
Fivetran
Fivetran é um pipeline de dados totalmente gerenciado com uma interface web que integra dados de serviços e bancos de dados SaaS em um único data warehouse. Características principais:
-
Provê integração direta e envia dados através de uma conexão direta segura usando uma sofisticada camada de cache.
-
Camada de cache ajuda a mover dados de um ponto para outro sem nunca armazenar uma cópia no servidor de aplicações.
-
Fivetran não impõe nenhum limite de dados.
-
Pode ser usado para centralizar os dados de uma empresa e integrar todas as fontes para determinar os Indicadores Chave de Desempenho (KPIs) em toda uma organização.
Preço Fivetran: Disponível mediante solicitação
3. Blendo
Blendo é outro serviço de ETL e integração de dados baseado em nuvem, com as seguintes características-chave:
- Self service – conecta-se a numerosas fontes de dados com alguns cliques, move os dados para Amazon Redshift, Panoply, PostgreSQL, MS SQL Server, e mais.
- Dados históricos – carrega e sincroniza dados históricos de serviços em nuvem.
- Carga programada – carrega dados periodicamente ou em frequências selecionadas de diferentes fontes de dados.
- Otimização de esquema de dados – coleta, detecção e preparação automatizada de dados usando esquema relacional ideal.
Blendo price: Disponível sob pedido
Microsoft SQL Server SSIS
Microsoft oferece SSIS, uma interface gráfica para gerenciar ETL usando o MS SQL Server. As principais características incluem:
- Interface fácil de usar permite aos utilizadores implementar soluções integradas de armazenamento de dados sem ter que se envolver com a escrita de muito – ou qualquer – código.
- Interface gráfica permite fácil arrastar e soltar ETL para múltiplos tipos de dados e destinos de armazenamento, incluindo DBs não-MS.
- Grande solução para uma equipe com uma mistura de níveis de habilidade técnica, já que é igualmente eficaz para ninjas ETL e tipos de ponto-e-clique.
PreçoSSIS: $931 – $15,000
Azure Data Factory
Além do SQL Server SSIS, a solução ETL da Microsoft no local, a empresa também oferece o Azure Data Factory (ADF), uma ferramenta ETL para sua plataforma Azure baseada em nuvem. Principais características do ADF:
- ETL pipelines no ADF são construídos em uma interface gráfica, permitindo o uso de código baixo.
- Variedade de conectores de dados para fácil ingestão de dados – exceto, estranhamente, o suporte para carregamento de arquivos Microsoft Excel.
- Suporte completo para carregamento de dados em armazéns de dados Azure
Azure Data Factory preço: $1 para 1.000 execuções por mês
Talend
Talend software de integração de dados de código aberto fornece software para integrar, limpar, máscara e dados de perfil. As principais características das ofertas Talend incluem:
- GUI que permite gerenciar um grande número de sistemas de código fonte usando conectores padrão.
- Funcionalidade MDM (Master Data Management)
- Visão única, consistente e precisa dos principais dados empresariais.
Preço do Talend: $1.170/utilizador mensal ou $12.000 anualmente
Alooma
Alooma oferece uma plataforma de integração de dados em escala empresarial com grandes ferramentas ETL incorporadas. Algumas características chave das ofertas Alooma:
- Foco forte na construção rápida de gasodutos, monitorização da qualidade dos dados e tratamento de erros.
- Protecção contra perda ou corrupção de dados num processo ETL potencialmente sujeito a erros.
- Flexibilidade para intervir e escrever os seus próprios scripts para monitorizar, limpar e mover os seus dados conforme necessário.
- Desenhado para operações em escala empresarial.
Preço do alooma: $1.000 – $15.000/mês
Melhores ferramentas de transformação de dados
Dataform é uma plataforma de transformação de dados baseada em SQL, totalmente gerenciada para gerenciar processos em seu armazém de dados em nuvem. Principais recursos:
- Escreva fluxos de trabalho SQL como uma equipe em um IDE colaborativo. Construído em controle de versão e integração com Github.
- Escreva testes de qualidade de dados e defina alertas se eles não garantirem que seus dados sejam sempre confiáveis.
- Crie um repositório centralizado para definições de dados em toda a sua empresa, documente seus dados e descubra conjuntos de dados em um catálogo de dados.
- Executar horários para garantir que seus dados estejam sempre atualizados.
Preço do Dataform:: A partir de $550/mês (descontos de inicialização disponíveis)
DBT
DBT (Data Build Tool) é uma ferramenta de transformação de dados baseada em SQL que permite que você configure fluxos de transformação modulares a partir da linha de comando. Construída com o objetivo de simplificar a análise de dados e fluxos de trabalho de engenharia, as principais características do DBT incluem:
- Ferramenta baseada emSQL
- Fluxos de trabalho fáceis para construir fluxos de transformação modular e modelagem de dados
- Gestão automatizada da qualidade dos dados com um sistema de teste robusto
- Aplicação simplificada do código analítico usando ambientes, gestão de pacotes e integração contínua
- Fácil documentação de dados com DAGs gerados automaticamente e fácil anotação e catalogação de dados
- Informação de dados para melhor análise de dados históricos
Preço DBT: $0 para nível gratuito, $100/mês para básico, com cotações disponíveis para implementações empresariais maiores
Airflow
Originalmente desenvolvido na Airbnb, Airflow é uma nova ferramenta popular de infra-estrutura de dados de código aberto. Embora ele não faça nenhum processamento de dados em si, o Airflow pode ajudá-lo a programar, organizar e monitorar processos ETL usando python. Principais características:
- Gráficos Acíclicos Dirigidos (DAGs) permitem ao seu agendador distribuir as suas tarefas por um conjunto de trabalhadores sem exigir que você defina relações pai-filho precisas entre fluxos de dados
- UI baseada na web para gerenciar e editar seus DAGs
- Conjunto de ferramentas que facilita a realização de “cirurgia DAG” a partir da linha de comando.
- Altamente extensível e escalável
Preço do fluxo aéreo: código livre e código aberto
Luigi
Luigi é um pacote Python de código aberto desenvolvido pela Spotify. Ele foi desenvolvido para facilitar o gerenciamento de processos em lote de longa duração, para que ele possa lidar com tarefas que vão muito além do escopo do ETL – mas ele faz ETL muito bem, também. Características principais:
- Base de código Python facilita a construção de pipelines de dados eficientes, especialmente aqueles que lidam com processos em lote de longa duração
- Resolução fácil de dependência
- Interface web que permite ao usuário visualizar tarefas para gerenciamento de workflow
- Conceptualmente similar ao GNU Make, mas não é só para Hadoop
- As operações do sistema de ficheiros atómicos garantem que os seus pipelines nunca irão falhar com dados parciais
Preço Luigi: Código livre e aberto
Best Master Data Management tools
Dell Boomi’s Master Data Hub tem as seguintes características chave:
- Define modelos através de código baixo, experiência visual.
- Deplora modelos de dados e identifica quais sistemas-fonte interagem com eles.
- Registros de sistema de placas em um repositório consolidado, funde automaticamente registros similares.
- Permite o envio de dados – alerta as equipes para resolver duplicatas e problemas de entrada de dados.
- Governa dados com fluxos de processos bidirecionais em tempo real entre silos.
Dell Boomi Master Data Hub preço: $100.000 – $300.000
Profisee
Profisee’s Master Data Management tem as seguintes características-chave:
- Stewardship and governance – permite que os “administradores de dados” dentro da organização gerenciem os dados mestres com o feedback das análises.
- Gestão de registros deolden – padroniza, limpa e combina os dados originais sem codificação.
- Gerenciamento de eventos – detecta alterações de dados, distribui eventos para sistemas assinantes.
- Integrador – federa dados mestres para empresas globais, com integração bidirecional em tempo real.
- Fluxo de trabalho empresarial – reforça os processos de negócios entre organizações, permite aos administradores gerenciar o desempenho do data steward.
- SDK – permite a integração de aplicativos personalizados.
Preço do prêmio: $10.30/hora
SAP NetWeaver
SAP NetWeaver MDM, um componente da plataforma de desenvolvimento NetWeaver, tem as seguintes características chave:
- Retira automaticamente dados mestres de todas as principais aplicações SAP.
- Carrega dados mestres de outras fontes.
- Integra dados usando conteúdo empresarial como estruturas de repositório, regras de validação, mapeamentos de entrada e saída.
- Distribui dados mestre a alvos.
- Permite integração de dados programáticos via APIs e serviços web.
Preçário NetWeaver do SAP: Disponível mediante solicitação
Semarchy xDM
Semarchy é um recém-chegado relativo ao cenário MDM, tendo sido lançado em 2011. Baseado fora da França, foi fundado por uma equipe de ex-funcionários da Sunopsis. xDM, seu principal produto MDM, tem as seguintes características:
- Não-Hadoop dependente.
- Optimizado para Oracle.
- Atualizações e alterações são rastreadas e propagadas usando metadados, permitindo uma gestão de dados iterativa e “evolutiva”.
- Faatures uma interface de usuário passo a passo que pode ser personalizada para funções específicas de negócios (ou seja, analistas, operações, etc.).
Preço xDM de semarch: Disponível sob pedido
Tibco MDM
Tibco é um placer perene no ranking das ferramentas MDM de topo. As principais características incluem:
- Flexibilidade e escalabilidade para aplicações multi-domínio.
- Dispositivo de dados mestre independente e distribuído.
- Interface visual personalizável sem código que pode ser construída para se adequar a várias funções empresariais.
- Suporte de versão de dados de alta classificação.
- Suporte de serviços Web SOAP.
Tibco preço MDM: Disponível sob pedido
Ataccama ONE
Ataccama oferece ONE, uma ferramenta de gestão de dados altamente automatizada que pode ser executada no local, na nuvem, ou em uma configuração híbrida. As principais características incluem:
- Curador de dados, limpeza e classificação baseados na aprendizagem da máquina.
- Descoberta automatizada de metadados.
- Configuração automatizada de projeto.
- Agnóstico de domínio, mas vem pré-configurado com regras pré-construídas para MDM para domínios típicos, como cliente, contato e produto.
- Conectores para uma vasta gama de tipos de dados e fontes.
- Pronto para GDPR.
- Histórico completo de auditoria de dados com registro detalhado das regras de negócios aplicadas e transformações.
Ataccama UM preço: Disponível sob pedido
Stibo STEP
Stibo tem a distinção de ser provavelmente a empresa mais antiga da lista, tendo sido fundada no século XVIII como uma empresa gráfica. O braço de gestão de dados da empresa é uma adição mais jovem, e STEP, sua principal ferramenta de gestão de dados, tem as seguintes características-chave:
- STEP Workbench UI.
- Plataforma MDM multidomínio holística.
- Alto nível de automação.
- Dados automatizados e tradução de idiomas para operações multinacionais.
- Revisão e aprovação automatizada de ativos digitais.
- Gestão de dados mestre a nível de empresa.
Preço STEP do Stibo: Disponível sob pedido
Melhores ferramentas de gerenciamento de dados de referência
Solução de dados de referência da Collibra tem as seguintes características-chave:
- Automa os fluxos de trabalho para criar novos códigos e conjuntos de códigos.
- Distribui códigos e conjuntos de códigos aos usuários de forma amigável.
- Executa um mapeamento de dados preciso para eliminar barreiras ao acesso aos dados.
- Comparece dados de diferentes partes da organização.
Preço da colíbria: Disponível sob pedido
Magnitude
A Gestão de Dados de Referência da Magnitude tem as seguintes características-chave:
- Modelagem de múltiplos domínios – suporta estruturas de negócio desde listas de códigos até hierarquias multi-percurso, auto-referenciadas.
- Automação – fornece automação, governança e controle sobre objetos de dados de referência e processos de carga.
- Mapping – fornece mapeamento global para local, externo para interno e específico para mapeamento geral, sem interrupção dos elementos existentes.
- Governança – fornece um fluxo de trabalho personalizável para controlar os processos de negócios relacionados aos dados de referência, com controles de segurança baseados em modelos, permitindo aos usuários visualizar, adicionar ou atualizar.
- Desvio de tempo – permite aos usuários alterar modelos, assuntos, atributos e associações e recuperar qualquer versão anterior do objeto.
Preço de Gerenciamento de Dados de Referência de Magnitude: Disponível sob pedido
Informatica MDM Reference 360
Informatica MDM Reference 360 tem as seguintes características chave:
- Fully cloud-based – melhor desempenho e escalabilidade.
- Plataforma de ponta a ponta – integração de dados embutidos, qualidade de dados, gestão de processos.
- Self service – gerenciamento de dados mestre e fluxos de trabalho construídos para usuários de negócios sem experiência técnica.
- Match and merge – funde e cruza dados de novos tipos e fontes.
Informatica MDM Reference 360 price: Disponível sob pedido
Reltio Cloud
Reltio torna o Reltio Cloud, uma ferramenta de gestão de dados mestre baseada em gráficos que inclui ferramentas de gestão de dados de referência. O Reltio é construído sobre bases de dados gráficas para dar-lhe a máxima flexibilidade, tanto em escalas de armazenamento de dados como na definição de relações claras entre os dados no seu repositório. Outras características chave:
- Fácil integração com ferramentas MDM existentes e/ou outras fontes de dados.
- Interface amigável para o usuário.
- Plataforma em nuvem sempre disponível torna possível atualizações com tempo zero de inatividade.
Preço da Nuvem de Relação: Disponível mediante solicitação
Melhores ferramentas de análise e visualização
Tableau é uma plataforma de BI disponível tanto na nuvem como como software para download, com as seguintes características-chave:
- Conecta-se facilmente às fontes de dados.
- Permite fácil acesso a visualizações para equipes, parceiros e clientes.
- Permite a exploração ilimitada de dados com dashboards interactivos.
- Cria “dashboards de arranque”, configuração de dashboards accionáveis em minutos com dados de aplicações web populares.
- Cria automaticamente mapas interactivos.
Preço do tabuleiro: $35-$70 por utilizador por mês.
Chartio
Chartio é uma plataforma de visualização e BI baseada em nuvem com as seguintes características-chave:
- Modo interativo – arraste e solte dados para criar, filtrar e compartilhar dashboards.
- ModoSQL – comunique-se com bancos de dados em SQL para extrair diretamente insights.
- Dados em camadas – adicione sucessivos passos de transformação aos dados para transformar os resultados das consultas.
- Visualizações e gráficos – visualize os dados instantaneamente; Chartio recomenda o gráfico mais apropriado.
- Mistura de dados e drill downs – combine fontes de dados díspares e obtenha insights acionáveis sem explorar dados brutos.
Preço do Chartio: $249/mês para uma licença de equipe.
Looker BI
Looker é outra plataforma de análise e visualização baseada em nuvem, com os seguintes recursos-chave:
- Definir métricas uma vez usando LookML, a linguagem de modelagem de dados simples de Looker, e Looker escreve consultas SQL para responder qualquer pergunta sobre essas métricas.
- Fazer dados bonitos com painéis de fácil leitura que permitem aos usuários perfurar e explorar.
- Conectar directamente a bases de dados, sem extractos ou software para descarregar.
- Abrir acesso a dashboards e relatórios para todos, não apenas analistas ou cientistas de dados.
Preço do leitor: $3.000 – $5.000 por mês para 10 utilizadores.
Metabase
Metabase oferece um interface de código aberto e de fácil utilização para ligar e analisar os seus dados. Como uma ferramenta de visualização de dados, ele oferece:
- Centenas de conectores de dados nativos.
- Fácil configuração e acesso para toda a sua equipa.
- Grande gama de diferentes opções de visualização de dados para escolher entre.
- Integração de dados com etiqueta branca (nível de integração premium e superior).
- Auditoria e gestão de permissões de dados (tier empresarial e superior).
Preço de base deetabase: O Metabase é gratuito e de código aberto, por isso o seu nível gratuito oferece uma série de funcionalidades que serão adequadas para a maioria dos utilizadores. Os planos empresariais podem variar entre $3.000 – $10.000/ano preços iniciais.
Microsoft Power BI
Power BI, a oferta da Microsoft no espaço de análise de negócios, foi concebida para ser útil tanto para os analistas de negócios como para os cientistas de dados. Características principais:
- Interface simples de arrastar e soltar que foi projetada para ser familiar aos usuários do MS Excel.
- Power BI é uma plataforma sem código, e oferece tanto clientes desktop como clientes web.
- Biblioteca de conectores pré-construídos
- Desempenho tende a atrasar em conjuntos de dados muito grandes – veja em outro lugar para grandes soluções de dados
Preço do Microsoft Power BI: $9,99 por usuário por mês, ou grátis para a versão básica.
Mode Analytics
Mode Analytics oferece uma suíte de análise de dados baseada na web destinada a cientistas e analistas de dados, com foco na colaboração e compartilhamento. Algumas das principais características da Mode:
- Desenhado para facilitar especialmente a conexão de suas fontes de dados ao seu editor SQL e plataforma de visualização embutidos.
- Modo pode canalizar os resultados das suas consultas SQL diretamente para um quadro de dados R ou Pandas em um notebook Mode-nativo.
- Partilhar os dados, análise e dashboard resultante tudo através do Modo.
- Modo é uma boa escolha para uma equipe de cientistas de dados que querem ser capazes de colaborar mais facilmente.
Mode Analytics preço: disponível mediante solicitação.
Towards gestão automatizada de dados
Cobrimos cinco formas de pensar sobre ferramentas de gestão de dados – Gestão de Dados de Referência, Gestão de Dados Mestre (MDM), ETL e grandes análises de dados – e algumas grandes ferramentas em cada categoria.
Enquanto a infra-estrutura de dados se move para a nuvem, mais da pilha de dados se torna gerenciada e totalmente integrada. Não há substituição para o gerenciamento de processos de negócios em torno de dados estruturados em grandes organizações. Mas as plataformas baseadas na nuvem podem ajudar com grande parte da estratégia de gerenciamento de dados – desde o tratamento e preparação de dados brutos, até a ingestão, carregamento, transformação, otimização e visualização de dados – automaticamente em um único sistema.