La gestión de datos es un concepto amplio y ambiguo. La Comunidad Global de Gestión de Datos (DAMA International) lo define como «el desarrollo de arquitecturas, políticas, prácticas y procedimientos para gestionar el ciclo de vida de los datos». Pero cuando la gente dice «gestión de datos», ¿a qué se refiere realmente? Sugerimos cinco posibilidades:
- Gestión de datos en la nube: el proceso de integrar los datos del ecosistema de aplicaciones en la nube de una organización. La principal distinción de la gestión de datos en la nube es que todo el almacenamiento, la ingesta y el procesamiento de los datos tiene lugar en un medio de almacenamiento basado en la nube.
- ETL e integración de datos – carga de datos de fuentes de datos en un almacén de datos, transformándolos, resumiéndolos y agregándolos en un formato adecuado para un análisis en profundidad.
- Gestión de datos maestros – método para gestionar los datos críticos de la organización: clientes, cuentas y partes nombradas en las transacciones comerciales, de una manera estandarizada que evita la redundancia en toda la organización.
- Gestión de datos de referencia – define los valores permitidos que pueden ser utilizados por otros campos de datos, tales como códigos postales, listas de países, regiones y ciudades, o números de serie de productos. Los datos de referencia pueden ser propios o externos.
- Análisis y visualización de datos – procesar datos seleccionados de fuentes de big data y almacenes de datos, realizar análisis de datos avanzados y permitir a los analistas y científicos de datos cortar, dividir y presentar visualizaciones y cuadros de mando.
Con las cantidades masivas de datos de hoy en día, las herramientas de alta calidad son esenciales para lograr las mejores prácticas de gestión de datos. Las organizaciones utilizan herramientas de gestión de datos de las cinco categorías anteriores, para gestionar y automatizar el proceso de gestión de datos:
- Herramientas de gestión de datos en la nube: construidas en la nube, para la nube, estas herramientas se conectan e integran múltiples fuentes de datos a través de API, webhooks o conexiones directas a bases de datos.
- Herramientas ETL: ayudan a las organizaciones a cargar datos de múltiples fuentes, definir transformaciones complejas y automatizadas de los datos, probar la canalización de datos y cargar los datos de forma continua en una base de datos o almacén de datos de destino.
- Herramientas de transformación de datos: ayudan a transformar los datos sin procesar en datos limpios, agregados y analizables a medida que pasan de las fuentes de datos individuales a un almacén de análisis, o dentro del almacén de análisis, en el punto de análisis.
- Herramientas de gestión de datos maestros (MDM): ayudan a visualizar conjuntos complejos de datos maestros en toda la organización y facilitan la administración de los datos por parte de expertos en la materia, que supervisan la creación y el mantenimiento de los datos de referencia.
- Herramientas de Gestión de Datos de Referencia (RDM) – a menudo proporcionadas como parte de las suites MDM, definen los procesos de negocio en torno a los datos de referencia, y ayudan a las partes interesadas a poblar los datos de referencia y a gestionarlos a lo largo del tiempo.
- Herramientas de visualización y análisis de datos: ayudan a las organizaciones a explorar, analizar y visualizar grandes conjuntos de datos, y a generar informes y cuadros de mando para extraer información y orientar las decisiones empresariales.
A continuación cubrimos varias herramientas excelentes de cada una de estas categorías, tanto para ayudarle a entender cada categoría como para acercarse a la selección de la mejor herramienta de gestión de datos para sus necesidades.
A medida que el almacenamiento y el ancho de banda se han ido abaratando, cada vez hay más soluciones fuera de las instalaciones para el almacenamiento y la gestión de datos. Las empresas con grandes cantidades de datos que almacenar, cribar y analizar ahora almacenan y gestionan de forma rutinaria sus datos completamente en la nube. Este flujo de trabajo ha sido posible gracias a la proliferación de herramientas de gestión de datos en la nube en los últimos 5-10 años. Aunque hasta ahora el campo ha sido liderado principalmente por gigantes como Amazon y Google, muchas empresas más pequeñas ofrecen ahora herramientas para clientes con necesidades de datos de todos los tamaños. Vea a continuación una lista de posibles opciones para la gestión de datos en la nube.
- Panoply
- Amazon Web Services
- Microsoft Azure
- Google Cloud
- Mejores herramientas de ETL e integración de datos
- Informatica Powercenter
- Stitch Data
- Fivetran
- Microsoft SQL Server SSIS
- Azure Data Factory
- Talend
- Alooma
- Mejores herramientas de transformación de datos
- DBT
- Airflow
- Luigi
- Mejores herramientas de gestión de datos maestros
- Profisee
- SAP NetWeaver
- Semarchy xDM
- Tibco MDM
- Ataccama ONE
- Stibo STEP
- Mejores herramientas de gestión de datos de referencia
- Magnitude
- Informatica MDM Reference 360
- Reltio Cloud
- Mejores herramientas de análisis y visualización
- Chartio
- Looker BI
- Metabase
- Microsoft Power BI
- Mode Analytics
- Hacia la gestión automatizada de datos
Panoply
Panoply ofrece un almacén de datos automatizado nativo de la nube que facilita la integración y gestión de todos los datos de su organización. Características principales:
- Una gran selección de conectores de datos nativos permite una fácil, la ingestión de datos con un solo clic
- La ingestión y el preprocesamiento de datos automatizados liberan recursos de TI
- El panel de gestión intuitivo elimina las conjeturas de la gestión de datos y la elaboración de presupuestos
- Escala y mantenimiento automatizados de bases de datos de varios nodos para un almacenamiento de datos de bajomantenimiento de almacenes de datos
- Editor SQL en el navegador para el análisis y la consulta de datos
- Conexiones con suites comunes de visualización y análisis de datos como Tableau, Looker, Chartio
Precio de Panoply: 325 $/mes
Amazon Web Services
Amazon Web Services ofrece un conjunto de herramientas en constante expansión que pueden reunirse en una pila eficaz de gestión de datos en la nube. Los servicios clave incluyen:
- Amazon S3 para el almacenamiento temporal y/o intermedio
- Amazon Glacier para la copia de seguridad y el almacenamiento a largo plazo
- AWS Glue para construir catálogos de datos para categorizar, buscar y consultar sus datos
- Amazon Athena para el análisis de datos basado en SQL
- Amazon Redshift para el almacenamiento de datos
- Amazon Quicksight para la construcción de cuadros de mando y la visualización de datos
- Cada servicio se pone en marcha y se factura por separado, por lo que los costes dependen del grado de utilización
AWS Precio: variable, dependiente de la implementación
Microsoft Azure
La plataforma Azure de Microsoft ofrece diferentes formas de configurar un sistema de gestión de datos basado en la nube, así como herramientas de análisis que pueden utilizarse en sus datos almacenados en Azure. Al igual que AWS, Azure permite múltiples estilos de bases de datos/almacenes de datos con un gran conjunto de herramientas para gestionarlos. Los servicios clave incluyen:
- Bases de datos SQL estándar y servidores SQL basados en VM
- Almacenamiento de bultos
- Opciones de almacenamiento de tablas de estilo NoSQL
- Implementaciones en la nube privada
- Azure Data Explorer (ADX) – un servicio recientemente añadido que permite el análisis en tiempo real de datos de flujo muy grandes sin necesidad de preprocesamiento
- Fácil integración con Panoply para servicios ELT/ETL
Precio de Azure: variable, depende de la implementación
Google Cloud
Al igual que Amazon, la plataforma Cloud de Google ofrece un amplio conjunto de herramientas para la gestión de datos en la nube, así como un gestor de flujos de trabajo que puede utilizarse para vincular los distintos componentes. Componentes clave de Google Cloud:
- BigQuery para el almacenamiento de datos tabulares
- Cloud BigTable para el almacenamiento de estilo de base de datos NoSQL
- Cloud Pub/Sub y Cloud Data Transfer para la entrada de datos; Google Cloud también puede conectarse con una variedad de otras fuentes de datos
- BigQuery analytics para consultas de estilo SQL
- ML Engine para análisis más avanzados mediante aprendizaje automático e IA
- Data Studio para análisis basados en GUI y construcción de cuadros de mando
- Cloud Datalab para ciencia de datos basada en código
- Conexiones con herramientas comunes de BI como Tableau, Looker, etc.
Precio de la nube de Google: variable, depende de la implementación
Mejores herramientas de ETL e integración de datos
Para la lista completa de herramientas de EL consulte nuestra lista de las mejores herramientas de ETL.
Informatica Powercenter
Informatica Powercenter es una herramienta ETL on-premise con las siguientes características clave:
- Conectividad e integración sin fisuras con todo tipo de fuentes de datos utilizando conectores out-of-the-box.
- Validación de datos automatizada: auditoría y validación automatizada sin scripts de los datos movidos o transformados.
- Transformaciones de datos avanzadas: admite datos no relacionales, capaz de analizar datos XML, JSON, PDF, Microsoft Office e IoT.
- Gestión basada en metadatos: proporciona vistas gráficas de los flujos de datos, el impacto y el linaje.
Precio de Informatica PowerCenter: 2000 dólares/mes para el plan más básico
Stitch Data
Stitch Data es una plataforma ETL basada en la nube con las siguientes características clave:
- Preintegrada con docenas de fuentes de datos dentro y fuera de la nube, mueve datos en Amazon Redshift, S3, BigQuery, Panoply, PostgreSQL, y más.
- Fácil programación para la replicación de datos.
- Manejo de errores y alertas con resolución automatizada cuando es posible.
- Marco de trabajo de API y JSON, que le permite introducir datos en un almacén de datos mediante programación.
- Servicio gestionado en la nube con escalado automático y SLA de nivel empresarial.
Precio de Stitch: 100 – 1.000 $/mes en función del tamaño de los datos.
Fivetran
Fivetran es una canalización de datos totalmente gestionada con una interfaz web que integra datos de servicios SaaS y bases de datos en un único almacén de datos. Características principales:
-
Proporciona una integración directa y envía los datos a través de una conexión directa y segura utilizando una sofisticada capa de caché.
-
La capa de almacenamiento en caché ayuda a mover los datos de un punto a otro sin tener que almacenar una copia en el servidor de aplicaciones.
-
Fivetran no impone ningún límite de datos.
-
Puede utilizarse para centralizar los datos de una empresa e integrar todas las fuentes para determinar los indicadores clave de rendimiento (KPI) de toda una organización.
Precio de Fivetran: Disponible bajo petición
3. Blendo
Blendo es otro servicio de ETL e integración de datos basado en la nube, con las siguientes características clave:
- Auto-servicio: se conecta a numerosas fuentes de datos con unos pocos clics, mueve datos a Amazon Redshift, Panoply, PostgreSQL, MS SQL Server y más.
- Datos históricos – carga y sincroniza los datos históricos de los servicios en la nube.
- Carga programada – carga los datos periódicamente o en frecuencias seleccionadas de diferentes fuentes de datos.
- Optimización del esquema de datos – recopilación, detección y preparación automatizada de los datos utilizando un esquema relacional óptimo.
Precio de Blendo: Disponible bajo petición
Microsoft SQL Server SSIS
Microsoft ofrece SSIS, una interfaz gráfica para gestionar ETL utilizando MS SQL Server. Las principales características son:
- La interfaz fácil de usar permite a los usuarios desplegar soluciones integradas de almacenamiento de datos sin tener que involucrarse en la escritura de mucho -o ningún- código.
- La interfaz gráfica permite arrastrar y soltar fácilmente el ETL para múltiples tipos de datos y destinos de almacén, incluyendo DBs que no son MS.
- Gran solución para un equipo con una mezcla de niveles de habilidad técnica, ya que es igualmente eficaz para ninjas ETL y tipos de apuntar y hacer clic por igual.
Precio de SSIS: $931 – $15,000
Azure Data Factory
Además de SQL Server SSIS, la solución ETL on-premise de Microsoft, la compañía también ofrece Azure Data Factory (ADF), una herramienta ETL para su plataforma Azure basada en la nube. Características principales de ADF:
- Los pipelines ETL en ADF se construyen en una interfaz gráfica, lo que permite un uso de bajo código.
- Amplia variedad de conectores de datos para una fácil ingestión de datos–excepto, extrañamente, el soporte para cargar archivos de Microsoft Excel.
- Soporte completo para la carga de datos en almacenes de datos de Azure
Precio de Azure Data Factory: 1 dólar por 1.000 ejecuciones al mes
Talend
Los productos de software de integración de datos de código abierto de Talend proporcionan software para integrar, limpiar, enmascarar y perfilar datos. Las principales características de las ofertas de Talend incluyen:
- GUI que permite gestionar un gran número de sistemas fuente mediante conectores estándar.
- Funcionalidad de gestión de datos maestros (MDM)
- Vista única, coherente y precisa de los datos clave de la empresa.
Precio de Talend: 1.170 dólares/usuario al mes o 12.000 dólares al año
Alooma
Alooma ofrece una plataforma de integración de datos a escala empresarial con grandes herramientas ETL incorporadas. Algunas características clave de las ofertas de Alooma:
- Fuerte enfoque en la construcción rápida de tuberías, monitoreo de calidad de datos y manejo de errores.
- Protección contra la pérdida o corrupción de datos en un proceso ETL potencialmente propenso a errores.
- Flexibilidad para intervenir y escribir sus propios scripts para supervisar, limpiar y mover sus datos según sea necesario.
- Diseñado para operaciones a escala empresarial.
Precio de Alooma: $1,000 – $15,000/mes
Mejores herramientas de transformación de datos
Dataform es una plataforma de transformación de datos basada en SQL y totalmente administrada para gestionar los procesos de su almacén de datos en la nube. Características principales:
- Escriba flujos de trabajo SQL en equipo en un IDE colaborativo. Control de versiones incorporado e integración con Github.
- Escriba pruebas de calidad de datos y establezca alertas si fallan para garantizar que sus datos sean siempre fiables.
- Cree un repositorio centralizado para las definiciones de datos en toda su empresa, documente sus datos y descubra conjuntos de datos en un catálogo de datos.
- Ejecute programas para garantizar que sus datos estén siempre actualizados.
Precio de Dataform:: Desde 550 dólares al mes (descuentos por inicio disponibles)
DBT
DBT (Data Build Tool) es una herramienta de transformación de datos basada en SQL que le permite configurar flujos de transformación modulares desde la línea de comandos. Construido con un ojo hacia la racionalización de análisis de datos y flujos de trabajo de ingeniería, las características clave de DBT incluyen:
- Herramienta basada en SQL
- Flujos de trabajo sencillos para construir flujos modulares de transformación y modelado de datos
- Gestión automatizada de la calidad de los datos con un robusto sistema de pruebas
- Despliegue de código analítico agilizado mediante entornos, gestión de paquetes e integración continua
- Documentación de datos fácil con DAGs autogenerados y fácil anotación y catalogación de datos
- Instalacion de datos para un mejor análisis de datos históricos
Precio de DBT: 0$ para la capa gratuita, 100$/mes para la básica, con presupuestos disponibles para implementaciones empresariales más grandes
Airflow
Originalmente desarrollado en Airbnb, Airflow es una nueva y popular herramienta de infraestructura de datos de código abierto. Aunque no hace nada del procesamiento de datos en sí mismo, Airflow puede ayudarle a programar, organizar y supervisar los procesos ETL utilizando python. Características principales:
- Los grafos acíclicos dirigidos (DAG) permiten que su planificador distribuya sus tareas entre un conjunto de trabajadores sin necesidad de definir relaciones precisas entre padres e hijos entre los flujos de datos
- Una práctica interfaz de usuario basada en la web para gestionar y editar sus DAG
- Un buen conjunto de herramientas que facilita la realización de la «cirugía DAG» desde la línea de comandos.
- Altamente extensible y escalable
Precio de Airflow: gratuito y de código abierto
Luigi
Luigi es un paquete Python de código abierto desarrollado por Spotify. Está diseñado para facilitar la gestión de procesos por lotes de larga duración, por lo que puede encargarse de tareas que van mucho más allá del ámbito de ETL; pero también hace ETL bastante bien. Características principales:
- El código base de Python facilita la construcción de pipelines de datos eficientes, especialmente los que se ocupan de procesos por lotes de larga duración
- Fácil resolución de dependencias
- Interfaz web que permite al usuario visualizar las tareas para la gestión del flujo de trabajo
- Conceptualmente similar a GNU Make, pero no es sólo para Hadoop
- Las operaciones atómicas del sistema de archivos garantizan que tus pipelines nunca se estrellarán con datos parciales
Precio de Luigi: Gratuito y de código abierto
Mejores herramientas de gestión de datos maestros
Dell Boomi’s Master Data Hub tiene las siguientes características clave:
- Define modelos a través de una experiencia visual de bajo código.
- Despliega modelos de datos e identifica qué sistemas de origen interactúan con ellos.
- Incorpora registros del sistema en un repositorio consolidado, fusiona automáticamente registros similares.
- Habilita la administración de datos: alerta a los equipos para que resuelvan duplicados y problemas de entrada de datos.
- Gestiona los datos con flujos de procesos bidireccionales en tiempo real a través de los silos.
Precio de Dell Boomi Master Data Hub: 100.000 dólares – 300.000 dólares
Profisee
La gestión de datos maestros de Profisee tiene las siguientes características clave:
- Administración y gobierno: permite a los «administradores de datos» dentro de la organización gestionar los datos maestros con la información de los análisis.
- Gestión de registros dorados: estandariza, limpia y hace coincidir los datos de origen sin codificación.
- Gestión de eventos: detecta los cambios en los datos y distribuye los eventos a los sistemas suscritos.
- Integrador: federa los datos maestros para las empresas globales, con integración bidireccional en tiempo real.
- Flujo de trabajo empresarial: aplica los procesos de negocio en toda la organización, permite a los administradores gestionar el rendimiento de los administradores de datos.
- SDK: permite la integración de las aplicaciones personalizadas.
Precio del experto: 10 dólares.30/hora
SAP NetWeaver
SAP NetWeaver MDM, un componente de la plataforma de desarrollo NetWeaver, tiene las siguientes características clave:
- Extrae automáticamente los datos maestros de las principales aplicaciones SAP.
- Carga los datos maestros de otras fuentes.
- Integra los datos utilizando contenido empresarial como estructuras de repositorio, reglas de validación, mapeos de entrada y salida.
- Distribuye los datos maestros a los objetivos.
- Permite la integración programática de datos a través de APIs y servicios web.
Precios de SAP NetWeaver: Disponible bajo petición
Semarchy xDM
Semarchy es una empresa relativamente nueva en la escena de MDM, habiendo sido lanzada en 2011. Con sede en Francia, fue fundada por un equipo de antiguos empleados de Sunopsis. xDM, su principal producto MDM, tiene las siguientes características:
- No depende de Hadoop.
- Optimizado para Oracle.
- Las actualizaciones y los cambios se rastrean y propagan utilizando metadatos, lo que permite una gestión de datos iterativa y «evolutiva».
- Cuenta con una interfaz de usuario paso a paso que se puede personalizar para roles empresariales específicos (es decir, analistas, operaciones, etc.).
Precio de Semarch xDM: Disponible bajo petición
Tibco MDM
Tibco es un lugar perenne en los rankings de las mejores herramientas MDM. Las características clave incluyen:
- Flexibilidad y escalabilidad para aplicaciones multidominio.
- Capa de datos maestros independiente y distribuida.
- Interfaz visual personalizable sin código que puede construirse para adaptarse a varios roles empresariales.
- Soporte de versiones de datos de alto nivel.
- Soporte de servicios web SOAP.
Precio del MDM de Tibco: Disponible bajo petición
Ataccama ONE
Ataccama ofrece ONE, una herramienta de gestión de datos altamente automatizada que puede ejecutarse en las instalaciones, en la nube o en una configuración híbrida. Las principales características son:
- Curación, limpieza y clasificación de datos basada en el aprendizaje automático.
- Descubrimiento automatizado de metadatos.
- Configuración automatizada de proyectos.
- Domain agnostic, but comes pre-configured with pre-built rules for MDM for typical domains such as customer, contact and product.
- Conectores para una amplia gama de tipos de datos y fuentes.
- Preparado para GDPR.
- Historia completa de auditoría de datos con registro detallado de las reglas de negocio y transformaciones aplicadas.
Precio de Ataccama ONE: Disponible bajo petición
Stibo STEP
Stibo tiene la distinción de ser probablemente la empresa más antigua de la lista, habiendo sido fundada en el siglo XVIII como una empresa de impresión. La rama de gestión de datos de la empresa es más joven, y STEP, su principal oferta de herramientas de gestión de datos, tiene las siguientes características clave:
- STEP Workbench UI.
- Plataforma MDM multidominio holística.
- Alto nivel de automatización.
- Traducción automatizada de datos e idiomas para operaciones multinacionales.
- Revisión y aprobación automatizada de activos digitales.
- Gestión de datos maestros a nivel empresarial.
Precio de Stibo STEP: Disponible bajo petición
Mejores herramientas de gestión de datos de referencia
La solución de datos de referencia de Collibra tiene las siguientes características clave:
- Automatiza los flujos de trabajo para crear nuevos códigos y conjuntos de códigos.
- Entrega códigos y conjuntos de códigos a los usuarios de manera amigable.
- Realiza un mapeo de datos preciso para eliminar las barreras de acceso a los datos.
- Compara datos de diferentes partes de la organización.
Precio de Collibra: Disponible bajo petición
Magnitude
La gestión de datos de referencia de Magnitude tiene las siguientes características clave:
- Modelado multidominio: admite estructuras empresariales desde listas de códigos hasta jerarquías de múltiples rutas y autorreferenciadas.
- Automatización – proporciona automatización, gobernanza y control sobre los objetos de datos de referencia y los procesos de carga.
- Mapeo – proporciona mapeo global a local, externo a interno, y específico a general sin interrumpir los elementos existentes.
- Gobierno – proporciona un flujo de trabajo personalizable para controlar los procesos de negocio relacionados con los datos de referencia, con controles de seguridad basados en el modelo que permiten a los usuarios ver, añadir o actualizar.
- Variedad temporal – permite a los usuarios cambiar los modelos, los sujetos, los atributos y las asociaciones y recuperar cualquier versión anterior del objeto.
Precio de la gestión de datos de referencia de magnitud: Disponible bajo petición
Informatica MDM Reference 360
El MDM Reference 360 de Informatica tiene las siguientes características clave:
- Totalmente basado en la nube: rendimiento y escalabilidad mejorados.
- Plataforma integral: integración de datos integrada, calidad de datos, gestión de procesos.
- Autoservicio – Gestión de Datos Maestros y flujos de trabajo construidos para los usuarios de negocio sin conocimientos técnicos.
- Combinación y fusión – fusiona y cruza datos de nuevos tipos y fuentes.
Precio de Informatica MDM Reference 360: Disponible bajo petición
Reltio Cloud
Reltio fabrica Reltio Cloud, una herramienta de gestión de datos maestros basada en gráficos que incluye herramientas de gestión de datos de referencia. Reltio está construido sobre bases de datos de grafos para darle la máxima flexibilidad, tanto para escalar los almacenes de datos como para definir relaciones claras entre los datos de su repositorio. Otras características clave:
- Fácil integración con las herramientas MDM existentes y/o con otras fuentes de datos.
- Interfaz fácil de usar.
- La plataforma en la nube, siempre disponible, hace posible las actualizaciones sin tiempo de inactividad.
Precio de Reltio Cloud: Disponible bajo petición
Mejores herramientas de análisis y visualización
Tableau es una plataforma de BI disponible tanto en la nube como en forma de software descargable, con las siguientes características clave:
- Se conecta fácilmente a las fuentes de datos.
- Permite un fácil acceso a las visualizaciones para equipos, socios y clientes.
- Permite la exploración ilimitada de datos con cuadros de mando interactivos.
- Crea «dashboard starters», cuadros de mando accionables configurados en minutos con datos de aplicaciones web populares.
- Crea mapas interactivos automáticamente.
Precio de Tableau: entre 35 y 70 dólares por usuario y mes.
Chartio
Chartio es una plataforma de BI y visualización basada en la nube con las siguientes características clave:
- Modo interactivo – arrastra y suelta los datos para crear, filtrar y compartir cuadros de mando.
- Modo SQL – se comunica con las bases de datos en SQL para extraer directamente los conocimientos.
- Capas de datos – añade pasos sucesivos de transformación a los datos para transformar los resultados de las consultas.
- Visualizaciones y gráficos – visualice los datos al instante; Chartio recomienda el gráfico más apropiado.
- Mezcla de datos y desgloses – combine fuentes de datos dispares sobre la marcha y obtenga información procesable sin explorar los datos en bruto.
Precio de Chartio: 249 $/mes para una licencia de equipo.
Looker BI
Looker es otra plataforma de análisis y visualización basada en la nube, con las siguientes características clave:
- Define las métricas una vez utilizando LookML, el sencillo lenguaje de modelado de datos de Looker, y Looker escribe consultas SQL para responder a cualquier pregunta sobre esas métricas.
- Haz que los datos sean hermosos con cuadros de mando fáciles de leer que permiten a los usuarios profundizar y explorar.
- Conéctese directamente a las bases de datos, sin extractos ni software que descargar.
- Abra el acceso a los cuadros de mando e informes a todo el mundo, no sólo a los analistas o científicos de datos.
Precio de Looker: 3.000 – 5.000 dólares al mes para 10 usuarios.
Metabase
Metabase ofrece una interfaz de código abierto y fácil de usar para conectar y analizar sus datos. Como herramienta de visualización de datos, ofrece:
- Cientos de conectores de datos nativos.
- Fácil configuración y acceso para todo su equipo.
- Gran variedad de opciones de visualización de datos diferentes para elegir.
- Incorporación de etiquetas blancas (nivel de incrustación premium y superior).
- Gestión de permisos de auditoría y datos (nivel empresarial y superior).
Precio de la base de datos: Metabase es gratuito y de código abierto, por lo que su nivel gratuito ofrece una serie de características que serán adecuadas para la mayoría de los usuarios. Los planes para empresas pueden oscilar entre los 3.000 y los 10.000 dólares anuales de precio inicial.
Microsoft Power BI
Power BI, la oferta de Microsoft en el espacio de la analítica empresarial, está diseñada para ser útil tanto para los analistas empresariales como para los científicos de datos. Principales características:
- Simple interfaz de arrastrar y soltar que está diseñada para ser familiar a los usuarios de MS Excel.
- Power BI es una plataforma sin código, y ofrece clientes de escritorio y web.
- Biblioteca de conectores preconfigurados
- El rendimiento tiende a ser lento en conjuntos de datos muy grandes – busque en otra parte soluciones de big data
Precio de Microsoft Power BI: 9,99 dólares por usuario al mes, o gratis para la versión básica.
Mode Analytics
Mode Analytics ofrece una suite de análisis de datos basada en la web dirigida a científicos y analistas de datos, con un enfoque en la colaboración y el intercambio. Algunas de las características clave de Mode:
- Diseñado para que sea especialmente fácil conectar tus fuentes de datos a su editor SQL incorporado y a su plataforma de visualización.
- Mode puede canalizar los resultados de sus consultas SQL directamente en un marco de datos de R o Pandas en un cuaderno nativo de Mode.
- Comparte los datos, el análisis y el cuadro de mando resultante todo a través de Mode.
- Mode es una buena opción para un equipo de científicos de datos que quieren ser capaces de colaborar más fácilmente.
Precio de Mode Analytics: disponible bajo petición.
Hacia la gestión automatizada de datos
Cubrimos cinco formas de pensar en las herramientas de gestión de datos -Gestión de Datos de Referencia, Gestión de Datos Maestros (MDM), ETL y análisis de big data- y unas cuantas herramientas estupendas en cada categoría.
A medida que la infraestructura de datos se traslada a la nube, más de la pila de datos se gestiona y se integra completamente. No existe un sustituto para la gestión de los procesos empresariales en torno a los datos estructurados en las grandes organizaciones. Pero las plataformas basadas en la nube pueden ayudar con gran parte de la estrategia de gestión de datos -desde el tratamiento y la preparación de los datos en bruto, hasta la ingestión, carga, transformación, optimización y visualización de datos- de forma automática en un único sistema.