¿Qué es Ceph y Ceph Storage?

El alojamiento en la nube para implementaciones de nivel empresarial necesita una solución de almacenamiento altamente escalable para agilizar y gestionar los datos empresariales importantes. A medida que la tecnología y las mejores prácticas avanzan hacia los servicios basados en la nube para seguir el ritmo de un negocio próspero, Ceph nació de la necesidad de una solución de software que fomente un modelo sostenible de crecimiento.

En este artículo

  • ¿Qué es Ceph?
  • ¿Cómo funciona Ceph?
  • Almacenamiento de objetos
  • Almacenamiento de bloques
  • Sistema de archivos
  • ¿Qué es el almacenamiento Ceph?

Nuestros antecedentes en Ceph provienen de que forma parte de nuestras nubes privadas hiperconvergentes pero también como nuestro software subyacente para nuestros sistemas de almacenamiento de objetos independientes. Para obtener más información, consulte nuestra nube privada Flex Metal.

¿Qué es Ceph?

Ceph es una plataforma de almacenamiento de código abierto que está diseñada para permitir el almacenamiento de objetos, bloques y archivos desde un único sistema. Diseñada para ser autorreparadora y autogestionada, Ceph se esfuerza por reducir los costes de administrador y de presupuesto, lo que le permite hacer frente a las interrupciones por sí sola. También pretende que las operaciones sean completamente distribuidas, sin un solo punto de fallo, y es escalable hasta el nivel de exabytes. El software Ceph también se ejecuta en hardware básico y replica los datos para que sea tolerante a los fallos.

¿Cómo funciona Ceph?

Ceph puede emplear cinco demonios distintos que están totalmente distribuidos y pueden ejecutarse en el mismo conjunto de servidores, lo que permite a los usuarios interactuar directamente con ellos:

  • Los monitores de Ceph (ceph-mon) realizan un seguimiento de los nodos de clúster activos y con fallos.
  • Los gestores de Ceph (ceph-mgr) se ejecutan junto a los demonios de los monitores para proporcionar una supervisión adicional e interfaces con sistemas externos de supervisión y gestión.
  • Los servidores de metadatos (ceph-mds) almacenan los metadatos de los inodos y directorios.
  • Los dispositivos de almacenamiento de objetos (ceph-osd) almacenan los archivos de contenido real.
  • Las pasarelas de transferencia de estado representacional (RESTful) (ceph-rgw) exponen la capa de almacenamiento de objetos como una interfaz compatible con las API de OpenStack Swift.

El despliegue de uno o más monitores Ceph y dos o más dispositivos de almacenamiento de objetos Ceph se denomina clúster de almacenamiento Ceph. En acción, el sistema de archivos Ceph, el almacenamiento de objetos Ceph y los dispositivos de bloques Ceph leen datos desde y escriben datos en el Cluster de Almacenamiento Ceph. Dentro del Cluster de Almacenamiento Ceph, los dispositivos de almacenamiento de objetos Ceph almacenan los datos como objetos en los nodos de almacenamiento. Un Ceph Storage Cluster puede tener miles de nodos de almacenamiento.

Dentro del propio sistema de almacenamiento, Ceph utiliza el almacenamiento de objetos distribuido, que es una arquitectura de almacenamiento de datos informáticos que trata los datos como objetos. Esto es diferente a otras arquitecturas de almacenamiento que gestionan los datos en una jerarquía de archivos, como los sistemas de archivos. A través de las bibliotecas de software de Ceph, los usuarios obtienen acceso directo al sistema de almacenamiento basado en objetos distribuidos autónomos y fiables (RADOS), que también proporciona una base para algunas de las características de Ceph, como RADOS Block Device y Ceph Filesystem.

Almacenamiento en bloque

Ceph proporciona acceso al almacenamiento en bloque mediante el montaje del clúster Ceph como dispositivo de bloque a través de un módulo del kernel de Linux llamado RDB o Radios Block Device.

Cuando se escriben datos en Ceph utilizando un dispositivo de bloque, Ceph separa y replica automáticamente los datos en todo el clúster. El sistema de almacenamiento de objetos de Ceph también permite a los usuarios montar Ceph como un dispositivo de bloque de aprovisionamiento ligero. Los dispositivos de bloque de Ceph utilizan las capacidades de RADOS, que incluyen instantáneas, replicación y consistencia. El dispositivo de bloque también puede proporcionar almacenamiento en bloque a las máquinas virtuales en OpenStack.

También hay grandes noticias que vienen con Ceph Crimson, un sistema OSD construido a propósito que ayuda a aprovechar la increíble potencia de las unidades NVMe.

Sistema de archivos

El sistema de archivos de Ceph (CephFS) es un sistema de archivos compatible con POSIX (que son estándares utilizados para garantizar la compatibilidad de archivos entre sistemas operativos) que utiliza un clúster de almacenamiento Ceph para almacenar datos. Con el clúster del servidor de metadatos Ceph, los mapas de los directorios y los nombres de los archivos se almacenan dentro de los clústeres RADOS. Además, el clúster del servidor de metadatos puede escalar y reequilibrar el sistema de archivos de forma dinámica para distribuir los datos uniformemente entre los hosts del clúster, garantizando un alto rendimiento y evitando cargas pesadas dentro del clúster.

Almacenamiento de objetos – Herramientas de cliente/RGW

Dentro del propio sistema de almacenamiento, Ceph utiliza el almacenamiento de objetos distribuido. Esto es independiente del concepto de conexión al Cluster Ceph para utilizarlo como almacén de objetos. Ceph tiene una pasarela de almacenamiento de objetos nativa llamada RGW. Se trata de un servicio que se ejecuta en varios o todos los miembros de un clúster y proporciona una API compatible con S3 y una pasarela para que sus programas puedan añadir, eliminar, etc. objetos. Todas las nubes Flex Metal vienen con almacenamiento de objetos Ceph bajo demanda como parte del núcleo y con clústeres de almacenamiento independientes.

Puede ser un poco confuso, sin duda. Una rápida descripción del almacenamiento en bloque frente al almacenamiento de objetos puede ayudar.

Clúster de Almacenamiento Ceph

Un Clúster de Almacenamiento Ceph es el despliegue de dos tipos de demonio: uno o más monitores Ceph y dos o más dispositivos de almacenamiento de objetos Ceph. El Cluster de Almacenamiento Ceph es la base de todos los despliegues Ceph y podría contener miles de dispositivos de almacenamiento.

¿Cómo funciona?

En acción, el sistema de archivos Ceph, el almacenamiento de objetos Ceph y los dispositivos de bloques Ceph leen datos desde el cluster de almacenamiento Ceph y escriben datos en él. Dentro del clúster de almacenamiento Ceph, los dispositivos de almacenamiento de objetos Ceph almacenan los datos como objetos en los nodos de almacenamiento. Los dispositivos de almacenamiento de objetos almacenan los archivos de contenido reales, y los monitores Ceph realizan un seguimiento de los dispositivos de clúster activos y fallidos.

Los usuarios que configuren, modifiquen y eliminen clústeres Ceph utilizarán la herramienta ceph-deploy. Hecha exclusivamente para Ceph, ceph-deploy permite a los usuarios lanzar Ceph de forma rápida y sencilla con prácticos ajustes de configuración inicial. La herramienta ofrece la posibilidad de instalar paquetes Ceph en hosts remotos, crear un clúster, añadir monitores, reunir y olvidar claves, añadir dispositivos de almacenamiento de objetos, desmontar clústeres y mucho más.

En resumen, creemos que Ceph es un gran software y constituye la base de nuestros sistemas de almacenamiento, tanto en nubes hiperconvergentes y convergentes como en los sistemas de almacenamiento autónomos a escala de petabytes alimentados por Ceph que ofrecemos.

OpenStack powered flex metal

Ceph y Ceph Storage Clusters ofrece a su empresa el almacenamiento altamente escalable que necesita para crecer en un entorno de nube. Experimente Ceph y Ceph Storage Clusters en acción, aprenda más sobre la solución Flex Metal potenciada por OpenStack.