sql >> Base de Datos >  >> NoSQL >> HBase

Base de datos operativa en CDP

Nota del editor, agosto de 2020:CDP Data Center ahora se llama CDP Private Cloud Base. Puede obtener más información al respecto aquí.

La base de datos operativa de Cloudera (OpDB) en CDP ofrece una OpDB escalable, siempre disponible y en tiempo real que sirve datos estructurados tradicionales junto con nuevos datos no estructurados dentro de una plataforma operativa y de almacenamiento unificada. Cloudera ofrece una base de datos operativa que sirve datos estructurados tradicionales junto con nuevos datos no estructurados dentro de una plataforma unificada de código abierto.

La base de datos operativa le ayuda a:

Ponga en funcionamiento el aprendizaje automático o la inteligencia artificial para revolucionar sectores como la sanidad, los servicios públicos, etc. 

  • Ofrezca contenido en tiempo real a escala web.
  • Potencia el análisis de big data para usos operativos y fuera de línea.
  • Úselo como un almacén de registros resistente.

OpDB en CDP está disponible actualmente en dos factores de forma:como una oferta semigestionada y completamente segura en CDP Public Cloud – Data Hub, y como una oferta totalmente personalizable en CDP Data Center, similar a lo que ya está disponible en CDH y HDP. Puede elegir un factor de forma según su estrategia de implementación y las necesidades de OpDB. La base de datos operativa utiliza un almacén de objetos como Amazon S3 como una capa de almacenamiento para Apache HBase, donde los HFiles se escriben en el almacén de objetos, pero los WAL se escriben en HDFS.

La base de datos operativa de CDP tiene los siguientes componentes: 

  • Apache Phoenix una interfaz SQL que se ejecuta sobre Apache HBase.
  • Apache HBase está diseñado para una escalabilidad masiva, por lo que puede almacenar cantidades ilimitadas de datos en una sola plataforma y manejar las crecientes demandas de servicio de datos.
  • Apache ZooKeeper proporciona un servicio de configuración distribuido, un servicio de sincronización y un registro de nombres.
  • Apache Knox Gateway brinda seguridad perimetral para que la empresa pueda ampliar el acceso con confianza a nuevos usuarios.
  • Apache HDFS se usa para escribir los WAL de Apache HBase.
  • El almacén de objetos, como Amazon S3 y Microsoft ADLS Gen2, se usa para almacenar Apache HBase HFiles.
  • Experiencia de datos compartidos (SDX) se utiliza para capacidades de seguridad y gobernanza. Las políticas de seguridad y gobernanza se establecen una vez y se aplican a todos los datos y cargas de trabajo.
  • IDBroker es una API REST creada como parte de los servicios de autenticación de Apache Knox. Permite que un usuario autenticado y autorizado intercambie un conjunto de credenciales o un token por tokens de acceso del proveedor de la nube.

Base de datos operativa en serie CDP 

Este artículo le dio una introducción sobre OpDB en CDP y su arquitectura. Puede obtener más información sobre cada aspecto de OpDB y conocer las nuevas características y capacidades de OpDB en los próximos artículos de esta serie. Actualizaremos los enlaces a cada publicación del blog a medida que se publiquen.

Accesibilidad

OpDB de Cloudera garantiza que los usuarios puedan acceder a los datos almacenados o recuperarlos. Admite fragmentación automática y fragmentación predefinida, tres motores de consulta y varias herramientas de integración de datos. Este artículo proporciona una descripción general de estas capacidades y otras características que aseguran que se logre un alto nivel de accesibilidad.

Administración

OpDB de Cloudera proporciona varias herramientas y funciones de administración para administrar su carga de trabajo de OpDB. Los administradores pueden implementar OpDB como una oferta totalmente segura y semiadministrada en CDP Public Cloud – Data Hub y como una oferta totalmente personalizable en CDP Data Center (similar a lo que está disponible en CDH y HDP). Este artículo le brinda una descripción general de alto nivel de las funciones y herramientas compatibles para administrar OpDB en CDP.

Administración

OpDB de Cloudera proporciona herramientas de administración que lo ayudan a administrar de manera efectiva sus cargas de trabajo de OpDB. Este artículo le brinda una descripción general de las herramientas y funciones de administración de OpDB en CDP.

Disponibilidad

OpDB de Cloudera mantiene un alto nivel de disponibilidad de datos, lo que garantiza que se pueda acceder a los datos requeridos cuando y donde se necesiten, incluso si se produce una falla en el nodo. Este artículo proporciona una descripción general de las funciones que hacen posible un alto nivel de disponibilidad, como la alta disponibilidad lista para usar, la replicación de datos y la protección contra errores.

Integridad

OpDB de Cloudera proporciona varias capacidades de integridad de datos, incluida la integridad de la entidad y el dominio, las transacciones ACID y la integridad no relacional. Este artículo proporciona una descripción general de las capacidades de integridad de datos de OpDB.

Soporte de aplicaciones

OpDB de Cloudera es compatible con varios lenguajes, marcos y aplicaciones populares que puede usar para acceder a los datos almacenados en su OpDB. Este artículo le brinda una descripción general de los lenguajes, marcos y aplicaciones admitidos.

NoSQL y capacidades relacionadas

Como OpDB de Cloudera incluye la base de datos NoSQL HBase para almacenar datos, tiene capacidades NoSQL, como valores clave, capacidades de estilo de tabla y tipos de datos flexibles. También se proporciona una estrecha integración en todo el ecosistema de Hadoop, incluidos HDFS, Spark y Kafka. Este artículo proporciona una descripción general de estas capacidades.

Escalabilidad

OpDB de Cloudera está diseñado para una alta escalabilidad, compatible con escalabilidad vertical y horizontal con tipos de datos flexibles y sin límite en el tamaño de los datos. Este artículo proporciona una descripción general de las funciones y herramientas relacionadas con la escalabilidad admitidas.

Seguridad

OpDB de Cloudera proporciona múltiples soluciones de seguridad en diferentes niveles, con respecto al cifrado, la autenticación, la autorización y la auditoría. Este artículo proporciona una descripción general de estas funciones y herramientas relacionadas con la seguridad.

Para obtener más información, vaya a:Introducción a la base de datos operativa.