sql >> Base de Datos >  >> NoSQL >> HBase

Primeros pasos con Cloudera Data Platform Operational Database (COD)

Conceptos

¿Qué es la base de datos operativa de Cloudera (COD)?

La base de datos operativa es una base de datos relacional y no relacional creada en Apache HBase y está diseñada para admitir aplicaciones OLTP, que utilizan big data.

La base de datos operativa de Cloudera Data Platform tiene los siguientes componentes: 

  • Apache Phoenix proporciona un modelo relacional que facilita la escalabilidad masiva. Aprovecha la escalabilidad y la resistencia de Apache HBase.
  • Apache HBase proporciona un modelo no relacional diseñado para una escalabilidad masiva, por lo que puede almacenar cantidades ilimitadas de datos en una sola plataforma y manejar las crecientes demandas de servicio de datos.
  • Apache ZooKeeper proporciona un servicio de configuración distribuido, un servicio de sincronización y un registro de nombres.
  • Apache Knox Gateway proporciona seguridad perimetral para que la empresa pueda ampliar el acceso con confianza a nuevos usuarios.
  • Apache HDFS se usa para escribir los WAL de Apache HBase (y HBase HFiles en algunos casos).
  • Almacenes de objetos como Amazon S3 y Microsoft ADLS Gen2 se utilizan para almacenar Apache HBase HFiles.
  • Shared Data Experience (SDX) se utiliza para las funciones de seguridad y gobernanza. Las políticas de seguridad y gobernanza se establecen una vez y se aplican a todos los datos y cargas de trabajo. Al igual que CDP, SDX se basa en proyectos comunitarios de código abierto con Apache Ranger y Apache Atlas ocupando un lugar de honor.

Atlas proporciona capacidades abiertas de gestión y gobierno de metadatos para crear un catálogo de todos los activos, y también clasificar y controlar estos activos. La capa SDX de CDP aprovecha el espectro completo de Atlas para rastrear y controlar automáticamente todos los activos de datos.

Ranger proporciona administración de claves de seguridad, con un inicio de sesión independiente para los administradores de claves que utilizan el servicio Ranger KMS. Apache Ranger también proporciona funciones de seguridad muy necesarias, como el enmascaramiento de columnas y el filtrado de filas, listos para usar. Otro factor importante es que las políticas de acceso en Ranger se pueden personalizar con un contexto dinámico utilizando diferentes atributos como "región geográfica" o "hora del día".

  • IDBroker es una API REST creada como parte de los servicios de autenticación de Apache Knox. Permite que un usuario autenticado y autorizado intercambie un conjunto de credenciales o un token por tokens de acceso del proveedor de la nube.

Servicio de datos de la base de datos operativa de CDP

CDP Operational Database (COD) es una base de datos operativa de escalado automático en tiempo real impulsada por Apache HBase y Apache Phoenix. Es un servicio de datos que se ejecuta en Cloudera Data Platform (CDP). Puede acceder a COD directamente desde su consola CDP. COD le permite crear una nueva base de datos operativa con un solo clic y se escala automáticamente en función de su carga de trabajo.

Los siguientes son los pasos clave para comenzar con COD:

  • Cree una base de datos en un entorno con un solo clic y la base de datos debería estar activa y disponible en unos minutos.
  • Configure su contraseña de carga de trabajo. Para obtener más información, haga clic aquí.
  • Descargue e instale Apache Maven, Java, Python 3.8.
  • Instale CDP Client en su máquina. Para obtener más información, haga clic aquí.
  • Siga las instrucciones en el repositorio de ejemplos para realizar cambios en su maven settings-security.xml, settings.xml y pom.xml.
  • Cree y ejecute las aplicaciones.

Apache HBase

HBase es una arquitectura de almacenamiento de datos orientada a columnas que se forma sobre HDFS para superar sus limitaciones. Aprovecha las funciones básicas de HDFS y se basa en ellas para proporcionar escalabilidad al manejar un gran volumen de solicitudes de lectura y escritura en tiempo real. Aunque la arquitectura HBase es una base de datos NoSQL, facilita el proceso de mantenimiento de datos al distribuirlos de manera uniforme en todo el clúster. Esto hace que acceder y modificar datos en el modelo de datos HBase sea rápido. Obtenga más información sobre Apache HBase.

Apache Fénix

Apache Phoenix es una interfaz RDBMS y ANSI SQL. Apache Phoenix implementa optimizaciones de mejores prácticas para permitir que los ingenieros de software desarrollen aplicaciones basadas en datos de próxima generación basadas en HBase. Con Phoenix, puede crear e interactuar con tablas en forma de instrucciones DDL/DML típicas utilizando la API estándar de JDBC, ODBC y Phoenix DB API.

Phoenix proporciona:

  • Compatibilidad con API SQL y JDBC
  • Soporte para schema-on-read enlazado en tiempo de ejecución
  • Acceso a datos almacenados y producidos en otros componentes como Apache Spark y Apache Hive

Obtenga más información sobre Apache Phoenix.

Procedimiento

Cómo crear una base de datos operativa

Puede crear una base de datos operativa en su entorno registrado utilizando CDP Operational Database (COD).

Requisitos previos

  • Debe iniciar sesión en el entorno COD como administrador de ODA.
  • Asegúrese de estar autorizado para crear una base de datos.

Pasos

  1. Inicie sesión en la interfaz web de CDP. Por ejemplo, consola CDP.
  2. Seleccionar base de datos operativa.
  3. En la interfaz web de COD, haga clic en Crear base de datos.
  4. Seleccione el entorno de la lista en el que desea tener la base de datos.
  5. Proporcione un nombre para la base de datos en el campo Nombre de la base de datos.
  6. Haga clic en Crear base de datos.

Resultado

Se muestra la página de información que muestra el estado de la base de datos. Su nueva base de datos estará lista para usarse una vez que su estado pase a ser Disponible.

Demostración

Cómo administrar una conexión de base de datos

Una vez que crea una base de datos operativa y está disponible, puede administrar las conexiones de la base de datos.

Requisitos previos

  • Asegúrese de que una base de datos esté activa y disponible.
  • Está autorizado a realizar cambios en la base de datos.

Pasos

  1. En la interfaz web de COD, seleccione la base de datos para la que desea administrar las conexiones.
  2. En Conectar, vaya dentro de cada pestaña y modifique los parámetros.

Referencias

  • Documentación de Cloudera sobre la creación de una base de datos COD
  • Base de datos operativa en CDP 

Si está interesado en probar CDP Public Cloud y Operational Database, pruebe nuestro Prueba de manejo .