Apache Phoenix para CDH

Apache Phoenix para CDH:Mejor característica nueva para DBMS

Cloudera está adoptando y será compatible con Apache Phoenix para CDH mientras lo integra para su Cloudera Data Platform en el futuro.

Los lanzamientos de CDH de Cloudera han incluido Apache HBase que proporciona un DBMS NoSQL resistente para las aplicaciones operativas de los clientes que desean aprovechar el poder de los grandes datos. Estas aplicaciones se han convertido en aplicaciones de misión importante y crítica que impulsan los ingresos de primera línea y la rentabilidad de la línea de fondo. Estas aplicaciones incluyen aplicaciones orientadas al cliente, plataformas de comercio electrónico, detección de riesgos y fraudes que se utilizan entre bastidores en los bancos o sirven modelos de IA/ML para aplicaciones y permiten una mayor capacitación de refuerzo de las mismas en función de los resultados reales.

Sin embargo, para muchos clientes, HBase ha sido un viaje demasiado desalentador, que requiere que aprendan

Un nuevo modelo de datos como HBase es un esquema de tabla ancha que admite millones de columnas pero no uniones y
Uso de las API de Java en lugar de ANSI SQL

Han pedido poder utilizar un diseño de esquema más tradicional que se parezca al proporcionado por Oracle o MySQL y han estado dispuestos a hacer algunas concesiones en la flexibilidad, por ejemplo,

Están dispuestos a utilizar los tipos de datos proporcionados en lugar de definir los suyos propios
Están dispuestos a renunciar a la flexibilidad de tener una sola columna con varios tipos dependiendo de la fila a cambio de un solo tipo en una sola fila

Permitir que los clientes accedan fácilmente a los otros beneficios de Apache HBase (escalado ilimitado, millones de filas, evolución de esquemas, etc.) mientras se brindan capacidades similares a RDBMS (ANSI SQL, uniones simples, tipos de datos fuera del box, etc.), estamos introduciendo soporte para Apache Phoenix en CDH.

Para todos los demás, las aplicaciones basadas en Phoenix también se benefician de las optimizaciones de HBase detrás de escena, lo que facilita obtener un mejor rendimiento de HBase. Por ejemplo, Phoenix implementa el salting de claves primarias, por lo que los usuarios de HBase no tienen que pensar en este aspecto del diseño de claves.

Además, las aplicaciones basadas en Phoenix pueden coexistir con aplicaciones HBase, lo que significa que puede usar un solo clúster HBase para admitir ambas. Con Phoenix, los clientes pueden continuar usando sus herramientas de BI y tableros favoritas tal como lo hicieron con Hive e Impala en el pasado. Al usar Phoenix, también pueden elegir usar Phoenix directamente con esas herramientas además de la opción de usar Hive/Impala eliminando un paso para nuevas implementaciones.

Desde una perspectiva de seguridad y gobierno (SDX), en CDH, Phoenix utiliza ACL de HBase para el control de acceso basado en funciones para las tablas de Phoenix. Phoenix también utiliza la integración de HBase en Cloudera Navigator para la información de auditoría.

Cloudera ha lanzado un paquete Phoenix 4.14.1 disponible para los clientes de CDH 5.16.2 y un paquete Phoenix 5.0 disponible para los clientes de CDH 6.2+.

Los clientes existentes de HDP ya tienen soporte para Apache Phoenix y casi la mitad de los usuarios de HBase que usan HDP actualmente usan Phoenix, lo que también habla de su popularidad en la comunidad de usuarios de HBase.

Descarga Apache Phoenix para CDH

Cree aplicaciones de misión crítica con Apache Phoenix. Descarga el software aquí.

Preguntas frecuentes sobre Fénix

P) ¿Cuáles son las cargas de trabajo para las que se debe usar Phoenix?

Phoenix admite los mismos casos de uso que HBase, principalmente cargas de trabajo de baja latencia y alta simultaneidad. Sin embargo, Phoenix simplifica el aprovechamiento de los datos subyacentes para fines de tableros y BI

P) ¿Cuál es el mecanismo de autorización con Phoenix?

Phoenix depende de HBase para la autorización. Para los clientes de CDH, esto utiliza HBase ACL. Para los clientes de HDP, esto es a través de la integración HBase-Ranger

P) ¿Cuál es la escalabilidad de Phoenix? ¿Cuál es el clúster más grande conocido?

Phoenix escala a cientos de TB de datos. El cliente más grande tiene más de 0,5 PB de datos administrados por Phoenix. Los detalles sobre los casos de uso se pueden encontrar en los archivos de PhoenixCon y en los archivos de videos del día de NoSQL a principios de este año en las propias palabras y diapositivas de los usuarios.

P) ¿Admite Phoenix la indexación secundaria geoespacial? ¿Qué nivel de compatibilidad con datos espaciales?

Tiene soporte limitado para datos geoespaciales. Sin embargo, GeoMesa proporciona una capa geoespacial en HBase que puede satisfacer esta necesidad e integrarse con las aplicaciones de los clientes. Phoenix, GeoMesa, así como JanusGraph y OpenTSDB pueden coexistir en un solo clúster de HBase.

P) ¿Cómo se crea y utiliza un índice?

Consulte la página de indexación secundaria de Phoenix para obtener detalles sobre la indexación. Desde Phoenix 4.8.0 en adelante, no se requieren cambios de configuración para usar la indexación local.

P) ¿Existe un límite en el número de columnas que puede incluir en el índice?

Al igual que en un RDBMS, un índice es esencialmente una tabla separada con el índice y un enlace a los datos de origen. Si indexa todas las columnas, anula el propósito al mantener dos tablas idénticas. Los índices deben usarse con prudencia, ya que hay una sobrecarga no trivial en escritura (índices globales) o lectura (índices locales).