sql >> Base de Datos >  >> NoSQL >> HBase

Procedimiento:agregue Cloudera Search a su clúster mediante Cloudera Manager

Cloudera Manager 4.7 agregó soporte para administrar Cloudera Search 1.0. Por lo tanto, los usuarios de Cloudera Manager pueden implementar fácilmente todos los componentes de Cloudera Search (incluido Apache Solr) y administrar todos los servicios relacionados, al igual que cualquier otro servicio incluido en CDH (distribución de Cloudera de Apache Hadoop y proyectos relacionados).

En este tutorial, aprenderá los pasos necesarios para agregar Cloudera Search a un clúster de Cloudera Enterprise (CDH + Cloudera Manager).

Instalación del paquete SOLR

En nuestro ejemplo, el clúster usa un paquete CDH 4.4 y ejecuta los servicios Apache ZooKeeper, HDFS y Apache HBase. (Los paquetes son una forma realmente útil de implementar software nuevo y realizar actualizaciones sencillas a través de Cloudera Manager).

Si desea descargar el paquete SOLR directamente desde Cloudera, puede usar la configuración predeterminada para "URL de repositorio de paquetes remotos" (en Paquetes en la pestaña Administración) como se muestra a continuación:

Configuración de la URL del repositorio de paquetes

Si desea utilizar un repositorio local (es decir, primero descargue el paquete de Cloudera y luego instálelo desde la copia local), puede seguir las instrucciones aquí. Los siguientes pasos son "Descargar", "Distribuir" y "Activar" el paquete desde la página Parcelas en la pestaña Anfitriones.

Implementación del paquete SOLR

Una vez que se activa el paquete, tiene todos los componentes de Cloudera Search (Solr, Lily HBase Indexer y Apache Flume's Morphlines Sink) listos para usar junto con CDH.

El siguiente paso es agregar el servicio Apache Solr a su clúster. En el menú "Acciones" de su clúster en la pestaña Servicios, elija "Agregar un servicio", que lo lleva al "Asistente para agregar servicios" en Cloudera Manager. Una vez que siga los pasos del asistente y elija dónde deben ejecutarse los servidores Solr, aterrizará en una página de flujo de trabajo que inicializará el servicio Solr e iniciará todos los servidores Solr.

Poner en funcionamiento el servicio Solr

Eso es todo:¡el servicio Solr ahora está listo para usar! Siga las instrucciones de la Guía del usuario de búsqueda de Cloudera para crear colecciones y agregarles documentos para su indexación. La siguiente captura de pantalla muestra cómo crear una colección utilizando el esquema Solr predeterminado.

Creando la primera colección

Agregar el indexador Lily HBase

Cloudera Manager 4.7 también brinda soporte para Lily HBase Indexer incluido con el paquete SOLR. Lily HBase Indexer Service es un sistema flexible, escalable, tolerante a fallas, transaccional y casi en tiempo real para procesar un flujo continuo de actualizaciones de celdas HBase en índices de búsqueda en vivo. Para usarlo, agregue el servicio "Keystore Indexer" a través del "Asistente para agregar servicios".

Sin embargo, antes de que pueda usar Lily HBase Indexer, debe asegurarse de que la replicación y la indexación estén habilitadas en el servicio HBase en el clúster. Puede cambiar estas propiedades en la página de configuración del servicio HBase en la sección "Copia de seguridad".

Configuración de las propiedades de HBase para Lily HBase Indexer

Además, tenga en cuenta que Cloudera Manager incluye un archivo Cloudera Morphlines predeterminado que Lily HBase Indexer puede utilizar. Para modificar ese archivo para usar sus propias funciones, debe navegar al servicio Keystore Indexer y modificar la configuración de Morphlines como se muestra a continuación:

Edición de Cloudera Morphlines para Lily HBase Indexer

Una vez realizados estos cambios, puede comenzar a utilizar Lily HBase Indexer para indexar cualquier dato que entre en HBase siguiendo las instrucciones de la Guía del usuario de Lily HBase Indexer. . Esta publicación de blog también proporciona un excelente ejemplo de cómo indexar correos electrónicos usando HBase y Cloudera Search.

Conclusión

Ahora sabe lo fácil que es implementar, configurar y administrar un servicio de búsqueda de Cloudera en su clúster de CDH mediante Cloudera Manager. A partir de Cloudera Enterprise 5 (en versión beta en el momento de escribir este artículo), Cloudera Search y Lily HBase indexer se instalarán y se iniciarán de forma predeterminada, lo que facilitará aún más este proceso.

Vikram Srivastava es ingeniero de software en Cloudera.