sql >> Base de Datos >  >> RDS >> Oracle

Extender el mapeo de plegamiento diacrítico de Endeca

En la documentación que proporcionas dice:

Esto sugiere que el griego no es compatible, ya que no se incluye en ninguno de estos conjuntos de caracteres (creo que el griego es Latin-7). Dicho esto, podría intentar configurar un indicador de idioma en un nivel de registro (ya que indica que sus datos incluyen tanto inglés como griego) asumiendo que cada idioma tiene su propio registro o intentar implementar un idioma global usando el dgidx y dgraph parámetros, pero esto afectará cosas como la lematización de registros o propiedades que no estén en el idioma global.

dgidx --lang el
dgraph --lang el

Aunque no estoy seguro de que funcione según la declaración original.

Alternativamente, puede implementar un proceso de eliminación de signos diacríticos usando un Accessor personalizado , que amplía el atg.repository.search.indexing.PropertyAccessorImpl class (una opción ya que te refieres a Nucleus , así que asumo que está utilizando ATG/Oracle Commerce). Al usar esto, especifica un campo de búsqueda normalizado en su índice que duplica los campos de búsqueda en su índice actual pero ahora con todos los signos diacríticos eliminados. La misma lógica que aplica en el Accessor luego debe aplicarse como un preprocesador en sus términos de búsqueda para que normalice la entrada para que coincida con los valores indexados. Por último, haga que sus campos originales en el índice (con los caracteres acentuados) sean de solo visualización y que los campos normalizados se puedan buscar (pero no los muestre).

El resultado coincidirá con su texto normalizado, pero la desventaja es que tiene datos duplicados, por lo que su índice será más grande. No es un gran problema con pequeños conjuntos de datos. También puede haber un impacto en cómo se comporta la funcionalidad OOTB, como la derivación, con el conjunto de datos normalizados. Tendrá que hacer algunas pruebas con varios escenarios en griego e inglés para ver si la precisión y la recuperación se ven afectadas negativamente.