sql >> Base de Datos >  >> RDS >> PostgreSQL

Búsqueda de texto completo de Postgresql para el idioma checo (sin configuración de idioma predeterminada)

Nunca lo he probado, pero debería poder crear un lematizador de Snowball checo siempre que esté listo para compilar PostgreSQL desde la fuente.

Hay una explicación en src/backend/snowball/README :

Ahora hay un stemmer checo Snowball disponible aquí , se contribuyó al proyecto. No hay un diccionario de palabras vacías disponible, pero estoy seguro de que puede encontrar uno o crear uno usted mismo.

El verdadero trabajo sería instalar Snowball y usar el compilador Snowball-to-C para crear los archivos C y de encabezado para agregar a la fuente de PostgreSQL. Estos archivos deberían permanecer estables, por lo que no debería ser difícil actualizar a un nuevo Versión PostgreSQL.

Si está dispuesto a hacer el trabajo, pero no desea parchear PostgreSQL y compilarlo desde el origen cada vez, también podría considerar enviar un parche a PostgreSQL. Mientras el lematizador funcione bien, no espero que encuentre mucha resistencia allí (pero el proceso de envío de parches sigue siendo tedioso).