sql >> Base de Datos >  >> RDS >> Sqlserver

Búsqueda de texto completo (FTS) de SQL Server 2008 frente a Lucene.NET

SQL Server FTS será más fácil de administrar para una implementación pequeña. Dado que FTS está integrado con la base de datos, el RDBMS maneja la actualización del índice automáticamente. La desventaja aquí es que no tiene una solución de escalado obvia que no sea la replicación de bases de datos. Entonces, si no necesita escalar, SQL Server FTS es probablemente "más seguro". Políticamente, la mayoría de las tiendas se sentirán más cómodas con una solución pura de SQL Server.

Del lado de Lucene, preferiría SOLR sobre Lucene directo. Con cualquiera de las soluciones, usted mismo debe trabajar más actualizando el índice cuando los datos cambian, así como asignando datos usted mismo al índice SOLR/Lucene. Las ventajas son que puede escalar fácilmente agregando índices adicionales. Puede ejecutar estos índices en servidores Linux muy eficientes, lo que elimina algunos costos de licencia. Si toma la ruta Lucene/SOLR, intentaría poner TODOS los datos que necesita directamente en el índice, en lugar de volver a poner punteros en la base de datos en el índice. Puede incluir datos en el índice que no se pueden buscar, por ejemplo, podría tener HTML o XML preconstruido almacenado en el índice y servirlo como resultado de búsqueda. Con este enfoque, su base de datos podría estar inactiva, pero aún puede mostrar resultados de búsqueda en un modo desconectado.

Nunca he visto una comparación directa de rendimiento entre SQL Server 2008 y Lucene, pero me encantaría ver una.