sql >> Base de Datos >  >> RDS >> Sqlserver

Cómo ignorar las etiquetas html en Sql Server 2008 Full Text Search

hay un filtro para archivos .htm y .html.

para ver si tienes el filtro instalado ejecuta este sql:

SELECT * FROM sys.fulltext_document_types

deberías ver:

.htm E0CA5340-4534-11CF-B952-00AA0051FE20 C:\Program Files\Microsoft SQL Server\MSSQL10.MSSQLSERVER\MSSQL\Binn\nlhtml.dll 12.0.6828.0 Microsoft Corporation

.html E0CA5340-4534-11CF-B952-00AA0051FE20 C:\Program Files\Microsoft SQL Server\MSSQL10.MSSQLSERVER\MSSQL\Binn\nlhtml.dll 12.0.6828.0 Microsoft Corporation

entonces, si puede convertir su columna de artículos a varbinary(max), entonces puede agregarle un índice de texto completo y especificar un tipo de documento de '.html'

una vez que se haya completado el índice, puede verificar las palabras clave usando este sql:

SELECT display_term, column_id, document_count
FROM sys.dm_fts_index_keywords
(DB_ID('your_db'), OBJECT_ID('your_table'))