sql >> Base de Datos >  >> RDS >> Mysql

Índice de palabras PHP, rendimiento y resultados razonables

Obtenga una lista de palabras vacías (no palabras clave) de aquí, el chico incluso las ha formateado en php para usted.http://armandbrahaj.blog.al/2009/04/14/list-of-english-stop-words/

Luego simplemente haga un preg_replace en la cadena que está indexando.

Lo que he hecho en el pasado es eliminar sufijos como 's', 'ed', etc. con expresiones regulares y usar la misma expresión regular en la cadena de búsqueda. Aunque no es ideal. Esto era para un sitio web básico con solo 200 páginas.

Si le preocupa el rendimiento, puede considerar usar un motor de búsqueda como Lucine (solr) en lugar de una base de datos. Esto hará que la indexación sea mucho más fácil. No querrás reinventar la rueda aquí.