sql >> Base de Datos >  >> RDS >> Mysql

¿Cuál es la aplicación de búsqueda de sitios más fácil de implementar que admite la búsqueda difusa?

La respuesta de ewemli está en la dirección correcta, pero debe combinar FULLTEXT y el mapeo de soundex, no reemplazar el texto completo, de lo contrario, es probable que sus consultas LIKE sean muy lentas.

create table with_soundex (
  id INT UNSIGNED AUTO_INCREMENT NOT NULL PRIMARY KEY,
  original TEXT,
  soundex TEXT,
  FULLTEXT (soundex)
);

insert into with_soundex (original, soundex) values 

('add some test cases', CONCAT_WS(' ', soundex('add'), soundex('some'), soundex('test'), soundex('cases'))),
('this is some text', CONCAT_WS(' ', soundex('this'), soundex('is'), soundex('some'), soundex('text'))),
('one more test case', CONCAT_WS(' ', soundex('one'), soundex('more'), soundex('test'), soundex('case'))),
('just filling the index', CONCAT_WS(' ', soundex('just'), soundex('filling'), soundex('the'), soundex('index'))),
('need one more example', CONCAT_WS(' ', soundex('need'), soundex('one'), soundex('more'), soundex('example'))),
('seems to need more', CONCAT_WS(' ', soundex('seems'), soundex('to'), soundex('need'), soundex('more')))
('some helpful cases to consider', CONCAT_WS(' ', soundex('some'), soundex('helpful'), soundex('cases'), soundex('to'), soundex('consider')))

select * from with_soundex where match(soundex) against (soundex('test'));
+----+---------------------+---------------------+
| id | original            | soundex             |
+----+---------------------+---------------------+
|  1 | add some test cases | A300 S500 T230 C000 | 
|  2 | this is some text   | T200 I200 S500 T230 | 
|  3 | one more test case  | O500 M600 T230 C000 | 
+----+---------------------+---------------------+

select * from with_soundex where match(soundex) against (CONCAT_WS(' ', soundex('test'), soundex('some')));
+----+--------------------------------+---------------------------+
| id | original                       | soundex                   |
+----+--------------------------------+---------------------------+
|  1 | add some test cases            | A300 S500 T230 C000       | 
|  2 | this is some text              | T200 I200 S500 T230       | 
|  3 | one more test case             | O500 M600 T230 C000       | 
|  7 | some helpful cases to consider | S500 H414 C000 T000 C5236 | 
+----+--------------------------------+---------------------------+

Eso da resultados bastante buenos (dentro de los límites del algoritmo soundex) mientras aprovecha al máximo un índice (cualquier consulta COMO '%foo' tiene que escanear cada fila de la tabla).

Tenga en cuenta la importancia de ejecutar soundex en cada palabra, no en la frase completa. También puede ejecutar su propia versión de soundex en cada palabra en lugar de que SQL lo haga, pero en ese caso asegúrese de hacerlo tanto al almacenar como al recuperar en caso de que haya diferencias entre los algoritmos (por ejemplo, el algoritmo de MySQL no limita sí mismo al estándar 4 caracteres )