sql >> Base de Datos >  >> RDS >> Mysql

¿Qué intercalación de MySQL es mejor para aceptar todos los caracteres Unicode?

La colección es la menor de tus preocupaciones, en lo que debes pensar es en el conjunto de personajes para la columna/tabla/base de datos. La intercalación (reglas que rigen cómo se comparan los datos y ordenado ) es solo un corolario de eso.

MySQL admite varios juegos de caracteres Unicode, utf8 y utf8mb4 siendo el más interesante. utf8 admite caracteres Unicode en el BMP , es decir, un subconjunto de todo Unicode. utf8mb4 , disponible desde MySQL 5.5.3, admite todos de Unicode.

La colección lo más probable es que se use con cualquiera de las codificaciones Unicode xxx_general_ci o xxx_unicode_ci . El primero es un algoritmo general de clasificación y comparación independiente del idioma, el segundo es un más completo algoritmo independiente del idioma que admite más funciones Unicode (por ejemplo, tratar "ß" y "ss" como equivalentes), pero por lo tanto también es más lento.

Consulte https://dev.mysql.com/ doc/refman/5.5/en/charset-unicode-sets.html .