sql >> Base de Datos >  >> RDS >> Sqlserver

Datos de idioma japonés/chino en la tabla de SQL Server

La intercalación solo afecta el orden de clasificación, no la codificación. Debe determinar cuál es la codificación de su contenido en chino y japonés (consulte esto ). Si no es UCS-2, tiene un problema (ya que no puede admitir codificaciones de varias páginas al mismo tiempo). Si es UCS-2, debe asegurarse de que la codificación de su página ASP también esté configurada en UTF-8 (y que el navegador lo reconozca configurando correctamente la codificación en UTF-8; consulte Ver/Codificar).

O en términos más simples:si la aplicación que creó el contenido no usó caracteres Unicode, tendrá que cambiar la codificación de la página si cambia entre caracteres chinos, japoneses y europeos.

Si ha codificado correctamente el contenido Unicode en su base de datos y usa la codificación UTF-8 en sus páginas, no debería tener problemas para mostrar caracteres especiales (siempre que use una fuente Unicode en la página):

<meta http-equiv="Content-Type" content="text/html; charset=utf-8" />

Me doy cuenta de que después de varias ediciones no estoy siendo muy claro, así que permítanme agregar algunos conceptos básicos.

Un conjunto de caracteres es una representación estandarizada de un conjunto de caracteres (por ejemplo, ASCII, UNICODE, ...).

La codificación de caracteres es la representación binaria utilizada para almacenar caracteres de un conjunto de caracteres determinado. ASCII tiene su propia codificación. Unicode, que es un conjunto de caracteres muy grande diseñado para admitir todos los caracteres existentes, tiene varias codificaciones (UTF-8, UTF-16, UCS-2, ...).

Solo Unicode le brinda la capacidad de admitir contenido occidental y del Lejano Oriente al mismo tiempo con la misma base de datos y configuración de aplicación. Sin embargo, existen conjuntos de caracteres más antiguos para los idiomas chino y japonés que no son Unicode. Si su contenido no es Unicode (BIG 5, por ejemplo), no puede mostrarlo en una página web codificada en UTF-8.

Esto puede volverse complicado si la aplicación que creó el contenido usó una codificación (por ejemplo, BIG-5) y la base de datos lo almacenó como datos Unicode. Si esto sucede, la información podría haberse perdido.

Incluso hay que instalar los paquetes de idioma correspondientes en Windows para poder ver los caracteres correctamente. Desafortunadamente, los problemas de codificación no son fáciles de diagnosticar.