sql >> Base de Datos >  >> RDS >> Oracle

Cualquier problema con el uso de Windows-1252 en lugar de UTF-8

Windows 1252 es uno de los muchos conjuntos de caracteres de tamaño fijo. Mac tiene su propio conjunto. hay algunos ISO para varias partes de Europa y para algunas otras partes del mundo. La mayoría de ellos tienen ligeras variaciones.

Lo bueno es que tiene un carácter de tamaño fijo, lo que significa que 1 carácter =1 byte, pase lo que pase.

Los puntos negativos son:

  • Es posible que algunas personas no tengan su codificación instalada
  • Algunas personas pueden usar una codificación ligeramente diferente, lo que resulta en muy pocos problemas, no obvios a la vista, pero muy desagradables a largo plazo
  • Solo puede admitir algunos idiomas

Eso incluye cualquier cita que le gustaría hacer. En Windows-1252 no puede mostrar ruso, griego, polaco...

UTF-8 es la codificación estándar para la representación Unicode en más de 1 byte. Puede representar una gran mayoría de los caracteres que puede encontrar, aunque está diseñado para idiomas latinos, ya que otros idiomas ocupan más espacio de almacenamiento.

Se utiliza en XML, JSON y la mayoría de los tipos de servicios web que pueda encontrar. Es un buen valor predeterminado cuando no sabe qué codificación usar. Permite limitar la cantidad de problemas de codificación, como "Pensé que estabas en Latin-1 / No, estaba usando latin-9, pero luego este tipo en Mac usó Roman". Si tiene más de 1 personas trabajando en el contenido del sitio web, es posible que tengan diferentes codificaciones en su plataforma y, por lo tanto, su contenido puede estar desordenado en algún momento.

UTF-8 es, hasta donde yo sé, la única forma de estandarizar fácilmente la codificación utilizada entre personas sin discusión.

Un ejemplo típico es que si su sitio web está codificado en Windows1252 y el nuevo desarrollador tiene una Mac, probablemente tendrá problemas.