sql >> Base de Datos >  >> RDS >> Mysql

El texto en bengalí no se muestra en el archivo CSV Unicode

Según las respuestas a la pregunta Excel a CSV con codificación UTF8 , Google Docs debería guardar CSV correctamente, a diferencia de Excel, que destruye todos los caracteres que no se pueden representar en la codificación "ANSI" que se está utilizando. Pero tal vez cambiaron esto, o algo salió mal, o el análisis de la situación es incorrecto.

Para el bengalí (bengalí) correctamente codificado y procesado en los programas de MS Office, no debería haber necesidad de ninguna "fuente bengalí", ya que la fuente Arial Unicode MS (incluida con Office) contiene los caracteres bengalíes. Entonces, ¿los datos están realmente en una codificación no estándar que se basa en una fuente especialmente codificada? En ese caso, primero debe convertirse a Unicode, aunque posiblemente se pueda administrar de alguna manera usando programas que usen constantemente esa fuente específica.

En Excel, al usar Guardar como, puede seleccionar "Texto Unicode (*.txt)". Guarda los datos como TSV (valores separados por tabuladores) en codificación UTF-16. Luego, es posible que deba convertirlo para usar una coma como separador en lugar de una pestaña, y/o de UTF-16 a UTF-8. Pero esto solo funciona si los datos originales están codificados correctamente.