elección de clasificación de tablas para caracteres universales

...general_ci es simple. No equipara combinaciones de 2 caracteres (como con una marca sin espacio) con el equivalente de un solo carácter.
...unicode_520_ci proviene de la versión 5.20 de Unicode, la última versión disponible cuando MySQL la detectó. Maneja cosas como tener un pedido de Emoji, que las versiones anteriores no tenían.
Con MySQL 8.0, la intercalación preferida es utf8mb4_0900_ai_ci , basado en Unicode 9.0.
...<language>_ci maneja las variaciones encontradas en el idioma dado. Por ejemplo, debería ch y ll en español se tratarán como "letras" y se ordenarán entre cz y d y lz y m .
Para uso general, no use ...general_ci , use la última versión derivada de Unicode. Para situaciones específicas del idioma, elija una de las otras intercalaciones.
Sé cómo (o incluso si) el chino y el árabe se clasifican de manera diferente en las diferentes intercalaciones. Sin embargo, veo ...persion_ci , por lo que sospecho que hay un problema.
Usa utf8mb4 , no utf8 , especialmente porque necesitas chino.