En Linux podrías usar el iconv
comando como se sugiere en: Cómo eliminar caracteres que no sean UTF-8 del archivo de texto
iconv -f utf8 -t utf8 -c file.txt
No estoy familiarizado con MongoDB, por lo que no sé cómo conservar los caracteres no válidos durante la importación.