El mongoimport
la herramienta tiene una opción:
--jsonArray
tratar la fuente de entrada como una matriz JSON
O es posible importar desde un archivo que contiene el mismo formato de datos como resultado de db.collection.find()
dominio. Aquí hay un ejemplo de material didáctico university.mongodb.com, algo de contenido de grades.json
:
{ "_id" : { "$oid" : "50906d7fa3c412bb040eb577" }, "student_id" : 0, "type" : "exam", "score" : 54.6535436362647 }
{ "_id" : { "$oid" : "50906d7fa3c412bb040eb578" }, "student_id" : 0, "type" : "quiz", "score" : 31.95004496742112 }
{ "_id" : { "$oid" : "50906d7fa3c412bb040eb579" }, "student_id" : 0, "type" : "homework", "score" : 14.8504576811645 }
Como puede ver, no se utilizó matriz ni delimitadores de coma entre documentos.
Descubrí, recientemente, que esto cumple con the JSON Lines text
formato.
Como uno usado en apache.spark.sql.DataFrameReader.json()
método.