Lo sentimos, José, porque tienes un problema con el conector.
Puede encontrar información sobre particiones en el sitio de documentación del conector Spark . Presente un ticket en el Docs jira project si siente que falta algo o que no está claro, ¡realmente podría ayudar a futuros usuarios!
El particionador predeterminado es un envoltorio delgado alrededor del MongoSamplePartitioner
. Divide una colección en particiones de tamaño según el muestreo estadístico de la colección.
El MongoShardedPartitioner
usa la shardKey
para generar las particiones. Por defecto usará _id
como la clave. Es posible que deba configurar ese valor.
MongoShardedPartitioner
ya que actualmente no hay forma de consultar una colección contra el valor hash, por lo que al recuperar particiones no podrá devolver resultados. He agregado DOCS-12345
para actualizar la documentación.
Parece que hay un problema en su configuración donde MongoShardedPartitioner
no puede particionar la colección como se esperaba y devuelve 0 resultados. La inferencia de esquema seguirá funcionando debido a cómo consulta la colección. Si no se trata de un problema de configuración/clave fragmentada con hash, envíe un error en el proyecto Spark jira y puedo ayudar a identificar la causa y publicar una solución para usted.