sql >> Base de Datos >  >> NoSQL >> MongoDB

Hadoop HDFS MapReduce salida en MongoDb

Quieres «Conector MongoDB para Hadoop» . Los ejemplos .

Es tentador simplemente agregar código en su Reducer que, como efecto secundario, inserta datos en su base de datos. Evita esta tentación. Una razón para usar un conector en lugar de solo insertar datos como un efecto secundario de su clase de reducción es la ejecución especulativa:Hadoop a veces puede ejecutar dos tareas de reducción exactamente iguales en paralelo, lo que puede generar inserciones extrañas y datos duplicados.