sql >> Base de Datos >  >> NoSQL >> MongoDB

Reformar documentos dividiendo un valor de campo

La forma óptima en MongoDB versión 3.4.

Esta versión de mongod proporciona el $split operador que, por supuesto, dividió la cadena como se muestra aquí .

Luego asignamos el valor recién calculado a una variable usando el $let operador de variables El nuevo valor se puede usar en el in expresión para devolver los valores de "nombre" y "edad" usando el $arrayElemAt operador para devolver el elemento en un índice especificado; 0 para el primer elemento y -1 para el último elemento.

Tenga en cuenta que en el en expresión necesitamos dividir el último elemento para devolver la cadena de entero.

Finalmente necesitamos iterar el Cursor y convierta la cadena de entero a numérico usando Number o parseInt y use la operación masiva y bulkWrite() método para $set el valor de esos campos para una máxima eficiencia.

let requests = [];
db.coll.aggregate(
    [
        { "$project": {  
            "person": { 
                "$let": { 
                    "vars": { 
                        "infos":  { "$split": [ "$person", "," ] } 
                    }, 
                    "in": { 
                        "name": { "$arrayElemAt": [ "$$infos", 0 ] }, 
                        "age": { 
                            "$arrayElemAt": [ 
                                { "$split": [ 
                                    { "$arrayElemAt": [ "$$infos", -1 ] }, 
                                    " " 
                                ]}, 
                                -1 
                            ] 
                        } 
                    } 
                } 
            }  
        }}
    ] 
).forEach(document => { 
    requests.push({ 
        "updateOne": { 
            "filter": { "_id": document._id }, 
            "update": { 
                "$set": { 
                    "name": document.person.name, 
                    "age": Number(document.person.age) 
                },
                "$unset": { "person": " " }
            } 
        } 
    }); 
    if ( requests.length === 500 ) { 
        // Execute per 500 ops and re-init
        db.coll.bulkWrite(requests); 
        requests = []; 
    }} 
);

 // Clean up queues
if(requests.length > 0) {
    db.coll.bulkWrite(requests);
}

MongoDB 3.2 o posterior.

MongoDB 3.2 desaprueba el antiguo Bulk() API y sus métodos asociados y proporciona el bulkWrite() método pero no proporciona el $split operador por lo que la única opción que tenemos aquí es usar el mapReduce() método para transformar nuestros datos y luego actualizar la colección mediante una operación masiva.

var mapFunction = function() { 
    var person = {}, 
    infos = this.person.split(/[,\s]+/); 
    person["name"] = infos[0]; 
    person["age"] = infos[2]; 
    emit(this._id, person); 
};

var results = db.coll.mapReduce(
    mapFunction, 
    function(key, val) {}, 
    { "out": { "inline": 1 } }
)["results"];

results.forEach(document => { 
    requests.push({ 
        "updateOne": { 
            "filter": { "_id": document._id }, 
            "update": { 
                "$set": { 
                    "name": document.value.name, 
                    "age": Number(document.value.age) 
                }, 
                "$unset": { "person": " " }
            } 
        } 
    }); 
    if ( requests.length === 500 ) { 
        // Execute per 500 operations and re-init
        db.coll.bulkWrite(requests); 
        requests = []; 
    }} 
);

// Clean up queues
if(requests.length > 0) {
    db.coll.bulkWrite(requests);
}

MongoDB versión 2.6 o 3.0.

Necesitamos usar la ahora obsoleta API masiva .

var bulkOp = db.coll.initializeUnorderedBulkOp();
var count = 0;

results.forEach(function(document) { 
    bulkOp.find({ "_id": document._id}).updateOne(
        { 
            "$set": { 
                "name": document.value.name, 
                "age": Number(document.value.age)
            },
            "$unset": { "person": " " }
        }
    );
    count++;
    if (count === 500 ) {
        // Execute per 500 operations and re-init
        bulkOp.execute();
        bulkOp = db.coll.initializeUnorderedBulkOp();
    }
});

// clean up queues
if (count > 0 ) {
    bulkOp.execute();
}