La forma óptima en MongoDB versión 3.4.
Esta versión de mongod
proporciona el $split
operador que, por supuesto, dividió la cadena como se muestra aquí
.
Luego asignamos el valor recién calculado a una variable usando el $let
operador de variables El nuevo valor se puede usar en el in expresión para devolver los valores de "nombre" y "edad" usando el $arrayElemAt
operador para devolver el elemento en un índice especificado; 0
para el primer elemento y -1
para el último elemento.
Tenga en cuenta que en el en expresión necesitamos dividir el último elemento para devolver la cadena de entero.
Finalmente necesitamos iterar el Cursor
y convierta la cadena de entero a numérico usando Number
o parseInt
y use la operación masiva y bulkWrite()
método para $set
el valor de esos campos para una máxima eficiencia.
let requests = [];
db.coll.aggregate(
[
{ "$project": {
"person": {
"$let": {
"vars": {
"infos": { "$split": [ "$person", "," ] }
},
"in": {
"name": { "$arrayElemAt": [ "$$infos", 0 ] },
"age": {
"$arrayElemAt": [
{ "$split": [
{ "$arrayElemAt": [ "$$infos", -1 ] },
" "
]},
-1
]
}
}
}
}
}}
]
).forEach(document => {
requests.push({
"updateOne": {
"filter": { "_id": document._id },
"update": {
"$set": {
"name": document.person.name,
"age": Number(document.person.age)
},
"$unset": { "person": " " }
}
}
});
if ( requests.length === 500 ) {
// Execute per 500 ops and re-init
db.coll.bulkWrite(requests);
requests = [];
}}
);
// Clean up queues
if(requests.length > 0) {
db.coll.bulkWrite(requests);
}
MongoDB 3.2 o posterior.
MongoDB 3.2 desaprueba el antiguo Bulk()
API y sus métodos
asociados y proporciona el bulkWrite()
método pero no proporciona el $split
operador por lo que la única opción que tenemos aquí es usar el mapReduce()
método para transformar nuestros datos y luego actualizar la colección mediante una operación masiva.
var mapFunction = function() {
var person = {},
infos = this.person.split(/[,\s]+/);
person["name"] = infos[0];
person["age"] = infos[2];
emit(this._id, person);
};
var results = db.coll.mapReduce(
mapFunction,
function(key, val) {},
{ "out": { "inline": 1 } }
)["results"];
results.forEach(document => {
requests.push({
"updateOne": {
"filter": { "_id": document._id },
"update": {
"$set": {
"name": document.value.name,
"age": Number(document.value.age)
},
"$unset": { "person": " " }
}
}
});
if ( requests.length === 500 ) {
// Execute per 500 operations and re-init
db.coll.bulkWrite(requests);
requests = [];
}}
);
// Clean up queues
if(requests.length > 0) {
db.coll.bulkWrite(requests);
}
MongoDB versión 2.6 o 3.0.
Necesitamos usar la ahora obsoleta API masiva .
var bulkOp = db.coll.initializeUnorderedBulkOp();
var count = 0;
results.forEach(function(document) {
bulkOp.find({ "_id": document._id}).updateOne(
{
"$set": {
"name": document.value.name,
"age": Number(document.value.age)
},
"$unset": { "person": " " }
}
);
count++;
if (count === 500 ) {
// Execute per 500 operations and re-init
bulkOp.execute();
bulkOp = db.coll.initializeUnorderedBulkOp();
}
});
// clean up queues
if (count > 0 ) {
bulkOp.execute();
}