La forma más eficiente de hacer esto es omitir $unwind
en total y simplemente $group
para contar. Esencialmente, las matrices de "filtro" obtienen el $size
de los resultados a $sum
:
db.objects.aggregate([
{ "$match": {
"createddate": {
"$gte": ISODate("2015-08-30T00:00:00.000Z")
},
"activity.action": "test_action"
}},
{ "$group": {
"_id": null,
"count": {
"$sum": {
"$size": {
"$setDifference": [
{ "$map": {
"input": "$activity",
"as": "el",
"in": {
"$cond": [
{ "$eq": [ "$$el.action", "test_action" ] },
"$$el",
false
]
}
}},
[false]
]
}
}
}
}}
])
Las versiones futuras de MongoDB tendrán $filter
, lo que hace que esto sea mucho más simple:
db.objects.aggregate([
{ "$match": {
"createddate": {
"$gte": ISODate("2015-08-30T00:00:00.000Z")
},
"activity.action": "test_action"
}},
{ "$group": {
"_id": null,
"count": {
"$sum": {
"$size": {
"$filter": {
"input": "$activity",
"as": "el",
"cond": {
"$eq": [ "$$el.action", "test_action" ]
}
}
}
}
}
}}
])
Usando $unwind
hace que los documentos se desnormalicen y crea efectivamente una copia por entrada de matriz. Siempre que sea posible, debe evitar esto debido al costo a menudo extremo. En comparación, filtrar y contar las entradas de la matriz por documento es mucho más rápido. Como es un simple $match
y $group
canalización en comparación con muchas etapas.