sql >> Base de Datos >  >> NoSQL >> MongoDB

Mongodb cuenta todos los elementos de la matriz en todos los objetos que coinciden con los criterios

La forma más eficiente de hacer esto es omitir $unwind en total y simplemente $group para contar. Esencialmente, las matrices de "filtro" obtienen el $size de los resultados a $sum :

db.objects.aggregate([
    { "$match": {
        "createddate": {
            "$gte": ISODate("2015-08-30T00:00:00.000Z")
        },
        "activity.action": "test_action"
    }},
    { "$group": {
        "_id": null,
        "count": {
            "$sum": {
                "$size": {
                    "$setDifference": [
                        { "$map": {
                            "input": "$activity",
                            "as": "el",
                            "in": {
                                "$cond": [ 
                                    { "$eq": [ "$$el.action", "test_action" ] },
                                    "$$el",
                                    false
                                ]
                            }               
                        }},
                        [false]
                    ]
                }
            }
        }
    }}
])

Las versiones futuras de MongoDB tendrán $filter , lo que hace que esto sea mucho más simple:

db.objects.aggregate([
    { "$match": {
        "createddate": {
            "$gte": ISODate("2015-08-30T00:00:00.000Z")
        },
        "activity.action": "test_action"
    }},
    { "$group": {
        "_id": null,
        "count": {
            "$sum": {
                "$size": {
                    "$filter": {
                        "input": "$activity",
                        "as": "el",
                        "cond": {
                            "$eq": [ "$$el.action", "test_action" ]
                        }
                    }
                }
            }
        }
    }}
])

Usando $unwind hace que los documentos se desnormalicen y crea efectivamente una copia por entrada de matriz. Siempre que sea posible, debe evitar esto debido al costo a menudo extremo. En comparación, filtrar y contar las entradas de la matriz por documento es mucho más rápido. Como es un simple $match y $group canalización en comparación con muchas etapas.