sql >> Base de Datos >  >> NoSQL >> MongoDB

¿Cómo normalizar/reducir los datos de tiempo en mongoDB?

Así es como podría hacerlo en el marco de agregación. Estoy usando una pequeña simplificación:solo estoy agrupando en Año, Mes y Fecha; en su caso, deberá agregar la hora y los minutos para los cálculos más detallados. También tiene la opción de hacer un promedio ponderado si la distribución de puntos no es uniforme en la muestra de datos que obtiene.

project={"$project" : {
        "year" : {
            "$year" : "$DateTime"
        },
        "month" : {
            "$month" : "$DateTime"
        },
        "day" : {
            "$dayOfWeek" : "$DateTime"
        },
        "array_serial" : 1,
        "Port Name" : 1,
        "metric" : 1
    }
};
group={"$group" : {
        "_id" : {
            "a" : "$array_serial",
            "P" : "$Port Name",
            "y" : "$year",
            "m" : "$month",
                    "d" : "$day"
        },
        "avgMetric" : {
            "$avg" : "$metric"
        }
    }
};

db.metrics.aggregate([project, group]).result

Ejecuté esto con algunos datos de muestra aleatorios y obtuve algo con este formato:

[
    {
        "_id" : {
            "a" : "12345",
            "P" : "CL1-B",
            "y" : 2012,
            "m" : 9,
            "d" : 6
        },
        "avgMetric" : 100.8
    },
    {
        "_id" : {
            "a" : "12345",
            "P" : "CL1-B",
            "y" : 2012,
            "m" : 9,
            "d" : 7
        },
        "avgMetric" : 98
    },
    {
        "_id" : {
            "a" : "12345",
            "P" : "CL1-A",
            "y" : 2012,
            "m" : 9,
            "d" : 6
        },
        "avgMetric" : 105
    }
]

Como puede ver, este es un resultado por array_serial, nombre de puerto, combinación de año/mes/fecha. Puede usar $sort para colocarlos en el orden en el que desea procesarlos desde allí.

Así es como extendería el paso del proyecto para incluir la hora y los minutos mientras redondea los minutos para promediar cada cinco minutos:

{
    "$project" : {
        "year" : {
            "$year" : "$DateTime"
        },
        "month" : {
            "$month" : "$DateTime"
        },
        "day" : {
            "$dayOfWeek" : "$DateTime"
        },
        "hour" : {
            "$hour" : "$DateTime"
        },
        "fmin" : {
            "$subtract" : [
                {
                    "$minute" : "$DateTime"
                },
                {
                    "$mod" : [
                        {
                            "$minute" : "$DateTime"
                        },
                        5
                    ]
                }
            ]
        },
        "array_serial" : 1,
        "Port Name" : 1,
        "metric" : 1
    }
}

Espero que pueda ampliarlo a sus datos y requisitos específicos.