sql >> Base de Datos >  >> RDS >> Mysql

Cuente el número de filas en contenedores de 30 días

Sin procedimientos almacenados, tablas temporales, solo una consulta y un plan de ejecución eficiente dado un índice en la columna de fecha:

select

  subdate(
    '2012-12-31',
    floor(dateDiff('2012-12-31', dateStampColumn) / 30) * 30 + 30 - 1
  ) as "period starting",

  subdate(
    '2012-12-31',
    floor(dateDiff('2012-12-31', dateStampColumn) / 30) * 30
  ) as "period ending",

  count(*)

from
  YOURTABLE
group by floor(dateDiff('2012-12-31', dateStampColumn) / 30);

Debería ser bastante obvio lo que está sucediendo aquí, excepto por este encantamiento:

floor(dateDiff('2012-12-31', dateStampColumn) / 30)

Esa expresión aparece varias veces y se evalúa como la cantidad de períodos de 30 días atrás dateStampColumn es. dateDiff devuelve la diferencia en días, se divide por 30 para obtenerlo en períodos de 30 días y se envía todo a floor() para redondearlo a un número entero. Una vez que tengamos este número, podemos GROUP BY y luego hacemos un poco de matemáticas para traducir este número a las fechas de inicio y finalización del período.

Reemplazar '2012-12-31' con now() si tu prefieres. Aquí hay algunos datos de muestra:

CREATE TABLE YOURTABLE
    (`Id` int, `dateStampColumn` datetime);

INSERT INTO YOURTABLE
    (`Id`, `dateStampColumn`)
VALUES
    (1, '2012-10-15 02:00:00'),
    (1, '2012-10-17 02:00:00'),
    (1, '2012-10-30 02:00:00'),
    (1, '2012-10-31 02:00:00'),
    (1, '2012-11-01 02:00:00'),
    (1, '2012-11-02 02:00:00'),
    (1, '2012-11-18 02:00:00'),
    (1, '2012-11-19 02:00:00'),
    (1, '2012-11-21 02:00:00'),
    (1, '2012-11-25 02:00:00'),
    (1, '2012-11-25 02:00:00'),
    (1, '2012-11-26 02:00:00'),
    (1, '2012-11-26 02:00:00'),
    (1, '2012-11-24 02:00:00'),
    (1, '2012-11-23 02:00:00'),
    (1, '2012-11-28 02:00:00'),
    (1, '2012-11-29 02:00:00'),
    (1, '2012-11-30 02:00:00'),
    (1, '2012-12-01 02:00:00'),
    (1, '2012-12-02 02:00:00'),
    (1, '2012-12-15 02:00:00'),
    (1, '2012-12-17 02:00:00'),
    (1, '2012-12-18 02:00:00'),
    (1, '2012-12-19 02:00:00'),
    (1, '2012-12-21 02:00:00'),
    (1, '2012-12-25 02:00:00'),
    (1, '2012-12-25 02:00:00'),
    (1, '2012-12-26 02:00:00'),
    (1, '2012-12-26 02:00:00'),
    (1, '2012-12-24 02:00:00'),
    (1, '2012-12-23 02:00:00'),
    (1, '2012-12-31 02:00:00'),
    (1, '2012-12-30 02:00:00'),
    (1, '2012-12-28 02:00:00'),
    (1, '2012-12-28 02:00:00'),
    (1, '2012-12-30 02:00:00');

Y el resultado:

period starting     period ending   count(*)
2012-12-02          2012-12-31      17
2012-11-02          2012-12-01      14
2012-10-03          2012-11-01      5

los puntos finales del período son inclusivos.

Juega con esto en SQL Fiddle .

Hay un poco de tontería potencial en el sentido de que cualquier período de 30 días con cero filas coincidentes no se incluirá en el resultado. Si pudiera unir esto con una tabla de períodos, eso podría eliminarse. Sin embargo, MySQL no tiene nada como generate_series() , por lo que tendría que tratarlo en su aplicación o probar este ingenioso truco .