sql >> Base de Datos >  >> RDS >> Oracle

¿Cómo tomo el evento "siguiente" cuando el desplazamiento es variable para los elementos que se pueden procesar repetidamente?

Este es un problema de lagunas e islas, pero las islas están definidas por un REQ transacción lo hacen un poco más complicado que algunos.

Podría usar funciones anidadas de adelanto y atraso y alguna manipulación para obtener lo que necesita:

select distinct item,
  coalesce(start_tran,
    lag(start_tran) over (partition by item order by timestamp)) as start_tran,
  coalesce(end_tran,
    lead(end_tran) over (partition by item order by timestamp)) as end_tran,
  coalesce(end_time, 
    lead(end_time) over (partition by item order by timestamp))
    - coalesce(start_time,
        lag(start_time) over (partition by item order by timestamp)) as time
from (
  select item, timestamp, start_tran, start_time, end_tran, end_time
  from (
    select item,
      timestamp,
      case when lag_tran is null or transaction like 'REQ%'
        then transaction end as start_tran,
      case when lag_tran is null or transaction like 'REQ%'
        then timestamp end as start_time,
      case when lead_tran is null or lead_tran like 'REQ%'
        then transaction end as end_tran,
      case when lead_tran is null or lead_tran like 'REQ%'
        then timestamp end as end_time
    from (
      select item, transaction, timestamp,
        lag(transaction)
          over (partition by item order by timestamp) as lag_tran,
        lead(transaction)
          over (partition by item order by timestamp) as lead_tran
      from transactions
    )
  )
  where start_tran is not null or end_tran is not null
)
order by item, start_tran;

Con registros adicionales para un segundo ciclo para los ítems 1 y 2 que podrían dar:

      ITEM START_TRAN END_TRAN   TIME      
---------- ---------- ---------- -----------
         1 REQ-A      PICKUP     0 1:53:30.0 
         1 REQ-E      PICKUP     0 1:23:30.0 
         2 REQ-B      MAIL       0 0:24:13.0 
         2 REQ-F      REQ-F      0 0:0:0.0   
         3 REQ-C      PICKUP     0 1:46:30.0 
         4 REQ-D      PULL       0 0:23:59.0 
         5 REQ-A      PICKUP     0 1:43:59.0 

SQL Fiddle mostrando todos los pasos intermedios.

No es tan aterrador como podría parecer a primera vista. La consulta más interna toma los datos sin procesar y agrega una columna adicional para las transacciones de adelanto y atraso. Tomando solo el primer conjunto de registros del elemento 1, sería:

      ITEM TRANSACTION TIMESTAMP                LAG_TRAN   LEAD_TRAN
---------- ----------- ------------------------ ---------- ----------
         1 REQ-A       2014-07-31T09:51:32Z                PULL       
         1 PULL        2014-07-31T10:22:21Z     REQ-A      TRANSFER   
         1 TRANSFER    2014-07-31T10:22:23Z     PULL       ARRIVE     
         1 ARRIVE      2014-07-31T11:45:01Z     TRANSFER   PICKUP     
         1 PICKUP      2014-07-31T11:45:02Z     ARRIVE     REQ-E      

Aviso REQ-E apareciendo como el último lead_tran ? Esa es la primera transaction para el segundo ciclo de registros de este artículo, y será útil más adelante. El siguiente nivel de consulta utiliza esos valores de adelanto y retraso y trata REQ valores como marcadores de inicio y fin, y usa esa información para anular todo excepto el primer y último registro de cada ciclo.

      ITEM TIMESTAMP                START_TRAN START_TIME               END_TRAN   END_TIME               
---------- ------------------------ ---------- ------------------------ ---------- ------------------------
         1 2014-07-31T09:51:32Z     REQ-A      2014-07-31T09:51:32Z                                         
         1 2014-07-31T10:22:21Z                                                                             
         1 2014-07-31T10:22:23Z                                                                             
         1 2014-07-31T11:45:01Z                                                                             
         1 2014-07-31T11:45:02Z                                         PICKUP     2014-07-31T11:45:02Z     

El siguiente nivel de consulta elimina las filas que no representan el inicio o el final (o ambos; consulte REQ-F in the Fiddle) ya que no estamos interesados ​​en ellos:

      ITEM TIMESTAMP                START_TRAN START_TIME               END_TRAN   END_TIME               
---------- ------------------------ ---------- ------------------------ ---------- ------------------------
         1 2014-07-31T09:51:32Z     REQ-A      2014-07-31T09:51:32Z                                         
         1 2014-07-31T11:45:02Z                                         PICKUP     2014-07-31T11:45:02Z     

Ahora tenemos pares de filas para cada ciclo (o una sola fila para REQ-F ). El nivel final utiliza de nuevo el adelanto y el atraso para llenar los espacios en blanco; si el start_tran es nulo, entonces esta es una fila final y debemos usar los datos de inicio de la fila anterior; si end_tran es nulo, entonces esta es una fila de inicio y debemos usar los datos finales de la siguiente fila.

  ITEM START_TRAN START_TIME               END_TRAN   END_TIME                 TIME      
     1 REQ-A      2014-07-31T09:51:32Z     PICKUP     2014-07-31T11:45:02Z     0 1:53:30.0 
     1 REQ-A      2014-07-31T09:51:32Z     PICKUP     2014-07-31T11:45:02Z     0 1:53:30.0 

Eso hace que ambas filas sean iguales, por lo que distinct elimina los duplicados.