sql >> Base de Datos >  >> RDS >> Sqlserver

¿Cómo eliminar filas duplicadas en SQL Server?

Me gustan las CTE y ROW_NUMBER como los dos combinados nos permiten ver qué filas se eliminan (o actualizan), por lo tanto, simplemente cambie DELETE FROM CTE... a SELECT * FROM CTE :

WITH CTE AS(
   SELECT [col1], [col2], [col3], [col4], [col5], [col6], [col7],
       RN = ROW_NUMBER()OVER(PARTITION BY col1 ORDER BY col1)
   FROM dbo.Table1
)
DELETE FROM CTE WHERE RN > 1

DEMO (el resultado es diferente; asumo que se debe a un error tipográfico de su parte)

COL1    COL2    COL3    COL4    COL5    COL6    COL7
john    1        1       1       1       1       1
sally   2        2       2       2       2       2

Este ejemplo determina duplicados por una sola columna col1 debido a la PARTITION BY col1 . Si desea incluir varias columnas, simplemente agréguelas a PARTITION BY :

ROW_NUMBER()OVER(PARTITION BY Col1, Col2, ... ORDER BY OrderColumn)