¿Cómo puedo eliminar las filas duplicadas?

Question

Más

Question

¿Cómo puedo eliminar las filas duplicadas?

¿Cuál es la mejor manera de eliminar las filas duplicadas de una tabla bastante grande de SQL Server (es decir, más de 300.000 filas)?

Las filas, por supuesto, no serán duplicados perfectos debido a la existencia del campo de identidad RowID.

MiTabla

RowID int not null identity(1,1) primary key,
Col1 varchar(20) not null,
Col2 varchar(2048) not null,
Col3 tinyint not null

DineshDB

Pregunta editada 28º marzo 2018 в 10:48

Programación

sql-server

tsql

duplicates

Popular videos

« Anterior

Jon Galloway

20º agosto 2008 в 9:53

Más

Hay un buen artículo sobre eliminar duplicados en el sitio de soporte de Microsoft. Es bastante conservador - te hacen hacer todo en pasos separados - pero debería funcionar bien contra tablas grandes.

En el pasado he utilizado autouniones para hacer esto, aunque probablemente se podría mejorar con una cláusula HAVING:

DELETE dupes
FROM MyTable dupes, MyTable fullTable
WHERE dupes.dupField = fullTable.dupField 
AND dupes.secondDupField = fullTable.secondDupField 
AND dupes.uniqueField > fullTable.uniqueField

Ivan Yurchenko

Respuesta editada 19º junio 2017 в 11:36

Remove duplicate rows from a table in SQL Server - SQL Server | Microsoft Learn

This article provides a script that you can use to remove duplicate rows from a SQL Server table.

support.microsoft.com

146

0

Comunidades relacionadas 2

SQL

852 usuarios

Grupo para gente seria e interesada en el lenguaje SQL. También NoSQL. Como medida para evitar el SPAM, para unirse a este grupo es necesario rellenar un Captcha. https://telegram.me/joinchat/AGFygUDuqou03Lr4jixWbA https://telegram.me/esequele

259 usuarios

Categorías

Todo

Tecnología

Cultura / Recreación

Vida / Artes

Ciencia

Profesional

Negocios

Usuarios

Todo

Nuevo

Popular

1

Ксения Комарова

Registrado hace 3 semanas

2

Артур «Апер»

Registrado hace 2 meses

3

Viktor Malyutin

Registrado hace 2 meses

4

Viktor Malyutin

Registrado hace 2 meses

5

Syahputra Zhedenk

Registrado hace 2 meses

¿Tiene alguna pregunta? Añádela en el sitio y obtén una respuesta al instante

es.kzen.dev

Mark Brackett · Accepted Answer · 2008-08-20T22:00:00+00:00

Asumiendo que no hay nulos, usted Grupa por las columnas únicas, y Selecciona el MIN (o MAX) RowId como la fila a mantener. Luego, simplemente borre todo lo que no tenga un ID de fila:

DELETE FROM MyTable
LEFT OUTER JOIN (
   SELECT MIN(RowId) as RowId, Col1, Col2, Col3 
   FROM MyTable 
   GROUP BY Col1, Col2, Col3
) as KeepRows ON
   MyTable.RowId = KeepRows.RowId
WHERE
   KeepRows.RowId IS NULL

En caso de que tenga un GUID en lugar de un entero, puede reemplazar

MIN(RowId)

por

CONVERT(uniqueidentifier, MIN(CONVERT(char(36), MyGuidColumn)))