Hvordan kan jeg fjerne dupliserte rader?

Question

Mer

Seibar

Spørsmål

Hvordan kan jeg fjerne dupliserte rader?

Hva er den beste måten å fjerne dupliserte rader fra en ganske stor SQL Server-tabell (dvs. 300 000+ rader)?

Radene vil selvfølgelig ikke være perfekte duplikater på grunn av eksistensen av RowID-identitetsfeltet.

MinTabell

RowID int not null identity(1,1) primary key,
Col1 varchar(20) not null,
Col2 varchar(2048) not null,
Col3 tinyint not null

DineshDB

Redigerte spørsmål 28. mars 2018 в 10:48

tsql

Løsning / svar

20. august 2008 в 9:53

Mer

Det er en god artikkel om fjerning av duplikater på Microsoft Support-nettstedet. Det er ganske konservativt - de får deg til å gjøre alt i separate trinn - men det skal fungere bra mot store tabeller.

I've brukt self-joins for å gjøre dette i det siste, selv om det kan sannsynligvis være pyntet opp med en HAVING klausul:

DELETE dupes
FROM MyTable dupes, MyTable fullTable
WHERE dupes.dupField = fullTable.dupField 
AND dupes.secondDupField = fullTable.secondDupField 
AND dupes.uniqueField > fullTable.uniqueField

Ivan Yurchenko

Redigert svar 19. juni 2017 в 11:36

Remove duplicate rows from a table in SQL Server - SQL Server | Microsoft Learn

This article provides a script that you can use to remove duplicate rows from a SQL Server table.

support.microsoft.com

146

0

Legg til spørsmål

Kategorier

Alle

Teknologi

Kultur / Fritid

Liv / Kunst

Vitenskap

Profesjonell

Virksomhet

Brukere

Alle

New

Popular

1

Ксения Комарова

Registered 2 uker siden

2

Артур «Апер»

Registered 1 måned siden

3

Viktor Malyutin

Registered 2 måneder siden

4

Viktor Malyutin

Registered 2 måneder siden

5

Syahputra Zhedenk

Registered 2 måneder siden

Do you have a question? Add it on the site and get an answer instantly

en.kzen.dev

Mark Brackett · Accepted Answer · 2008-08-20T22:00:00+00:00

Forutsatt at det ikke er noen null, GROUP BY de unike kolonnene, og SELECT MIN (eller MAX) RowId som raden som skal beholdes. Deretter er det bare å slette alt som ikke hadde en rad-ID:

DELETE FROM MyTable
LEFT OUTER JOIN (
   SELECT MIN(RowId) as RowId, Col1, Col2, Col3 
   FROM MyTable 
   GROUP BY Col1, Col2, Col3
) as KeepRows ON
   MyTable.RowId = KeepRows.RowId
WHERE
   KeepRows.RowId IS NULL

Hvis du har en GUID i stedet for et heltall, kan du bytte ut

MIN(RowId)

med

CONVERT(uniqueidentifier, MIN(CONVERT(char(36), MyGuidColumn)))