Hur kan jag ta bort dubbla rader?

Question

Mer

Seibar

Question

Hur kan jag ta bort dubbla rader?

Vilket är det bästa sättet att ta bort dubbla rader från en ganska stor SQL Server tabell (dvs. 300 000+ rader)?

Raderna kommer naturligtvis inte att vara perfekta dubbletter eftersom identitetsfältet RowID finns.

MyTable

RowID int not null identity(1,1) primary key,
Col1 varchar(20) not null,
Col2 varchar(2048) not null,
Col3 tinyint not null

DineshDB

Redigerad fråga 2018ör mars 2018 в 10:48

Programmering

sql-server

tsql

duplicates

Popular videos

« Föregående

Nästa »

Solution / Answer

Jon Galloway

2008ör augusti 2008 в 9:53

Mer

Det finns en bra artikel om att ta bort dubbletter på Microsofts supportwebbplats. Den är ganska konservativ - du måste göra allt i separata steg - men den borde fungera bra för stora tabeller.

Jag har tidigare använt self-joins för att göra detta, även om det förmodligen skulle kunna förbättras med en HAVING-klausul:

DELETE dupes
FROM MyTable dupes, MyTable fullTable
WHERE dupes.dupField = fullTable.dupField 
AND dupes.secondDupField = fullTable.secondDupField 
AND dupes.uniqueField > fullTable.uniqueField

Ivan Yurchenko

Redigerat svar 2017ör juni 2017 в 11:36

Remove duplicate rows from a table in SQL Server - SQL Server | Microsoft Learn

This article provides a script that you can use to remove duplicate rows from a SQL Server table.

support.microsoft.com

146

0

Lägg till en fråga

Kategorier

Alla

Teknik

Kultur / fritid

Livet / Konst

Vetenskap

Professionell

Företag

Användare

Alla

Ny

Populära

1

Ксения Комарова

Registrerad för 3 veckor sedan

2

Артур «Апер»

Registrerad för 2 månader sedan

3

Viktor Malyutin

Registrerad för 2 månader sedan

4

Viktor Malyutin

Registrerad för 2 månader sedan

5

Syahputra Zhedenk

Registrerad för 2 månader sedan

Do you have a question? Add it on the site and get an answer instantly

en.kzen.dev

Mark Brackett · Accepted Answer · 2008-08-20T22:00:00+00:00

Om du antar att det inte finns några nollor, så gör du en gruppering efter de unika kolumnerna och väljer den lägsta (eller högsta) RowId-numret som den rad som ska behållas. Sedan raderar du allt som inte har ett row id:

DELETE FROM MyTable
LEFT OUTER JOIN (
   SELECT MIN(RowId) as RowId, Col1, Col2, Col3 
   FROM MyTable 
   GROUP BY Col1, Col2, Col3
) as KeepRows ON
   MyTable.RowId = KeepRows.RowId
WHERE
   KeepRows.RowId IS NULL

Om du har en GUID istället för ett heltal kan du ersätta

MIN(RowId)

med

CONVERT(uniqueidentifier, MIN(CONVERT(char(36), MyGuidColumn)))