Kaksoisarvojen etsiminen SQL-taulukosta

Question

Lisää

Kysymys

Kaksoisarvojen etsiminen SQL-taulukosta

Kaksoiskappaleet on helppo löytää yhdellä kentällä:

SELECT name, COUNT(email) 
FROM users
GROUP BY email
HAVING COUNT(email) > 1

Joten jos meillä on taulukko

ID   NAME   EMAIL
1    John   [email protected]
2    Sam    [email protected]
3    Tom    [email protected]
4    Bob    [email protected]
5    Tom    [email protected]

Tämä kysely antaa meille John, Sam, Tom, Tom, Tom, koska heillä kaikilla on sama email.

Haluan kuitenkin saada kaksoiskappaleet, joilla on sama email ja name.

Toisin sanoen haluan saada "Tom", "Tom".

Syy, miksi tarvitsen tätä: Tein virheen ja annoin lisätä päällekkäisiä name- ja email-arvoja. Nyt minun on poistettava/muutettava kaksoiskappaleet, joten minun on löydettävä ne ensin.

Pang

Muokattu kysymysT44 syyskuu 2019 в 2:18

Ohjelmointi

sql

duplicates

Ratkaisu / Vastaus

KM.

T22 huhtikuu 2010 в 6:22

Lisää

kokeile tätä:

declare @YourTable table (id int, name varchar(10), email varchar(50))

INSERT @YourTable VALUES (1,'John','John-email')
INSERT @YourTable VALUES (2,'John','John-email')
INSERT @YourTable VALUES (3,'fred','John-email')
INSERT @YourTable VALUES (4,'fred','fred-email')
INSERT @YourTable VALUES (5,'sam','sam-email')
INSERT @YourTable VALUES (6,'sam','sam-email')

SELECT
    name,email, COUNT(*) AS CountOf
    FROM @YourTable
    GROUP BY name,email
    HAVING COUNT(*)>1

OUTPUT:

name       email       CountOf
---------- ----------- -----------
John       John-email  2
sam        sam-email   2

(2 row(s) affected)

jos haluat duppien tunnukset, käytä tätä:

SELECT
    y.id,y.name,y.email
    FROM @YourTable y
        INNER JOIN (SELECT
                        name,email, COUNT(*) AS CountOf
                        FROM @YourTable
                        GROUP BY name,email
                        HAVING COUNT(*)>1
                    ) dt ON y.name=dt.name AND y.email=dt.email

OUTPUT:

id          name       email
----------- ---------- ------------
1           John       John-email
2           John       John-email
5           sam        sam-email
6           sam        sam-email

(4 row(s) affected)

yrittääksesi poistaa kaksoiskappaleet:

DELETE d
    FROM @YourTable d
        INNER JOIN (SELECT
                        y.id,y.name,y.email,ROW_NUMBER() OVER(PARTITION BY y.name,y.email ORDER BY y.name,y.email,y.id) AS RowRank
                        FROM @YourTable y
                            INNER JOIN (SELECT
                                            name,email, COUNT(*) AS CountOf
                                            FROM @YourTable
                                            GROUP BY name,email
                                            HAVING COUNT(*)>1
                                        ) dt ON y.name=dt.name AND y.email=dt.email
                   ) dt2 ON d.id=dt2.id
        WHERE dt2.RowRank!=1
SELECT * FROM @YourTable

OUTPUT:

id          name       email
----------- ---------- --------------
1           John       John-email
3           fred       John-email
4           fred       fred-email
5           sam        sam-email

(4 row(s) affected)

simhumileco

Muokattu vastausta T11 huhtikuu 2018 в 8:46

348

0

Chris Van Opstal

T22 huhtikuu 2010 в 6:20

Lisää

Kokeile tätä:

SELECT name, email
FROM users
GROUP BY name, email
HAVING ( COUNT(*) > 1 )

110

0

Lisää kysymys

Kategoriat

Kaikki

Teknologia

Kulttuuri / Virkistys

Elämä / Taide

Tiede

Ammattilainen

Liiketoiminta

Käyttäjät

Kaikki

Uusi

Suosittu

1

Ксения Комарова

Rekisteröity 3 viikkoa sitten

2

Артур «Апер»

Rekisteröity 2 kuukautta sitten

3

Viktor Malyutin

Rekisteröity 2 kuukautta sitten

4

Viktor Malyutin

Rekisteröity 2 kuukautta sitten

5

Syahputra Zhedenk

Rekisteröity 2 kuukautta sitten

Do you have a question? Add it on the site and get an answer instantly

en.kzen.dev

gbn · Accepted Answer · 2010-04-07T18:20:18+00:00

SELECT
    name, email, COUNT(*)
FROM
    users
GROUP BY
    name, email
HAVING 
    COUNT(*) > 1

Yksinkertaisesti ryhmittele molemmat sarakkeet.

Huomautus: vanhemman ANSI-standardin mukaan GROUP BY:ssä on oltava kaikki ei-aggregoidut sarakkeet, mutta tämä on muuttunut ajatuksen "toiminnallinen riippuvuus" myötä:

Relaatiotietokantateoriassa funktionaalinen riippuvuus on tietokannan relaation kahden attribuuttijoukon välinen rajoitus. Toisin sanoen funktionaalinen riippuvuus on rajoitus, joka kuvaa relaation attribuuttien välistä suhdetta.

Tuki ei ole johdonmukainen:

PostgreSQL tukee sitä.
SQL Server (kuten SQL Server 2017) vaatii edelleen kaikki ei-aggregoidut sarakkeet GROUP BY:ssä.
MySQL on arvaamaton ja tarvitset sql_mode=only_full_group_by:
https://stackoverflow.com/q/10894820/27535;
https://stackoverflow.com/questions/6060241/which-is-the-least-expensive-aggregate-function-in-the-absence-of-any/6060414#6060414 (ks. hyväksytyn vastauksen kommentit).
Oracle ei ole tarpeeksi yleinen (varoitus: huumori, en tiedä Oraclesta).