SQL valitse vain rivit, joilla on sarakkeen maksimiarvo

Question

Lisää

Kysymys

SQL valitse vain rivit, joilla on sarakkeen maksimiarvo

Minulla on tämä taulukko asiakirjoja varten (yksinkertaistettu versio tässä):

+------+-------+--------------------------------------+
| id   | rev   | content                              |
+------+-------+--------------------------------------+
| 1    | 1     | ...                                  |
| 2    | 1     | ...                                  |
| 1    | 2     | ...                                  |
| 1    | 3     | ...                                  |
+------+-------+--------------------------------------+

Miten valitsen yhden rivin per id ja vain suurimman rev?
Yllä olevilla tiedoilla tuloksen pitäisi sisältää kaksi riviä: [1, 3, ...] ja [2, 1, ...]. Käytän MySQL:ää.

Tällä hetkellä käytän tarkastuksia while-silmukassa havaitakseni ja korvatakseni vanhat kierrokset tulosjoukosta. Mutta onko tämä ainoa tapa saavuttaa tulos? Eikö ole olemassa SQL-ratkaisua?

Päivitys Kuten vastauksista käy ilmi, SQL-ratkaisu on olemassa, ja tässä sqlfiddle-demo.

Päivitys 2 Huomasin edellä mainitun sqlfiddle:n lisäämisen jälkeen, että kysymystä on äänestetty enemmän kuin vastauksia. Tämä ei ole ollut tarkoitus! Fiddle perustuu vastauksiin, erityisesti hyväksyttyyn vastaukseen.

Rick James

Muokattu kysymysT22 tammikuu 2019 в 10:44

Ohjelmointi

sql

mysql

Ratkaisu / Vastaus

T22 lokakuu 2011 в 7:47

Lisää

Haluan käyttää mahdollisimman vähän koodia...

Voit tehdä sen käyttämällä IN kokeile tätä:

SELECT * 
FROM t1 WHERE (id,rev) IN 
( SELECT id, MAX(rev)
  FROM t1
  GROUP BY id
)

mielestäni se on vähemmän monimutkainen... helpompi lukea ja ylläpitää.

Kevin Burton

Muokattu vastausta T00 joulukuu 2013 в 1:08

230

0

Marc B

T22 lokakuu 2011 в 7:48

Lisää

Jotain tällaista?

SELECT yourtable.id, rev, content
FROM yourtable
INNER JOIN (
    SELECT id, max(rev) as maxrev FROM yourtable
    WHERE yourtable
    GROUP BY id
) AS child ON (yourtable.id = child.id) AND (yourtable.rev = maxrev)

Marc B

Muokattu vastausta T22 lokakuu 2011 в 7:54

21

0

Lisää kysymys

Kategoriat

Kaikki

Teknologia

Kulttuuri / Virkistys

Elämä / Taide

Tiede

Ammattilainen

Liiketoiminta

Käyttäjät

Kaikki

Uusi

Suosittu

1

Ксения Комарова

Rekisteröity 1 kuukausi sitten

2

Артур «Апер»

Rekisteröity 2 kuukautta sitten

3

Viktor Malyutin

Rekisteröity 2 kuukautta sitten

4

Viktor Malyutin

Rekisteröity 2 kuukautta sitten

5

Syahputra Zhedenk

Rekisteröity 2 kuukautta sitten

Do you have a question? Add it on the site and get an answer instantly

en.kzen.dev

Adrian Carneiro · Accepted Answer · 2011-10-12T19:43:53+00:00

Ensi silmäyksellä...

Tarvitset vain GROUP BY-lausekkeen ja MAX-aggregaattifunktion:

SELECT id, MAX(rev)
FROM YourTable
GROUP BY id

Eihän se ole koskaan niin yksinkertaista?

Huomasin juuri, että tarvitset myös sarakkeen "sisältö".

Tämä on hyvin yleinen kysymys SQL:ssä: etsi koko data riville, jolla on jokin maksimiarvo sarakkeessa jonkin ryhmän tunnisteen mukaan. Olen kuullut tuon usein urani aikana. Itse asiassa se oli yksi niistä kysymyksistä, joihin vastasin nykyisessä työpaikassani teknisessä haastattelussa.

Se on itse asiassa niin yleistä, että StackOverflow-yhteisö on luonut yhden tunnisteen juuri tällaisia kysymyksiä varten: [tag:greatest-n-per-group].

Ongelman ratkaisemiseen on periaatteessa kaksi lähestymistapaa:

Liittäminen yksinkertaisella `group-identifier, max-value-in-group` alakyselyllä.

Tässä lähestymistavassa etsitään ensin group-identifier, max-value-in-group (ratkaistu jo edellä) alakyselyssä. Sitten liitetään taulukko alakyselyyn siten, että sekä group-identifier että max-value-in-group ovat yhtä suuret:

SELECT a.id, a.rev, a.contents
FROM YourTable a
INNER JOIN (
    SELECT id, MAX(rev) rev
    FROM YourTable
    GROUP BY id
) b ON a.id = b.id AND a.rev = b.rev

Vasemmalla liitos itsensä kanssa, liitosehtojen ja suodattimien muokkaaminen.

Tässä lähestymistavassa taulukko liitetään vasemmalla liitoksella itsensä kanssa. Yhtäläisyys on group-identifier. Sitten 2 fiksua siirtoa:

Toinen liitosehto on, että vasemman puolen arvo on pienempi kuin oikean puolen arvo.
Kun teet vaiheen 1, oikealla puolella on NULL rivillä (riveillä), joilla todella on suurin arvo (se on LEFT JOIN, muistatko?). Sitten suodatamme yhdistetyn tuloksen ja näytämme vain ne rivit, joiden oikealla puolella on NULL.

Tulokseksi saadaan siis:

SELECT a.*
FROM YourTable a
LEFT OUTER JOIN YourTable b
    ON a.id = b.id AND a.rev < b.rev
WHERE b.id IS NULL;

Johtopäätös

Molemmat lähestymistavat johtavat täsmälleen samaan tulokseen.

Jos sinulla on kaksi riviä, joilla on group-identifier-arvona max-value-in-group, molemmat rivit ovat tuloksessa molemmilla lähestymistavoilla.

Molemmat lähestymistavat ovat SQL ANSI -yhteensopivia, joten ne toimivat suosikki RDBMS-tietokannan kanssa sen "maku" -ominaisuuksista riippumatta.

Molemmat lähestymistavat ovat myös suorituskykyystävällisiä, mutta käyttötapa voi vaihdella (RDBMS, tietokannan rakenne, indeksit jne.). Kun siis valitset yhden lähestymistavan toisen sijaan, vertaile. Ja varmista, että valitset sen, joka on sinusta järkevin.

SQL valitse vain rivit, joilla on sarakkeen maksimiarvo

Ensi silmäyksellä...

Eihän se ole koskaan niin yksinkertaista?

Liittäminen yksinkertaisella group-identifier, max-value-in-group alakyselyllä.

Vasemmalla liitos itsensä kanssa, liitosehtojen ja suodattimien muokkaaminen.

Johtopäätös

Liittäminen yksinkertaisella `group-identifier, max-value-in-group` alakyselyllä.