SQL selecciona sólo las filas con valor máximo en una columna

Question

Más

Question

SQL selecciona sólo las filas con valor máximo en una columna

Tengo esta tabla para documentos (versión simplificada aquí):

+------+-------+--------------------------------------+
| id   | rev   | content                              |
+------+-------+--------------------------------------+
| 1    | 1     | ...                                  |
| 2    | 1     | ...                                  |
| 1    | 2     | ...                                  |
| 1    | 3     | ...                                  |
+------+-------+--------------------------------------+

¿Cómo selecciono una fila por id y sólo el mayor rev?
Con los datos anteriores, el resultado debería contener dos filas: [1, 3, ..] y [2, 1, ..]. Estoy utilizando MySQL.

Actualmente utilizo comprobaciones en el bucle while para detectar y sobrescribir las revoluciones antiguas del conjunto de resultados. ¿Pero es este el único método para conseguir el resultado? ¿No hay una solución SQL?

Actualización Como sugieren las respuestas, existe una solución SQL, y aquí una demostración sqlfiddle.

Actualización 2 Me he dado cuenta de que después de añadir el sqlfiddle de arriba, la tasa de upvotes de la pregunta ha superado la tasa de upvotes de las respuestas. Esa no ha sido la intención. El fiddle se basa en las respuestas, especialmente en la respuesta aceptada.

Rick James

Pregunta editada 2º enero 2019 в 10:44

Programación

sql

mysql

Solution / Answer

12º octubre 2011 в 7:47

Más

Mi preferencia es utilizar el menor código posible...

Puedes hacerlo utilizando IN. prueba esto:

SELECT * 
FROM t1 WHERE (id,rev) IN 
( SELECT id, MAX(rev)
  FROM t1
  GROUP BY id
)

en mi opinión es menos complicado... más fácil de leer y mantener.

Kevin Burton

Respuesta editada 16º diciembre 2013 в 1:08

230

0

Marc B

12º octubre 2011 в 7:48

Más

¿Algo así?

SELECT yourtable.id, rev, content
FROM yourtable
INNER JOIN (
    SELECT id, max(rev) as maxrev FROM yourtable
    WHERE yourtable
    GROUP BY id
) AS child ON (yourtable.id = child.id) AND (yourtable.rev = maxrev)

Marc B

Respuesta editada 12º octubre 2011 в 7:54

21

0

Comunidades relacionadas 2

SQL

852 usuarios

Grupo para gente seria e interesada en el lenguaje SQL. También NoSQL. Como medida para evitar el SPAM, para unirse a este grupo es necesario rellenar un Captcha. https://telegram.me/joinchat/AGFygUDuqou03Lr4jixWbA https://telegram.me/esequele

259 usuarios

Categorías

Todo

Tecnología

Cultura / Recreación

Vida / Artes

Ciencia

Profesional

Negocios

Usuarios

Todo

Nuevo

Popular

1

Ксения Комарова

Registrado hace 1 mes

2

Артур «Апер»

Registrado hace 2 meses

3

Viktor Malyutin

Registrado hace 3 meses

4

Viktor Malyutin

Registrado hace 3 meses

5

Syahputra Zhedenk

Registrado hace 3 meses

¿Tiene alguna pregunta? Añádela en el sitio y obtén una respuesta al instante

es.kzen.dev

Adrian Carneiro · Accepted Answer · 2011-10-12T19:43:53+00:00

A primera vista...

Todo lo que necesitas es una cláusula GROUP BY con la función agregada MAX:

SELECT id, MAX(rev)
FROM YourTable
GROUP BY id

Nunca es tan sencillo, ¿verdad?

Acabo de darme cuenta de que también necesitas la columna content.

Esta es una pregunta muy común en SQL: encontrar todos los datos de la fila con algún valor máximo en una columna por algún identificador de grupo. Lo he escuchado mucho durante mi carrera. De hecho, fue una de las preguntas que respondí en la entrevista técnica de mi trabajo actual.

Es, de hecho, tan común que la comunidad de StackOverflow ha creado una sola etiqueta sólo para tratar con preguntas como esa: [tag:greatest-n-per-group].

Básicamente, tienes dos enfoques para resolver ese problema:

Unir con un simple `identificador de grupo, valor máximo en el grupo` Subconsulta

En este enfoque, primero se encuentra el identificador de grupo, valor máximo en el grupo (ya resuelto anteriormente) en una subconsulta. A continuación, se une la tabla a la subconsulta con igualdad en el "identificador de grupo" y el "valor máximo en el grupo":

SELECT a.id, a.rev, a.contents
FROM YourTable a
INNER JOIN (
    SELECT id, MAX(rev) rev
    FROM YourTable
    GROUP BY id
) b ON a.id = b.id AND a.rev = b.rev

Unión a la izquierda con self, ajustando las condiciones de unión y los filtros

En este enfoque, se une a la izquierda la tabla con sí misma. La igualdad va en el "identificador de grupo". Entonces, 2 movimientos inteligentes:

La segunda condición de unión es que el valor del lado izquierdo sea menor que el valor del lado derecho
Al hacer el paso 1, la(s) fila(s) que realmente tiene(n) el valor máximo tendrá(n) NULL en el lado derecho (es un LEFT JOIN, ¿recuerda?). Entonces, filtramos el resultado unido, mostrando sólo las filas donde el lado derecho es NULL.

Así que terminamos con:

SELECT a.*
FROM YourTable a
LEFT OUTER JOIN YourTable b
    ON a.id = b.id AND a.rev < b.rev
WHERE b.id IS NULL;

Conclusión

Ambos enfoques dan exactamente el mismo resultado.

Si tiene dos filas con valor máximo en el grupo para identificador de grupo, ambas filas estarán en el resultado en ambos enfoques.

Ambos enfoques son compatibles con SQL ANSI, por lo tanto, funcionarán con su RDBMS favorito, independientemente de su "sabor".

Ambos enfoques son también amigables con el rendimiento, sin embargo, su kilometraje puede variar (RDBMS, estructura de la base de datos, índices, etc.). Así que cuando elijas un enfoque sobre el otro, compara el rendimiento. Y asegúrese de elegir el que tenga más sentido para usted.

SQL selecciona sólo las filas con valor máximo en una columna

A primera vista...

Nunca es tan sencillo, ¿verdad?

Unir con un simple identificador de grupo, valor máximo en el grupo Subconsulta

Unión a la izquierda con self, ajustando las condiciones de unión y los filtros

Conclusión

Unir con un simple `identificador de grupo, valor máximo en el grupo` Subconsulta