Jeg ønsker at sortere en data.frame efter flere kolonner. I nedenstående data.frame vil jeg f.eks. gerne sortere efter kolonne z
(faldende) og derefter efter kolonne b
(stigende):
dd <- data.frame(b = factor(c("Hi", "Med", "Hi", "Low"),
levels = c("Low", "Med", "Hi"), ordered = TRUE),
x = c("A", "D", "A", "C"), y = c(8, 3, 9, 9),
z = c(1, 1, 1, 2))
dd
b x y z
1 Hi A 8 1
2 Med D 3 1
3 Hi A 9 1
4 Low C 9 2
Du kan bruge funktionen order()
direkte uden at skulle bruge tillægsværktøjer - se dette enklere svar, som bruger et trick direkte fra toppen af example(order)
-koden:
R> dd[with(dd, order(-z, b)), ]
b x y z
4 Low C 9 2
2 Med D 3 1
1 Hi A 8 1
3 Hi A 9 1
Rediger ca. 2+ år senere: Der blev netop spurgt, hvordan man gør dette ved kolonneindeks. Svaret er, at man blot skal overdrage den/de ønskede sorteringskolonne(r) til order()
-funktionen:
R> dd[order(-dd[,4], dd[,1]), ]
b x y z
4 Low C 9 2
2 Med D 3 1
1 Hi A 8 1
3 Hi A 9 1
R>
i stedet for at bruge navnet på kolonnen (og with()
for nemmere/mere direkte adgang).
Med denne (meget nyttige) funktion af Kevin Wright, som er lagt ud i tips-sektionen på R-wikien, er det nemt at opnå dette.
sort(dd,by = ~ -z + b)
# b x y z
# 4 Low C 9 2
# 2 Med D 3 1
# 1 Hi A 8 1
# 3 Hi A 9 1