我想对一个数据框按多列进行排序。例如,在下面的数据框中,我想按z
列(降序)然后按b
列(升序)排序。
dd <- data.frame(b = factor(c("Hi", "Med", "Hi", "Low"),
levels = c("Low", "Med", "Hi"), ordered = TRUE),
x = c("A", "D", "A", "C"), y = c(8, 3, 9, 9),
z = c(1, 1, 1, 2))
dd
b x y z
1 Hi A 8 1
2 Med D 3 1
3 Hi A 9 1
4 Low C 9 2
你可以直接使用order()
函数,而不需要借助附加工具--请看这个更简单的答案,它在example(order)
代码的顶部直接使用了一个技巧。
R> dd[with(dd, order(-z, b)), ]
b x y z
4 Low C 9 2
2 Med D 3 1
1 Hi A 8 1
3 Hi A 9 1
2年多后编辑:有人问如何按列索引来做。答案是简单地将所需的排序列传递给order()
函数。
R> dd[order(-dd[,4], dd[,1]), ]
b x y z
4 Low C 9 2
2 Med D 3 1
1 Hi A 8 1
3 Hi A 9 1
R>
而不是使用列的名称(和with()
以便更容易/更直接地访问)。
通过Kevin Wright的这个(非常有帮助的)函数,发布在R维基的技巧部分,这很容易实现。
sort(dd,by = ~ -z + b)
# b x y z
# 4 Low C 9 2
# 2 Med D 3 1
# 1 Hi A 8 1
# 3 Hi A 9 1