Cum de a schimba ordinea de DataFrame coloane?

Question

Mai mult

Question

Cum de a schimba ordinea de DataFrame coloane?

Am urmatoarele DataFrame ("df"):

import numpy as np
import pandas as pd

df = pd.DataFrame(np.random.rand(10, 5))

Mai adaug coloana(e) de sarcină:

df['mean'] = df.mean(1)

Cum pot muta coloana "înseamnă" în față, adică a stabilit ca prima coloana a părăsi ordinul alte coloane de neatins?

nick

Întrebarea editată 20 ianuarie 2019 в 1:47

Programare

python

pandas

dataframe

Comunități asemănătoare 1

Python România

121 utilizatori

Comunitatea pasionaților de Python din România.

Deschide telegram

Adăugati o întrebare

Categorii

Toate

Tehnologii

Cultură

Viață / Artă

Stiință

Profesii

Afaceri

Utilizatori

Toate

Nou

Populare

1

Ксения Комарова

Înregistrat 1 lună în urmă

2

Артур «Апер»

Înregistrat 2 luni în urmă

3

Viktor Malyutin

Înregistrat 2 luni în urmă

4

Viktor Malyutin

Înregistrat 2 luni în urmă

5

Syahputra Zhedenk

Înregistrat 3 luni în urmă

Aveți o întrebare? Adăugați-o pe site-ul nostru și primiți răspuns instant

ro.kzen.dev

Aman · Answer 1 · 2012-10-30T22:38:49+00:00

O modalitate de ușor ar fi pentru a realoca dataframe cu o listă de coloane, rearanjate după cum este necesar.

Aceasta este ceea ce ai acum:

In [6]: df
Out[6]:
          0         1         2         3         4      mean
0  0.445598  0.173835  0.343415  0.682252  0.582616  0.445543
1  0.881592  0.696942  0.702232  0.696724  0.373551  0.670208
2  0.662527  0.955193  0.131016  0.609548  0.804694  0.632596
3  0.260919  0.783467  0.593433  0.033426  0.512019  0.436653
4  0.131842  0.799367  0.182828  0.683330  0.019485  0.363371
5  0.498784  0.873495  0.383811  0.699289  0.480447  0.587165
6  0.388771  0.395757  0.745237  0.628406  0.784473  0.588529
7  0.147986  0.459451  0.310961  0.706435  0.100914  0.345149
8  0.394947  0.863494  0.585030  0.565944  0.356561  0.553195
9  0.689260  0.865243  0.136481  0.386582  0.730399  0.561593

In [7]: cols = df.columns.tolist()

In [8]: cols
Out[8]: [0L, 1L, 2L, 3L, 4L, 'mean']

Rearanja coloane în orice mod doriți. Acest lucru este cum m-am mutat la ultimul element la primul loc:

In [12]: cols = cols[-1:] + cols[:-1]

In [13]: cols
Out[13]: ['mean', 0L, 1L, 2L, 3L, 4L]

Apoi reordona dataframe astfel:

In [16]: df = df[cols]  #    OR    df = df.ix[:, cols]

In [17]: df
Out[17]:
       mean         0         1         2         3         4
0  0.445543  0.445598  0.173835  0.343415  0.682252  0.582616
1  0.670208  0.881592  0.696942  0.702232  0.696724  0.373551
2  0.632596  0.662527  0.955193  0.131016  0.609548  0.804694
3  0.436653  0.260919  0.783467  0.593433  0.033426  0.512019
4  0.363371  0.131842  0.799367  0.182828  0.683330  0.019485
5  0.587165  0.498784  0.873495  0.383811  0.699289  0.480447
6  0.588529  0.388771  0.395757  0.745237  0.628406  0.784473
7  0.345149  0.147986  0.459451  0.310961  0.706435  0.100914
8  0.553195  0.394947  0.863494  0.585030  0.565944  0.356561
9  0.561593  0.689260  0.865243  0.136481  0.386582  0.730399

freddygv · Answer 2 · 2014-05-19T15:20:33+00:00

De asemenea, ai putea face ceva de genul asta:

df = df[['mean', '0', '1', '2', '3']]

Puteți obține lista de coloane cu:

cols = list(df.columns.values)

Producția va produce:

['0', '1', '2', '3', 'mean']

...care este apoi ușor pentru a rearanja manual înainte de a scădea în prima funcție

fixxxer · Answer 3 · 2015-04-28T14:19:49+00:00

Doar să atribuiți nume de coloane în ordinea în care le doriți:

In [39]: df
Out[39]: 
          0         1         2         3         4  mean
0  0.172742  0.915661  0.043387  0.712833  0.190717     1
1  0.128186  0.424771  0.590779  0.771080  0.617472     1
2  0.125709  0.085894  0.989798  0.829491  0.155563     1
3  0.742578  0.104061  0.299708  0.616751  0.951802     1
4  0.721118  0.528156  0.421360  0.105886  0.322311     1
5  0.900878  0.082047  0.224656  0.195162  0.736652     1
6  0.897832  0.558108  0.318016  0.586563  0.507564     1
7  0.027178  0.375183  0.930248  0.921786  0.337060     1
8  0.763028  0.182905  0.931756  0.110675  0.423398     1
9  0.848996  0.310562  0.140873  0.304561  0.417808     1

In [40]: df = df[['mean', 4,3,2,1]]

Acum, 'spun' coloana iese în față:

In [41]: df
Out[41]: 
   mean         4         3         2         1
0     1  0.190717  0.712833  0.043387  0.915661
1     1  0.617472  0.771080  0.590779  0.424771
2     1  0.155563  0.829491  0.989798  0.085894
3     1  0.951802  0.616751  0.299708  0.104061
4     1  0.322311  0.105886  0.421360  0.528156
5     1  0.736652  0.195162  0.224656  0.082047
6     1  0.507564  0.586563  0.318016  0.558108
7     1  0.337060  0.921786  0.930248  0.375183
8     1  0.423398  0.110675  0.931756  0.182905
9     1  0.417808  0.304561  0.140873  0.310562

Wes McKinney · Answer 4 · 2012-11-09T21:04:03+00:00

Ce zici de:

df.insert(0, 'mean', df.mean(1))

http://pandas.pydata.org/pandas-docs/stable/dsintro.html#column-selection-addition-deletion

Alvaro Joao · Answer 5 · 2016-08-30T21:57:36+00:00

În cazul tău,

df = df.reindex(columns=['mean',0,1,2,3,4])

va face exact ceea ce vrei.

In cazul meu (forma generală):

df = df.reindex(columns=sorted(df.columns))
df = df.reindex(columns=(['opened'] + list([a for a in df.columns if a != 'opened']) ))

Yuca · Answer 6 · 2018-08-20T17:35:46+00:00

Din August 2018:

Dacă numele de coloane sunt prea lungi pentru tip, atunci ai putea specifica noua ordine printr-o listă de numere întregi cu pozițiile:

Date:

          0         1         2         3         4      mean
0  0.397312  0.361846  0.719802  0.575223  0.449205  0.500678
1  0.287256  0.522337  0.992154  0.584221  0.042739  0.485741
2  0.884812  0.464172  0.149296  0.167698  0.793634  0.491923
3  0.656891  0.500179  0.046006  0.862769  0.651065  0.543382
4  0.673702  0.223489  0.438760  0.468954  0.308509  0.422683
5  0.764020  0.093050  0.100932  0.572475  0.416471  0.389390
6  0.259181  0.248186  0.626101  0.556980  0.559413  0.449972
7  0.400591  0.075461  0.096072  0.308755  0.157078  0.207592
8  0.639745  0.368987  0.340573  0.997547  0.011892  0.471749
9  0.050582  0.714160  0.168839  0.899230  0.359690  0.438500

Generic exemplu:

new_order = [3,2,1,4,5,0]
print(df[df.columns[new_order]])  

          3         2         1         4      mean         0
0  0.575223  0.719802  0.361846  0.449205  0.500678  0.397312
1  0.584221  0.992154  0.522337  0.042739  0.485741  0.287256
2  0.167698  0.149296  0.464172  0.793634  0.491923  0.884812
3  0.862769  0.046006  0.500179  0.651065  0.543382  0.656891
4  0.468954  0.438760  0.223489  0.308509  0.422683  0.673702
5  0.572475  0.100932  0.093050  0.416471  0.389390  0.764020
6  0.556980  0.626101  0.248186  0.559413  0.449972  0.259181
7  0.308755  0.096072  0.075461  0.157078  0.207592  0.400591
8  0.997547  0.340573  0.368987  0.011892  0.471749  0.639745
9  0.899230  0.168839  0.714160  0.359690  0.438500  0.050582

Și pentru cazul specific al OP's întrebare:

new_order = [-1,0,1,2,3,4]
df = df[df.columns[new_order]]
print(df)

       mean         0         1         2         3         4
0  0.500678  0.397312  0.361846  0.719802  0.575223  0.449205
1  0.485741  0.287256  0.522337  0.992154  0.584221  0.042739
2  0.491923  0.884812  0.464172  0.149296  0.167698  0.793634
3  0.543382  0.656891  0.500179  0.046006  0.862769  0.651065
4  0.422683  0.673702  0.223489  0.438760  0.468954  0.308509
5  0.389390  0.764020  0.093050  0.100932  0.572475  0.416471
6  0.449972  0.259181  0.248186  0.626101  0.556980  0.559413
7  0.207592  0.400591  0.075461  0.096072  0.308755  0.157078
8  0.471749  0.639745  0.368987  0.340573  0.997547  0.011892
9  0.438500  0.050582  0.714160  0.168839  0.899230  0.359690

Principala problemă cu această abordare este că de asteptare acelasi cod de mai multe ori, va crea rezultate diferite de fiecare dată, așa că trebuie să fie atent :)

Alexander · Answer 7 · 2015-08-21T02:18:52+00:00

Aveți nevoie pentru a crea o nouă listă de coloane în ordinea dorită, apoi utilizați df = df[coloane] pentru a rearanja coloanele în această nouă ordine.

cols = ['mean']  + [col for col in df if col != 'mean']
df = df[cols]

Puteți folosi, de asemenea, o abordare mai generală. În acest exemplu, ultima coloană (indicat de -1) este introdus ca prima coloana.

cols = [df.columns[-1]] + [col for col in df if col != df.columns[-1]]
df = df[cols]

Puteți folosi, de asemenea, această abordare pentru reordonarea coloanelor într-o ordine dorită, dacă acestea sunt prezente în DataFrame.

inserted_cols = ['a', 'b', 'c']
cols = ([col for col in inserted_cols if col in df] 
        + [col for col in df if col not in inserted cols])
df = df[cols]

clocker · Answer 8 · 2014-08-27T19:49:31+00:00

Am fugit într-o întrebare similară mine, și am vrut doar să adăugați ceea ce am stabilit. Mi-a placut `reindex_axis() metoda pentru a schimba ordinea. Aceasta a lucrat:

df = df.reindex_axis(['mean'] + list(df.columns[:-1]), axis=1)

O metodă alternativă bazată pe comentariul de la @Jorge:

df = df.reindex(columns=['mean'] + list(df.columns[:-1]))

Deși reindex_axis pare a fi ușor mai rapid în micro-obiective de referință decât reindex, cred că aș prefera aceasta din urmă pentru sinceritate.

seeiespi · Answer 9 · 2014-07-29T19:30:18+00:00

Această funcție se evită a fi nevoie pentru a lista fiecare variabilă din setul de date doar pentru câteva dintre ele.

def order(frame,var):
    if type(var) is str:
        var = [var] #let the command take a string or list
    varlist =[w for w in frame.columns if w not in var]
    frame = frame[var+varlist]
    return frame

Este nevoie de două argumente, primul este setului de date, în cel de-al doilea sunt coloanele din setul de date pe care doriți pentru a aduce în față.

Deci, în cazul meu, am un set de date, numit Cadru cu variabilele A1, A2, B1, B2, Total și Data. Dacă vreau să aduc Total pentru partea din față, atunci tot ce trebuie sa faci este:

frame = order(frame,['Total'])

Dacă vreau să aduc Total și Data la față, apoi am făcut:

frame = order(frame,['Total','Date'])

EDIT:

Un alt mod util de a folosi acest lucru este, dacă aveți un necunoscut masă și te're în căutarea cu variabile cu un anumit termen în ele, ca VAR1, VAR2,... poate executa ceva de genul:

frame = order(frame,[v for v in frame.columns if "VAR" in v])

Napitupulu Jon · Answer 10 · 2015-04-28T09:50:19+00:00

Napitupulu Jon

28 aprilie 2015 в 9:50

Mai mult

Pur și simplu face,

df = df[['mean'] + df.columns[:-1].tolist()]

15

0

otteheng · Answer 11 · 2016-12-08T15:22:39+00:00

Ai putea face următoarele (împrumut piese de la Aman's de răspuns):

cols = df.columns.tolist()
cols.insert(0, cols.pop(-1))

cols
>>>['mean', 0L, 1L, 2L, 3L, 4L]

df = df[cols]

pomber · Answer 12 · 2018-02-27T14:05:01+00:00

Mișcare orice coloană în orice poziție:

import pandas as pd
df = pd.DataFrame({"A": [1,2,3], 
                   "B": [2,4,8], 
                   "C": [5,5,5]})

cols = df.columns.tolist()
column_to_move = "C"
new_position = 1

cols.insert(new_position, cols.pop(cols.index(column_to_move)))
df = df[cols]

ccerhan · Answer 13 · 2016-05-06T11:39:33+00:00

Trebuie doar să tastați numele de coloană doriți să o modificați, și a stabilit index pentru noua locație.

def change_column_order(df, col_name, index):
    cols = df.columns.tolist()
    cols.remove(col_name)
    cols.insert(index, col_name)
    return df[cols]

Pentru cazul dumneavoastră, acest lucru ar fi ca:

df = change_column_order(df, 'mean', 0)

Joe Heffer · Answer 14 · 2018-01-04T13:25:54+00:00

Aici's o modalitate de a muta o coloană existente, care va modifica datele existente în locul cadrului.

my_column = df.pop('column name')
df.insert(3, my_column.name, my_column)

dmvianna · Answer 15 · 2013-01-04T06:04:46+00:00

Această întrebare s-a răspuns înainte dar reindex_axis este învechită acum, așa că aș sugera să utilizați:

df.reindex(sorted(df.columns), axis=1)

ZEE · Answer 16 · 2016-06-26T23:46:28+00:00

ZEE

26 iunie 2016 в 11:46

Mai mult

Cum despre utilizarea "T"?

df.T.reindex(['mean',0,1,2,3,4]).T

3

0

matthhias · Answer 17 · 2017-07-27T09:21:39+00:00

@clockers: solutia Ta a fost foarte util pentru mine, deoarece am vrut să aduc două coloane în față de la un dataframe unde nu stiu exact numele tuturor coloanelor, pentru că ele sunt generate de un pivot declarație înainte. Deci, dacă sunteți în aceeași situație: Pentru a aduce coloane în față că știi numele și apoi să le urmați de "toate celelalte coloane", am venit cu următoarea soluție generală;

df = df.reindex_axis(['Col1','Col2'] + list(df.columns.drop(['Col1','Col2'])), axis=1)

Shoresh · Answer 18 · 2017-09-12T02:06:24+00:00

set():

O abordare simplă este utilizarea set(), în special atunci când aveți o listă lungă de coloane și nu doresc să se ocupe de le manual:

cols = list(set(df.columns.tolist()) - set(['mean']))
cols.insert(0, 'mean')
df = df[cols]

silgon · Answer 19 · 2017-12-18T15:24:07+00:00

Puteți folosi reindex` care poate fi folosit pentru ambele axe:

df
#           0         1         2         3         4      mean
# 0  0.943825  0.202490  0.071908  0.452985  0.678397  0.469921
# 1  0.745569  0.103029  0.268984  0.663710  0.037813  0.363821
# 2  0.693016  0.621525  0.031589  0.956703  0.118434  0.484254
# 3  0.284922  0.527293  0.791596  0.243768  0.629102  0.495336
# 4  0.354870  0.113014  0.326395  0.656415  0.172445  0.324628
# 5  0.815584  0.532382  0.195437  0.829670  0.019001  0.478415
# 6  0.944587  0.068690  0.811771  0.006846  0.698785  0.506136
# 7  0.595077  0.437571  0.023520  0.772187  0.862554  0.538182
# 8  0.700771  0.413958  0.097996  0.355228  0.656919  0.444974
# 9  0.263138  0.906283  0.121386  0.624336  0.859904  0.555009

df.reindex(['mean', *range(5)], axis=1)

#        mean         0         1         2         3         4
# 0  0.469921  0.943825  0.202490  0.071908  0.452985  0.678397
# 1  0.363821  0.745569  0.103029  0.268984  0.663710  0.037813
# 2  0.484254  0.693016  0.621525  0.031589  0.956703  0.118434
# 3  0.495336  0.284922  0.527293  0.791596  0.243768  0.629102
# 4  0.324628  0.354870  0.113014  0.326395  0.656415  0.172445
# 5  0.478415  0.815584  0.532382  0.195437  0.829670  0.019001
# 6  0.506136  0.944587  0.068690  0.811771  0.006846  0.698785
# 7  0.538182  0.595077  0.437571  0.023520  0.772187  0.862554
# 8  0.444974  0.700771  0.413958  0.097996  0.355228  0.656919
# 9  0.555009  0.263138  0.906283  0.121386  0.624336  0.859904

freeB · Answer 20 · 2018-01-29T18:57:18+00:00

Aici este o funcție pentru a face acest lucru pentru orice număr de coloane.

def mean_first(df):
    ncols = df.shape[1]        # Get the number of columns
    index = list(range(ncols)) # Create an index to reorder the columns
    index.insert(0,ncols)      # This puts the last column at the front
    return(df.assign(mean=df.mean(1)).iloc[:,index]) # new df with last column (mean) first