Panda sum dengan groupby, tetapi mengecualikan beberapa kolom

Question

Lebih

Question

Panda sum dengan groupby, tetapi mengecualikan beberapa kolom

Apa cara terbaik untuk melakukan groupby pada Panda dataframe, tetapi mengecualikan beberapa kolom dari yang groupby? misalnya saya memiliki berikut dataframe: tidak ada Kode Negara Item_Code Item Ele_Code Unit Y1961 Y1962 Y1963 2 Afghanistan 15 Gandum 5312 Ha 10 20 30 2 Afghanistan 25 Jagung 5312 Ha 10 20 30 4 Angola 15 Gandum 7312 Ha 30 40 50 4 Angola 25 Jagung 7312 Ha 30 40 50 Saya ingin groupby kolom Negara dan Item_Code dan hanya menghitung jumlah baris yang jatuh di bawah kolom Y1961, Y1962 dan Y1963. Yang dihasilkan dataframe harus terlihat seperti ini: tidak ada Kode Negara Item_Code Item Ele_Code Unit Y1961 Y1962 Y1963 2 Afghanistan 15 C3 5312 Ha 20 40 60 4 Angola 25 C4 7312 Ha 60 80 100 Sekarang saya melakukan ini:

df.groupby('Country').sum()

Namun hal ini menambah nilai dalam Item_Code kolom juga. Apakah ada cara saya dapat menentukan kolom mana yang akan disertakan dalam jumlah ' () operasi dan mana yang untuk mengecualikan?

karel

Pertanyaan edit 3 Maret 2019 в 2:46

pandas

Solution / Answer

leroyJr

24 September 2015 в 12:04

Lebih

The agg fungsi akan melakukan ini untuk anda. Melewati kolom dan fungsi sebagai dict dengan kolom, output:

df.groupby(['Country', 'Item_Code']).agg({'Y1961': np.sum, 'Y1962': [np.sum, np.mean]})  # Added example for two output columns from a single input column

Ini hanya akan menampilkan group by kolom, dan ditentukan agregat kolom. Dalam contoh ini saya termasuk dua agg fungsi diterapkan untuk 'Y1962'.

Untuk mendapatkan apa yang anda harapkan untuk melihat, termasuk kolom lain dalam grup, dan menerapkan jumlah ke variabel Y dalam rangka:

df.groupby(['Code', 'Country', 'Item_Code', 'Item', 'Ele_Code', 'Unit']).agg({'Y1961': np.sum, 'Y1962': np.sum, 'Y1963': np.sum})

leroyJr

Jawaban edit 24 September 2015 в 12:11

34

0

Superstar

8 Oktober 2016 в 10:18

Lebih

Jika anda sedang mencari lebih banyak cara umum untuk diterapkan ke banyak kolom, apa yang dapat anda lakukan adalah untuk membangun sebuah daftar dari nama-nama kolom dan lulus sebagai indeks yang dikelompokkan dataframe. Dalam kasus anda, misalnya:

columns = ['Y'+str(i) for year in range(1967, 2011)]

df.groupby('Country')[columns].agg('sum')

Richard

Jawaban edit 16 September 2017 в 12:35

11

0

Related communities 6

Python Indonesia

25 972 pengguna

Programmer Python Indonesia. Group ini dikelola oleh sejumlah admin. Baca pesan tersemat / pinned message: https://t.me/pythonID/217588

Buka telegram

Indonesian Python Warriors

1 564 pengguna

Di grup ini tidak ada kewajiban untuk menggunakan username dan foto. Yang tidak boleh adalah spamming. Gak boleh baper, kalau nanya yang bener, eror jangan difoto pake HP, gunakan screenshot, code copas ke dpaste.org lalu share link ke sini.

Buka telegram

Python-ID Jogja

947 pengguna

Buka telegram

Python Newbie Indonesia

471 pengguna

Peraturan grup Python Newbie 🌻Dilarang spam 🌻Dilarang menggunakan bahasa kasar 🌻Dilarang beriklan di grup tanpa seizin admin Beberapa video dasar python dapat diliat melalui channel youtube juan aditya Jangan lupa untuk subscribe ya🙏

Buka telegram

BASIC PYTHON INDONESIA

351 pengguna

Buka telegram

PythonWealth Indonesia 🇮🇩

14 pengguna

Buka telegram

Tambahkan pertanyaan

Kategori

Semua

Teknologi

Budaya / Rekreasi

Kehidupan / Seni

Ilmu Pengetahuan

Profesional

Bisnis

Pengguna

Semua

Baru

Populer

1

Ксения Комарова

Terdaftar 1 bulan yang lalu

2

Артур «Апер»

Terdaftar 2 bulan yang lalu

3

Viktor Malyutin

Terdaftar 2 bulan yang lalu

4

Viktor Malyutin

Terdaftar 2 bulan yang lalu

5

Syahputra Zhedenk

Terdaftar 3 bulan yang lalu

Anda punya pertanyaan? Tambahkan di situs dan dapatkan jawabannya secara instan

id.kzen.dev

Andy Hayden · Accepted Answer · 2015-09-24T00:12:27+00:00

Anda dapat memilih kolom dari groupby:

In [11]: df.groupby(['Country', 'Item_Code'])[["Y1961", "Y1962", "Y1963"]].sum()
Out[11]:
                       Y1961  Y1962  Y1963
Country     Item_Code
Afghanistan 15            10     20     30
            25            10     20     30
Angola      15            30     40     50
            25            30     40     50

Perhatikan bahwa daftar lulus harus subset dari kolom jika tidak, anda'll melihat KeyError.