Панды сумма путем метода groupBy, но исключить определенные столбцы

Question

Дополнительно

Вопрос

Панды сумма путем метода groupBy, но исключить определенные столбцы

Что это лучший способ, чтобы сделать groupBy на одной панды фрейма данных, но исключить некоторые столбцы из этого метода groupBy? например, у меня есть следующие таблицы данных: нет Страна Код Товара Блок Item_Code Ele_Code Y1961 Y1962 Y1963 2 Афганистан 15 Пшеницы 5312 Га 10 20 30 2 Афганистан 25 Кукурузы 5312 Га 10 20 30 4 Ангола 15 Пшеницы 7312 Га 30 40 50 4 Анголе 25 Кукурузы 7312 Га 30 40 50 `` Я хочу, чтобы метод groupBy графе Страна и Item_Code и только вычислить сумму строк, попадающих под колонны Y1961, Y1962 и Y1963. Результирующие таблицы данных должна выглядеть следующим образом: нет Страна Код Товара Блок Item_Code Ele_Code Y1961 Y1962 Y1963 2 Афганистан 15 С3 5312 Га 20 40 60 4 Анголе 25 С4 7312 Га 60 80 100 `` Прямо сейчас я делаю это:

df.groupby('Country').sum()

Однако это сложение значений в столбце Item_Code, а также. Есть ли способ я могу указать, какие столбцы следует включить в сумму операции ()`, а какие исключить?

karel

Редактировал вопрос 3-го марта 2019 в 2:46

pandas

Решение / Ответ

leroyJr

24-го сентября 2015 в 12:04

Дополнительно

Функция агг будет делать это за вас. Проходят колонны и функционировать как дикт с колонкой, вывод:

df.groupby(['Country', 'Item_Code']).agg({'Y1961': np.sum, 'Y1962': [np.sum, np.mean]})  # Added example for two output columns from a single input column

Это будет отображать только группы по столбцам, и указанной совокупности столбцов. В этом примере я включил две функции агг применяется к 'Y1962'.

Чтобы получить именно то, что вы надеялись увидеть, включить другие столбцы в группе, и применить сумм к y переменные в кадре:

df.groupby(['Code', 'Country', 'Item_Code', 'Item', 'Ele_Code', 'Unit']).agg({'Y1961': np.sum, 'Y1962': np.sum, 'Y1963': np.sum})

leroyJr

Редактировал ответ 24-го сентября 2015 в 12:11

34

0

Superstar

8-го октября 2016 в 10:18

Дополнительно

Если вы ищете более универсальный способ применим ко многим колонок, что вы можете сделать, это создать список имен столбцов и передать его в качестве индекса сгруппированы в таблицы данных. В вашем случае, например:

columns = ['Y'+str(i) for year in range(1967, 2011)]

df.groupby('Country')[columns].agg('sum')

Richard

Редактировал ответ 16-го сентября 2017 в 12:35

11

0

Похожие сообщества 30

Python beginners

14 568 пользователей

Вопросы про Python для чайников. Cпам и троллинг неприемлем. Частозадаваемые вопросы: https://github.com/ru-python-beginners/faq/blob/master/README.md Правила группы: https://t.me/ru_python_beginners/2752736

Открыть telegram

Python

13 656 пользователей

Уютный чат для профессионалов, занимающихся поиском питоньих мудростей. Как не получить бан: https://t.me/ru_python/1961404

Открыть telegram

🐍 Python Stepik Chat

11 621 пользователей

Этот уютный чат создан для помощи в решение задач на прекрасном курсе "Поколение Python: курс для начинающих" и не только. Правила: https://t.me/pythonstepikchat/619142 Чат для оффтопа - t.me/+fqNb78zlQY81NGUy Наш канал - @kimport_this

Открыть telegram

Вакансии для Python-разработчиков / Python Jobs

6 970 пользователей

Как разместить вакансию? — https://t.me/ru_pythonjobs/21926 Размещение вакансий бесплатно. Только Python. Рекламы нет.

Открыть telegram

Python — вакансии и аналитика

6 933 пользователей

Публикуем вакансии и запросы на поиск работы по направлению Python, Flask и т.д. Здесь всё: full-time, part-time, remote и разовые подработки. См. также: @golang_jobs, @qa_jobs, @devops_jobs, @javascript_jobs, @nodejs_jobs, @uiux_jobs, @products_jobs

Открыть telegram