Написание панды DataFrame в файл CSV

Question

Дополнительно

Вопрос

Написание панды DataFrame в файл CSV

У меня есть структура данных в пандах, которую я хотел бы записать в файл CSV. Я делаю это, используя:

df.to_csv('out.csv')

И получить ошибку:

UnicodeEncodeError: 'ascii' codec can't encode character u'\u03b1' in position 20: ordinal not in range(128)

Есть ли способ обойти это легко (т.е. У меня есть символы Unicode в моей рамке данных)? И есть ли способ записать в файл с разделителями вкладок вместо CSV, например, используя. метод «в-таб» (который я не думаю, что существует)?

cs95

Редактировал вопрос 21-го мая 2019 в 3:27

csv

pandas

Решение / Ответ

17-го июля 2017 в 10:27

Дополнительно

Когда вы храните объект DataFrame в файле csv с помощью метода to_csv, вам, вероятно, не понадобится хранить предшествующие индексы каждой строки DataFrame объект.

Вы можете избежать этого, передав логическое значение False параметру index.

Несколько нравится:

df.to_csv(file_name, encoding='utf-8', index=False)

Так что, если ваш объект DataFrame похож на:

  Color  Number
0   red     22
1  blue     10

Файл CSV будет хранить:

Color,Number
red,22
blue,10

вместо (случай, когда было передано значение по умолчанию True)

,Color,Number
0,red,22
1,blue,10

cs95

Редактировал ответ 7-го апреля 2019 в 10:10

204

0

Glen Thompson

18-го января 2017 в 9:00

Дополнительно

Что-то еще, что вы можете попробовать, если у вас возникли проблемы с кодированием «utf-8» и вы хотите перейти по ячейкам, вы можете попробовать следующее.

Python 2

(Где «df» - ваш объект DataFrame.)

for column in df.columns:
    for idx in df[column].index:
        x = df.get_value(idx,column)
        try:
            x = unicode(x.encode('utf-8','ignore'),errors ='ignore') if type(x) == unicode else unicode(str(x),errors='ignore')
            df.set_value(idx,column,x)
        except Exception:
            print 'encoding error: {0} {1}'.format(idx,column)
            df.set_value(idx,column,'')
            continue

Тогда попробуй:

df.to_csv(file_name)

Вы можете проверить кодировку столбцов по:

for column in df.columns:
    print '{0} {1}'.format(str(type(df[column][0])),str(column))

Предупреждение: ошибки = 'ignore' просто опустят символ, например,.

IN: unicode('Regenexx\xae',errors='ignore')
OUT: u'Regenexx'

Python 3

for column in df.columns:
    for idx in df[column].index:
        x = df.get_value(idx,column)
        try:
            x = x if type(x) == str else str(x).encode('utf-8','ignore').decode('utf-8','ignore')
            df.set_value(idx,column,x)
        except Exception:
            print('encoding error: {0} {1}'.format(idx,column))
            df.set_value(idx,column,'')
            continue

Glen Thompson

Редактировал ответ 1-го декабря 2017 в 5:38

16

0

cs95

21-го мая 2019 в 3:16

Дополнительно

Чтобы записать Pandas DataFrame в файл CSV, вам потребуется DataFrame.to_csv . Эта функция предлагает множество аргументов с разумными значениями по умолчанию, которые вам чаще всего придется переопределять в соответствии с вашим конкретным вариантом использования. Например, вы можете использовать другой разделитель, изменить формат datetime или сбросить индекс при записи. to_csv имеет аргументы, которые вы можете передать для выполнения этих требований.

Вот таблица, в которой перечислены некоторые распространенные сценарии записи в файлы CSV и соответствующие аргументы, которые вы можете использовать для них.

Написать CSV ma чувак!

Сноски

Разделитель по умолчанию считается запятой (','). Не меняйте это, если не знаете, что вам нужно.

По умолчанию индекс df записывается как первый столбец. Если у вашей DataFrame нет индекса (IOW, df.index - это RangeIndex по умолчанию), то при записи вы захотите установить index = False. Чтобы объяснить это по-другому, если ваши данные имеют индекс, вы можете (и должны) использовать index = True или просто полностью исключить его (по умолчанию True).

Было бы целесообразно установить этот параметр, если вы пишете строковые данные, чтобы другие приложения знали, как читать ваши данные. Это также позволит избежать любых потенциальных UnicodeEncodeError, с которыми вы можете столкнуться при сохранении.

Сжатие рекомендуется, если вы записываете большие DataFrames (> 100K строк) на диск, так как это приведет к гораздо меньшим выходным файлам. OTOH, это будет означать, что время записи увеличится (и, следовательно, время чтения, так как файл нужно будет распаковать).

cs95

Редактировал ответ 28-го мая 2019 в 4:07

6

0

Yury Wallet

26-го января 2018 в 3:35

Дополнительно

это может быть не ответ для этого случая, но поскольку у меня было то же сообщение об ошибке с < i > .to_csv < / i > Я попробовал < i > .toCSV ('name.csv') < / i > и сообщение об ошибке было другим (объект '' SparseDataFrame' не имеет атрибута '). Таким образом, проблема была решена путем преобразования планера данных в плотный планер данных

df.to_dense().to_csv("submission.csv", index = False, sep=',', encoding='utf-8')

Yury Wallet

Редактировал ответ 26-го января 2018 в 5:04

4

0

Harvey

8-го августа 2019 в 12:23

Дополнительно

Пример экспорта в файл с полным путем в Windows и в случае, если ваш файл имеет заголовки:

df.to_csv (r'C:\Users\John\Desktop\export_dataframe.csv', index = None, header=True)

Пример, если вы хотите сохранить в экспорте папок тот же каталог, в котором находится ваш скрипт с кодировкой utf-8 и вкладкой в качестве разделителя:

df.to_csv(r'./export/dftocsv.csv', sep='\t', encoding='utf-8', header='true')

1

0

Похожие сообщества 30

Python beginners

14 568 пользователей

Вопросы про Python для чайников. Cпам и троллинг неприемлем. Частозадаваемые вопросы: https://github.com/ru-python-beginners/faq/blob/master/README.md Правила группы: https://t.me/ru_python_beginners/2752736

Открыть telegram

Python

13 656 пользователей

Уютный чат для профессионалов, занимающихся поиском питоньих мудростей. Как не получить бан: https://t.me/ru_python/1961404

Открыть telegram

🐍 Python Stepik Chat

11 621 пользователей

Этот уютный чат создан для помощи в решение задач на прекрасном курсе "Поколение Python: курс для начинающих" и не только. Правила: https://t.me/pythonstepikchat/619142 Чат для оффтопа - t.me/+fqNb78zlQY81NGUy Наш канал - @kimport_this

Открыть telegram

Вакансии для Python-разработчиков / Python Jobs

6 970 пользователей

Как разместить вакансию? — https://t.me/ru_pythonjobs/21926 Размещение вакансий бесплатно. Только Python. Рекламы нет.

Открыть telegram

Python — вакансии и аналитика

6 933 пользователей

Публикуем вакансии и запросы на поиск работы по направлению Python, Flask и т.д. Здесь всё: full-time, part-time, remote и разовые подработки. См. также: @golang_jobs, @qa_jobs, @devops_jobs, @javascript_jobs, @nodejs_jobs, @uiux_jobs, @products_jobs

Открыть telegram