kzen.dev
  • 질문
  • 태그
  • 사용자
알림
보상
등록
등록을 마치면 질문에 대한 답변과 의견이 통보됩니다.
로그인
계정이 이미 있는 경우 로그인하여 새 알림을 확인합니다.
추가 질문, 답변 및 코멘트에 대한 보상이 제공됩니다.
더보기
원본
편집
 abuteau
abuteau
Question

Python Panda 데이터 토큰화 오류

팬더를 사용하여 .csv 파일을 조작하려고 하는데 다음과 같은 오류가 발생합니다.

parser.parser.>파서.CParserError: 데이터를 토큰화하는 중 오류가 발생했습니다. C 오류: 3행에는 2개의 필드가 있어야 하는데 12개가 있습니다.

판다의 문서를 읽어보려고 노력했지만 아무것도 찾지 못했어요.

내 코드는 간단합니다:

path = 'GOOG Key Ratios.csv'
#print(open(path).read())
data = pd.read_csv(path)

어떻게 해결할 수 있을까요? 'csv' 모듈을 사용해야 합니까 아니면 다른 언어를 사용해야 합니까?

파일은 Morningstar에서 가져옵니다.

281 2013-08-04T01:54:45+00:00 20
Ronak Shah
Ronak Shah
편집된 질문30일 12월 2017 в 3:00
프로그래밍
csv
python
pandas
Popular videos
판다스에서 파일경로 확인과 불러오기 (FileNotFoundError 오류 해결하기)
판다스에서 파일경로 확인과 불러오기 (FileNotFoundError 오류 해결하기)
4년 전
[SOLVED] ParserError: Error tokenizing data. C error - Solve in 10 Secs
[SOLVED] ParserError: Error tokenizing data. C error - Solve in 10 Secs
2년 전
판다와 손잡은 파이썬 (파이썬 엑셀 다루기)
판다와 손잡은 파이썬 (파이썬 엑셀 다루기)
1년 전
Pandas의 기본 사용법 [ Python 데이터 분석과 이미지 처리 ]
Pandas의 기본 사용법 [ Python 데이터 분석과 이미지 처리 ]
3년 전
파이썬 판다스로 회사 엑셀데이터 전처리 하는 방법 ! 1탄 (Python / Pandas) #Python #파이썬 #Pandas
파이썬 판다스로 회사 엑셀데이터 전처리 하는 방법 ! 1탄 (Python / Pandas) #Python #파이썬 #Pandas
1년 전
[1/7] Python, Pandas,  folium으로 스타벅스, 이디야 매장 위치 분석하기
[1/7] Python, Pandas, folium으로 스타벅스, 이디야 매장 위치 분석하기
4년 전
[Pandas 강의] 파일에서 데이터 불러오기
[Pandas 강의] 파일에서 데이터 불러오기
5년 전
파이썬 판다스 데이터프레임의 중요 함수를 배워보자. Python Pandas의 기본 활용
파이썬 판다스 데이터프레임의 중요 함수를 배워보자. Python Pandas의 기본 활용
2년 전
[매일 10분 데이터 분석] 날짜데이터를 처리 하자! 1편 (python / date time / pandas) #Python #파이썬 #Pandas
[매일 10분 데이터 분석] 날짜데이터를 처리 하자! 1편 (python / date time / pandas) #Python #파이썬 #Pandas
2년 전
[Chapter #2] 2.파이썬 데이터 읽기, 이렇게 쉽게 가능해? 판다스(Pandas)의 등장! 사용하기전에 알면 좋은 방법론! (부동산 데이터 제공!)
[Chapter #2] 2.파이썬 데이터 읽기, 이렇게 쉽게 가능해? 판다스(Pandas)의 등장! 사용하기전에 알면 좋은 방법론! (부동산 데이터 제공!)
3년 전
모듈 설치 문제로 인한 고통을 줄이자 - VS Code 가상환경
모듈 설치 문제로 인한 고통을 줄이자 - VS Code 가상환경
1년 전
[13/29] Pandas 기초 - 파이썬 판다스로 pd.concat([df1,df2]) 시리즈, 데이터프레임 합치기
[13/29] Pandas 기초 - 파이썬 판다스로 pd.concat([df1,df2]) 시리즈, 데이터프레임 합치기
3년 전
파이썬 공공데이터 분석[2/6] - Pandas로 데이터 불러오고 요약하기
파이썬 공공데이터 분석[2/6] - Pandas로 데이터 불러오고 요약하기
4년 전
03 판다스(pandas)로 엑셀(csv)데이터 불러오기
03 판다스(pandas)로 엑셀(csv)데이터 불러오기
4년 전
[7/29] Pandas 기초 - 파이썬 판다스로 기본 통계 하기 value_counts, nunique, sum, count, mean, median 튜토리얼 강의
[7/29] Pandas 기초 - 파이썬 판다스로 기본 통계 하기 value_counts, nunique, sum, count, mean, median 튜토리얼 강의
3년 전
« 이전
다음 »
이 질문은 영어로 1답번으로 되어 있는데, 그것을 읽으려면 로그 인. 당신이 보기에.
Solution / Answer
 richie
richie
8일 8월 2013 в 2:47
2013-08-08T14:47:15+00:00
더보기
원본
편집
#20551641

시도해 볼 수도 있습니다;

data = pd.read_csv('file1.csv', error_bad_lines=False)

이렇게 하면 위반되는 줄은 건너뜁니다.

 Renaud
Renaud
편집된 답변4일 3월 2019 в 4:44
421
0
 grisaitis
grisaitis
28일 10월 2014 в 2:18
2014-10-28T02:18:23+00:00
더보기
원본
편집
#20551643

이 문제가 될 수 있습니다

  • 이 고객의 데이터 구분
  • 첫 번째 행, @TomAugspurger 있다 "고 전했다

이를 해결하기 위해 9월 ',' 지정 및 / 또는 '헤더입니다 시도하시겠습니까 호출할 때' '인수만 read_csv'. 예를 들어,

df = pandas.read_csv(fileName, sep='delimiter', header=None)

위의 코드에서 '와' 헤더입니다 알 수 있는 '판다' 는 9월 너회의 구분 = 없음) 의 소스 데이터 주님으로부터그에게 행일 헤더도 / 열 개의 국내 타이틀을 우승하였다. 이렇게 말하는 이 문서: 헤더 파일이 포함되어 있지, 만약 &quot 행일 관심용 전달하십시오 헤더입니다 = None&quot, 명시적으로 합니다. 예를 들어, 정수 자동으로 만들어집니다.}, {0.1,2 각 분야의 지수 판다.

    • 문제가 될 게 없는 docs 에 따르면 구분 한다. 이 문서 할 말이 없는 경우, 9월 &quot [지정되지 않은] this.&quot 자동으로 판별할 수 있도록 노력하겠다. 하지만 난 적이 없는 등 함께 좋은 운빨이야 대체하십시오 인스턴스들도 명백하네 구분.
 grisaitis
grisaitis
편집된 답변5일 6월 2018 в 2:24
This API page has moved
pandas.pydata.org
77
0
 TomAugspurger
TomAugspurger
4일 8월 2013 в 2:24
2013-08-04T02:24:35+00:00
더보기
원본
편집
#20551640

파서가 파일의 헤더로 인해 혼동되고 있습니다. 첫 번째 행을 읽고 해당 행의 열 수를 추측합니다. 그러나 처음 두 행은 파일의 실제 데이터를 나타냅니다.

'data = pd.read_csv(경로, skiprow=2)'를 사용하여 시도하십시오.

38
0
 computerist
computerist
31일 3월 2017 в 4:29
2017-03-31T16:29:00+00:00
더보기
원본
편집
#20551648

네 CSV 파일 '에서' 유추 할 수가 가변적입니다 read_csv 열과 열 수가 처음 몇 행뿐만. 이를 해결하기 위해 두 가지 방법으로 이 경우:

  1. 할 수 있는 첫 번째 줄을 맥스야 CSV 파일 변경하십시오 더미 (dummy) 열 (지정하고 '헤더입니다 = [0]')

  2. 사용 목록 (범위 (0, N)) '또는' 이름 = 여기서 N 은 최대 열.

 Ajean
Ajean
편집된 답변20일 9월 2017 в 12:53
28
0
Piyush  S. Wanare
Piyush S. Wanare
1일 4월 2015 в 5:42
2015-04-01T05:42:48+00:00
더보기
원본
편집
#20551644

이건 분명히 문제가 구분, csv CSV 는 9월 = & # 39 로 대부분 잡을라는데 사용하여 만든 ',', '그래서 /t& # 39 를 사용하여 시도하시겠습니까 read_csv' 탭 문자 ' (\t)' 분리자의 사용하여 '/ t'. 따라서 열려면 다음과 같은 코드를 사용하여 시도하시겠습니까 할말이다

data=pd.read_csv("File_path", sep='\t')
17
0
Robert Geiger
Robert Geiger
4일 2월 2016 в 10:16
2016-02-04T22:16:44+00:00
더보기
원본
편집
#20551645

내가 가진 것은 아마도 이 문제가 아니라 다른 이유. 나는 내 뒤에 있던 쉼표 CSV 는 약간의 열을 추가 읽으려고 판다. 하지만 다음 작품을 통해 단순히 흐름선 나쁜거라 무시합니다.

data = pd.read_csv('file1.csv', error_bad_lines=False)

추악한 흐름선 유지하려면 한 종류의 해킹 처리하는 것이 뭔가 오류가 다음과 같습니다.

line     = []
expected = []
saw      = []     
cont     = True 

while cont == True:     
    try:
        data = pd.read_csv('file1.csv',skiprows=line)
        cont = False
    except Exception as e:    
        errortype = e.message.split('.')[0].strip()                                
        if errortype == 'Error tokenizing data':                        
           cerror      = e.message.split(':')[1].strip().replace(',','')
           nums        = [n for n in cerror.split(' ') if str.isdigit(n)]
           expected.append(int(nums[0]))
           saw.append(int(nums[2]))
           line.append(int(nums[1])-1)
         else:
           cerror      = 'Unknown'
           print 'Unknown Error - 222'

if line != []:
    # Handle the errors however you want

내가 쓸 수 차례 스크립트입니다 흐름선 재장착하려면 다테프라임 꽂으십시오 이후 line& # 39, & # 39 변수에 의해 나쁜거라 흐름선 나옵니다. 위 코드입니다. Csv 판독기에서 사용하기만 하면 이 피할 수 있습니다. 향후 이 상황에 대처할 수 있는 개발자들이 쉽게 판다 기대해 본다.

16
0
Steven Rouk
Steven Rouk
8일 1월 2019 в 6:57
2019-01-08T18:57:22+00:00
더보기
원본
편집
#20551664

내가 가진 것 없이 읽을 수 있는 것은 이 문제를 어디서 CSV 반군지역 열 이름.

df = pd.read_csv(filename, header=None)

나는 열 이름을 미리 지정된 후 목록에 이름을 바로 해결 및 정보기술 (it) ',' 전달하십시오 묶습니다. # 39 열 이름을 설정할 수 없는 경우, 그냥 don& 만들 수 있는 최대 열이 많은 자리표시자 이름으로 고객의 데이터.

col_names = ["col1", "col2", "col3", ...]
df = pd.read_csv(filename, names=col_names)
11
0
 elPastor
elPastor
7일 7월 2016 в 5:22
2016-07-07T17:22:00+00:00
더보기
원본
편집
#20551646

39 이 문제를 몇 번 i&, 내 자신을 숨기지 않았다. 거의 모든 시간, 그 이유는 해당 파일이 저장된 CSV 는 열려고 시도하는 것은 내가 제대로 꼴입니다. , 내 말은 각 행은 동일한 수의 뒤를 &quot properly&quot 경식도 구분 또는 열.

내가 잘못 때문에 일반적으로 발생했습니까 CSV Excel 에서 연 다음 구했잖아 거잖나. 비록 파일 확장자는 .csv 형식, CSV 는 여전히 순수한 그동안 변경됩니다.

39 마리의 to_csv 저장된 모든 파일을 통해 이 문제를 제대로 포맷하여 shouldn&, 될 수 없다. 하지만 대화 상자를 열면 다른 프로그램을 통해 구조를 변경할 수 있습니다.

도움이 되길 바란다.

10
0
 Legend_Ari
Legend_Ari
30일 6월 2014 в 11:46
2014-06-30T11:46:21+00:00
더보기
원본
편집
#20551642

저도 같은 문제를 접했어요. 동일한 소스 파일에 'pd.read_table()'을 사용하는 것이 작동하는 것처럼 보였습니다. 나는 이것에 대한 이유를 추적할 수 없었지만 그것은 나의 경우에 유용한 해결 방법이었어. 아마도 더 박식한 누군가가 왜 그것이 작동했는지 더 밝혀줄 수 있을 것이다.

편집: 파일에 실제 데이터와 동일한 형식이 아닌 텍스트가 있을 때 이 오류가 발생하는 것을 발견했습니다. 이것은 일반적으로 머리글 또는 바닥글 정보이며(한 줄 이상 크므로 skip_header가 작동하지 않음't) 실제 데이터와 같은 수의 쉼표로 구분되지 않습니다(read_csv 사용 시). read_table을 사용하면 탭을 구분 기호로 사용하여 사용자의 현재 오류를 우회하지만 다른 오류를 도입할 수 있습니다.

나는 보통 파일에 여분의 데이터를 읽고 read_csv() 방법을 사용함으로써 이것을 해결한다.

정확한 해결책은 실제 파일에 따라 다를 수 있지만, 이 방법은 여러 경우에 효과가 있었습니다.

7
0
 lotrus28
lotrus28
24일 4월 2017 в 11:28
2017-04-24T11:28:41+00:00
더보기
원본
편집
#20551649

39 i& 비슷한 문제가 발생, 읽을 수 있는 테이블을 공백 탭으로 구분된 숨기지 않았다, 쉼표 및 인용:

1115794 4218    "k__Bacteria", "p__Firmicutes", "c__Bacilli", "o__Bacillales", "f__Bacillaceae", ""
1144102 3180    "k__Bacteria", "p__Firmicutes", "c__Bacilli", "o__Bacillales", "f__Bacillaceae", "g__Bacillus", ""
368444  2328    "k__Bacteria", "p__Bacteroidetes", "c__Bacteroidia", "o__Bacteroidales", "f__Bacteroidaceae", "g__Bacteroides", ""

import pandas as pd
# Same error for read_table
counts = pd.read_csv(path_counts, sep='\t', index_col=2, header=None, engine = 'c')

pandas.io.common.CParserError: Error tokenizing data. C error: out of memory

이 있다고 캜 구문 분석 엔진 (디스크입니다. 기본값입니다) 한 관련이 있다. 아마 어떤 것도 변화시킬 수 있는 한, 파이썬 변경됩니까 &lt br&gt.

counts = pd.read_table(path_counts, sep='\t', index_col=2, header=None, engine='python')

Segmentation fault (core dumped)

바로 그것이 다른 error.&lt br>; 만약 우리가 박으래도 지루려면 시도하시겠습니까 공백을 테이블에서 파이썬 engine 변경 및 오류 다시 한 번:

1115794 4218    "k__Bacteria","p__Firmicutes","c__Bacilli","o__Bacillales","f__Bacillaceae",""
1144102 3180    "k__Bacteria","p__Firmicutes","c__Bacilli","o__Bacillales","f__Bacillaceae","g__Bacillus",""
368444  2328    "k__Bacteria","p__Bacteroidetes","c__Bacteroidia","o__Bacteroidales","f__Bacteroidaceae","g__Bacteroides",""

_csv.Error: '   ' expected after '"'

문제가 있는 것은 우리의 행뿐만 구문 분석 및 it gets 선택해제합니다 판다. 내가 필요한 모든 공간 및 파이썬 engine 분석할 수 있는 테이블을 지루려면 인용 테이블 신청했다. 한편 캜 engine 포함 추락한 있는 쉼표는 행뿐만 지켰다. &lt br>; &lt br>; 내가 가진 새 파일을 생기지 않도록 교체품을 이런게야 내 테이블 등 작다. &lt br>;

from io import StringIO
with open(path_counts) as f:
    input = StringIO(f.read().replace('", ""', '').replace('"', '').replace(', ', ',').replace('\0',''))
    counts = pd.read_table(input, sep='\t', index_col=2, header=None, engine='python')
  • tl; dr * &lt br>; 구문 분석 엔진, 시도하시겠습니까 변경하십시오 비사양 제한되지 않은 견적 / / 공백을 방지하기 위해 쉼표 고객의 데이터.
5
0
 user3426943
user3426943
26일 6월 2019 в 7:09
2019-06-26T19:09:22+00:00
더보기
원본
편집
#20551682

제가 가지고 있는 데이터세트를 사용되는 많은 쿼트에 자국이야 (") 불필요한 서식을 사용할 수 있다. 그는 이러한 오류는 매개변수입니다 해결할 수 있는 등 이른바 'read_csv ()' ':

"'파이썬

3 = 3 인용 csv 로 상호. 대한 quote_none 판다

4
0
Bhavesh Kumar
Bhavesh Kumar
21일 11월 2018 в 1:03
2018-11-21T13:03:24+00:00
더보기
원본
편집
#20551662

사용할 수 있는 매개변수입니다 구분

pd.read_csv(filename, delimiter=",", encoding='utf-8')

It 읽습니다.

4
0
 RegularlyScheduledProgram
RegularlyScheduledProgram
3일 10월 2016 в 3:45
2016-10-03T15:45:19+00:00
더보기
원본
편집
#20551647

이 질문에 대한 것은 아니지만, 이 사건을 통해 압축된 데이터 오류 나타날 수도 있습니다. 값 설정 '이 문제를 명시적으로 콰리' '압축' 해결되었으므로.

result = pandas.read_csv(data_source, compression='gzip')
3
0
 kepy97
kepy97
23일 5월 2018 в 11:45
2018-05-23T11:45:25+00:00
더보기
원본
편집
#20551656

다음과 같은 순서로 작동됨 명령 (I 손실됩니다 첫 줄의 데이터 (= 없음 - 아니 헤더입니다 χ02 있지만, 적어도 이 로드되는지):

df = pd.read_csv (파일_이름, ' 우스콜스 = 범위 (0, 42)) 드프스콜럼너스 = [& # 39, YR& # 39, & # 39, MO& # 39, & # 39, DAY& # 39, & # 39, HR& # 39, & # 39, MIN& # 39, & # 39, & # 39, HUND& SEC& # 39, # 39;;

39, & # 39, & # 39, & # 39, ERROR& RECTYPE& LANE& # 39, & # 39,,, # 39, & # 39 CLASS& SPEED& # 39, # 39;;

39, & # 39, & # 39, & # 39, LENGTH& GVW& ESAL& # 39, & # 39,,, # 39, & # 39, & # 39, W1& S1& # 39, & # 39,,, # 39 W2& # 39 S2& # 39;

39, & # 39, & # 39, & # 39, W3& S3& W4& # 39, & # 39,,, # 39, & # 39, & # 39, S4& W5& S5& # 39, & # 39,, # 39, & # 39 S6& W6& # 39, # 39, # 39;;

39, & # 39, & # 39, & # 39, W7& S7& W8& # 39, & # 39,,, # 39, & # 39, & # 39, S8& W9& S9& # 39, & # 39,, # 39, & # 39 S10& W10& # 39, # 39, # 39;;

& # 39, W11& # 39, & # 39, S11& # 39, & # 39, W12& # 39, & # 39, S12& # 39, & # 39, W13& # 39, & # 39, & # 39, # 39 W14& S13& # 39;;;] '

다음과 같은 작동하지 않습니다.

df = pd.read_csv (파일_이름, ' 이름 = [& # 39, YR& # 39, & # 39, MO& # 39, & # 39, DAY& # 39, & # 39, HR& # 39, & # 39, MIN& # 39, & # 39, & # 39, HUND& SEC& # 39, # 39;;

39, & # 39, & # 39, & # 39, ERROR& RECTYPE& LANE& # 39, & # 39,,, # 39, & # 39 CLASS& SPEED& # 39, # 39;;

39, & # 39, & # 39, & # 39, LENGTH& GVW& ESAL& # 39, & # 39,,, # 39, & # 39, & # 39, W1& S1& # 39, & # 39,,, # 39 W2& # 39 S2& # 39;

39, & # 39, & # 39, & # 39, W3& S3& W4& # 39, & # 39,,, # 39, & # 39, & # 39, S4& W5& S5& # 39, & # 39,, # 39, & # 39 S6& W6& # 39, # 39, # 39;;

39, & # 39, & # 39, & # 39, W7& S7& W8& # 39, & # 39,,, # 39, & # 39, & # 39, S8& W9& S9& # 39, & # 39,, # 39, & # 39 S10& W10& # 39, # 39, # 39;;

& # 39, W11& # 39, & # 39, S11& # 39, & # 39, W12& # 39, & # 39, S12& # 39, & # 39, W13& # 39, & # 39, & # 39, # 39 W14& S13& # 39;;;] 우스콜스 = 범위 (0, 42)) '

스파서에로: 토큰 화 데이터 오류. 캜 오류: 걱정했던것 53 필드에 1605634 54 선 · 표면탄성파 (saw) 다음과 같은 작동하지 않습니다.

df = pd.read_csv (파일_이름, ' 헤더입니다 = 없음) '

스파서에로: 토큰 화 데이터 오류. 캜 오류: 걱정했던것 53 필드에 1605634 54 선 · 표면탄성파 (saw)

따라서 이 문제를 전달하십시오 우스콜스 = 범위 (0, 2) '' 합니다.

3
0
 Abhishek
Abhishek
2일 1월 2018 в 9:56
2018-01-02T09:56:48+00:00
더보기
원본
편집
#20551654

사용 'pandas.read_csv (& # 39, CSVFILENAME& # 39, & # 39, & # 39, 9월 = 헤더입니다 = 없음;;)'

csv 데이터 링크를 통해 읽을 수 있도록 할 때

http://archive.ics.uci.edu/ml/machine-learning-databases/adult/adult.data

난 내 데이터 복사됨 사이트에서 agent. 치프필레. 그래서 & # 39, & # 39 이 공백 = 9월 사용되는 했다. 또한 협력했습니다:)

2
0
 bcoz
bcoz
26일 1월 2018 в 8:54
2018-01-26T20:54:38+00:00
더보기
원본
편집
#20551655

나는 유용할 수 있는 대안이 비슷한 문제를 다루는 모듈을 사용하여 구문 분석 오류뿐만 CSV 에 데이터를 재지정할 df 판다. 예를 들면 다음과 같습니다.

import csv
import pandas as pd
path = 'C:/FileLocation/'
file = 'filename.csv'
f = open(path+file,'rt')
reader = csv.reader(f)

#once contents are available, I then put them in a list
csv_list = []
for l in reader:
    csv_list.append(l)
f.close()
#now pandas has no problem getting into a df
df = pd.DataFrame(csv_list)

다운로드합니까 CSV 파일 등) 로 잘못 포맷됩니다 모듈을 좀 더 강력한 쉼표로 구분된 이 라우트를 문제를 해결하기 위해 이 같은 성공을 거둘 수 없었을 것이다.

2
0
Kims Sifers
Kims Sifers
15일 11월 2017 в 10:59
2017-11-15T10:59:33+00:00
더보기
원본
편집
#20551652

가끔 파이썬 갖추고 있지만, 원시 데이터를 사용하는 방법에 문제가 아니다. 내가 맡을게 오류 메시지

Error tokenizing data. C error: Expected 18 fields in line 72, saw 19.

가끔 쉼표 설명스크립트 열 것으로 드러나 있었다. 즉, CSV 파일 클리닝해야 백업하도록 또는 다른 사용되는 분리자의.

 Aks4125
Aks4125
편집된 답변15일 11월 2017 в 12:13
2
0
 Dirk
Dirk
20일 8월 2019 в 9:37
2019-08-20T09:37:20+00:00
더보기
원본
편집
#20551688

다음 협력했습니다 가져다줄래요 (제가 이 질문에 내가 만약 이 문제가 있기 때문에 특별히 게시하기를 구글 콜라보라토리 노트북):

df = pd.read_csv("/path/foo.csv", delimiter=';', skiprows=0, low_memory=False)
2
0
 Zstack
Zstack
14일 10월 2019 в 2:54
2019-10-14T14:54:07+00:00
더보기
원본
편집
#20551701

비슷한 사람들을 위한 파이썬 3 에 리눅스 운용체계 (os) 문제를 겪고 있다.

pandas.errors.ParserError: Error tokenizing data. C error: Calling
read(nbytes) on source failed. Try engine='python'.

종료기:

df.read_csv('file.csv', encoding='utf8', engine='python')
 double-beep
double-beep
편집된 답변14일 10월 2019 в 3:11
2
0
Kareem Jeiroudi
Kareem Jeiroudi
3일 11월 2019 в 9:35
2019-11-03T09:35:50+00:00
더보기
원본
편집
#20551703

내가 봐도 알 수 있고, 멀리는 이수한 뒤 해당 파일, 문제는 # 39, csv 파일 you& re 로드하려고 시도할 복수의 표. 표 제목에 포함된 줄을 선 또는 비어 있습니다. 가지고 시도하시겠습니까 이걸봐 [스택 오버플로 오토메이티드] (https://stackoverflow.com/questions/34184841/python-pandas-read-csv-file-containing-multiple-tables # 34188535 오토메이티드). 이 프로그램을 통해 얻을 수 있는 방법을 보여줍니다.

이를 사용하여 다른 동적임 외곽진입 약간만이라도 [csv 모듈에서는] (https://docs.python.org/3/library/csv.html), read 모든 단일 행일 추론할 수 있는 경우 한 번에 저회가 정신 점검 / 정규 표현식, 행 (제목 / 헤더입니다 / 가치 / 빈). 한 번 더 할 수 있는 장점이 있습니다 이 방법을 통해 데이터를 파이썬 객체에는 분할합니다 / 덮어쓰기/추가 / 수집하십시오 원하는 대로.

모든 기능을 사용할 수 있는 가장 쉬운 약간만이라도 pd.read_clipboard 수동으로로 선택 및 복사 후 '판다 ()' 이 테이블을 클립보드가, csv excel 에서 열 수 있는 경우 또는 무언가.

    • 무관하지 않다.

또한, , 아무도 이 문제에 대한 산정하지만 브라운아저씨의 언급하십시오 무관하지 않다. 전 그 때 이 같은 문제로 로드중 등 일부 데이터세트를 ['seeds_dataset.txt'] (http://archive.ics.uci.edu/ml/datasets/seeds) 에서 자전거. 제 경우에는 오류 발생 공백 때문에 진정한 탭 '구분' 보다 더 많았던 일부 \t. 지켜보리니 다음과 같은 예를 들어 3 호선

"' 14.38 14.21 0.8951 5.386 3.312 2.462 4.956 1 14.69 14.49 0.8799 5.563 3.259 3.586 5.219 1 14.11 14.1 0.8911 5.42 3.302 2.7 5 1 "' 따라서 '' 를 사용하여 \t+ seperator 패턴 대신에 '\t'. "'파이썬 데이터 = pd.read_csv (& # 39, 경로, 9월 = \t+ '헤더입니다 = 없음) "'

Kareem Jeiroudi
Kareem Jeiroudi
편집된 답변3일 11월 2019 в 10:10
csv — CSV File Reading and Writing — Python 3.10.7 documentation
docs.python.org
UCI Machine Learning Repository: seeds Data Set
archive.ics.uci.edu
1
0
관련 커뮤니티 1
Python - 한인 사회
Python - 한인 사회
22명의 사용자
Python Korean Community. @phpko @js_korea @react_ko @vue_ko @laravel_ko @java_ko
telegram 열기
질문 추가
카테고리
모두
기술
문화/레크리에이션
생활/예술
과학
직업
비즈니스
사용자
すべて
새로운
인기
1
bran Bran
등록된 12시간 전
2
Олечка Арапова
등록된 18시간 전
3
Роман Азаров
등록된 1주 전
4
Mansur Zakirov
등록된 1주 전
5
Тагир Мамедов
등록된 2주 전
DE
EL
ES
FR
ID
IT
JA
KO
NL
PT
RU
SK
TR
ZH
© kzen.dev 2023
원본
stackoverflow.com
cc by-sa 3.0 번 면허에 따라 귀속하여.