어떻게 반복할 행에 있는 다테프라임 판다?

Question

Question

어떻게 반복할 행에 있는 다테프라임 판다?

I have a 다테프라임 '에서' 라 불렀다.

import pandas as pd
inp = [{'c1':10, 'c2':100}, {'c1':11,'c2':110}, {'c1':12,'c2':120}]
df = pd.DataFrame(inp)
print df

출력:

이제 이 프레임을 행을 반복할 싶다. I want to be 행일 액세스하려면 모든 요소 (값을 셀입니다) 에 이름을 열 수 있다. 예를 들면 다음과 같습니다.

for row in df.rows:
   print row['c1'], row['c2']

그렇게 할 수 있는 것은 판다?

내가 찾은 이 비슷한 질문. 제게 답을 것은 아니지만 데릭쉐퍼드와. 예를 들어, 사용할 수 있을 것이 좋습니다.

for date, row in df.T.iteritems():

또는

for row in df.iterrows():

하지만 난 무엇을, 어떻게 내가 알지 '행' 객체인지 작업을 할 수 있습니다.

petezurich

편집된 질문24일 8월 2018 в 7:20

프로그래밍

python

rows

pandas

dataframe

Solution / Answer

viddik13

7일 12월 2016 в 4:41

- 반복 할 경우 첫 번째 행에 걸쳐 고려해보십시오 정말 다테프라임. [이 오토메이티드] 참조 (https://stackoverflow.com/a/55557758/3844376) 의 대안.

계속 필요한 경우 아래 행뿐만 반복할 방법을 사용할 수 있습니다. 참고 있는 몇 가지 중요한 시 언급되지 않은 다른 모든 분입니다.

[다테프라임.이트로스 ()] (http://pandas.pydata.org/pandas-docs/stable/generated/pandas.DataFrame.iterrows.html)

인덱스화하여 행에 대해 드프리양로스 (): 인쇄하십시오 행, 행 [&quot c2";] [&quot c1";]

[다태프라메트리터투플스 ()] (http://pandas.pydata.org/pandas-docs/stable/generated/pandas.DataFrame.itertuples.html)

행에 대해 드프리양터플스 (# 39, & # 39, 이름 =, = True 인덱스화할 Pandas&): 그레타르 인쇄하십시오 (행, c1&quot ";), 그레타르 (행, c2&quot ";)

'아르투플스 이트로스 ()' 보다 ' ()' 가 있어야한다

하지만 주의해야 할 조사 결과에 따르면, 문서 (0.24.2 판다 순간):

이트로스: '에서' 행 행일 트리프 일치하지 않을 수 있습니다 &gt. 이 때문에 각 행에 대한 일련의 이트로스 되돌려줍니다 트리피스 보존할지 언약보다는 모든 행 (트리피스 아니했으니 구현하므로 다테프럼스 열이 있다). 한편 행뿐만 트리피스 보존할 수 있는 것이 더 이상 반복 사용할 수 있는 것보다 훨씬 빨리 네메트우플스 되돌려줍니다 아르투플스 () 은 일반적으로 이트로스 () 의 가치와

이트로스: 수정하십시오 행뿐만 &gt. 뭔가 이상 수정하십시오 틀렸다니까 반복 안 합니다. 이 모든 경우에 작업하십시오 보장할 수 없습니다. 이 유형에 따라, 데이터 복제 및 쓰기 반복자가 되돌려줍니다 아닌 보기인 아무런 영향을 주지 않습니다.

[다테프라임.애플리 ()] (http://pandas.pydata.org/pandas-docs/stable/generated/pandas.DataFrame.apply.html) 을 대신 사용합니다.

new_df = 드프리애플리 (람다 (λ) x: * 2 개)

아르투플스: &gt. 열 이름을 이름이 될 경우, 반복, 또는 시작 위치 이름을 잘못된 파이썬 식별자입니다 밑줄로. 많이 열 (&gt, 255), 일반 튜플을 나님이시거늘.

참조 [판다 docs 에 이터레이션에] (https://pandas.pydata.org/pandas-docs/stable/getting_started/basics.html # 이터레이션에) 자세한 내용은.

viddik13

편집된 답변30일 5월 2019 в 12:00

326

0

cs95

7일 4월 2019 в 10:03

&gt, 어떻게 반복할 행에 있는 다테프라임 판다?

대답: # 39 don&, T!

안티패턴 백업이었습니다 있는 경우에만 당신이 바라는 이터레이션에 판다, 이 경우 다른 모든 옵션을 모두 가능하다. 국제열핵융합실험로 ',' 모든 기능이 &quot &quot 사용을 고려해보십시오 안됩니다. 이 모든 것에 대한 여러 차례 이름이 곧 적응할 수 있는 못하니이는 행 또는 합니다 롯이여 기다리는. 인쇄하시겠습니까 다테프라임? [ 'DataFrame.to_string ()' ) 사용 (https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.DataFrame.to_string.html). 설정하시겠습니까 연산 뭔가? 이 경우, 이 순서대로 메서드을 검색하겠습니다 (목록 수정 에서 [here] (https://stackoverflow.com/questions/24870953/does-iterrows-have-performance-issues):

벡터화
사이썬 루틴
지능형 목록 (바닐라 '는' 루프)
[ '다테프라임.애플리 ()' ] (https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.DataFrame.apply.html): i) 의 감소, nbsp, &amp 수행할 수 있는 사이썬, ii) 의 이터레이션에 파이썬 공간
[ '다태프라메트리터투플스 ()' ] (https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.DataFrame.itertuples.html) 및 [ '아리트마스 ()' ] (https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.DataFrame.iteritems.html # 프란다s.다태프라머스트리트마스) [ '다테프라임.이트로스 ()' ] (https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.DataFrame.iterrows.html # 프란다s.다타프라임.이트로스) 6. '이트로스' 와 '아르투플스' (둘 다 많은 표를 받은 이 물음에 대한) 을 사용해야 하는 등 매우 드문 경우이지만, 생성 / 남레토플스 순차인지 행일 객체에는 대한 처리, 이는 유일한 이러한 기능은 정말 유용합니다.

- 권위에 대한 호소 [이 문서 페이지] (# 이터레이션에 https://pandas.pydata.org/pandas-docs/stable/getting_started/basics.html) 의 거대한 붉은 이터레이션에 경고 기입란 말하고 있다. &gt. 일반적으로 느린 마리의 개체가 통해 반복. 대부분의 경우, 반복 [.] 을 통해 수동으로 행뿐만 필요하지 않습니다.

루프을 보다. [벡터화] (https://stackoverflow.com/questions/1422149/what-is-vectorization), [사이썬] (https://cython.org)

좋은 여러 가지 기본적인 운영 및 계산, vectorised&quot &quot 있다. 판다 (또는 시토니체트 기능을 통해 통해 인컨텍스트 누마피) 에 의해. 여기에는 (대부분) 절감, 산술, 비교, 변형 (피벗 등), 조인 및 그룹비 운영체. [에센셀 기본 기능] 대한 관련 서류를 살펴보고 적절한 방법을 찾기 위해 벡터화 (https://pandas.pydata.org/pandas-docs/stable/getting_started/basics.html # 에센셀 기본 기능) 단축시킵니다 문제다. 언제든지 쓸 수 없는 경우, 사용자 정의를 통해 자신의 존재 [사이썬 확장장치] (https://pandas.pydata.org/pandas-docs/stable/user_guide/enhancingperf.html # 사이썬 쓰기 위한 c 확장을 판다).
Next Best Thing: [목록 지능형] (https://docs.python.org/3/tutorial/datastructures.html # 지능형 목록)

목록 지능형 제공하십시오 다음 기항지 경우 1) 꾨т 臾몄젣媛? 벡터화된 솔루션보다도, 2) 성능이 매우 중요한, 하지만 번거로움을 거치지 않은 만큼 중요한 코드에 시토니징, 그리고 3), re trying to # 39 의 변형 엘레멘트와이즈 실행하십시오 you& 코드에. 좁히어 는 [优秀 양의 증거를] (https://stackoverflow.com/questions/54028199/for-loops-with-pandas-when-should-i-care) 를 충분히 빠른 (심지어 가끔 빠름) 는 지능형 제안하세요 그 목록에 자주 사용되는 이동작업 판다. 공식은 간단합니다,

# iterating over one column - `f` is some function that processes your data
result = [f(x) for x in df['col']]
# iterating over two columns, use `zip`
result = [f(x, y) for x, y in zip(df['col1'], df['col2'])]
# iterating over multiple columns
result = [f(row[0], ..., row[n]) for row in df[['col1', ...,'coln']].values]

기업의 경우 캡슐화됨 논리를 표현할 수 있는 함수를 호출하는 바뀌엇어요 이를 사용할 수 있습니다. 복잡한 일도 기초형상 파이썬 속도를 임의로 단순성과 통해 할 수 있습니다.

명백한 예

39 의 차이를 보여 줄 수 있는 단순한 예로 let& 추가 열 두 마리의 'A + B'. 이 때문에 심지어 베스리자블 퍼턴 성능이 위에서 설명한 방법을 볼 수 있습니다.

! [입력하십시오. 이미지 여기에 설명을] [1] [벤치마킹 코드, 단축시킵니다 참조입니다.] (https://gist.github.com/Coldsp33d/948f96b384ca5bdf6e8ce203ac97c9a0) 그러나 그것은 내가 언급해야한다면 isn& t # 39, 항상 이 잘라냅니다 and dry. 가끔 어떤 대답을 &quot operation&quot 경우, 가장 좋은 방법입니다. ) 는 &quot 설정이므로 data&quot 따라 다릅니다. 내 충고를 따라 상이한 데이터 전에 한 여성에게 테스트하려면 아웃해야 있다.

참조입니다
[10 분 판다] 및 [에센셀 기본 기능] (https://pandas.pydata.org/pandas-docs/stable/getting_started/basics.html) - (https://pandas.pydata.org/pandas-docs/stable/getting_started/10min.html), 수 있는 유용한 링크가 소개하십시오 판다 및 해당 라이브러리 vectorized/cythonize 총괄하였습니다.
[성능 향상] (https://pandas.pydata.org/pandas-docs/stable/user_guide/enhancingperf.html) 에서 사용할 수 있는 표준 문서 작업을 한 마리의 증대합니다 -
https://stackoverflow.com/questions/54028199/for-loops-with-pandas-when-should-i-care - 상세한 작성자 지능형 목록 및 그 날 통해 다양한 작업을 위해 적합성 (주로 수준들과 비사양 숫자 관련된 데이터)
- 'https://stackoverflow.com/questions/54432583/when-should-i-ever-want-to-use-pandas-apply-in-my-code' 은 적용하십시오 slow (느린 만큼 이제는 '' 로 가족이었지 국제열핵융합실험로 있다고 하지만, 상황 수 있는 (또는 /dev/raw/raw200) 고려해보십시오 '대안' 으로, 특히 일부 그룹비 적용하십시오 시리즈 '' 작업). 판다, 문자열 방식은, &lt sub&gt &quot vectorized"; 그러나 이들은 작동합니까 시리즈 에서 지정된 점에서 각 요소. 반복적인 작업은 여전히 기본 메커니즘 때문에 본질적으로 어려운 문자열이어야 vectorize.&lt /sub>;

cs95

편집된 답변21일 7월 2019 в 8:17

193

0

e9t

20일 9월 2015 в 1:52

가끔 '동시에' 좋은 옵션을 이트로스 () '가 훨씬 빠른 아르투플스 ()' 가 펼쳐진다.

df = pd.DataFrame({'a': randn(1000), 'b': randn(1000),'N': randint(100, 1000, (1000)), 'x': 'x'})

%timeit [row.a * 2 for idx, row in df.iterrows()]
# => 10 loops, best of 3: 50.3 ms per loop

%timeit [row[1] * 2 for row in df.itertuples()]
# => 1000 loops, best of 3: 541 µs per loop

143

0

cheekybastard

1일 6월 2015 в 6:24

드프리애플리 사용할 수도 있습니다 () '' 반복할 행과 열을 액세스 여러 함수에 대해.

문서: 다테프라임.애플리 ()

def valuation_formula(x, y):
    return x * y * 0.5

df['price'] = df.apply(lambda row: valuation_formula(row['x'], row['y']), axis=1)

80

0

PJay

7일 9월 2016 в 12:56

드프스키노크 함수를 다음과 같이 사용할 수 있습니다.

for i in range(0, len(df)):
    print df.iloc[i]['c1'], df.iloc[i]['c2']

69

0

Lucas B

17일 1월 2018 в 9:41

얼마나 기대했는데 반복할 수 있는 행과 열이 그러하매 :* 여기서 끝이 났다.

for i, row in df.iterrows():
    for j, column in row.iteritems():
        print(column)

29

0

piRSquared

7일 11월 2017 в 4:15

'' 네메트루프레 구현하는 반복자가 직접 작성할 수 있습니다

from collections import namedtuple

def myiter(d, cols=None):
    if cols is None:
        v = d.values.tolist()
        cols = d.columns.values.tolist()
    else:
        j = [d.columns.get_loc(c) for c in cols]
        v = d.values[:, j].tolist()

    n = namedtuple('MyTuple', cols)

    for line in iter(v):
        yield n(*line)

이는 페데리다태프라메트리터투플스 필적할 만한 '직접'. # 39 m, 동일한 작업을 효율적으로 수행하는 i& 목표로 하고 있다.

_

내 손으로 대한 다테프라임 주어진 함수.

list(myiter(df))

[MyTuple(c1=10, c2=100), MyTuple(c1=11, c2=110), MyTuple(c1=12, c2=120)]

페데리다태프라메트리터투플스 을 (를) '또는':

list(df.itertuples(index=False))

[Pandas(c1=10, c2=100), Pandas(c1=11, c2=110), Pandas(c1=12, c2=120)]

_

종합적인 테스트 * 테스트할 수 있도록 필요한 모든 열이 서브세팅 열.

def iterfullA(d):
    return list(myiter(d))

def iterfullB(d):
    return list(d.itertuples(index=False))

def itersubA(d):
    return list(myiter(d, ['col3', 'col4', 'col5', 'col6', 'col7']))

def itersubB(d):
    return list(d[['col3', 'col4', 'col5', 'col6', 'col7']].itertuples(index=False))

res = pd.DataFrame(
    index=[10, 30, 100, 300, 1000, 3000, 10000, 30000],
    columns='iterfullA iterfullB itersubA itersubB'.split(),
    dtype=float
)

for i in res.index:
    d = pd.DataFrame(np.random.randint(10, size=(i, 10))).add_prefix('col')
    for j in res.columns:
        stmt = '{}(d)'.format(j)
        setp = 'from __main__ import d, {}'.format(j)
        res.at[i, j] = timeit(stmt, setp, number=100)

res.groupby(res.columns.str[4:-1], axis=1).plot(loglog=True);

! [입력하십시오. 이미지 여기에 설명을] [1]

! [입력하십시오. 이미지 여기에 설명을] [2]

16

0

Grag2015

2일 11월 2017 в 10:33

 for ind in df.index:
     print df['c1'][ind], df['c2'][ind]

cs95

편집된 답변7일 5월 2019 в 6:37

13

0

Pedro Lobito

11일 3월 2017 в 10:44

'모든 행 반복할 수 있는' 다테프라임 사용할 수 있습니다.

for x in range(len(date_example.index)):
    print date_example['Date'].iloc[x]

13

0

Zach

27일 6월 2018 в 6:48

가끔 유용한 패턴이:

# Borrowing @KutalmisB df example
df = pd.DataFrame({'col1': [1, 2], 'col2': [0.1, 0.2]}, index=['a', 'b'])
# The to_dict call results in a list of dicts
# where each row_dict is a dictionary with k:v pairs of columns:value for that row
for row_dict in df.to_dict(orient='records'):
    print(row_dict)

이로 인해:

{'col1':1.0, 'col2':0.1}
{'col1':2.0, 'col2':0.2}

cs95

편집된 답변13일 4월 2019 в 11:06

7

0

Herpes Free Engineer

23일 4월 2018 в 2:53

값을 사용할 수 있는 '와' 모든 행 루프 다테프라임 각 행의 * ',' 의 '노다레이 편리하게 네메트우플스 변환할 수 있다. 예를 들면 다음과 같습니다.

df = pd.DataFrame({'col1': [1, 2], 'col2': [0.1, 0.2]}, index=['a', 'b'])

행뿐만 통한 반복.

for row in df.itertuples(index=False, name='Pandas'):
    print np.asarray(row)

결과:

[ 1.   0.1]
[ 2.   0.2]

이 경우 = True ',' 인덱스화할 유념하십시오 인덱스 () 는 첫 번째 요소에 튜플 , 추가될 수 있는 것은 일부 응용 프로그램.

6

0

Zeitgeist

17일 10월 2019 в 3:26

던질 때 다테프라임 가져오는 방법이 반복 행뿐만 보상으론 아니라 시리즈. 내가 모든 것을 목록으로, t 지켜보리니 거론하며 don& # 39 의 행을 귀의하지않는다고 비호환성의 다테프라임 인덱스화할 전달할 수 있습니다.

for i in range(len(df)):
    row = df.iloc[[i]]

참고 연산뿐 브래킷에 사용. 이 단일 행으로 다테프라임 반환합니다.

1

0

James L.

1일 12월 2017 в 5:49

누마피 할 수도 있습니다 '' 인덱스화를 더욱 높은 속도를 강조한다. # 39 의 반복 it& 작동됨 특정 애플리케이션에 대한 것보다 훨씬 더 좋은 이터레이션에 하지만 꼭 그렇지는 않습니다.

subset = row['c1'][0:5]
all = row['c1'][:]

캐스트 迈向 어레이에서는 할 수도 있습니다. 이 같은 행동을 취할 수 있어야 하고 싶지만 이미 indexe / 선택물의 누마피 어레이에는 실행했음 agent. 나라를 위해 필요한 문제 및

np.asarray(all)
imgs[:] = cv2.resize(imgs[:], (224,224) ) #resize every image in an hdf5 file

1

0

shubham ranjan

19일 1월 2019 в 6:53

너무 많아 반복할 수 있는 방법을 통해 행뿐만 다테프라임 판다. 매우 간단하고 직관적인 방법을 하나 입니다.

df=pd.DataFrame({'A':[1,2,3], 'B':[4,5,6],'C':[7,8,9]})
print(df)
for i in range(df.shape[0]):
    # For printing the second column
    print(df.iloc[i,1])
    # For printing more than one columns
    print(df.iloc[i,[0,2]])

1

0

mjr2000

16일 3월 2019 в 10:33

이 예제는 일로스 격리합니다 위해 각 숫자가 데이터 프레임이.

import pandas as pd

 a = [1, 2, 3, 4]
 b = [5, 6, 7, 8]

 mjr = pd.DataFrame({'a':a, 'b':b})

 size = mjr.shape

 for i in range(size[0]):
     for j in range(size[1]):
         print(mjr.iloc[i, j])

0

어떻게 반복할 행에 있는 다테프라임 판다?

&gt, 어떻게 반복할 행에 있는 다테프라임 판다?

대답: # 39 don&, T!

루프을 보다. [벡터화] (https://stackoverflow.com/questions/1422149/what-is-vectorization), [사이썬] (https://cython.org)

Next Best Thing: [목록 지능형] (https://docs.python.org/3/tutorial/datastructures.html # 지능형 목록)

기업의 경우 캡슐화됨 논리를 표현할 수 있는 함수를 호출하는 바뀌엇어요 이를 사용할 수 있습니다. 복잡한 일도 기초형상 파이썬 속도를 임의로 단순성과 통해 할 수 있습니다.

명백한 예

39 의 차이를 보여 줄 수 있는 단순한 예로 let& 추가 열 두 마리의 'A + B'. 이 때문에 심지어 베스리자블 퍼턴 성능이 위에서 설명한 방법을 볼 수 있습니다.

참조입니다