Como faço para obter a contagem de filas de um pandas DataFrame?

Question

Mais

Question

Como faço para obter a contagem de filas de um pandas DataFrame?

I'estou a tentar obter o número de linhas de dataframe df com Pandas, e aqui está o meu código.

Método 1:

total_rows = df.count
print total_rows +1

Método 2:

total_rows = df['First_columnn_label'].count
print total_rows +1

Ambos os trechos de código me dão este erro:

TypeError: tipo(s) de operando não suportado(s) para +: 'instancemethod' e 'int'

O que estou a fazer mal?

pandas

Solution / Answer

19º agosto 2013 в 3:02

Mais

Utilize len(df). Isto funciona a partir de pandas 0.11 ou talvez até mais cedo.

__len__() está atualmente (0.12) documentado com Retorna o comprimento do índice. Informação de tempo, configure da mesma forma que na resposta do root's:

In [7]: timeit len(df.index)
1000000 loops, best of 3: 248 ns per loop

In [8]: timeit len(df)
1000000 loops, best of 3: 573 ns per loop

Devido a uma chamada de função adicional é um pouco mais lento do que chamar len(df.index) diretamente, mas isto não deve desempenhar qualquer papel na maioria dos casos de utilização.

0

19º agosto 2015 в 7:07

Mais

Além das respostas acima, utilize df.axes para obter o tuple com índices de linhas e colunas e depois utilize a função len():

total_rows=len(df.axes[0])
total_cols=len(df.axes[1])

skuntsel

Resposta editada :em

18

0

Comunidades relacionadas 3

Pt-BR Data Science & Python

5 045 utilizadores

Abrir telegram

Python Coding Brazil

308 utilizadores

Programação Python. Python Programming. ***************************** ➸ Pentest Brazil Group (pt_BR) http://t.me/pentestbrazilgroup ➸ Pentest Brazil Channel (pt_BR) http://t.me/pentestbrazilchannel

Abrir telegram

Python Brasil

198 utilizadores

Bem vindos a comunidade do python Brasil! oficial do Telegram! 13/05/20

Abrir telegram

Adicionar pergunta

Categorias

Todos

Tecnologia

Cultura / Recreação

Vida / Artes

Ciência

Profissional

Negócios

Utilizadores

Todos

Novo

Popular

1

Ксения Комарова

Registrado há 3 semanas

2

Артур «Апер»

Registrado há 2 meses

3

Viktor Malyutin

Registrado há 2 meses

4

Viktor Malyutin

Registrado há 2 meses

5

Syahputra Zhedenk

Registrado há 2 meses

Tem uma pergunta? Adicione-a no sítio e obtenha uma resposta instantânea

pt.kzen.dev

root · Accepted Answer · 2013-04-11T08:24:29+00:00

Você pode utilizar a propriedade .shape' ou apenaslen(DataFrame.index). Entretanto, há diferenças notáveis de desempenho (len(DataFrame.index)` é mais rápido):

In [1]: import numpy as np

In [2]: import pandas as pd

In [3]: df = pd.DataFrame(np.arange(12).reshape(4,3))

In [4]: df
Out[4]: 
   0  1  2
0  0  1  2
1  3  4  5
2  6  7  8
3  9  10 11

In [5]: df.shape
Out[5]: (4, 3)

In [6]: timeit df.shape
2.77 µs ± 644 ns per loop (mean ± std. dev. of 7 runs, 100000 loops each)

In [7]: timeit df[0].count()
348 µs ± 1.31 µs per loop (mean ± std. dev. of 7 runs, 1000 loops each)

In [8]: len(df.index)
Out[8]: 4

In [9]: timeit len(df.index)
990 ns ± 4.97 ns per loop (mean ± std. dev. of 7 runs, 100000 loops each)

EDIT: Como @Dan Allen observou nos comentários len(df.index) e df[0].count() não são intercambiáveis como count exclui NaNs,