¿Cómo puedo leer datos CSV en una matriz de registros en NumPy?

Question

Más

Question

¿Cómo puedo leer datos CSV en una matriz de registros en NumPy?

Me pregunto si existe una forma directa de importar el contenido de un archivo CSV a una matriz de registros, del mismo modo que las familias read.table(), read.delim() y read.csv() importan datos al marco de datos de R's?

¿O la mejor manera es utilizar csv.reader() y luego aplicar algo como numpy.core.records.fromrecords()?

Peter Mortensen

Pregunta editada 15º julio 2018 в 8:25

Programación

python

numpy

scipy

genfromtxt

Solution / Answer

atomh33ls

10º octubre 2014 в 9:30

Más

Yo recomendaría la función read_csv de la biblioteca pandas:

import pandas as pd
df=pd.read_csv('myfile.csv', sep=',',header=None)
df.values
array([[ 1. ,  2. ,  3. ],
       [ 4. ,  5.5,  6. ]])

Esto da un DataFrame de pandas - permitiendo muchas funciones útiles de manipulación de datos que no están disponibles directamente con arrays de registros de numpy.

DataFrame es una estructura de datos etiquetada de 2 dimensiones con columnas de potencialmente de diferentes tipos. Puedes pensar en ello como una hoja de cálculo o tabla SQL...

Yo también recomendaría genfromtxt. Sin embargo, como la pregunta pide un array de registros, en lugar de un array normal, hay que añadir el parámetro dtype=None a la llamada genfromtxt:

Dado un archivo de entrada, miarchivo.csv:

1.0, 2, 3
4, 5.5, 6

import numpy as np
np.genfromtxt('myfile.csv',delimiter=',')

da un array:

array([[ 1. ,  2. ,  3. ],
       [ 4. ,  5.5,  6. ]])

y

np.genfromtxt('myfile.csv',delimiter=',',dtype=None)

da una matriz de registros:

array([(1.0, 2.0, 3), (4.0, 5.5, 6)], 
      dtype=[('f0', '<f8'), ('f1', '<f8'), ('f2', '<i4')])

Esto tiene la ventaja de que se pueden importar fácilmente archivos con múltiples tipos de datos (incluyendo cadenas).

Community

Respuesta editada 23º mayo 2017 в 12:10

162

0

Comunidades relacionadas 5

Python en español

10 322 usuarios

Grupo de discusión sobre el lenguaje Python en español

Abrir telegram

Sólo Python

559 usuarios

Lugar para compartir, disfrutar, aprender, etc. Y también hablar de Python. Interés: @Debian_es @tensorflow

Abrir telegram

python-docs-es

257 usuarios

Grupo de trabajo para la documentación oficial de Python en Español

Abrir telegram

Python en Español🖥

154 usuarios

Grupo creado con el fin de compartir tus conocimientos y ayudar en el lenguaje Python3, en Español

Abrir telegram

Python Español 2.0

88 usuarios

Grupo de Python en español Regla #1: No preguntes si puedes preguntar. Simplemente haz tu pregunta

Abrir telegram

Añadir pregunta

Categorías

Todo

Tecnología

Cultura / Recreación

Vida / Artes

Ciencia

Profesional

Negocios

Usuarios

Todo

Nuevo

Popular

1

Ксения Комарова

Registrado hace 2 semanas

2

Артур «Апер»

Registrado hace 1 mes

3

Viktor Malyutin

Registrado hace 2 meses

4

Viktor Malyutin

Registrado hace 2 meses

5

Syahputra Zhedenk

Registrado hace 2 meses

¿Tiene alguna pregunta? Añádela en el sitio y obtén una respuesta al instante

es.kzen.dev

Andrew · Accepted Answer · 2010-08-19T06:34:54+00:00

Puede utilizar el método genfromtxt() de Numpy para hacerlo, estableciendo el kwarg delimiter a una coma.

from numpy import genfromtxt
my_data = genfromtxt('my_file.csv', delimiter=',')

Puede encontrar más información sobre la función en su respectiva documentación.