Hoe lees ik CSV-gegevens in een record array in NumPy?

Question

Meer

Vraag

Hoe lees ik CSV-gegevens in een record array in NumPy?

Ik vraag me af of er een directe manier is om de inhoud van een CSV bestand in een record array te importeren, ongeveer op de manier waarop R's read.table(), read.delim(), en read.csv() familie gegevens importeert in R's data frame?

Of is de beste manier om csv.reader() te gebruiken en dan iets als numpy.core.records.fromrecords() toe te passen?

Peter Mortensen

Bewerkte vraag 15de6 juli 2018 в 8:25

Programmering

python

numpy

scipy

genfromtxt

Oplossing / Antwoord

atomh33ls

10de4 oktober 2014 в 9:30

Meer

Ik zou de read_csv functie uit de pandas bibliotheek aanraden:

import pandas as pd
df=pd.read_csv('myfile.csv', sep=',',header=None)
df.values
array([[ 1. ,  2. ,  3. ],
       [ 4. ,  5.5,  6. ]])

Dit geeft een pandas DataFrame - waardoor veel handige data manipulatie functies die niet direct beschikbaar zijn met numpy record arrays.

DataFrame is een 2-dimensionale gelabelde datastructuur met kolommen van potentieel verschillende types. Je kunt het zien als een spreadsheet of SQL tabel...

Ik zou ook genfromtxt aanraden. Echter, omdat de vraag vraagt om een record array, in tegenstelling tot een normale array, moet de dtype=None parameter worden toegevoegd aan de genfromtxt aanroep:

Gegeven een invoerbestand, myfile.csv:

1.0, 2, 3
4, 5.5, 6

import numpy as np
np.genfromtxt('myfile.csv',delimiter=',')

geeft een matrix:

array([[ 1. ,  2. ,  3. ],
       [ 4. ,  5.5,  6. ]])

en

np.genfromtxt('myfile.csv',delimiter=',',dtype=None)

geeft een record array:

array([(1.0, 2.0, 3), (4.0, 5.5, 6)], 
      dtype=[('f0', '<f8'), ('f1', '<f8'), ('f2', '<i4')])

Dit heeft het voordeel dat bestanden met meerdere gegevenstypen (waaronder strings) gemakkelijk kunnen worden geïmporteerd.

Community

Bewerkt antwoord 23ste1 mei 2017 в 12:10

162

0

Vraag toevoegen

Categorieën

Alle

Technologie

Cultuur / Recreatie

Leven / Kunst

Wetenschap

Professioneel

Business

Gebruikers

Alle

Nieuw

Populair

1

Ксения Комарова

Geregistreerd 2 weken geleden

2

Артур «Апер»

Geregistreerd 1 maand geleden

3

Viktor Malyutin

Geregistreerd 2 maanden geleden

4

Viktor Malyutin

Geregistreerd 2 maanden geleden

5

Syahputra Zhedenk

Geregistreerd 2 maanden geleden

Do you have a question? Add it on the site and get an answer instantly

en.kzen.dev

Andrew · Accepted Answer · 2010-08-19T06:34:54+00:00

Je kunt Numpy's genfromtxt() methode hiervoor gebruiken, door de delimiter kwarg op een komma te zetten.

from numpy import genfromtxt
my_data = genfromtxt('my_file.csv', delimiter=',')

Meer informatie over de functie is te vinden in zijn respectievelijke documentatie.