NumPyでCSVデータをレコード配列に読み込むにはどうすればいいですか？

Question

さらに

質問

R#39;の read.table(), read.delim(), `read.csv()ファミリーがR#39;のデータフレームにデータをインポートするのと同じように、CSVファイルの内容をレコード配列に直接インポートする方法はないのでしょうか？

それとも、csv.reader()を使用して、numpy.core.records.fromrecords()のようなものを適用するのが一番良い方法なのでしょうか？

解決策・回答

10日 10月 2014 в 9:30

さらに

私は、pandas ライブラリの read_csv` 関数をお勧めします。

import pandas as pd
df=pd.read_csv('myfile.csv', sep=',',header=None)
df.values
array([[ 1. ,  2. ,  3. ],
       [ 4. ,  5.5,  6. ]])

DataFrameは、潜在的に異なるタイプの列を持つ2次元のラベル付きデータ構造です。データフレームは、潜在的に異なるタイプの列を持つ2次元のラベル付きデータ構造です。表計算ソフトやSQLテーブルのようなものと考えればよいでしょう。 SQLテーブルのようなものです。

私もgenfromtxtをお勧めします。しかし、質問では通常の配列ではなく、レコード配列を求めているので、genfromtxtの呼び出しにdtype=Noneパラメータを追加する必要があります。

入力ファイルとしてmyfile.csvが与えられます。

1.0, 2, 3
4, 5.5, 6

import numpy as np
np.genfromtxt('myfile.csv',delimiter=',')

は配列を与えます．

array([[ 1. ,  2. ,  3. ],
       [ 4. ,  5.5,  6. ]])

そして

np.genfromtxt('myfile.csv',delimiter=',',dtype=None)

はレコード配列を与えます。

array([(1.0, 2.0, 3), (4.0, 5.5, 6)], 
      dtype=[('f0', '<f8'), ('f1', '<f8'), ('f2', '<i4')])

これは，「複数のデータ型（文字列を含む）を持つファイルを容易に取り込むことができる」という利点があります5。

カテゴリ

技術情報

文化・レクリエーション

生活・芸術

科学

プロフェッショナル

事業内容

ユーザー