Saya loading file txt containig campuran float dan string data. Aku ingin menyimpannya dalam array di mana saya dapat mengakses masing-masing elemen. Sekarang saya hanya melakukan
import pandas as pd
data = pd.read_csv('output_list.txt', header = None)
print data
Ini adalah struktur dari input file: 1 0 2000.0 70.2836942112 1347.28369421 /file_address.txt
.
Sekarang data yang diimpor sebagai kolom yang unik. Bagaimana saya bisa membaginya, sehingga untuk menyimpan unsur-unsur yang berbeda secara terpisah (jadi saya dapat panggilan data[i,j]
)? Dan bagaimana saya bisa menentukan header?
Anda dapat menggunakan:
data = pd.read_csv('output_list.txt', sep=" ", header=None)
data.columns = ["a", "b", "c", "etc."]
Tambahkan sep=" "
dalam kode anda, meninggalkan ruang kosong di antara tanda kutip. Jadi panda dapat mendeteksi ruang antara nilai-nilai dan memilah dalam kolom. Kolom Data untuk penamaan kolom anda.
@Pietrovismara's solusi yang benar tapi aku'd hanya ingin menambahkan: daripada harus terpisah line untuk menambahkan kolom nama, it's mungkin untuk melakukan hal ini dari pd.read_csv.
df = pd.read_csv('output_list.txt', sep=" ", header=None, names=["a", "b", "c"])
anda dapat menggunakan ini
import pandas as pd
dataset=pd.read_csv("filepath.txt",delimiter="\t")
Yang dapat anda lakukan seperti:
import pandas as pd
df = pd.read_csv('file_location\filename.txt', delimiter = "\t")
(seperti, df = pd.read_csv('F:\Desktop\ds\text.txt', pembatas = " t")
Jika anda don't memiliki indeks yang ditetapkan untuk data dan anda tidak yakin apa yang jarak, dapat anda gunakan untuk membiarkan panda menetapkan indeks dan mencari beberapa ruang.
df = pd.read_csv('filename.txt', delimiter= '\s+', index_col=False)