Mengapa tidak ada 'hadoop fs -head' perintah shell?

Question

Lebih

Question

Mengapa tidak ada 'hadoop fs -head' perintah shell?

Sebuah metode cepat untuk memeriksa file pada HDFS adalah dengan menggunakan ekor:

~$ hadoop fs -tail /path/to/file

Ini menampilkan terakhir kilobyte data dalam file, yang sangat membantu. Namun, berlawanan dengan perintah kepala tidak muncul untuk menjadi bagian dari shell command koleksi. Saya menemukan ini sangat mengejutkan.

Hipotesis saya adalah bahwa sejak HDFS ini dibangun untuk sangat cepat streaming membaca pada file yang sangat besar, ada beberapa akses yang berorientasi pada masalah yang mempengaruhi kepala. Hal ini membuat saya ragu-ragu untuk melakukan hal-hal untuk mengakses kepala. Apakah ada yang punya jawaban?

Pramit

Pertanyaan edit 10 September 2015 в 2:52

Pemrograman

hadoop

hdfs

Solution / Answer

xu2mao

21 April 2015 в 8:58

Lebih

hdfs -dfs /path | head

adalah cara yang baik untuk memecahkan masalah.

TZHX

Jawaban edit 21 April 2015 в 9:18

3

0

Amey

13 Agustus 2017 в 7:18

Lebih

anda dapat mencoba perintah folowing

hadoop fs -cat /path | head -n

di mana -n bisa di ganti dengan nomor dari catatan ini untuk melihat

George Edwards

Jawaban edit 13 Agustus 2017 в 8:10

2

0

Ani Menon

2 Desember 2017 в 11:16

Lebih

Di Hadoop v2:

hdfs dfs -cat /file/path|head

Di Hadoop v1 dan v3:

hadoop fs -cat /file/path|head

2

0

Tambahkan pertanyaan

Kategori

Semua

Teknologi

Budaya / Rekreasi

Kehidupan / Seni

Ilmu Pengetahuan

Profesional

Bisnis

Pengguna

Semua

Baru

Populer

1

Ксения Комарова

Terdaftar 4 minggu yang lalu

2

Артур «Апер»

Terdaftar 2 bulan yang lalu

3

Viktor Malyutin

Terdaftar 2 bulan yang lalu

4

Viktor Malyutin

Terdaftar 2 bulan yang lalu

5

Syahputra Zhedenk

Terdaftar 2 bulan yang lalu

Anda punya pertanyaan? Tambahkan di situs dan dapatkan jawabannya secara instan

id.kzen.dev

Chris White · Accepted Answer · 2013-11-04T23:37:35+00:00

Aku akan mengatakan itu's dengan efisiensi - kepala dapat dengan mudah ditiru oleh pipa output dari hadoop fs -kucing melalui linux kepala komando.

hadoop fs -cat /path/to/file | head

Ini lebih efisien karena kepala akan menutup mendasari aliran setelah nomor yang diinginkan dari garis-garis yang telah output

Dengan menggunakan ekornya dengan cara ini akan jauh kurang efisien - anda'd harus streaming ke seluruh file (semua HDFS blok) untuk menemukan akhir x jumlah baris.

hadoop fs -cat /path/to/file | tail

Yang hadoop fs -ekor perintah seperti yang anda perhatikan bekerja pada terakhir kilobita - hadoop efisien dapat menemukan blok terakhir dan melompat ke posisi akhir kilobyte, maka aliran output. Pipa melalui ekor bisa't dengan mudah melakukan hal ini.