Unix/Linux'ta iki dosyanın aynı olup olmadığını anlamanın en hızlı yolu nedir?

Question

Daha

Question

Unix/Linux'ta iki dosyanın aynı olup olmadığını anlamanın en hızlı yolu nedir?

İki dosyanın aynı olup olmadığını kontrol etmem gereken bir kabuk betiğim var. Bunu çok sayıda dosya için yapıyorum ve betiğimde diff komutu performans darboğazı gibi görünüyor.

İşte çizgi:

diff -q $dst $new > /dev/null

if ($status) then ...

Dosyaları karşılaştırmanın daha hızlı bir yolu olabilir mi, belki varsayılan diff yerine özel bir algoritma?

codeforester

Edited question 2017ööp21öö4 Şubat 2017 в 4:21

Programlama

file

linux

unix

diff

Solution / Answer

jabaldonedo

2012ösp8ös17 Ekim 2012 в 5:08

Daha

Neden her iki dosyanın içeriğinin karmasını almıyorsunuz?

Bu betiği deneyin, örneğin script.sh olarak adlandırın ve ardından aşağıdaki gibi çalıştırın: script.sh file1.txt file2.txt

#!/bin/bash

file1=`md5 $1`
file2=`md5 $2`

if [ "$file1" = "$file2" ]
then
    echo "Files have the same content"
else
    echo "Files have NOT the same content"
fi

jabaldonedo

Edited answer 2015ösp14ös17 Temmuz 2015 в 5:14

17

0

jim mcnamara

2012ösp38ös18 Ekim 2012 в 6:38

Daha

Farklı olmayan dosyalar için, herhangi bir yöntem, okuma geçmişte yapılmış olsa bile, her iki dosyanın da tamamen okunmasını gerektirecektir.

Başka bir alternatif yoktur. Dolayısıyla, bir noktada hash veya sağlama toplamı oluşturmak tüm dosyanın okunmasını gerektirir. Büyük dosyalar zaman alır.

Dosya meta verilerinin alınması, büyük bir dosyanın okunmasından çok daha hızlıdır.

Peki, dosyaların farklı olduğunu belirlemek için kullanabileceğiniz herhangi bir dosya meta verisi var mı? Dosya boyutu ya da dosyanın sadece küçük bir kısmını okuyan file komutunun sonuçları?

Dosya boyutu örnek kod parçası:

  ls -l $1 $2 | 
  awk 'NR==1{a=$5} NR==2{b=$5} 
       END{val=(a==b)?0 :1; exit( val) }'

[ $? -eq 0 ] && echo 'same' || echo 'different'

Dosyalar aynı boyuttaysa, tam dosya okumalarına takılıp kalırsınız.

4

0

Related communities 4

🇹🇷 GNU/Linux Türkiye Genel

771 users

Açıklama ve kurallar https://t.me/+CerkAx-piYg2OTgx Android gurubu: @droidtr kanal: @linuxistan Windows öven atılır. Yasadışı faaliyetler hakkında bilgi paylaşım platformu değildir. Debian gurubu : @debianturkey OpenSUSE gurubu @opensusetr

749 users

GNU/Linux Türkiye Genel

100 users

Uygulama mağazamız: @PlayBoyStore @YazwmDeposu Android grubumuz: @DroidTR OpenWrt: @OpenWrtTurkiye Android-x86 iso arşivi: @aandroidx86 Konu dışı muhabbet: @tgkonudisi Elektronik: @elektroniktr Gapps sevmeyenler: @AntiGapps Kanalımız: @linuxistan

Open telegram

linux türkiye

81 users

Linux Türkiye Telegram Grubudur. https://www.facebook.com/groups/linuxturkey

Open telegram

Soru ekleyin

Kategoriler

Herşey

Teknoloji

Kültür / Rekreasyon

Yaşam / Sanat

Bilim

Profesyonel

İş Dünyası

Kullanıcılar

All

New

Popular

1

Ксения Комарова

Registered 3 hafta önce

2

3

4

5

Do you have a question? Add it on the site and get an answer instantly

en.kzen.dev

Alex Howansky · Accepted Answer · 2012-10-15T17:15:56+00:00

cmp`nin ilk bayt farklılığında duracağına inanıyorum:

cmp --silent $old $new || echo "files are different"