Rdfind: Unterschied zwischen den Versionen

Aus Foxwiki
Keine Bearbeitungszusammenfassung
Keine Bearbeitungszusammenfassung
Zeile 1: Zeile 1:
'''topic''' - Kurzbeschreibung
'''topic''' - Kurzbeschreibung
== Beschreibung ==
== Beschreibung ==
===== Rdfind =====
„Rdfind“ steht für ‚redundant data find‘ und ist ein kostenloses Open-Source-Dienstprogramm zum Auffinden doppelter Dateien in und/oder innerhalb von Verzeichnissen und Unterverzeichnissen.
'''Rdfind''', stands for '''r'''edundant '''d'''ata '''find''', is a free and open source utility to find duplicate files across and/or within directories and sub-directories.
* Es vergleicht Dateien anhand ihres Inhalts, nicht anhand ihrer Dateinamen.
* It compares files based on their content, not on their file names.
* Rdfind verwendet einen Ranking-Algorithmus, um Originaldateien und doppelte Dateien zu klassifizieren.
* Rdfind uses '''ranking''' algorithm to classify original and duplicate files.
* Wenn Sie zwei oder mehr identische Dateien haben, ist Rdfind intelligent genug, um die Originaldatei zu finden und die restlichen Dateien als Duplikate zu betrachten.
* If you have two or more equal files, Rdfind is smart enough to find which is original file, and consider the rest of the files as duplicates.
* Sobald es die Duplikate gefunden hat, werden sie Ihnen gemeldet.
* Once it found the duplicates, it will report them to you.
* Sie können entscheiden, ob Sie sie löschen oder durch [https://www.ostechnix.com/explaining-soft-link-and-hard-link-in-linux-with-examples/ Hardlinks oder symbolische (Soft-)Links] ersetzen möchten.
* You can decide to either delete them or replace them with [https://www.ostechnix.com/explaining-soft-link-and-hard-link-in-linux-with-examples/ hard links or symbolic (soft) links].


; Installing Rdfind
; Rdfind installieren
Rdfind is available in [https://aur.archlinux.org/packages/rdfind/ AUR].
Rdfind ist in [https://aur.archlinux.org/packages/rdfind/ AUR] verfügbar.
* So, you can install it in Arch-based systems using any AUR helper program like [https://www.ostechnix.com/yay-found-yet-another-reliable-aur-helper/ Yay] as shown below.
* Sie können es also in Arch-basierten Systemen mit einem beliebigen AUR-Hilfsprogramm wie [https://www.ostechnix.com/yay-found-yet-another-reliable-aur-helper/ Yay] installieren, wie unten gezeigt.
<syntaxhighlight lang="bash" highlight="1" line>
<syntaxhighlight lang=„bash“ highlight=„1“ line>
sudo apt-get install rdfind
sudo apt-get install rdfind
</syntaxhighlight>
</syntaxhighlight>


; Usage
; Verwendung
Once installed, simply run Rdfind command along with the directory path to scan for the duplicate files.
Nach der Installation führen Sie einfach den Befehl Rdfind zusammen mit dem Verzeichnispfad aus, um nach doppelten Dateien zu suchen.


<syntaxhighlight lang="bash" highlight="1" line>
<syntaxhighlight lang=„bash“ highlight=„1“ line>
$ rdfind ~/Downloads
rdfind ~/Downloads
</syntaxhighlight>
</syntaxhighlight>


Rdfind command will scan ~/Downloads directory and save the results in a file named '''results.txt''' in the current working directory.
Der Befehl Rdfind durchsucht das Verzeichnis ~/Downloads und speichert die Ergebnisse in einer Datei namens „results.txt“ im aktuellen Arbeitsverzeichnis.
* You can view the name of the possible duplicate files in results.txt file.
* Sie können den Namen der möglichen doppelten Dateien in der Datei „results.txt“ anzeigen.


<syntaxhighlight lang="bash" highlight="1" line>
<syntaxhighlight lang=„bash“ highlight=„1“ line>
cat results.txt
cat results.txt
# Automatically generated
# Automatically generated
Zeile 38: Zeile 37:
</syntaxhighlight>
</syntaxhighlight>


By reviewing the results.txt file, you can easily find the duplicates.
Durch Überprüfung der Datei results.txt können Sie die Duplikate leicht finden.
* You can remove the duplicates manually if you like.
* Sie können die Duplikate manuell entfernen, wenn Sie möchten.


Also, you can '''-dryrun''' option to find all duplicates in a given directory without changing anything and output the summary in your Terminal:
Sie können auch die Option „‚‘‚dryrun‘'“ verwenden, um alle Duplikate in einem bestimmten Verzeichnis zu finden, ohne etwas zu ändern, und die Zusammenfassung in Ihrem Terminal auszugeben:


<syntaxhighlight lang="bash" highlight="1" line>
<syntaxhighlight lang=„bash“ highlight=„1“ line>
rdfind -dryrun true ~/Downloads
rdfind -dryrun true ~/Downloads
</syntaxhighlight>
</syntaxhighlight>


Once you found the duplicates, you can replace them with either hardlinks or symlinks.
Sobald Sie die Duplikate gefunden haben, können Sie sie entweder durch Hardlinks oder durch Symlinks ersetzen.


To replace all duplicates with hardlinks, run:
Um alle Duplikate durch Hardlinks zu ersetzen, führen Sie Folgendes aus:
<syntaxhighlight lang="bash" highlight="1" line>
<syntaxhighlight lang=„bash“ highlight=„1“ line>
rdfind -makehardlinks true ~/Downloads
rdfind -makehardlinks true ~/Downloads
</syntaxhighlight>
</syntaxhighlight>


To replace all duplicates with symlinks/soft links, run:
Um alle Duplikate durch Symlinks/Softlinks zu ersetzen, führen Sie Folgendes aus:
<syntaxhighlight lang="bash" highlight="1" line>
<syntaxhighlight lang=„bash“ highlight=„1“ line>
rdfind -makesymlinks true ~/Downloads
rdfind -makesymlinks true ~/Downloads
</syntaxhighlight>
</syntaxhighlight>


You may have some empty files in a directory and want to ignore them.
Möglicherweise befinden sich in einem Verzeichnis einige leere Dateien, die Sie ignorieren möchten.
* If so, use '''-ignoreempty''' option like below.
* Wenn dies der Fall ist, verwenden Sie die Option „-ignoreempty“ wie unten beschrieben.
<syntaxhighlight lang="bash" highlight="1" line>
<syntaxhighlight lang=„bash“ highlight=„1“ line>
rdfind -ignoreempty true ~/Downloads
rdfind -ignoreempty true ~/Downloads
</syntaxhighlight>
</syntaxhighlight>


If you don’t want the old files anymore, just delete duplicate files instead of replacing them with hard or soft links.
Wenn Sie die alten Dateien nicht mehr benötigen, löschen Sie die doppelten Dateien einfach, anstatt sie durch harte oder weiche Links zu ersetzen.


To delete all duplicates, simply run:
Um alle Duplikate zu löschen, führen Sie einfach Folgendes aus:
<syntaxhighlight lang="bash" highlight="1" line>
<syntaxhighlight lang=„bash“ highlight=„1“ line>
rdfind -deleteduplicates true ~/Downloads
rdfind -deleteduplicates true ~/Downloads
</syntaxhighlight>
</syntaxhighlight>


If you do not want to ignore empty files and delete them along with all duplicates, run:
Wenn Sie leere Dateien nicht ignorieren und zusammen mit allen Duplikaten löschen möchten, führen Sie Folgendes aus:
<syntaxhighlight lang="bash" highlight="1" line>
<syntaxhighlight lang=„bash“ highlight=„1“ line>
rdfind -deleteduplicates true -ignoreempty false ~/Downloads
rdfind -deleteduplicates true -ignoreempty false ~/Downloads
</syntaxhighlight>
</syntaxhighlight>


For more details, refer the help section:
Weitere Informationen finden Sie im Hilfebereich:
<syntaxhighlight lang="bash" highlight="1" line>
<syntaxhighlight lang=„bash“ highlight=„1“ line>
rdfind --help
rdfind --help
</syntaxhighlight>
</syntaxhighlight>


And, the manual pages
Und die Handbuchseiten
<syntaxhighlight lang="bash" highlight="1" line>
<syntaxhighlight lang=„bash“ highlight=„1“ line>
man rdfind
man rdfind
</syntaxhighlight>
</syntaxhighlight>

Version vom 13. Oktober 2024, 20:31 Uhr

topic - Kurzbeschreibung

Beschreibung

„Rdfind“ steht für ‚redundant data find‘ und ist ein kostenloses Open-Source-Dienstprogramm zum Auffinden doppelter Dateien in und/oder innerhalb von Verzeichnissen und Unterverzeichnissen.

  • Es vergleicht Dateien anhand ihres Inhalts, nicht anhand ihrer Dateinamen.
  • Rdfind verwendet einen Ranking-Algorithmus, um Originaldateien und doppelte Dateien zu klassifizieren.
  • Wenn Sie zwei oder mehr identische Dateien haben, ist Rdfind intelligent genug, um die Originaldatei zu finden und die restlichen Dateien als Duplikate zu betrachten.
  • Sobald es die Duplikate gefunden hat, werden sie Ihnen gemeldet.
  • Sie können entscheiden, ob Sie sie löschen oder durch Hardlinks oder symbolische (Soft-)Links ersetzen möchten.
Rdfind installieren

Rdfind ist in AUR verfügbar.

  • Sie können es also in Arch-basierten Systemen mit einem beliebigen AUR-Hilfsprogramm wie Yay installieren, wie unten gezeigt.
sudo apt-get install rdfind
Verwendung

Nach der Installation führen Sie einfach den Befehl Rdfind zusammen mit dem Verzeichnispfad aus, um nach doppelten Dateien zu suchen.

rdfind ~/Downloads

Der Befehl Rdfind durchsucht das Verzeichnis ~/Downloads und speichert die Ergebnisse in einer Datei namens „results.txt“ im aktuellen Arbeitsverzeichnis.

  • Sie können den Namen der möglichen doppelten Dateien in der Datei „results.txt“ anzeigen.
cat results.txt
# Automatically generated
# duptype id depth size device inode priority name
DUPTYPE_FIRST_OCCURRENCE 1469 8 9 2050 15864884 1 /home/sk/Downloads/tor-browser_en-US/Browser/TorBrowser/Tor/PluggableTransports/fte/tests/dfas/test5.regex
DUPTYPE_WITHIN_SAME_TREE -1469 8 9 2050 15864886 1 /home/sk/Downloads/tor-browser_en-US/Browser/TorBrowser/Tor/PluggableTransports/fte/tests/dfas/test6.regex
[...]
DUPTYPE_FIRST_OCCURRENCE 13 0 403635 2050 15740257 1 /home/sk/Downloads/Hyperledger(1).pdf
DUPTYPE_WITHIN_SAME_TREE -13 0 403635 2050 15741071 1 /home/sk/Downloads/Hyperledger.pdf
# end of file

Durch Überprüfung der Datei results.txt können Sie die Duplikate leicht finden.

  • Sie können die Duplikate manuell entfernen, wenn Sie möchten.

Sie können auch die Option „‚‘‚dryrun‘'“ verwenden, um alle Duplikate in einem bestimmten Verzeichnis zu finden, ohne etwas zu ändern, und die Zusammenfassung in Ihrem Terminal auszugeben:

rdfind -dryrun true ~/Downloads

Sobald Sie die Duplikate gefunden haben, können Sie sie entweder durch Hardlinks oder durch Symlinks ersetzen.

Um alle Duplikate durch Hardlinks zu ersetzen, führen Sie Folgendes aus:

rdfind -makehardlinks true ~/Downloads

Um alle Duplikate durch Symlinks/Softlinks zu ersetzen, führen Sie Folgendes aus:

rdfind -makesymlinks true ~/Downloads

Möglicherweise befinden sich in einem Verzeichnis einige leere Dateien, die Sie ignorieren möchten.

  • Wenn dies der Fall ist, verwenden Sie die Option „-ignoreempty“ wie unten beschrieben.
rdfind -ignoreempty true ~/Downloads

Wenn Sie die alten Dateien nicht mehr benötigen, löschen Sie die doppelten Dateien einfach, anstatt sie durch harte oder weiche Links zu ersetzen.

Um alle Duplikate zu löschen, führen Sie einfach Folgendes aus:

rdfind -deleteduplicates true ~/Downloads

Wenn Sie leere Dateien nicht ignorieren und zusammen mit allen Duplikaten löschen möchten, führen Sie Folgendes aus:

rdfind -deleteduplicates true -ignoreempty false ~/Downloads

Weitere Informationen finden Sie im Hilfebereich:

rdfind --help

Und die Handbuchseiten

man rdfind

Installation

Syntax

Optionen

Parameter

Umgebungsvariablen

Exit-Status

Anwendung

Fehlerbehebung

Konfiguration

Dateien

Anhang

Siehe auch

Dokumentation

Man-Pages
Info-Pages

Links

Projekt
Weblinks