Doppelte Dateien sind unerwünscht. Sie belegen unnötig Speicherplatz auf dem System und sorgen für Unordnung. Glücklicherweise bietet Linux eine Methode, um redundante Daten zu beseitigen und Duplikate mithilfe von Fdupes zu bereinigen.
Fdupes installieren
Das Fdupes-Tool ist ein hervorragendes Kommandozeilenwerkzeug zur Deduplizierung unter Linux. Es kann bei der Ausführung Verzeichnisse nach Duplikaten durchsuchen, deren genauen Speicherort ermitteln und diese Duplikate in symbolische Verknüpfungen umwandeln – sowohl Hardlinks als auch Softlinks. Das Tolle daran ist, dass die Umwandlung von Duplikaten in Systemverknüpfungen den Speicherplatz reduziert, während die Dateien an den gleichen Stellen erhalten bleiben.
Die Installation von Fdupes ist unkompliziert und wird von den meisten Linux-Distributionen unterstützt. Sogar FreeBSD bietet diese Software an. Um die Software zu installieren, öffnen Sie ein Terminal und geben Sie die entsprechenden Befehle für Ihr Linux-Betriebssystem ein.
Ubuntu
sudo apt install fdupes
Debian
sudo apt-get install fdupes
Arch-Linux
Unter Arch Linux ist Fdupes über das „Community“-Repository verfügbar. Dieses Repository ist jedoch nicht standardmäßig aktiviert. Um das Programm zu installieren, muss die Datei „pacman.conf“ bearbeitet werden.
Öffnen Sie die Konfigurationsdatei mit dem Texteditor Nano:
sudo nano /etc/pacman.conf
Entfernen Sie in der Konfigurationsdatei die „#“-Zeichen vor allen Zeilen, die mit „Community“ in Verbindung stehen. Alle „#“-Zeichen müssen entfernt werden, damit das Repository funktioniert. Speichern Sie die Änderungen mit Strg + O und beenden Sie mit Strg + X.
Synchronisieren Sie das neue Community-Repository mit Pacman:
sudo pacman -Syy
Nachdem die Softwarequelle „Community“ erfolgreich synchronisiert wurde, hat Arch Linux vollen Zugriff darauf. Installieren Sie Fdupes mit dem Paketmanager:
sudo pacman -S fdupes
Fedora
sudo dnf install fdupes
OpenSUSE
sudo zypper install fdupes
Nach Duplikaten suchen
Bevor Fdupes überflüssige Dateien entfernen kann, muss es deren Speicherorte kennen. Verwenden Sie den Schalter „r“, um nach Dateien zu suchen. Der „r“-Schalter ermöglicht die Durchsuchung jedes Ordners auf Ihrem Linux-Rechner, einschließlich aller Unterordner, was die Suche nach Duplikaten beschleunigt.
Um zu lernen, wie man doppelte Dateien an verschiedenen Stellen auf Ihrem Linux-PC findet und entfernt, befolgen Sie die nachstehenden Anweisungen.
Duplikate im Home-Verzeichnis
Ein Hauptspeicherort für Benutzerdateien ist das Verzeichnis „/home/“. Hier werden alle Benutzerdaten unter Linux abgelegt. Daher sammelt sich im Laufe der Zeit eine Menge Daten an, was häufig zu Duplikaten führt. Um diese zu finden, öffnen Sie ein Terminal und weisen Sie Fdupes auf Ihr Home-Verzeichnis hin:
fdupes -r ~/
oder um einen anderen Benutzer zu scannen, der nicht angemeldet ist:
fdupes -r /home/benutzername/
Nach dem Scan gibt das Tool eine Liste der gefundenen Duplikate im Home-Verzeichnis aus. Um diese Informationen zu speichern, leiten Sie die Ausgabe in eine Datei im Ordner „Dokumente“ um:
fdupes -r ~/ >> ~/Documents/fdupes-scan-home.txt
oder
fdupes -r /home/benutzername/ >> ~/Documents/fdupes-scan-home-user.txt
Duplikate im Root-Dateisystem
Fdupes kann jeden Ort scannen, nicht nur das Home-Verzeichnis. Um doppelte Dateien im Root-Dateisystem Ihres Linux-PCs zu finden, gehen Sie wie folgt vor.
Wechseln Sie im Terminal vom normalen Benutzer zum Root-Konto. Dadurch erhält die Fdupes-App die Berechtigung, gesperrte Orte zu scannen.
sudo -s
oder
su -
Scannen Sie als Root das Root-Dateisystem mit Fdupes:
fdupes -r /
Alternativ scannen Sie einen bestimmten Ort anstelle des gesamten Root-Systems:
fdupes -r /pfad/auf/ihrem/pc
Möchten Sie die Scanergebnisse in eine Datei exportieren? Führen Sie diesen Befehl aus:
fdupes -r / >> /home/benutzername/Documents/fdupes-scan.txt
oder
fdupes -r /pfad/auf/ihrem/pc >> /home/benutzername/Documents/fdupes-scan.txt
Redundante Daten entfernen
Das Scannen nach doppelten Dateien ist ein wichtiger Schritt bei der Beseitigung redundanter Daten. Der nächste Schritt ist die Analyse der Ergebnisse und das Entfernen der Duplikate. Zum Glück geht das Entfernen von Redundanzen sehr schnell. Das Beste daran ist, dass nichts gelöscht werden muss, da Fdupes das Ersetzen von Dateien durch Symlinks unterstützt.
Fdupes unterstützt zwei Arten von Deduplizierung: Hardlinks und Softlinks. Für beste Ergebnisse wird die Verwendung von Hardlinks empfohlen, da diese nicht von echten Dateien zu unterscheiden sind. Soft-Symlinks funktionieren aber auch. Gehen Sie wie folgt vor, um die Deduplizierung im Terminal durchzuführen:
Hinweis: Ersetzen Sie doppelte Daten nicht systemweit, wenn Sie die Risiken nicht kennen!
Hardlink ersetzen
fdupes -rH /home/benutzername/
oder für systemweite Duplikate:
sudo -s fdupes -rH /root/datei/pfad
Softlink ersetzen
fdupes -rS /home/benutzername/
oder für systemweit:
fdupes -rS /root/datei/pfad