Zum Inhalt springen

Linux/Datenkompression

Aus Foxwiki

Linux/Datei/komprimierenArchivieren - Datei archivieren und komprimieren

Beschreibung

Dateien zu Archiven zusammenfassen und Dateigröße verringern

  • Dateien in Archive zu verpacken und ihre Größe durch Kompressionsalgorithmen zu verkleinern ist ein häufiger Vorgang in der Datenverarbeitung
Archiven und komprimierte Dateien
  • Ein Archiv ist ein unkomprimierter Behälter für Dateien
  • Dieses Archiv kann durch Kompressionsverfahren komprimiert werden
  • Es gibt allerdings ein paar Formate, die gleich auch eine Komprimierung beinhalten

Programme

Um diese Formate unter Linux packen und entpacken zu können, benötigt man für jedes Format ein eigenes Programm

  • Für die großen Desktop-Umgebungen GNOME und KDE gibt es Archivmanager, die über eine komfortable grafische Oberfläche verfügen, jedoch auf die Einzelprogramme zurückgreifen
  • Daher müssen diese auf jeden Fall installiert sein

Um mit sämtlichen oben genannten Formaten umgehen zu können, müssen die folgenden Pakete installiert [1] werden.

  • Die ersten fünf Pakete sollten bereits nach einer Standardinstallation vorhanden sein
tar - ein Archivierungsprogramm, das unter Linux oft mit GZip oder BZip verwendet wird
bzip2 - für Dateien vom Typ BZip
gzip - für Dateien vom Typ GZip
lzop - auf Geschwindigkeit optimiertes Packprogramm
zip Packen von Zip-Archiven
unzip Entpacken von Zip-Archiven
xz-utils
xz-lzma
XZ-Dateien und den Vorgänger LZMA
p7zip-full Packen/Entpacken mittels LZMA Algorithmus von 7-Zip-Archiven und Entpacken von AES-verschlüsselten Zip-Archiven
lha [2] LZH-Archiver, wird von Ark benutzt

Erwähnenswert ist auch folgende Anwendung, die bereits in der Standardinstallation mit installiert wird

  • split - Archive in mehrere (beliebig große) Teile teilen
Proprietäre Archivformate

Für diverse proprietäre Archivformate gibt es die Wahl zwischen einer Open Source Version und einer Version, die unter einer unfreien Lizenz steht, die dafür aber mehr Funktionalität bietet

  • So können beispielsweise nur die proprietären Versionen mit Passwörtern geschützte Archive extrahieren usw.
  • Man sollte hierbei darauf achten, dass entweder die proprietäre oder die freie Version installiert ist

Ace

  • unace
  • unace-nonfree

Rar

Für rar Dateien muss eines der folgenden Pakete installiert werden:

  • rar Erstellen von Rar-Archiven
  • unrar
  • unrar-free
  • p7zip-rar
  • unar
Hinweis
RAR und Ace sind proprietäre Dateiformate
  • Das heißt, die Mechanismen zum Erstellen und Entpacken solcher Archive beruhen auf geschützten Closed-Source Verfahren
  • unrar-free und unace sind Versuche, die wichtigsten Funktionen zum Entpacken unter einer offenen Lizenz bereit stellen zu können. unrar und unace-nonfree sind kommerzielle Software von den Herstellern der beiden Formate

Welches dieser Pakete man installieren soll, ist dem Benutzer selber überlassen

  • Möchte man ein Computersystem ohne proprietäre Software, so sollte man die freien Pakete nutzen, muss aber mit der Einschränkung leben, nicht alle Archive entpacken zu können
  • Möchte man alle Archive inklusive beispielsweise dem RAR 3.0 Format und Passwort geschützte Archive entpacken, so muss man auf die proprietären Pakete zurückgreifen

Terminal

Man muss nicht zwangsläufig auf die graphischen Archivmanager zurückgreifen

  • Alle Packprogramme kann man auch von einem Terminal heraus bedienen
  • Wichtig dabei ist natürlich, dass die oben genannten Packprogramme installiert sind

Ace

Falls unance-nonfree installiert ist

unace (OPTIONEN) ARCHIVNAME.ace

Falls unace installiert ist

unace e ARCHIVNAME.ace

Rar

Archive erstellen

# Allgemein rar a ARCHIVNAME DATEI1 (DATEI2) # Beispiel rar a -v2048 test.rar -p datei1 datei2 datei3

Archive entpacken

Manche unter Windows erstellte Rar-Archive lassen sich aus unbekannten Gründen nicht mit Ark unter KDE öffnen

  • Hier ist man gezwungen, auf das Entpacken im Terminal zurückzugreifen, was in der Regel einwandfrei funktioniert
  • Dazu geht man wie folgt vor

# Allgemein unrar x ARCHIVNAME.rar # Beispiel unrar x -pPasswort ~/Desktop/beispiel.rar

Ein Sonderfall ergibt sich, wenn bei einer passwortgeschützten Datei das Passwort mit Sonderzeichen, wie etwa ~ endet

  • In diesem Fall führt der o
  • g
  • Befehl zu der Fehlermeldung

bash: !~: event not found

Das Problem kann man umgehen, indem man zunächst das Entpacken ohne Passworteingabe einleitet (siehe Befehl oben)

  • Dann wird man automatisch nach dem Passwort gefragt, welches man nun eingeben kann
  • Achtung: Das Passwort wird bei der Eingabe nicht angezeigt

Enter password (will not be echoed) for Dateiname.rar

Kommandos / Optionen Bemerkung
a Dateien sollen hinzugefügt werden
e Dateien sollen entpackt werden
x Dateien sollen in die in der Datei enthaltene Verzeichnisstruktur entpackt werden
-m[KOMPRESSIONSLEVEL] Setzt den Kompressionslevel ( -m0 = ohne; -m3 = standard; -m5 = maximal) (optional)
-v[GROESSE][EINHEIT] Legt die Dateigröße fest, als Einheit kann man u.a
  • Byte (b), Kilobyte (k), und Megabyte (m) wählen
  • Wenn man nun Teilarchive haben will, die zum Beispiel 100 Megabyte groß sind, wählt man folgende Option -v100m
  • Die Größe der Teilarchive geht bei 1000 Bytes los, kleinere Teilarchive kann man nicht erstellen (optional)
-rr[GROESSE][EINHEIT] Fügt Wiederherstellungsinformationen hinzu
  • Diese können bspw
  • in Prozent angegeben werden, für fünf Prozent gibt man also -rr5% an
  • Wird keine Einheit angegeben, gibt die Größenangabe die Anzahl der Sektoren an, die zur Wiederherstellung verwendet werden können (optional)
-p Setzt ein Passwort, das man nach der Eingabe festlegt (optional)
-hp Setzt auch ein Passwort, Unterschied zu -p ist, dass das Archiv nun komplett verschlüsselt wird, das heißt die Dateinamen im Archiv werden auch verschlüsselt (optional)

tar.gz/tar.bz2

tar.gz

Archive erstellen

# Allgemein

tar -czf ARCHIVNAME.tar.gz DATEI1/VERZEICHNIS1 (DATEI2/VERZEICHNIS2)

# Beispiel

tar -czf beispiel.tar.gz test example

# oder

tar -czf beispiel.tar.gz test/

Dabei wird im ersten Beispiel ein Archiv beispiel.tar.gz aus den Dateien test und example erstellt

  • Im zweiten Beispiel wird aus dem Verzeichnis test/ ein Archiv erstellt

Archive entpacken

# Allgemein

tar -xzf ARCHIVNAME.tar.gz

# Beispiel tar -xzf beispiel.tar.gz

tar.bz2

Archive erstellen

# Allgemein

tar -cjf ARCHIVNAME.tar.bz2 DATEI1/VERZEICHNIS1 (DATEI2/VERZEICHNIS2)

# Beispiel

tar -cjf beispiel.tar.bz2 test example

# oder tar -cjf beispiel.tar.bz2 test/

Dabei wird im ersten Beispiel ein Archiv beispiel.tar.bz2 aus den Dateien test und example erstellt

  • Im zweiten Beispiel wird aus dem Verzeichnis test/ ein Archiv erstellt

Archive entpacken

# Allgemein

tar -xjf ARCHIVNAME.tar.bz2

# Beispiel

tar -xjf beispiel.tar.bz2

Dabei entsteht in der Regel ein neues Verzeichnis, in welches man dann wechseln kann

  • Manchmal möchte man den Inhalt des Archivs auch direkt an einen Ort entpacken (für .tar.bz2 bitte die Befehle entsprechend ändern)

# Allgemein

tar -xjf ARCHIVNAME.tar.bz2 -C ZIELORDNER

# Beispiel

tar -xjf php-5.1.0.tar.bz2 -C /opt/php5

UnZip

# Datei entpacken unzip ARCHIVNAME.zip # in Ordner entpacken unzip ARCHIVNAME.zip -d ZIELORDNER

atool, Unpack und dtrx

Um sich nicht die unterschiedlichen Befehle und Parameter der verschiedenen Archivformattools zu merken, gibt es atool, Unpackoder dtrx

  • Die Programme kennen die Syntax um Archive zu entpacken und ersparen dem Benutzer die Eingabe des kompletten Befehls
  • So kann man dann mit einem einzigen Befehl wie
aunpack ARCHIV

oder

unp ARCHIV

oder

dtrx ARCHIV

bequem im Terminal [4] entpacken

  • Weitere Informationen zu Unpack findet man im Wiki unter unp

Die Funktionalität von atool geht sogar noch weiter, so können u.a

  • mit apack Archive erstellt werden oder mit als Archivinhalte aufgelistet werden. atool kann aus den universe-Quellen installiert werden:* atool (universe)

Analog dtrx: * dtrx (universe)

zless und bzless

zless und bzless sind zwei kleine Programme, mit denen sich gepackte Textdateien (.gz und .bz2) betrachten lassen, ohne sie vorher manuell entpacken zu müssen

Weitere Packprogramme

cabextract

cabextract ist zum Entpacken von Cabinet-Dateien, welche im Format .cab vorliegen, gedacht

innoextract

innoextract extrahiert Installationsdateien, welche mit Inno Setup erstellt wurden

unshield

unshield ist wie cabextract zum Entpacken von Cabinet-Dateien gedacht, jedoch für Anwendungen, die InstallShield verwenden

PeaZip

PeaZip ist ein relativ junges plattformübergreifendes Projekt (2005) und stellt eine gute und funktionserweiterte Alternative zu den obigen Archivmanagern dar

Es unterstützt praktisch alle im Rahmen der lizenzrechtlichen Bestimmungen verfügbaren Formate und bietet eine kaum mehr überschaubare

Vielfalt an Funktionen, Optionen und Filtern

  • Besondere Beachtung verdienen die umfangreichen Möglichkeiten zur Datensicherheit (verschiedene Kryptografieen, Löschen durch mehrfaches Überschreiben usw.)

Im Gegensatz zu den oben beschriebenen Archivmanagern ist PeaZip kein grafisches Frontend für die einzelnen oben beschriebenen Packprogramme, sondern ein eigenständiges Pack- und Archivierungsprogramm

Es ist also nicht auf die separate Installation von Packprogrammen angewiesen


Anhang

Siehe auch

Dokumentation

Man-Page
Info-Pages

Links

Projekt
Weblinks