Dateiformat
Überblick
TAR-Dateien, die für Tape ARchive stehen, sind unerlässlich in der Welt des Dateimanagements, vor allem auf Unix-basierten Systemen. Erstellt im Jahr 1979 von AT&T Bell Laboratories, TAR Dateien dienen als ein einfacher, aber leistungsstarkes Mechanismus, um mehrere Dateien und Kataloge in ein einziges Archiv ohne Komprimierung zu bündeln. Dieses Format wird weit verbreitet über verschiedene Betriebssysteme aufgrund seiner Einfachheit und Kompatibilität. Ob Sie ein Entwickler sind, der nach Paket Quellcode oder ein Systemadministrator verwalten Backups, das Verständnis der Ins und Outs von TAR Files kann Ihr Workflow erheblich verbessern.
Hauptmerkmale
- Uncompressed Storage: TAR archiviert Daten in einer unkompressierten Form, wodurch sie ideal für schnelle Dateienübertragungen ohne Sorgen über die Kompression.
- Detaillierte Metadaten: Jede Datei innerhalb eines TAR-Archivs enthält Meta-Daten wie Timestamps, Eigentumsdetails und Genehmigungen, um sicherzustellen, dass der ursprüngliche Kontext jedes Dateien beibehalten wird.
- Cross-Platform Compatibility: Trotz ihrer Wurzeln in Unix-Systemen werden TAR-Dateien durch die meisten modernen Betriebssysteme unterstützt, was sie für verschiedene Umgebungen vielseitig macht.
- Standardisierte Formate: Das Format entspricht den POSIX-Standards (POSIX.1-1988 und nachfolgender Posix.1-2001), die eine Konsistenz über verschiedene Implementierungen gewährleisten.
- End-of-File Marker: TAR-Dateien enthalten einen zweiblock-end- of-file-Marker, der bei der Identifizierung des Endpunkts des Archivs hilft.
Technische Spezifikationen
Formatierung Struktur
TAR ist ein textbasiertes Format, das Daten in Blöcke von 512 Byten organisiert.Jeder Block kann entweder einen Header oder Dateiinhalt darstellen.Die Abwesenheit eines magischen Zahlen unterscheidet es von anderen Formaten wie ZIP, wo spezifische Identifikatoren verwendet werden, um den Archivtyp zu erkennen.
Kernkomponenten
- Header Block: enthält Metadaten über jedes Datei wie Name, Modus, Benutzer-ID, Gruppe ID, Größe und Zeitstempel.
- File Content Blocks: Folgen Sie den Headerblock und enthalten tatsächliche Dateidaten.Diese Blöcke können in größere Einheiten zu effizienten I/O-Betrieb (Blocking) zusammengefasst werden).
- End-of-File Marker: Es besteht aus zwei 512-Bit-blocken, die mit binären zeros gefüllt sind, um das Ende eines archives zu bezeichnen.
Standards & Kompatibilität
TAR hält sich an die POSIX-Standards, die Kompatibilität über verschiedene Systeme und Versionen gewährleisten. obwohl es nicht natürliche Kompression unterstützt, verschiedene Erweiterungen wie .tar.gz
(gzip) oder .tar.bz2
(bzip2) werden in der Regel für komprimierte TAR-Archive verwendet.
Geschichte & Evolution
- 1979: Erst von AT&T Bell Laboratories eingeführt.
- POSIX.1-1988 und POSIX1-2001: Standards wurden festgelegt, um das Format zu standardisieren und Konsistenz in verschiedenen Implementierungen zu gewährleisten.
- GNU Tar: Verbesserte Version mit zusätzlichen Funktionen wie Pax-Erweiterungen für bessere Kompatibilität.
Arbeiten mit TAR Files
Öffnen von TAR Files
Um eine TAR Datei zu öffnen:
- Windows: Installieren Sie 7-Zip oder verwenden Sie Windows Subsystem für Linux (WSL).
- Mac: Doppelklicken Sie auf die Datei, um sie zu extrahieren.
- Linux: Verwenden Sie
tar -xvf
Befehl im Terminal.
Konvertierung von TAR Files
Gemeinsame Konvertierungen beinhalten die Komprimierung von TAR-Dateien in .tar.gz
, .tar.bz2
, usw. Zum Beispiel kann die Konvertierung einer Platten TAR-Datei in eine gzip-komprimierte eine mit:
tar -czf archive.tar.gz directory/
Erstellen von TAR Files
Um eine neue TAR-Datei auf Linux oder Unix-basierten Systemen zu erstellen:
tar -cvf archive.tar /path/to/directory
In Windows können Sie WSL oder Drittanbieter-Tools wie 7-Zip verwenden.
Häufige Anwendungsfälle
- Backup und Restore: Ideal für die Erstellung von Backups von Katalogen und Dateien ohne Kompression.
- File Distribution: Die Verteilung von großen Dateien über Netzwerke in einem unkomprimierten Format.
- Source Code Management: Bundling Source Code Repositories vor dem Laden auf Version-Control-Systeme oder Teilen mit Mitarbeitern.
Vorteile & Beschränkungen
Vorzüge:
- Einfache und leicht zu verstehen Struktur
- Cross-Plattform Kompatibilität
- Detaillierte Metadatenrechterhaltung
Einschränkungen:
- Keine integrierte Kompressionsunterstützung (vor allem Erweiterungen wie
.tar.gz
ist weit verbreitet) - größere Dateigröße im Vergleich zu komprimierten Formaten
Entwickler Ressourcen
Programmierung mit TAR-Dateien wird über verschiedene APIs und Bibliotheken unterstützt. Code Beispiele und Implementierungsanweisungen werden bald hinzugefügt.
Häufige Fragen
Warum hat ein TAR-Datei keine magische Zahl?
Im Gegensatz zu anderen Archivformaten verwendet TAR am Anfang der Datei nicht einen spezifischen Identifikator, um ihren Typ anzuzeigen.
Wie kann ich überprüfen, ob eine TAR-Datei vollständig ist?
Stellen Sie sicher, dass die letzten zwei Blöcke der Datei mit binären Zero (512-Bit-End-of-File-Marker) gefüllt sind.
Was ist der Unterschied zwischen .tar und.tar.gz Dateien?
Eine Plain
.tar
Die Datei ist ein unkomprimiertes Archiv, während eine.tar.gz
Die Datei wird mit Gzip-Kompression komprimiert, um die Größe zu verringern.