Tar bestandformaat
Overzicht
TAR-bestanden, die staan voor Tape ARchive, zijn essentieel in de wereld van bestandsbeheer, vooral op Unix-gebaseerde systemen. Created way back in 1979 door AT&T Bell Laboratories, TAR bestanden dienen als een eenvoudige maar krachtige mechanisme om meerdere bestanddelen en directories in een enkele archief zonder compressie te bundelen. Dit format wordt veel gebruikt over verschillende besturingssystemen vanwege zijn eenvoud en compatibiliteit. Of u een ontwikkelaar bent die op zoek is naar pakket bronnencode of een systeemadministrator die backups beheert, het begrijpen van de ins en outs van TAR files kan uw werkstroom aanzienlijk verbeteren.
De sleutelfuncties
- Uncompressed Storage: TAR archiveert gegevens in een ongecomprimeerde vorm, waardoor ze ideaal zijn voor snelle bestandsoverdracht zonder zich zorgen te maken over de compressie overhead.
- Detailleerde metadata: Elk bestand binnen een TAR-archief bevat metadaten zoals timestamps, eigendomsgegevens en vergunningen, waardoor de oorspronkelijke context van elk bestanden wordt bewaard.
- Cross-Platform Compatibility: Ondanks dat het in Unix-systemen is opgericht, worden TAR-bestanden ondersteund door de meeste moderne besturingssystems, waardoor ze veelzijdig zijn voor verschillende omgevingen.
- Standaardiseerde Format: Het format voldoet aan de POSIX-normen (POSIX.1-1988 en later POSix.1-2001), waardoor de consistentie in verschillende implementaties wordt gewaarborgd.
- End-of-File Marker: TAR-bestanden bevatten een tweeblokke end- of-file marker, die helpt bij het identificeren van de eindpunt van het archief.
Technische specificaties
Format structuur
TAR is een tekstgebaseerd formaat dat gegevens in blokken van 512 byten organiseert.Elke blok kan een header of bestandinhoud vertegenwoordigen.De afwezigheid van een magische getal maakt het onderscheid van andere formaten zoals ZIP, waar specifieke identificatoren worden gebruikt om de archieftype te herkennen.
Kerncomponenten
- Header Block: Inhoudt metadata over elk bestand zoals naam, modus, gebruikersID, groep ID, grootte en timestamps.
- File Content Blocks: Volg headerblokken en bevat werkelijke bestandgegevens.Deze blokken kunnen worden gegroepeerd in grotere eenheden voor efficiënte I/O-operaties (blockering).
- End-of-File Marker: Het bestaat uit twee 512-bits blokken gevuld met binaire zeros om het einde van een archief te betekenen.
Standards & Compatibiliteit
TAR voldoet aan de POSIX-normen, waardoor de compatibiliteit over verschillende systemen en versies wordt gewaarborgd. hoewel het de compressie natively niet ondersteunt, zijn er verschillende uitbreidingen zoals .tar.gz
(gzip) of .tar.bz2
(bzip2) worden meestal gebruikt voor gecomprimeerde TAR-archieven.
Geschiedenis & Evolutie
- 1979: Voor het eerst geïntroduceerd door AT&T Bell Laboratories.
- POSIX.1-1988 en POSIX1-2001: Standards zijn vastgesteld om het formaat te standaardiseren, waardoor de consistentie in verschillende implementaties wordt gewaarborgd.
- GNU Tar: Verbeterde versie met extra functies zoals pax-uitbreidingen voor betere compatibiliteit.
Werken met TAR Files
Opening van TAR-bestanden
Om een TAR-bestand te openen:
- Windows: Installeer 7-Zip of gebruik Windows Subsystem voor Linux (WSL).
- Mac: Double-click op het bestand om het te extraheren.
- Linux: Gebruik
tar -xvf
Command in de terminal.
Conversie van TAR-bestanden
Gemeenschappelijke conversies omvatten het compresseren van TAR-bestanden in .tar.gz
, .tar.bz2
, etc. Bijvoorbeeld, het omzetten van een plat TAR bestand naar een gzip-compressed kan worden gedaan met:
tar -czf archive.tar.gz directory/
Het maken van TAR-bestanden
Om een nieuwe TAR-bestand op Linux of Unix-gebaseerde systemen te maken:
tar -cvf archive.tar /path/to/directory
Op Windows kunt u WSL of tools van derden zoals 7-Zip gebruiken.
Gemeenschappelijk gebruik Cases
- Backup en Restore: Ideaal voor het maken van backups van directories en bestanden zonder compressie.
- File Distribution: Het distribueren van grote sets van bestanden over netwerken in een oncompressief formaat.
- Source Code Management: Bundling source code repositories voor het uploaden naar versie controlesystemen of het delen met medewerkers.
Voordelen & beperkingen
Voordelen van:
- Eenvoudige en gemakkelijk te begrijpen structuur
- Cross-platform compatibiliteit
- Gedetailleerde metadata behoud
De beperkingen zijn:
- Geen ingebouwde compressie ondersteuning (met name uitbreidingen zoals
.tar.gz
Het wordt veel gebruikt) - Grotere bestandsgrootte in vergelijking met gecomprimeerde formaten
Ontwikkelaar Resources
Programmeer met TAR-bestanden wordt ondersteund door middel van verschillende APIs en bibliotheken. code voorbeelden en implementatie gids zullen binnenkort worden toegevoegd.
Vaak gestelde vragen
Waarom heeft een TAR-bestand geen magisch nummer?
In tegenstelling tot andere archiefformaten gebruikt TAR op het begin van het bestand geen specifieke identificator om zijn type te noemen.
Hoe kan ik controleren of een TAR-bestand is voltooid?
Zorg ervoor dat de laatste twee blokken van het bestand worden gevuld met binaire zeros (512-bit end-of-file marker.
Wat is het verschil tussen .tar en .ar.gz bestanden?
Een plain
.tar
een bestand is een oncompressief archief, terwijl een.tar.gz
Het bestand wordt gecomprimeerd met behulp van gzip compression om de grootte te verminderen.