Formater af filer
Overblik
TAR-filer, der står for Tape ARchive, er væsentlige i filstyringsverdenen, især på Unix-baserede systemer. Skabt tilbage i 1979 af AT&T Bell Laboratories, TAR filer tjener som en simpel men kraftfuld mekanisme til at bundle flere filers og kataloger i et enkelt arkiv uden kompression. Dette format anvendes bredt over forskellige operativsystemer på grund af sin enkelhed og kompatibilitet. Uanset om du er en udvikler søger at pakke kilde kode eller en systemadministrator håndterer backups, forståelse af ins og outs af TAR files kan meget forbedre dit arbejdsproces.
Nøglefunktioner
- Uncompressed Storage: TAR arkiverer data i en ikke-komprimeret form, hvilket gør dem ideelle til hurtige filoverførsler uden at bekymre sig om kompression overhead.
- Detaljerede Metadata: Hver fil i et TAR-arkiv indeholder metadata som timestamper, ejendomsoplysninger og tilladelser, hvilket sikrer, at den oprindelige kontekst for hver fil bevares.
- Cross-Platform Compatibility: På trods af at være rødder i Unix-systemer, er TAR-filer understøttet af de fleste moderne driftssystemer og gør dem mangfoldige for forskellige miljøer.
- Standardiseret format: Formatet overholder POSIX-standarderne (POSIX.1-1988 og senere POSix.1-2001), hvilket sikrer konsistens i forskellige implementationer.
- End-of-File Marker: TAR-filer indeholder en to-block end- of-file markør, som hjælper med at identificere arkivets ophørspunkt.
Tekniske specifikationer
Formater struktur
TAR er et tekstbaseret format, der organiserer data i blokker på 512 byte. Hver blok kan repræsentere enten en header eller filindhold. Fraværet af et magisk nummer gør det forskellig fra andre formater som ZIP, hvor specifikke identifikatorer bruges til at genkende arkivtypen.
Core komponenter
- Header Block: Indeholder metadata om hver fil som navn, mode, bruger-ID, gruppe-id, størrelse og timestamper.
- File Content Blocks: Følg headerblokker og indeholder faktiske fildata. Disse blokker kan grupperes i større enheder for effektiv I/O-operationer (blocking).
- End-of-File Marker: Den består af to 512-byte blokke fyldt med binære zeros for at betyde slutningen af et arkiv.
Standarder og kompatibilitet
TAR overholder POSIX standarder, der sikrer kompatibilitet over forskellige systemer og versioner. Mens det ikke understøtter kompression nativt, forskellige udvidelser såsom .tar.gz
(gzip) eller .tar.bz2
(bzip2) er almindeligt anvendt til komprimerede TAR-arkiver.
Historie og evolution
- 1979: Først introduceret af AT&T Bell Laboratories.
- POSIX.1-1988 og POSIX1-2001: Standarder blev etableret for at standardisere formatet, hvilket sikrer sammenhæng mellem forskellige implementeringer.
- GNU Tar: Udvidet version med yderligere funktioner som pax-udvidelser for bedre kompatibilitet.
Arbejdet med TAR Files
Åbning af filer
For at åbne en TAR fil:
- Windows: Installér 7-Zip eller bruger Windows Subsystem for Linux (WSL).
- Mac: Double-click på filen for at udtrykke den.
- Linux: Brug af
tar -xvf
Kommandoen i terminalen.
Konverter TAR filer
Generelle konverteringer omfatter komprimering af TAR-filer i .tar.gz
, .tar.bz2
, osv. For eksempel kan konvertering af en flat TAR-fil til en gzip-komprimeret en foretages med:
tar -czf archive.tar.gz directory/
Skabelse af filer
For at oprette en ny TAR-fil på Linux eller Unix-baserede systemer:
tar -cvf archive.tar /path/to/directory
På Windows kan du bruge WSL eller tredjepartsværktøjer som 7-Zip.
Gennemsigtig brug af tilfælde
- Backup & Restore: Ideel til at oprette backups af kataloger og filer uden kompression.
- File Distribution: Distribuerer store sæt af filer over netværk i et ikke-komprimeret format.
- Source Code Management: Bundling source code repositorier før opladning til versionskontrolsystemer eller deling med samarbejdspartnere.
Fordele og begrænsninger
Fordele ved:
- Enkel og nem at forstå struktur
- Cross-platform kompatibilitet
- Detaljeret metadata vedligeholdelse
Begrænsningerne er:
- Ingen indbygget kompressionstøtte (især udvidelser som
.tar.gz
Det er meget anvendt) - Større filstørrelser sammenlignet med komprimerede formater
Udviklere ressourcer
Programmering med TAR-filer understøttes gennem forskellige APIs og biblioteker. kode eksempler og gennemførelsesguider vil blive tilføjet snart.
Ofte stillede spørgsmål
Hvorfor har en TAR-fil ikke et magisk nummer?
I modsætning til andre arkivformater bruger TAR ikke en specifik identifikator i begyndelsen af filen til at angive dens type.
Hvordan kan jeg kontrollere, om en TAR-fil er fuldstændig?
Sørg for, at de sidste to blokke af filen er fyldt med binære zeros (512-bit end-of-file marker.
Hvad er forskellen mellem .tar og .ar.gz filer?
En plain
.tar
filen er en ikke-komprimeret arkiv, mens en.tar.gz
Filen komprimeres ved hjælp af gzip-kompression for at reducere størrelsen.