Formát súborov
Prehľad
TAR súbory, ktoré predstavujú Tape ARchive, sú nevyhnutné vo svete riadenia súborov, najmä na systémoch založených na Unix. Vytvorené späť v roku 1979 AT&T Bell Laboratories, Súbory TAR slúžia ako jednoduchý, ale silný mechanizmus pre spájanie viacerých súloh a adresárov do jedného archívu bez kompresie. Tento formát je široko používaný v rôznych operačných systémov kvôli jeho jednoduchosti a kompatibilite. Či už ste vývojár hľadá zdrojový kód balenia alebo systémový správca spravuje zálohy, porozumieť vkladom a výstupom súboroch TAR môže výrazne zlepšiť váš pracovný tok.
Kľúčové vlastnosti
- Uncompressed Storage: TAR archivuje údaje v nekompresovanom formáte, čo ich robí ideálnymi pre rýchle prenosy súborov bez toho, aby sa obávali o kompresie.
- Podrobné metaúdaje: Každý súbor v archíve TAR obsahuje metadata, ako sú časové štítky, podrobnosti o vlastníctve a povolenia, ktoré zabezpečujú zachovanie pôvodného kontextu každého súbory.
- Cross-Platform Compatibility: Napriek tomu, že sú zakorenené v systémoch Unix, súbory TAR sú podporované väčšinou moderných operačných systémov, čo ich robí všestrannými pre rôzne prostredia.
- Standardizovaný formát: Formát je v súlade so štandardmi POSIX (POSIX.1-1988 a neskôr PosIX1-2001), čo zaručuje konzistenciu v rôznych implementáciách.
- End-of-File Marker: TAR súbory zahŕňajú dvojblockový end- of-file marker, ktorý pomáha pri identifikácii bodu ukončenia archívu.
Technické špecifikácie
Formátová štruktúra
TAR je formát založený na texte, ktorý organizuje dáta do blokov 512 bajtov.Každý blok môže reprezentovať buď hlavičku alebo obsah súboru.Nedostatok magického čísla ho odlišuje od iných formatov, ako je ZIP, kde sa používajú špecifické identifikátory na rozpoznanie typu archívu.
Kľúčové komponenty
- Header Block: Obsahuje metaúdaje o každom súbore, ako je názov, režim, užívateľský identifikátor, identifikácia skupiny, veľkosť a časové štítky.
- File Content Blocks: Sledujte hlavné bloky a obsahujte skutočné údaje o súboroch. Tieto bloky môžu byť zoskupené do väčších jednotiek pre efektívne I/O operácie (blokovanie).
- End-of-File Marker: Skladá sa z dvoch 512-bitových blokov naplnených binárnymi zerami, ktoré označujú koniec archívu.
Štandardy a kompatibilita
TAR dodržiava štandardy POSIX, ktoré zabezpečujú kompatibilitu medzi rôznymi systémami a verziami. hoci nepodporuje kompresiu nativne, rôzne rozšírenia ako .tar.gz
(gzip) alebo .tar.bz2
(bzip2) sa bežne používajú pre komprimované archívy TAR.
História a evolúcia
- 1979: Prvýkrát zaviedol AT&T Bell Laboratories.
- POSIX.1-1988 a POSIX1-2001: Štandardy boli stanovené na štandardizáciu formátu, čo zabezpečuje konzistenciu v rôznych implementáciách.
- GNU Tar: Vylepšená verzia s ďalšími funkciami, ako sú rozšírenia pax pre lepšiu kompatibilitu.
Práca s TAR súbormi
Otvorenie TAR súborov
Ak chcete otvoriť súbor TAR:
- Windows: Inštalovať 7-Zip alebo používať Windows Subsystem pre Linux (WSL).
- Mac: Dvojnásobne kliknite na súbor, aby ste ho vytiahli.
- Linux: Použitie
tar -xvf
Komanda v termináli.
Konverzia TAR súborov
Zvyčajné konverzie zahŕňajú komprimovanie TAR súborov do .tar.gz
, .tar.bz2
, atď. Napríklad, konverziu plochého TAR súboru na gzip-komprimovaný môže byť vykonané s:
tar -czf archive.tar.gz directory/
Vytvorenie TAR súborov
Ak chcete vytvoriť nový súbor TAR na systémoch Linux alebo Unix:
tar -cvf archive.tar /path/to/directory
V systéme Windows môžete použiť nástroje WSL alebo tretích strán, ako je 7-Zip.
bežné prípady použitia
- Backup a Restore: Ideálne pre vytvorenie záloh adresárov a súborov bez kompresie.
- Distribúcia súborov: Distribuovanie veľkých súprav súbory cez siete v nekomprimovanom formáte.
- Source Code Management: Spojenie zdrojových kódových záložiek pred nahraním do systémov ovládania verzie alebo zdieľaním s spolupracovníkami.
Výhody a obmedzenia
Výhody:
- Jednoduchá a ľahko pochopiteľná štruktúra
- Cross-platform kompatibilita
- Podrobné uchovávanie metadata
Obmedzenia sú:
- Žiadna vstavaná kompresná podpora (najmä rozšírenia ako
.tar.gz
sú široko používané) - Veľké súbory v porovnaní s komprimovanými formátmi
Vývojové zdroje
Programovanie s TAR súbormi je podporované prostredníctvom rôznych API a knižníc. kódy príklady a implementácie sprievodcov budú pridané čoskoro.
Často kladené otázky
Prečo súbor TAR nemá magické číslo?
Na rozdiel od iných formátov archívu, TAR nepoužíva konkrétny identifikátor na začiatku súboru na označenie jeho typu. namiesto toho sa spolieha na štruktúru a obsah v súbore na identifikáciu.
Ako môžem skontrolovať, či je súbor TAR dokončený?
Uistite sa, že posledné dva bloky súboru sú naplnené binárnymi nulami (512-bitový end-of-file marker.
Aký je rozdiel medzi .tar a .ar.gz súbory?
Plná
.tar
súbor je nekomprimovaný archív, zatiaľ čo.tar.gz
Súbor je komprimovaný pomocou kompresie gzip na zníženie veľkosti.