Formát súborov

Prehľad

TAR súbory, ktoré predstavujú Tape ARchive, sú nevyhnutné vo svete riadenia súborov, najmä na systémoch založených na Unix. Vytvorené späť v roku 1979 AT&T Bell Laboratories, Súbory TAR slúžia ako jednoduchý, ale silný mechanizmus pre spájanie viacerých súloh a adresárov do jedného archívu bez kompresie. Tento formát je široko používaný v rôznych operačných systémov kvôli jeho jednoduchosti a kompatibilite. Či už ste vývojár hľadá zdrojový kód balenia alebo systémový správca spravuje zálohy, porozumieť vkladom a výstupom súboroch TAR môže výrazne zlepšiť váš pracovný tok.

Kľúčové vlastnosti

  • Uncompressed Storage: TAR archivuje údaje v nekompresovanom formáte, čo ich robí ideálnymi pre rýchle prenosy súborov bez toho, aby sa obávali o kompresie.
  • Podrobné metaúdaje: Každý súbor v archíve TAR obsahuje metadata, ako sú časové štítky, podrobnosti o vlastníctve a povolenia, ktoré zabezpečujú zachovanie pôvodného kontextu každého súbory.
  • Cross-Platform Compatibility: Napriek tomu, že sú zakorenené v systémoch Unix, súbory TAR sú podporované väčšinou moderných operačných systémov, čo ich robí všestrannými pre rôzne prostredia.
  • Standardizovaný formát: Formát je v súlade so štandardmi POSIX (POSIX.1-1988 a neskôr PosIX1-2001), čo zaručuje konzistenciu v rôznych implementáciách.
  • End-of-File Marker: TAR súbory zahŕňajú dvojblockový end- of-file marker, ktorý pomáha pri identifikácii bodu ukončenia archívu.

Technické špecifikácie

Formátová štruktúra

TAR je formát založený na texte, ktorý organizuje dáta do blokov 512 bajtov.Každý blok môže reprezentovať buď hlavičku alebo obsah súboru.Nedostatok magického čísla ho odlišuje od iných formatov, ako je ZIP, kde sa používajú špecifické identifikátory na rozpoznanie typu archívu.

Kľúčové komponenty

  • Header Block: Obsahuje metaúdaje o každom súbore, ako je názov, režim, užívateľský identifikátor, identifikácia skupiny, veľkosť a časové štítky.
  • File Content Blocks: Sledujte hlavné bloky a obsahujte skutočné údaje o súboroch. Tieto bloky môžu byť zoskupené do väčších jednotiek pre efektívne I/O operácie (blokovanie).
  • End-of-File Marker: Skladá sa z dvoch 512-bitových blokov naplnených binárnymi zerami, ktoré označujú koniec archívu.

Štandardy a kompatibilita

TAR dodržiava štandardy POSIX, ktoré zabezpečujú kompatibilitu medzi rôznymi systémami a verziami. hoci nepodporuje kompresiu nativne, rôzne rozšírenia ako .tar.gz (gzip) alebo .tar.bz2 (bzip2) sa bežne používajú pre komprimované archívy TAR.

História a evolúcia

  • 1979: Prvýkrát zaviedol AT&T Bell Laboratories.
  • POSIX.1-1988 a POSIX1-2001: Štandardy boli stanovené na štandardizáciu formátu, čo zabezpečuje konzistenciu v rôznych implementáciách.
  • GNU Tar: Vylepšená verzia s ďalšími funkciami, ako sú rozšírenia pax pre lepšiu kompatibilitu.

Práca s TAR súbormi

Otvorenie TAR súborov

Ak chcete otvoriť súbor TAR:

  • Windows: Inštalovať 7-Zip alebo používať Windows Subsystem pre Linux (WSL).
  • Mac: Dvojnásobne kliknite na súbor, aby ste ho vytiahli.
  • Linux: Použitie tar -xvf Komanda v termináli.

Konverzia TAR súborov

Zvyčajné konverzie zahŕňajú komprimovanie TAR súborov do .tar.gz, .tar.bz2, atď. Napríklad, konverziu plochého TAR súboru na gzip-komprimovaný môže byť vykonané s:

tar -czf archive.tar.gz directory/

Vytvorenie TAR súborov

Ak chcete vytvoriť nový súbor TAR na systémoch Linux alebo Unix:

tar -cvf archive.tar /path/to/directory

V systéme Windows môžete použiť nástroje WSL alebo tretích strán, ako je 7-Zip.

bežné prípady použitia

  • Backup a Restore: Ideálne pre vytvorenie záloh adresárov a súborov bez kompresie.
  • Distribúcia súborov: Distribuovanie veľkých súprav súbory cez siete v nekomprimovanom formáte.
  • Source Code Management: Spojenie zdrojových kódových záložiek pred nahraním do systémov ovládania verzie alebo zdieľaním s spolupracovníkami.

Výhody a obmedzenia

Výhody:

  • Jednoduchá a ľahko pochopiteľná štruktúra
  • Cross-platform kompatibilita
  • Podrobné uchovávanie metadata

Obmedzenia sú:

  • Žiadna vstavaná kompresná podpora (najmä rozšírenia ako .tar.gz sú široko používané)
  • Veľké súbory v porovnaní s komprimovanými formátmi

Vývojové zdroje

Programovanie s TAR súbormi je podporované prostredníctvom rôznych API a knižníc. kódy príklady a implementácie sprievodcov budú pridané čoskoro.

Často kladené otázky

  • Prečo súbor TAR nemá magické číslo?

  • Na rozdiel od iných formátov archívu, TAR nepoužíva konkrétny identifikátor na začiatku súboru na označenie jeho typu. namiesto toho sa spolieha na štruktúru a obsah v súbore na identifikáciu.

  • Ako môžem skontrolovať, či je súbor TAR dokončený?

  • Uistite sa, že posledné dva bloky súboru sú naplnené binárnymi nulami (512-bitový end-of-file marker.

  • Aký je rozdiel medzi .tar a .ar.gz súbory?

  • Plná .tar súbor je nekomprimovaný archív, zatiaľ čo .tar.gz Súbor je komprimovaný pomocou kompresie gzip na zníženie veľkosti.

References

 Slovenčina