Formát souborů

přehled

TAR soubory, které stojí za Tape ARchive, jsou nezbytné ve světě správy souborů, zejména na systémech založených na Unix. Vytvořené zpět v roce 1979 AT&T Bell Laboratories, TAR Soubory slouží jako jednoduchý, ale mocný mechanismus pro svazování několika soubojů a adresářů do jednoho archivu bez komprese. Tento formát je široce používán v různých operačních systémů kvůli své jednoduchosti a kompatibilitě. Ať už jste vývojář hledá zdrojový kód balení nebo systémový správce spravuje zálohy, porozumění vnitřních a výstupních souloh TAR může výrazně zlepšit váš pracovní tok.

Hlavní rysy

  • Uncompressed Storage: TAR archivuje data v nekomprimovaném formátu, což je ideální pro rychlé přenosy souborů bez starostí o kompresi.
  • Detail Metadata: Každý soubor v archivu TAR obsahuje metadata, jako jsou časové štítky, podrobnosti o vlastnictví a povolení, což zajišťuje zachování původního kontextu každého soubory.
  • Cross-Platform Compatibility: Navzdory tomu, že jsou zakořeněny v systémech Unix, soubory TAR jsou podporovány většinou moderních operačních systémů, čímž jsou všestranné pro různé prostředí.
  • Standardizovaný formát: Formát je v souladu se standardy POSIX (POSIX.1-1988 a později POSix.1-2001), což zajišťuje konzistenci v různých implementacích.
  • End-of-File Marker: soubory TAR obsahují dvou bloků end- of-file marker, který pomáhá při identifikaci bodu ukončení archivu.

Technické specifikace

Formátová struktura

TAR je textový formát, který organizuje data do bloků 512 bytů.Každý blok může představovat buď titulek nebo obsah souboru.Nedostatek magického čísla to odlišuje od jiných formatů, jako je ZIP, kde se specifické identifikátory používají k rozpoznání typu archivu.

Klíčové složky

  • Header Block: Obsahuje metadata o každém souboru, jako je jméno, režim, uživatelský identifikátor, ID skupiny, velikost a časové štítky.
  • File Content Blocks: Sledujte záznamové bloky a obsahujte skutečné údaje o souborech.Tyto bloky mohou být seskupeny do větších jednotek pro efektivní I/O operace (blokování).
  • End-of-File Marker: Skládá se ze dvou 512-bitových bloků naplněných binárními nulami, které označují konec archivu.

Standardy a kompatibilita

TAR dodržuje normy POSIX, což zajišťuje kompatibilitu v různých systémech a verzích. zatímco nepodporuje nativní komprese, různé rozšíření jako .tar.gz (GZIP nebo .tar.bz2 (bzip2) jsou běžně používány pro komprimované archivy TAR.

Historie a evoluce

  • 1979: První představila AT&T Bell Laboratories.
  • POSIX.1-1988 a POSIX1-2001: Standardy byly stanoveny pro standardizaci formátu, což zajišťuje konzistenci mezi různými implementacemi.
  • GNU Tar: Vylepšená verze s dalšími funkcemi, jako jsou rozšíření pax pro lepší kompatibilitu.

Práce s archivy

Otevření souborů

Chcete-li otevřít soubor TAR:

  • Windows: Instalujte 7-Zip nebo použijte Windows Subsystem pro Linux (WSL).
  • Mac: Dvojnásobně klikněte na soubor, abyste ho extrahovali.
  • Linux: Použití tar -xvf Řízení v terminálu.

Převod souborů

Společné konverze zahrnují komprese souborů TAR do .tar.gz, .tar.bz2, atd. Například konverze plochého souboru TAR na gzip-komprimovaný lze provést pomocí:

tar -czf archive.tar.gz directory/

Vytvoření archivů

Pro vytvoření nového souboru TAR na systémech založených na Linuxu nebo Unixu:

tar -cvf archive.tar /path/to/directory

V systému Windows můžete používat nástroje WSL nebo třetích stran, jako je 7-Zip.

Běžné použití

  • Backup and Restore: Ideální pro vytváření záloh adresářů a souborů bez komprese.
  • Distribuce souborů: Rozdělování velkých sítí soubory přes sítě v nekomprimovaném formátu.
  • Source Code Management: Spojení zdrojových kódů před stažením do systémů ovládání verzí nebo sdílením s spolupracovníky.

Výhody a omezení

Výhody:

  • Jednoduchá a snadno pochopitelná struktura
  • Cross-platformová kompatibilita
  • Podrobné uchovávání metadata

Omezení:

  • Žádná vestavěná kompresní podpora (zejména rozšíření jako .tar.gz Většinou se používá)
  • Rozměry souborů ve srovnání s komprimovanými formáty

Vývojářské zdroje

Programování s soubory TAR je podporováno prostřednictvím různých API a knihoven. Příklady kódu a průvodce provádění budou brzy přidány.

Často kladené otázky

  • Proč nemá soubor TAR magické číslo?

  • Na rozdíl od jiných archivních formátů TAR na začátku souboru nepoužívá specifický identifikátor k označení jeho typu.

  • Jak mohu zkontrolovat, zda je soubor TAR kompletní?

  • Ujistěte se, že poslední dva bloky souboru jsou naplněny binární nulou (512-bitový end-of-file marker.

  • Jaký je rozdíl mezi .tar a .ar.gz soubory?

  • Jedná se o .tar soubor je nekomprimovaný archiv, zatímco .tar.gz Soubor je komprimován pomocí komprese gzip ke snížení velikosti.

Reference

 Čeština