Format de fitxers

Revisió

Els arxius TAR, que representen el Tape ARchive, són essencials en el món de la gestió de fitxers, especialment en els sistemes basats en Unix. Creat el 1979 per AT&T Bell Laboratories, els archives TAR serveixen com un mecanisme senzill però poderós per unificar múltiples fitxes i directoris en un únic arxivament sense compressió. Aquest format s’utilitza àmpliament a través de diversos sistema operatiu degut a la seva simplicitat i compatibilitat. Si vostè és un desenvolupador que busca el codi font del paquet o un administrador del sistema que gestiona les backups, la comprensió de les entrades i les sortides dels arquets TAR pot millorar considerablement el seu flux de treball.

Característiques clau

  • Arxiu d’emmagatzematge sense comprensió: TAR emmagatzema les dades en una forma no comprensada, fent-les ideals per a transferències de fitxers ràpides sense preocupar-se per la compressió.
  • Metadades detallades: Cada fitxer dins d’un arxiu TAR inclou metadats com ara estamps de temps, detalls de propietat i permissions, garantint que es conserva el context original de cada fitxa.
  • Compatibilitat a través de la plataforma: Malgrat ser arrelats en els sistemes d’Unix, els arxius TAR estan recolzats per la majoria del sistema operatiu modern, fent-los versàtils per a diferents entorns.
  • Format estàndard: El format s’adhereix a les normes de POSIX (POSIX.1-1988 i posteriorment POSX.1-2001), assegurant la coherència a través de diverses implementacions.
  • End-of-File Marker: els arxius TAR inclouen un marcador de finals de fitxers de dos blocs, que ajuda a identificar el punt d’acabament de l’arxiu.

especificacions tècniques

Formació estructural

TAR és un format basat en text que organitza les dades en blocs de 512 bytes. Cada bloc pot representar un títol o contingut de fitxers. L’absència d’un nombre màgic el distingeix dels altres formats com el ZIP, on s’utilitzen identificadors específics per reconèixer el tipus de arxiu.

Components bàsics

  • Header Block: Conté metadades sobre cada fitxer com ara nom, mode, ID d’usuari, identificador de grup, mida i timestamps.
  • File Content Blocks: Segueix els blocs de cap i conté dades de fitxers reals. Aquests bloquejos es poden agrupar en unitats més grans per a operacions eficients I/O (blocant).
  • End-of-File Marker: Consisteix en dos blocs de 512 bits omplits de zeros binaris per significar el final d’un arxiu.

Estàndards i compatibilitat

TAR s’adhereix als estàndards POSIX, garantint la compatibilitat entre diferents sistemes i versions. Tot i que no suporta la compressió nativament, diverses extensions com .tar.gz (gzip) o .tar.bz2 (bzip2) s’utilitzen sovint per a arxius TAR comprimits.

Història i evolució

  • 1979: Primera introducció per AT&T Bell Laboratories.
  • POSIX.1-1988 i POSIX1-2001: Es van establir estàndards per normalitzar el format, assegurant la coherència entre diferents implementacions.
  • GNU Tar: Versió millorada amb característiques addicionals com les extensions pax per a una millor compatibilitat.

Treballant amb els arxius

Obertura de fitxers

Per obrir un arxiu TAR:

  • Windows: Instal·la 7-Zip o utilitza Windows Subsystem per a Linux (WSL).
  • Mac: Double-clicqueu el fitxer per extreure-lo.
  • Linux: Utilitzar tar -xvf Comandant al terminal.

Convertir els arxius

Conversions comunes inclouen la compressió de fitxers TAR en .tar.gz, .tar.bz2, etc. Per exemple, la conversió d’un fitxer TAR pla en un gzip-comprimit es pot fer amb:

tar -czf archive.tar.gz directory/

Creació de fitxers

Per crear un nou fitxer TAR en sistemes basats en Linux o Unix:

tar -cvf archive.tar /path/to/directory

En Windows, podeu utilitzar WSL o eines de tercers com 7-Zip.

Casos d’ús comú

  • Backup i Restauració: Ideal per crear backups de directoris i arxius sense compressió.
  • Distribució de fitxers: Distribuir grans grups d’arxius a través de xarxes en un format no comprès.
  • Gestió del codi font: confeccionar els repositoris de codis font abans de carregar-se als sistemes de control de versió o compartir-los amb col·laboradors.

Avantatges i limitacions

Els avantatges:

  • Estructura senzilla i fàcil d’entendre
  • Compatibilitat cross-platform
  • Retenció de metadades detallada

Les limitacions:

  • No hi ha suport de compressió integrat (especialment extensions com .tar.gz s’utilitza àmpliament)
  • mida de fitxers més gran en comparació amb els formats comprimits

Recursos desenvolupadors

La programació amb arxius TAR es dóna suport a través de diverses API i biblioteques. exemples de codi i guies d’implementació s’afegiran aviat.

Preguntes freqüents

  • Per què un arxiu TAR no té un número màgic?

  • A diferència dels altres formats d’arxiu, TAR no utilitza un identificador específic a l’inici del fitxer per marcar el seu tipus.

  • Com puc comprovar si un arxiu TAR és complet?

  • Assegureu-vos que els dos últims blocs del fitxer estan omplits amb zero binari (512-bit end-of-file marker.

  • Quina és la diferència entre els arxius .tar i .t.gz?

  • Una plana .tar El fitxer és un arxiu no comprès, mentre que .tar.gz El fitxer es comprimeix utilitzant la compressió gzip per reduir la mida.

References

 Català