Formato de archivo

Revisión

Los archivos TAR, que se refiere a Tape ARchive, son esenciales en el mundo de la gestión de ficheros, especialmente en los sistemas basados en Unix. Creado en 1979 por AT&T Bell Laboratories, los archivo TAR sirven como un mecanismo sencillo pero poderoso para unir múltiples archivios y directorios en un único arquivo sin compresión. Este formato se utiliza ampliamente en varios sistemas operativos debido a su simplicidad y compatibilidad. Si usted es un desarrollador que busca el código fuente del paquete o un administrador del sistema que gestiona las copias de seguridad, la comprensión de los ins y los saltos de las archivas TAR puede mejorar significativamente su flujo de trabajo.

Características clave

  • S almacenamiento sin compresión: TAR almacena los datos en una forma no comprimida, lo que los hace ideal para transferencias rápidas de archivos sin preocuparse por la compresión.
  • Metadatos detallados: Cada archivo dentro de un arquivo TAR incluye metadados tales como timestamps, detalles de propiedad, y permisos, garantizando que se conserva el contexto original de cada fichero.
  • Cross-Platform Compatibility: A pesar de estar enraizado en los sistemas de Unix, los archivos TAR están apoyados por la mayoría de sistemas operativos modernos, lo que los hace versátiles para diferentes entornos.
  • Formato estándar: El formato se adhiere a los estándares POSIX (POSIX.1-1988 y posteriormente POSix.1-2001), garantizando la coherencia a través de diversas implementaciones.
  • End-of-File Marker: Los archivos TAR incluyen un marcador de fin de archivo de dos bloques, que ayuda a identificar el punto de término del arquivo.

especificaciones técnicas

Formación estructural

TAR es un formato basado en texto que organiza los datos en bloques de 512 bytes.Cada bloque puede representar ya un título o contenido de archivo.La ausencia de un número mágico lo distingue de otros formatos como ZIP, donde se utilizan identificadores específicos para reconocer el tipo del archivio.

Componentes básicos

  • Header Block: contiene metadatos sobre cada archivo como nombre, modo, ID de usuario, identificación de grupo, tamaño y timestamps.
  • File Content Blocks: Siga los bloques de los header y contiene datos de archivos reales. Estos bloqueos se pueden agrupar en unidades más grandes para operaciones eficientes de I/O (bloqueo).
  • End-of-File Marker: Se compone de dos bloques de 512 bits llenos de ceroes binarios para significar el fin de un archivo.

Estándares y Compatibilidad

TAR se adhiere a los estándares POSIX, garantizando la compatibilidad a través de diferentes sistemas y versiones. Aunque no soporta la composición nativa, varias extensiones como .tar.gz (gzip) o .tar.bz2 (bzip2) se utilizan comunmente para los archivos de TAR comprimidos.

Historia y Evolución

  • 1979: Primero introducido por AT&T Bell Laboratories.
  • POSIX.1-1988 y POSIX1-2001: se establecieron estándares para normalizar el formato, garantizando la coherencia entre las diferentes implementaciones.
  • GNU Tar: Versión mejorada con características adicionales como extensiones pax para una mejor compatibilidad.

Trabajando con Tar Files

Abriendo los archivos

Para abrir un archivo TAR:

  • Windows: Instalar 7-Zip o utilizar Windows Subsystem para Linux (WSL).
  • Mac: doble clic en el archivo para extraerlo.
  • Linux: Utilización tar -xvf Comando en el terminal.

Convertir archivos

Conversiones comunes incluyen la compresión de archivos TAR en .tar.gz, .tar.bz2, etc. Por ejemplo, la conversión de un archivo TAR plano en un gzip-comprimido se puede hacer con:

tar -czf archive.tar.gz directory/

Creación de archivos

Para crear un nuevo archivo TAR en sistemas basados en Linux o Unix:

tar -cvf archive.tar /path/to/directory

En Windows, puede usar WSL o herramientas de terceros como 7-Zip.

Casos de uso comunes

  • Backup and Restore: Ideal para crear backups de directorios y archivos sin compresión.
  • Distribución de archivos: Distribuir grandes conjuntos de ficheros a través de redes en un formato no comprimido.
  • Gestión del código fuente: Bundling repositorios de código Fuente antes de subir a los sistemas de control de versión o compartir con colaboradores.

Beneficios y limitaciones

Las ventajas:

  • Estructura sencilla y fácil de entender
  • Compatibilidad cross-platform
  • Retención detallada de metadatos

Las limitaciones:

  • No hay soporte de compresión integrada (especialmente extensiones como .tar.gz Se utilizan ampliamente)
  • Grandes dimensiones de archivo en comparación con los formatos comprimidos

Recursos de desarrolladores

La programación con los archivos TAR se apoya a través de diversas APIs y bibliotecas. ejemplos de código y guías de implementación se añadirán pronto.

Preguntas frecuentes

  • Por qué un archivo TAR no tiene un número mágico?

  • A diferencia de otros formatos de archivo, TAR no utiliza un identificador específico al comienzo del fichero para denominar su tipo.

  • Cómo puedo comprobar si un archivo TAR está completo?

  • Asegúrese de que los últimos dos bloques del archivo están llenos de cero binario (512-bit end-of-file marker.

  • Cuál es la diferencia entre los archivos .tar y .ar.gz?

  • Un plano .tar El archivo es un arquivo no comprimido, mientras que .tar.gz El archivo se comprime utilizando la composición gzip para reducir el tamaño.

Referencias

 Español