Formato de archivo
Revisión
Los archivos TAR, que se refiere a Tape ARchive, son esenciales en el mundo de la gestión de ficheros, especialmente en los sistemas basados en Unix. Creado en 1979 por AT&T Bell Laboratories, los archivo TAR sirven como un mecanismo sencillo pero poderoso para unir múltiples archivios y directorios en un único arquivo sin compresión. Este formato se utiliza ampliamente en varios sistemas operativos debido a su simplicidad y compatibilidad. Si usted es un desarrollador que busca el código fuente del paquete o un administrador del sistema que gestiona las copias de seguridad, la comprensión de los ins y los saltos de las archivas TAR puede mejorar significativamente su flujo de trabajo.
Características clave
- S almacenamiento sin compresión: TAR almacena los datos en una forma no comprimida, lo que los hace ideal para transferencias rápidas de archivos sin preocuparse por la compresión.
- Metadatos detallados: Cada archivo dentro de un arquivo TAR incluye metadados tales como timestamps, detalles de propiedad, y permisos, garantizando que se conserva el contexto original de cada fichero.
- Cross-Platform Compatibility: A pesar de estar enraizado en los sistemas de Unix, los archivos TAR están apoyados por la mayoría de sistemas operativos modernos, lo que los hace versátiles para diferentes entornos.
- Formato estándar: El formato se adhiere a los estándares POSIX (POSIX.1-1988 y posteriormente POSix.1-2001), garantizando la coherencia a través de diversas implementaciones.
- End-of-File Marker: Los archivos TAR incluyen un marcador de fin de archivo de dos bloques, que ayuda a identificar el punto de término del arquivo.
especificaciones técnicas
Formación estructural
TAR es un formato basado en texto que organiza los datos en bloques de 512 bytes.Cada bloque puede representar ya un título o contenido de archivo.La ausencia de un número mágico lo distingue de otros formatos como ZIP, donde se utilizan identificadores específicos para reconocer el tipo del archivio.
Componentes básicos
- Header Block: contiene metadatos sobre cada archivo como nombre, modo, ID de usuario, identificación de grupo, tamaño y timestamps.
- File Content Blocks: Siga los bloques de los header y contiene datos de archivos reales. Estos bloqueos se pueden agrupar en unidades más grandes para operaciones eficientes de I/O (bloqueo).
- End-of-File Marker: Se compone de dos bloques de 512 bits llenos de ceroes binarios para significar el fin de un archivo.
Estándares y Compatibilidad
TAR se adhiere a los estándares POSIX, garantizando la compatibilidad a través de diferentes sistemas y versiones. Aunque no soporta la composición nativa, varias extensiones como .tar.gz
(gzip) o .tar.bz2
(bzip2) se utilizan comunmente para los archivos de TAR comprimidos.
Historia y Evolución
- 1979: Primero introducido por AT&T Bell Laboratories.
- POSIX.1-1988 y POSIX1-2001: se establecieron estándares para normalizar el formato, garantizando la coherencia entre las diferentes implementaciones.
- GNU Tar: Versión mejorada con características adicionales como extensiones pax para una mejor compatibilidad.
Trabajando con Tar Files
Abriendo los archivos
Para abrir un archivo TAR:
- Windows: Instalar 7-Zip o utilizar Windows Subsystem para Linux (WSL).
- Mac: doble clic en el archivo para extraerlo.
- Linux: Utilización
tar -xvf
Comando en el terminal.
Convertir archivos
Conversiones comunes incluyen la compresión de archivos TAR en .tar.gz
, .tar.bz2
, etc. Por ejemplo, la conversión de un archivo TAR plano en un gzip-comprimido se puede hacer con:
tar -czf archive.tar.gz directory/
Creación de archivos
Para crear un nuevo archivo TAR en sistemas basados en Linux o Unix:
tar -cvf archive.tar /path/to/directory
En Windows, puede usar WSL o herramientas de terceros como 7-Zip.
Casos de uso comunes
- Backup and Restore: Ideal para crear backups de directorios y archivos sin compresión.
- Distribución de archivos: Distribuir grandes conjuntos de ficheros a través de redes en un formato no comprimido.
- Gestión del código fuente: Bundling repositorios de código Fuente antes de subir a los sistemas de control de versión o compartir con colaboradores.
Beneficios y limitaciones
Las ventajas:
- Estructura sencilla y fácil de entender
- Compatibilidad cross-platform
- Retención detallada de metadatos
Las limitaciones:
- No hay soporte de compresión integrada (especialmente extensiones como
.tar.gz
Se utilizan ampliamente) - Grandes dimensiones de archivo en comparación con los formatos comprimidos
Recursos de desarrolladores
La programación con los archivos TAR se apoya a través de diversas APIs y bibliotecas. ejemplos de código y guías de implementación se añadirán pronto.
Preguntas frecuentes
Por qué un archivo TAR no tiene un número mágico?
A diferencia de otros formatos de archivo, TAR no utiliza un identificador específico al comienzo del fichero para denominar su tipo.
Cómo puedo comprobar si un archivo TAR está completo?
Asegúrese de que los últimos dos bloques del archivo están llenos de cero binario (512-bit end-of-file marker.
Cuál es la diferencia entre los archivos .tar y .ar.gz?
Un plano
.tar
El archivo es un arquivo no comprimido, mientras que.tar.gz
El archivo se comprime utilizando la composición gzip para reducir el tamaño.