Formato de arquivo
Visão geral
Os arquivos TAR, que representam o Tape ARchive, são essenciais no mundo do gerenciamento de ficheiros, especialmente em sistemas baseados na Unix. Criado em 1979 pela AT&T Bell Laboratories, os dados TAR servem como um mecanismo simples, mas poderoso para ligar vários arquivo e diretrizes em um único arquivo sem compressão. Este formato é amplamente usado em vários sistemas operacionais devido à sua simplicidade e compatibilidade. Se você é um desenvolvedor que busca o código fonte de pacote ou um administrador de sistema que Gerencia backups, compreender as entradas e saídas dos arquivas TAR pode melhorar significativamente o seu fluxo de trabalho.
Principais Características
- Não comprimido armazenamento: TAR arquivam dados em uma forma não compressada, tornando-os ideais para transferências rápidas de arquivos sem se preocupar com a composição.
- Metadatos detalhados: Cada arquivo dentro de um arquivo TAR inclui metadados, como timestamps, detalhes de propriedade e permissões, garantindo que o contexto original de cada ficheiro seja preservado.
- Cross-Platform Compatibility: Apesar de ser radicado em sistemas Unix, os arquivos TAR são suportados pela maioria dos sistemas operacionais modernos, tornando-os versáteis para diferentes ambientes.
- Formato padronizado: O formato aderirá aos padrões POSIX (POSIX.1-1988 e posteriormente POSix.1-2001), garantindo consistência em várias implementações.
- End-of-File Marker: os arquivos TAR incluem um marcador de fim de arquivo de dois blocos, o que ajuda a identificar o ponto de encerramento do archivo.
especificações técnicas
Formação Estrutura
O TAR é um formato baseado em texto que organiza os dados em blocos de 512 bytes. Cada bloco pode representar um cabeçalho ou conteúdo de arquivo. A ausência de um número mágico o distingue de outros formatos como ZIP, onde identificadores específicos são usados para reconhecer o tipo de ficheiro.
Componentes essenciais
- Header Block: contém metadados sobre cada arquivo, como nome, modo, ID de usuário, identificação de grupo, tamanho e timestamps.
- File Content Blocks: Siga os blocos de cabeçalho e contém dados de arquivo reais. Estes blocs podem ser agrupados em unidades maiores para operações eficientes de I/O (bloqueamento).
- End-of-File Marker: Consiste em dois blocos de 512 bits cheios de zero binário para significar o fim de um arquivo.
Normas e Compatibilidade
A TAR adere aos padrões POSIX, garantindo compatibilidade entre diferentes sistemas e versões. embora não suporta a compressão nativamente, várias extensões como .tar.gz
(gzip) ou .tar.bz2
(bzip2) são usados comumente para arquivos TAR comprimidos.
História e Evolução
- 1979: Primeiro introduzido pela AT&T Bell Laboratories.
- POSIX.1-1988 e POSIX1-2001: Os padrões foram estabelecidos para standardizar o formato, assegurando a consistência em várias implementações.
- GNU Tar: Versão melhorada com recursos adicionais como extensões pax para melhor compatibilidade.
Trabalhando com Tar Files
Abertura de arquivos
Para abrir um arquivo:
- Windows: Instale 7-Zip ou use o Windows Subsystem para Linux (WSL).
- Mac: clique duas vezes no arquivo para extraí-lo.
- Linux: Utilizar
tar -xvf
Comando no terminal.
Conversão de arquivos
Conversões comuns incluem a compressão de arquivos TAR em .tar.gz
, .tar.bz2
, etc. Por exemplo, a conversão de um arquivo TAR plano em um gzip-comprimido pode ser feito com:
tar -czf archive.tar.gz directory/
Criação de arquivos
Para criar um novo arquivo TAR em sistemas baseados no Linux ou Unix:
tar -cvf archive.tar /path/to/directory
No Windows, você pode usar WSL ou ferramentas de terceiros como 7-Zip.
Casos de Uso Comuns
- Backup e Restauração: Ideal para criar backups de diretórios e arquivos sem compressão.
- Distribuição de arquivos: Distribuir grandes conjuntos de ficheiros em redes em um formato não comprimido.
- Gerenciamento de código-fonte: Bundling repositórios de códigos fonte antes de carregar para sistemas de controle de versão ou compartilhar com colaboradores.
Benefícios e Limites
As vantagens são:
- Estrutura simples e fácil de entender
- Compatibilidade cross-platform
- Retenção de metadados detalhados
Limitações:
- Não há suporte de compressão incorporada (especialmente extensões como
.tar.gz
são amplamente utilizados) - Maiores tamanhos de arquivo em comparação com formatos comprimidos
Desenvolvimento de recursos
A programação com arquivos TAR é suportada através de várias APIs e bibliotecas. exemplos de código e guias de implementação serão adicionados em breve.
Perguntas frequentes
Por que um arquivo TAR não tem um número mágico?
Ao contrário de outros formatos de arquivo, a TAR não usa um identificador específico no início do ficheiro para designar o seu tipo.
Como posso verificar se um arquivo TAR está completo?
Certifique-se de que os dois últimos blocos do arquivo estão preenchidos com zero binário (512-bit end-of-file marker.
Qual é a diferença entre .tar e arquivos.gz?
Um plano
.tar
um arquivo não compacto, enquanto o.tar.gz
O arquivo é comprimido usando a compressão gzip para reduzir o tamanho.