Formato de arquivo

Visão geral

Os arquivos TAR, que representam o Tape ARchive, são essenciais no mundo do gerenciamento de ficheiros, especialmente em sistemas baseados na Unix. Criado em 1979 pela AT&T Bell Laboratories, os dados TAR servem como um mecanismo simples, mas poderoso para ligar vários arquivo e diretrizes em um único arquivo sem compressão. Este formato é amplamente usado em vários sistemas operacionais devido à sua simplicidade e compatibilidade. Se você é um desenvolvedor que busca o código fonte de pacote ou um administrador de sistema que Gerencia backups, compreender as entradas e saídas dos arquivas TAR pode melhorar significativamente o seu fluxo de trabalho.

Principais Características

  • Não comprimido armazenamento: TAR arquivam dados em uma forma não compressada, tornando-os ideais para transferências rápidas de arquivos sem se preocupar com a composição.
  • Metadatos detalhados: Cada arquivo dentro de um arquivo TAR inclui metadados, como timestamps, detalhes de propriedade e permissões, garantindo que o contexto original de cada ficheiro seja preservado.
  • Cross-Platform Compatibility: Apesar de ser radicado em sistemas Unix, os arquivos TAR são suportados pela maioria dos sistemas operacionais modernos, tornando-os versáteis para diferentes ambientes.
  • Formato padronizado: O formato aderirá aos padrões POSIX (POSIX.1-1988 e posteriormente POSix.1-2001), garantindo consistência em várias implementações.
  • End-of-File Marker: os arquivos TAR incluem um marcador de fim de arquivo de dois blocos, o que ajuda a identificar o ponto de encerramento do archivo.

especificações técnicas

Formação Estrutura

O TAR é um formato baseado em texto que organiza os dados em blocos de 512 bytes. Cada bloco pode representar um cabeçalho ou conteúdo de arquivo. A ausência de um número mágico o distingue de outros formatos como ZIP, onde identificadores específicos são usados para reconhecer o tipo de ficheiro.

Componentes essenciais

  • Header Block: contém metadados sobre cada arquivo, como nome, modo, ID de usuário, identificação de grupo, tamanho e timestamps.
  • File Content Blocks: Siga os blocos de cabeçalho e contém dados de arquivo reais. Estes blocs podem ser agrupados em unidades maiores para operações eficientes de I/O (bloqueamento).
  • End-of-File Marker: Consiste em dois blocos de 512 bits cheios de zero binário para significar o fim de um arquivo.

Normas e Compatibilidade

A TAR adere aos padrões POSIX, garantindo compatibilidade entre diferentes sistemas e versões. embora não suporta a compressão nativamente, várias extensões como .tar.gz (gzip) ou .tar.bz2 (bzip2) são usados comumente para arquivos TAR comprimidos.

História e Evolução

  • 1979: Primeiro introduzido pela AT&T Bell Laboratories.
  • POSIX.1-1988 e POSIX1-2001: Os padrões foram estabelecidos para standardizar o formato, assegurando a consistência em várias implementações.
  • GNU Tar: Versão melhorada com recursos adicionais como extensões pax para melhor compatibilidade.

Trabalhando com Tar Files

Abertura de arquivos

Para abrir um arquivo:

  • Windows: Instale 7-Zip ou use o Windows Subsystem para Linux (WSL).
  • Mac: clique duas vezes no arquivo para extraí-lo.
  • Linux: Utilizar tar -xvf Comando no terminal.

Conversão de arquivos

Conversões comuns incluem a compressão de arquivos TAR em .tar.gz, .tar.bz2, etc. Por exemplo, a conversão de um arquivo TAR plano em um gzip-comprimido pode ser feito com:

tar -czf archive.tar.gz directory/

Criação de arquivos

Para criar um novo arquivo TAR em sistemas baseados no Linux ou Unix:

tar -cvf archive.tar /path/to/directory

No Windows, você pode usar WSL ou ferramentas de terceiros como 7-Zip.

Casos de Uso Comuns

  • Backup e Restauração: Ideal para criar backups de diretórios e arquivos sem compressão.
  • Distribuição de arquivos: Distribuir grandes conjuntos de ficheiros em redes em um formato não comprimido.
  • Gerenciamento de código-fonte: Bundling repositórios de códigos fonte antes de carregar para sistemas de controle de versão ou compartilhar com colaboradores.

Benefícios e Limites

As vantagens são:

  • Estrutura simples e fácil de entender
  • Compatibilidade cross-platform
  • Retenção de metadados detalhados

Limitações:

  • Não há suporte de compressão incorporada (especialmente extensões como .tar.gz são amplamente utilizados)
  • Maiores tamanhos de arquivo em comparação com formatos comprimidos

Desenvolvimento de recursos

A programação com arquivos TAR é suportada através de várias APIs e bibliotecas. exemplos de código e guias de implementação serão adicionados em breve.

Perguntas frequentes

  • Por que um arquivo TAR não tem um número mágico?

  • Ao contrário de outros formatos de arquivo, a TAR não usa um identificador específico no início do ficheiro para designar o seu tipo.

  • Como posso verificar se um arquivo TAR está completo?

  • Certifique-se de que os dois últimos blocos do arquivo estão preenchidos com zero binário (512-bit end-of-file marker.

  • Qual é a diferença entre .tar e arquivos.gz?

  • Um plano .tar um arquivo não compacto, enquanto o .tar.gz O arquivo é comprimido usando a compressão gzip para reduzir o tamanho.

Referências

 Português