Formato de arquivo DJVU

Visão geral

DjVu (pronunciado como “déjà vu”) é um formato de arquivo gráfico sofisticado projetado para documentos e livros escaneados. É particularmente adepto ao processamento de ficheiros que contêm uma mistura de texto, desenhos, imagens e fotografias. Desenvolvido pela AT&T Labs no final dos anos 90, o objetivo do Dj Vu é fornecer representações digitais de alta qualidade ao mesmo tempo que reduzir significativamente o tamanho do ficheiro em comparação com outros formatos como PDF, JPEG, GIF, ou TIFF.

O ponto de venda único do DjVu está na sua capacidade de comprimir documentos grandes de forma eficiente sem comprometer a qualidade. Por exemplo, um documento escaneado de cor inteira em 300 DPI pode ser comprimido de cerca de 25 MB para apenas 30-100 KB. Similarmente, documentos negros e brancos podem ser reduzidos a menos de 5 a 30 Kb. Isso torna o Dj Vu uma escolha ideal para compartilhar grandes documentos on-line sem os problemas de largura de banda tipicamente associados a outros formatos.

Principais Características

  • High Compression Ratio: oferece proporções de compressão superiores em comparação com JPEG, GIF e TIFF.
  • Separação de camadas: Utiliza a separação da camada da imagem para distinguir texto das imagens de fundo.
  • Carregamento progressivo: permite que os usuários vejam uma versão de baixa resolução do documento rapidamente antes de carregar detalhes de alta qualidade.
  • Codificação aritmética: emprega técnicas avançadas de codificação arítmica para uma compressão eficiente de dados.
  • Lossy Compression for Bitonal Images: fornece compressão de perda especificamente otimizada para documentos negros e brancos.

especificações técnicas

Formação Estrutura

Os arquivos DjVu são baseados em uma estrutura hierárquica conhecida como IFF85, que é semelhante ao formato TIFF. Esta estrutura consiste em “chunks”, cada um com seu próprio identificador (Chunk ID) que descreve seu propósito dentro do arquivo 0x41 0x54 0x26 0x54, Indica o início de uma forma de chunk.

Componentes essenciais

Os arquivos DjVu são compostos de vários pedaços, cada um que serve uma função específica:

  • Form: Um recipiente composto que detém outros pedaços.
  • DJVM / DJVU / THUM: Diferentes tipos de documentos DjVu (múltiplos / páginas únicas / subtletos).
  • DIRM: Contém informações sobre páginas em documentos multipáginas.
  • NAVM: Armazena dados de marcador para navegação dentro do documento.
  • ANTa, ANTz/TXTa, TXTz: Manejar anotações e layout de texto.
  • Djbz/Sjc/FG44/BG 44/TH44: Armazenar vários componentes da imagem (background, frontal, máscara, miniaturas).
  • INFO: fornece metadados sobre páginas individuais do DjVu.

Normas e Compatibilidade

O formato DjVu passou por várias revisões desde a sua criação em 1996.A versão mais recente foi lançada em abril de 2005.DJVU é compatível com uma variedade de sistemas operacionais e suporta várias aplicações para visualizar, editar e converter arquivos.No entanto, é importante notar que, embora o Dj Vu oferece excelente compressão e qualidade, sua adoção tem sido limitado em comparação com formatos mais amplamente utilizados como PDF.

História e Evolução

O DjVu foi desenvolvido pela AT&T Labs entre 1996 e 2001 por uma equipe incluindo Yann LeCun, Léon Bottou, Patrick Haffner e Paul G. O objetivo principal foi criar uma maneira eficiente de armazenar e transmitir documentos scannados através da internet.

VersãoData de lançamentoNotas
1-191996-1999Versões de desenvolvimento.
20Abril de 1999Introdução ao formato multipágina.
23Julho de 2002Adicionado CID chunk para identificação de personagens.
24Fevereiro de 2003Incluído LTAnno chunk para anotações de texto.
21Setembro de 1999Introdução do formato de armazenamento indireto e adição da camada de pesquisa de texto.
22Abril de 2001Suporte de orientação de página adicionado e compressão de cor JB2.
25Maio de 2003Adicionou NAVM chunk para bookmarks.
26Abril de 2005Finalizado com anotações de texto/linha.

Trabalhar com DJVU Files

Abertura dos arquivos DJVU

Para abrir e exibir arquivos DjVu, você pode usar software dedicado, como DjvuLibre ou ferramentas comerciais como o Adobe Acrobat Reader DC (que suporta Dj Vu através de plugins.

Conversão de arquivos DJVU

Conversão de arquivos DjVu para outros formatos é muitas vezes necessário por razões de compatibilidade. conversões comuns incluem a conversão do Dj Vu em PDF, que pode ser feito usando software como djvutxt ou conversores on-line que suportam o formato.

Criação de arquivos DJVU

A criação de arquivos DjVu geralmente requer software especializado, como o Dj VuLibre, que inclui ferramentas para escanear documentos e comprimê-los no formato Djvu. Essas Ferramentas são projetadas para lidar com estruturas de documentos complexas de forma eficiente, tornando mais fácil gerenciar grandes volumes de material escanejado.

Casos de Uso Comuns

  • E-Books: DjVu é ideal para digitalizar e distribuir e-books que contêm uma mistura de texto e imagens.
  • Manuais & Guia: Manuais técnicos e guias de usuário muitas vezes beneficiam dos altos índices de compressão oferecidos pela DjVu, tornando-os mais fáceis de distribuir on-line.
  • Documentos históricos: Documentos antigos e manuscritos raros podem ser preservados digitalmente usando as capacidades de retenção de qualidade superiores do DjVu.
  • Newspapers & Magazines: Os periódicos com uma mistura de texto e imagens são adequados para DjVu devido à sua compressão eficiente.

Benefícios e Limites

As vantagens são:

  • High Compression Ratio: oferece melhor compressão em comparação com JPEG, GIF e TIFF.
  • Tratamento de texto eficiente: Utiliza técnicas avançadas como o codificação JB2 para a representação do texto ideal.
  • Carregamento progressivo: permite que os usuários vejam documentos rapidamente, mesmo com ligações lentas à internet.

Limitações:

  • Adopção Limitada: o DjVu não é tão amplamente apoiado ou reconhecido em comparação com formatos como PDF.
  • Software Dependence: requer software específico para abrir e editar arquivos, o que pode limitar a sua usabilidade para alguns usuários.

Desenvolvimento de recursos

A programação com arquivos DJVU é suportada através de várias APIs e bibliotecas. exemplos de código e guias de implementação serão adicionados em breve.

Perguntas frequentes

  • Que ferramentas posso usar para ver arquivos DjVu?

  • Você pode usar softwares como DjVuLibre ou Adobe Acrobat Reader DC (com plugins) para abrir e visualizar arquivos Dj Vu em diferentes sistemas operacionais.

  • Como posso converter um arquivo DjVu para PDF?

  • Use ferramentas como djvutxt ou conversores on-line que suportam a conversão de arquivos DjVu para formato PDF.

  • É possível editar texto dentro de um documento DjVu?

  • Editar texto diretamente em DjVu é limitado, mas você pode extrair e modificar texto usando software especializado antes de re-importá-lo de volta para Dj Vu se necessário.

Referências

 Português