Il formato di file DJVU

di Overview

DjVu (pronunciato come “déjà vu”) è un formato di file grafico sofisticato progettato per i documenti e i libri scansionati. è particolarmente adatto al trattamento dei file che contengono una miscela di testo, disegni, immagini e foto. Sviluppato da AT&T Labs alla fine degli anni ‘90, Dj Vu si propone di fornire rappresentazioni digitali di alta qualità, riducendo in modo significativo la dimensione del file rispetto ad altri formati come PDF, JPEG, GIF o TIFF.

Il punto di vendita unico di DjVu si trova nella sua capacità di comprimere i grandi documenti in modo efficiente senza compromettere la qualità. Ad esempio, un documento scansionato a colori a 300 DPI può essere compreso da circa 25 MB fino a soli 30-100 KB. Allo stesso modo, i Documenti neri e bianchi possono essere ridotti a meno di 5-30 Kb. Ciò rende Dj Vu un’opzione ideale per condividere i big documents online senza i problemi di larghezza di banda tipicamente associati ad altri formati.

Caratteristiche principali

  • High Compression Ratio: offre un rapporto di compressione superiore rispetto a JPEG, GIF e TIFF.
  • Separazione di strati: Utilizza la separazione della strata dell’immagine per distinguere il testo dalle immagini di sfondo.
  • Caricamento progressivo: consente agli utenti di visualizzare una versione a bassa risoluzione del documento rapidamente prima di caricare i dettagli di alta qualità.
  • Codifica aritmetica: utilizza tecniche avanzate di codificazione arithmetico per la compressione efficiente dei dati.
  • Lossy Compression per Immagini Bitonali: fornisce una compressione di perdita ottimizzata specificamente per documenti bianchi e neri.

Specifiche tecniche

Formato Struttura

I file DjVu si basano su una struttura gerarchica conosciuta come IFF85, che è simile al formato TIFF. Questa struttura è costituita da “chunks”, ciascuno con il proprio identificatore (Chunk ID) che descrive il suo scopo all’interno del file. I primi quattro byte di qualsiasi file DJVU sono sempre letti 0x41 0x54 0x26 0x54, indicando l’inizio di un form chunk.

Componenti Core

I file DjVu sono costituiti da diversi pezzi, ognuno servendo una funzione specifica:

  • Form: un contenitore composito che detiene altri pezzi.
  • DJVM / DJVU / THUM: Diversi tipi di documenti DjVu (multipage / single page / thumbnails).
  • DIRM: contiene informazioni sulle pagine nei documenti multipagine.
  • NAVM: memorizza i dati di marchio per la navigazione all’interno del documento.
  • ANTa, ANTz/TXTa, TXTz: gestire le annotazioni e il layout del testo.
  • Djbz/Sjc/FG44/BG 44/TH44: Conservare diversi componenti dell’immagine (background, foreground, maschera, miniature).
  • INFO: fornisce metadati sulle singole pagine DjVu.

Standard & Compatibilità

Il formato DjVu è stato sottoposto a diverse revisioni dal suo inizio nel 1996.La versione più recente è stata rilasciata nell’aprile 2005.DjVU è compatibile con una serie di sistemi operativi e supporta varie applicazioni per visualizzare, modificare e convertire file.Tuttavia, è importante notare che mentre Dj Vu offre eccellente compressione e qualità, la sua adozione è limitata rispetto a formati più ampiamente utilizzati come PDF.

Storia e evoluzione

DjVu è stato sviluppato da AT&T Labs tra il 1996 e il 2001 da un team tra cui Yann LeCun, Léon Bottou, Patrick Haffner e Paul G. L’obiettivo principale era quello di creare un modo efficiente di memorizzare e trasmettere documenti scansionati su Internet.

VersioneData di rilascioNotizie
1-191996-1999Versioni di sviluppo.
20Aprile 1999Formato multipagine introdotto.
23luglio 2002Aggiunto CID chunk per identificazione del carattere.
24Febbraio 2003Incluso LTAnno chunk per annotazioni di testo.
21Settembre 1999Introdotto formato di archiviazione indiretta e aggiunto strato di ricerca di testo.
22Aprile 2001Aggiungi il supporto per l’orientamento della pagina e la compressione del colore JB2.
25maggio 2003Aggiunto NAVM chunk per bookmarks.
26Aprile 2005Finito con annotazioni di testo/linea.

Lavorare con i file DJVU

Apertura dei file DJVU

Per aprire e visualizzare i file DjVu, è possibile utilizzare software dedicato come Dj VuLibre o strumenti commerciali come Adobe Acrobat Reader DC (che supporta Djvu attraverso i plugin.

Conversione di file DJVU

Convertire i file DjVu in altri formati è spesso necessario per motivi di compatibilità. Conversioni comuni includono la conversione di Dj Vu a PDF, che può essere fatto utilizzando software come djvutxt o convertitori online che supportano il formato. Il processo di solito implica l’estrazione di testo e immagini dal file DJ VU e poi riassemblagli in un nuovo format.

Creazione di file DJVU

La creazione di file DjVu richiede di solito software specializzato, come Dj VuLibre, che include strumenti per lo scansione dei documenti e la compressione in formato Djvu.Questi strumenti sono progettati per gestire efficientemente le strutture complesse del documento, rendendo più facile la gestione di grandi volumi di materiale scansionato.

Casi d’uso comuni

  • E-Books: DjVu è ideale per la digitalizzazione e la distribuzione di e-books che contengono una miscela di testo e immagini.
  • Manuali & Guides: manuali tecnici e guide utente spesso beneficiano dei livelli di compressione elevati offerti da DjVu, rendendoli più facili da distribuire online.
  • Documenti storici: I documenti antichi e i manoscritti rari possono essere conservati digitalmente utilizzando le capacità di mantenimento di qualità superiori di DjVu.
  • Newspapers & Magazines: I giornali con un mix di testo e immagini sono adatti per DjVu a causa della sua efficiente compressione.

Vantaggi e limitazioni

Vantaggi:

  • High Compression Ratio: offre una migliore compressione rispetto a JPEG, GIF e TIFF.
  • Trattamento efficiente del testo: utilizza tecniche avanzate come il codifica JB2 per la rappresentazione ottimale di testo.
  • Caricamento progressivo: consente agli utenti di visualizzare rapidamente i documenti anche con connessioni internet lente.

Le limitazioni:

  • Limited Adoption: DjVu non è così ampiamente supportato o riconosciuto rispetto a formati come PDF.
  • Software Dependency: richiede software specifico per aprire e modificare i file, che possono limitare la sua usabilità per alcuni utenti.

Risorse dello sviluppatore

La programmazione con i file DJVU è supportata attraverso varie API e biblioteche. esempi di codice e guide di implementazione saranno presto aggiunti.

Domande frequenti

  • Quali strumenti posso utilizzare per visualizzare i file DjVu?

  • È possibile utilizzare software come DjVuLibre o Adobe Acrobat Reader DC (con plug-ins) per aprire e visualizzare i file Dj Vu in diversi sistemi operativi.

  • Come posso convertire un file DjVu in PDF?

  • Utilizzare strumenti come djvutxt o convertitori online che supportano la conversione dei file DjVu in formato PDF.

  • È possibile modificare il testo all’interno di un documento DjVu?

  • L’editing del testo direttamente in DjVu è limitato, ma è possibile estrarre e modificare il testo utilizzando software specializzato prima di reimportirlo indietro a Dj Vu se necessario.

Riferimenti

 Italiano