Il formato di file DJVU
di Overview
DjVu (pronunciato come “déjà vu”) è un formato di file grafico sofisticato progettato per i documenti e i libri scansionati. è particolarmente adatto al trattamento dei file che contengono una miscela di testo, disegni, immagini e foto. Sviluppato da AT&T Labs alla fine degli anni ‘90, Dj Vu si propone di fornire rappresentazioni digitali di alta qualità, riducendo in modo significativo la dimensione del file rispetto ad altri formati come PDF, JPEG, GIF o TIFF.
Il punto di vendita unico di DjVu si trova nella sua capacità di comprimere i grandi documenti in modo efficiente senza compromettere la qualità. Ad esempio, un documento scansionato a colori a 300 DPI può essere compreso da circa 25 MB fino a soli 30-100 KB. Allo stesso modo, i Documenti neri e bianchi possono essere ridotti a meno di 5-30 Kb. Ciò rende Dj Vu un’opzione ideale per condividere i big documents online senza i problemi di larghezza di banda tipicamente associati ad altri formati.
Caratteristiche principali
- High Compression Ratio: offre un rapporto di compressione superiore rispetto a JPEG, GIF e TIFF.
- Separazione di strati: Utilizza la separazione della strata dell’immagine per distinguere il testo dalle immagini di sfondo.
- Caricamento progressivo: consente agli utenti di visualizzare una versione a bassa risoluzione del documento rapidamente prima di caricare i dettagli di alta qualità.
- Codifica aritmetica: utilizza tecniche avanzate di codificazione arithmetico per la compressione efficiente dei dati.
- Lossy Compression per Immagini Bitonali: fornisce una compressione di perdita ottimizzata specificamente per documenti bianchi e neri.
Specifiche tecniche
Formato Struttura
I file DjVu si basano su una struttura gerarchica conosciuta come IFF85, che è simile al formato TIFF. Questa struttura è costituita da “chunks”, ciascuno con il proprio identificatore (Chunk ID) che descrive il suo scopo all’interno del file. I primi quattro byte di qualsiasi file DJVU sono sempre letti 0x41 0x54 0x26 0x54
, indicando l’inizio di un form chunk.
Componenti Core
I file DjVu sono costituiti da diversi pezzi, ognuno servendo una funzione specifica:
- Form: un contenitore composito che detiene altri pezzi.
- DJVM / DJVU / THUM: Diversi tipi di documenti DjVu (multipage / single page / thumbnails).
- DIRM: contiene informazioni sulle pagine nei documenti multipagine.
- NAVM: memorizza i dati di marchio per la navigazione all’interno del documento.
- ANTa, ANTz/TXTa, TXTz: gestire le annotazioni e il layout del testo.
- Djbz/Sjc/FG44/BG 44/TH44: Conservare diversi componenti dell’immagine (background, foreground, maschera, miniature).
- INFO: fornisce metadati sulle singole pagine DjVu.
Standard & Compatibilità
Il formato DjVu è stato sottoposto a diverse revisioni dal suo inizio nel 1996.La versione più recente è stata rilasciata nell’aprile 2005.DjVU è compatibile con una serie di sistemi operativi e supporta varie applicazioni per visualizzare, modificare e convertire file.Tuttavia, è importante notare che mentre Dj Vu offre eccellente compressione e qualità, la sua adozione è limitata rispetto a formati più ampiamente utilizzati come PDF.
Storia e evoluzione
DjVu è stato sviluppato da AT&T Labs tra il 1996 e il 2001 da un team tra cui Yann LeCun, Léon Bottou, Patrick Haffner e Paul G. L’obiettivo principale era quello di creare un modo efficiente di memorizzare e trasmettere documenti scansionati su Internet.
Versione | Data di rilascio | Notizie |
---|---|---|
1-19 | 1996-1999 | Versioni di sviluppo. |
20 | Aprile 1999 | Formato multipagine introdotto. |
23 | luglio 2002 | Aggiunto CID chunk per identificazione del carattere. |
24 | Febbraio 2003 | Incluso LTAnno chunk per annotazioni di testo. |
21 | Settembre 1999 | Introdotto formato di archiviazione indiretta e aggiunto strato di ricerca di testo. |
22 | Aprile 2001 | Aggiungi il supporto per l’orientamento della pagina e la compressione del colore JB2. |
25 | maggio 2003 | Aggiunto NAVM chunk per bookmarks. |
26 | Aprile 2005 | Finito con annotazioni di testo/linea. |
Lavorare con i file DJVU
Apertura dei file DJVU
Per aprire e visualizzare i file DjVu, è possibile utilizzare software dedicato come Dj VuLibre o strumenti commerciali come Adobe Acrobat Reader DC (che supporta Djvu attraverso i plugin.
Conversione di file DJVU
Convertire i file DjVu in altri formati è spesso necessario per motivi di compatibilità. Conversioni comuni includono la conversione di Dj Vu a PDF, che può essere fatto utilizzando software come djvutxt o convertitori online che supportano il formato. Il processo di solito implica l’estrazione di testo e immagini dal file DJ VU e poi riassemblagli in un nuovo format.
Creazione di file DJVU
La creazione di file DjVu richiede di solito software specializzato, come Dj VuLibre, che include strumenti per lo scansione dei documenti e la compressione in formato Djvu.Questi strumenti sono progettati per gestire efficientemente le strutture complesse del documento, rendendo più facile la gestione di grandi volumi di materiale scansionato.
Casi d’uso comuni
- E-Books: DjVu è ideale per la digitalizzazione e la distribuzione di e-books che contengono una miscela di testo e immagini.
- Manuali & Guides: manuali tecnici e guide utente spesso beneficiano dei livelli di compressione elevati offerti da DjVu, rendendoli più facili da distribuire online.
- Documenti storici: I documenti antichi e i manoscritti rari possono essere conservati digitalmente utilizzando le capacità di mantenimento di qualità superiori di DjVu.
- Newspapers & Magazines: I giornali con un mix di testo e immagini sono adatti per DjVu a causa della sua efficiente compressione.
Vantaggi e limitazioni
Vantaggi:
- High Compression Ratio: offre una migliore compressione rispetto a JPEG, GIF e TIFF.
- Trattamento efficiente del testo: utilizza tecniche avanzate come il codifica JB2 per la rappresentazione ottimale di testo.
- Caricamento progressivo: consente agli utenti di visualizzare rapidamente i documenti anche con connessioni internet lente.
Le limitazioni:
- Limited Adoption: DjVu non è così ampiamente supportato o riconosciuto rispetto a formati come PDF.
- Software Dependency: richiede software specifico per aprire e modificare i file, che possono limitare la sua usabilità per alcuni utenti.
Risorse dello sviluppatore
La programmazione con i file DJVU è supportata attraverso varie API e biblioteche. esempi di codice e guide di implementazione saranno presto aggiunti.
Domande frequenti
Quali strumenti posso utilizzare per visualizzare i file DjVu?
È possibile utilizzare software come DjVuLibre o Adobe Acrobat Reader DC (con plug-ins) per aprire e visualizzare i file Dj Vu in diversi sistemi operativi.
Come posso convertire un file DjVu in PDF?
Utilizzare strumenti come djvutxt o convertitori online che supportano la conversione dei file DjVu in formato PDF.
È possibile modificare il testo all’interno di un documento DjVu?
L’editing del testo direttamente in DjVu è limitato, ma è possibile estrarre e modificare il testo utilizzando software specializzato prima di reimportirlo indietro a Dj Vu se necessario.