Format de fitxers DJVU
Revisió
DjVu (pronunciat com “déjà vu”) és un format de fitxers gràfics sofisticat dissenyat per a documents i llibres escanats. És particularment adequat per tractar arxius que contenen una barreja de text, dibuixos, imatges i fotografies. Desenvolupat per AT&T Labs a finals de la dècada de 1990, Dj Vu té com a objectiu proporcionar representacions digitals d’alta qualitat mentre redueix significativament la mida del fitxer en comparació amb altres formats com PDF, JPEG, GIF, o TIFF.
El punt de venda únic de DjVu es troba en la seva capacitat de compressar documents grans de manera eficient sense comprometre la qualitat. Per exemple, un document escanejat de color complet a 300 DPI es pot comprimir d’aproximadament 25 MB fins a només 30-100 KB. De la mateixa manera, els documents negres i blancs es poden reduir a tan poc que 5-30 Kb. Això fa que Dj Vu sigui l’opció ideal per compartir grans documents en línia sense els problemes de banda generalment associats amb altres formats.
Característiques clau
- High Compression Ratio: Ofereix ràtio de compressió superior en comparació amb JPEG, GIF i TIFF.
- Separació de la capa: Utilitza la separació d’imatge per distingir el text de les imatges de fons.
- Càrrega progressiva: permet als usuaris veure una versió de baixa resolució del document ràpidament abans de carregar detalls d’alta qualitat.
- Codificació aritmètica: Utilitza tècniques avançades de codifica arítmica per a una compressió eficaç de dades.
- La compressió de pèrdua per a imatges bitonals: proporciona la compresssió d’ pèrdues optimitzada específicament per als documents negres i blancs.
especificacions tècniques
Formació estructural
Els arxius DjVu es basen en una estructura jeràrquica coneguda com IFF85, que és similar al format TIFF. Aquesta estructura consisteix en “chunks”, cadascú amb el seu propi identificador (Chunk ID) que descriu la seva finalitat dins del fitxer 0x41 0x54 0x26 0x54
, que indica el començament d’un form chunk.
Components bàsics
Els arxius DjVu es componen de diferents trossos, cadascun servint una funció específica:
- Form: un contenidor compost que emmagatzema altres trossos.
- DJVM / DJVU / THUM: Diferents tipus de documents DjVu (múltiples / pàgines singles / subtítols).
- DIRM: Conté informació sobre pàgines en documents multipàgins.
- NAVM: Emmagatzema les dades de marcador per a la navegació dins del document.
- ANTa, ANTz/TXTa, TXTz: tractar les anotacions i el disseny de text.
- Djbz/Sjc/FG44/BG 44/TH44: Emmagatzema diversos components d’imatge (background, frontal, màscara, miniatures).
- INFO: proporciona metadades sobre les pàgines de DjVu individuals.
Estàndards i compatibilitat
El format DjVu ha sofert diverses revisions des de la seva creació el 1996.La darrera versió va ser llançada a l’abril del 2005.Djvu és compatible amb una sèrie de sistemes operatius i suporta diverses aplicacions per visualitzar, editar i convertir fitxers.
Història i evolució
DjVu va ser desenvolupat per AT&T Labs entre 1996 i 2001 per un equip incloent Yann LeCun, Léon Bottou, Patrick Haffner i Paul G. L’objectiu principal era crear una manera eficient d’emmagatzemar i transmetre documents escanejats a través de l’Internet.
Versió | Data de publicació | Notícies |
---|---|---|
1-19 | 1996-1999 | Versions de desenvolupament. |
20 | abril de 1999 | Introducció en format multipàgic. |
23 | juliol de 2002 | Afegir CID chunk per a la identificació de caràcters. |
24 | febrer 2003 | Inclou LTAnno chunk per a anotacions de text. |
21 | setembre de 1999 | Introdueix el format d’emmagatzematge indirecte i afegeix la capa de cerca de text. |
22 | abril de 2001 | Suport d’orientació de pàgina afegit i compressió de color JB2. |
25 | maig de 2003 | Afegir NAVM chunk per a les notes. |
26 | abril de 2005 | Finalitzat amb anotacions de text / línia. |
Treballant amb els arxius DJVU
Obrir els arxius de DJVU
Per obrir i veure els arxius de DjVu, podeu utilitzar programari dedicat com el Dj VuLibre o eines comercials com Adobe Acrobat Reader DC (que dóna suport a Djvu a través de plugins.
Convertir els arxius de DJVU
Convertir els arxius DjVu a altres formats sovint és necessari per raons de compatibilitat. Conversions comunes inclouen la conversió de Dj Vu en PDF, que es pot fer utilitzant programari com djvutxt o convertidors en línia que donen suport al format. El procés normalment implica l’extracció de text i imatges del fitxer Djvu i després reassemblar-los en un format nou.
Creació d’arxius DJVU
La creació de fitxers DjVu generalment requereix programari especialitzat, com ara Dj VuLibre, que inclou eines per escanejar els documents i compressar-los en el format Djvu. Aquestes eines estan dissenyades per gestionar estructures de document complexes de manera eficient, la qual cosa facilita la gestió de grans volums de material escanejat.
Casos d’ús comú
- E-Books: DjVu és ideal per digitalitzar i distribuir llibres electrònics que contenen una barreja de text i imatges.
- Manuals i guies: Els manuals tècnics i guides d’usuari sovint gaudeixen de les altes proporcions de compressió que ofereix DjVu, la qual cosa els facilita la distribució en línia.
- Documents històrics: Els documents antics i els manuscrits rars es poden conservar digitalment utilitzant les capacitats de retenció de qualitat superior de DjVu.
- Newspapers & Magazines: Periodicals amb una barreja de text i imatges són ben adequats per a DjVu a causa de la seva eficient compressió.
Avantatges i limitacions
Els avantatges:
- High Compression Ratio: ofereix una millor compressió en comparació amb JPEG, GIF i TIFF.
- Efficient tractament de text: Utilitza tècniques avançades com ara el codificació JB2 per a la representació del text òptima.
- Càrrega progressiva: permet als usuaris veure documents ràpidament fins i tot amb connexions d’internet lents.
Les limitacions:
- Adopció limitada: DjVu no és tan àmpliament recolzat o reconegut en comparació amb formats com PDF.
- Dependència del programari: requereix programes específics per obrir i editar arxius, que poden limitar la seva usabilitat per a alguns usuaris.
Recursos desenvolupadors
La programació amb els arxius DJVU es dóna suport a través de diverses API i biblioteques. exemples de codi i guies d’implementació s’afegiran aviat.
Preguntes freqüents
Quines eines puc utilitzar per visualitzar els arxius DjVu?
Podeu utilitzar programari com DjVuLibre o Adobe Acrobat Reader DC (amb plugins) per obrir i veure els fitxers de Dj Vu a través de diferents sistemes operatius.
Com es pot convertir un arxiu DjVu en PDF?
Utilitza eines com djvutxt o convertidors en línia que donen suport a la conversió de fitxers DjVu en format PDF.
És possible editar text dins d’un document DjVu?
Editar text directament en DjVu és limitat, però es pot extreure i modificar el text utilitzant programari especialitzat abans de reimportar-lo a Dj Vu si cal.