El formato de archivo DJVU
Revisión
DjVu (pronunciado como “déjà vu”) es un formato de archivo gráfico sofisticado diseñado para documentos y libros escaneados. Es particularmente adepto en el manejo de ficheros que contienen una mezcla de texto, dibujos, imágenes y fotografías. Desarrollado por AT&T Labs a finales de los años 90, Dj Vu tiene como objetivo proporcionar representaciones digitales de alta calidad al mismo tiempo que reducir significativamente el tamaño del fichero en comparación con otros formatos como PDF, JPEG, GIF o TIFF.
El punto de venta único de DjVu se encuentra en su capacidad de comprimir grandes documentos de manera eficiente sin comprometer la calidad. Por ejemplo, un documento escaneado de color completo a 300 DPI puede ser comprimido de alrededor de 25 MB hasta sólo 30-100 KB. De igual manera, los documentos negros y blancos pueden ser reducidos a tan poco como 5-30 Kb. Esto hace que Dj Vu sea una opción ideal para compartir documentos grandes en línea sin los problemas de ancho de banda habitualmente asociados con otros formatos.
Características clave
- High Compression Ratio: Ofrece proporciones de compresión superiores en comparación con JPEG, GIF y TIFF.
- Separación de la capa: Utiliza la separación del nivel de imagen para distinguir el texto de las imágenes de fondo.
- Carga progresiva: permite a los usuarios ver una versión de baja resolución del documento rápidamente antes de cargar detalles de alta calidad.
- Codificación aritmética: emplea técnicas avanzadas de codificación arítmica para una compresión eficiente de datos.
- Compresión de pérdida para imágenes bitonales: proporciona compresión de perdición específicamente optimizada para documentos negros y blancos.
especificaciones técnicas
Formación estructural
Los archivos DjVu se basan en una estructura jerárquica conocida como IFF85, que es similar al formato TIFF. Esta estructura se compone de “chunks”, cada uno con su propio identificador (Chunk ID) que describe su propósito dentro del archivo 0x41 0x54 0x26 0x54
, Indica el comienzo de una forma de chunk.
Componentes básicos
Los archivos DjVu se componen de varios fragmentos, cada uno que sirve una función específica:
- Form: Un contenedor compuesto que mantiene otros picos.
- DJVM / DJVU / THUM: Diferentes tipos de documentos DjVu (múltiplos / páginas únicas / subtítulos).
- DIRM: contiene información sobre páginas en documentos multipáginas.
- NAVM: almacenará datos de marcador para la navegación dentro del documento.
- ANTa, ANTz/TXTa, TXTz: Gestionar las anotaciones y el diseño de texto.
- Djbz/Sjc/FG44/BG 44/TH44: almacenar diferentes componentes de la imagen (background, frontal, máscara, miniaturas).
- INFO: proporciona metadatos sobre las páginas individuales de DjVu.
Estándares y Compatibilidad
El formato DjVu ha sufrido varias revisiones desde su creación en 1996.La última versión fue lanzada en abril de 2005.DJVU es compatible con una variedad de sistemas operativos y soporta diversas aplicaciones para ver, editar y convertir archivos.Sin embargo, es importante tener en cuenta que mientras que DJVú ofrece excelente compresión y calidad, su adopción se ha limitado en comparación con los formatos más ampliamente utilizados como PDF.
Historia y Evolución
DjVu fue desarrollado por AT&T Labs entre 1996 y 2001 por un equipo incluyendo Yann LeCun, Léon Bottou, Patrick Haffner y Paul G. El objetivo principal era crear una manera eficiente de almacenar y transmitir documentos escaneados a través de Internet.
Versión | Data de lanzamiento | Notas |
---|---|---|
1-19 | 1996-1999 | Versiones de desarrollo. |
20 | abril de 1999 | Introducción al formato multipágina. |
23 | Julio 2002 | Agregado CID chunk para la identificación de caracteres. |
24 | Febrero 2003 | Incluido LTAnno chunk para anotaciones de texto. |
21 | septiembre de 1999 | Introducir el formato de almacenamiento indirecto y añadir la capa de búsqueda de texto. |
22 | abril de 2001 | Apoyo de orientación de página y compresión de color JB2. |
25 | mayo de 2003 | Añadió NAVM chunk para los bookmarks. |
26 | abril de 2005 | Finalizado con anotaciones de texto/linea. |
Trabajar con los archivos de DJVU
Descargar archivos de DJVU
Para abrir y ver los archivos de DjVu, puede utilizar software dedicado como Dj VuLibre o herramientas comerciales como Adobe Acrobat Reader DC (que apoya a Djvu a través de plugins.
Convertir archivos de DJVU
Convertir los archivos DjVu a otros formatos es a menudo necesario por razones de compatibilidad. Conversiones comunes incluyen la conversión de Dj Vu en PDF, que se puede hacer utilizando software como djvutxt o convertidores en línea que soportan el formato. El proceso normalmente implica extraer texto y imágenes del archivo Djvu y luego reassemblarlos en un nuevo format.
Creación de archivos DJVU
La creación de archivos DjVu generalmente requiere un software especializado, como DjvuLibre, que incluye herramientas para escanear los documentos y comprimirlos en el formato Dj Vu. Estas herrales están diseñadas para gestionar estructuras complejas de documentos de manera eficiente, lo que hace más fácil la gestión de grandes volúmenes de material escaneo.
Casos de uso comunes
- E-Books: DjVu es ideal para digitalizar y distribuir libros electrónicos que contienen una mezcla de texto y imágenes.
- Manuales y guías: Los manuales técnicos y los guiones de usuario a menudo se benefician de las altas proporciones de compresión ofrecidas por DjVu, lo que los hace más fáciles de distribuir en línea.
- Documentos históricos: Los documentos antiguos y los manuscritos rara pueden ser conservados digitalmente utilizando las capacidades de retención de calidad superior de DjVu.
- Noticias y revistas: Los periódicos con una mezcla de texto y imágenes son adecuados para DjVu debido a su eficiente composición.
Beneficios y limitaciones
Las ventajas:
- High Compression Ratio: Ofrece una mejor composición en comparación con JPEG, GIF y TIFF.
- Tratamiento de texto eficiente: Utiliza técnicas avanzadas como el codificación JB2 para la representación óptima del texto.
- Carga progresiva: permite a los usuarios ver documentos rápidamente incluso con conexiones de Internet lentas.
Las limitaciones:
- Adopción limitada: DjVu no es tan ampliamente apoyado o reconocido en comparación con formatos como PDF.
- Software Dependency: Requiere software específico para abrir y editar archivos, lo que puede limitar su usabilidad para algunos usuarios.
Recursos de desarrolladores
La programación con los archivos DJVU se apoya a través de diferentes APIs y bibliotecas. ejemplos de código y guías de implementación se añadirán pronto.
Preguntas frecuentes
Qué herramientas puedo usar para ver los archivos DjVu?
Usted puede usar software como DjVuLibre o Adobe Acrobat Reader DC (con plugins) para abrir y ver los archivos de Djvu a través de diferentes sistemas operativos.
Cómo puedo convertir un archivo DjVu en PDF?
Utilice herramientas como djvutxt o convertidores en línea que soportan la conversión de archivos DjVu en formato PDF.
Es posible editar el texto dentro de un documento DjVu?
La edición del texto directamente en DjVu es limitada, pero se puede extraer y modificar el texto utilizando software especializado antes de reimporlo a Dj Vu si es necesario.