Format de fichier DJVU
Résumé
DjVu (prononcé comme “déjà vu”) est un format de fichier graphique sophistiqué conçu pour les documents et les livres scannés. Il est particulièrement adapté au traitement des fichiers qui contiennent un mélange de texte, dessins, images et photographies. Développé par AT&T Labs à la fin des années 1990, Dj Vu vise à fournir des représentations numériques de haute qualité tout en réduisant considérablement la taille du dossier par rapport à d’autres formats tels que PDF, JPEG, GIF ou TIFF.
Le point de vente unique de DjVu réside dans sa capacité à comprimer de grands documents efficacement sans compromettre la qualité. Par exemple, un document scané de pleine couleur à 300 DPI peut être comprimé d’environ 25 MB en dessous à seulement 30-100 KB. De même, les documents noirs et blancs peuvent être réduits à peu de 5 à 30 Kb. Cela fait de DJVU une option idéale pour partager de gros documents en ligne sans les problèmes de bande passante typiquement associés à d’autres formats.
Caratteristiche principali
- Ratio de compression élevé: Il offre des ratio-compression supérieurs par rapport à JPEG, GIF et TIFF.
- Séparation des couches: Il utilise la séparation de la couche d’image pour distinguer le texte des images de fond.
- La charge progressive: permet aux utilisateurs de voir une version à faible résolution du document rapidement avant de charger des détails de haute qualité.
- Codage arithmétique: Il utilise des techniques de codage d’arithmatique avancées pour une compression efficace des données.
- Lossy Compression pour les images bitonales: Il fournit une compression de perte spécifiquement optimisée pour des documents noirs et blancs.
spécifications techniques
Formation Structure
Les fichiers DjVu sont basés sur une structure hiérarchique connue sous le nom de IFF85, qui est similaire au format TIFF. Cette structure se compose de “chunks”, chacun avec son propre identifiant (Chunk ID) qui décrit son but dans le fichier 0x41 0x54 0x26 0x54
, indiquant le début d’une forme de chunk.
Les composants de base
Les fichiers DjVu sont composés de différents morceaux, chacun servant une fonction spécifique:
- Form : un conteneur composite qui contient d’autres morceaux.
- DJVM / DJVU / THUM: Différents types de documents DjVu (multipage / page unique / thumbnails).
- DIRM : contient des informations sur les pages dans les documents multipage.
- NAVM : stocke les données de marquage pour la navigation dans le document.
- ANTa, ANTz/TXTa, TXTz: Traiter les annotations et le layout du texte.
- Djbz/Sjc/FG44/BG 44/TH44 : stockez différents composants d’image (background, front, masque, miniatures).
- INFO: Il fournit des métadonnées sur les pages DjVu individuelles.
Normes et compatibilité
Le format DjVu a subi plusieurs révisions depuis sa création en 1996.La dernière version a été sortie en avril 2005.DJVU est compatible avec une gamme de systèmes d’exploitation et soutient diverses applications pour la visualisation, l’édition et la conversion des fichiers.Toutefois, il est important de noter que tandis que Dj Vu offre une excellente compression et de qualité, son adoption est restreinte par rapport aux formats plus largement utilisés comme PDF.
Histoire et évolution
DjVu a été développé par AT&T Labs entre 1996 et 2001 par une équipe dont Yann LeCun, Léon Bottou, Patrick Haffner et Paul G. L’objectif principal était de créer un moyen efficace d’enregistrer et de transmettre des documents scannés sur Internet.
La version | Date de sortie | Notes |
---|---|---|
1-19 | 1996-1999 | Versions de développement. |
20 | avril 1999 | Le format multipage introduit. |
23 | Juillet 2002 | Ajouter CID chunk pour l’identification des caractères. |
24 | février 2003 | Inclut LTAnno chunk pour les annotations de texte. |
21 | Septembre 1999 | Le format de stockage indirect est introduit et la couche de recherche texte est ajoutée. |
22 | avril 2001 | Ajout de support d’orientation de page et de compression de couleur JB2. |
25 | Mai 2003 | Ajoutez NAVM chunk pour les bookmarks. |
26 | avril 2005 | Finalisé avec des annotations de texte / ligne. |
Travailler avec DJVU Files
Ouvrir les fichiers DJVU
Pour ouvrir et visualiser les fichiers DjVu, vous pouvez utiliser des logiciels dédiés tels que DjvuLibre ou des outils commerciaux comme Adobe Acrobat Reader DC (qui soutient Dj Vu par le biais de plugins.
Conversion des fichiers DJVU
Conversion des fichiers DjVu à d’autres formats est souvent nécessaire pour des raisons de compatibilité. conversions communes comprennent la conversion de Dj Vu en PDF, ce qui peut être fait avec des logiciels tels que djvutxt ou convertisseurs en ligne qui soutiennent le format. Le processus implique généralement l’extraction du texte et des images du fichier Djvu et ensuite leur réassemblage dans un nouveau format.
Créer des fichiers DJVU
La création de fichiers DjVu nécessite généralement des logiciels spécialisés, tels que Dj VuLibre, qui comprennent des outils pour scanner les documents et les compresser dans le format Djvu. Ces outil sont conçus pour gérer efficacement les structures de documents complexes, ce qui facilite la gestion de grands volumes de matériel scanné.
Casi d’uso comuni
- E-Books: DjVu est idéal pour la numérisation et la distribution de livres électroniques contenant un mélange de texte et d’images.
- Manuels & Guides: Les manuels techniques et les guides d’utilisateur bénéficient souvent des taux de compression élevés proposés par DjVu, ce qui les rend plus faciles à distribuer en ligne.
- Documents historiques: Des documents anciens et des manuscrits rares peuvent être conservés numériquement en utilisant les capacités de conservation de qualité supérieures de DjVu.
- Journal & Magazines: Les périodiques avec un mélange de texte et d’images sont bien adaptés à DjVu en raison de sa compression efficace.
Avantages & Limitations
Les avantages:
- High Compression Ratio: offre une meilleure compression par rapport à JPEG, GIF et TIFF.
- Texte efficace: Utilisez des techniques avancées telles que le codage JB2 pour une représentation de texte optimale.
- Ladage progressif: permet aux utilisateurs de voir rapidement les documents même avec des connexions internet lentes.
Les limites:
- Adoption limitée: DjVu n’est pas aussi largement soutenu ou reconnu par rapport aux formats tels que PDF.
- Dépendance du logiciel: Il nécessite des programmes spécifiques pour ouvrir et éditer des fichiers, ce qui peut limiter son usabilité pour certains utilisateurs.
Les ressources de développeur
La programmation avec les fichiers DJVU est soutenue à travers diverses API et bibliothèques. exemples de code et guides d’application seront bientôt ajoutés.
Questions fréquentes posées
Quels outils puis-je utiliser pour voir les fichiers DjVu?
Vous pouvez utiliser des logiciels tels que DjVuLibre ou Adobe Acrobat Reader DC (avec des plugins) pour ouvrir et visualiser les fichiers Dj Vu sur différents systèmes d’exploitation.
Comment puis-je convertir un fichier DjVu en PDF?
Utilisez des outils tels que djvutxt ou des convertisseurs en ligne qui soutiennent la conversion des fichiers DjVu au format PDF.
Est-il possible d’éditer le texte dans un document DjVu?
L’édition du texte directement dans DjVu est limitée, mais vous pouvez extraire et modifier le texte à l’aide de logiciels spécialisés avant de le réimporter en Dj Vu si nécessaire.