DJVU Dateiformat

Überblick

DjVu (ausgedrückt als “déjà vu”) ist ein hochwertiges grafisches Dateiformat, das für geschanzte Dokumente und Bücher entworfen wurde. Es ist besonders geeignet für die Verarbeitung von Dateien, die eine Mischung aus Text, Zeichnungen, Bilder und Fotos enthalten. Entwickelt von AT&T Labs in den späten 1990er Jahren, Zielsetzung ist, hohe Qualität digitaler Darstellungen zu liefern und gleichzeitig signifikant verringern Dateihilfe im Vergleich zu anderen Formaten wie PDF, JPEG, GIF oder TIFF.

Der einzigartige Verkaufspunkt von DjVu liegt in seiner Fähigkeit, große Dokumente effizient zu komprimieren, ohne die Qualität zu beeinträchtigen. Zum Beispiel kann ein vollfarbiges Scanned-Dokument bei 300 DPI von ca. 25 MB bis nur 30-100 KB herunterkomprimiert werden. Ähnlich können schwarze und weiße Dokumenten auf so wenig wie 5-30 KB reduziert wird.

Hauptmerkmale

  • High Compression Ratio: Es bietet höhere Kompressionsrate im Vergleich zu JPEG, GIF und TIFF.
  • Layer Separation: Verwenden Sie Bildschichtseparation, um Text von Hintergrundbilder zu unterscheiden.
  • Progressive Loading: Erlaubt Benutzern, eine Version des Dokuments mit niedriger Auflösung schnell zu sehen, bevor hochwertige Details geladen werden.
  • Arithmetic Coding: Entwickelt erweiterte aritmetische Codierungstechniken für eine effiziente Datenkompression.
  • Lossy Compression for Bitonal Images: Er bietet eine verlorene Kompression speziell für schwarze und weiße Dokumente optimiert.

Technische Spezifikationen

Formatierung Struktur

Die DjVu-Dateien basieren auf einer hierarchischen Struktur namens IFF85, die dem TIFF-Format ähnlich ist. Diese Struktur besteht aus “chunks”, jeder mit seinem eigenen Identifier (Chunk ID), der sein Zweck innerhalb der Datei beschreibt 0x41 0x54 0x26 0x54, die den Beginn einer Form Chunk anzeigen.

Kernkomponenten

DjVu-Dateien bestehen aus verschiedenen Teilen, die jeweils eine bestimmte Funktion dienen:

  • Form: Eine kompositvolle Container, die andere Stücke hält.
  • DJVM / DJVU / THUM: unterschiedliche Arten von DjVu-Dokumenten (Multipage / Single Page / Thumbnails).
  • DIRM: In mehrseitigen Dokumenten enthält es Informationen über Seiten.
  • NAVM: Speichert Buchmarkendaten für die Navigation innerhalb des Dokuments.
  • ANTa, ANTz/TXTa, TXTz: Handeln Sie mit Ankündigungen und Textlayout.
  • Djbz/Sjc/FG44/BG 44/TH44: Speichern Sie verschiedene Bildkomponenten (Background, Vordergrund, Maske, Thumbnails).
  • INFO: Er liefert Metadaten über einzelne DjVu-Seiten.

Standards & Kompatibilität

Der DjVu-Format wurde seit seiner Gründung im Jahr 1996 über mehrere Revisionen unterzogen.Die neueste Version wurde im April 2005 veröffentlicht.DJVU ist mit einer Reihe von Betriebssystemen kompatibel und unterstützt verschiedene Anwendungen für die Anzeige, Bearbeitung und Konvertierung von Dateien.Es ist jedoch wichtig zu beachten, dass während der Dj Vu eine ausgezeichnete Kompression und Qualität bietet, wurde seine Annahme im Vergleich zu weit verbreiteten Formaten wie PDF begrenzt.

Geschichte & Evolution

DjVu wurde von AT&T Labs zwischen 1996 und 2001 von einem Team entwickelt, darunter Yann LeCun, Léon Bottou, Patrick Haffner und Paul G. Das primäre Ziel war es, eine effiziente Art der Speicherung und Übertragung skannter Dokumente über das Internet zu schaffen.

VersionRelease DateAnmerkungen
1-191996-1999Entwicklungsversionen.
20April 1999Multipage Format eingeführt.
23Juli 2002CID Chunk für die Charakteridentifikation hinzugefügt.
24Februar 2003Inbegriffen LTAnno chunk für Textannotationen.
21September 1999Einführte indirekte Speicherformat und Text-Suchschicht hinzugefügt.
22April 2001Zusatzseite Orientierung Unterstützung und Farbe JB2 Kompression.
25Mai 2003NAVM Chunk für Buchmarken hinzugefügt.
26April 2005Abgeschlossen mit Text/Linie Annotationen.

Arbeiten mit DJVU Files

Öffnen von DJVU Dateien

Um DjVu-Dateien zu öffnen und anzuzeigen, können Sie dedizierte Software wie Dj VuLibre oder kommerzielle Werkzeuge wie Adobe Acrobat Reader DC (die Djvu über Plugins unterstützt) verwenden.

Konvertierung von DJVU Dateien

Die Konvertierung von DjVu-Dateien in andere Formate ist oft aus Kompatibilitätsgründen erforderlich. Die gemeinsamen Konversionen umfassen die Konvertierung von djVU in PDF, die mit Software wie djvutxt oder Online-Konverter durchgeführt werden kann, der das Format unterstützt. Der Prozess beinhaltet normalerweise die Ausnahme von Text und Bildern aus dem Dj Vu Datei und anschließend die Wiederherstellung in ein neues Format.

Erstellen von DJVU-Dateien

Die Erstellung von DjVu-Dateien erfordert in der Regel spezialisierte Software wie Dj VuLibre, die Werkzeuge enthält, um Dokumente zu scannen und zu komprimieren in das Djvu Format. Diese Tools sind so konzipiert, dass komplexe Dokumentstrukturen effizient zu handhaben, so dass es einfacher ist, große Mengen von scannetem Material zu verwalten.

Häufige Anwendungsfälle

  • E-Books: DjVu ist ideal für die Digitalisierung und Verteilung von E-Büchern, die eine Mischung aus Text und Bilder enthalten.
  • Manuals & Guides: Technische Handbuch und Benutzeranleitung profitieren oft von den hohen Kompressionsraten, die von DjVu angeboten werden, wodurch sie online verbreitet werden können.
  • Historische Dokumente: Alte Dokumenten und seltene Handschriften können digital beibehalten werden, indem DjVu über die höheren Qualitätsbehaltungsfähigkeiten verfügt.
  • Newspapers & Magazines: Zeitschriften mit einer Mischung aus Text und Bilder sind für DjVu aufgrund ihrer effizienten Kompression gut geeignet.

Vorteile & Beschränkungen

Vorzüge:

  • High Compression Ratio: Es bietet eine bessere Kompression im Vergleich zu JPEG, GIF und TIFF.
  • Effiziente Textbehandlung: Verwenden Sie fortschrittliche Techniken wie JB2-Coding für eine optimale Textvertretung.
  • Progressive Loading: Erlaubt Benutzern, Dokumente schnell anzuzeigen, auch mit langsamen Internetverbindungen.

Einschränkungen:

  • Limited Adoption: DjVu wird im Vergleich zu PDF-Formaten nicht so weit unterstützt oder anerkannt.
  • Software Abhängigkeit: Es erfordert spezifische Software, um Dateien zu öffnen und zu bearbeiten, was die Benutzbarkeit für einige Benutzer einschränken kann.

Entwickler Ressourcen

Programmierung mit DJVU-Dateien wird über verschiedene APIs und Bibliotheken unterstützt. Code Beispiele und Implementierungsanweisungen werden bald hinzugefügt.

Häufige Fragen

  • Welche Tools kann ich verwenden, um DjVu-Dateien zu sehen?

  • Sie können Software wie DjVuLibre oder Adobe Acrobat Reader DC (mit Plugins) verwenden, um DJVU-Dateien über verschiedene Betriebssysteme zu öffnen und zu sehen.

  • Wie kann ich eine DjVu-Datei in PDF konvertieren?

  • Verwenden Sie Werkzeuge wie djvutxt oder Online-Konverter, die die Konvertierung von DjVu-Dateien in PDF-Format unterstützen.

  • Ist es möglich, Text innerhalb eines DjVu-Dokuments zu bearbeiten?

  • Die Redaktion von Text direkt in DjVu ist begrenzt, aber Sie können Text mit spezialisierter Software extrahieren und modifizieren, bevor Sie es nach Bedarf wieder in DJVU importieren.

Referenzen

 Deutsch