Formát souborů DJVU

přehled

DjVu (přesněji „déjà vu“) je sofistikovaný grafický formát souboru určený pro skenované dokumenty a knihy. Je to zvláště vhodný pro zpracování soubory, které obsahují směs textu, kresby, obrázků a fotografií. Vyvinutý AT&T Labs v koncích devadesátých let, Dj Vu má za cíl poskytovat vysoce kvalitní digitální prezentace a zároveň výrazně snížit velikost Souborů ve srovnání s jinými formáty jako PDF, JPEG, GIF nebo TIFF.

Jedinečný prodejní bod DjVu spočívá v jeho schopnosti efektivně komprimovat velké dokumenty bez narušení kvality. Například, plnofarební skenovaný dokument na 300 DPI může být kompresován z asi 25 MB dolů až do pouhých 30-100 KB. Podobně, černé a bílé doklady mohou být sníženy na tak málo, jak 5-30 Kb. To dělá Dj Vu ideální volbou pro sdílení velkých dokumentů on-line bez problémů s šířkou pásma obvykle spojených s jinými formáty.

Hlavní rysy

  • High Compression Ratio: Nabízí vyšší poměry kompresi ve srovnání s JPEG, GIF a TIFF.
  • Layer Separation: Používá oddělení vrstvy obrazu k odlišení textu od pozadí obrázků.
  • Progresivní nabíjení: Umožňuje uživatelům rychle zobrazit verzi dokumentu s nízkým rozlišením před nabízením kvalitních detailů.
  • Arithmetic Coding: Používá pokročilé techniky aritmetického kódování pro efektivní komprese dat.
  • Lossy Compression for Bitonal Images: Zajišťuje kompresi pro ztrátu, která je speciálně optimalizována pro černé a bílé dokumenty.

Technické specifikace

Formátová struktura

DjVu soubory jsou založeny na hierarchické struktuře známé jako IFF85, který je podobný formátu TIFF. Tato struktura se skládá z “chunks”, každý se svým vlastním identifikátorem (Chunk ID), který popisuje svůj účel v souboru 0x41 0x54 0x26 0x54, To znamená začátek formy chunk.

Klíčové složky

DjVu soubory se skládají z různých kusů, z nichž každá slouží určité funkce:

  • Form: Kompozitní kontejner, který drží další kusy.
  • DJVM / DJVU / THUM: Různé typy dokumentů DjVu (multipage / single page / texty).
  • DIRM: Obsahuje informace o stránkách ve více stranách dokumentů.
  • NAVM: V dokumentu ukládá údaje o značce pro navigaci.
  • ANTa, ANTz/TXTa, TXTz: Zpracujte poznámky a rozložení textu.
  • Djbz/Sjc/FG44/BG 44/TH44: Uložte různé součásti obrazu (zázemí, přední plochy, masky, miniatury).
  • INFO: Poskytuje metadata o jednotlivých stránkách DjVu.

Standardy a kompatibilita

DjVu je kompatibilní s řadou operačních systémů a podporuje různé aplikace pro zobrazení, úpravu a konverzi souborů. Nicméně, je důležité poznamenat, že zatímco Dj Vu nabízí vynikající komprese a kvalitu, jeho přijetí bylo omezeno ve srovnání s široko používanými formáty, jako je PDF.

Historie a evoluce

DjVu byl vyvinut AT&T Labs mezi lety 1996 a 2001 týmem včetně Yann LeCun, Léon Bottou, Patrick Haffner a Paul G. Hlavním cílem bylo vytvořit efektivní způsob ukládání a přenosu skenovaných dokumentů přes internet.

verzeDatum vydáníPoznámky
1-191996-1999Vývojové verze.
20Červen 1999Vstup do multipage formátu.
23červenec 2002Přidat CID chunk pro identifikaci charakteru.
24Únor 2003Zahrnuje LTAnno chunk pro textové poznámky.
21září 1999Vložte formát nepřímého ukládání a přidejte textovou vyhledávací vrstvu.
22dubna 2001Přidaná podpora orientace stránky a barevná komprese JB2.
25května 2003Přidat NAVM chunk pro poznámky.
26Červen 2005Závěrečné textové / písemné poznámky.

Práce s DJVU Files

Otevření DJVU souborů

Chcete-li otevřít a zobrazit soubory DjVu, můžete použít specializované software, jako je Dj VuLibre nebo komerční nástroje, například Adobe Acrobat Reader DC (které podporuje Djvu prostřednictvím plug-inů.

Převod DJVU souborů

Konverze DjVu souborů do jiných formátů je často nezbytné z důvodů kompatibility. Společné konverze zahrnují konverzi Dj Vu do PDF, který lze provést pomocí softwaru, jako je djvutxt nebo on-line konvertory, které podporují format.

Vytvoření DJVU souborů

Vytvoření souborů DjVu obvykle vyžaduje specializovaný software, jako je Dj VuLibre, který zahrnuje nástroje pro skenování dokumentů a komprese do formátu Dj. Tyto nářadí jsou navrženy tak, aby efektivně zvládly složité struktury dokumentu, což usnadňuje správu velkých objemů skenovaného materiálu.

Běžné použití

  • E-Knihy: DjVu je ideální pro digitalizace a distribuci e-knih, které obsahují směs textu a obrázků.
  • Příručky a průvodce: Technické manuály a uživatelské příruče často využívají vysokých poměrů komprese nabízených společností DjVu, což zjednodušuje jejich distribuci online.
  • Historické dokumenty: Staré doklady a vzácné rukopisy mohou být digitálně uchovávány s využitím vysoce kvalitních kapacit společnosti DjVu.
  • Noviny a časopisy: Periodika s textovou a obrázkovou směsí jsou pro DjVu vhodná díky efektivní kompresi.

Výhody a omezení

Výhody:

  • High Compression Ratio: Nabízí lepší kompresi ve srovnání s JPEG, GIF a TIFF.
  • Efektivní zpracování textu: Používá pokročilé techniky, jako je kódování JB2, pro optimální textovou reprezentaci.
  • Progresivní nabíjení: Umožňuje uživatelům rychle zobrazovat dokumenty i při pomalém připojení k internetu.

Omezení:

  • Limited Adoption: DjVu není v porovnání s formáty, jako je PDF, tak široko podporována nebo uznána.
  • Závislost na softwaru: Vyžaduje specifický software k otevření a úpravě souborů, což může omezit jeho použitelnost pro některé uživatele.

Vývojářské zdroje

Programování s DJVU soubory je podporováno prostřednictvím různých API a knihoven. Příklady kódu a implementační průvodce budou brzy přidány.

Často kladené otázky

  • Jaké nástroje mohu použít k zobrazení souborů DjVu?

  • Můžete použít software, jako je DjVuLibre nebo Adobe Acrobat Reader DC (s pluginy), abyste otevřeli a zobrazili soubory Dj Vu v různých operačních systémech.

  • Jak konvertuji soubor DjVu do PDF?

  • Použijte nástroje, jako je djvutxt nebo on-line konvertory, které podporují konverzi souborů DjVu do formátu PDF.

  • Je možné editovat text v dokumentu DjVu?

  • Editování textu přímo v DjVu je omezeno, ale můžete text extrahovat a upravovat pomocí specializovaného softwaru před tím, než ho znovu importujete zpět do Dj Vu, pokud je to nutné.

Reference

 Čeština