Formát souborů DJVU
přehled
DjVu (přesněji „déjà vu“) je sofistikovaný grafický formát souboru určený pro skenované dokumenty a knihy. Je to zvláště vhodný pro zpracování soubory, které obsahují směs textu, kresby, obrázků a fotografií. Vyvinutý AT&T Labs v koncích devadesátých let, Dj Vu má za cíl poskytovat vysoce kvalitní digitální prezentace a zároveň výrazně snížit velikost Souborů ve srovnání s jinými formáty jako PDF, JPEG, GIF nebo TIFF.
Jedinečný prodejní bod DjVu spočívá v jeho schopnosti efektivně komprimovat velké dokumenty bez narušení kvality. Například, plnofarební skenovaný dokument na 300 DPI může být kompresován z asi 25 MB dolů až do pouhých 30-100 KB. Podobně, černé a bílé doklady mohou být sníženy na tak málo, jak 5-30 Kb. To dělá Dj Vu ideální volbou pro sdílení velkých dokumentů on-line bez problémů s šířkou pásma obvykle spojených s jinými formáty.
Hlavní rysy
- High Compression Ratio: Nabízí vyšší poměry kompresi ve srovnání s JPEG, GIF a TIFF.
- Layer Separation: Používá oddělení vrstvy obrazu k odlišení textu od pozadí obrázků.
- Progresivní nabíjení: Umožňuje uživatelům rychle zobrazit verzi dokumentu s nízkým rozlišením před nabízením kvalitních detailů.
- Arithmetic Coding: Používá pokročilé techniky aritmetického kódování pro efektivní komprese dat.
- Lossy Compression for Bitonal Images: Zajišťuje kompresi pro ztrátu, která je speciálně optimalizována pro černé a bílé dokumenty.
Technické specifikace
Formátová struktura
DjVu soubory jsou založeny na hierarchické struktuře známé jako IFF85, který je podobný formátu TIFF. Tato struktura se skládá z “chunks”, každý se svým vlastním identifikátorem (Chunk ID), který popisuje svůj účel v souboru 0x41 0x54 0x26 0x54
, To znamená začátek formy chunk.
Klíčové složky
DjVu soubory se skládají z různých kusů, z nichž každá slouží určité funkce:
- Form: Kompozitní kontejner, který drží další kusy.
- DJVM / DJVU / THUM: Různé typy dokumentů DjVu (multipage / single page / texty).
- DIRM: Obsahuje informace o stránkách ve více stranách dokumentů.
- NAVM: V dokumentu ukládá údaje o značce pro navigaci.
- ANTa, ANTz/TXTa, TXTz: Zpracujte poznámky a rozložení textu.
- Djbz/Sjc/FG44/BG 44/TH44: Uložte různé součásti obrazu (zázemí, přední plochy, masky, miniatury).
- INFO: Poskytuje metadata o jednotlivých stránkách DjVu.
Standardy a kompatibilita
DjVu je kompatibilní s řadou operačních systémů a podporuje různé aplikace pro zobrazení, úpravu a konverzi souborů. Nicméně, je důležité poznamenat, že zatímco Dj Vu nabízí vynikající komprese a kvalitu, jeho přijetí bylo omezeno ve srovnání s široko používanými formáty, jako je PDF.
Historie a evoluce
DjVu byl vyvinut AT&T Labs mezi lety 1996 a 2001 týmem včetně Yann LeCun, Léon Bottou, Patrick Haffner a Paul G. Hlavním cílem bylo vytvořit efektivní způsob ukládání a přenosu skenovaných dokumentů přes internet.
verze | Datum vydání | Poznámky |
---|---|---|
1-19 | 1996-1999 | Vývojové verze. |
20 | Červen 1999 | Vstup do multipage formátu. |
23 | červenec 2002 | Přidat CID chunk pro identifikaci charakteru. |
24 | Únor 2003 | Zahrnuje LTAnno chunk pro textové poznámky. |
21 | září 1999 | Vložte formát nepřímého ukládání a přidejte textovou vyhledávací vrstvu. |
22 | dubna 2001 | Přidaná podpora orientace stránky a barevná komprese JB2. |
25 | května 2003 | Přidat NAVM chunk pro poznámky. |
26 | Červen 2005 | Závěrečné textové / písemné poznámky. |
Práce s DJVU Files
Otevření DJVU souborů
Chcete-li otevřít a zobrazit soubory DjVu, můžete použít specializované software, jako je Dj VuLibre nebo komerční nástroje, například Adobe Acrobat Reader DC (které podporuje Djvu prostřednictvím plug-inů.
Převod DJVU souborů
Konverze DjVu souborů do jiných formátů je často nezbytné z důvodů kompatibility. Společné konverze zahrnují konverzi Dj Vu do PDF, který lze provést pomocí softwaru, jako je djvutxt nebo on-line konvertory, které podporují format.
Vytvoření DJVU souborů
Vytvoření souborů DjVu obvykle vyžaduje specializovaný software, jako je Dj VuLibre, který zahrnuje nástroje pro skenování dokumentů a komprese do formátu Dj. Tyto nářadí jsou navrženy tak, aby efektivně zvládly složité struktury dokumentu, což usnadňuje správu velkých objemů skenovaného materiálu.
Běžné použití
- E-Knihy: DjVu je ideální pro digitalizace a distribuci e-knih, které obsahují směs textu a obrázků.
- Příručky a průvodce: Technické manuály a uživatelské příruče často využívají vysokých poměrů komprese nabízených společností DjVu, což zjednodušuje jejich distribuci online.
- Historické dokumenty: Staré doklady a vzácné rukopisy mohou být digitálně uchovávány s využitím vysoce kvalitních kapacit společnosti DjVu.
- Noviny a časopisy: Periodika s textovou a obrázkovou směsí jsou pro DjVu vhodná díky efektivní kompresi.
Výhody a omezení
Výhody:
- High Compression Ratio: Nabízí lepší kompresi ve srovnání s JPEG, GIF a TIFF.
- Efektivní zpracování textu: Používá pokročilé techniky, jako je kódování JB2, pro optimální textovou reprezentaci.
- Progresivní nabíjení: Umožňuje uživatelům rychle zobrazovat dokumenty i při pomalém připojení k internetu.
Omezení:
- Limited Adoption: DjVu není v porovnání s formáty, jako je PDF, tak široko podporována nebo uznána.
- Závislost na softwaru: Vyžaduje specifický software k otevření a úpravě souborů, což může omezit jeho použitelnost pro některé uživatele.
Vývojářské zdroje
Programování s DJVU soubory je podporováno prostřednictvím různých API a knihoven. Příklady kódu a implementační průvodce budou brzy přidány.
Často kladené otázky
Jaké nástroje mohu použít k zobrazení souborů DjVu?
Můžete použít software, jako je DjVuLibre nebo Adobe Acrobat Reader DC (s pluginy), abyste otevřeli a zobrazili soubory Dj Vu v různých operačních systémech.
Jak konvertuji soubor DjVu do PDF?
Použijte nástroje, jako je djvutxt nebo on-line konvertory, které podporují konverzi souborů DjVu do formátu PDF.
Je možné editovat text v dokumentu DjVu?
Editování textu přímo v DjVu je omezeno, ale můžete text extrahovat a upravovat pomocí specializovaného softwaru před tím, než ho znovu importujete zpět do Dj Vu, pokud je to nutné.