DJVU filformatet

Overblik

DjVu (berømt som “déjà vu”) er et sofistikeret grafisk filformat designet til scannede dokumenter og bøger. Det er særligt velkendt til håndtering af filer, der indeholder en blanding af tekst, tegninger, billeder og billeder. Udviklet af AT&T Labs i slutningen af 1990’erne, Dj Vu sigter mod at levere høj kvalitet digitale repræsentationer samtidig med betydelig reduktion af file størrelse sammenlignet med andre formater som PDF, JPEG, GIF, eller TIFF.

DjVu’s unikke salgspunkt ligger i dens evne til effektiv komprimering af store dokumenter uden at kompromittere kvaliteten. For eksempel kan et fuldfarvet scannet dokument på 300 DPI kompreseres fra omkring 25 MB ned til kun 30-100 KB. På samme måde kan sorte og hvide dokumentere reduceres til så lidt som 5-30 Kb. Dette gør Dj Vu til et ideelt valg for at dele store documenter online uden bandbreddeproblemer typisk forbundet med andre formater.

Nøglefunktioner

  • Høj kompressionshastighed: Det giver højere kompressionsforhold i forhold til JPEG, GIF og TIFF.
  • Layer Separation: Brug billedskalaer separation til at skelne tekst fra baggrundsbilleder.
  • Progressiv opladning: Det giver brugerne mulighed for at se en lavopløsningsversion af dokumentet hurtigt, før de oplader detaljer af høj kvalitet.
  • Arithmetic Coding: Anvende avancerede aritmetiske kodningsteknikker til effektiv datakompression.
  • Lossy Compression for Bitonal Images: Tilbyder losy kompression specielt optimeret for sorte og hvide dokumenter.

Tekniske specifikationer

Formater struktur

DjVu filer er baseret på en hierarkisk struktur kendt som IFF85, som er lignende til TIFF-format. Denne struktur består af “chunks”, hver med sin egen identifikator (Chunk ID), der beskriver sin formål inden for filen. De første fire byter af ethvert Djvu-fil altid læses 0x41 0x54 0x26 0x54, Indikerer begyndelsen af en form chunk.

Core komponenter

DjVu filer består af forskellige stykker, hver tjener en bestemt funktion:

  • Form: En komposit container, der holder andre stykker.
  • DJVM/DJVU/THUM: Forskellige typer af DjVu-dokumenter (multipage/single page/thumbnails).
  • DIRM: indeholder oplysninger om sider i flere sider dokumenter.
  • NAVM: Lagrer bookmarkdata til navigation inden for dokumentet.
  • ANTa, ANTz/TXTa, TXTz: Handle annotationer og tekst layout.
  • Djbz/Sjc/FG44/BG 44/TH44: Lagre forskellige billedkomponenter (background, foreground, maske, miniatyrer).
  • INFO: Giver metadata om individuelle DjVu-sider.

Standarder og kompatibilitet

DjVu-format har været gennemgået flere revisioner siden dets oprettelse i 1996.Den nyeste version blev udgivet i april 2005.DJVU er kompatibel med en række operativsystemer og understøtter forskellige applikationer til visning, redigering og konvertering af filer.Men det er vigtigt at bemærke, at mens Dj VU tilbyder fremragende kompression og kvalitet, har dens vedtagelse været begrænset sammenlignet med mere almindeligt anvendte formater som PDF.

Historie og evolution

DjVu blev udviklet af AT&T Labs mellem 1996 og 2001 af et team herunder Yann LeCun, Léon Bottou, Patrick Haffner og Paul G. Det primære mål var at skabe en effektiv måde at lagre og overføre scannede dokumenter over internettet.

Version afUdgivelsesdatoNoter
1-191996-1999Udviklingsversioner.
20April 1999Introduktion af multipage format.
23juli 2002Tilføj CID chunk til karakteridentifikation.
24februar 2003Inkluderet LTAnno chunk for tekst annotationer.
21september 1999Indtast indirekte lagringsformat og tilføjet tekst søgslade.
22April 2001Tilføjede sideorientering støtte og farve JB2 kompression.
25maj 2003Tilføj NAVM chunk til bogmærker.
26April 2005Afslutter med tekst/line annotationer.

Arbejde med DJVU Files

Åbning af DJVU filer

For at åbne og se DjVu-filer, kan du bruge dedikeret software som DjvuLibre eller kommercielle værktøjer som Adobe Acrobat Reader DC (som understøtter Dj Vu via plugins.

Konverter DJVU filer

Konvertering af DjVu-filer til andre formater er ofte nødvendigt af kompatibilitetsgrunde. almindelige konverteringer omfatter konvertering av Dj Vu til PDF, som kan gøres ved hjælp af software som djvutxt eller online konvertere, der understøtter formatet.

Skabelse af DJVU filer

Skabelse af DjVu-filer kræver normalt specialiseret software som Dj VuLibre, som omfatter værktøjer til skanning af dokumenter og komprimering af dem i Djvu format. Disse værksteder er designet til effektiv håndtering af komplekse dokumentstrukturer, hvilket gør det nemmere at administrere store mængder scannede materialer.

Gennemsigtig brug af tilfælde

  • E-Bøger: DjVu er ideel til digitalisering og distribution af e-bøger, der indeholder en blanding af tekst og billeder.
  • Manualer & Guides: Tekniske manualer og brugervejledning kan ofte drage fordel af de høje kompressionssatser, der tilbydes af DjVu, hvilket gør dem nemmere at distribuere online.
  • Historiske dokumenter: Gammel dokument og sjældne manuskript kan bevares digitalt ved hjælp af DjVu’s overordnede kvalitetshåndhævelse.
  • Newspapers & Magazines: Periodikaler med en blanding af tekst og billeder er velegnet til DjVu på grund af sin effektive kompression.

Fordele og begrænsninger

Fordele ved:

  • High Compression Ratio: Det giver bedre kompression sammenlignet med JPEG, GIF og TIFF.
  • Effektiv teksthåndtering: Brug avancerede teknikker som JB2 kodning for optimal tekstrepresentation.
  • Progressiv opladning: giver brugerne mulighed for at se dokumenter hurtigt, selv med langsom internetforbindelse.

Begrænsningerne er:

  • Limited Adoption: DjVu er ikke så bredt støttet eller anerkendt i forhold til formater som PDF.
  • Software Afhængighed: Der kræves specifik software til at åbne og redigere filer, hvilket kan begrænse dets brugbarhed for nogle brugere.

Udviklere ressourcer

Programmering med DJVU filer understøttes gennem forskellige APIs og biblioteker. kode eksempler og implementering guider vil blive tilføjet snart.

Ofte stillede spørgsmål

  • Hvilke værktøjer kan jeg bruge til at se DjVu-filer?

  • Du kan bruge software som DjVuLibre eller Adobe Acrobat Reader DC (med plugins) til at åbne og se DJVU-filer på tværs af forskellige operativsystemer.

  • Hvordan kan jeg konvertere en DjVu fil til PDF?

  • Brug værktøjer som djvutxt eller online konvertere, der understøtter konvertering af DjVu filer til PDF-format.

  • Er det muligt at redigere tekst i et DjVu-dokument?

  • Redigering af tekst direkte i DjVu er begrænset, men du kan udveksle og redigere tekst ved hjælp af specialiseret software, før du re-importerer det tilbage til Dj Vu, hvis det er nødvendigt.

References

 Dansk