DJVU filformat

Overview

DjVu (pronunciert som “déjà vu”) er et sofistikert grafisk filformat designet for skannede dokumenter og bøker. Det er spesielt egnet til å håndtere filer som inneholder en blanding av tekst, tegninger, bilder og bilder. Utviklet av AT&T Labs i slutten av 1990-tallet, Dj Vu tar sikte på å gi høy kvalitet digitale representasjoner mens betydelig redusere filstørrelsen sammenlignet med andre format som PDF, JPEG, GIF, eller TIFF.

DjVu’s unike salgspunkt ligger i sin evne til å komprimere store dokumenter effektivt uten å hindre kvaliteten. For eksempel kan et fullfarget skannert dokument på 300 DPI kompreseres fra rundt 25 MB ned til bare 30-100 KB. På samme måte kan svarte og hvite dokumente reduseres til så lite som 5-30 Kb. Dette gjør Dj Vu et ideelt valg for å dele store Dokumenter online uten bandbreddeproblemer som vanligvis er forbundet med andre formater.

Nøkkelfunksjoner

  • High Compression Ratio: gir høyere komprimeringsforhold sammenlignet med JPEG, GIF og TIFF.
  • Layer Separation: Bruker bildeskala separasjon for å skille tekst fra bakgrunnsbilder.
  • Progressive Loading: Gjør det mulig for brukere å se en lavoppløsningsversjon av dokumentet raskt før du laster opp høy kvalitet detaljer.
  • Arithmetic Coding: Utnytter avanserte aritmetiske kodeteknikker for effektiv datakompresjon.
  • Lossy Compression for Bitonal Images: gir tap kompresjon spesielt optimalisert for svarte og hvite dokumenter.

Tekniske spesifikasjoner

Formater struktur

DjVu filer er basert på en hierarkisk struktur kjent som IFF85, som er lik TIFF-format. Denne strukturen består av “chunks”, hver med sin egen identifikator (Chunk ID) som beskriver sitt formål innenfor filen 0x41 0x54 0x26 0x54, Dette indikerer starten på en form chunk.

Nøkkelkomponenter

DjVu-filer består av ulike stykker, hver som tjener en bestemt funksjon:

  • Form: En sammensatt container som holder andre stykker.
  • DJVM / DJVU / THUM: Forskjellige typer DjVu-dokumenter (multipage/single page/thumbnails).
  • DIRM: Inneholder informasjon om sider i flere sider dokumenter.
  • NAVM: Lagrer bookmarkdata for navigasjon i dokumentet.
  • ANTa, ANTz/TXTa, TXTz: Handle annotasjoner og tekst layout.
  • Djbz/Sjc/FG44/BG 44/TH44: Lagre ulike bildekomponenter (bakgrunn, foreground, maske, miniatyrer).
  • INFO: gir metadata om individuelle DjVu-sider.

Standarder og kompatibilitet

DjVu-formatet har gjennomgått flere revideringer siden starten i 1996.Den nyeste versjonen ble utgitt i april 2005.Djvu er kompatibel med en rekke operativsystemer og støtter ulike applikasjoner for visning, redigering og konvertering av filer.Men det er viktig å merke seg at mens Dj Vu tilbyr utmerket kompresjon og kvalitet, har dens vedtak blitt begrenset sammenlignet med mer brukte formater som PDF.

Historie og evolusjon

DjVu ble utviklet av AT&T Labs mellom 1996 og 2001 av et team som inkluderer Yann LeCun, Léon Bottou, Patrick Haffner og Paul G. Hovedmålet var å skape en effektiv måte å lagre og overføre skannede dokumenter over internett.

versjonUtgivelsesdatoNoter
1-191996-1999Utviklingsversjoner.
20april 1999Introduksjon av multipage format.
23juli 2002Legg til CID chunk for karakteridentifikasjon.
24februar 2003Inkludert LTAnno chunk for tekstannotasjoner.
21september 1999Introdusert indirekte lagringsformat og lagt til tekst søkemaskine.
22april 2001Legg til sideorientering støtte og farge JB2 komprimering.
25mai 2003Legg til NAVM chunk for bokmerker.
26april 2005Avslutter med tekst/linjeannotasjoner.

Arbeide med DJVU Files

Åpne DJVU filer

For å åpne og se DjVu-filer, kan du bruke dedikert programvare som DjvuLibre eller kommersielle verktøy som Adobe Acrobat Reader DC (som støtter Dj Vu gjennom plugins.

Konverter DJVU filer

Konvertering av DjVu-filer til andre formater er ofte nødvendig for kompatibilitetsgrunner. Vanlige konverteringer inkluderer konvertere Dj Vu til PDF, som kan gjøres ved hjelp av programvare som djvutxt eller online konvertere som støtter formatet.

Skaper DJVU filer

Å opprette DjVu-filer krever vanligvis spesialisert programvare slik som Dj VuLibre, som inkluderer verktøy for å skanne dokumenter og komprimere dem i DJ VU-format. Disse verktøyet er designet til å håndtere komplekse dokumentstrukturer effektivt, noe som gjør det lettere å administrere store volum av skannet materiale.

Vanlige brukssaker

  • E-Bøker: DjVu er ideell for digitalisering og distribusjon av e-bøker som inneholder en blanding av tekst og bilder.
  • Manualer og guider: Tekniske manualer og brukerguider kan ofte dra nytte av de høye kompresjonsratene som tilbys av DjVu, noe som gjør det enklere å distribuere på nettet.
  • Historiske dokumenter: Antikk dokument og sjeldne manuskript kan bevares digitalt ved hjelp av DjVus høyere kvalitet bevaringskapasiteter.
  • Newspapers & Magazines: Periodikaler med en blanding av tekst og bilder er godt egnet for DjVu på grunn av sin effektive komprimering.

Fordeler og begrensninger

Fordelene er:

  • High Compression Ratio: gir bedre komprimering sammenlignet med JPEG, GIF og TIFF.
  • Effektiv teksthåndtering: Bruk avanserte teknikker som JB2-koding for optimal tekstrepresentasjon.
  • Progressive Loading: Tillater brukere å se dokumenter raskt, selv med langsom internettforbindelse.

Begrensningene er:

  • Limited Adoption: DjVu er ikke så bredt støttet eller anerkjent sammenlignet med PDF-formater.
  • Softwareavhengighet: Det krever spesifikk programvare for å åpne og redigere filer, noe som kan begrense brukbarheten for noen brukere.

Utviklerressurser

Programmering med DJVU filer støttes gjennom ulike APIs og biblioteker. kode eksempler og implementeringsguider vil bli lagt til snart.

Ofte stillede spørsmål

  • Hvilke verktøy kan jeg bruke for å se DjVu-filer?

  • Du kan bruke programvare som DjVuLibre eller Adobe Acrobat Reader DC (med plugins) for å åpne og se DJVU-filer over ulike operativsystemer.

  • Hvordan kan jeg konvertere en DjVu fil til PDF?

  • Bruk verktøy som djvutxt eller online konvertere som støtter konvertering av DjVu filer til PDF-format.

  • Er det mulig å redigere tekst i et DjVu-dokument?

  • Redigering av tekst direkte i DjVu er begrenset, men du kan ekstraktere og modifisere tekst ved hjelp av spesialisert programvare før du re-importerer det tilbake til Dj Vu hvis det er nødvendig.

References

 Norsk