DJVU файловый формат
Обзор
DjVu (исполняется как “déjà vu”) - это сложный графический формат файлов, предназначенный для скенированных документов и книг. Особенно уместный в обработке файлів, содержащих смесь текста, рисунков, изображений и фотографий. Разработанный AT&T Labs в конце 1990-х годов, Dj Vu стремится обеспечить высококачественные цифровые представления при этом значительно уменьшить размер файла по сравнению с другими форматами, такими как PDF, JPEG, GIF или TIFF.
Уникальная точка продажи DjVu заключается в его способности эффективно компрессировать большие документы без ущерба качеству. Например, полноцветный скенированный документ на 300 дПИ может быть сдавлен от около 25 Мб до всего 30-100 КБ. Аналогично, черные и белые документы могут быть сокращены до не менее 5-30 Кб. Это делает Dj Vu идеальным выбором для обмена большими документами онлайн без проблем с шириной полосы, обычно связанных с другими форматами.
Ключевые особенности
- Высокий соотношение компрессии: обеспечивает более высокие сопоставительные показатели по сравнению с JPEG, GIF и TIFF.
- Разница слоев: Использует разделение слоя изображения, чтобы отличить текст от фоновых изображений.
- Прогрессивное зарядка: позволяет пользователям быстро просматривать низкоразличную версию документа, прежде чем загружать высококачественные детали.
- Аритметическое кодирование: использует передовые методы аритмического кодира для эффективной компрессии данных.
- Потерянная компрессия для битонных изображений: обеспечивает убыточную компромиссию, специально оптимизированную для черно-белых документов.
Технические спецификации
Формат структуры
DjVu файлы основываются на иерархической структуре, известной как IFF85, которая похожа на формат TIFF. Эта структура состоит из «чунков», каждый с собственным идентификатором (Чунк ИД), который описывает свою цель в файле 0x41 0x54 0x26 0x54
, указывая начало Форма Чунка.
Ключевые компоненты
DjVu файлы состоят из различных частей, каждая из которых выполняет определенную функцию:
- ФОРМ: Композитный контейнер, который хранит другие шланги.
- DJVM / DJVU / THUM: Различные типы документов DjVu (множественные / односторонние / тоннели).
- DIRM: содержит информацию о страницах в многостраничных документах.
- NAVM: хранит данные букмекеры для навигации в документе.
- ANTa, ANTz/TXTa, TXTz: Обработка анотаций и текстового расположения.
- Djbz/Sjc/FG44/BG45/TH44: хранить различные компоненты изображения (задний, предшественник, маска, тоннели).
- ИНФОРМАЦИЯ: предоставляет метаданные о отдельных страницах DjVu.
Стандарты и совместимость
Формат DjVu подвергся нескольким пересмотрам с момента его создания в 1996 году.Последняя версия была выпущена в апреле 2005 года.ДжВу совместима с широким спектром операционных систем и поддерживает различные приложения для просмотра, редактирования и конвертации файлов.Сейчас важно отметить, что, в то время как Dj Vu предлагает отличную компрессию и качество, его принятие было ограничено по сравнению с более широко используемыми форматами, такими как PDF.
История и эволюция
DjVu был разработан AT&T Labs между 1996 и 2001 годами командой, включая Yann LeCun, Léon Bottou, Patrick Haffner и Paul G. Основной целью было создание эффективного способа хранения и передачи сканированных документов через интернет.
Версия | Дата выхода | Примечания |
---|---|---|
1-19 | 1996-1999 | Развитые версии. |
20 | Апрель 1999 | Введенный мультистраничный формат. |
23 | Июль 2002 | Добавлено CID chunk для идентификации персонажа. |
24 | Февраль 2003 | Включен LTAnno chunk для текстовых анотаций. |
21 | сентябрь 1999 | Введенный формат косвенного хранения и добавленный слой поиска текста. |
22 | Апрель 2001 | Добавлена поддержка ориентации страницы и цветная компрессия JB2. |
25 | Май 2003 | Добавлено NAVM chunk для букмарк. |
26 | Апрель 2005 | Завершено текстом/линейными анотациями. |
Работа с DJVU Files
Открытие файлов DJVU
Для открытия и просмотра файлов DjVu можно использовать специальное программное обеспечение, например, DjvuLibre или коммерческие инструменты, такие как Adobe Acrobat Reader DC (который поддерживает Dj Vu через плагины.
Конвертирование файлов DJVU
Конвертация файлов DjVu в другие форматы часто необходима по соображениям совместимости. Общие конверсии включают конструирование Dj Vu на PDF, что может быть сделано с помощью программного обеспечения, таких как djvutxt или онлайн-конвертеров, которые поддерживают формат. Процесс обычно включает в себя извлечение текста и изображений из файла Djvu, а затем их перезагрузку в новый формат.
Создание файлов DJVU
Создание файлов DjVu, как правило, требует специализированного программного обеспечения, такого как DjvuLibre, который включает в себя инструменты для сканирования документов и компрессирования их в формате Dj Vu. Эти средства предназначены для эффективного управления сложными структурами документов, что облегчает управление большими объемами скенированного материала.
Общие случаи использования
- Электронные книги: DjVu идеально подходит для цифровизации и распределения электронных книг, содержащих смесь текста и изображений.
- Руководства и руководства: Технические инструкции и инструкция пользователя часто пользуются высокими соотношениями компрессии, предлагаемыми DjVu, что облегчает их распространение в Интернете.
- Исторические документы: Древние документы и редкие рукописи можно хранить в цифровом виде с использованием высококачественных возможностей DjVu по сохранению качества.
- Новости и журналы: Периодики с смесью текста и изображений хорошо подходят для DjVu из-за эффективной компрессии.
Преимущества и ограничения
Преимущества:
- Высокий соотношение компрессии: обеспечивает лучшее сжатие по сравнению с JPEG, GIF и TIFF.
- Эффективная обработка текста: использует передовые методы, такие как JB2 кодирование для оптимального представления текста.
- Прогрессивное зарядка: позволяет пользователям быстро просматривать документы даже при медленном подключении к Интернету.
Ограничения:
- Ограниченное принятие: DjVu не так широко поддерживается или признается по сравнению с форматами, такими как PDF.
- Софтверная зависимость: требуется специальное программное обеспечение для открытия и редактирования файлов, что может ограничивать его полезность для некоторых пользователей.
Разработчики ресурсов
Программирование с файлами DJVU поддерживается через различные АПИ и библиотеки. Примеры кода и руководства по внедрению будут добавлены в ближайшее время.
Часто задаваемые вопросы
Какие инструменты я могу использовать для просмотра файлов DjVu?
Вы можете использовать программное обеспечение, например, DjVuLibre или Adobe Acrobat Reader DC (с плагинами) для открытия и просмотра файлов Dj Vu по различным операционным системам.
Как конвертировать файл DjVu в PDF?
Используйте такие инструменты, как djvutxt или онлайн-конвертеры, которые поддерживают конвертирование файлов DjVu в PDF-формат.
Можно ли редактировать текст в документе DjVu?
Редактирование текста непосредственно в DjVu ограничено, но вы можете экстрактировать и модифицировать текст с помощью специализированного программного обеспечения, прежде чем повторно импортировать его обратно в DJVU, если это необходимо.