فرمت فایل DJVU
بررسی
DjVu (به اصطلاح “déjà vu”) یک فرمت فایل گرافیکی پیچیده است که برای اسناد و کتاب های اسکن شده طراحی شده است. آن را به طور خاص در پردازش فایل هایی که حاوی ترکیبی از متن، نقاشی ها، تصاویر و عکس ها. توسعه یافته توسط AT&T Labs در اواخر دهه ۱۹۹۰، Dj Vu با هدف ارائه نمایشنامه های دیجیتال با کیفیت بالا در حالی که کاهش قابل توجهی در اندازه فایل در مقایسه با سایر فرم ها مانند PDF، JPEG، GIF، یا TIFF.
نقطه فروش منحصر به فرد DjVu در توانایی آن برای فشرده سازی مستندات بزرگ به طور موثر بدون تضعیف کیفیت است.به عنوان مثال، یک سند اسکن شده با رنگ کامل در 300 DPI می تواند از حدود 25 مگابایت به 30-100 کیلوگرم کاهش یابد.همچنین، اسناد سیاه و سفید را می توان به کمتر از 5-30 KB کاهش داد.
ویژگیهای کلیدی
- معدل فشرده سازی بالا: در مقایسه با JPEG، GIF و TIFF، نرخ فاش بالاتر را ارائه می دهد.
- تفرقه لایه: از جداسازی لایک تصویر برای تشخیص متن از تصاویر پس زمینه استفاده می کند.
- بارگذاری پیشرفته: به کاربران اجازه می دهد تا نسخه ای با رزولوشن پایین از سند را به سرعت قبل از بارگیری جزئیات با کیفیت بالا ببینند.
- کودینگ اریتمیک: استفاده از تکنیک های پیشرفته رمزگذاری ارتیمیک برای فشرده سازی داده های کارآمد.
- Lossy Compression for Bitonal Images: ارائه می دهد ضعف فشرده سازی به طور خاص برای اسناد سیاه و سفید بهینه شده است.
مشخصات فنی
ساختار فرمت
فایل های DjVu بر اساس یک ساختار سلسله مراتبی شناخته شده به عنوان IFF85 است که شبیه به فرمت TIFF است. این ساختاری از “چونک ها” تشکیل شده است، هر کدام با شناسه خود (Chunk ID) که هدف خود را در داخل فایل توصیف می کند 0x41 0x54 0x26 0x54
, نشان دهنده شروع یک شکل chunk.
اجزای اصلی
فایل های DjVu از تکه های مختلف تشکیل شده اند که هر کدام به یک عملکرد خاص خدمت می کنند:
- Form: یک ظرف ترکیبی که سایر قطعات را نگه می دارد.
- DJVM / DJVU / THUM: انواع مختلفی از اسناد DjVu (مجموعه / صفحه تک / تامپنی).
- DIRM: شامل اطلاعات مربوط به صفحات در اسناد چند صفحه ای است.
- NAVM: اطلاعات برچسب را برای ناوبری در داخل سند ذخیره می کند.
- ANTa، ANTz/TXTa، TXTz: پردازش یادداشت ها و طرح متن.
- Djbz / SHBZ / FG44 / BG 44 / TH44: ذخیره اجزای مختلف تصویر (پایه، جلو، ماسک، کوچک).
- INFO: ارائه داده های متا در مورد صفحات DjVu فردی.
استانداردها و سازگاری
فرمت DjVu از زمان راه اندازی آن در سال ۱۹۹۶ چندین بازنگری را تجربه کرده است.آخرین نسخه در ماه آوریل ۲۰۰۵ منتشر شد.دیو با طیف وسیعی از سیستم عامل ها سازگار است و از برنامه های مختلف برای مشاهده، ویرایش و تبدیل فایل ها پشتیبانی می کند.با این حال، مهم است که توجه داشته باشید که در حالی که دیو ارائه می دهد فشرده سازی عالی و کیفیت، پذیرش آن محدود شده است در مقایسه با فرم های رایج تر مانند PDF.
تاریخ و تکامل
DjVu توسط AT&T Labs بین سال های 1996 تا 2001 توسط یک تیم از جمله Yann LeCun، Léon Bottou، Patrick Haffner و Paul G. هدف اصلی ایجاد یک راه موثر برای ذخیره و انتقال اسناد اسکن شده از طریق اینترنت بود.
نسخه | تاریخ انتشار | یادداشت ها |
---|---|---|
1-19 | 1996-1999 | نسخه های توسعه. |
۲۰ | آگوست 1999 | فرمت چند صفحه ای معرفی شد. |
23 | ژوئیه 2002 | اضافه کردن CID chunk برای شناسایی شخصیت. |
24 | فوریه 2003 | شامل LTAnno chunk برای یادداشت های متن. |
21 | سپتامبر 1999 | وارد فرمت ذخیره سازی غیرمستقیم و اضافه کردن لایه جستجوی متن. |
22 | آوریل 2001 | اضافه شده پشتیبانی جهت گیری صفحه و رنگ JB2 فشرده سازی. |
25 | ماه مه 2003 | اضافه کردن NAVM chunk برای برچسب ها. |
26 | آگوست 2005 | پایان نامه با نوشته های متن / خطی. |
کار با فایل های DJVU
باز کردن فایل های DJVU
برای باز کردن و مشاهده فایل های DjVu، شما می توانید از نرم افزار اختصاص داده شده مانند DjvuLibre یا ابزارهای تجاری مانند Adobe Acrobat Reader DC استفاده کنید (که از طریق پلاگین ها پشتیبانی می کند).این برنامه ها در ویندوز، macOS و لینوکس سازگار هستند.
تبدیل فایل های DJVU
تبدیل فایل های DjVu به فرمت های دیگر اغلب به دلایل سازگاری مورد نیاز است.تبدیلات رایج شامل تبدیل دی ویو به PDF است که می تواند با استفاده از نرم افزار مانند djvutxt یا تبدیل های آنلاین که از فرم پشتیبانی می کنند انجام شود.این فرآیند به طور معمول شامل استخراج متن و تصاویر از فایل Dj Vu و سپس جمع آوری مجدد آنها به یک فرم جدید.
ایجاد فایل های DJVU
برای ایجاد فایل های DjVu معمولاً نیاز به نرم افزار تخصصی مانند Dj VuLibre دارد که شامل ابزارهایی برای اسکن اسناد و فشرده سازی آنها در فرمت Djvu است.این ابزارها طراحی شده اند تا با ساختارهای مستند پیچیده به طور موثر برخورد کنند و مدیریت حجم زیادی از مواد اسناری را آسان تر کنند.
موارد استفاده رایج
- E-Books: DjVu ایده آل برای دیجیتالی سازی و توزیع کتاب های الکترونیکی است که حاوی ترکیبی از متن و تصاویر است.
- دستورها و راهنمایها: دستورالعمل های فنی و گواهینامه های کاربر اغلب از نرخ فشرده سازی بالا ارائه شده توسط DjVu بهره مند می شوند، که آنها را آسان تر برای توزیع آنلاین می کند.
- اسناد تاریخی: مستندات باستانی و دست نوشته های نادر را می توان به صورت دیجیتال با استفاده از قابلیت های حفظ کیفیت برتر DjVu حفظ کرد.
- روزنامه ها و مجلات: روزنامه ها با ترکیبی از متن و تصاویر به دلیل فشرده سازی موثر آن برای DjVu مناسب هستند.
مزایای و محدودیت ها
مزایای:
- معدل فشرده سازی بالا: در مقایسه با JPEG، GIF و TIFF، فشار بهتر را ارائه می دهد.
- استفاده از تکنیک های پیشرفته مانند رمزگذاری JB2 برای ارائه متن بهینه.
- بارگذاری پیشرفته: به کاربران اجازه می دهد تا اسناد را به سرعت حتی با اتصال به اینترنت آهسته مشاهده کنند.
محدودیت ها:
- تولید محدود: DjVu در مقایسه با فرمت هایی مانند PDF به طور گسترده ای پشتیبانی یا به رسمیت شناخته نمی شود.
- مطالعه نرم افزاری: نیاز به نرم افزار خاص برای باز کردن و ویرایش فایل ها، که ممکن است محدودیت استفاده آن برای برخی از کاربران.
منابع توسعه دهنده
برنامه نویسی با فایل های DJVU از طریق APIs و کتابخانه های مختلف پشتیبانی می شود نمونه های کد و راهنمای اجرای به زودی اضافه خواهد شد.
پرسش های مکرر
از چه ابزاری می توانم برای مشاهده فایل های DjVu استفاده کنم?
شما می توانید از نرم افزار هایی مانند DjVuLibre یا Adobe Acrobat Reader DC (با پلاگین ها) برای باز کردن و مشاهده فایل های Dj Vu در سراسر سیستم عامل های مختلف استفاده کنید.
چگونه یک فایل DjVu را به PDF تبدیل کنم?
از ابزارهایی مانند djvutxt یا تبدیل های آنلاین استفاده کنید که از تبدیل فایل های DjVu به فرمت PDF پشتیبانی می کنند.
آیا می توان متن را در یک سند DjVu ویرایش کرد?
ویرایش متن به طور مستقیم در DjVu محدود است، اما شما می توانید متن را با استفاده از نرم افزار تخصصی استخراج و اصلاح کنید قبل از اینکه آن را دوباره وارد کنید، در صورت لزوم.