Aspose.OCR تصویر اسکن شده به متن برای .NET
Aspose.OCR Scanned Image to Text for .NET به توسعه دهندگان اجازه می دهد تا متن را از تصاویر حاوی مقدار زیادی از محتوای ساختار یافته – قراردادهای اسکن شده، موافقت نامه ها، صفحات کتاب، مقالات، روزنامه ها و بیشتر – در حالی که حفظ وفاداری طرح (از جمله جریان های چند ستون) استخراج کنند.
نصب و نصب
برای اضافه کردن Aspose.OCR Scanned Image به متن برای .NET به پروژه خود، بسته NuGet را نصب کنید و مجوز اندازه گیری شده را تنظیم کنید:
- نصب از طریق NuGet (نگاه کنید به مراحل دقیق): نصب
- اجازه می دهد تا قبل از اولین استفاده مجوز اندازه گیری شود: مجوز متریکی پس از نصب، به سادگی به نام Aspose.OCR در فایل های کد خود اشاره کنید.
ویژگی ها و عملکردها
استخراج متن دقیق
موتور OCR هسته ای از الگوریتم های تشخیص پیشرفته برای اسناد اسکن شده استفاده می کند. آن را تجزیه و تحلیل پیکسل ها، شناسایی اشکال شخصیت در برابر مدل های آموزش دیده ساخته شده، و تولید خروجی متن Unicode. دقت برای ورودی های با رزولوشن بالا و اسکریپت های تمیز بهینه شده است.
تجزیه و تحلیل طرح اسناد ساختاری
فراتر از ضبط متن خط به خط، پلاگین عناصر ساختاری را – پاراگراف ها، عنوانها، پاها و جدول ها – با بخش بندی مناطق تصویر – تقسیم می کند. بلوک های شناخته شده روابط فضایی را حفظ می کنند، به توسعه دهندگان اجازه می دهد تا جریان اسناد را بازسازی کنند یا پس از پردازش سفارشی را اعمال کنند.
Multi-Column Layout شناختی
صفحه های اسکن شده اغلب از فرمت های دو یا سه ستون استفاده می کنند موتور OCR به طور خودکار مرزهای ستون را تشخیص می دهد، آنها را در ترتیب طبیعی می خواند و بخش های متن را به یک جریان خروجی تک و به درستی سفارش داده می کند.
پیش پردازش و بهبود تصویر
روال های پیش پردازش یکپارچه موفقیت تشخیص را در اسکن های چالش برانگیز بهبود می بخشد:
- Skew Detection و دکمه اتوماتیک
- دوگانه سازی (Adaptive thresholding)
- فیلترهای کاهش سر و صدا (خرد و فلفل، رطوبت گازی)
- تنظیمات کنتراست و روشنایی این مراحل می توانند مورد بررسی قرار گیرند یا سفارشی شوند تا با سناریوهای کیفیت تصویر خاص مطابقت داشته باشند.
زبان و شخصیت تنظیم پشتیبانی
اگرچه تمرکز بر متن های ساختار یافته انگلیسی، موتور پشتیبانی از چندین زبان و مجموعه های شخصیت مربوط به محتوای قانونی، علمی یا فنی اسکن شده است.
تنظیمات شناختی سفارشی
گزینه های رنگ آمیزی به توسعه دهندگان اجازه می دهد تا سرعت تعادل در برابر دقت:
- محدودیت های اعتماد به نفس برای پذیرش شخصیت و کلمه
- حالت های بخش بندی صفحه (بلوک تک، اتوماتیک، متن پراکنده)
- پارامترهای رزولوشن برای مقیاس تصاویر ورودی
- واژگان های تعریف شده توسط کاربر برای افزایش شناخت اصطلاحات خاص دامنه
فرمت های خروجی و پردازش داده ها
متن استخراج شده را می توان به عنوان خطوط Unicode مسطح و یا جریان به فایل های متن. برای سناریوهای پیشرفته، متا داده های طرح (نقشه های محدود، نمره اعتماد) قرار داده شده است به طوری که برنامه ها می تواند برجسته یا تایید مناطق شناخته شده.
عملکرد و مدیریت منابع
طراحی شده برای پردازش مجموعه ای از مجموعه های تصویر بزرگ، پلاگین:
- حافظه را با صفحه های پخش به حداقل می رساند
- ارائه API های تشخیص غیر همزمان برای موازی کردن بار کار
- نمایش پارامترهای تنگ برای شمارش نوار و اندازه های بوفر
تسهیلات امنیتی و ارز
تمام کلاس های شناسایی در خط امن هستند، اجازه می دهد تا وظایف OCR همزمان را در سراسر خط های متعدد یا تماس های غیر همگام بدون قفل کردن درگیری ها انجام دهند.این ایده آل برای راه اندازی سرور یا خدمات با نفوذ بالا است.
پشتیبانی از مجوزهای متری
Aspose.OCR Scanned Image to Text for .NET از همان مدل مجوز اندازه گیری شده به عنوان محصولات ASPOSE استفاده می کند.Call the Metered.InitiateLicensing method at application startup to bind consumption to your subscription meter.
راهنمایی ها و بهترین شیوه ها
- با اسکن های با کیفیت بالا (300 DPI یا بالاتر) برای حداکثر دقت شروع کنید.
- تصاویر پیش پردازش برای حذف سر و صدا و اسکو درست قبل از تغذیه به OCR.
- از تنظیمات تقسیم بندی صفحه استفاده کنید که با پیچیدگی طرح شما مطابقت دارد.
- بارگذاری فقط بسته های زبان مورد نیاز؛ مدل های خارجی می تواند تشخیص آهسته.
- اجازه می دهد تا تشخیص غیر همزمان در هنگام پردازش بسته های بزرگ برای حفظ پاسخگویی UI.
- نمره های اعتماد را نظارت کنید و برای اسناد انتقادی، اعتباربخشی یا بازنگری دستی مبتنی بر حد اعمال کنید.
- در دسترس بودن اشیاء موتور OCR به سرعت برای آزاد کردن منابع مدیریت نشده.
- ردیابی و استفاده از متر سوابق برای جلوگیری از نقض غیرمنتظره کوتا.