Aspose.OCR فاکتور به متن برای .NET
Aspose.OCR Invoice to Text for .NET یک پلاگین تخصصی است که برای ساده سازی استخراج متن ساختار یافته از صورتحساب های اسکن شده یا عکس گرفته شده طراحی شده است. با اتوماسیون مراحل کلیدی – پیش پردازش تصویر، تجزیه و تحلیل طرح و OCR – شما می توانید داده های حاصل از آن را به طور مستقیم به سیستم های حسابداری، پایگاه داده ها و یا پلتفرم های پرداخت بدون بازنویسی دستی تغذیه کنید.
نصب و نصب
این مراحل را دنبال کنید تا Aspose.OCR Invoice را به متن برای .NET به پروژه خود اضافه کنید:
- نصب از طریق NuGet یا دانلود بسته از سرورهای Aspose. برای دستورالعمل های دقیق، ببینید نصب .
- تنظیم مجوز اندازه گیری شده در استارتاپ برنامه برای جلوگیری از محدودیت های ارزیابی مجوز متریکی .
مثال: شناسایی صورتحساب
Aspose.OCR.Metered metered = new Aspose.OCR.Metered();
metered.SetMeteredKey("PublicKey", "PrivateKey");
// Initialize OCR engine
Aspose.OCR.AsposeOcr recognitionEngine = new Aspose.OCR.AsposeOcr();
// Add images to OcrInput object
Aspose.OCR.OcrInput input = new Aspose.OCR.OcrInput(Aspose.OCR.InputType.SingleImage);
input.Add("invoice1.png");
input.Add("invoice2.jpg");
// Configure recognition settings
Aspose.OCR.InvoiceRecognitionSettings recognitionSettings = new Aspose.OCR.InvoiceRecognitionSettings();
recognitionSettings.Language = Aspose.OCR.Language.Latin;
// Perform invoice recognition
List<Aspose.OCR.RecognitionResult> results = recognitionEngine.RecognizeInvoice(input, recognitionSettings);
foreach (Aspose.OCR.RecognitionResult result in results)
{
Console.WriteLine(result.RecognitionText);
}
// Save results
results[0].Save("invoice_result.txt", Aspose.OCR.SaveFormat.Text);
Aspose.OCR.AsposeOcr.SaveMultipageDocument("invoice_result.pdf", Aspose.OCR.SaveFormat.Pdf, results);ویژگی ها و عملکردها
موتورهای OCR
- مدل های شناختی سفارشی برای صورتحساب های چاپ شده و عکس گرفته شده.
- تحمل بالا برای رزولوشن های مختلف، سطوح سر و صدا و زاویه های شکسته.
- به رسمیت شناختن چندین زبان و سبک های دیجیتال در یک سند.
پیش پردازش و بهبود تصویر
- فیلترهای اتوماتیک تخریب، تخلیه و دوگانه سازی برای بهبود قابل خواندن.
- محدودیت های سازگار که خطوط صورتحساب و مرزهای جدول را حفظ می کند.
- روشنایی و تنظیمات کنتراست برای مقابله با اسکن های زیر یا بیش از حد قرار گرفته.
تجزیه و تحلیل و تشخیص جدول
- شناسایی اتوماتیک عنوان، پایه، جدول آیتم خط، و بلوک های خلاصه.
- شناسایی ردیف ها، ستون ها و مرزهای سلولی، حتی زمانی که خطوط حاکم ضعیف یا از دست رفته است.
- استخراج جدول های چوبی (به عنوان مثال، زیر عناصر زیر یک آیتم خط مادری).
نکات کلیدی برای استخراج زوج
- قالب های قابل تنظیم برای نام میدان نقشه (به عنوان مثال، “قیمت صورتحساب”، “مجموع بدهی”) برای نتایج OCR.
- پشتیبانی از برچسب های پویا – تشخیص نزدیکی متن به جای مطابقت دقیق قالب.
- امتیاز اعتماد به نفس در هر میدان، اجازه می دهد تا شما را به فیلتر و یا بازسازی آیتم های اعتماد کم.
صادرات و ادغام
- فرمت های خروجی: متن صاف، JSON، XML، PDF، Word یا HTML.
- رویدادها برای جلوگیری از نتایج OCR خام قبل از سریالی شدن.
- پشتیبانی از پردازش بسته با کنترل های موازی برای بار کار حجم بالا.
خطای پردازش و ثبت نام
- پیام های جزئی استثنایی برای حالت های شکست معمولی (به عنوان مثال، فرمت تصویر پشتیبانی نشده، مشکلات مجوز).
- رابط ورود ساخته شده سازگار با چارچوب های محبوب .NET (Serilog، NLog و log4net).
- سیاست های بازگرداندن برای خطاهای موقت در هنگام فایل I/O یا تخصیص حافظه.
راهنمایی ها و بهترین شیوه ها
- رزولوشن تصویر پیش تأیید شده: برای بهترین دقت OCR، تصاویر را در یا بالاتر از 300 DPI عرضه کنید.
- از تصاویر خاکستری یا رنگی استفاده کنید – فقط ورودی های باینری می توانند خطوط میز خوب را از دست بدهند.
- محدودیت های اعتماد را با توجه به کیفیت داده های خود تنظیم کنید؛ حد پایین تر اطلاعات بیشتری را جذب می کند، اما ممکن است نیاز به اعتباربخشی پایین داشته باشد.
- برای بسته های بسیار بزرگ، استفاده از حافظه را نظارت کنید و از طریق گزینه های پردازش پلاگین، همبستگی را تنظیم کنید.
- ویژگی قالب ارزش کلیدی را بالا ببرید تا طرح های پیش بینی شده صورتحساب را منجمد کنید؛ برای قراردادهای ناشناخته، به تشخیص جدول عمومی بازگردید.
- همیشه قبل از استفاده از روش های OCR برای جلوگیری از ارزیابی، مجوزهای اندازه گیری را آغاز کنید.
با پیروی از این دستورالعمل ها و استفاده از توانایی های فاکتور متمرکز آن، Aspose.OCR Invoice to Text for .NET به شما اجازه می دهد تا لوله های قابل اعتماد و پایان به پایان پردازش اسناد را بسازید – به حداقل رساندن تلاش دستی و حداکثر پهنای باند.