ترجمة النص: Aspose.OCR Invoice to Text لـ .NET
Aspose.OCR الفاتورة إلى النص ل .NET هو إضافات متخصصة مصممة لتسريع استخراج النص المنظم من الفواتير المسجلة أو المصورة. من خلال تلقائي الخطوات الرئيسية - معالجة الصورة المسبقة، وتحليل التخطيط، و OCR-يمكنك تغذية البيانات الناتجة مباشرة إلى أنظمة المحاسبة، قواعد بيانات، أو منصات الدفع دون إعادة صياغة يدويًا.
تثبيت وإعداد
اتبع هذه الخطوات لإضافة Aspose.OCR Invoice إلى النص لـ .NET إلى مشروعك:
- تثبيت عبر NuGet أو تنزيل الحزمة من خوادم Aspose للحصول على تعليمات مفصلة، انظر التثبيت .
- إعداد الترخيص المقياس عند بدء التطبيق لتجنب قيود التقييم ترخيص مقيد .
مثال: التعرف على الفواتير
Aspose.OCR.Metered metered = new Aspose.OCR.Metered();
metered.SetMeteredKey("PublicKey", "PrivateKey");
// Initialize OCR engine
Aspose.OCR.AsposeOcr recognitionEngine = new Aspose.OCR.AsposeOcr();
// Add images to OcrInput object
Aspose.OCR.OcrInput input = new Aspose.OCR.OcrInput(Aspose.OCR.InputType.SingleImage);
input.Add("invoice1.png");
input.Add("invoice2.jpg");
// Configure recognition settings
Aspose.OCR.InvoiceRecognitionSettings recognitionSettings = new Aspose.OCR.InvoiceRecognitionSettings();
recognitionSettings.Language = Aspose.OCR.Language.Latin;
// Perform invoice recognition
List<Aspose.OCR.RecognitionResult> results = recognitionEngine.RecognizeInvoice(input, recognitionSettings);
foreach (Aspose.OCR.RecognitionResult result in results)
{
Console.WriteLine(result.RecognitionText);
}
// Save results
results[0].Save("invoice_result.txt", Aspose.OCR.SaveFormat.Text);
Aspose.OCR.AsposeOcr.SaveMultipageDocument("invoice_result.pdf", Aspose.OCR.SaveFormat.Pdf, results);الخصائص والوظائف
محرك المحاسبة الخاص OCR
- نموذج التعرف المخصص للفواتير المطبوعة والصور.
- التسامح العالي للحلول المختلفة ومستويات الضوضاء والزوايا الصاخبة.
- الاعتراف باللغات المتعددة والأساليب الرقمية في نفس الوثيقة.
Image Preprocessing & تحسين الصور
- تصفية التلقائي، وتفريغ، وبرمجة ثنائية لتحسين القراءة.
- الحدود التكيفية التي تحافظ على خطوط الفواتير والحدود المكتبية.
- تعديلات الضوء والتباين للتعامل مع الفحوصات المنخفضة أو الزائدة.
تحليل التصميم و الكشف عن الطاولة
- التعرف التلقائي على العناوين، والخطوط، ورقم البنود، ومجموعات.
- التعرف على الصفوف والأعمدة والحدود الخلوية، حتى عندما تكون الخطوط الحاكمة ضعيفة أو مفقودة.
- استخراج اللوحات المطحونة (على سبيل المثال، العناصر الفرعية تحت العنصر الخط الأصلي).
القيمة الرئيسية الزوجية استخراج
- قوالب قابلة للتكوين إلى أسماء الحقول الخريطة (على سبيل المثال، “رقم الفاتورة” و “التنفيذ الإجمالي”) إلى نتائج OCR.
- دعم العلامات الديناميكية – يكتشف قريبة النص بدلاً من مطابقة قوالب صارمة.
- تقييم الثقة حسب الحقل، مما يتيح لك تصفية أو إعادة تدوير العناصر منخفضة ثقة.
التصدير والتكامل
- تنسيقات الخروج: النص المسطح، JSON، XML، PDF، Word، أو HTML.
- الحدث يضغط على نتائج OCR الخام قبل التسلسل.
- دعم معالجة الحزام مع التحكمات الموازية للحملات العاملة عالية الحجم.
خطأ التعامل & تسجيل الدخول
- رسائل الاستثناء التفصيلية للوضع المشترك للفشل (على سبيل المثال، تنسيق الصورة غير المدعومة، مشاكل الترخيص).
- واجهة تسجيل الدخول المدمجة متوافقة مع الإطارات التسجيلية .NET الشعبية (Serilog، NLog ، log4net).
- سياسات الاسترداد للخطأ الانتقالي أثناء تخصيص الملف I/O أو الذاكرة.
نصائح وأفضل الممارسات
- تصحيح الصورة المسبقة: للحصول على أفضل دقة OCR، توفير الصور عند أو فوق 300 DPI.
- استخدم الصور الرمادية أو الملونة - يمكن أن تفقد الإدخالات الثنائية فقط خطوط الطاولة الجميلة.
- ضع حدود الثقة وفقا لجودة البيانات الخاصة بك؛ الحدود المنخفضة تلتقط المزيد من بيانات ولكن قد تتطلب التحقق من الانخفاض.
- بالنسبة للمجموعات الكبيرة جدا، مراقبة استخدام الذاكرة وتعديل الموازنة من خلال خيارات معالجة المكونات الإضافية.
- قم بتخفيف ميزة قالب القيمة الرئيسية لتجميد ترتيبات الفاتورة المتوقعة؛ بالنسبة للتخطيطات غير المعروفة، يعود إلى الكشف عن الجدول العام.
- يبدأ دائمًا ترخيص القياس قبل الاستدعاء بأي أساليب OCR لتجنب علامات المياه في وضع التقييم.
من خلال اتباع هذه المبادئ التوجيهية والاستفادة من قدراتها المركزية في الفاتورة، Aspose.OCR الفواتير إلى النص لـ .NET يسمح لك بإنشاء أنابيب معالجة المستندات الموثوقة والأخيرة إلى النهاية – الحد الأدنى من الجهد اليدوي وتحقيق أقصى قدر من الدخول.