Aspose.OCR تحويل الصور إلى نص لـ .NET

Aspose.OCR Photo to Text for .NET يتيح للمطورين استخراج النص من الصور التي تم التقاطها بواسطة الكاميرات أو الهواتف الذكية.مصنوعة على محرك ASPOSE.OKR المثبت ، يستخدم هذا المكون الإضافي مرشحات مسبقة المعالجة المتقدمة - مثل تصحيح الدوران ، تعويض الاضطرابات ، وقمع الضوضاء - لتوفير التعرف على الدقة العالية حتى على الصور المزعجة ، منخفضة التباين ، أو الصوتية.

تثبيت وإعداد

إن البدء بسيط:

  • قم بتثبيت حزمة Aspose.OCR عبر NuGet أو من جهاز توزيع تم تنزيله.See التثبيت للحصول على تعليمات مفصلة.
  • إعداد الترخيص المقياس في بدء التشغيل لتفكيك الوظائف الكاملة.الإشارة إلى ترخيص مقيد إعداد خطوات.

مثال: استخراج النص من الصور

Aspose.OCR.Metered metered = new Aspose.OCR.Metered();
metered.SetMeteredKey("PublicKey", "PrivateKey");

// Initialize OCR engine
Aspose.OCR.AsposeOcr recognitionEngine = new Aspose.OCR.AsposeOcr();

// Add images to input
Aspose.OCR.OcrInput input = new Aspose.OCR.OcrInput(Aspose.OCR.InputType.SingleImage);
input.Add("source1.png");
input.Add("source2.jpg");

// Configure recognition settings for photo detection
Aspose.OCR.RecognitionSettings recognitionSettings = new Aspose.OCR.RecognitionSettings();
recognitionSettings.DetectAreasMode = DetectAreasMode.PHOTO;

// Perform recognition
List<Aspose.OCR.RecognitionResult> results = recognitionEngine.Recognize(input, recognitionSettings);
foreach (Aspose.OCR.RecognitionResult result in results)
{
    Console.WriteLine(result.RecognitionText);
}

// Save results
results[0].Save("result.txt", Aspose.OCR.SaveFormat.Text);
Aspose.OCR.AsposeOcr.SaveMultipageDocument("result.pdf", Aspose.OCR.SaveFormat.Pdf, results);

الخصائص والوظائف

الفلاتر المتقدمة المسبقة المعالجة

  • تدوير وتصحيح الخرسانة : تلقائيًا تصف الصور المطاطية.
  • التعويض عن التآكل : يصلح العناصر الناجمة عن العدسة والرؤية.
  • الحد من الضوضاء : يضغط على البثور والغبار والملصقات.
  • التناقض والتعديلات الضوئية : تحسين الإضاءة للصور الغامضة أو المفرطة.

محرك التعرف على النص القوي

  • OCR متعددة اللغات (اللاتينية، السيريلية، العربية، و CJK النصوص).
  • الكشف عن الخطوط التي تدعم النص المطبوع والتوقيع والمسح.
  • تقسيم السيناريو التلقائي على صفحات اللغة المختلطة.
  • التعرف على الأرقام والرموز والنقاط مع الحدود القابلة للتكوين.

تحليل التصميم والتقسيم

  • الكشف التلقائي عن الكتل النصية مقابل الرسومات أو اللوحات.
  • تقسيم العمود والخط يحافظ على ترتيب القراءة الطبيعي.
  • OCR القائم على المنطقة لتوجيه المناطق المحددة.

تنسيقات الخروج واستخراج البيانات

  • تصدير النص المسطح، والأشياء المنظمة، أو JSON مع إحداثيات الحدود.
  • استرداد نقاط الثقة خط لخط للحصول على التصديق.
  • Generate PDF أو إخراج النص مباشرة للاستخدام المنخفض.

Batch و Parallel Processing

  • التعرف الموازي باستخدام .NET async/await.
  • إدارة التحقق من الحملات العاملة على نطاق واسع.
  • دعم إلغاء المهام الطويلة الأجل.

التكيف والتوسع

  • تحديد أنابيب الفلتر المخصصة.
  • إضافة القاموسات أو الكلمات الدلالية لتحسين الدقة.
  • الذهاب إلى أحداث التعرف على تسجيل الدخول أو الفحص المتوسط.

أداء Tuning

  • تعديل القرار وعمق اللون لتحقيق التوازن بين السرعة والدقة.
  • تخزين البوفر المسبقة عند العمل مع القوالب المتكررة.
  • خطوط الأنابيب الملف الشخصي لإزالة الزجاجات.

نصائح وأفضل الممارسات

  • المناطق المختارة مسبقا أو الحصاد من الاهتمام لتقليل وقت المعالجة.
  • اختبار المعلمات الفلتر على العينات التمثيلية قبل نشرها.
  • استخدم نقاط الثقة لإنشاء تدفقات السقوط أو التحقق البشري.
  • بالنسبة للصور المحمولة ، تأكد من الإضاءة المناسبة والخلفيات المتناقضة.
  • مراقبة استخدام الذاكرة مع تشغيل المجموعات؛ تطبيق علامات الإلغاء عند الضرورة.
  • الجمع بين تصدير JSON وخدمات التحقق لبناء أنابيب بيانات قوية.

الأسئلة المتكررة

**هل من الضروري تحديد لغة?**بشكل افتراضي ، يكتشف المكون الإضافي تلقائيًا العديد من اللغات ، ومع ذلك ، فإن إعداد اللغة بشكل صريح يحسن دقة النصوص مثل السيرلي أو الصينية أو الهندية.

**ما هي النماذج التي يتم دعمها?**JPEG، PNG، TIFF، PDF، وغيرها من تنسيقات شعبية من الماسح الضوئي أو الكاميرات. يمكن تصدير النتائج على شكل نص مسطح، HTML، Word، pdf، JSON، أو XML.

**كيف يمكنني تحقيق أفضل النتائج?**استخدم صور عالية الجودة من الماسح الضوئي أو الكاميرات الحديثة.تعزز الفلاتر المدمجة جودة الصورة قبل التعرف عليها.

 عربي