كيفية تحويل جدول Aspose.OCR إلى نص في .NET

Aspose.OCR Table to Text for .NET هو ملحق قوي يتيح للمطورين استخراج النص من اللوحات المسجلة أو المصورة بدقة عالية.إستفادة من خوارزميات التعلم الآلي المتقدمة والشبكات العصبية، فإنه يكتشف الهياكل الجدولية، وسحب النص على مستوى الخلية، وتنظيم كل شيء في البحث، ويمكن تعديل لوحات التوزيع أو هياكات البيانات جدول.

تثبيت وإعداد

للبدء، قم بتثبيت حزمة Aspose.OCR Table to Text عبر NuGet أو تنزيل المجموعة من خوادم Asposa التثبيت دليل خطوات مفصلة.تمكين الوظائف الكاملة عن طريق تكوين الترخيص المقياس كما هو موضح في ترخيص مقيد الوثائق.

الخصائص والوظائف

الكشف عن الطاولة والتعرف على الهيكل

  • يكتشف تلقائيًا حدود الطاولة في الصور التي تم فحصها أو التقاطها ، حتى لو كانت الخلايا مكسورة أو مدرجة أو غير متساوية.
  • يدعم ترتيبات متعددة الأقواس ومتعددة الأعمدة والجدول المطحون والأحجام الخلوية المختلفة.
  • يوفر التمثيل الهرمي للصفوف والخلايا لعملية ما بعد المعالجة البسيطة.

استخراج النص الخلوي

  • يعترف النص داخل كل خلية باستخدام خوارزميات OCR المتقدمة، والحفاظ على الفجوات الخطية، والرأسمالية، والتصميم الرقمي.
  • التعامل مع العديد من اللغات في جدول واحد مع أولويات اللغة قابلة للتكوين.
  • تصحيح الاضطرابات مثل الانحناء، وانخفاض التباين، أو ضوضاء الصورة لتعزيز الدقة.

إعادة الإعمار والتصدير

  • إعادة بناء اللوحات التي تم الكشف عنها إلى بنية بيانات .NET (على سبيل المثال، DataTable) أو تصديرها إلى تنسيقات CSV/TSV.
  • تنتج ملفات ورقة المفاتيح القابلة للتعديل (XLSX) التي يمكن فتحها في Excel أو أدوات أخرى.
  • يحتفظ بتصميم الخلايا الأساسية (التصحيح والحدود) وتنسيقات التصدير لتدفقات العمل المتقدمة.

نتائج قابلة للبحث والتحرير

  • إنتاج طبقات نصية قابلة للبحث في PDF التصدير ، مما يجعل محتوى الجدول مؤشرًا.
  • يتكامل بسهولة مع Aspose.Cells للعمليات المتقدمة مثل الصيغ والخرائط.
  • يسمح بإدراج المحتوى المستخرج في قواعد البيانات أو أنابيب المعالجة المنخفضة.

الأداء والوساطة

  • تم تحسينها لمعالجة مجموعة من مجموعات البيانات الكبيرة مع تثبيت قابل للتكوين وإدارة الذاكرة.
  • تدفق بيانات الصورة مباشرة إلى محرك OCR، وتقليل القرص I/O.
  • يوفر ردود الفعل التقدم و علامات الإلغاء للعمليات الطويلة الأجل.

التكيف المتقدم

  • دعم منطقة الفائدة (ROI) للحد من الكشف إلى مناطق محددة من أجل تسريع المعالجة.
  • الحد الأقصى للثقة قابلة للتعيين لتصفية نتائج منخفضة الثقة.
  • الأقواس لعملية ما قبل و ما بعد المعالجة (الفلاتر المخصصة، الخوارزميات، أو التحقق).

مثال: استخراج النص من اللوحات الماسح الضوئي أو المصورة

Aspose.OCR.Metered metered = new Aspose.OCR.Metered();
metered.SetMeteredKey("PublicKey", "PrivateKey");

// Initialize recognition engine
Aspose.OCR.AsposeOcr recognitionEngine = new Aspose.OCR.AsposeOcr();

// Add images to OcrInput object
Aspose.OCR.OcrInput input = new Aspose.OCR.OcrInput(Aspose.OCR.InputType.SingleImage);
input.Add("source1.png");
input.Add("source2.jpg");

// Configure recognition settings for tables
Aspose.OCR.RecognitionSettings recognitionSettings = new Aspose.OCR.RecognitionSettings();
recognitionSettings.DetectAreasMode = DetectAreasMode.TABLE;

// Recognize table text
List<Aspose.OCR.RecognitionResult> results = recognitionEngine.Recognize(input, recognitionSettings);
foreach (Aspose.OCR.RecognitionResult result in results)
{
    Console.WriteLine(result.RecognitionText);
}

// Save results
results[0].Save("result.txt", Aspose.OCR.SaveFormat.Text);
Aspose.OCR.AsposeOcr.SaveMultipageDocument("result.pdf", Aspose.OCR.SaveFormat.Pdf, results);

حالات الاستخدام المشترك

  • استخراج البيانات المنظمة من التقارير المالية.
  • تحويل النماذج والتطبيقات التي تم فحصها إلى لوحات.
  • تلقائيًا مهام إدخال البيانات عن طريق تحويل صور الجدول إلى تنسيقات قابلة للتعديل.

نصائح وأفضل الممارسات

  • استخدم الصور مع 300 DPI على الأقل والتباين الجيد للحصول على أفضل النتائج.
  • قبل زراعة أو تخفيف الصور لعزل مناطق الطاولة.
  • تحميل حزم اللغة اللازمة فقط للحد من استخدام الذاكرة.
  • ضع حدود الثقة لتوازن الدقة والتذكير.
  • تأكيد اللوحات التي تم إعادة بناءها مقابل المخططات المتوقعة قبل استيرادها إلى قواعد البيانات.

من خلال اتباع هذه المبادئ التوجيهية والاستفادة من قدراتها في التعرف على الجدول ، توفر Aspose.OCR Table to Text for .NET للمطورين حلًا موثوق به لتحويل اللوحات المسجلة إلى نص منظم ويمكن تحريرها وسهولة البحث.

 عربي