Aspose.OCR ตารางเป็นข้อความสำหรับ .NET

Aspose.OCR Table to Text for .NET เป็นปลั๊กอินที่มีประสิทธิภาพที่ช่วยให้ผู้พัฒนาสามารถ استخراجข้อความจากตารางที่สแกนหรือถ่ายภาพด้วยความแม่นยําสูง ใช้อัลกอริทึมการเรียนรู้เครื่องขั้นสูงและเครือข่ายประสาทจะตรวจจับโครงสร้างโต๊ะดึงเนื้อหาระดับเซลล์และจัดระเบียบทุกอย่างเป็นตัวเลือกที่สามารถค้นหาได้สามารถแก้ไขได้หรือกลไกข้อมูลแท็บ.

การติดตั้งและการตั้งค่า

ในการเริ่มต้นติดตั้งแพคเกจ Aspose.OCR Table to Text via NuGet หรือดาวน์โหลดการประกอบจากเซิร์ฟเวอร์ aspose การติดตั้ง คู่มือสําหรับขั้นตอนที่ละเอียด.เปิดใช้งานเต็มรูปแบบโดยการกําหนดค่าใบอนุญาตตามที่อธิบายไว้ใน การให้ใบอนุญาตที่มีการวัด การทําเอกสาร.

คุณสมบัติและฟังก์ชั่น

การตรวจจับตารางและการรับรู้โครงสร้าง

  • จะตรวจจับขอบตารางในภาพสแกนหรือถ่ายภาพโดยอัตโนมัติแม้ว่าเซลล์จะถูกหมุนหรือสว่างไม่เท่าเทียมกัน.
  • รองรับการจัดตั้งหลายรากและหลายคอลัมน์ตารางและขนาดเซลล์ที่แตกต่างกัน.
  • ให้การแสดงตัวอักษรของเส้นและเซลล์สําหรับการประมวลผลหลังที่เรียบง่าย.

หมายเลขรุ่น: Cell Text Extraction

  • การยอมรับข้อความในแต่ละเซลล์โดยใช้อัลกอริทึม OCR แบบขั้นสูงเพื่อรักษาข้อบกพร่องเส้นการ capitalization และการจัดรูปแบบดิจิตอล.
  • การจัดการหลายภาษาในตารางเดียวที่มีความสําคัญทางภาษาที่กําหนดเอง.
  • แก้ไขข้อบกพร่องเช่นสกปรกความแตกต่างต่ําหรือเสียงภาพเพื่อเพิ่มความแม่นยํา.

ตารางการก่อสร้างและการส่งออก

  • สร้าง tables detected ในโครงสร้างข้อมูล .NET (เช่น DataTable) หรือส่งออกไปยังรูปแบบ CSV/TSV.
  • สร้างไฟล์แผ่นบันทึกที่สามารถแก้ไขได้ (XLSX) ซึ่งสามารถเปิดได้ใน Excel หรือเครื่องมืออื่น ๆ.
  • เก็บรูปแบบเซลล์พื้นฐาน (การเชื่อมโยงขอบเขต) และการส่งออกโค้ทสําหรับกระบวนการทํางานขั้นสูง.

ผลที่สามารถค้นหาและแก้ไขได

  • สร้างชั้นข้อความที่สามารถค้นหาได้ใน คู่มือ PDF การส่งออกทําให้เนื้อหาตาราง indexable.
  • การรวมกันอย่างราบรื่นกับ Aspose.Cells สําหรับการดําเนินงานขั้นสูงเช่นสูตรและแผนท.
  • ช่วยให้เนื้อหาที่สกัดเข้าสู่ฐานข้อมูลหรือท่อการประมวลผลต่ํา.

ประสิทธิภาพและการสแกน

  • เหมาะสําหรับการประมวลผลชุดของชุดข้อมูลขนาดใหญ่พร้อมการกําหนดค่าและการจัดการหน่วยความจํา.
  • กระแสข้อมูลภาพโดยตรงไปยังมอเตอร์ OCR, minimizing disk I / O.
  • ให้การเรียกคืนขั้นสูงและ tokens การยกเลิกสําหรับการดําเนินงานระยะยาว.

การปรับแต่งขั้นสูง

  • สนับสนุน ROI เพื่อ จํากัด การตรวจจับไปยังพื้นที่ที่เฉพาะเจาะจงเพื่อการประมวลผลอย่างรวดเร็ว.
  • ข้อ จํากัด ความน่าเชื่อถือที่กําหนดเองเพื่อกรองผลลัพธ์ที่มีความไว้วางใจต่ํา.
  • Hooks สําหรับการประมวลผลก่อนและหลัง (ตัวกรองที่กําหนดเอง algorithms หรือ validators).

ตัวอย่าง: สารสกัดข้อความจากตารางสแกนหรือถ่ายภาพ

Aspose.OCR.Metered metered = new Aspose.OCR.Metered();
metered.SetMeteredKey("PublicKey", "PrivateKey");

// Initialize recognition engine
Aspose.OCR.AsposeOcr recognitionEngine = new Aspose.OCR.AsposeOcr();

// Add images to OcrInput object
Aspose.OCR.OcrInput input = new Aspose.OCR.OcrInput(Aspose.OCR.InputType.SingleImage);
input.Add("source1.png");
input.Add("source2.jpg");

// Configure recognition settings for tables
Aspose.OCR.RecognitionSettings recognitionSettings = new Aspose.OCR.RecognitionSettings();
recognitionSettings.DetectAreasMode = DetectAreasMode.TABLE;

// Recognize table text
List<Aspose.OCR.RecognitionResult> results = recognitionEngine.Recognize(input, recognitionSettings);
foreach (Aspose.OCR.RecognitionResult result in results)
{
    Console.WriteLine(result.RecognitionText);
}

// Save results
results[0].Save("result.txt", Aspose.OCR.SaveFormat.Text);
Aspose.OCR.AsposeOcr.SaveMultipageDocument("result.pdf", Aspose.OCR.SaveFormat.Pdf, results);

กรณีการใช้งานทั่วไป

  • การสกัดข้อมูลโครงสร้างจากรายงานทางการเงิน.
  • การแปลงแบบฟอร์มและแอพพลิเคชันที่สแกนเป็นแผ่นสเปรย.
  • การอัตโนมัติของงานเข้าข้อมูลโดยการแปลงภาพตารางเป็นรูปแบบที่สามารถแก้ไขได.

เคล็ดลับและการปฏิบัติที่ดีที่สุด

  • ใช้ภาพที่มีขนาด 300 DPI และ contrast ที่ดีที่สุดสําหรับผลลัพธ์ที่ดีที่สุด.
  • Pre-crop หรือ deskew ภาพเพื่อแยกพื้นที่ตาราง.
  • ดาวน์โหลดแพคเกจภาษาที่จําเป็นเท่านั้นเพื่อลดการใช้หน่วยความจํา.
  • ปลั๊กข้อ จํากัด ความมั่นใจเพื่อสมดุลความแม่นยําและความจํา.
  • การยืนยันตารางที่สร้างใหม่กับแผนที่คาดหวังก่อนที่จะนําเข้าไปยังฐานข้อมูล.

โดยการปฏิบัติตามคําแนะนําเหล่านี้และใช้ประโยชน์จากความสามารถในการรับรู้ตาราง Aspose.OCR Table to Text for .NET ให้ผู้พัฒนาโซลูชันที่เชื่อถือได้สําหรับการแปลงแท็บที่สแกนเป็นข้อความที่โครงสร้างแก้ไขและสามารถค้นหาได.

 แบบไทย