Aspose.OCR ตารางเป็นข้อความสำหรับ .NET
Aspose.OCR Table to Text for .NET เป็นปลั๊กอินที่มีประสิทธิภาพที่ช่วยให้ผู้พัฒนาสามารถ استخراجข้อความจากตารางที่สแกนหรือถ่ายภาพด้วยความแม่นยําสูง ใช้อัลกอริทึมการเรียนรู้เครื่องขั้นสูงและเครือข่ายประสาทจะตรวจจับโครงสร้างโต๊ะดึงเนื้อหาระดับเซลล์และจัดระเบียบทุกอย่างเป็นตัวเลือกที่สามารถค้นหาได้สามารถแก้ไขได้หรือกลไกข้อมูลแท็บ.
การติดตั้งและการตั้งค่า
ในการเริ่มต้นติดตั้งแพคเกจ Aspose.OCR Table to Text via NuGet หรือดาวน์โหลดการประกอบจากเซิร์ฟเวอร์ aspose การติดตั้ง คู่มือสําหรับขั้นตอนที่ละเอียด.เปิดใช้งานเต็มรูปแบบโดยการกําหนดค่าใบอนุญาตตามที่อธิบายไว้ใน การให้ใบอนุญาตที่มีการวัด การทําเอกสาร.
คุณสมบัติและฟังก์ชั่น
การตรวจจับตารางและการรับรู้โครงสร้าง
- จะตรวจจับขอบตารางในภาพสแกนหรือถ่ายภาพโดยอัตโนมัติแม้ว่าเซลล์จะถูกหมุนหรือสว่างไม่เท่าเทียมกัน.
- รองรับการจัดตั้งหลายรากและหลายคอลัมน์ตารางและขนาดเซลล์ที่แตกต่างกัน.
- ให้การแสดงตัวอักษรของเส้นและเซลล์สําหรับการประมวลผลหลังที่เรียบง่าย.
หมายเลขรุ่น: Cell Text Extraction
- การยอมรับข้อความในแต่ละเซลล์โดยใช้อัลกอริทึม OCR แบบขั้นสูงเพื่อรักษาข้อบกพร่องเส้นการ capitalization และการจัดรูปแบบดิจิตอล.
- การจัดการหลายภาษาในตารางเดียวที่มีความสําคัญทางภาษาที่กําหนดเอง.
- แก้ไขข้อบกพร่องเช่นสกปรกความแตกต่างต่ําหรือเสียงภาพเพื่อเพิ่มความแม่นยํา.
ตารางการก่อสร้างและการส่งออก
- สร้าง tables detected ในโครงสร้างข้อมูล .NET (เช่น DataTable) หรือส่งออกไปยังรูปแบบ CSV/TSV.
- สร้างไฟล์แผ่นบันทึกที่สามารถแก้ไขได้ (XLSX) ซึ่งสามารถเปิดได้ใน Excel หรือเครื่องมืออื่น ๆ.
- เก็บรูปแบบเซลล์พื้นฐาน (การเชื่อมโยงขอบเขต) และการส่งออกโค้ทสําหรับกระบวนการทํางานขั้นสูง.
ผลที่สามารถค้นหาและแก้ไขได
- สร้างชั้นข้อความที่สามารถค้นหาได้ใน คู่มือ PDF การส่งออกทําให้เนื้อหาตาราง indexable.
- การรวมกันอย่างราบรื่นกับ Aspose.Cells สําหรับการดําเนินงานขั้นสูงเช่นสูตรและแผนท.
- ช่วยให้เนื้อหาที่สกัดเข้าสู่ฐานข้อมูลหรือท่อการประมวลผลต่ํา.
ประสิทธิภาพและการสแกน
- เหมาะสําหรับการประมวลผลชุดของชุดข้อมูลขนาดใหญ่พร้อมการกําหนดค่าและการจัดการหน่วยความจํา.
- กระแสข้อมูลภาพโดยตรงไปยังมอเตอร์ OCR, minimizing disk I / O.
- ให้การเรียกคืนขั้นสูงและ tokens การยกเลิกสําหรับการดําเนินงานระยะยาว.
การปรับแต่งขั้นสูง
- สนับสนุน ROI เพื่อ จํากัด การตรวจจับไปยังพื้นที่ที่เฉพาะเจาะจงเพื่อการประมวลผลอย่างรวดเร็ว.
- ข้อ จํากัด ความน่าเชื่อถือที่กําหนดเองเพื่อกรองผลลัพธ์ที่มีความไว้วางใจต่ํา.
- Hooks สําหรับการประมวลผลก่อนและหลัง (ตัวกรองที่กําหนดเอง algorithms หรือ validators).
ตัวอย่าง: สารสกัดข้อความจากตารางสแกนหรือถ่ายภาพ
Aspose.OCR.Metered metered = new Aspose.OCR.Metered();
metered.SetMeteredKey("PublicKey", "PrivateKey");
// Initialize recognition engine
Aspose.OCR.AsposeOcr recognitionEngine = new Aspose.OCR.AsposeOcr();
// Add images to OcrInput object
Aspose.OCR.OcrInput input = new Aspose.OCR.OcrInput(Aspose.OCR.InputType.SingleImage);
input.Add("source1.png");
input.Add("source2.jpg");
// Configure recognition settings for tables
Aspose.OCR.RecognitionSettings recognitionSettings = new Aspose.OCR.RecognitionSettings();
recognitionSettings.DetectAreasMode = DetectAreasMode.TABLE;
// Recognize table text
List<Aspose.OCR.RecognitionResult> results = recognitionEngine.Recognize(input, recognitionSettings);
foreach (Aspose.OCR.RecognitionResult result in results)
{
Console.WriteLine(result.RecognitionText);
}
// Save results
results[0].Save("result.txt", Aspose.OCR.SaveFormat.Text);
Aspose.OCR.AsposeOcr.SaveMultipageDocument("result.pdf", Aspose.OCR.SaveFormat.Pdf, results);
กรณีการใช้งานทั่วไป
- การสกัดข้อมูลโครงสร้างจากรายงานทางการเงิน.
- การแปลงแบบฟอร์มและแอพพลิเคชันที่สแกนเป็นแผ่นสเปรย.
- การอัตโนมัติของงานเข้าข้อมูลโดยการแปลงภาพตารางเป็นรูปแบบที่สามารถแก้ไขได.
เคล็ดลับและการปฏิบัติที่ดีที่สุด
- ใช้ภาพที่มีขนาด 300 DPI และ contrast ที่ดีที่สุดสําหรับผลลัพธ์ที่ดีที่สุด.
- Pre-crop หรือ deskew ภาพเพื่อแยกพื้นที่ตาราง.
- ดาวน์โหลดแพคเกจภาษาที่จําเป็นเท่านั้นเพื่อลดการใช้หน่วยความจํา.
- ปลั๊กข้อ จํากัด ความมั่นใจเพื่อสมดุลความแม่นยําและความจํา.
- การยืนยันตารางที่สร้างใหม่กับแผนที่คาดหวังก่อนที่จะนําเข้าไปยังฐานข้อมูล.
โดยการปฏิบัติตามคําแนะนําเหล่านี้และใช้ประโยชน์จากความสามารถในการรับรู้ตาราง Aspose.OCR Table to Text for .NET ให้ผู้พัฒนาโซลูชันที่เชื่อถือได้สําหรับการแปลงแท็บที่สแกนเป็นข้อความที่โครงสร้างแก้ไขและสามารถค้นหาได.