Aspose.OCR ใบแจ้งหนี้เป็นข้อความสำหรับ .NET
Aspose.OCR Invoice to Text for .NET เป็นปลั๊กอินพิเศษที่ออกแบบมาเพื่อปรับปรุงการสกัดของข้อความโครงสร้างจากบัญชีที่สแกนหรือถ่ายภาพ โดยอัตโนมัติขั้นตอนหลัก - การประมวลผลก่อนภาพการวิเคราะห์การตั้งค่าและ OCR - คุณสามารถจัดเก็บข้อมูลที่เกิดขึ้นโดยตรงไปยังระบบการบัญชีฐานข้อมูลหรือแพลตฟอร์มการชําระเงินโดยไม่มีการพิมพ์ใหม่ด้วยตนเอง ปลัจอินจะนํามาใช้กับคอร์รี่ OCR ที่มีคุณภาพสูงเดียวกันกับ Asposa.ocR, ที่เพิ่มประสิทธิภาพสําหรับการจัดวางบัญชีตารางและคู่ค่าหลัก คุณจะลดเวลาการดําเนินการลดความผิดพลาดของมนุษย์และได้รับผลลัพธ์ที่มั่นคงและแม่นยําในระดับ.
การติดตั้งและการตั้งค่า
ทําตามขั้นตอนต่อไปนี้เพื่อเพิ่ม Aspose.OCR Invoice to Text for .NET ไปยังโครงการของคุณ:
- ติดตั้งผ่าน NuGet หรือดาวน์โหลดแพคเกจจากเซิร์ฟเวอร์ Aspose สําหรับคําแนะนํารายละเอียดด การติดตั้ง .
- การตั้งค่าใบอนุญาตที่วัดในโปรแกรมเริ่มต้นเพื่อหลีกเลี่ยงข้อ จํากัด การประเมิน ด การให้ใบอนุญาตที่มีการวัด .
ตัวอย่าง: การยอมรับบัญช
Aspose.OCR.Metered metered = new Aspose.OCR.Metered();
metered.SetMeteredKey("PublicKey", "PrivateKey");
// Initialize OCR engine
Aspose.OCR.AsposeOcr recognitionEngine = new Aspose.OCR.AsposeOcr();
// Add images to OcrInput object
Aspose.OCR.OcrInput input = new Aspose.OCR.OcrInput(Aspose.OCR.InputType.SingleImage);
input.Add("invoice1.png");
input.Add("invoice2.jpg");
// Configure recognition settings
Aspose.OCR.InvoiceRecognitionSettings recognitionSettings = new Aspose.OCR.InvoiceRecognitionSettings();
recognitionSettings.Language = Aspose.OCR.Language.Latin;
// Perform invoice recognition
List<Aspose.OCR.RecognitionResult> results = recognitionEngine.RecognizeInvoice(input, recognitionSettings);
foreach (Aspose.OCR.RecognitionResult result in results)
{
Console.WriteLine(result.RecognitionText);
}
// Save results
results[0].Save("invoice_result.txt", Aspose.OCR.SaveFormat.Text);
Aspose.OCR.AsposeOcr.SaveMultipageDocument("invoice_result.pdf", Aspose.OCR.SaveFormat.Pdf, results);คุณสมบัติและฟังก์ชั่น
เครื่องยนต์ OCR ข้อมูลจําเพาะ
- รูปแบบการรับรู้ที่กําหนดเองสําหรับบัญชีพิมพ์และถ่ายภาพ.
- ความต้านทานสูงต่อความละเอียดที่แตกต่างกันระดับเสียงและมุมสกปรก.
- การยอมรับหลายภาษาและรูปแบบดิจิตอลภายในเอกสารเดียวกัน.
Image Preprocessing & การปรับปรุง
- ตัวกรองอัตโนมัติการปลดล็อคและไบนารีเพื่อเพิ่มความสามารถในการอ่าน.
- ขอบเขตการปรับแต่งที่รักษาเส้นด้ายและตาราง.
- การปรับความสว่างและความต้านทานในการจัดการการสแกนภายใต้หรือภายนอก.
Layout การวิเคราะห์และการตรวจจับตาราง
- การระบุอัตโนมัติของหัว, footer, แผ่นรายการเส้นและบล็อกสรุป.
- การรับรู้ของสายรัดคอลัมน์และขอบเซลล์แม้ว่าสายการควบคุมจะอ่อนแอหรือหายไป.
- สารสกัดของตารางที่กําหนดเอง (เช่นหัวข้อภายใต้รายการเส้นแม).
คู่สกัดความสําคัญ
- รูปแบบที่กําหนดเองสําหรับชื่อสนามแผนที่ (เช่น “หมายเลขบัญชี”, “ Total Due”) สําหรับผล OCR.
- สนับสนุนแท็กแบบไดนามิก - การตรวจจับความใกล้ชิดของข้อความแทนที่จะตรงกับรูปแบบที่เข้มงวด.
- การคะแนนความไว้วางใจตามฟิลด์ซึ่งช่วยให้คุณสามารถกรองหรือรีไซเคิลรายการที่เชื่อถือได้ต่ํา.
การส่งออกและการรวมกัน
- รูปแบบการส่งออก: หมายเลข JSON, XML, PDF, Word หรือ HTML.
- Event hooks เพื่อ intercept วัตถุดิบ OCR ผลก่อนการ serialization.
- รองรับการประมวลผลแบตช์พร้อมการควบคุมการสอดคล้องสําหรับการโหลดงานปริมาณสูง.
การจัดการข้อผิดพลาดและการเข้าสู่ระบบ
- รายละเอียดข้อความยกเว้นสําหรับโหมดความล้มเหลวทั่วไป (เช่นรูปแบบภาพที่ไม่ได้สนับสนุนปัญหาใบอนุญาต).
- อินเตอร์เฟซการเข้าสู่ระบบแบบบูรณาการที่รองรับ frameworks .NET ที่นิยม (Serilog NLog, log4net).
- นโยบายการยกเลิกสําหรับข้อผิดพลาดผ่านระหว่างไฟล์ I/O หรือการกําหนดค่าหน่วยความจํา.
เคล็ดลับและการปฏิบัติที่ดีที่สุด
- ความละเอียดภาพที่ได้รับการรับรองก่อน: สําหรับความแม่นยํา OCR ที่ดีที่สุดให้ภาพเข้าถึงหรือสูงกว่า 300 DPI.
- ใช้รูปภาพสีเทาหรือสี - อินพุตไบนารีเท่านั้นอาจสูญเสียเส้นตารางที่สวยงาม.
- ตัดข้อ จํากัด ความน่าเชื่อถือตามคุณภาพของข้อมูลของคุณ ข้อ จํากัด ที่ต่ํากว่าจะจับข้อมูลมากขึ้น แต่อาจจําเป็นต้องมีการยืนยันด้านล่าง.
- สําหรับชุดขนาดใหญ่มากตรวจสอบการใช้งานของหน่วยความจําและปรับตัวผ่านตัวเลือกการประมวลผลของปลั๊กอิน.
- ปลั๊กฟังก์ชั่นตัวอย่างค่าหลักเพื่อแช่แข็งการจัดตั้งบัญชีที่คาดหวัง สําหรับการตั้งค่าที่ไม่คุ้นเคยกลับไปที่การตรวจจับตารางทั่วไป.
- มักจะเริ่มต้นการใบอนุญาตมาตรฐานก่อนที่จะเรียกใช้วิธีการ OCR เพื่อหลีกเลี่ยงการประเมินโหมดน้ํา.
โดยการปฏิบัติตามคําแนะนําเหล่านี้และใช้ประโยชน์จากความสามารถในการตั้งค่าบัญชี Aspose.OCR Invoice to Text for .NET ช่วยให้คุณสามารถสร้างท่อการประมวลผลเอกสารที่เชื่อถือได้และสิ้นสุด - การลดความพยายามด้วยตนเองและเพิ่มประสิทธิภาพการผ่าน.