ASPOSE.OCR .NET के लिए पाठ में बिल
Aspose.OCR Invoice to Text for .NET एक विशेष प्लगइन है जो स्कैन किए गए या चित्रित बिलों से संरचित पाठ के निष्कर्षण को सरल बनाने के लिए डिज़ाइन किया गया है. कुंजी चरणों को स्वचालित करके – छवि प्री-प्रसंस्करण, लेआउट विश्लेषण, और OCR – आप परिणामस्वरूप डेटा को सीधे लेखा प्रणालियों, डाटाबेस, या भुगतान प्लेटफार्मों में भंडारण कर सकते हैं, बिना मैन्युअल पुन: टाइपिंग क.
स्थापना और स्थापन
निम्नलिखित चरणों का पालन करें और अपने परियोजना में .NET के लिए पाठ में Aspose.OCR Invoice जोड:
- NuGet के माध्यम से स्थापित करें या Aspose सर्वर से पैकेज डाउनलोड करें. विस्तृत निर्देशों के लिए, देख Installation .
- मूल्यांकन सीमाओं से बचने के लिए एप्लिकेशन स्टार्टअप पर माप लाइसेंस सेट करें. देख मेट्रिक लाइसेंस .
उदाहरण: बिलों की पहचान
Aspose.OCR.Metered metered = new Aspose.OCR.Metered();
metered.SetMeteredKey("PublicKey", "PrivateKey");
// Initialize OCR engine
Aspose.OCR.AsposeOcr recognitionEngine = new Aspose.OCR.AsposeOcr();
// Add images to OcrInput object
Aspose.OCR.OcrInput input = new Aspose.OCR.OcrInput(Aspose.OCR.InputType.SingleImage);
input.Add("invoice1.png");
input.Add("invoice2.jpg");
// Configure recognition settings
Aspose.OCR.InvoiceRecognitionSettings recognitionSettings = new Aspose.OCR.InvoiceRecognitionSettings();
recognitionSettings.Language = Aspose.OCR.Language.Latin;
// Perform invoice recognition
List<Aspose.OCR.RecognitionResult> results = recognitionEngine.RecognizeInvoice(input, recognitionSettings);
foreach (Aspose.OCR.RecognitionResult result in results)
{
Console.WriteLine(result.RecognitionText);
}
// Save results
results[0].Save("invoice_result.txt", Aspose.OCR.SaveFormat.Text);
Aspose.OCR.AsposeOcr.SaveMultipageDocument("invoice_result.pdf", Aspose.OCR.SaveFormat.Pdf, results);
विशेषताओं और कार्य
OCR इंजन की विशेषताए
- मुद्रित और चित्रित बिलों के लिए अनुकूलित पहचान मॉडल.
- अलग-अलग रिज़ॉल्यूशन, शोर के स्तर और स्केव कोनों के लिए उच्च सहनशीलत.
- एक ही दस्तावेज़ के भीतर कई भाषाओं और डिजिटल शैलियों की पहचान.
Image Preprocessing और सुधार
- पढ़ने में सुधार करने के लिए स्वचालित डिस्केजिंग, डिस्कले, और बाइनरीकरण फ़िल्टर.
- अनुकूलित सीमा जो बिल लाइनों और तालिका सीमाओं को बनाए रखती ह.
- उज्ज्वलता और विरोधाभास समायोजन नीचे या अति-प्रकट स्कैन को संभालने के लिए.
लेआउट विश्लेषण और टेबल डिटेक्शन
- शीर्षक, फुटर, लाइन आइटम तालिका और सारांश ब्लॉक की स्वचालित पहचान.
- पंक्तियों, स्तंभों और सेल सीमाओं की पहचान, यहां तक कि जब नियंत्रण लाइनों कमजोर या गायब ह.
- नकली तालिकाओं का निष्कर्षण (उदाहरण के लिए, एक माता-पिता लाइन आइटम के नीचे उप-वस्तुओ).
कुंजी मूल्य जोड़ी निष्कर्षण
- मानचित्र फ़ील्ड नामों (उदाहरण के लिए, “फॉक्स नंबर”, “Total Due”) पर सेटअप योग्य टेम्पलेट OCR परिणाम.
- गतिशील लेबल का समर्थन – कठोर टेम्पलेट फिट होने के बजाय पाठ निकटता का पता लगाता ह.
- विश्वसनीयता स्कोर फ़ील्ड के आधार पर, आपको कम भरोसेमंद वस्तुओं को फ़िल्टर या पुनरावृत्ति करने की अनुमति देता ह.
निर्यात और एकीकरण
- आउटपुट प्रारूप: सीधे पाठ, JSON, XML, PDF, Word, या HTML.
- घटनाओं को सीरियलकरण से पहले कच्चे OCR परिणामों को अवरुद्ध करने के लिए प्रेरित किया जाता ह.
- बैच प्रसंस्करण समर्थन उच्च वॉल्यूम कार्य भार के लिए समानांतरता नियंत्रण के साथ.
त्रुटि प्रबंधन और लॉगिंग
- सामान्य विफलता मोड के लिए विस्तृत अपवाद संदेश (जैसे, असहाय छवि प्रारूप, लाइसेंस समस्याए).
- NET लॉगिंग फ्रेमवर्क (Serilog, NLog और log4net) के साथ संगत ह).
- फ़ाइल I/O या स्मृति आवंटन के दौरान पारगमन त्रुटियों के लिए वापसी नीतिय.
टिप्स और सर्वश्रेष्ठ अभ्यास
- प्रारंभिक मान्य छवि रिज़ॉल्यूशन: सर्वोत्तम ओसीआर सटीकता के लिए, 300 डीपीआई पर या उससे अधिक छवियों की आपूर्ति कर.
- ग्रे स्केल या रंग छवियों का उपयोग करें - बाइनरी-केवल इनपुट सुंदर टेबल लाइनों को खो सकते ह.
- अपने डेटा की गुणवत्ता के अनुसार आत्मविश्वास की सीमाओं को ट्यूनिंग करें; कम सीमाएं अधिक जानकारी पकड़ती हैं लेकिन नीचे प्रवाह वैधता की आवश्यकता हो सकती ह.
- बहुत बड़े बैच के लिए, प्लगइन के प्रसंस्करण विकल्पों के माध्यम से स्मृति के उपयोग की निगरानी करें और समानांतरता को समायोजित कर.
- कुंजी-मूल्य टेम्पलेट फ़ंक्शन को फ्रीज करने के लिए अप्रत्याशित बिल डिज़ाइन; अज्ञात डिजाइनों में, जनरल टेबल डिटेक्शन पर वापस आ जाए.
- हमेशा मूल्यांकन मोड पानी के संकेतों से बचने के लिए किसी भी OCR विधियों को बुलाने से पहले मीटर लाइसेंस शुरू कर.
इन दिशानिर्देशों का पालन करके और इसकी बिल-केंद्रित क्षमताओं का लाभ उठाकर, Aspose.OCR Invoice to Text for .NET आपको विश्वसनीय, अंत-दर-अंत दस्तावेज़-प्रसंस्करण पाइपलाइन बनाने में सक्षम बनाता है - मैन्युअल प्रयास को कम करने और पारगमन को अधिकतम करने के लिए.