Aspose.OCR Invoeren naar tekst voor .NET
Aspose.OCR Invoice to Text voor .NET is een gespecialiseerde plug-in ontworpen om de extractie van gestructureerde tekst uit gescannelde of gefotografeerde facturen te vergemakkelijken. Door het automatiseren van de belangrijkste stappen – beeldpreprocessing, layout analyse en OCR – kunt u de resulterende gegevens rechtstreeks in accountingssystemen, databases, of betalingsplatforms voeren zonder handmatige re-typing. De plugin levert dezelfde hoogwaardige oCR-core als Asposa.ocR, geoptimaliseerd voor factuurlijsten, tabellen en sleutelwaardeparen. U zult de verwerkingstijd verminderen, menselijke fouten minimaliseren en consistente, nauwkeurige resultaten op schaal verkrijgen.
Installatie en Setup
Volg deze stappen om Aspose.OCR Invoice in Text voor .NET toe te voegen aan uw project:
- Installeer via NuGet of download het pakket van de servers van Aspose. voor gedetailleerde instructies, zie Installatie .
- Configureer gemeten licentie bij de applicatie start-up om beoordelingsbeperkingen te voorkomen gemeten licentie .
Voorbeeld: Herkenning van facturen
Aspose.OCR.Metered metered = new Aspose.OCR.Metered();
metered.SetMeteredKey("PublicKey", "PrivateKey");
// Initialize OCR engine
Aspose.OCR.AsposeOcr recognitionEngine = new Aspose.OCR.AsposeOcr();
// Add images to OcrInput object
Aspose.OCR.OcrInput input = new Aspose.OCR.OcrInput(Aspose.OCR.InputType.SingleImage);
input.Add("invoice1.png");
input.Add("invoice2.jpg");
// Configure recognition settings
Aspose.OCR.InvoiceRecognitionSettings recognitionSettings = new Aspose.OCR.InvoiceRecognitionSettings();
recognitionSettings.Language = Aspose.OCR.Language.Latin;
// Perform invoice recognition
List<Aspose.OCR.RecognitionResult> results = recognitionEngine.RecognizeInvoice(input, recognitionSettings);
foreach (Aspose.OCR.RecognitionResult result in results)
{
Console.WriteLine(result.RecognitionText);
}
// Save results
results[0].Save("invoice_result.txt", Aspose.OCR.SaveFormat.Text);
Aspose.OCR.AsposeOcr.SaveMultipageDocument("invoice_result.pdf", Aspose.OCR.SaveFormat.Pdf, results);Features en functionaliteiten
OCR-specifieke factuurmotor
- aangepaste erkenningsmodellen voor gedrukte en gefotografeerde facturen.
- Hoge tolerantie voor verschillende resoluties, geluidsniveaus en schuimhoeken.
- Herkenning van meerdere talen en digitale stijlen binnen hetzelfde document.
Image Preprocessing & Verbetering
- Automatische ontkopping, afdekking en binarisatie filters om de leesbaarheid te verbeteren.
- Adaptieve drempel die de factuurlijnen en tafelgrenzen behoudt.
- Brightness en contrast aanpassingen om onder- of over-exposite scans te beheren.
Layout analyse en tabeldetectie
- Automatische identificatie van header, footer, lijn items tabel en samenvatting blokken.
- Herkenning van lijnen, kolommen en celgrenzen, zelfs wanneer de bestuurslijnen zwak zijn of ontbreken.
- Extractie van gebogen tabellen (bijvoorbeeld sub-elementen onder een moederlijn item).
Hoofdwaarde Pair Extractie
- Configurable templates to map field names (bv. “Invoice Number”, “Total Due”) to OCR resultaten.
- Ondersteuning voor dynamische etiketten – detecteert tekst nabijheid in plaats van strikte template matching.
- Vertrouwensscore per veld, waardoor u elementen met lage vertrouwen kunt filteren of reproduceren.
Export & Integratie
- Uitgangsformaten: plain text, JSON, XML, PDF, Word of HTML.
- Event hooks om grondige OCR-resultaten vóór serialisatie te intercepteren.
- Batch verwerkingsondersteuning met parallelistische controles voor hoge volume werkbelasting.
Foutbehandeling & Logging
- Gedetailleerde uitzonderingsberichten voor gemeenschappelijke mislukkingsmodus (bv. niet-ondersteunde beeldformaat, licentieproblemen).
- Gebouwde logging-interface compatibel met populaire .NET-logging frameworks (Serilog, NLog en log4net).
- Verwijder beleid voor overgangsfouten tijdens bestand I/O of geheugenallocatie.
Tips en beste praktijken
- Pre-valideerde beeldresolutie: voor de beste OCR nauwkeurigheid, leveren we afbeeldingen bij of boven 300 DPI.
- Gebruik grijze of kleurrijke afbeeldingen – alleen binaire inputs kunnen fijne tafellijnen verliezen.
- Tune vertrouwensgrenzen volgens de kwaliteit van uw gegevens; lagere grenzen vangen meer gegevens, maar kunnen een downstream validatie vereisen.
- Voor zeer grote sets, monitor het geheugengebruik en aanpassen van paralleliteit via de verwerkingsopties van de plug-in.
- Verwijder de sleutel-waarde template-functie om verwachte factuurplannen te bevriezen; voor onbekende plannen, valt terug op generische tabeldetectie.
- Start altijd metereerde licentie voordat u OCR-methoden aanwijst om te voorkomen dat de beoordelingsmodus watermarker is.
Door deze richtsnoeren te volgen en gebruik te maken van de factuur-centrische capaciteiten, Aspose.OCR Invoice to Text for .NET stelt u in staat om betrouwbare, end-to-end documentverwerkingspijpen te bouwen – het minimaliseren van handmatige inspanning en het maximalisëren van doorvoer.