Aspose.OCR Faktura till Text för .NET
Aspose.OCR Invoice to Text for .NET är en specialplugin som är utformad för att effektivisera utvinning av strukturerad text från skannade eller fotograferade fakturor. Genom att automatisera nyckelsteg – bildpreprocessing, layoutanalys och OCR – kan du leverera de resulterande uppgifterna direkt till redovisningssystem, databaser eller betalningsplattformar utan manuell re-typning. Pluginen levererar samma högkvalitativa oCR kärna som Asposa.ocR, optimerat för faktura layouter, tabeller och nyvärdespar. Du kommer att minska bearbetningstiden, minimera mänskliga fel och få konsekventa, exakta resultat i skala.
Installation och installation
Följ dessa steg för att lägga till Aspose.OCR Invoice till Text för .NET till ditt projekt:
- Installera via NuGet eller ladda ner paketet från Aspose-servrar. för detaljerade instruktioner, se Installation .
- Konfigurera måttlig licens vid applikationsstart för att undvika utvärderingsbegränsningar Mätlicensiering .
Exempel: Identifiera fakturor
Aspose.OCR.Metered metered = new Aspose.OCR.Metered();
metered.SetMeteredKey("PublicKey", "PrivateKey");
// Initialize OCR engine
Aspose.OCR.AsposeOcr recognitionEngine = new Aspose.OCR.AsposeOcr();
// Add images to OcrInput object
Aspose.OCR.OcrInput input = new Aspose.OCR.OcrInput(Aspose.OCR.InputType.SingleImage);
input.Add("invoice1.png");
input.Add("invoice2.jpg");
// Configure recognition settings
Aspose.OCR.InvoiceRecognitionSettings recognitionSettings = new Aspose.OCR.InvoiceRecognitionSettings();
recognitionSettings.Language = Aspose.OCR.Language.Latin;
// Perform invoice recognition
List<Aspose.OCR.RecognitionResult> results = recognitionEngine.RecognizeInvoice(input, recognitionSettings);
foreach (Aspose.OCR.RecognitionResult result in results)
{
Console.WriteLine(result.RecognitionText);
}
// Save results
results[0].Save("invoice_result.txt", Aspose.OCR.SaveFormat.Text);
Aspose.OCR.AsposeOcr.SaveMultipageDocument("invoice_result.pdf", Aspose.OCR.SaveFormat.Pdf, results);Funktioner och funktioner
Faktura-specifik OCR-motor
- Anpassade identifieringsmodeller för tryckta och fotograferade fakturor.
- Hög tolerans för olika upplösningar, bullernivåer och smutsiga vinklar.
- Erkännande av flera språk och digitala stilar inom samma dokument.
Image Preprocessing och förbättring
- Automatisk avskärmning, avskaffning och binariseringsfilter för att förbättra läsbarhet.
- Adaptiv tröskel som bevarar fakturor och tabellgränser.
- Ljus och kontrastjusteringar för att hantera under- eller överexponerade skanningar.
Layout Analys och tabelldetektion
- Automatisk identifiering av header, footer, linjeobjekttabell och sammanfattningsblock.
- Erkännande av rader, kolumner och cellgränser, även när dominerande linjer är svaga eller saknas.
- Utvinning av stängda tabeller (t.ex. underteckningar under en föregångare).
Nyckelvärde Pair Extraction
- Konfigurerbara mallar till kartan fältnamn (t.ex. ”Faktnummer”, ”Total Due”) till OCR-resultat.
- Stöd för dynamiska etiketter – detekterar text närhet snarare än strikt mönster matchning.
- Tillförlitlighetsresultat per fält, vilket gör att du kan filtrera eller reproducera lågförtroende objekt.
Export och integration
- Utgångsformat: platt text, JSON, XML, PDF, Word eller HTML.
- Event hooks för att interceptera rå OCR-resultat före serialisering.
- Batch bearbetningsstöd med parallellstyrning för högvolym arbetsbelastning.
Felhantering och loggning
- Detaljerade undantagsmeddelanden för vanliga misslyckande lägen (t.ex. icke-stödda bildformat, licensfrågor).
- Inbyggd logggränssnitt som är kompatibel med populära .NET-loggram (Serilog, NLog och log4net).
- Återhämta policyer för övergångsfel under fil I/O eller minnesfördelning.
Tips och bästa praxis
- Prevaliderad bildupplösning: För bästa OCR noggrannhet, leverera bilder vid eller över 300 DPI.
- Använd gråskaliga eller färgglada bilder – bara binära inmatningar kan förlora fina bordslinjer.
- Lämna förtroendegränserna i enlighet med datakvaliteten; lägre gränsen fångar mer data men kan kräva nedströmsvalidering.
- För mycket stora partier, övervaka användningen av minnet och justera parallellen via plug-ins bearbetningsalternativ.
- Hämta nyckelvärdesmallfunktionen för att frysa förväntade faktura layouter; för okända layout faller tillbaka på generisk tabelldetektion.
- Alltid initialisera måttlig licens innan du inbjuder några OCR-metoder för att undvika utvärderings-läge vattenmärken.
Genom att följa dessa riktlinjer och utnyttja dess faktura-centriska kapacitet, Aspose.OCR Invoice to Text för .NET gör det möjligt att bygga pålitliga, änd-till-änd dokumentbearbetningskanaler – minimera manuell ansträngning och maximera genomgången.