ASPOSE.OCR-faktura til tekst for .NET
Aspose.OCR Invoice to Text for .NET er et specialiseret plug-in designet til at rationalisere udvinding af struktureret tekst fra scannede eller fotograferede fakturaer. Ved at automatisere nøgle trin - billedforarbejdning, layout analyse og OCR - du kan fodre de resulterende data direkte til regnskabssystemer, databaser eller betalingsplatforme uden manuel re-typing. Plugin leverer den samme højkvalitets OCC-kern som Asposa.ocR, optimeret til fakturelager, tabeller og nøglepare. Du vil reducere behandlingstiden, minimere menneskelige fejl, og få konsekvent, nøjagtige resultater i skalaen.
Installation og installation
Følg disse trin for at tilføje Aspose.OCR Invoice til Text for .NET til dit projekt:
- Installere via NuGet eller downloade pakken fra Aspose servere. for detaljerede instruktioner, se Installation .
- Konfigurer målt licens på ansøgningsstart for at undgå evalueringsbegrænsninger Målt licens .
Eksempel: Anerkendelse af fakturaer
Aspose.OCR.Metered metered = new Aspose.OCR.Metered();
metered.SetMeteredKey("PublicKey", "PrivateKey");
// Initialize OCR engine
Aspose.OCR.AsposeOcr recognitionEngine = new Aspose.OCR.AsposeOcr();
// Add images to OcrInput object
Aspose.OCR.OcrInput input = new Aspose.OCR.OcrInput(Aspose.OCR.InputType.SingleImage);
input.Add("invoice1.png");
input.Add("invoice2.jpg");
// Configure recognition settings
Aspose.OCR.InvoiceRecognitionSettings recognitionSettings = new Aspose.OCR.InvoiceRecognitionSettings();
recognitionSettings.Language = Aspose.OCR.Language.Latin;
// Perform invoice recognition
List<Aspose.OCR.RecognitionResult> results = recognitionEngine.RecognizeInvoice(input, recognitionSettings);
foreach (Aspose.OCR.RecognitionResult result in results)
{
Console.WriteLine(result.RecognitionText);
}
// Save results
results[0].Save("invoice_result.txt", Aspose.OCR.SaveFormat.Text);
Aspose.OCR.AsposeOcr.SaveMultipageDocument("invoice_result.pdf", Aspose.OCR.SaveFormat.Pdf, results);Funktioner og funktioner
Forespecifik OCR-motor
- Tilpassede genkendelsesmodeller til trykte og fotograferede fakturaer.
- Høj tolerance for forskellige opløsninger, støjniveauer og skæv hjørner.
- anerkendelse af flere sprog og digitale stilarter i samme dokument.
Forarbejdning og forbedring af billedet
- Automatisk afgrænsning, avgrænse og binarisering filtre for at forbedre læsbarhed.
- Adaptive grænser, der bevarer fakturelinjer og bordgrænser.
- Lys og kontrastjusteringer til at håndtere under- eller over-eksposerede scanninger.
Layout analyse og tabeldetektion
- Automatisk identifikation af header, footer, linje elementer tabel, og sammendrag blokke.
- Anerkendelse af rader, kolonner og cellegrænser, selv når dominerende linjer er svage eller mangler.
- Ekstraktion af nestede tabeller (f.eks. underelementer under et element i en moderstier).
Nøgleværdi par ekstraktion
- Konfigurerbare maler til mappefeltnavn (f.eks. “Faktnummer”, “Total Due”) til OCR resultater.
- Støtte for dynamiske etiketter – detekterer tekstnærhed i stedet for strenge template matching.
- Tillid scoring pr. felt, der giver dig mulighed for at filtrere eller reproducere elementer med lav tillid.
Eksport og integration
- Udgangsformater: klar tekst, JSON, XML, PDF, Word eller HTML.
- Event hooks til at interceptere rå OCR resultater før serialisering.
- Batch-behandlingsstøtte med parallelmæssige kontroller for høj volumen arbejdsbelastning.
Fejlbehandling og logging
- detaljerede undtagelsesmeddelelser til almindelige fejlmoder (f.eks. ustøttet billedformat, licensproblemer).
- Indbygget logggrænseflade, der er kompatibel med populære .NET-loggrammer (Serilog, NLog og log4net).
- Returpolitikker for overgangsfejl under fil I/O eller hukommelsesfordeling.
Tips og bedste praksis
- Forvaltet billedopløsning: For den bedste OCR nøjagtighed, leverer du billeder på eller over 300 DPI.
- Brug grayscale eller farvede billeder – kun binære indtægter kan miste fine bordlinjer.
- Tænk tillidsgrænserne i henhold til din datakvalitet; lavere grænser fanger flere data, men kan kræve downstream validering.
- For meget store partier overvåger du hukommelsesbruget og justerer parallellen via plug-ins behandlingsmuligheder.
- Levering af nøgle-værdi template-funktionen til at fryse forventede fakturaudstillinger; for ukendte layouter, falder tilbage på generisk tabeldetektion.
- Altid initialisere Metered Licensing, før du opfordrer til enhver OCR-metode for at undgå evalueringsmodus vandmærker.
Ved at følge disse retningslinjer og udnytte dens faktura-centriske kapaciteter, Aspose.OCR Invoice to Text for .NET giver dig mulighed for at opbygge pålidelige, end-to-end dokumentbehandlingsrør - minimere manuel anstrengelse og maksimere gennemsnit.