ASPOSE.OCR-faktura til tekst for .NET

Aspose.OCR Invoice to Text for .NET er et specialiseret plug-in designet til at rationalisere udvinding af struktureret tekst fra scannede eller fotograferede fakturaer. Ved at automatisere nøgle trin - billedforarbejdning, layout analyse og OCR - du kan fodre de resulterende data direkte til regnskabssystemer, databaser eller betalingsplatforme uden manuel re-typing. Plugin leverer den samme højkvalitets OCC-kern som Asposa.ocR, optimeret til fakturelager, tabeller og nøglepare. Du vil reducere behandlingstiden, minimere menneskelige fejl, og få konsekvent, nøjagtige resultater i skalaen.

Installation og installation

Følg disse trin for at tilføje Aspose.OCR Invoice til Text for .NET til dit projekt:

  • Installere via NuGet eller downloade pakken fra Aspose servere. for detaljerede instruktioner, se Installation .
  • Konfigurer målt licens på ansøgningsstart for at undgå evalueringsbegrænsninger Målt licens .

Eksempel: Anerkendelse af fakturaer

Aspose.OCR.Metered metered = new Aspose.OCR.Metered();
metered.SetMeteredKey("PublicKey", "PrivateKey");

// Initialize OCR engine
Aspose.OCR.AsposeOcr recognitionEngine = new Aspose.OCR.AsposeOcr();

// Add images to OcrInput object
Aspose.OCR.OcrInput input = new Aspose.OCR.OcrInput(Aspose.OCR.InputType.SingleImage);
input.Add("invoice1.png");
input.Add("invoice2.jpg");

// Configure recognition settings
Aspose.OCR.InvoiceRecognitionSettings recognitionSettings = new Aspose.OCR.InvoiceRecognitionSettings();
recognitionSettings.Language = Aspose.OCR.Language.Latin;

// Perform invoice recognition
List<Aspose.OCR.RecognitionResult> results = recognitionEngine.RecognizeInvoice(input, recognitionSettings);

foreach (Aspose.OCR.RecognitionResult result in results)
{
    Console.WriteLine(result.RecognitionText);
}

// Save results
results[0].Save("invoice_result.txt", Aspose.OCR.SaveFormat.Text);
Aspose.OCR.AsposeOcr.SaveMultipageDocument("invoice_result.pdf", Aspose.OCR.SaveFormat.Pdf, results);

Funktioner og funktioner

Forespecifik OCR-motor

  • Tilpassede genkendelsesmodeller til trykte og fotograferede fakturaer.
  • Høj tolerance for forskellige opløsninger, støjniveauer og skæv hjørner.
  • anerkendelse af flere sprog og digitale stilarter i samme dokument.

Forarbejdning og forbedring af billedet

  • Automatisk afgrænsning, avgrænse og binarisering filtre for at forbedre læsbarhed.
  • Adaptive grænser, der bevarer fakturelinjer og bordgrænser.
  • Lys og kontrastjusteringer til at håndtere under- eller over-eksposerede scanninger.

Layout analyse og tabeldetektion

  • Automatisk identifikation af header, footer, linje elementer tabel, og sammendrag blokke.
  • Anerkendelse af rader, kolonner og cellegrænser, selv når dominerende linjer er svage eller mangler.
  • Ekstraktion af nestede tabeller (f.eks. underelementer under et element i en moderstier).

Nøgleværdi par ekstraktion

  • Konfigurerbare maler til mappefeltnavn (f.eks. “Faktnummer”, “Total Due”) til OCR resultater.
  • Støtte for dynamiske etiketter – detekterer tekstnærhed i stedet for strenge template matching.
  • Tillid scoring pr. felt, der giver dig mulighed for at filtrere eller reproducere elementer med lav tillid.

Eksport og integration

  • Udgangsformater: klar tekst, JSON, XML, PDF, Word eller HTML.
  • Event hooks til at interceptere rå OCR resultater før serialisering.
  • Batch-behandlingsstøtte med parallelmæssige kontroller for høj volumen arbejdsbelastning.

Fejlbehandling og logging

  • detaljerede undtagelsesmeddelelser til almindelige fejlmoder (f.eks. ustøttet billedformat, licensproblemer).
  • Indbygget logggrænseflade, der er kompatibel med populære .NET-loggrammer (Serilog, NLog og log4net).
  • Returpolitikker for overgangsfejl under fil I/O eller hukommelsesfordeling.

Tips og bedste praksis

  • Forvaltet billedopløsning: For den bedste OCR nøjagtighed, leverer du billeder på eller over 300 DPI.
  • Brug grayscale eller farvede billeder – kun binære indtægter kan miste fine bordlinjer.
  • Tænk tillidsgrænserne i henhold til din datakvalitet; lavere grænser fanger flere data, men kan kræve downstream validering.
  • For meget store partier overvåger du hukommelsesbruget og justerer parallellen via plug-ins behandlingsmuligheder.
  • Levering af nøgle-værdi template-funktionen til at fryse forventede fakturaudstillinger; for ukendte layouter, falder tilbage på generisk tabeldetektion.
  • Altid initialisere Metered Licensing, før du opfordrer til enhver OCR-metode for at undgå evalueringsmodus vandmærker.

Ved at følge disse retningslinjer og udnytte dens faktura-centriske kapaciteter, Aspose.OCR Invoice to Text for .NET giver dig mulighed for at opbygge pålidelige, end-to-end dokumentbehandlingsrør - minimere manuel anstrengelse og maksimere gennemsnit.

 Dansk