Aspose.OCR Invoice til tekst for .NET

Aspose.OCR Invoice to Text for .NET er en spesialisert plug-in designet for å effektivisere utvinning av strukturert tekst fra skannede eller fotograferte fakturaer. Ved å automatisere nøkkelsteg - bildeforbehandling, layout analyse, og OCR - du kan lagre de resulterende data direkte til regnskapssystemer, databaser eller betalingsplattformer uten manuell re-typing.

Installasjon og installasjon

Følg disse trinnene for å legge til Aspose.OCR Invoice til Text for .NET til prosjektet ditt:

  • Installere via NuGet eller laste ned pakken fra Aspose-server. for detaljerte instruksjoner, se Installation .
  • Konfigurer målt lisens ved applikasjonstart for å unngå evalueringsbegrensninger. se målt lisens .

Eksempel: Å gjenkjenne fakturaer

Aspose.OCR.Metered metered = new Aspose.OCR.Metered();
metered.SetMeteredKey("PublicKey", "PrivateKey");

// Initialize OCR engine
Aspose.OCR.AsposeOcr recognitionEngine = new Aspose.OCR.AsposeOcr();

// Add images to OcrInput object
Aspose.OCR.OcrInput input = new Aspose.OCR.OcrInput(Aspose.OCR.InputType.SingleImage);
input.Add("invoice1.png");
input.Add("invoice2.jpg");

// Configure recognition settings
Aspose.OCR.InvoiceRecognitionSettings recognitionSettings = new Aspose.OCR.InvoiceRecognitionSettings();
recognitionSettings.Language = Aspose.OCR.Language.Latin;

// Perform invoice recognition
List<Aspose.OCR.RecognitionResult> results = recognitionEngine.RecognizeInvoice(input, recognitionSettings);

foreach (Aspose.OCR.RecognitionResult result in results)
{
    Console.WriteLine(result.RecognitionText);
}

// Save results
results[0].Save("invoice_result.txt", Aspose.OCR.SaveFormat.Text);
Aspose.OCR.AsposeOcr.SaveMultipageDocument("invoice_result.pdf", Aspose.OCR.SaveFormat.Pdf, results);

Egenskaper og funksjoner

Fakturespesifikk OCR-motor

  • Tilpassede gjenkjennelsesmodeller for trykte og fotograferte fakturaer.
  • Høy toleranse for varierende oppløsninger, støynivåer og skitne vinkler.
  • anerkjennelse av flere språk og digitale stiler i samme dokument.

Image Preprocessing & forbedring

  • Automatisk avskjæring, avskjed, og binarisering filtre for å forbedre lesbarhet.
  • Adaptive grenser som bevarer fakturelinjer og bordgrenser.
  • Lys og kontrastjusteringer for å håndtere under- eller over-eksposerte skanninger.

Layout analyse og tabelldeteksjon

  • Automatisk identifisering av header, footer, linje elementer tabell, og sammendrag blokker.
  • Erkennelse av rader, kolonner og cellegrenser, selv når styrende linjer er svak eller savnet.
  • Ekstraksjon av nestede tabeller (f.eks. underelementer under et element i en mors linje).

Nøkkelverdi par ekstraksjon

  • Konfigurerbare maler til kartfeltnavn (f.eks. «Faktnummer», «Total Due») til OCR-resultater.
  • Støtte for dynamiske etiketter – detekterer tekst nærhet i stedet for strenge template matching.
  • Tillit score per felt, slik at du kan filtrere eller reprodusere elementer med lav tillit.

Eksport og integrasjon

  • Utgangsformater: flat tekst, JSON, XML, PDF, Word eller HTML.
  • Event hooks for å interceptere rå OCR resultater før serialisering.
  • Batch-behandlingsstøtte med parallellstyringer for høyvolum arbeidsbelastning.

Feil håndtering og logging

  • detaljerte unntak meldinger for vanlige feilmoduser (f.eks. støttet bildeformat, lisensproblemer).
  • Built-in logging-grensesnitt som er kompatibel med populære .NET-logging rammer (Serilog, NLog og log4net).
  • Returpolitikk for overgangsfeil under fil I/O eller hukommelsesallokasjon.

Tips og beste praksis

  • Forhåndsvalidert bildeoppløsning: for best OCR nøyaktighet, leverer bilder på eller over 300 DPI.
  • Bruk grayscale eller farge bilder – bare binære inntak kan miste fine tabell linjer.
  • Tune tillitsgrenser i henhold til datakvaliteten din; lavere grenser fanger mer data, men kan kreve downstream validering.
  • For veldig store pakker, overvåke minnesbruk og justere parallellismen via plug-ins behandlingsalternativer.
  • Leverer funksjonen for nøkkelverdi-templet for å fryse forventede faktura layouts; for ukjente layouter, faller tilbake på generisk tabelldeteksjon.
  • Alltid initialisere Metered Licensing før du inviterer noen OCR metoder for å unngå evalueringsmodus vannmarker.

Ved å følge disse retningslinjene og utnytte sin faktura-sentriske kapasitet, Aspose.OCR Invoice to Text for .NET gjør det mulig å bygge pålitelige, end-to-end dokumentbehandlingsrør – minimere manuell anstrengelse og maksimere gjennomgangen.

 Norsk