Aspose.OCR Invoice til tekst for .NET
Aspose.OCR Invoice to Text for .NET er en spesialisert plug-in designet for å effektivisere utvinning av strukturert tekst fra skannede eller fotograferte fakturaer. Ved å automatisere nøkkelsteg - bildeforbehandling, layout analyse, og OCR - du kan lagre de resulterende data direkte til regnskapssystemer, databaser eller betalingsplattformer uten manuell re-typing.
Installasjon og installasjon
Følg disse trinnene for å legge til Aspose.OCR Invoice til Text for .NET til prosjektet ditt:
- Installere via NuGet eller laste ned pakken fra Aspose-server. for detaljerte instruksjoner, se Installation .
- Konfigurer målt lisens ved applikasjonstart for å unngå evalueringsbegrensninger. se målt lisens .
Eksempel: Å gjenkjenne fakturaer
Aspose.OCR.Metered metered = new Aspose.OCR.Metered();
metered.SetMeteredKey("PublicKey", "PrivateKey");
// Initialize OCR engine
Aspose.OCR.AsposeOcr recognitionEngine = new Aspose.OCR.AsposeOcr();
// Add images to OcrInput object
Aspose.OCR.OcrInput input = new Aspose.OCR.OcrInput(Aspose.OCR.InputType.SingleImage);
input.Add("invoice1.png");
input.Add("invoice2.jpg");
// Configure recognition settings
Aspose.OCR.InvoiceRecognitionSettings recognitionSettings = new Aspose.OCR.InvoiceRecognitionSettings();
recognitionSettings.Language = Aspose.OCR.Language.Latin;
// Perform invoice recognition
List<Aspose.OCR.RecognitionResult> results = recognitionEngine.RecognizeInvoice(input, recognitionSettings);
foreach (Aspose.OCR.RecognitionResult result in results)
{
Console.WriteLine(result.RecognitionText);
}
// Save results
results[0].Save("invoice_result.txt", Aspose.OCR.SaveFormat.Text);
Aspose.OCR.AsposeOcr.SaveMultipageDocument("invoice_result.pdf", Aspose.OCR.SaveFormat.Pdf, results);
Egenskaper og funksjoner
Fakturespesifikk OCR-motor
- Tilpassede gjenkjennelsesmodeller for trykte og fotograferte fakturaer.
- Høy toleranse for varierende oppløsninger, støynivåer og skitne vinkler.
- anerkjennelse av flere språk og digitale stiler i samme dokument.
Image Preprocessing & forbedring
- Automatisk avskjæring, avskjed, og binarisering filtre for å forbedre lesbarhet.
- Adaptive grenser som bevarer fakturelinjer og bordgrenser.
- Lys og kontrastjusteringer for å håndtere under- eller over-eksposerte skanninger.
Layout analyse og tabelldeteksjon
- Automatisk identifisering av header, footer, linje elementer tabell, og sammendrag blokker.
- Erkennelse av rader, kolonner og cellegrenser, selv når styrende linjer er svak eller savnet.
- Ekstraksjon av nestede tabeller (f.eks. underelementer under et element i en mors linje).
Nøkkelverdi par ekstraksjon
- Konfigurerbare maler til kartfeltnavn (f.eks. «Faktnummer», «Total Due») til OCR-resultater.
- Støtte for dynamiske etiketter – detekterer tekst nærhet i stedet for strenge template matching.
- Tillit score per felt, slik at du kan filtrere eller reprodusere elementer med lav tillit.
Eksport og integrasjon
- Utgangsformater: flat tekst, JSON, XML, PDF, Word eller HTML.
- Event hooks for å interceptere rå OCR resultater før serialisering.
- Batch-behandlingsstøtte med parallellstyringer for høyvolum arbeidsbelastning.
Feil håndtering og logging
- detaljerte unntak meldinger for vanlige feilmoduser (f.eks. støttet bildeformat, lisensproblemer).
- Built-in logging-grensesnitt som er kompatibel med populære .NET-logging rammer (Serilog, NLog og log4net).
- Returpolitikk for overgangsfeil under fil I/O eller hukommelsesallokasjon.
Tips og beste praksis
- Forhåndsvalidert bildeoppløsning: for best OCR nøyaktighet, leverer bilder på eller over 300 DPI.
- Bruk grayscale eller farge bilder – bare binære inntak kan miste fine tabell linjer.
- Tune tillitsgrenser i henhold til datakvaliteten din; lavere grenser fanger mer data, men kan kreve downstream validering.
- For veldig store pakker, overvåke minnesbruk og justere parallellismen via plug-ins behandlingsalternativer.
- Leverer funksjonen for nøkkelverdi-templet for å fryse forventede faktura layouts; for ukjente layouter, faller tilbake på generisk tabelldeteksjon.
- Alltid initialisere Metered Licensing før du inviterer noen OCR metoder for å unngå evalueringsmodus vannmarker.
Ved å følge disse retningslinjene og utnytte sin faktura-sentriske kapasitet, Aspose.OCR Invoice to Text for .NET gjør det mulig å bygge pålitelige, end-to-end dokumentbehandlingsrør – minimere manuell anstrengelse og maksimere gjennomgangen.