Aspose.OCR facturació de text per a .NET
Aspose.OCR Invoice to Text for .NET és un plug-in especialitzat dissenyat per simplificar l’extracció de text estructurat de les factures escanades o fotografiades. Per automatitzar els passos clau -preprocessament d’imatge, anàlisi de layout, i OCR- vostè pot alimentar les dades resultants directament en els sistemes comptables, bases de dades, o plataformes de pagament sense re-títol manual. El plugin proveeix el mateix nucli de alta qualitat de OCC com Asposa.ocR, optimitzat per a les disposicions de la factura, taules i parelles de valors claus. Reduiràs el temps de processament, minimitzar els errors humans i obtenir resultats coherents i exactes a escala.
Instal·lació i configuració
Segueix aquests passos per afegir Aspose.OCR Invoice a Text per .NET al teu projecte:
- Instal·lar a través de NuGet o descarregar el paquet des dels servidors d’Aspose Instal·lació .
- Configuració de llicències mesurades a la startup d’aplicació per evitar limitacions de avaluació Llicència Metrada .
Exemple: Reconeixement de les factures
Aspose.OCR.Metered metered = new Aspose.OCR.Metered();
metered.SetMeteredKey("PublicKey", "PrivateKey");
// Initialize OCR engine
Aspose.OCR.AsposeOcr recognitionEngine = new Aspose.OCR.AsposeOcr();
// Add images to OcrInput object
Aspose.OCR.OcrInput input = new Aspose.OCR.OcrInput(Aspose.OCR.InputType.SingleImage);
input.Add("invoice1.png");
input.Add("invoice2.jpg");
// Configure recognition settings
Aspose.OCR.InvoiceRecognitionSettings recognitionSettings = new Aspose.OCR.InvoiceRecognitionSettings();
recognitionSettings.Language = Aspose.OCR.Language.Latin;
// Perform invoice recognition
List<Aspose.OCR.RecognitionResult> results = recognitionEngine.RecognizeInvoice(input, recognitionSettings);
foreach (Aspose.OCR.RecognitionResult result in results)
{
Console.WriteLine(result.RecognitionText);
}
// Save results
results[0].Save("invoice_result.txt", Aspose.OCR.SaveFormat.Text);
Aspose.OCR.AsposeOcr.SaveMultipageDocument("invoice_result.pdf", Aspose.OCR.SaveFormat.Pdf, results);Característiques i funcionalitats
Motor de facturació específic OCR
- Models de reconeixement personalitzats per a les factures impreses i fotografiades.
- Alta tolerància per a diferents resolucions, nivells de soroll i angles d’esquena.
- Reconeixement de diversos idiomes i estils digitals en el mateix document.
Preprocesament i millora de la imatge
- Filtres automàtics de descompte, desprotege i binarització per millorar la legibilitat.
- Un límit adaptatiu que conserva les línies de facturació i els límits de taula.
- Ajustaments de brillantor i contrast per gestionar escans sota o sobre-exposats.
Anàlisi i detecció de taula
- Identificació automàtica del títol, el footer, la taula d’articles de línia i els blocs de resum.
- Reconeixement de files, columnes i límits de cèl·lules, fins i tot quan les línies de govern són febles o no.
- Extracció de taules nestades (per exemple, sub-elements sota un element de línia materna).
Extracció de parella de valor clau
- Models configurables per a noms de camp de mapa (per exemple, “Nombre de factura”, “Total Due”) per als resultats de l’OCR.
- Suport per a etiquetes dinàmiques - detecta la proximitat del text en lloc de coincidir estrictament amb el model.
- Puntuació de confiança per camp, que li permet filtrar o reproduir els articles de baixa confiància.
Exportació i integració
- Formats de sortida: text pla, JSON, XML, PDF, Word o HTML.
- Esdeveniments per interceptar els resultats de l’OCR prima abans de la serialització.
- Suport de processament de batxillerat amb controls de paral·lelisme per a càrregues de treball d’alt volum.
Tractament d’errors i logging
- Missatges d’excepció detallats per a modes comuns de fracàs (per exemple, format d’imatge no suportat, problemes de llicència).
- Interfície de registre construïda compatible amb els caràcters de log .NET populars (Serilog, NLog i log4net).
- Polítiques de retracció per errors transitoris durant el fitxer I/O o l’allotjament de memòria.
Consells i millors pràctiques
- Resolució d’imatge prevalida: per a la millor precisió OCR, proporcionar imatges a o més de 300 DPI.
- Utilitzeu imatges de gris o de color - les entrades binàries només poden perdre les fines línies de taula.
- Tuneu els límits de confiança d’acord amb la qualitat de les vostres dades; els mínims més baixos capten més dades però poden requerir la validació de baix flux.
- Per a batxes molt grans, monitoritza l’ús de la memòria i ajusta el paral·lelisme a través de les opcions de processament del plug-in.
- Eliminar la característica de la plantilla de valor clau per congelar els dissenys de factura esperats; per al disseny desconegut, cau enrere a la detecció de taula genèrica.
- Sempre iniciar la Llicència Metrada abans d’invocar qualsevol mètode OCR per evitar les marques de l’avaluació-mode.
Seguint aquestes directrius i aprofitant les seves capacitats centrals de facturació, Aspose.OCR Invoice to Text per .NET li permet construir pipelines de processament de documents fiables i finalitzades - minimitzant l’esforç manual i maximitzar el rendiment.