Aspose.OCR facturació de text per a .NET

Aspose.OCR Invoice to Text for .NET és un plug-in especialitzat dissenyat per simplificar l’extracció de text estructurat de les factures escanades o fotografiades. Per automatitzar els passos clau -preprocessament d’imatge, anàlisi de layout, i OCR- vostè pot alimentar les dades resultants directament en els sistemes comptables, bases de dades, o plataformes de pagament sense re-títol manual. El plugin proveeix el mateix nucli de alta qualitat de OCC com Asposa.ocR, optimitzat per a les disposicions de la factura, taules i parelles de valors claus. Reduiràs el temps de processament, minimitzar els errors humans i obtenir resultats coherents i exactes a escala.

Instal·lació i configuració

Segueix aquests passos per afegir Aspose.OCR Invoice a Text per .NET al teu projecte:

  • Instal·lar a través de NuGet o descarregar el paquet des dels servidors d’Aspose Instal·lació .
  • Configuració de llicències mesurades a la startup d’aplicació per evitar limitacions de avaluació Llicència Metrada .

Exemple: Reconeixement de les factures

Aspose.OCR.Metered metered = new Aspose.OCR.Metered();
metered.SetMeteredKey("PublicKey", "PrivateKey");

// Initialize OCR engine
Aspose.OCR.AsposeOcr recognitionEngine = new Aspose.OCR.AsposeOcr();

// Add images to OcrInput object
Aspose.OCR.OcrInput input = new Aspose.OCR.OcrInput(Aspose.OCR.InputType.SingleImage);
input.Add("invoice1.png");
input.Add("invoice2.jpg");

// Configure recognition settings
Aspose.OCR.InvoiceRecognitionSettings recognitionSettings = new Aspose.OCR.InvoiceRecognitionSettings();
recognitionSettings.Language = Aspose.OCR.Language.Latin;

// Perform invoice recognition
List<Aspose.OCR.RecognitionResult> results = recognitionEngine.RecognizeInvoice(input, recognitionSettings);

foreach (Aspose.OCR.RecognitionResult result in results)
{
    Console.WriteLine(result.RecognitionText);
}

// Save results
results[0].Save("invoice_result.txt", Aspose.OCR.SaveFormat.Text);
Aspose.OCR.AsposeOcr.SaveMultipageDocument("invoice_result.pdf", Aspose.OCR.SaveFormat.Pdf, results);

Característiques i funcionalitats

Motor de facturació específic OCR

  • Models de reconeixement personalitzats per a les factures impreses i fotografiades.
  • Alta tolerància per a diferents resolucions, nivells de soroll i angles d’esquena.
  • Reconeixement de diversos idiomes i estils digitals en el mateix document.

Preprocesament i millora de la imatge

  • Filtres automàtics de descompte, desprotege i binarització per millorar la legibilitat.
  • Un límit adaptatiu que conserva les línies de facturació i els límits de taula.
  • Ajustaments de brillantor i contrast per gestionar escans sota o sobre-exposats.

Anàlisi i detecció de taula

  • Identificació automàtica del títol, el footer, la taula d’articles de línia i els blocs de resum.
  • Reconeixement de files, columnes i límits de cèl·lules, fins i tot quan les línies de govern són febles o no.
  • Extracció de taules nestades (per exemple, sub-elements sota un element de línia materna).

Extracció de parella de valor clau

  • Models configurables per a noms de camp de mapa (per exemple, “Nombre de factura”, “Total Due”) per als resultats de l’OCR.
  • Suport per a etiquetes dinàmiques - detecta la proximitat del text en lloc de coincidir estrictament amb el model.
  • Puntuació de confiança per camp, que li permet filtrar o reproduir els articles de baixa confiància.

Exportació i integració

  • Formats de sortida: text pla, JSON, XML, PDF, Word o HTML.
  • Esdeveniments per interceptar els resultats de l’OCR prima abans de la serialització.
  • Suport de processament de batxillerat amb controls de paral·lelisme per a càrregues de treball d’alt volum.

Tractament d’errors i logging

  • Missatges d’excepció detallats per a modes comuns de fracàs (per exemple, format d’imatge no suportat, problemes de llicència).
  • Interfície de registre construïda compatible amb els caràcters de log .NET populars (Serilog, NLog i log4net).
  • Polítiques de retracció per errors transitoris durant el fitxer I/O o l’allotjament de memòria.

Consells i millors pràctiques

  • Resolució d’imatge prevalida: per a la millor precisió OCR, proporcionar imatges a o més de 300 DPI.
  • Utilitzeu imatges de gris o de color - les entrades binàries només poden perdre les fines línies de taula.
  • Tuneu els límits de confiança d’acord amb la qualitat de les vostres dades; els mínims més baixos capten més dades però poden requerir la validació de baix flux.
  • Per a batxes molt grans, monitoritza l’ús de la memòria i ajusta el paral·lelisme a través de les opcions de processament del plug-in.
  • Eliminar la característica de la plantilla de valor clau per congelar els dissenys de factura esperats; per al disseny desconegut, cau enrere a la detecció de taula genèrica.
  • Sempre iniciar la Llicència Metrada abans d’invocar qualsevol mètode OCR per evitar les marques de l’avaluació-mode.

Seguint aquestes directrius i aprofitant les seves capacitats centrals de facturació, Aspose.OCR Invoice to Text per .NET li permet construir pipelines de processament de documents fiables i finalitzades - minimitzant l’esforç manual i maximitzar el rendiment.

 Català