Aspose.OCR Factura a Texto para .NET

Aspose.OCR Invoice to Text for .NET es un plug-in especializado diseñado para simplificar la extracción de texto estructurado de las facturas escaneadas o fotografiadas. Al automatizar los pasos clave —preprocesamiento de imágenes, análisis de layout, y OCR— se pueden alimentar los datos resultantes directamente a los sistemas de contabilidad, bases de datos, o plataformas de pago sin re-typing manual. El plugin aprovecha el mismo núcleo de alta calidad de OCR como Asposa.ocR, optimizado para las colocaciones de factura, tablas y pares de valores clave. Se reducirá el tiempo de procesamiento, se minimizará el error humano y se obtendrán resultados consistentes y precisos a escala.

Instalación y configuración

Siga estos pasos para agregar Aspose.OCR Invoice a Texto para .NET a su proyecto:

  • Instalar a través de NuGet o descargar el paquete de los servidores de Aspose Instalación .
  • Configure la licencia medida en la startup de la aplicación para evitar limitaciones de evaluación. ver Licenciamiento Medido .

Exemplos: Recogida de facturas

Aspose.OCR.Metered metered = new Aspose.OCR.Metered();
metered.SetMeteredKey("PublicKey", "PrivateKey");

// Initialize OCR engine
Aspose.OCR.AsposeOcr recognitionEngine = new Aspose.OCR.AsposeOcr();

// Add images to OcrInput object
Aspose.OCR.OcrInput input = new Aspose.OCR.OcrInput(Aspose.OCR.InputType.SingleImage);
input.Add("invoice1.png");
input.Add("invoice2.jpg");

// Configure recognition settings
Aspose.OCR.InvoiceRecognitionSettings recognitionSettings = new Aspose.OCR.InvoiceRecognitionSettings();
recognitionSettings.Language = Aspose.OCR.Language.Latin;

// Perform invoice recognition
List<Aspose.OCR.RecognitionResult> results = recognitionEngine.RecognizeInvoice(input, recognitionSettings);

foreach (Aspose.OCR.RecognitionResult result in results)
{
    Console.WriteLine(result.RecognitionText);
}

// Save results
results[0].Save("invoice_result.txt", Aspose.OCR.SaveFormat.Text);
Aspose.OCR.AsposeOcr.SaveMultipageDocument("invoice_result.pdf", Aspose.OCR.SaveFormat.Pdf, results);

Características y funciones

Motor de factura específico OCR

  • Modelos de reconocimiento personalizados para las facturas impresas y fotografiadas.
  • Alta tolerancia a las diferentes resoluciones, niveles de ruido y ángulos escudos.
  • Reconocimiento de varios idiomas y estilos digitales dentro del mismo documento.

Preprocesamiento de imágenes y mejora

  • Los filtros de desciframiento automático, despecle y binarización para mejorar la legibilidad.
  • Un límite adaptativo que conserva las líneas de factura y los límites de la mesa.
  • Ajustes de brillo y contraste para manejar escaneos sub- o sobre-expuestos.

Análisis de Layout y Detección de Mesa

  • Identificación automática de los header, footer, tabla de artículos de línea y bloques de resumen.
  • Reconocimiento de líneas, columnas y fronteras de células, incluso cuando las direcciones son débiles o faltan.
  • Extracción de tablas nestas (por ejemplo, sub-elementos debajo de un elemento de línea materna).

Extracción de pares de valor clave

  • Templates configurables para los nombres de campos de mapa (por ejemplo, “Número de factura”, “Total Due”) a los resultados de OCR.
  • Apoyo a las etiquetas dinámicas – detecta la proximidad del texto en lugar de un ajuste estricto del modelo.
  • La puntuación de confianza por campo, lo que le permite filtrar o reproducir artículos de baja confianza.

Exportación e integración

  • Formatos de salida: texto plano, JSON, XML, PDF, Word o HTML.
  • Los eventos pueden interceptar los resultados crudos de la OCR antes de serializar.
  • Soporte de procesamiento de batch con controles de paralelismo para cargas de trabajo de alto volumen.

Errores de gestión y logging

  • Mensajes de excepción detallados para los modos de fracaso comunes (por ejemplo, formato de imagen no soportado, problemas de licencia).
  • Interfaz de registro integrada compatible con los populares cuadros de log .NET (Serilog, NLog y log4net).
  • Políticas de retiro para errores transitorios durante el archivo I/O o la asignación de memoria.

Consejos y mejores prácticas

  • Resolución de imagen pre-validada: para la mejor precisión OCR, proporciona imágenes a o más de 300 DPI.
  • Utilice imágenes de escalera gris o de color - las entradas binarias únicamente pueden perder líneas de mesa finas.
  • Tiene los límites de confianza según la calidad de sus datos; los barreros más bajos captan más datos pero pueden requerir validación de baja corriente.
  • Para batches muy grandes, monitorizar el uso de la memoria y ajustar el paralelismo a través de las opciones de procesamiento del plug-in.
  • Levante la característica de modelo de valor clave para congelar los deseos de factura esperados; para los diseños desconocidos, cae de vuelta en la detección de la tabla genérica.
  • Siempre iniciar la Licencia Metrada antes de invocar cualquier método de OCR para evitar las marcas de agua de modo de evaluación.

Al seguir estas directrices y aprovechar sus capacidades centralizadas en la factura, Aspose.OCR Invoice to Text for .NET le permite construir pipelines de procesamiento de documentos fiables y de fin a fin, minimizando el esfuerzo manual y maximizándose el rendimiento.

 Español